isaac referentiels-ist12-121002051942-phpapp01
Post on 18-Jul-2015
41 Views
Preview:
TRANSCRIPT
Référen'els et interoperabilité (1)
Antoine Isaac
Europeana & Vrije Universiteit Amsterdam
Séminaire INRIA IST Carnac, 2 Octobre 2012
Aver'ssement !
• Le web de données ne matérialise pas la no'on de “référen'el” Tout comme le web “tradi'onel”: techniquement rien ne dis'ngue un
“site de référence” d’un autre
• Mais il y a quand même des ressources qui peuvent prétendre au statut de référence pour une ou plusieurs communautés
Catégories de référen'els possibles
Inspira'on: rapports du groupe d’incuba'on du W3C “Bibliothèques et web de données”
• Élements de métadonnées
• Vocabulaires de valeurs
• Jeux de données
hVp://www.w3.org/2005/Incubator/lld/XGR-‐lld-‐vocabdataset/
Des catégories pas forcément disjointes?
“Ontologie” a pu être u'lisé pour divers “référen'els séman'ques”
[Smith 2001]
Des catégories pas forcément disjointes?
• Conceptuellement, elles expriment “de la séman'que”
• Parfois un artefact appar'ent à deux catégories
• Mais d’un point de vue technique (seman'c web stack) il y a une vraie différence
Eléments de métadonnées
A.k.a ontologies OWL, metadata element sets
• Fournissent les classes et propriétés qui servent de support à l’expression des descrip'ons
• Types d’ontologies selon la portée ontologie noyau vs. ontologie de domaine vs. ontologie d’applica'on
“Briques de construc'on” des graphes RDF
myMES:suject
myVV:Amsterdam
http://example.org/article1
myMES:Article
rdf:type
Ontologies par “popularité” sur le Linked Data Cloud
http://www4.wiwiss.fu-berlin.de/lodcloud/state/#terms
Dans l’inventaire Library Linked Data
http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/#Metadata_Element_Sets
Dublin Core
DCMI Metadata Terms
• A l’origine, 15 éléments généraux pour tous types de documents dc:title, dc:creator, dc:coverage, dc:subject
• Spécialisés en éléments plus spécifiques, avec par ex. domaines et ranges dcterms:spatial, dcterms:creator dcterms:Agent
• Utilisable pour relier des resources, pas seulement des descriptions “à plat”
• Effort communautaire
dublincore.org/
FOAF
Friend of a Friend
• Décrire des personnes – réseaux sociaux, pages personnelles… • Porté par deux personnes, retour d’expérience des u'lisateurs • Approche très pragma'que
www.foaf-‐project.org/
OAI-‐ORE
Open Archives Ini'a've - Object Reuse and Exchange
• Décrire des aggrégations de resources qui composent des ressources numériques complexes
• Eléments clefs – Aggrégation – Ressource aggrégée – “Proxy” – “Resource map”
• Communauté OAI cf. OAI-PMH
www.openarchives.org/ore/
Bibo
• Bibliographic Ontology
• Ontologie pour les ressources bibliographiques – Categorisa'on de documents (AcademicAr'cle)
– Structure des documents (chapter…)
– Cita'on (citedBy) • Créée par deux personnes
bibliontology.com/
FRBR
• Modèle conceptuel développé par l’IFLA
• Il existe plusieurs ontologies (FRBRer, FRBRcore, FRBRoo)
Schema.org • Représenter dans les pages web des informa'ons de base sur
les objets qu’elle représentent Videos, Volcans, Sex shops…
• Moteurs de recherche (Bing, Google, Yahoo!)
• Approche top-‐down, mais très pragma'que
Et bien d’autres…
• CIDOC-‐CRM
• W3C Media Ontology • Music Ontology
…
Où les trouver ?
Rapports
• Library Linked Data
Moteurs de recherche
• Sindice • Watson
Répertoires • Linked Open Vocabularies • Open Metadata Registry
www.w3.org/2005/Incubator/lld/XGR-‐lld-‐vocabdataset/
sindice.com watson.kmi.open.ac.uk/
lov.okfn.org/dataset/lov/ metadataregistry.org
Linked Open Vocabularies
Etude de cas : la créa'on du Europeana Data Model
http://pro.europeana.eu/edm-documentation
?
Europeana
Service qui donne accès aux objets numérisés du domaine patrimonial européen
• Portail liés aux portails des ins'tu'ons et projets partenaires
• Services de données: – API – Linked Data
europeana.eu
pro.europeana.eu/api data.europeana.eu
Mn;kl;k;klj;lkj;lkj;jh;lkj;klj;klj;klj;klj
Qui envoie des données à Europeana?
APEnet
Archives
Libraries
Museums
National Aggregators
Regional Aggregators
Horizontal Aggregators Vertical Aggregators
The European Library
ATHENA
European Film Gateway
Film archives ELocal
GLAMs
Flanders museums
Culture Grid
GLAMs
“Dark” Aggregators
GLAMs
Qu’est-‐ce qui est envoyé à Europeana?
1. Thumbnails
2. Metadata
3. Links to digital objects online
Résoudre un problème d’intégra'on de données
Construire un service d’accès u'lisant les métadonnées est difficile
• Chaque domaine u'lise ses propres modèles et formats LIDO, EAD…
• Solu'on actuelle: les partenaires fournissent des métadonnées au format Europeana Seman'c Elements (ESE) – Plus grand commun dénominateur pour les métadonnées
– Données “à plat” – Ne respectent pas le “one-‐to-‐one principle” – Perte de la richesse des metadonnées orginelles
Plus de “séman'que” pour l’accès aux objets
Construire une “couche séman'que” au-‐dessus des objets
Services assistés par la séman'que
• Exploita'on de rela'ons comme: “localisé à”, “a pour sujet”, “concept plus générique”, correspondences entre langues, domaines – Reformula'on de requêtes – Regroupement et personnalisa'on de résultats
• Échanger des données plus riches
• Les données plus riches sont souvent déjà là ! – Thesauri, classifica'ons… – Éléments de données complexes (EAD, MARC) – Dans le domaine patrimonial ou ailleurs
EDM design requirements
Données plus fines
• Distinction entre l’"objet fourni (tableau, livre…) et ses représentations numériques
• Distinction entre l’objet et ses descriptions • Permettre plusieurs descriptions pour un objet
Contenant éventuellement des assertions contradictoires
• Représentation d’objets complexes • Ressources contextuelles, y compris concepts
EDM design requirements
Données plus interopérables
• Permettre la co-existence de plusieurs grains de données Autoriser des profils spécifiques à un domaine
• Réutiliser et étendre des éléments de standards existants
EDM : les bases
• OAI ORE pour l’organisation des metadonnées et des représentations numériques des objets
• Dublin Core pour une partie des metadonnées descriptives
• CIDOC-CRM comme inspiration pour la structure des événements et des relations entre objets
• SKOS et d’autres référentiels pour les ressources contextuelles
Exemple -‐ 1
30
Exemple -‐ 2
31
Aggrega'ons OAI ORE
32
aggrega'on
digital representa'on
object
provenance metadata
organiser la “contribution” d’un partenaire
Proxys OAI ORE
33
proxy
object metadata
Représenter une “vue” sur les objets
Plusieurs fournisseurs = plusieurs aggrega'ons
34
DMF proxy
Louvre Proxy
Louvre 'tle
DMF 'tle
The “real” pain'ng
Europeana comme un “simple” fournisseur de metadonnées normalisées et enrichies
35
Europeana aggrega'on
“enriched” metadata
En'tés contextuelles
Récupér et exploiter des données “orginelles” ou enrichies réclame plus que des descriptions centrées objet
Evénements, lieux, agents, concepts
Objets et événements
EDM est un effort collabora'f
• Europeana v1.0 WP3: 60 participants
• Développement semi-ouvert, “en aquarium”
• Transversal – Experts des bibliothèques, archives et musées – Avec EDM, Europeana devient plus compatible avec les besoins de
communautés spécifiques. Il est aussi possible de créer des “profils” d’EDM pour ces communautés
Bénéfices de l’approche web de données pour la concep'on d’EDM
• Vocabulaires à réu'liser • Approche flexible de la concep'on et la ré-‐u'lisa'on de
standards
• Ontologies spécifiques co-‐existant avec les ontologies standards
• Pas de contrainte sur le grain du modèle de données • Facilité technique de la connec'on et la publica'on des
données • Vision qui appuie les stratégies Open Data
Retour aux éléments de métadonnées – ou presque
EDM
41
Elément de (méta)données
Concept d’un vocabulaire d’autorité
SKOS
Simple Knowledge Organiza@on System
Portée: knowledge organiza'on systems (KOS) comme les thesauri, systèmes de classifica'on, autorités ma'ères…
SKOS permet de représenter et d’échanger les KOS en RDF de manière simple
Représenter la séman'que
La manière formalisée: OWL Seman'c Web ontology language
Ontologies avec une séman'que exploitable par la machine
• Mère est une classe • C’est l’intersec'on des classes Femme et Parent!• Parent est la classe des ressources de type Personne qui
sont liés à au moins une autre ressource de type Personne en u'lisant la propriété estParentDe
…
SKOS n’est pas pour des ontologies formelles
• Il est possible de produire des ontologies à par'r de KOS, mais les KOS – Se concentrent souvent sur les données lexicales
Enfant U'liséPour Progéniture!
– Ont une séman'que plus “molle” Parent TermeLié Enfant!
– Sont parfois gigantesques et donc difficiles à “neVoyer”
• Et pourtant en tant que tels les KOS peuvent être u'les à de nombreuses applica'ons! Recherche séman'que, annota'on…
Séman'que et interopérabilité
SKOS – les bases
Pour sa'sfaire la majorité des besoins
• Concepts • Propriétés lexicales • Liens séman'ques • Notes
Un thesaurus fic'f
Animals
cats UF (used for) domestic cats RT (related term) wildcats BT (broader term) animals SN (scope note) used only for domestic cats
domestic cats USE cats
wildcats
Concepts et libellés
cats UF (used for) domestic cats
skos: = http://www.w3.org/2004/02/skos/core# rdf: = http://www.w3.org/1999/02/22-rdf-syntax-ns# ex: = http://example.org/
Libellés mul'lingues
Rela'ons séman'ques
cats RT (related term) wildcats BT (broader term) animals
Un graphe SKOS animals cats
UF domestic cats RT wildcats BT animals SN used only for domestic cats
domestic cats USE cats
wildcats
Changement par rapport aux approches tradi'onelles
• Approche orientée concepts • Plus de fron'ère “dure” entre vocabulaires
Extension & alignement sont facilités à travers différents contextes
• L’u'lisa'on de plusieurs vocabulaires dans une applica'on est facilitée
• Transi'on vers une interoperabilité plus grande avec tous types de jeux de données
Extensions de SKOS
• MADS/RDF Autorités-‐ma'ères (LCSH)
France –– Histoire –– XXeme siècle
• ISO25964 (en cours) Thesaurus « classiques »
– Coumpound equivalences:
Charbonnages USE Charbon + Mines – Arrays: Chaises
<Chaises par forme>
Fauteuils
…
SKOS vs. OWL – rappel
• Il y a vraiment une différence entre les deux approches Les ressources SKOS (les concepts) sont des instances de classes au sens
de OWL (instances de skos:Concept). Elles-‐mêmes ne sont pas des classes par défaut.
• Des ontologies comme SKOS existent pour porter et exploiter sur le web de données des données séman'ques “tradi'onelles” sans avoir à la conver'r (et les neVoyer) en ontologies OWL
Vocabulaires de valeurs
Terminologie du groupe LLD
Regroupe vocabulaires contrôlés, vocabulaires d’autorités, mais aussi poten'ellement des folksonomies…
SKOS est une ontologie qui permet de publier un semble de ressources d’autorité, référen'els provenant des bibliothèques ou bien d’autres domaines
http://www.w3.org/2001/sw/wiki/SKOS/Datasets
http://thedatahub.org/dataset?q=format-skos
http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/#Value_vocabularies
DBpedia, Freebase?
• Le web de données efface la fon'ère technique entre vocabulaire d’autorité et « simples » jeux de données
• Des ressources SKOS peuvent être liées à des ressources différentes Par ex. une personne et le « concept d’une personne » dans un fichier
d’autorité
• Un jeu de données peut devenir un référen'el
Linked Library Data
hVp://www.w3.org/2005/Incubator/lld/XGR-‐lld-‐vocabdataset/
Jeux de données
• Dans le domaine bibliographique – Catalogues de bibliothèques na'onales – Services documentaires spécialisés
Jeux de données a réu'liser et lier
• Ressources d’intérêt bibliographique sur le Data Hub thedatahub.org/group/lld
• Linked Open Data Cloud sur le Data Hub thedatahub.org/group/lod
• Moteurs de recherche sur le Linked Data Cloud
Sindice.com
Merci !
Remerciements par'culiers: • Equipe et partenaires Europeana • Membres du groupe Library Linked Data
aisaac@few.vu.nl
top related