Annotations et métadonnéespour le Web sémantique
Yannick PriéLIRIS – Université Lyon 1
Journée Web Sémantique et SHSAction spécifique WS – 7 mai 2003
Laboratoire d’InfoRmatique en Image et Systèmes d’informationFRE 2672 – CNRS/INSA-Lyon/Université Lyon 1/Université Lyon 2/Centrale Lyon
2
Annotations et métadonnées sur le web sémantique
Une définition « information associée à une ressource du web, permettant d’en favoriser l’utilisation par un agent humain, du fait de son exploitation par un agent logiciel »
Points importants Indépendance de la ressource à l’annotation Information structurée descriptive de la ressource Traitements plus ou moins évolués par le programme Utilisateur plus ou moins conscient de l’exploitation des
métadonnées (de leur existence)
3
Exemples d’annotations
Auteur : Y. PriéDate de création :Mots-clé : page perso, informatique, annotation
Prénom : YannickNom : Prié
Type : adresse
« A actualiser »
SG-03/01/03« J’aime pas cette partie. »
Yannick_Prié
concerne
Page personnelle
type
Chercheur
connait
Philippe_Laublet
Page personnelle Humain
sous-classe
Tout (domaine recherche)
concerne
connait
4
Annotation ou métadonnée ?
Des définitions plutôt vagues Métadonnée : « donnée sur une donnée » (différents niveau
d’interprétation) Annotation : « note critique ou explicative accompagnant un
texte », par extension, une quelconque marque de lecture portée sur un document (texte, image)
S’il faut différencier Métadonnée plutôt attachée à un document, un service
identifié en tant que tel, plutôt une pertinence a priori et saisie suivant un schéma
Annotation plutôt située au sein de cette ressource plutôt écrite au cours d’un processus d’annotation/lecture
5
Exemples d’utilisations Annoter : décrire des ressources à partir d’ontologies pour
rechercher de l’information (annotation = index de fait) composer des documents à partir de ressources
Exemples construction, transformation de requêtes à base d’ontologies construction automatique d’index, tables des matières, cartes de
navigation… classification de documents adaptation de documents : consultation d’annotations, aides à la
navigation construction de documents : cours à la carte, réponses à des
questions, résumé automatiques, nouveaux services ...
6
Principes « officiels »
(d’après http://www.semanticweb.org)
7
Vocabulaire de l’annotation Ancre de l’annotation
Document Fragment
Valeur de l’annotation Un peu structuré
ex. attribut auteur, valeur « V. Hugot » Fortement structuré
ex. Auteur = Victor_Hugo Connaissances extérieures = contraintes
Un peu structurées Dublin Core : définition de 15 champs de description documentaire
Fortement structurées ex. Ontologies formelles
Auteur sorte_de Etre_humain Victor_Hugo enfant_du 19ème_siècle
8
Systèmes à base d’annotation
Fonctionnalités création, modification des annotations (evt. des schémas
d’annotations, des ressources) stockage des annotations : avec les ressources, en dehors utilisation des annotations : calcul, présentation
Dimensions d’analyse types de ressources concernées, possibilité de fragmenter automatisation plus ou moins marquée de la mise en place
des annotations structuration plus ou moins forte du « schéma d’annotation »,
des tâches soutenues (ou sous-tendues), et utilisation plus ou moins « intelligente » par les agents logiciels
...
9
Systèmes à base d’annotations sur le web
Web contraintes réseau : charge langages, protocoles informations réparties variabilité, contrôle simplement local multiples utilisateurs ...aussi bien pour les méta-données que pour les
ressources Des questions informatiques ... avec des
conséquences pratiques collecte, localisation de l’usage des annotations,
modification de ressource, contrôles d’accès, etc.
10
Quelques systèmes du WS
Les ancêtres : SHOE, WebKB L’outil du W3C : annotea (+ protocole) RDFWeb : foaf, co-depiction Outils pour annoter une page web tout en
l’écrivant : ontomat, smore Outils pour l’évaluation de ressources :
MedCertain, EARL (Evaluation And Report Language)
...
11
Où en est-on ?
Aujourd’hui RDF largement utilisé, joue son rôle peu d’inférences « natives » (manque de langages ?) XML pour fragmenter différents types de stockages, toujours plus ou moins des
serveurs dédiés Mais pas de système diffusé et utilisé à grande échelle
Prototypes de recherche Trop ambitieux ?
D’autres communautés que celle du WS se sont intéressées à ces questions, et ont des choses à dire
12
Communautés gestion de connaissances et de documentation
Gestion des connaissances, documentation et bibliothèques l’indexation, automatique ou non, ce n’est pas
nouveau annuaires, moteurs, etc.
la normalisation de descripteurs non plus thésaurus schémas de données DTD, XML-Schema
13
Communauté annotation
Problématique de la lecture active lire en écrivant lecture-appropriation / exploration/ assimilation /
d'inspiration (Bellenger 78) Etudes des différents types d’annotations papier, de leur
utilisations (cf. Marshall, Virbel) : l’annotation peut être considérée à de nombreux niveaux est rarement une fin en soi ressort de l’écriture s’intègre dans une activité productrice de sens, et
souvent de documents Définition d’outils de lecture-écriture de documents
numériques
14
Autre communautés CSCW – travail collaboratif Web adaptatif Echanges documentaires P2P ...
Depuis 1994, des systèmes d’annotation sur le web ! problématiques techniques problématiques d’usages nombreux systèmes : Thirdvoice, Hypernews, Critlink, Yawas,
Nestor... nombreuses formes : postits, threads de discussion
(conversations), liens, tours guidés, index, notes, marques d’approbation, objets quelconques...
... mais toujours pas d’usage généralisé !
15
En bref, ne pas tout réinventer
Existent déjà des architectures et modèles de systèmes à base
d’annotation des architectures, modèles, et méthodes de conception de
systèmes de gestion des connaissances à base de thésaurus ou ontologie
des outils d’extraction de connaissances (schémas ou instances) à partir de textes
des outils d’échanges de descriptions de contenus des « leçons apprises »
Autant profiter de toutes ces expériences
16
Du coup, deux questions
Qu’apporte le web sémantique ? une possibilité d’intégration des langages de description et
des protocoles l’échelle du web comme test (impitoyable)
Quelles conditions pour un démarrage de système d’annotation à base d’ontologie ? communauté + ontologie valide système complet vrai service
facilité d’utilisation bénéfice immédiat
Approche KAON suite vs Annotea ?
17
Directions de recherche
Usage actuel des outils à base d’annotations qu’est ce qui fonctionne, et pourquoi ?
Interfaces d’écriture et de visualisation coût de la trace vs bénéfice
Droit, cycle de vie et annotations responsabilité, maîtrise d’usage, validité
Nécessité d’une implication des chercheurs de SHS pour s’approprier la problématique pour apporter leurs résultats pour analyser les changements
18
Discussion : annoter
Mise en place d’annotations Automatique
dépend des genres documentaires Semi-automatique
méthodes statistiques pour proposer des méta-données Manuelle
maîtriser l’ontologie et ses conséquences (inférences) pour pouvoir annoter qui est l’expert ? (l’homme de la rue, le spécialiste, l’informaticien) qui voit les méta-données et les ontologies ? (des annotations au
portail)
19
Discussion : annoter
Sur la sémantique du lien d’annotation Annoter une ressource, décrire le monde, programmer
une utilisation ? Sur la notion d’auto-indexation
annotations a posteriori sur les ressources vs conception de page / intégration de méta-données est-on expert de la description de ses documents ?
L’ontologie dirige ? annoter en utilisant une ontologie annoter en construisant/étendant
annoter d’abord, formaliser ensuite SMORE vs OntoMat
20
Discussion : document
Evolution des structures documentaires Un monde XML Description de document XML
DTD / schéma XML figement / normalisation de méta-données
Méta-données XML RDF extension document pour certains usages
Où est la structure du document ? Où s’arrête le document ?
21
Discussion : autres
Annotation de ressources par l’usage Traces d’utilisation sur le web pour la réutilisation
des ressources MUSETTE : Modéliser les USages Et les Tâches
pour Tracer l’Expérience http://experience.univ-lyon1.fr
Documents multimédias et annotation annoter de l’audiovisuel sur le web ?
Web sémantique et P2P Edutella / SWAP (Semantic Web and Peer to peer)
22
Deux visions extrêmes du web et des annotations sur le web
Le web comme fouillis ingérable auquel les machines doivent nous aider à accéder Annotations comme structuration formelle (meilleure
structuration des modèles pour exprimer des connaissances utilisables automatiquement par des agents logiciels).
ou bien le web comme espace documentaire (ultime), naturellement bruité, seulement un peu hypertexte car fondé sur la lecture Annotations comme moyen de passage à un véritable
hypertexte : écriture (meilleure sensibilité des modèles aux usages de la lecture active, du repérage communautaire, etc.).
23
Pour conclure Web sémantique ?
la différence entre une application du WS et une en dehors peut simplement provenir de la façon dont elle est présentée (pourvu que les standards soient utilisés)
Annotations – métadonnées ? vu d’un point de vue technique, l’annotation est un mécanisme
pouvant exprimer beaucoup d’applications de gestion de BD et de documents, du formel et de l’informel
Web vs web sémantique / annotations informelles vs formelles / annotation vs annotations sémantiques différence graduelle et discrète différentes acceptions de « sémantique » formalisme à divers degrés, sémantique à divers degrés
De toute façon, du formel et de l’informel, et la grande question de l’interprétation par l’utilisateur
24
Plus de détails
Chapitre Annotations et métadonnées dans le rapport de l’Action spécifique (juin 2003)
http://www.semanticweb.org
http://www.w3C.org
25
Annexes
26
Protocoles / langages pour les annotations sur le WS
HTTP transmission
HTML / XML données, feuilles de style
XPATH identification de fragments
RDF expression et échange des métadonnées
DAML+OIL, OWL ontologies formelles
...[ retour ]
27
Schéma annotea de base
http://www.w3.org/Talks/2001/1021-KCAP/
28
Annotation en RDF
<RDF xmlns=“http://www.w3.org/1999/02/22-rdf-syntax-ns#”xmlns:a=“http://www.w3.org/2000/10/annotation-ns#”xmlns:d=“http://dublincore.org/”><a:Annotation about=“http://…/annotation/3ACF6D754”><d:creator>Ralph</d:creator><d:title>This is great</d:title><a:annotates resource=“http://…/XDoc.html” /><a:body resource=“http://…/body/postit.html” /></a:Annotation> </RDF>
http://www.w3.org/Talks/2001/1021-KCAP/
29
Amaya
http://www.w3.org/Talks/2001/1021-KCAP/
30
Extension
répondre à une annotation
http://www.w3.org/Talks/2001/1021-KCAP/
31
Amaya : réponses
http://www.w3.org/Talks/2001/1021-KCAP/ [ retour ]
32
Ontomat
Ontomat http://annotation.semanticweb.org/tools/ontomat
Implantation de CREAM pour création / annotation de pages web
Navigateur HTML Navigateur Ontologie Instances DAML+OIL sur fragments
33
Ontomat
34
Ontomat
[ retour ]
35
SHOE Simple HTML Ontology Extensions Eléments supplémentaires pour décrire dans des
pages web des ontologies des annotations des inférences
Ontologies SHOE classification relations typées inférences (sans négation) liens entre ontologies : extension, versions
Une ontologie de basehttp://www.cs.umd.edu/projects/plus/SHOE/
36
SHOE Modèle d’annotations SHOE
entités instances de concepts
relations entre entités notion de claim
assertions locales à la page Applications SHOE
Interface graphique d’annotation Robot pour récupèrer les assertions, et les stocker dans
une base Requêtes à cette base
Interface graphique de construction de requêtes. Remarque : SHOE plus ou moins arrêté
[ retour ]
37
WebKB (Martin / Eklund)
Web Knowledge Base – http://www.webkb.org/ Basé sur les graphes conceptuels
Sowa Treillis
concepts relations
Instances graphes conceptuels
Inférences recherche de graphe
[Go]- (Agnt)->[Person: John] (Dest)->[City: Boston] (Inst)->[Bus].
http://users.bestweb.net/~sowa/cg/
38
WebKB
Ontologie générale construite à partir de Wordnet.
Annotation de ressources web Dans les pages en RDF Sur un serveur
Requêtes sur le serveur Recherche d’information Interface très complexe
Utilisé ?
[ retour ]
39
RDFweb
http://rdfweb.org/ Schémas RDFS / descriptions RDF Robots serveur / base de données Applications
FOAF (Friend of a Friend) Description de personne (propriétés DAML) + propriété
SeeAlso vers d’autres personnes Recherche de personnes, de liens entre personnes, etc.
Co-Depiction project foaf:depiction possibilité d’annotation de fragments d’images SVG
[ retour ]
40
Des êtres humains partout !
(d’après http://www.semanticweb.org)