ist2012 aussenac-ontologieannotationweb

106
Donner du sens à des documents semi- structurés : De la construction d'ontologies à l'annotation sémantique À l’heure du web des données : 1. Donner du sens à des documents pour des logiciels 2. Pourquoi des ontologies ? 3. Comment ? apports du traitement automatique des langues 4. Annotation sémantique, extraction d’information : convergences 5. Web des données : nouveaux enjeux, problèmes connus Oct 2012 - IST De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles 1 Nathalie Aussenac-Gilles, DR CNRS, [email protected]

Upload: nathalie-aussenac-gilles

Post on 18-Dec-2014

1.124 views

Category:

Documents


0 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Ist2012 aussenac-ontologieAnnotationweb

Donner du sens à des documents semi-

structurés : De la construction d'ontologies

à l'annotation sémantique

À l’heure du web des données :

1. Donner du sens à des documents pour des logiciels

2. Pourquoi des ontologies ?

3. Comment ? apports du traitement automatique des langues

4. Annotation sémantique, extraction d’information : convergences

5. Web des données : nouveaux enjeux, problèmes connus

Oct 2012 - IST De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles 1

Nathalie Aussenac-Gilles, DR CNRS, [email protected]

Page 2: Ist2012 aussenac-ontologieAnnotationweb

1 - Donner du sens à des

documents pour des logiciels

Qu’est que cela signifie ?

… à l’heure du web sémantique

… avec des ontologies

… à l’heure du web des données

Oct 2012 - IST 2 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 3: Ist2012 aussenac-ontologieAnnotationweb

Donner du sens à des documents numériques

Rendre accessible à un programme leur “contenu”

… les informations, les connaissances que l’humain y reconnait

… pour les traiter en tenant compte de ce contenu

Oct 2012 - IST 3 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

<CV>

<nom>

</nom>

<adresse>

</adresse>

<experience>

</experience>

<formation>

</formation>

</CV>

href

href

Description documentaire

Schemas et DTD pour unifier

Page 4: Ist2012 aussenac-ontologieAnnotationweb

… à l’heure du web sémantique

Normaliser les tags et faire référence à une ontologie pour

échanger, comparer, mettre en relation

Être précis, se mettre d’accord sur le sens

Raisonner, exploiter des connaissances non explicites

Oct 2012 - IST 4 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

<CV>

P1 rdf:Type foaf:person

P1 foaf:name ”ڎڻڇ”

P1 foaf:adress ”ڦڀڤڎڻڇ”

Expe1 rdf:Type onto:experience

P1 onto:aExperience Expe1

….

</CV>

Onto:collaboreAvec

dc:estAuteurDe

Onto

Foaf

Page 5: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 5 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Comment produire les annotations ?

Page 6: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 6 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Comment produire les annotations ? Indexation classique

3rd European Semantic Web Conference (ESWC2006)

The 3rd Annual European Semantic Web Conference (ESWC2006) will be held in Budva, Montenegro from the 11th - 14th June, 2006.

It will present the latest results in research and application in Semantic Web technologies (including knowledge markup languages, Semantic Web services, ontology management and more).

ESWC 2006 will also feature a special industry-oriented event providing European industry with an opportunity to become even more familiar with these technologies. It will offer a tutorial program, focusing on the latest in Semantic Web technologies.

Page 7: Ist2012 aussenac-ontologieAnnotationweb

Comment produire les annotations ? Indexation classique -> indexation sémantique

Oct 2012 - IST 7 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Europe

Semanti

Web

Confere

Annual

Europe

Semanti

Web

Confere

Budva

Montene

present

results

Researc

Applica

Semanti

Web

Technol

Includi

Knowled

Markup

Languag

Semanti

Web

Service

Ontolog

managem

Feature

Special

Industr

Oriente

event

European [geographic area:Europe]

Semantic

Web [semantic Web]

Conference [conference]

Annual

European [geographic area:Europe]

Semantic

Web

Conference [conference]

Budva [City:Budva]

Montene [geographic area:Montenegro]

present [to present]

results [result]

Research [research]

Application [application]

Semantic

Web [semantic Web]

Technology [technology]

Including [to include]

Knowledge [knowledge]

Markup

Language [Markup Language]

Semantic

Web [semantic Web]

Service

Ontology [Ontology]

management [management]

Feature [to feature]

Special

Industrial [industrial]

Oriented

Event [event]

Page 8: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 8 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Comment produire les annotations ?

Une représentation sémantique de la page web

Page 9: Ist2012 aussenac-ontologieAnnotationweb

… à l’heure du web des données

2 défis

Extraire les triplets

Les associer à des données existantes

Oct 2012 - IST 9 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

<CV>

(hasValue,”ڎڻڇ”, foaf:name)

(hasValue,”ڦڀڤڎڻڇ”,foaf:adress)

(rdf:Type, P1, foaf:person)

(rdf:Type, Expe1, onto:experience)

(onto:aExperience, P1, Expe1)

….

</CV>

Onto:collaboreAvec

dc:estAuteurDe

Onto

Foaf

Page 10: Ist2012 aussenac-ontologieAnnotationweb

Reconnaître des données existantes

Des mots à des triplets

spécifiques

De triplets à des classes,

des types

Des triplets à des

instances

Reconciliation d’instances

Alignement de concepts

Oct 2012 - IST 10 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 11: Ist2012 aussenac-ontologieAnnotationweb

2 – Pourquoi des ontologies ?

Nécessité de référentiels pour relier les données entre elles

Nécessité de la formalisation pour raisonner

Oct 2012 - IST 11 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 12: Ist2012 aussenac-ontologieAnnotationweb

Est-ce la fin des ontologies ?

===========================================

1st International Workshop on

Ontology Engineering in a Data-Driven World – OEDW 2012

Full-day workshop at EKAW 2012 (Galway, Ireland)

October 8th or 9th, 2012

http://granvia.dia.fi.upm.es/oedw2012/

===========================================

* Motivation*

- Is the current data-driven world going to kill ontologies?

- Are we navigating towards a shallow Web of Data? * Topics *

- Guidelines, methods, and tools for Linked Data engineering

- Methods for ontology/vocabulary reuse in the Linked Data context

- Methods and techniques for ontology/vocabulary mapping and alignment in

the Linked Data context

- Guidelines, methods, and tools for RDB to RDF mappings

- Life cycle management in the context of Linked Data

- Creation of knowledge out of Linked Open Data

- Ontology/vocabulary repositories

- Empirical findings and statistics about ontologies underlying Linked Data

Oct 2012 - IST 12 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 13: Ist2012 aussenac-ontologieAnnotationweb

Nécessité de référentiels pour lier les données

Enjeux pour lier les données

Reconnaître la même instance dans le même document

Reconnaître la même classe dans une collection

Reconnaître la même instance dans une collection

Phénomènes linguistiques associés

Calcul de références

Polysémie (quel est le sens d’une occurrence de terme ? Quel

type sémantique lui associer ?)

Synomymie (savoir qu’on parle de la même entité ou du même

concept avec des termes différents)

Oct 2012 - IST 13 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Geonames:city ??:books

Page 14: Ist2012 aussenac-ontologieAnnotationweb

Ontologies : motivations

Réutilisation

Partage de la connaissance et communication

Interopérabilité entre différents SBC

Échange de connaissances entre systèmes

Premières initiatives

Infrastructure comme support à la réutilisation de connaissance

«Knowledge Sharing Effort », ONTOLINGUA,...

INTERLINGUA (KIF) comme langage pivot pour la traduction

d’un langage vers un autre

Oct 2012 - IST 15 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 15: Ist2012 aussenac-ontologieAnnotationweb

Ontologies : historique

Ontologie PHILO. Partie de la métaphysique qui s’applique à l’être en

tant qu’être, indépendamment de ses déterminations particulières

(Le Petit Robert).

Taxinomie 1.DIDACT. Étude théorique des bases, lois, règles,

principes, d’une classification. 2. Classification d’éléments (Le Petit

Robert).

Taxinomies en sciences naturelles

Depuis Aristote : essence des choses,

points communs et différences

Triangle sémiotique : signe, référant, référé

Oct 2012 - IST 16 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Référé Forme Dénomme

Refère à évoque

Concept

“Jaguar“

[Odwen, Richards, 1923]

référant

signe

Page 16: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 17

Ontologies en Ingénierie des Connaissances

Modèles des connaissances d’un domaine pertinentes pour une

application, une tâche donnée

Conceptualisation de ces connaissances en classes génériques, relations

et règles

Application de principes de normalisation, de « bonne construction » et/ou

référence à des classes ontologiques

Réseau sémantique + axiomes

Ontologie Spécification normalisée représentant les classes des

objets reconnus comme existant dans le domaine. Construire

une ontologie, c’est aussi décider d’une manière d’être et

d’exister des objets.

FORME

FOND

De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 17: Ist2012 aussenac-ontologieAnnotationweb

D’un formulation linguistique à une représentation

formelle (1)

Oct 2012 - IST 18 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 18: Ist2012 aussenac-ontologieAnnotationweb

D’un formulation linguistique à une représentation

formelle : si on utilisait une ontologie ? (2)

Oct 2012 - IST 19 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 19: Ist2012 aussenac-ontologieAnnotationweb

Une ontologie permet de typer les données (3)

Oct 2012 - IST 20 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 20: Ist2012 aussenac-ontologieAnnotationweb

Une ontologie pour repérer les ambigüités (4)

Exploiter les contraintes de l’ontologie formelle

Oct 2012 - IST 21 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 21: Ist2012 aussenac-ontologieAnnotationweb

Une ontologie pour définir avec précision (5)

Oct 2012 - IST 22 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

:NationalitéFrançaise rdfs:subClassOf :nationalité

:français#1 rdf:type :NationaliteFrançaise

Page 22: Ist2012 aussenac-ontologieAnnotationweb

Autres intérêts d’utiliser une ontologie (5)

Représenter les connaissances sous une forme plus

synthétique (ex des proprités)

Pouvoir définir des classes par leurs propriétés :

Définir “journaliste français”

Oct 2012 - IST 23 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

:Homme rdfs:subClassOf :Personne

:Femme rdfs:subClassOf :Personne

:apourProfession rdfs:domain :Personne rdfs:range :Profession

Regroupe les 2 définitions

:apourProfession rdfs:domain :Homme rdfs:range :Profession

:apourProfession rdfs:domain :Homme rdfs:range :Profession

Soit p tel que :

Personne(p) et (p : apourProfession :journaliste) et

(p :apourNationalité :NationalitéFrançaise),

alors :JournalisteFrançais(p)

Page 23: Ist2012 aussenac-ontologieAnnotationweb

Ontologie vs thésaurus

Oct 2012 - IST 24 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Thésaurus SRLF et de la SFAR

hémopéritoine

Page 24: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 25

Liens

Hiérarchie de relation Hiérarchie de concepts

Ontologie vs thésaurus

ETAT_PATHOLOGIQUE

ETAT_PATHOLOGIQUE_LOCAL

LESION

adénopathie

épanchement

épanchement gazeux

épanchement liquidien

épanchement de pus

épanchement hématique

LESION (LOCALISATION) ANATOMIE

LOCALISATION

à_côté_de

à_l'extérieur_de

au_dessus_de

au_niveau_de

ANATOMIE

ANA_TISSU_ENVEL

capsule

duremère

mésentère

peau

péritoine

hémopéritoine : « épanchement hématique localisé au niveau du péritoine »

épanchement hématique (au_niveau_de) péritoine

Concept défini

De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 25: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 26

Hiérarchie de relations Hiérarchie de concepts

Ontologie vs thésaurus

LESION

épanchement

fracture

LESION (LOCALISATION) SITUATION

LOCALISATION

à_côté_de

à_l'extérieur_de

au_dessus_de

au_niv_de

SITUATION

angle

base

bord

SITUATION (OBJET) ANATOMIE_OBJET

OBJET

DE

ANATOMIE_OBJET

OS

crâne

fracture à la base du crâne

fracture (au_niveau_de) base (DE) crâne

Liens

Concept défini

De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 26: Ist2012 aussenac-ontologieAnnotationweb

Une ontologie respecte des principes de

structuration … en principe …

Fixer préalablement et précisément (Guarino 94)

– les engagements ontologiques généraux : point de vue

– les catégories de haut-niveau : appellations et significations (DOLCE)

– le processus de raffinement de ces engagements et définitions des

catégories

– la spécialisation de ces catégories

Déterminer une ontologie revient à fixer la signification

attendue des primitives d’un domaine (Guarino 96)

– les primitives n’existent pas en tant que telles dans un domaine

d’expertise

Oct 2012 - IST 27 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 27: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 28

Modéliser, c’est faire des choix

De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

1. Quelle différence entre patient et

patiente ?

2. Un concept « primitif » (patient), deux

caractéristiques différentes,

différenciant ainsi les deux concepts

« définis ».

3. La différence est

explicitement liée à un

attribut (sexe) dont la

valeur diffère.

Page 28: Ist2012 aussenac-ontologieAnnotationweb

Principes de normalisation d’Archonte (Bachimont 2000)

Principes de différenciation Point commun entre 1 concept et son père

Différence entre 1 concept et son père

Points communs entre 1 concept et ses frères

Différences entre un concept et ses frères

Les différences ne sont pas forcément

représentées à l’aide de propriétés mais au

moins par des commentaires

Oct 2012 - IST 29 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 29: Ist2012 aussenac-ontologieAnnotationweb

Ontologies - Quelques exemples en 2006

Ontologies générales ou génériques (haut niveau) WordNet / EuroWordNet, http://www.cogsci.princeton.edu/~wn

The Upper Cyc Ontology, http://www.cyc.com/cyc-2-1/index.html

IEEE Standard Upper Ontology, http://suo.ieee.org/

DOLCE, http://www.loa-cnr.it/ontologies/DLP_397.owl

LRI-Core: a core ontology for law

Ontologies de domaine ou spécifiques à des applications RDF Site Summary RSS, http://groups.yahoo.com/group/rss-dev/files/schema.rdf

UMLS, http://www.nlm.nih.gov/research/umls/

RETSINA Calendering Agent, http://ilrt.org/discovery/2001/06/schemas/ical-full/hybrid.rdf

AIFB Web Page Ontology, http://ontobroker.semanticweb.org/ontos/aifb.html

Web-KB Ontology, http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/

Dublin Core, http://dublincore.org/

Meta-Ontologies Semantic Translation, http://www.ecimf.org/contrib/onto/ST/index.html

Evolution Ontology, http://kaon.semanticweb.org/examples/Evolution.rdfs

Ontologies au sens large Agrovoc, http://www.fao.org/agrovoc/

Art and Architecture Thesaurus, http://www.getty.edu/research/tools/vocabulary/aat/

UNSPSC, http://eccma.org/unspsc/

DTD standardizations, e.g. HR-XML, http://www.hr-xml.org/

Oct 2012 - IST 30 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 30: Ist2012 aussenac-ontologieAnnotationweb

Ontologies pour le web des données DBPedia, une ontologie à l’échelle du web !

Construction à partir des Info-box de Wikipedia

Extraction d’information à partir de documents semi-structurés

L’ontologie 359 classes

800 object properties

859 datatype properties

116 specialized datatype properties

45 owl:equivalentClass, 31 owl:equivalentProperty mappings

La base de connaissances (pour l’anglais) = 3.77 million things 2.35 million are classified in a consistent Ontology

764,000 persons, 573,000 places, 333,000 creative works (including 112,000 music albums, 72,000 films and 18,000 video games), 192,000 organizations (including 45,000 companies and 42,000 educational institutions), 202,000 species and 5,500 diseases.

Versions disponibles en 111 langues = 20.8 million things, out of which 10.5 mio are interlinked with concepts from the English DBpedia.

http://wiki.dbpedia.org/About

Oct 2012 - IST 34 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 31: Ist2012 aussenac-ontologieAnnotationweb

Vocabulaires pour le web des données

Dmoz The Open Directory Project is the largest, most comprehensive human-edited directory of the Web. It is constructed and maintained by a vast, global community of volunteer editors.

Associé au web2.0 et à l’annotation collaborative

Organiser les rubriques, les catégories d’annotation

structure.rdf.u8.gz - category hierarchy information

http://www.dmoz.org

Freebase Freebase is an open, Creative Commons licensed graph database with

more than 23 million entities. An entity is a single person, place, or thing.

Freebase connects entities together as a graph.

Structure : données structurées selon un SCHEMA en domaines / types (concepts) / properties

Pas vraiment de sémantique des types

Oct 2012 - IST 35 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 32: Ist2012 aussenac-ontologieAnnotationweb

Ontologies pour le web sémantique

Écrites en OWL ou RDFs

Accessibles sur le web

Identifiants : URI

Importent d’autres ontologies

<owl:Class rdf:ID= “wineOnto:Winery”/>

<owl:Class rdf:ID= wineOnto:PotableLiquid »/>

<owl:Class rdf:ID="Wine">

<rdfs:subClassOf rdf:resource="food:PotableLiquid"/>

<rdfs:label xml:lang="en">wine</rdfs:label>

<rdfs:label xml:lang="fr">vin</rdfs:label> ...

</owl:Class>

Oct 2012 - IST 36 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 33: Ist2012 aussenac-ontologieAnnotationweb

3 – Comment ? Apports du TAL

Le problème : donner du sens à des documents

Hypothèses :

c’est articuler langue et représentations sémantiques

les représentations sémantiques sont mieux définies dans

une ontologie

L’approche : extraire des informations/connaissances des textes

Les outils : logiciels de Traitement Automatique des langues

Oct 2012 - IST 37 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 34: Ist2012 aussenac-ontologieAnnotationweb

Construire vs peupler une ontologie

Oct 2012 - IST 38 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Construction d‘ontologie

Analyse linguistique pour extraire des

prédicats (catégories, attributs,

propriétés) à partir de textes

Peuplement d‘ontologie

Extraire des indices linguistiques

d’instances de concepts de

l’ontologie

Annoter

Extraire Classes & Relations

Extraire (Annoter)

Instances

Ontology Population

Knowledge Base Generation

Ontology Learning

Ontology Creation & Development Construction d‘ontologie

Identifier des indices de prédicats

(catégories, attributs, propriétés)

Décider de leur représentation dans

l’ontologie

Page 35: Ist2012 aussenac-ontologieAnnotationweb

Construire vs peupler une ontologie

Classes

Propriétés des classes

Relations binaires

Personne

PereDe ou MereDe

GrandParentDe

AppartientMemeFamilleQue

Oct 2012 - IST 39 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Je crée l’ontologie Je décris des instances

Classes / propriétés connues

Personne

PereDe; MereDe

GrandParentDe

Instances identifiées

Hugo, René, Rosie

Relations entre instances

GrandPereDe(René, Hugo)

MereDe(Rosie,Hugo)

PereDe(René, Rosie)

Hugo est heureux que son grand-père René l’accompagne pour

retrouver sa mère Rosie.

Page 36: Ist2012 aussenac-ontologieAnnotationweb

Les textes pour construire ou peupler

Construire le schéma

Peupler par des instances

Oct 2012 - IST 40 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Indices

linguistiques

Ontologie

RTO : ressource termino-ontologique

Où stocker les indices linguistiques ??

Et les patrons/ logiciels pour les trouver ?

Indices

linguistiques

Ontologie

RTO

Instances

Page 37: Ist2012 aussenac-ontologieAnnotationweb

Trouver les formulations linguistiques

Oct 2012 - IST 41 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

système

L'échographie abdominale retrouve une contusion splénique et un hémopéritoine. Traumatisme abdominal avec une fracture de rate et un

hémopéritoine abondant, ayant nécessité une splénectomie en urgence. Un nouvel état de choc apparaît associé à syndrome

compartimentaire abdominal (hémopéritoine + hématome rétropéritonéal)) justifiant la laparotomie exploratrice. L'évacuation de

l'hémopéritoine ne permet pas de mettre en évidence une cause nette au saignement ;Instabilité hémodynamique initiale, avec TA 80 / 60

et fréquence cardiaque à 120 / min en relation avec des pertes sanguines sur les foyers de fractures (échographie abdominale normale,

absence d‘ hémopéritoine ou de lésion viscérale intrapéritonéale évidente)).deux échographies abdominales successives un

hémopéritoine évolutif, sans pneumopéritoine, ainsi qu'un décollement péricardique postérieur.un traumatisme thoraco-abdominal avec

fracture des arcs postérieurs des 7e, 8e et 9e côtes droites, contusion hépatique au niveau des segments VI-VII, hémopéritoine de

moyenne abondance, contusion splénique,Instabilité hémodynamique nécessitant remplissage, transfusion de culots globulaires, PFC et

plaquettes dans le cadre d'un hémopéritoine sur fracture du bassin.

texte

épanchement hématique (au_niveau_de) péritoine

Ressource

ANATOMIE LESION LOCALISATION

hémopéritoine

CONCEPT

terme

Page 38: Ist2012 aussenac-ontologieAnnotationweb

Trouver les variantes de formulation

Oct 2012 - IST 42 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

sevrage en noradrénaline le 23 / 10. Stabilité cardiorespiratoire, le sevrage de la Noradrénaline est fait à J5 de la

réintervention et l'extubation est réalisée à J6. Evolution favorable avec sevrage rapide en Noradrénaline le 20 / 06 /

99. Stabilité hémodynamique initiale correcte avec sevrage progressif en Noradrénaline obtenu à J3. Les suites du

choc hypovolémique hémorragique sont simples, avec sevrage de noradrénaline à J3 et extubation à J2. L'évolution

est alors favorable avec Instauration d'une corticothérapie ayant permis un sevrage rapide de la Noradrénaline, La

patiente est sevrée de noradrénaline le 16 / 06 / 00. Le patient est sevré de Noradrénaline le 13 / 05 / 00. La

Noradrénaline est sevrée dans la nuit du 20 au 21 / 01. Après remplissage vasculaire par 1000 cc de Plasmion et

1000 cc d'Elohes, la Noradrénaline est rapidement sevrée

sevrage (OBJET) Noradrénaline

RTO

système

texte

sevrage en noradrénaline sevrage de la noradrénaline

sevrage Adj? [de|en] la? noradrénaline

sevré de noradrénaline

noradrénaline être Adv? sevré

sevrage_Noradrénaline

CONCEPT

termes

patrons

Page 39: Ist2012 aussenac-ontologieAnnotationweb

Couches de TAL pour construire une ontologie (Buitelaar, EACL 2006)

Oct 2012 - IST 43 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Séquence de mots (texte)

Termes

Synonymes (multilingues)

Concepts

Hiérarchie de concepts

Autres relations

Schémas d’axiomes

{père, papa, géniteur}

{mari, conjoint, époux}

Personne, père, père adoptif,

enfant, grand-parent

C:père = {René,…}, {personne qui a 1 enfant}

PèreAdoptif est_un père

personne est_un êtreVivant

Axiomes, règles

estParentDe(Personne, personne) ;

habiteDans(personne, ville)

Disjoint(personne, ville)

Toute personne a au plus 1 mère

Page 40: Ist2012 aussenac-ontologieAnnotationweb

Extraire des termes

Termes

Unité lexicale complexe qui fait sens dans le domaine

Candidats

Père connaissance

Père adoptif acquisition de connaissances

Père adoptif de l’enfant Acquisition de K du domaine

. Acquisition de connaissances du jour

Difficultés

Trop de candidats : comment sélectionner ?

Quels sont les bons termes pour mon ontologie ?

Notion de termhood (« termitude ») = importance, représentativité

du candidat dans le domaine

Oct 2012 - IST 44 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 41: Ist2012 aussenac-ontologieAnnotationweb

Techniques pour identifier des termes

Linguistiques

= caractériser la syntaxe des termes par des patrons

N, N prep det N, Adj N; N adj, …

Exploiter les frontières : det, prep, verbes

Exploiter les noms propres, mots vides …

Statistiques

Co-occurrences, segments répétés

Comparaison de la fréquence dans le corpus % à la langue

générale

Hybrides

Utiliser les statistiques pour filtrer les termes

Combiner patrons + co-occurrences pour trouver des candidats

Oct 2012 - IST 45 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 42: Ist2012 aussenac-ontologieAnnotationweb

Extracteurs de termes « linguistiques »

Patrons appris sur corpus annoté : ANA (Daille)

Frontières négatives Lexter ( Bourigault, 2000)

Patrons exploitant les dépendances grammaticales :

SYNTEX (Bourigault, 2003)

Oct 2012 - IST 46 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 43: Ist2012 aussenac-ontologieAnnotationweb

TermoStat (Drouin, 2007) : ex de patrons

TermoStat Web

http://olst.ling.umontreal.ca/~drouinp/termostat_web/

Oct 2012 - IST 47 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 44: Ist2012 aussenac-ontologieAnnotationweb

Termostat : score de spécificité

Oct 2012 - IST 48 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 45: Ist2012 aussenac-ontologieAnnotationweb

Termostat : Critères de sélection des termes

Fréquence Spécificité

Relations syntaxiques entre termes /productivité

Oct 2012 - IST 49 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 46: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 50 De la construction d'ontologies à l'annotation sémantique -

N. Aussenac-Gilles

Couches de TAL pour construire une ontologie

Séquence de mots (texte)

Termes

Synonymes (multilingues)

Concepts

Hiérarchie de concepts

Autres relations

Schémas d’axiomes

{père, papa, géniteur}

{mari, conjoint, époux}

Personne, père, père adoptif,

enfant, grand-parent

C:père = {René,…}, {personne qui a 1 enfant}

Axiomes, règles

estParentDe(Personne, personne) ;

habiteDans(personne, ville)

Disjoint(personne, ville)

Toute personne a au plus 1 mère

PèreAdoptif est_un père

personne est_un êtreVivant

Page 47: Ist2012 aussenac-ontologieAnnotationweb

Recherche de synonymes en français

Ressources exploitables Dictionnaires de synonymes (Dicosyn (U. de Caen, ~200 000

couples)

Ressources lexicales (Synset de Wordnet)

Logiciel SYNOTERM (Hamon, 2006) : Exploiter la structure des termes et des dictionnaires de

synonymes + vérifier en corpus:

Si A et B sont synonymes,

Si NA et NB existent en corpus

Alors proposer NA synonyme de NB

Problème : la relation de synonymie est contextuelle Identifier des relations de synonymie pertinentes

pour le domaine

pour l’application

Oct 2012 - IST 51 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 48: Ist2012 aussenac-ontologieAnnotationweb

Synonymie inter-langue

Techniques statistiques

Clustering

Classer les termes selon leur distribution

2 termes sont groupés dans une classe s’ils sont utilisés dans les

mêmes contextes

Classification

Associer des candidats termes à des classes déjà définies

Exploiter des corpus parallèles

Même texte exprimé dans 2 langues

Oct 2012 - IST 52 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 49: Ist2012 aussenac-ontologieAnnotationweb

Couches de TAL pour construire une ontologie (Buitelaar, EACL 2006)

Oct 2012 - IST 53 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Séquence de mots (texte)

Termes

Synonymes (multilingues)

Concepts

Hiérarchie de concepts

Autres relations

Schémas d’axiomes

{père, papa, géniteur}

{mari, conjoint, époux}

Personne, père, père adoptif,

enfant, grand-parent

C:père = {René,…}, {personne qui a 1 enfant}

Axiomes, règles

estParentDe(Personne, personne) ;

habiteDans(personne, ville)

Disjoint(personne, ville)

Toute personne a au plus 1 mère

PèreAdoptif est_un père

personne est_un êtreVivant

Page 50: Ist2012 aussenac-ontologieAnnotationweb

Typologie des méthodes de structuration

Méthodes structurelles Exploitent sur la structure syntaxique interne des candidats

termes («endotermes»)

Composition syntaxique

Variation morpho-syntaxique, lexicale

Méthodes contextuelles Exploitent les contextes de co-occurrence des candidats termes

(«exotermes»)

Locales : une relation extraite pour une occurrence

Patrons

Globales : des relations extraites à partir d’un ensemble d’occurrences

Cooccurrence statistique

Analyse distributionnelle

Oct 2012 - IST 54 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 51: Ist2012 aussenac-ontologieAnnotationweb

Méthode structurelle : dépendance syntaxique

Dépendance syntaxique

Chaque terme complexe se décompose en une Tête et une

Expansion

Séries paradigmatiques

Oct 2012 - IST 55 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

ontologie ~

---- disponible

---- définie

---- explicite

---- formelle

---- référentielle

---- régionale

---- résultante

---- spécialisée

---- universelle

T ---- concepteur

---- conception

---- construction

---- maintenance

---- raffinement

---- structure

---- usage

---- validation

---- vérification

~ de base de connaissance

E

Page 52: Ist2012 aussenac-ontologieAnnotationweb

« Tous les Nom Adj sont des Nom » est faux

Oct 2012 - IST 56 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

38 syndrome septique

35 syndrome infectieux

29 Syndrome alvéolaire

28 syndrome dépressif

27 syndrome confusionnel

23 syndrome de défaillance

19 syndrome bilatéral

18 syndrome inflammatoire

17 Syndrome fébrile

16 syndrome de défaillance multiviscérale

14 syndrome pyramidal

14 syndrome alvéolaire bilatéral

14 Syndrome abdominal

14 syndrome occlusif

11 syndrome de sevrage

… …

SYNDROME

SYNDROME_CLINIQUE

anasarque

apnée du sommeil

syndrome bronchique

syndrome cave

syndrome confusionnel

SYNDROME_MIXTE

état de mort encéphalique

rhabdomyolyse

syndrome de défaillance multiviscérale

syndrome de détresse respiratoire aiguë

SYNDROME_PARACLINIQUE

syndrome alvéolaire

syndrome alvéolo-interstitiel

CT : syndrome ~ Taxinomie de concepts

Page 53: Ist2012 aussenac-ontologieAnnotationweb

Méthode structurelle : variation

Principe général (Daille, 2009)

Si

CT1 = [ A B1 ]

CT2 = [ A B2 ]

Et

B1 REL B2

Alors

CT1 REL CT2

Exemples

Variation morphosyntaxique

transférer en réanimation transfert en réanimation

patient transféré transfert du patient

Variation lexicale

hausse de la température augmentation de la température

Oct 2012 - IST 57 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 54: Ist2012 aussenac-ontologieAnnotationweb

Variation morphosyntaxique

Type de relations

verbe – nom (transférer un = transfert du)

nom – adjectif (transfert de / transférable)

Méthodes exogènes : avec ressources lexicales

Celex

Verbaction (ERSS, N. Hathout) : verbe – nom

Méthodes endogène : sans ressource externe Règles de troncation + validation sur corpus

Oct 2012 - IST 58 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 55: Ist2012 aussenac-ontologieAnnotationweb

Variation morphosyntaxique : des résultats

Une productivité réduite, mais des résultats fiables

Corpus REA : environ 200 couples SV-SN

arrêter les antibiotiques, arrêt des antibiotiques, antibiotiques arrêtés

drainer un pneumothorax, drainage du pneumothorax

lever une atélectasie, levée de l’atélectasie

Corpus Code Civil : environ 100 couples SV-SN

le conseil de famille autorise, autorisation du conseil de famille

établir la filiation, filiation établie

révoquer la donation, révocation de la donation, donation révoquée

Oct 2012 - IST 59 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 56: Ist2012 aussenac-ontologieAnnotationweb

Couches de TAL pour la construction

d’ontologies (Buitelaar, EACL 2006)

Oct 2012 - IST 60 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Séquence de mots (texte)

Termes

Synonymes (multilingues)

Concepts

Hiérarchie de concepts

Autres relations

Schémas d’axiomes

{père, papa, géniteur}

{mari, conjoint, époux}

Personne, père, père adoptif,

enfant, grand-parent

C:père = {René,…}, personne qui a 1 enfant}

Axiomes, règles

estParentDe(Personne, personne) ;

habiteDans(personne, ville)

Disjoint(personne, ville)

Toute personne a au plus 1 mère

PèreAdoptif est_un père

personne est_un êtreVivant

Page 57: Ist2012 aussenac-ontologieAnnotationweb

Méthodes contextuelles locales :

patrons de relation

Exemples : un … est un … qui

tous les …, sauf …,

… et …

Problèmes Généralités vs. spécificité (domaine, type de textes)

Relations

Patrons

Prétraitements : quels indices exploiter ?

Lexique, POS, relations syntaxiques SUJET-OBJET…,

Valider des patrons généraux

Cf. Cameléon

Acquérir des patrons spécifiques

Technique itérative (Hearst, 1992)

Apprentissage automatique

Oct 2012 - IST 61 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 58: Ist2012 aussenac-ontologieAnnotationweb

Méthodes contextuelles globales :

cooccurrence

Méthodes classiques en informatique documentaire

Création automatique de thesaurus

Cooccurrence statistique

1er ordre

Les unités qui cooccurrent avec le mot pivot dans une fenêtre

donnée (phrase, paragraphe, +- n mots)

2ème ordre

Les unités qui ont les mêmes cooccurrents que le mot pivot

Oct 2012 - IST 62 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 59: Ist2012 aussenac-ontologieAnnotationweb

Méthode contextuelle globale :

analyse distributionnelle

Analyse distributionnelle (Zellig S. HARRIS)

Deux termes sont rapprochés s’ils apparaissent dans les mêmes

contextes syntaxiques.

Oct 2012 - IST 63 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

ontologie taxinomie

insertion dans ~

classer dans ~

structurer ~

organisation de ~

réaliser ~

contextes

Page 60: Ist2012 aussenac-ontologieAnnotationweb

Analyse distributionnelle :

choix méthodologiques

Analyse syntaxique en entrée

syntagmes nominaux / syntagmes verbaux

Données (unités rapprochées, contexte)

structures élémentaires / structures complexes

Mesures de proximité

Jaccard / Jaccard pondéré / …

Types de regroupement

Couples / classes / cliques / …

Oct 2012 - IST 64 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 61: Ist2012 aussenac-ontologieAnnotationweb

Logiciels

Extraction de relations

Caméléon -> démo

Terminoweb http://termino.iit.nrc.ca/index.jsp

Chaînes de traitements

text2Onto http://ontoware.org/projects/text2onto/

Un projet européen : NEON http://www.neon-project.org/

Un projet pour le français : DAFOE http://dafoe4app.fr/

Oct 2012 - IST 65 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 62: Ist2012 aussenac-ontologieAnnotationweb

Couches de TAL pour la construction

d’ontologies (Buitelaar, EACL 2006)

Oct 2012 - IST 66 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Séquence de mots (texte)

Termes

Synonymes (multilingues)

Concepts

Hiérarchie de concepts

Autres relations

Schémas d’axiomes

{père, papa, géniteur}

{mari, conjoint, époux}

Personne, père, père adoptif,

enfant, grand-parent

C:père = {René,…}, personne qui a 1 enfant}

Axiomes, règles

estParentDe(Personne, personne) ;

habiteDans(personne, ville)

Disjoint(personne, ville)

Toute personne a au plus 1 mère

Si Pere(x,y) et Pere(y,z) alors GrandPere(X,Z)

PèreAdoptif est_un père

personne est_un êtreVivant

Page 63: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 67

4 - Annotation sémantique,

extraction d’information :

convergences

La diversité des annotations

L’annotation de documents textuels : de la langue aux

représentations formelles

Quelques logiciels d’annotation

À l’heure du web des données

De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 64: Ist2012 aussenac-ontologieAnnotationweb

Annotations et méta-données

Annotation comme objet Information associée à une page existante

Information manipulable par un système informatique

Information qui peut être séparée des données annotées

Annotation vs méta-donnée vs index Méta-donnée

Plutôt normalisée, catégories définies a priori et souvent séparée du document (fichier à part)

Ex : Dublin Core

Annotation

Plutôt liée au domaine, définie A LA MAIN ou automatiquement, APRES création du document, complète le document

Index

Plutôt lié au contenu, calculé AUTOMATIQUEMENT à partir du document (APRES création), stocké à part, se substitue au document

Oct 2012 - IST 68 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 65: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 69

Emprunté à Y. Prié, cours M2R 2005-2006

De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 66: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 71 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 67: Ist2012 aussenac-ontologieAnnotationweb

Processus d’annotation sémantique

2 types d’annotations Associer des concepts à tout le document ou à chaque

paragraphe (annotation conceptuelle)

Localiser précisément les mots correspondant aux concepts (annotation sémantique)

2 types de processus / de logiciels Manuel : interface pour « poser » des annotations (ex: Magpie,

Notator)

Automatique : logiciel de production d’un index sémantique

Oct 2012 - IST 72 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 68: Ist2012 aussenac-ontologieAnnotationweb

Annotation sémantique de documents textuels

Annotation comme processus

But

Construire une représentation de chaque document

formée de concepts (et de relations entre concepts)

Les indices linguistiques comme pivots

Retrouver des traces linguistiques de concepts /

d’instances de concepts / dans les textes

Retrouver des traces linguistiques de relations

Oct 2012 - IST 73 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Indices

linguistiques

Page 69: Ist2012 aussenac-ontologieAnnotationweb

Processus d’annotation sémantique

Indices pour annoter termes importants ou mots clés

présents dans l’ontologie

= étiquettes des concepts (labels ou Id)

Annoter Enregistrer les concepts

associés

Résultat de l’annotation (suivant les approches) Liste de concepts

Liste d’instances de concepts

Graphe de concepts

Graphe d’instances de concepts

Oct 2012 - IST 74 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 70: Ist2012 aussenac-ontologieAnnotationweb

Graphe d’annotation

Graphe de relations entre

instances

Graphe connexe

Ensemble de triplets

conformes au modèle de

l’ontologie

Oct 2012 - IST 75 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 71: Ist2012 aussenac-ontologieAnnotationweb

Processus d’annotation

Ex de difficultés

Ontologie : concept « rouler » > comment reconnaître roulage ?

Ontologie : concepts « perte de puissance » et « puissance » :

comment choisir « perte de puissance » ?

Ontologie : « perte de puissance » EST-UN « problème » : faut-il

annoter avec le concept le plus spécifique ? Le plus générique ?

Les deux ?

Phrase : (à haut régime) :

parenthèses: faut-il en tenir compte ? Comment les interpréter ?

Fin de phrase : comment savoir que « haut régime » est associé au

moteur et pas à « autoroute » ?

Oct 2012 - IST 76 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 72: Ist2012 aussenac-ontologieAnnotationweb

Processus d’annotation : fonctions de TAL

essentielles

Calculer la distance entre 2 termes

Distances entre chaînes de caractères (dist lexicales)

Basée sur des n-grammes, souvent 3-grammes : chat et chaton ont

en commun {cha, hat} (mesure de Lin, 1998)

Distance d’édition (Levenshtein, 1996)

E(T1,T2) = nbre d’opérations pour passer de T1 à T2

String matching (Maedche et Staab, 2002)

Distances entre termes composés de plusieurs mots

Distance entre vecteurs de mots

Oct 2012 - IST 77 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 73: Ist2012 aussenac-ontologieAnnotationweb

Couches de TAL pour l’annotation

sémantique (Buitelaar, EACL 2006)

Oct 2012 - IST 78 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Séquence de mots (texte)

Termes

Synonymes (multilingues)

Concepts

Hiérarchie de concepts

Autres relations

Schémas d’axiomes

{père, papa, géniteur}

{mari, conjoint, époux}

Personne, père, père adoptif,

enfant, grand-parent

C:père = {René,…}, personne qui a 1 enfant}

Axiomes, règles

estParentDe(Personne, personne) ;

habiteDans(personne, ville)

Disjoint(personne, ville)

Toute personne a au plus 1 mère

PèreAdoptif est_un père

personne est_un êtreVivant

Page 74: Ist2012 aussenac-ontologieAnnotationweb

Annotation sémantique avec TextAnnot http://themat2i.univ-pau.fr:8080/TextAnnot-WWW/index.jsp

Le processus Projette les termes de la RTO des fiches à annoter

indexation avec le moteur Lucène

distance entre termes basée sur des trigrammes

Génère des instances de termes

Pour chaque terme, génère une instance DU (seul) concept associé

Met en relation les instances de concepts reconnus lorsque les termes sont proches dans la même phrase

Les met en relation avec le type de relation proposé dans l’ontologie

Le résultat Graphe d’instances, connexe

Ensemble de triplets d’instances ajoutées à l’ontologie

Oct 2012 - IST 79 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 75: Ist2012 aussenac-ontologieAnnotationweb

Annotation sémantique avec TextAnnot http://themat2i.univ-pau.fr:8080/TextAnnot-WWW/index.jsp

Oct 2012 - IST 80 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 76: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 81

Cycle de vie des annotations

Nouveaux documents Nouveaux concepts

Nouvelle terminologie

Gestion des évolutions des annotations

Assurer la cohérence entre ontologie / annotation et corpus

De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 77: Ist2012 aussenac-ontologieAnnotationweb

Outils d’annotation

Annotation en RDF Annotea

W3C

Protocole de transfert d’annotation vers/de un serveur central

Un schéma minimal, extensions possibles, classement des topics

Implémentations : Amaya

Annotation sémantique en RDFs CREAM (CREAting Metadata)

Framework pour l’annotation / édition

Notion de méta-données relationnelle (ie. basées sur les ontologies)

Ontomat

http://annotation.semanticweb.org/tools/ontomat

Annotation sémantique à l’aide de graphes conceptuels Web Knowledge Base – http://www.webkb.org/

Oct 2012 - IST 82 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 78: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 83

CREAM

De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 79: Ist2012 aussenac-ontologieAnnotationweb

KIM (Kyriakov et al., 2004)

But = annoter des pages web

Implémentation = plug-in du navigateur

Mise à disposition d’une ontologie “générale” qui renvoie

à des noms propres (lieux, personnes, entreprises, etc)

Disponible à http://www.ontotext.com/kim

Oct 2012 - IST 84 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 80: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 85

KIM

De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 81: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 86 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 82: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 87 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 83: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 88 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 84: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 89 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 85: Ist2012 aussenac-ontologieAnnotationweb

5 – à l’heure du web des données

Nouveaux enjeux

Associer données et ontologies

Annoter avec des ontologies peuplées de données

Extraire des données pour annoter

Annoter pour naviguer

Nouveauté

Quantité, disponibilité des données

Continuité des problèmes linguistiques

Ambigüité, références, variation, …

Oct 2012 - IST 90 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 86: Ist2012 aussenac-ontologieAnnotationweb

DBPedia Spotlight

Début en Juin 2010, réalisé par les chercheurs du Web Based

Systems Group de la Free University of Berlin

Disponible pour l’anglais, internationalisation en cours

Open source web service

Spotting: Keyphrase Extraction and Named Entity Recognition

Desambiguation : choisit la bonne classe en fonction du contexte

Annotation : retourne les résultats de l’annotation avec le “meilleur” concept pour

chaque expression annotée

Candidats : retourne toutes les possibilités d’annotation de chaque expression

http://dbpedia-spotlight.github.com/demo/#

Oct 2012 - IST 91 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

DBpedia Spotlight is a tool for annotating mentions of DBpedia resources

in text, providing a solution for linking unstructured information sources to

the Linked Open Data cloud through DBpedia.

http://en.wikipedia.org/wiki/DBpedia_Spotlight

Page 87: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 92 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 88: Ist2012 aussenac-ontologieAnnotationweb

Fred : extraire et annoter par des graphes

FRED http://wit.istc.cnr.it/stlab-tools/fred/

analyse des phrases en langage naturel

bien formées en anglais (verbe)

produit des fragments d'ontologies et de données liées

en RDF/OWL

Principes

reconnaissance des relations du verbe (FrameNet et VerbNet)

représentation logique compatible avec DRT (discourse

representation theory)

application de patrons de conception d'ontologie (ontology design

patterns) pour bien former les fragments

Analyseurs utilisés

C&C http://svn.ask.it.usyd.edu.au/trac/candc

Boxer http://svn.ask.it.usyd.edu.au/trac/candc/wiki/boxer

Oct 2012 - IST 93 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 89: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 94 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 90: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 95 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 91: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 96 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 92: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 97 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 93: Ist2012 aussenac-ontologieAnnotationweb

Tipalo : extraire des graphes locaux

Tipalo http://wit.istc.cnr.it/stlab-tools/tipalo/

But :

générer un graphe d’entités d’une page Wikipedia

Sorte « d’annotation » de la page

Graphe RDF composé de rdf:type, rdfs:subClassOf, owl:sameAs,

et owl:equivalentTo

Méthode

Utilise FRED

Affecte automatiquement un type aux entités nommées

Oct 2012 - IST 98 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 94: Ist2012 aussenac-ontologieAnnotationweb

http://en.wikipedia.org/wiki/Isabelle_Huppert

Oct 2012 - IST 99 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 95: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 100 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 96: Ist2012 aussenac-ontologieAnnotationweb

Annoter pour naviguer via les données

Aemoo http://wit.istc.cnr.it/aemoo/index.html

But : recherche exploratoire sur le Web.

Entrée : des mots clés

Résultat : réseau autour de cette entité

Sources exploitées :

Les textes de Wikipedia, Twitter, et Google News

Plus riche que DBpedia (qui représente seulement 7de

Wikipedia).

Oct 2012 - IST 101 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 97: Ist2012 aussenac-ontologieAnnotationweb

Aemoo n’aime que les entités, pas les classes

Oct 2012 - IST 102 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 98: Ist2012 aussenac-ontologieAnnotationweb

Aemoo aime bien les entités

Oct 2012 - IST 103 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 99: Ist2012 aussenac-ontologieAnnotationweb

Inquire : intelligent textbook http://www.aaaivideos.org/2012/inquire_intelligent_textbook/

Ontologie de 5000

concepts

Editeur de graphes

Annotation

manuelle

Oct 2012 - IST 104 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 100: Ist2012 aussenac-ontologieAnnotationweb

Inquire : annotation par des graphes

Oct 2012 - IST 105 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 101: Ist2012 aussenac-ontologieAnnotationweb

Inquire : interrogation

Oct 2012 - IST 106 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 102: Ist2012 aussenac-ontologieAnnotationweb

Le graphe / concept réponse

Oct 2012 - IST 107 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 103: Ist2012 aussenac-ontologieAnnotationweb

Afficher la réponse : document reconstruit

Oct 2012 - IST 108 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 104: Ist2012 aussenac-ontologieAnnotationweb

Discussion: web des données, web sémantique

Le web des données

Plus de données

Format homogène

Processus continu d’enrichissement

L’espoir / l’illusion : plus réaliste que le web sémantique

Annotations plus faciles

Ressources disponibles pour annoter, couvrant tout domaine

Faire émerger du sens de la quantité

La réalité

Typer les données

Assurer des passerelles entre données (aligner, associer)

Les problèmes d’annotation demeurent

Oct 2012 - IST 109 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 105: Ist2012 aussenac-ontologieAnnotationweb

Oct 2012 - IST 110

Convergences : les difficultés qui demeurent

Sur les données pour annoter Relier les données => les typer => ontologies

Ontologie => point de vue sur le document

Extraire des triplets vs donner du sens

Sur l’annotation en général Statut des annotations, droits % documents et auteurs

Qui annote, quand, pour qui

Place, stockage des annotations

Sur l’annotation sémantique Orientation des interprétations, des usages, requêtes etc.

Gestion des évolutions

Guidage par le document (et adaption du schéma) vs par l’ontologie

De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles

Page 106: Ist2012 aussenac-ontologieAnnotationweb

Convergences : les difficultés qui demeurent

Outils d’annotation Automatisation => articulation lexique-ontologie et/ou TAL

Architectures différentes selon usage prévus

En pleine expansion

Nécessite des développements en apprentissage et TAL

Ce que je n’ai pas développé : exploiter le web 2.0

Les tags sont-ils des annotations ?

Méta-données ? Mots-clés ou pense-bête ?

Quel rapport à l’objet documentaire taggé ?

Folksonomies pour construire / remplacer les ontologies

Oct 2012 - IST 111 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles