ontologies étendues pour l'annotation sémantique

23
Annotation s´ emantique Une extension ` a base de r` egles d’annotation Conclusion et perspectives Ontologies ´ etendues pour l’annotation s´ emantique Yue Ma, Laurent Audibert, Adeline Nazarenko Laboratoire d’Informatique de Paris-Nord (UMR CNRS 7030) Institut Galil´ ee - Universit´ e Paris-Nord 99, avenue Jean-Baptiste Cl´ ement 93430 Villetaneuse, France 29 mai 2009 Ce travail a ´ et´ e r´ ealis´ e dans le cadre du programme Quaero, financ´ e par OSEO, agence nationale de valorisation de la recherche. IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´ etendues pour l’annotation s´ emantique 1 / 23

Upload: conference-ic-2009

Post on 05-Dec-2014

1.694 views

Category:

Technology


3 download

DESCRIPTION

Présentation de Yue Ma, Laurent Audibert et Adeline Nazarenko à IC 2009

TRANSCRIPT

Page 1: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Ontologies etendues pour l’annotation semantique

Yue Ma, Laurent Audibert, Adeline Nazarenko

Laboratoire d’Informatique de Paris-Nord (UMR CNRS 7030)Institut Galilee - Universite Paris-Nord

99, avenue Jean-Baptiste Clement93430 Villetaneuse, France

29 mai 2009

Ce travail a ete realise dans le cadre du programme Quaero,finance par OSEO, agence nationale de valorisation de la recherche.

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 1 / 23

Page 2: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Introduction

Annotation semantique

Mettre des fragments de texte en correspondance avec les elementsd’une ontologie

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 2 / 23

Page 3: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Introduction

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 3 / 23

Page 4: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Introduction

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 4 / 23

Page 5: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Sommaire

1 Annotation semantique

2 Une extension a base de regles d’annotation

3 Conclusion et perspectives

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 5 / 23

Page 6: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre

Types d’annotationConcepts

Certains mots ou expressionsdenotent des concepts

Exemple : piece de theatre

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 6 / 23

Page 7: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre

Types d’annotationInstances de concepts

Certains mots ou expressionsrenvoient a des instances deconcepts

Exemple : entites nommees commeMarie et Moliere

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 7 / 23

Page 8: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre

Types d’annotationRoles conceptuels

Certains mots ou expressionsdenotent des roles conceptuels

Exemple : lit

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 8 / 23

Page 9: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre

Types d’annotationRelations entre instances

Certains fragments de texterenvoient a des relations entreinstances

Exemple : une piece de theatre deMoliere

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 9 / 23

Page 10: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre

Types d’annotationAxiomes ontologiques

Certains fragments textuels expriment des axiomesontologiques

Exemple : les genes sont des entites biologiques

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 10 / 23

Page 11: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre

Extension lexicaleSysteme LingInfo

LingInfo [Buitelaar, Sintek & Kiesel, 2006] associe une decompositionlinguistique detaillee aux classes et aux proprietes de l’ontologie

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 11 / 23

Page 12: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre

Extension lexicaleSysteme LexOnto

LexOnto [Cimiano, Haase, Herold, Mantel & Buitelaar, 2007] utilise unemeta-ontologie permettant de representer des relations simples entretermes et concepts, ainsi que des structures linguistiques complexes detype predicat-argument (cadres de sous-categorisation).

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 12 / 23

Page 13: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre

Contexte de mise en oeuvrePlateforme d’annotation linguistique

Contexte :

Plateforme d’annotationlinguistique

Integration d’outils heterogenes

Probleme dans la plateforme Alvis :

Representation semantiquerepartie sur plusieurs niveauxI problemes de coherenceI forte dependance avec les outilsutilises en amont

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 13 / 23

Page 14: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre

Contexte de mise en oeuvreExtensions lexicales existantes ?

L’ontologie rassemble en un lieu uniqueet coherent ce qui est du ressort de lasemantique

Inconvenients du niveau terminologiquepivot des systemes presentes :

Constitution manuelle ou assistee

Double-emploi avec les annotationsdes niveaux inferieurs de laplateforme

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 14 / 23

Page 15: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre

Contexte de mise en oeuvreExtension a base de regles

Objectifs de l’extension :

Permettre l’annotation semantiqueautomatique

S’appuyer sur les annotations desmodules situes en amont

Comprehensible et modifiable parun etre humain

Etre inferable(semi-)automatiquement a partird’un corpus semantiquementannote

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 15 / 23

Page 16: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Extension a base de reglesExpression des reglesOperations sur une ontologie etendue

Ontologie et Regles

Ontologie

O = 〈C ,R, I ?,RI ?,A〉 composee d’un ensemble de concepts (C ),de roles (R), d’instances (I ), de relations entre instances (RI ) etd’axiomes (A)

Regles

Une regle est la donnee d’un couple (P,C ) ou P (Premisse) decritles conditions qu’un segment de texte doit verifier pour etre annoteet C (Conclusion) indique comment annoter le segment.

Exemple de regle pour annoter le segment de texte « personne » :

(P,C ) = ([lemme={personne}], PERSONNE )

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 16 / 23

Page 17: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Extension a base de reglesExpression des reglesOperations sur une ontologie etendue

Definition de l’extension

Extension

R = 〈RC ,RR ,RI ,RRI ,RA〉, un ensemble de regles permettantd’annoter des fragments de textes en les reliant a des concepts(RC ), des roles (RR), des instances (RI ), des relations entreinstances (RRI ) ou des axiomes (RA)

Pour chaque concept c de C il existe un couple de regles(ρc , ρci ) concluant sur c et telles que ρc ∈ RC et ρci ∈ RI

pour chaque role r de R il existe un couple de regles (ρr , ρri )concluant sur r et telles que ρr ∈ RI et ρri ∈ RRI

pour chaque axiome a de A il existe une regle ρa ∈ RA

concluant sur a

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 17 / 23

Page 18: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Extension a base de reglesExpression des reglesOperations sur une ontologie etendue

Exemple de couple de regles

Regle d’annotation ontologique pour annoter « personne » :

ρc ∈ RC = ([lemme={personne}], PERSONNE )

Regle de peuplement ontologique pour annoter « Marie » :

ρci ∈ RI = ([entite_nommee={personne}], PERSONNE )

Si l’objectif n’est pas de peupler l’ontologie :

on peut ignorer les regles de peuplement

on peut les interpreter comme des regles conceptuelles

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 18 / 23

Page 19: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Extension a base de reglesExpression des reglesOperations sur une ontologie etendue

Formalisme des patrons

La premisse P d’une regle (P,C ) peut etre representee par unensemble de patrons

Pour exprimer des contraintes de desambiguısation portant sur soncontexte, un patron pourrait s’ecrire sous la forme d’un triplet :P = (LC ?,T ,RC ?)

Formalismes candidats :

XPath pour des annotations en XML (sous forme de triplets)

ou XQuery (pas besoin de triplets)

SQL pour des annotations dans une base de donnees

JDOQL pour des annotations gerees par la librairie JDO

HQL pour des annotations gerees par la librairie Hibernate

. . .IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 19 / 23

Page 20: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Extension a base de reglesExpression des reglesOperations sur une ontologie etendue

Operations sur une ontologie etendue

L’ajout d’un concept implique de preciser les patrons associes :1 selon une proposition spontanee de l’utilisateur2 ou en les inferant a partir d’annotations manuelles sur un

corpus representatif

La decomposition d’un concept impose la decomposition de sonextension :

1 qui peut etre realisee manuellement2 ou inferee apres avoir annote un corpus representatif et

reparti manuellement les annotations

La fusion de deux concepts c1 et c2 a comme extension(ρc1 ∨ ρc2, ρi1 ∨ ρi2)

La suppression d’un concept entraıne la suppression de sonextension, ou son absorption par le ou les concepts qui lesubsument

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 20 / 23

Page 21: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Conclusion

Solution au probleme de l’annotation semantique au regard d’uneontologie dans le cadre d’une plateforme d’annotation

Tire parti des outils de TAL situes en amont

Distinction claire entre processus d’analyse linguistique etinterpretation ontologique

Interet des patrons :

Grand pouvoir expressif

Comprehensibles et modifiables par une personne

Interpretables, voire calculables, par un ordinateur

Nombreux formalismes connus et standardises existants

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 21 / 23

Page 22: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Perspectives

Determination du formalisme des patrons

Developpement et experimentations d’un module d’annotationsemantique dans une plateforme d’annotation

Problematique prometteuse du champs de rechercheconcernant l’acquisition des regles (apprentissage incremental,active learning. . . )

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 22 / 23

Page 23: Ontologies étendues pour l'annotation sémantique

Annotation semantiqueUne extension a base de regles d’annotation

Conclusion et perspectives

Paul Buitelaar, Michael Sintek, and Malte Kiesel.

A multilingual/multimedia lexicon model for ontologies.

In ESWC, pages 502–513, 2006.

Philipp Cimiano, Peter Haase, Matthias Herold, Matthias Mantel, andPaul Buitelaar.

Lexonto : A model for ontology lexicons for ontology-based nlp.

In Proceedings of OntoLex - From Text to Knowledge : TheLexicon/Ontology Interface, 2007.

IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 23 / 23