vers une approche de construction de composants ontologiques pour le web sémantique – synthèse...

20
Vers une approche de Vers une approche de construction de composants construction de composants ontologiques pour le web ontologiques pour le web sémantique – synthèse et sémantique – synthèse et discussion. discussion. Nesrine Ben Mustapha (RIADI, ENSI Nesrine Ben Mustapha (RIADI, ENSI Tunis) Tunis) Marie-Aude Aufaure (Supélec Paris) Marie-Aude Aufaure (Supélec Paris) Hajer Baazaoui-Zghal (RIADI, ENSI Hajer Baazaoui-Zghal (RIADI, ENSI Tunis) Tunis)

Upload: lemoine-buisson

Post on 03-Apr-2015

105 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

Vers une approche de Vers une approche de construction de composants construction de composants

ontologiques pour le web ontologiques pour le web sémantique – synthèse et sémantique – synthèse et

discussion.discussion.

Nesrine Ben Mustapha (RIADI, ENSI Nesrine Ben Mustapha (RIADI, ENSI Tunis)Tunis)

Marie-Aude Aufaure (Supélec Paris)Marie-Aude Aufaure (Supélec Paris)

Hajer Baazaoui-Zghal (RIADI, ENSI Tunis)Hajer Baazaoui-Zghal (RIADI, ENSI Tunis)

Page 2: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

PLANPLAN

Contexte et objectifsContexte et objectifs Classification des méthodes de Classification des méthodes de

construction d’ontologiesconstruction d’ontologies– Les méthodes de construction Les méthodes de construction

« from scratch »« from scratch »– Les méthodes d’apprentissage à Les méthodes d’apprentissage à

partir de textespartir de textes Méthode proposéeMéthode proposée conclusionconclusion

Page 3: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

Contexte et objectifsContexte et objectifs Web sémantique : recherche plus Web sémantique : recherche plus

pertinente d’informations sur le webpertinente d’informations sur le web– Brique de base : les ontologiesBrique de base : les ontologies– Pb : rapidité de déploiement des Pb : rapidité de déploiement des

ontologies sur le webontologies sur le web Construction manuelle d’ontologiesConstruction manuelle d’ontologies

– Tâche longue et fastidieuseTâche longue et fastidieuse

automatiser au maximum automatiser au maximum cette cette tâchetâche

Page 4: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

Quelques définitionsQuelques définitions

Ontologie :Ontologie :– " une ontologie est une spécification explicite,

formelle d'une conceptualisation partagée " [Gruber, 1993]

Web sémantique :– « Le Web sémantique n'est pas un Web distinct

indépendant du web actuel mais c’est le prolongement du web que l'on connaît et où on attribue à l'information une signification clairement définie, ce qui permet aux ordinateurs et aux humains de travailler en collaboration étroite » Tim Berners-Lee

Page 5: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

Classification des Classification des méthodesméthodesLes méthodologies de

construction d’ontologies « from scratch »

Les méthodologies d’apprentissage d’ontologies

Les méthodologies de ré-ingénierie d’ontologies

Les méthodologies de construction coopérative d’ontologies

Les méthodologies de fusion d’ontologies

A partir du texte

A partir du dictionnaire

A partir d’une base de

connaissances

A partir des données semi-structurées

A partir des schémas

relationnels

Les méthodologies d’évaluation d’ontologies

Les méthodologies d’évolution d’ontologies

Page 6: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

Les méthodologies d’apprentissage d’ontologies

A partir de textes

A partir de dictionnaires

A partir de bases de connaissances

A partir de données semi-structurées

A partir de schémas

relationnels

Basées sur des méthodes de traitement

automatique du langage naturel

basées sur les règles

d’association

basées sur les méthodes de

clustering

basées sur l’enrichissement

d’ontologie

basées sur la combinaison de

plusieurs techniques

Des méthodologies d’apprentissage d’ontologie

Page 7: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

Construction automatisée Construction automatisée d’ontologiesd’ontologies

2 points de vue :2 points de vue :

– Utilisation ou non de connaissance à prioriUtilisation ou non de connaissance à priori

Différentes techniques :Différentes techniques :

– ApprentissageApprentissage– Classification automatiqueClassification automatique– Techniques linguistiquesTechniques linguistiques– Méthodes hybridesMéthodes hybrides

Page 8: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

SynthèseSynthèse

La construction d’une ontologie

?

Type d’ontologie à construire

Usage de l’ontologie

Sources d’informations d’entrée de la méthode

L’extraction des concepts

L’extraction des relations

L’extraction des axiomes

Les techniques de traitement

automatique de la langue naturelle

Les techniques d’apprentissage

Des techniques hybrides

Les patrons lexico-syntaxiques

symboliques numériques

Page 9: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

SynthèseSynthèseLes techniques de

traitement automatique des

langues naturelles

Les patrons lexico-syntaxiques

Extraction des hyponymes des instancesExtraction des collocations de termesExtraction des relations taxonomiques

Les techniques d’apprentissage

symboliques

numériques

La logique des propositionsLa logique du premier ordre Les réseaux sémantiques Les graphes conceptuels Les arbres de décision Les treillis de Galois Les langages de Frames La représentation des connaissances par objets

Les réseaux bayésiens Les réseaux de neurones Les cartes de Kohonen Les chaînes de Markov cachées (HMM) Les algorithmes génétiquesLes algorithmes de clustering

Page 10: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

ProblématiqueProblématiqueType d’ontologie à

construire

Usage de l’ontologie

Sources d’informations d’entrée de la

méthode

Extraction des connaissances à partir du web

Ontologie pour le web sémantique

L’extraction des concepts

L’extraction des relations

L’extraction des axiomes

???

• Automatisation du processus de construction

• Satisfaire la contrainte du passage à l’échelle de l’ontologie et de son évolution.

• Adopter un enrichissement incrémental de l’ontologie au fur et à mesure de l’acquisition de connaissances.

Techniques utilisées

Formalismes de représentation

Pages web (html, XML)

Page 11: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

Approche proposéeApproche proposée

Architecture de composants Architecture de composants ontologiques pour le web ontologiques pour le web sémantiquesémantique

Page 12: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Page 13: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Page 14: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

La construction de l’ontologie de domaine

Initialisation

Itération 1

Etape A Etape B

Itération n

Etape A Etape B

AutoApprentissage

D’ontologie

Apprentissage incrémental et itératif en se basant sur des techniques linguistiques et statistiques

En l’absence des autres composants ontologiques

Les axiomes de l’ontologie de domaine spécifiant des règles d’extraction de relations et les

axiomes de l’ontologie des structures Web permettent un auto

apprentissage de l’ontologie de domaine

Page 15: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

La construction de l’ontologie de domaine

Initialisation

Conception et construction manuelle de l'ontologie minimale de domaine en se basant sur les concepts et les relations de synonymie, antonymie, hyponymie…. de Wordnet.

La préparation des sources d’apprentissage des concepts et des relations

La recherche dans le Web des documents relatifs au domaine d'étude en s'appuyant sur les requêtes de concepts de ont0 (ontologie minimale).

La classification des documents Web selon leur pertinence aux concepts de l’ontologie minimale en calculant des vecteurs de poids (tf-idf [SAL 88])

Cette classification aboutira à la répartition des documents Web en des classes de documents textuels

La préparation d’un corpus textuel qui comprend un ensemble de phrases contenant au moins un concept de l’ontologie de domaine.

La préparation d’un corpus des documents HTML et XML indexés par leurs adresses qui sont extraites.

Prétraitement des corpus : étiquetage lexico-syntaxique des textes.

Page 16: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

La construction de l’ontologie de domaine

Etape A

L’enrichissement de l’ontologie «Ont0 » avec de nouveaux concepts à partir des données semi structurés (XML, DTD, tableaux).

La construction d’un espace de mots [Yamaguchi, 2001] basé sur les concepts de l’ontologie minimale « Ont0 ».

L’apprentissage des axiomes d’extraction de patrons lexico-syntaxiques

relatifs aux relations non taxonomiques à partir de l’ontologie minimale

Relatifs aux relations de synonymie, hyponymie et méronymie en vue d’extraire les relations de la couche lexicale de l’ontologie de domaine

relatifs à l’extraction des instances d’ontologie de domaine

Construction d’une matrice permettant de calculer la similarité entre chaque paire de vecteurs représentants une paire de concept dans l’espace de mot antérieurement construit

Initialisation

Page 17: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

La construction de l’ontologie de domaine

Etape B

La mise à jour du corpus textuel et la collection des documents Web suivant une recherche basée sur les concepts de l’ontologie minimale.

L’extraction de nouvelles relations non taxonomiques et de nouveaux concepts en appliquant les patrons lexico syntaxiques.

Les relations sont pondérées par un score se basant sur le calcul de la fréquence de l’application des patrons lexico-syntaxiques antérieurement appris.

Mise à jour de l’ontologie minimale

Etape A

Etape A

Initialisation

Page 18: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

La construction de l’ontologie de domaine

Etape B

Etape A

Etape A

Initialisation

AutoApprentissage

Exemple : Les axiomes qui spécifient la dérivation des noms, adjectifs et adverbes

à partir des verbes

Exemple : Les axiomes qui spécifient Les patrons

lexioco-syntaxiques des relations conceptuelles

Exemple : les axiomes qui spécifient des relations entre les instances en

appliquant des méthodes de fouille de données

Page 19: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

Conclusion et Conclusion et perspectivesperspectives Architecture de composants Architecture de composants

ontologiquesontologiques– 3 ontologies en interaction3 ontologies en interaction– Implémentation de la partie Implémentation de la partie

ontologie de domaineontologie de domaine Prise en compte des profils Prise en compte des profils

utilisateurs et de l’usage durant le utilisateurs et de l’usage durant le processus de constructionprocessus de construction

Encore beaucoup de travail !!!Encore beaucoup de travail !!!

Page 20: Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

Merci de votre attention