vers une approche de construction de composants ontologiques pour le web sémantique – synthèse...
TRANSCRIPT
Vers une approche de Vers une approche de construction de composants construction de composants
ontologiques pour le web ontologiques pour le web sémantique – synthèse et sémantique – synthèse et
discussion.discussion.
Nesrine Ben Mustapha (RIADI, ENSI Nesrine Ben Mustapha (RIADI, ENSI Tunis)Tunis)
Marie-Aude Aufaure (Supélec Paris)Marie-Aude Aufaure (Supélec Paris)
Hajer Baazaoui-Zghal (RIADI, ENSI Tunis)Hajer Baazaoui-Zghal (RIADI, ENSI Tunis)
PLANPLAN
Contexte et objectifsContexte et objectifs Classification des méthodes de Classification des méthodes de
construction d’ontologiesconstruction d’ontologies– Les méthodes de construction Les méthodes de construction
« from scratch »« from scratch »– Les méthodes d’apprentissage à Les méthodes d’apprentissage à
partir de textespartir de textes Méthode proposéeMéthode proposée conclusionconclusion
Contexte et objectifsContexte et objectifs Web sémantique : recherche plus Web sémantique : recherche plus
pertinente d’informations sur le webpertinente d’informations sur le web– Brique de base : les ontologiesBrique de base : les ontologies– Pb : rapidité de déploiement des Pb : rapidité de déploiement des
ontologies sur le webontologies sur le web Construction manuelle d’ontologiesConstruction manuelle d’ontologies
– Tâche longue et fastidieuseTâche longue et fastidieuse
automatiser au maximum automatiser au maximum cette cette tâchetâche
Quelques définitionsQuelques définitions
Ontologie :Ontologie :– " une ontologie est une spécification explicite,
formelle d'une conceptualisation partagée " [Gruber, 1993]
Web sémantique :– « Le Web sémantique n'est pas un Web distinct
indépendant du web actuel mais c’est le prolongement du web que l'on connaît et où on attribue à l'information une signification clairement définie, ce qui permet aux ordinateurs et aux humains de travailler en collaboration étroite » Tim Berners-Lee
Classification des Classification des méthodesméthodesLes méthodologies de
construction d’ontologies « from scratch »
Les méthodologies d’apprentissage d’ontologies
Les méthodologies de ré-ingénierie d’ontologies
Les méthodologies de construction coopérative d’ontologies
Les méthodologies de fusion d’ontologies
A partir du texte
A partir du dictionnaire
A partir d’une base de
connaissances
A partir des données semi-structurées
A partir des schémas
relationnels
Les méthodologies d’évaluation d’ontologies
Les méthodologies d’évolution d’ontologies
Les méthodologies d’apprentissage d’ontologies
A partir de textes
A partir de dictionnaires
A partir de bases de connaissances
A partir de données semi-structurées
A partir de schémas
relationnels
Basées sur des méthodes de traitement
automatique du langage naturel
basées sur les règles
d’association
basées sur les méthodes de
clustering
basées sur l’enrichissement
d’ontologie
basées sur la combinaison de
plusieurs techniques
Des méthodologies d’apprentissage d’ontologie
Construction automatisée Construction automatisée d’ontologiesd’ontologies
2 points de vue :2 points de vue :
– Utilisation ou non de connaissance à prioriUtilisation ou non de connaissance à priori
Différentes techniques :Différentes techniques :
– ApprentissageApprentissage– Classification automatiqueClassification automatique– Techniques linguistiquesTechniques linguistiques– Méthodes hybridesMéthodes hybrides
SynthèseSynthèse
La construction d’une ontologie
?
Type d’ontologie à construire
Usage de l’ontologie
Sources d’informations d’entrée de la méthode
L’extraction des concepts
L’extraction des relations
L’extraction des axiomes
Les techniques de traitement
automatique de la langue naturelle
Les techniques d’apprentissage
Des techniques hybrides
Les patrons lexico-syntaxiques
symboliques numériques
SynthèseSynthèseLes techniques de
traitement automatique des
langues naturelles
Les patrons lexico-syntaxiques
Extraction des hyponymes des instancesExtraction des collocations de termesExtraction des relations taxonomiques
Les techniques d’apprentissage
symboliques
numériques
La logique des propositionsLa logique du premier ordre Les réseaux sémantiques Les graphes conceptuels Les arbres de décision Les treillis de Galois Les langages de Frames La représentation des connaissances par objets
Les réseaux bayésiens Les réseaux de neurones Les cartes de Kohonen Les chaînes de Markov cachées (HMM) Les algorithmes génétiquesLes algorithmes de clustering
ProblématiqueProblématiqueType d’ontologie à
construire
Usage de l’ontologie
Sources d’informations d’entrée de la
méthode
Extraction des connaissances à partir du web
Ontologie pour le web sémantique
L’extraction des concepts
L’extraction des relations
L’extraction des axiomes
???
• Automatisation du processus de construction
• Satisfaire la contrainte du passage à l’échelle de l’ontologie et de son évolution.
• Adopter un enrichissement incrémental de l’ontologie au fur et à mesure de l’acquisition de connaissances.
Techniques utilisées
Formalismes de représentation
Pages web (html, XML)
Approche proposéeApproche proposée
Architecture de composants Architecture de composants ontologiques pour le web ontologiques pour le web sémantiquesémantique
La construction de l’ontologie de domaine
Initialisation
Itération 1
Etape A Etape B
Itération n
Etape A Etape B
AutoApprentissage
D’ontologie
Apprentissage incrémental et itératif en se basant sur des techniques linguistiques et statistiques
En l’absence des autres composants ontologiques
Les axiomes de l’ontologie de domaine spécifiant des règles d’extraction de relations et les
axiomes de l’ontologie des structures Web permettent un auto
apprentissage de l’ontologie de domaine
La construction de l’ontologie de domaine
Initialisation
Conception et construction manuelle de l'ontologie minimale de domaine en se basant sur les concepts et les relations de synonymie, antonymie, hyponymie…. de Wordnet.
La préparation des sources d’apprentissage des concepts et des relations
La recherche dans le Web des documents relatifs au domaine d'étude en s'appuyant sur les requêtes de concepts de ont0 (ontologie minimale).
La classification des documents Web selon leur pertinence aux concepts de l’ontologie minimale en calculant des vecteurs de poids (tf-idf [SAL 88])
Cette classification aboutira à la répartition des documents Web en des classes de documents textuels
La préparation d’un corpus textuel qui comprend un ensemble de phrases contenant au moins un concept de l’ontologie de domaine.
La préparation d’un corpus des documents HTML et XML indexés par leurs adresses qui sont extraites.
Prétraitement des corpus : étiquetage lexico-syntaxique des textes.
La construction de l’ontologie de domaine
Etape A
L’enrichissement de l’ontologie «Ont0 » avec de nouveaux concepts à partir des données semi structurés (XML, DTD, tableaux).
La construction d’un espace de mots [Yamaguchi, 2001] basé sur les concepts de l’ontologie minimale « Ont0 ».
L’apprentissage des axiomes d’extraction de patrons lexico-syntaxiques
relatifs aux relations non taxonomiques à partir de l’ontologie minimale
Relatifs aux relations de synonymie, hyponymie et méronymie en vue d’extraire les relations de la couche lexicale de l’ontologie de domaine
relatifs à l’extraction des instances d’ontologie de domaine
Construction d’une matrice permettant de calculer la similarité entre chaque paire de vecteurs représentants une paire de concept dans l’espace de mot antérieurement construit
Initialisation
La construction de l’ontologie de domaine
Etape B
La mise à jour du corpus textuel et la collection des documents Web suivant une recherche basée sur les concepts de l’ontologie minimale.
L’extraction de nouvelles relations non taxonomiques et de nouveaux concepts en appliquant les patrons lexico syntaxiques.
Les relations sont pondérées par un score se basant sur le calcul de la fréquence de l’application des patrons lexico-syntaxiques antérieurement appris.
Mise à jour de l’ontologie minimale
Etape A
Etape A
Initialisation
La construction de l’ontologie de domaine
Etape B
Etape A
Etape A
Initialisation
AutoApprentissage
Exemple : Les axiomes qui spécifient la dérivation des noms, adjectifs et adverbes
à partir des verbes
Exemple : Les axiomes qui spécifient Les patrons
lexioco-syntaxiques des relations conceptuelles
Exemple : les axiomes qui spécifient des relations entre les instances en
appliquant des méthodes de fouille de données
Conclusion et Conclusion et perspectivesperspectives Architecture de composants Architecture de composants
ontologiquesontologiques– 3 ontologies en interaction3 ontologies en interaction– Implémentation de la partie Implémentation de la partie
ontologie de domaineontologie de domaine Prise en compte des profils Prise en compte des profils
utilisateurs et de l’usage durant le utilisateurs et de l’usage durant le processus de constructionprocessus de construction
Encore beaucoup de travail !!!Encore beaucoup de travail !!!
Merci de votre attention