Transcript
Page 1: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

Construction des composants ontologiques flous à partir de corpus de données sémantiques floues

Sahar Maâlej* — Hanêne Ghorbel* — Afef Bahri* — Rafik Bouaziz*

* Laboratoire Miracl Faculté des Sciences Economiques et de Gestion de Sfax Route de l’Aéroport km 4, B.P. 1088, 3018 Sfax, Tunisie [email protected] ; [email protected] ; [email protected] ; [email protected]

RÉSUMÉ. Les ontologies floues sont destinées à représenter aussi bien des notions précises que des notions floues. Elles représentent un grand intérêt pour divers domaines, et en particulier pour le domaine du web sémantique. Elles constituent maintenant un axe de recherche prometteur, sur lequel nous avons situé nos travaux, en partant du fait que les composants et les méthodes de construction d’ontologies floues sont complexes et délicats, et qu’une automatisation de leur construction s’impose. C’est ce qui constitue l’objet de cet article. L’approche que nous proposons à cet effet tire profit de certaine approches de conception et de développement d’ontologies précises et floues, d’une part, et des outils de traitement automatique de corpus de données, d’autre part. Cette approche permet de mieux extraire et organiser les composants ontologiques flous. ABSTRACT. Fuzzy ontologies are intended to represent not only crisp notions but also fuzzy ones. They have a key role in various domains, and in particular in the semantic web domain. They are now a promising research orientation, on which we positioned our works, assuming that the components and building methodologies of fuzzy ontologies are complex, and that an automation of their construction is essential. This is the subject of this article. The approach which we propose for this purpose takes advantage of some approaches of crisp and fuzzy ontologies design and development, on the one hand, and the tools for corpus automatic treatment, on the other hand. Our approach allows better extracting and organizing fuzzy ontological components. MOTS-CLÉS : Ontologie floue, Méthode de construction d’ontologies floues, Approche de construction des composants d’ontologies floues, Corpus de données. KEYWORDS: Fuzzy ontology, Fuzzy ontologies building methodology, Approach of fuzzy ontologies components construction, Data corpus.

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

361

Page 2: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

1. Introduction

Le web sémantique est un web intelligent où les informations ne seraient pas uniquement stockées par les ordinateurs, mais aussi comprises par eux afin de pouvoir apporter à l'utilisateur exactement ce qu'il cherche. Ce web, contrairement au web actuel, permettra de rendre les contenus sémantiques des ressources web interprétables non seulement par l'homme mais aussi par la machine (Berners-Lee et al., 2001). Pour que cet objectif soit atteint, on a pensé à faire appel aux ontologies qui aident à concevoir le monde réel avec ses contraintes sémantiques (Roberts, 2008). Mais, ce monde comporte des imprécisions et des imperfections que nous ne pouvons pas concevoir en utilisant les ontologies classiques (i.e., précises). Nous ne pouvons le faire que par des ontologies floues, mais dont les composants sont complexes et délicats à construire. Une automatisation de leur construction s’impose alors. C’est dans ce cadre que se situent nos travaux qui visent à définir une approche appropriée pour cette automatisation.

Le présent article est organisé comme suit. La section suivante présente l’étude de l’état de l’art et le positionnement de nos travaux. Les ontologies floues constituent l’objet de la troisième section. Quant à la quatrième, elle est réservée à la présentation de la démarche de notre méthodologie. Notre approche de construction des composants d’ontologies floues est décrite dans la cinquième section. Enfin, la dernière section traite de la conclusion et des perspectives.

2. Etat de l’art et positionnement

Les ontologies floues sont souvent définies en se basant sur la logique de description (LD) (Carbonell et al., 2007), mais pas sur leurs composants et sur la différence de ces derniers par rapport à ceux des ontologies précises. Cependant, l’utilisation de la logique floue dans les ontologies floues suscite de plus en plus d’intérêt de la part de la communauté scientifique. Ses apports sont montrés par plusieurs travaux pour différents domaines (Ghorbel et al., 2008). Les auteurs de (Zhai et al., 2008) essayent de définir les ontologies floues dans un modèle ontologique flou en se basant sur la logique floue, sans distinction entre composants précis et composants flous. Si les auteurs de (Ghorbel et al., 2010) ont fait le même essai, ils ont montré la différence entre ces composants suite à l’étude de leurs caractéristiques. Les composants d’ontologies floues (i.e., concepts flous et relations floues) sont souvent définis en se basant sur la logique floue. Cependant, l’auteur de (Straccia, 2006) se limite à définir un composant flou à partir de ses instances. Les auteurs de (Ghorbel et al., 2008) essayent de définir un composant flou en se basant sur l’intégration des incertitudes et des imprécisions à la définition d’un composant précis, sans définir tout d’abord ce dernier. C’est pour cela que nous allons essayer, dans cet article, d’améliorer la définition des composants flous.

Par ailleurs, la construction d’une ontologie floue représente un travail délicat et difficile, vu la complexité des notions utilisées. C’est pour cela qu’une méthode de

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

362

Page 3: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

conception d’ontologies floues s’impose. Nous allons se contenter dans cet article à présenter très brièvement la démarche de notre méthodologie, intitulée « Fuzzy OntoMethodology ». Elle est inspirée de la méthodologie de conception d’ontologies précises, « METHODOLOGY » (Gomez-Pérez et al., 2004). Cette dernière porte sur l’ensemble du processus et guide l’ontologiste dans toutes les étapes de construction.

De même, nous visons l’automatisation de la construction des composants des ontologies floues à partir de corpus de données sémantiques floues pour aider l’ontologiste à vaincre la complexité de ce travail et à améliorer la qualité de ces composants. A cet effet, nous avons étudié différentes approches et frameworks de conception et de développement d’ontologies. IKSO est une méthode de construction d’ontologies pour le partage des connaissances implicites de conduite du changement (Remillieux et al., 2007). Si elle n’intègre pas les imprécisions et les incertitudes dans la définition des composants, et son processus n’est pas encore automatisé, elle nous paraît rigoureuse et a constitué pour nous une source d’inspiration. Text2Onto est un framework de génération d’ontologies à partir de textes (Cimiano et al., 2005). S’il se limite à la génération d’ontologies classiques à partir de textes en anglais, il a constitué pour nous un bon exemple qui montre la faisabilité d’une telle génération. Quant au framework FOGA « A Fuzzy Ontology Generation FrAmework », il vise une aide pour la génération d’ontologies floues (Quan et al., 2004). Cependant, ce framework n’a pas un modèle ontologique flou clair permettant de vérifier la correction de l’ontologie floue trouvée. Il procède à une analyse des composants d’ontologie floue déjà définis, puis à une structuration de ces composants, alors que notre objectif est l’extraction automatique des composants des ontologies floues, non connus a priori, à partir de corpus. Pour atteindre cet objectif, nous avons examiné les outils de traitement automatique de corpus de données, en l’occurrence l’environnement de développement linguistique NOOJ (Silberztein et al., 2005). Ce dernier inclut des dictionnaires, des grammaires et une analyse de corpus, mais il ne traite pas la partie sémantique des mots et commet alors des erreurs lors de l’extraction des mots à partir des corpus de données. De ce fait, nous pouvons utiliser NOOJ en tant qu’étiqueteur (i.e., analyseur syntaxique) pour l’extraction des composants d’ontologies floues à partir de corpus, mais nous devons trouver une solution pour combler cette insuffisance.

3. Les ontologies floues

La logique floue a été introduite par L. Zadeh (Zadeh, 1965) comme extension de la logique booléenne. Elle permet à une proposition d'être dans un autre état que vrai ou faux. La logique floue s’appuie sur la théorie mathématique des ensembles flous, introduite aussi par L. Zadeh. Ces ensembles permettent de modéliser l'incertitude et l'imprécision qui caractérisent souvent les représentations humaines des connaissances. Chaque ensemble flou est défini par sa « variable linguistique »

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

363

Page 4: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

et sa « fonction d’appartenance » (Zadeh, 1965). Aujourd’hui, la logique floue est arrivée à maturité et elle est utilisée dans différents domaines d’application. Notre intérêt porte sur son utilisation pour la représentation des données imprécises et incertaines dans le cadre du web sémantique, et plus précisément son intégration dans la définition des ontologies, devenant ainsi floues.

3.1. Définition d’ontologies floues

Notre définition d’ontologies floues se base sur l'intégration de la logique floue à la définition des ontologies précises pour représenter les incertitudes et les imprécisions dans le cadre du web sémantique. Nous pouvons définir l’ontologie floue comme une ontologie (Gruber, 2008) qui possède, en plus des composants de base (i.e., concepts, relations, axiomes et instances), de nouveaux composants conformes à la logique floue : les concepts flous et les relations floues. Ces derniers assurent la représentation des parties floues d’un univers de discours.

3.2. Les composants d’ontologies floues

Une ontologie floue comprend 6 composants : (1) les concepts précis, (2) les concepts flous, (3) les relations précises, (4) les relations floues, (5) les axiomes et (6) les instances. Les concepts et les relations précis gardent les mêmes définitions et jouent les mêmes rôles que dans une ontologie classique. Les concepts et les relations flous, définis selon la logique floue, servent à la représentation des éléments flous du domaine modélisé. Ils ont des répercussions sur l’expression des axiomes et des instances.

3.2.1. Les concepts flous

Un concept flou est un concept définie sur la base d’une valeur particulière d’une variable linguistique (e.g., Classification-Âge) relative à l’univers de discours, avec l’incertitude et l’imperfection touchant une propriété fuzzifiée, i.e., rendue floue (e.g., Âge).

Figure 1 montre deux concepts flous : Personne Jeune et Personne Adulte.

3.2.2. Les relations floues

Une relation floue est une relation binaire (i.e., entre deux concepts d’un domaine) dont la sémantique est décrite par une valeur particulière d’une variable linguistique.

Figure 2 montre trois relations floues : Distance-courte, Distance-Moyenne et Distance-Longue.

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

364

Page 5: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

��

Variable Linguistique = DistanceDistance = {Courte, Moyenne,

Longue,…}

Figure 1. Exemple de concepts flous

Figure 2. Exemple de relations floues

3.2.3. Les instances

Dans les ontologies floues, nous trouvons deux types d’instances : (1) les instances des concepts et des relations précis et (2) les instances des concepts et des relations flous. L’appartenance d’une instance à un composant flou n’est pas sûre. Elle est déterminée par une variable probabiliste prenant ses valeurs entre 0 et 1, et déterminée par une fonction d’appartenance (Bouaziz et al., 2007).

3.2.4. Les axiomes

Dans le cas d’ontologies floues, les axiomes servent aussi à exprimer les formules de calcul des fonctions d’appartenance.

Exemple : Ahmed a comme âge 31 ans. On peut alors le considérer comme une « Personne Jeune » avec un degré d’appartenance de 0.8, calculé selon les formules de calcul suivante de la fonction d’appartenance trapézoïdale (cf. Figure 1).

- Degré_Appartenance = (Âge – 16) / (20 – 16) si Âge � [16 ; 20[ ;

�Personne

Personne Jeune

Personne Adulte

Ensemble de ses propriétésNom Prénom Âge

ConceptAéroport

ConceptHôtel�

Distance-Courte Distance-Moyenne Distance-Longue

Est une

Ensemble de

propriétés

Nom Localité

Ensemble de

propriétés

Nom Localité

Distance-A-H Relation précise

Relations floues

Fonction d’appartenance de la variable linguistique « Classification-Âge » -

Sous-ensemble flou « Personne Adulte »

Fonction d’appartenance de la variable linguistique « Classification-Âge » -

Sous-ensemble flou « Personne Jeune »

Variable Linguistique : Classification-Âge =

{Jeune, Adulte,…}

Incertitudes

Âge

μ(x)�1

Âge��16�20�����30�35

μ(x)�

30��35����45��50

1�

Concepts flous

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

365

Page 6: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

- Degré_Appartenance = 1 si Âge � [20 ; 30[ ; - Degré_Appartenance = (35 – Âge) / (35 – 30) si Âge � [30 ; 35] ; - Degré_Appartenance = 0 ailleurs.

4. Démarche de Fuzzy OntoMethodology

Nous voyons que la conception d’ontologies floues doit passer par les mêmes étapes de la conception d’ontologies classiques (e.g., METHODOLOGY) : évaluation des besoins, conceptualisation, formalisation et opérationnalisation, mais avec des phases supplémentaires. Nous proposons, dans ce qui suit, notre méthodologie de conception d’ontologies floues, intitulée « Fuzzy OntoMethodology ».

4.1. Evaluation des besoins

A part le fait que l’équipe de travail doit fixer les objectifs attendus, elle doit vérifier que le domaine d’étude considéré nécessite vraiment la construction d’une ontologie floue. Pour ce faire, elle doit collecter l’ensemble des documents décrivant l’univers de discours.

4.2. Conceptualisation

Lors de la construction d’ontologies floues, l’ontologiste doit accorder une attention particulière aux incertitudes et imprécisions qui peuvent caractériser certains phénomènes du domaine d’étude. Ces dernières nécessitent plus d’effort d’analyse pour que nous puissions les recenser et les comprendre. A la fin de cette étape, nous obtenons une description informelle (i.e., en langage naturel) des composants précis (i.e., concepts et relations précis) et flous (i.e., concepts et relations flous) d’ontologies floues.

4.3. Ontologisation

Une ontologisation respectant l’intégrité du modèle conceptuel ne se contente pas de la construction de la partie précise d’une ontologie (i.e., les concepts et les relations précis). L’ontologiste doit définir les solutions adéquates pour la représentation des incertitudes et des imprécisions trouvées. Il doit ensuite décrire, tous les concepts et relations, précis et flous, en tant qu’ensembles flous. Il doit aussi le faire pour les fonctions d’appartenance. C’est à cet effet que nous avons proposé d’utiliser le profil UML « UML - Fuzzy Ontologies » pour représenter correctement une ontologie floue (Ghorbel et al., 2010).��

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

366

Page 7: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

4.4. Opérationnalisation

L’opérationnalisation consiste à outiller une ontologie floue pour permettre à une machine de manipuler des connaissances du domaine. L’ontologiste, dans cette étape, doit disposer de moyens appropriés pour outiller les ontologies floues, Fuzzy Protégé (Ghorbel et al., 2009) ou Fuzzy DL (Straccia, 2006) en l’occurrence. Ces moyens doivent être capables d’instaurer tous les composants flous, et surtout les formules de calcul des fonctions d’appartenance pour qu’ils puissent automatiser les tâches lourdes de calcul des degrés d’appartenance.

Nous allons nous intéresser dans la suite de cet article à la première et la deuxième étapes de cette méthodologie. L’étude de l’existant doit vérifier si le domaine d’étude nécessite la construction d’une ontologie floue. Il s’agit par la suite de définir le dictionnaire des concepts précis et flous et les relations d’héritage et de synonymie entre concepts. C’est un travail complexe qui mérite, à notre avis, une assistance au profit de l’ontologiste. C’est dans ce cadre que se situe l’approche que nous allons proposer dans la section suivante, et qui se base sur l’automatisation de la construction des composants d’ontologies floues à partir de corpus de données sémantiques floues.

5. Approche de la construction des composants d’ontologies floues

Notre approche concerne la définition d’un dictionnaire des concepts précis et flous d’une ontologie floue à partir d’un corpus de données sémantiques floues. Elle concerne aussi la définition des relations d’héritage et de synonymie du fait que nous voulons définir une hiérarchie et une organisation entre les concepts. Elle nécessite l’utilisation d’outils pour assister l’ontologiste tout au long de la phase d’évaluation des besoins et de conceptualisation. Pour atteindre ces objectifs, nous proposons les cinq étapes suivantes (cf. Figure 3) :

1- Constitution de corpus de données sémantiques floues.

2- Traitement automatique de corpus de données sémantiques floues.

3- Constitution de dictionnaires des concepts pour les ontologies floues.

4- Constitution des relations d’héritage et de synonymie pour les ontologies floues.

5- Visualisation de la structure de l’ontologie floue.

5.1. Constitution de corpus de données sémantiques floues

Pour se préparer à l’extraction des concepts précis et flous, ainsi que les relations entre ces concepts, il est nécessaire de collecter l’ensemble des documents sur lesquels reposera cette extraction (Condamines, 2005). Cet ensemble constitue le

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

367

Page 8: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

corpus de référence. En cas d’absence de tels documents, il faut les créer spécialement à cet effet. La première étape de notre approche est donc la constitution du corpus.

Figure 3. Approche de construction des composants d’ontologies floues

Selon Noras (Noras et al., 2007), un corpus est un ensemble de données et de traces issues d’une expérimentation, enrichies par des informations techniques, humaines, pédagogiques et scientifiques permettant leur analyse conformément à leur contexte. Nous avons à utiliser un corpus de données textuel, sémantique et flou (cf. Figure 3) : (1) textuel : c’est la manière la plus simple pour représenter les informations et (2) sémantique et flou : le domaine d’étude pour les ontologies floues comprend des incertitudes et des imprécisions non représentables par les données classiques (cf. Figure 5). En effet la constitution d’un corpus de données sémantiques floues permet de mettre en relief les aspects flous en termes

Corpus de données sémantiques floues

Traitement de corpus

Ontologiste

Grammaire de concepts précis

(CP)

Extraction des CP <xml�xxx�/xml>� <xml�xxx�/xml>

Grammaire de concepts flous

(CF)

Extraction des CF

Grammaire de relations

d’héritage (RH)

Extraction des RH <xml�xxx�/xml>

CrispConcepts.xml FuzzyConcepts.xml Inheritance Relations.xml

Création de dictionnaire

desynonymie

Synonymy.xml

Constitution de dictionnaire de

concepts

Constitution de relations d’héritage

Constitution de relations de synonymie

Importation et vérification

ValidationOntologie

floue validée

Base de données ontologiques

Visualisation de la structure de

l’ontologie floue

<S>nom, nom-synonyme,… </S> <S>adjective, adjective-

synonyme,… </S> <S>adverbe, adverbe-synonyme,… </S>…

Name. FuzzyOnt : … -- Concept (i.e., précis ou flous) générique (Syno of) Concept -- Concept (i.e., précis ou flous) spécialisé -- (IS A) Concept (précis ou flou) --Etc.

� � �Name. FuzzyOnt

Import CC

ImportFC

Dictionary of concepts

Import simple

IR

Import multiple

IR

Name. FuzzyOnt

Inheritance Relation (IR)

Name. FuzzyOnt

Synonymy Relation(SR)

Import SR

between CC

Import SR

betweenFC

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

368

Page 9: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

d’incertitudes et d’imprécisions. Delà, se dégagent les besoins pour la construction d’une ontologie floue. Nous finalisons alors les travaux de l’étape d’évaluation des besoins de « Fuzzy OntoMethodology ».

5.2. Traitement automatique de corpus de données sémantiques floues

Nous décomposons cette étape en deux sous-étapes : (1) extraction des concepts précis et flous et (2) extraction des relations d’héritages et de synonymie.

5.2.1. Extraction des concepts précis et flous

Pour réaliser l’extraction des concepts précis et flous, nous avons utilisé l’analyseur syntaxique NOOJ (cf. Section 2). Mais pour résoudre le problème du traitement sémantique du corpus de données, nous avons créé notre propre dictionnaire de données où nous associons à chaque mot un et un seul rôle grammatical : nom, adjectif ou adverbe. En effet, nous pouvons déterminer les critères de base (i.e., qui présentent les entrées de la grammaire de l’analyseur) des concepts à partir de leur définition selon le langage de l’analyseur. En se basant sur ces critères, l’analyseur extrait automatiquement les concepts à partir de corpus. Nous proposons la décomposition de cette extraction en deux phases : l’extraction des concepts précis et l'extraction des concepts flous. Les résultats sont stockés dans des fichiers XML.

5.2.1.1. Extraction des concepts précis dans un fichier XML

D’après le dictionnaire français « Le petit Robert » (Robert, 1967), un « Nom » est un mot servant à désigner les catégories d'êtres, de choses et de concepts. Nous proposons alors de dégager les concepts précis à partir des noms utilisés dans l’univers de discours. En effet, malgré la différence sémantique entre « Nom » et « Concept », nous notons une dépendance forte entre ces deux notions. Nous proposons alors d’introduire le critère « Nom » comme entrée dans notre grammaire afin que l’analyseur syntaxique fasse son analyse pour extraire les concepts précis à partir de corpus de données sémantiques floues. Nous proposons aussi la sauvegarde des concepts précis recensés dans un fichier XML (cf. Figure 3 et Figure 7).

5.2.1.2. Extraction des concepts flous dans un fichier XML

Nous avons défini les concepts flous comme étant des concepts entachés d’imprécisions et d’incertitudes (cf. Section 3.2.1). Par conséquent, nous proposons le « Nom » comme une première entrée de la grammaire de l’analyseur syntaxique. La deuxième entrée doit représenter l’imprécision et l’incertitude touchant sa propriété floue qui sont exprimées par des adjectifs. En effet, si les adjectifs sont utilisés pour ajouter de la précision (e.g., personne jeune), ils introduisent le plus souvent une imprécision dans la marge correspondant à cette précision (e.g., personne jeune : de 17 ans, 20 ans, 22 ans, 25 ans ou 30 ans ?). Nous pouvons alors

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

369

Page 10: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

définir les critères d’extraction des concepts flous par « Nom + Adjectif » ou « Adjectif + Nom ». Nous avons remarqué aussi que nous pouvons représenter les ensembles flous par des adverbes et des adjectifs. Pour cette raison, nous proposons d’introduire aussi les critères « Nom + Adverbe + Adjectif » et « Adverbe + Adjectif + Nom ». La sauvegarde des concepts flous recensés se fait dans un deuxième fichier XML (cf. Figure 3 et Figure 6).

5.2.2. Extraction des relations d’héritages et de synonymie

Nous décomposons cette sous-étape en deux phases : (1) extraction des relations d’héritage et (2) création d’un dictionnaire des synonymes. Les résultats sont stockés dans des fichiers XML.

5.2.2.1. Extraction des relations d’héritage dans un fichier XML

Nous proposons d’utiliser aussi dans cette phase le même analyseur syntaxique pour les mêmes raisons expliquées précédemment (cf. Section 5.2.1).

Dans une relation d’héritage, les objets de bas niveau (i.e., les classes spécialisées ou classes filles) spécialisent des classes plus génériques. Typiquement, une classe peut hériter des propriétés de plusieurs classes plus abstraites (Koenig et al., 2008). Les relations d’héritage dans les corpus de données sémantiques floues peuvent être entre : (1) des concepts précis, (2) des concepts flous et (3) un concept flou, comme classe spécialisée, et un concept précis, comme classe générique. En effet, nous ne trouvons jamais une relation d’héritage entre un concept flou générique et un concept précis spécialisé, puisqu’une classe spécialisée hérite toutes les propriétés de la classe générique, y compris ses propriétés floues ; un concept qui hérite des propriétés floues ne peut être que flou. Ces relations peuvent être marquées par les mots clés « est un » ou « est une » que nous allons appeler par la suite « Connecteurs de Relations d’Héritage (CRH) ». Nous trouvons, par exemple, la structure suivante : « un concept précis spécialisé « CRH » un concept précis générique ». Les structures grammaticales caractérisant les relations d’héritage dans les corpus de données sémantiques floues servent de base pour spécifier les critères d’entrée pour la grammaire de l’analyseur syntaxique afin de pouvoir extraire ces relations.

Exemple : Dans la phrase : « Un homme est une personne », nous trouvons : un concept précis spécialisé (homme), le CRH (« est une ») et un concept précis générique (personne).

Nous pouvons trouver aussi, dans les corpus de données sémantiques floues, des relations d’héritage multiple entre un concept spécialisé et deux ou plusieurs concepts génériques. Pour recenser ces relations, nous proposons différents critères d’entrée dans la grammaire de l’analyseur syntaxique afin que ce dernier puisse les extraire, comme par exemple, la structure suivante : « un concept (précis ou flou)

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

370

Page 11: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

spécialisé « CRH » un concept précis générique « et » un concept précis générique ».

Les relations d’héritage recensées sont à sauvegarder dans un troisième fichier XML (cf. Figure 3 et Figure 8).

5.2.2.2. Création d’un dictionnaire des synonymes dans un fichier XML

La synonymie est une relation contextuelle, avec une définition proche de celle de WordNet (Fellbaum, 1998) et de (Ploux et al., 1998) : X est un synonyme de Y si les deux termes sont sémantiquement identiques (Hamon et al., 2001). Dans notre cas, les relations de synonymie d’ontologies floues sont des relations entre les concepts précis et flous de même sens. Contrairement aux relations d’héritage, nous ne trouvons pas des structures, comme critères d’entrée de la grammaire, permettant l’extraction des concepts synonymes à partir de corpus. Il n’est pas alors possible d’extraire automatiquement des relations de synonymie en se basant sur un analyseur syntaxique. Nous proposons alors de créer un dictionnaire des synonymes dans un fichier XML (cf. Figure 3). Ce dictionnaire comprend un ensemble de noms, d’adjectifs et d’adverbes, et leurs synonymes. Il doit continuellement être enrichi par des linguistes pour qu’il comprenne le maximum de synonymes.

5.3. Constitution de dictionnaires des concepts pour les ontologies floues

Le résultat de cette étape est un dictionnaire des concepts précis et flous d’ontologies floues. Pour le constituer, nous proposons trois phases (cf. Figure 3) : (1) importation des concepts, (2) vérification des concepts par l’ontologiste et (3) définition des variables linguistiques.

5.3.1. Importation des concepts

Le dictionnaire des concepts est constitué par deux tableaux : le premier pour les concepts précis, l’autre pour les concepts flous. Nous procédons à l’importation des concepts à partir du fichier XML des concepts précis, résultat de l’étape d’extraction des concepts précis, et du fichier XML des concepts flous, résultat de l’étape d’extraction des concepts flous. Cette importation s’effectue automatiquement en se basant sur une analyse des fichiers XML.

5.3.2. Vérification des concepts par l’ontologiste

Après l’importation des concepts précis et flous dans le dictionnaire des concepts, une étape de vérification par l’ontologiste est nécessaire. Nous proposons alors différentes actions pour redresser les anomalies ; l’ontologiste peut : (1) ajouter des concepts précis ou flous qui n’ont pas été recensés dans les fichiers XML lors de l’extraction des concepts précis et flous de l’ontologie floue, (2) supprimer des concepts jugés inutiles pour l’ontologie floue et (3) modifier des concepts.

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

371

Page 12: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

5.3.3. Définition des variables linguistiques

Après l’étape de vérification, l’ontologiste doit préciser pour chaque concept flou le type de sa fonction d’appartenance et indiquer la liste des valeurs de sa variablelinguistique. En effet, ces valeurs sont à prendre en considération pour le calcul du degré d’appartenance.

Finalement, l’ontologiste doit valider définitivement le dictionnaire des concepts précis et flous de l’ontologie floue. Ces concepts sont à enregistrer dans une base de données ontologiques.

5.4. Constitution des relations d’héritage et de synonymie pour les ontologies floues

5.4.1. Constitution des relations d’héritage

La constitution des relations d’héritage d’ontologies floues nécessite deux phases (cf. Figure 3) : (1) apurement des relations d’héritage et (2) vérification des relations d’héritage par l’ontologiste.

5.4.1.1. Apurement des relations d’héritage

Dans cette phase, nous proposons à l’ontologiste d’analyser de nouveau les concepts de l’ontologie floue afin de prendre en considération les changements apportés aux concepts de l’ontologie. Puis, nous proposons une comparaison automatique entre les concepts sur lesquels sont définies les relations d’héritage du fichier XML généré par l’extraction et les concepts déjà validés afin de s’assurer que les relations d’héritage sont entre concepts validés. Ensuite, nous proposons l’importation des relations d’héritage simple entre les concepts validés et leur stockage dans un tableau des relations d’héritage simple, et l’importation des relations d’héritage multiple entre les concepts validés et leur stockage dans un autre tableau, réservé aux relations d’héritage multiple.

5.4.1.2. Vérification des relations d’héritage par l’ontologiste

Nous jugeons que la vérification par l’ontologiste reste nécessaire, sachant que des contrôles sont instaurés pour qu’il n’utilise que des concepts déjà validés, lors de l’ajout ou la modification de relations d’héritage. Nous proposons alors différentes actions que l’ontologiste peut réaliser, d’une manière tout à fait similaire à la vérification des concepts. Il doit aussi valider définitivement les relations d’héritage simple et multiple de l’ontologie floue pour qu’elles soient enregistrées dans la base de données ontologiques.

5.4.2. Constitution des relations de synonymie

La constitution des relations de synonymie d’ontologies floues nécessite aussi deux phases : (1) apurement des relations de synonymie et (2) vérification des

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

372

Page 13: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

relations de synonymie par l’ontologiste. Les travaux de ces phases sont similaires à ceux relatifs à la constitution des relations d’héritage sauf que la comparaison automatique faite entre chaque entrée du dictionnaire de synonymes et les concepts déjà validés. Deux tableaux sont utilisés pour le stockage : l’un pour les relations de synonymie entre des concepts précis validés, l’autre pour les relations de synonymie entre des concepts flous validés.

5.5. Visualisation de la structure de l’ontologie floue

Nous offrons à l’ontologiste une fonctionnalité pour visualiser la structure de l’ontologie floue considérée, à partir des éléments validés et enregistrés dans la base de données ontologiques (cf. Figure 3).

5.6. Implémentation

Nous avons entrepris le développement d’un prototype, nommé « Text 2 FuzzyOnto », en utilisant l’analyseur syntaxique NOOJ pour les deux premières étapes de notre approche, et Eclipse comme un outil de développement pour les autres étapes. Nous nous limitons ici à la présentation de quelques éléments d’implémentation dans le cadre des deux premières étapes de notre approche. Ces éléments concernent l’extraction des concepts flous.

La figure 4 montre la grammaire que nous avons définie pour caractériser les concepts flous. La figure 5 donne un exemple de corpus textuel introduit sous NOOJ. La figure 6 montre le résultat de l’extraction des concepts flous à partir de ce texte. Ces concepts sont délimités par les balises <F> et </F> (F signifie « Fuzzy »). Notons que nous avons utilisé les balises : <C> et </C> (C signifie « Crisp ») pour délimiter les concepts précis, <SI> et </SI> (SI signifie « SimpleInheritance ») pour délimiter les relations d’héritage simple et <MI> et </MI> (MI signifie « MultipleInheritance ») pour délimiter les relations d’héritage multiple.

Figure 4. Grammaire de concepts flous

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

373

Page 14: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

Figure 5. Exemple de corpus textuel

Figure 6. Exemple d’extraction de concepts flous

Nous nous montrons aussi, ci-après, le résultat d’extraction des concepts précis et des relations d’héritage à partir du même corpus de données.

Figure 7. Exemple d’extraction de concepts précis

Figure 8. Exemple d’extraction de relations d’héritage

6. Conclusion et perspectives

Dans cet article, nous nous sommes intéressés à l’étude des ontologies floues et de leurs composants de base, puis aux méthodologies de leur construction. Notre apport se situe essentiellement au niveau de la première étape et de la deuxième étape de la méthode « Fuzzy OntoMethodology ». Nous avons proposé une approche pour la définition de dictionnaires de concepts précis et flous et de relations d’héritage et de synonymie, à partir de corpus de données sémantiques

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

374

Page 15: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

floues. Les premiers produits des implémentations d’un framework qui permet lagénération de tels dictionnaires ont montré la faisabilité et l’intérêt de nos propositions. Ceframework, intitulé « Text 2 FuzzyOnto », permet alors d’assister l’ontologiste dansla construction d’ontologies floues, qui est une tâche délicate et difficile. Les tests deces produits sont en cours d’analyse. Ils sont effectués sur une application type, intitulée «Dangers du bruit en milieu professionnel » et définie dans (Caubet et al., 2009). Nousavons obtenu un pourcentage d’automatisation d’environ 40%. Les résultats de ces testsvont constituer l’objet d’un prochain article. Comme perspectives, nous envisageonsd’améliorer notre framework en cherchant à automatiser, complètement ou partiellement,l’extraction des relations conceptuelles floues et la définition des variables linguistiquesassociées aux concepts et aux relations. Nous comptons aussi chercher des solutionspour l’extraction d’autres types des relations sémantiques (e.g., antonymie et équivalence).

Bibliographies

Berners-Lee T., Hendler J., Lassila O., « The Semantic Web », Scientific American, Mai 2001, p.29-37.

Bouaziz R., Chakhar S., Mousseau V., Ram S., Telmoudi A., « Database design and queryingwithin the fuzzy semantic model », Information Sciences: an International Journal, vol.177, n° 21, November 2007, P. 4598-4620.

Carbonell J.G., Siekmann J., « Applications of Fuzzy Sets Theory », Lecture Notes inComputer 7th International Workshop on Fuzzy Logic and Applications, Science, 7-10Juillet 2007, Camogli, Italy.

Caubet A., Verger C., « Dangers du bruit en milieu professionnel », Réseau pédagogiquede l’Université Médicale Virtuelle Francophone, 2009. http://www.med.univ-rennes1.fr/wkf/stock/RENNES20090319042208molacBRUIT_module_7.pdf.

Cimiano P.,Volker J., « Text2Onto : A Framework for Ontology Learning and Data-drivenChange Discovery », International conference on applications of natural languages toinformation systems No10, vol. 3513, 2005, p. 227-238.

Condamines A., « Sémantique et Corpus », Hermès Science Publications, ISBN2-7462-1055-X, 2005, London, p.17-38.

(Fellbaum, 1998) Fellbaum C., « WordNet: an electronic lexical database (Language, Speechand Communication) », The MIT Press, 1998, Cambridge, Massachusetts.

Ghorbel H., Bahri A., Bouaziz R., « A Framework for Fuzzy Ontology Models », 2émes

Journées Francophones sur les Ontologies, 1-2 décembre 2008, Lyon,France, p. 21-30.

Ghorbel H., Bahri A., Bouaziz R., « Fuzzy Protégé for FuzzyOntology Models », 11th Inter-national Protégé Conference IPC'2009, Juin 2009, Academic Medical Center, Uni-versity of Amsterdam, Amsterdam, Netherlands. http://protege.stanford.edu/conference/2009/abstracts/S10P2Ghorbel.pdf.

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

375

Page 16: Construction des composants ontologiques flous à partir de ... · Construction des composants ontologiques flous à partir de corpus de données sémantiques floues Sahar Maâlej*

Ghorbel H., Bahri A., Bouaziz R., « Fuzzy ontologies model for semantic web », The SecondInternational Conférence on Information and Knowledge Management, eKNow 2010, Février 2010, st. Maorten, Netherlands Antilles (à apparaître).

Gomez-Pérez A., Fernandez-Lopez M., Corcho O., « Ontology Development Methods and Method-ologies », Ontological Engineering, Springer Verlag, 2004, Madrid, Espagne, p. 113-153.

Gruber T., « Ontology », the Encyclopedia of Database System, Ling Liu and M. TamerOzsu (Eds.), Springer-Verlag - DOI : 10.1007/978-0-387-39940-9_1318, 2008.

Hamon T., Nazarenko A., « Exploitation de l'expertise humaine dans un processus deconstitution de terminologie », Traitement Automatique des Langues Naturelles 2001, 2-5Juillet 2001, Tours, France, p. 213-222.

Koenig P., Melançon G., « Dagmap : exploration interactive de relations d'héritage »,Hermes-Lavoisier, R. (ed.), Revue d'Intelligence Artificielle, vol. 22, 2008, p. 353-368.

Noras M., Reffay C., Betbeder M., « Structuration de corpus de formation en ligne en vue deleur échange », hyper articles en lignes- centre pour la communication scientifiquedirecte (HAL – CCSD), 2007, France.

Ploux S., Victorri B., « Constructions d’espaces sémantiques à l’aide de dictionnaires desynonymes », Traitement Automatique des Langues, 1998, p.161-182.

Quan T.T., Hui1 S.C., Cao T.H., « FOGA: A Fuzzy Ontology Generation Framework forScholarly Semantic Web », Knowledge Discovery and Ontologies (KDO-2004),Workshop at ECML/PKDD 2004, 2004, Italie, p. 37-48.

Remillieux A., Petitmengin C., Ermine J-L., Blatter C., « Construction d’une ontologie pourle partage des connaissances implicites de conduite du changement IKSO », 1ére JournéesFrancophones sur les Ontologies (JFO 2007), 18-20 Octobre 2007, Sousse, Tunisie, p. 175-194.

Robert P., « Le petit Robert », Paris, 10087910-(I)-(200)-OSBMT 37, 1967.

Roberts R., « Introduction aux technologies du Web Sémantique »,AIDAinformazioni, 2008, Italie. http://www.aidainformazioni.it/pub/roberts122008.pdf.

Silberztein M., Tutin A., « NooJ, un outil TAL pour l'enseignement des langues. Applicationpour l'étude de la morphologie lexicale en FLE », Apprentissage des langues et systèmesd'information et de communication, vol. 8, 2005, p. 123-134.

Straccia U., « A Fuzzy Description Logic for the semantic Web », Capturing Intelligence:Fuzzy logic and the semantic Web, 2006, Elie Sanchez.

Zadeh L., « Fuzzy sets. Information and Control », Information Science, vol. 4, n° 4, 1965, p.338-353.

Zhai J., Yiduo L., Jiatao J., Yi Y., « Fuzzy Ontology Models Based on Fuzzy Linguistic Variable forKnowledge Management and Information Retrieval », Intelligent Information ProcessingIV, IFIP-The International Federation for Information Processing, vol. 288, 2008, p. 58-67.

Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

376


Top Related