construction des composants ontologiques flous à partir de ... · pdf file construction...

Click here to load reader

Post on 15-May-2020

1 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • Construction des composants ontologiques flous à partir de corpus de données sémantiques floues

    Sahar Maâlej* — Hanêne Ghorbel* — Afef Bahri* — Rafik Bouaziz*

    * Laboratoire Miracl Faculté des Sciences Economiques et de Gestion de Sfax Route de l’Aéroport km 4, B.P. 1088, 3018 Sfax, Tunisie [email protected] ; [email protected] ; [email protected] ; [email protected]

    RÉSUMÉ. Les ontologies floues sont destinées à représenter aussi bien des notions précises que des notions floues. Elles représentent un grand intérêt pour divers domaines, et en particulier pour le domaine du web sémantique. Elles constituent maintenant un axe de recherche prometteur, sur lequel nous avons situé nos travaux, en partant du fait que les composants et les méthodes de construction d’ontologies floues sont complexes et délicats, et qu’une automatisation de leur construction s’impose. C’est ce qui constitue l’objet de cet article. L’approche que nous proposons à cet effet tire profit de certaine approches de conception et de développement d’ontologies précises et floues, d’une part, et des outils de traitement automatique de corpus de données, d’autre part. Cette approche permet de mieux extraire et organiser les composants ontologiques flous. ABSTRACT. Fuzzy ontologies are intended to represent not only crisp notions but also fuzzy ones. They have a key role in various domains, and in particular in the semantic web domain. They are now a promising research orientation, on which we positioned our works, assuming that the components and building methodologies of fuzzy ontologies are complex, and that an automation of their construction is essential. This is the subject of this article. The approach which we propose for this purpose takes advantage of some approaches of crisp and fuzzy ontologies design and development, on the one hand, and the tools for corpus automatic treatment, on the other hand. Our approach allows better extracting and organizing fuzzy ontological components. MOTS-CLÉS : Ontologie floue, Méthode de construction d’ontologies floues, Approche de construction des composants d’ontologies floues, Corpus de données. KEYWORDS: Fuzzy ontology, Fuzzy ontologies building methodology, Approach of fuzzy ontologies components construction, Data corpus.

    Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

    361

  • 1. Introduction

    Le web sémantique est un web intelligent où les informations ne seraient pas uniquement stockées par les ordinateurs, mais aussi comprises par eux afin de pouvoir apporter à l'utilisateur exactement ce qu'il cherche. Ce web, contrairement au web actuel, permettra de rendre les contenus sémantiques des ressources web interprétables non seulement par l'homme mais aussi par la machine (Berners-Lee et al., 2001). Pour que cet objectif soit atteint, on a pensé à faire appel aux ontologies qui aident à concevoir le monde réel avec ses contraintes sémantiques (Roberts, 2008). Mais, ce monde comporte des imprécisions et des imperfections que nous ne pouvons pas concevoir en utilisant les ontologies classiques (i.e., précises). Nous ne pouvons le faire que par des ontologies floues, mais dont les composants sont complexes et délicats à construire. Une automatisation de leur construction s’impose alors. C’est dans ce cadre que se situent nos travaux qui visent à définir une approche appropriée pour cette automatisation.

    Le présent article est organisé comme suit. La section suivante présente l’étude de l’état de l’art et le positionnement de nos travaux. Les ontologies floues constituent l’objet de la troisième section. Quant à la quatrième, elle est réservée à la présentation de la démarche de notre méthodologie. Notre approche de construction des composants d’ontologies floues est décrite dans la cinquième section. Enfin, la dernière section traite de la conclusion et des perspectives.

    2. Etat de l’art et positionnement

    Les ontologies floues sont souvent définies en se basant sur la logique de description (LD) (Carbonell et al., 2007), mais pas sur leurs composants et sur la différence de ces derniers par rapport à ceux des ontologies précises. Cependant, l’utilisation de la logique floue dans les ontologies floues suscite de plus en plus d’intérêt de la part de la communauté scientifique. Ses apports sont montrés par plusieurs travaux pour différents domaines (Ghorbel et al., 2008). Les auteurs de (Zhai et al., 2008) essayent de définir les ontologies floues dans un modèle ontologique flou en se basant sur la logique floue, sans distinction entre composants précis et composants flous. Si les auteurs de (Ghorbel et al., 2010) ont fait le même essai, ils ont montré la différence entre ces composants suite à l’étude de leurs caractéristiques. Les composants d’ontologies floues (i.e., concepts flous et relations floues) sont souvent définis en se basant sur la logique floue. Cependant, l’auteur de (Straccia, 2006) se limite à définir un composant flou à partir de ses instances. Les auteurs de (Ghorbel et al., 2008) essayent de définir un composant flou en se basant sur l’intégration des incertitudes et des imprécisions à la définition d’un composant précis, sans définir tout d’abord ce dernier. C’est pour cela que nous allons essayer, dans cet article, d’améliorer la définition des composants flous.

    Par ailleurs, la construction d’une ontologie floue représente un travail délicat et difficile, vu la complexité des notions utilisées. C’est pour cela qu’une méthode de

    Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

    362

  • conception d’ontologies floues s’impose. Nous allons se contenter dans cet article à présenter très brièvement la démarche de notre méthodologie, intitulée « Fuzzy OntoMethodology ». Elle est inspirée de la méthodologie de conception d’ontologies précises, « METHODOLOGY » (Gomez-Pérez et al., 2004). Cette dernière porte sur l’ensemble du processus et guide l’ontologiste dans toutes les étapes de construction.

    De même, nous visons l’automatisation de la construction des composants des ontologies floues à partir de corpus de données sémantiques floues pour aider l’ontologiste à vaincre la complexité de ce travail et à améliorer la qualité de ces composants. A cet effet, nous avons étudié différentes approches et frameworks de conception et de développement d’ontologies. IKSO est une méthode de construction d’ontologies pour le partage des connaissances implicites de conduite du changement (Remillieux et al., 2007). Si elle n’intègre pas les imprécisions et les incertitudes dans la définition des composants, et son processus n’est pas encore automatisé, elle nous paraît rigoureuse et a constitué pour nous une source d’inspiration. Text2Onto est un framework de génération d’ontologies à partir de textes (Cimiano et al., 2005). S’il se limite à la génération d’ontologies classiques à partir de textes en anglais, il a constitué pour nous un bon exemple qui montre la faisabilité d’une telle génération. Quant au framework FOGA « A Fuzzy Ontology Generation FrAmework », il vise une aide pour la génération d’ontologies floues (Quan et al., 2004). Cependant, ce framework n’a pas un modèle ontologique flou clair permettant de vérifier la correction de l’ontologie floue trouvée. Il procède à une analyse des composants d’ontologie floue déjà définis, puis à une structuration de ces composants, alors que notre objectif est l’extraction automatique des composants des ontologies floues, non connus a priori, à partir de corpus. Pour atteindre cet objectif, nous avons examiné les outils de traitement automatique de corpus de données, en l’occurrence l’environnement de développement linguistique NOOJ (Silberztein et al., 2005). Ce dernier inclut des dictionnaires, des grammaires et une analyse de corpus, mais il ne traite pas la partie sémantique des mots et commet alors des erreurs lors de l’extraction des mots à partir des corpus de données. De ce fait, nous pouvons utiliser NOOJ en tant qu’étiqueteur (i.e., analyseur syntaxique) pour l’extraction des composants d’ontologies floues à partir de corpus, mais nous devons trouver une solution pour combler cette insuffisance.

    3. Les ontologies floues

    La logique floue a été introduite par L. Zadeh (Zadeh, 1965) comme extension de la logique booléenne. Elle permet à une proposition d'être dans un autre état que vrai ou faux. La logique floue s’appuie sur la théorie mathématique des ensembles flous, introduite aussi par L. Zadeh. Ces ensembles permettent de modéliser l'incertitude et l'imprécision qui caractérisent souvent les représentations humaines des connaissances. Chaque ensemble flou est défini par sa « variable linguistique »

    Actes du XXVIII° congrès INFORSID, Marseille, mai 2010

    363

  • et sa « fonction d’appartenance » (Zadeh, 1965). Aujourd’hui, la logique floue est arrivée à maturité et elle est utilisée dans différents domaines d’application. Notre intérêt porte sur son utilisation pour la représentation des données imprécises et incertaines dans le cadre du web sémantique, et plus précisément son intégration dans la définition des ontologies, devenant ainsi floues.

    3.1. Définition d’ontologies floues

    Notre définition d’ontologies floues se base sur l'intégration de la logique floue à la définition des ontologies précises pour représen

View more