gradients de prototypicalité appliqués à la personnalisation d'ontologies

33
Gradients de prototypicalité appliqués à la personnalisation d'ontologies X. AIME, F. FURST, P. KUNTZ & F. TRICHET [email protected] [email protected] pascale.kuntz,[email protected] LINA - UMR CNRS 6241 – Université de Nantes – FRANCE MIS – Université d’Amiens – FRANCE TENNAXIA – Paris – FRANCE

Upload: conference-ic-2009

Post on 19-Jun-2015

601 views

Category:

Technology


0 download

DESCRIPTION

Présentation de Xavier Aimé, Frédéric Fürst, Pascale Kuntz et Francky Trichet à IC 2009

TRANSCRIPT

  • 1. Gradients de prototypicalit appliqus la personnalisation d'ontologies X. AIME, F. FURST, P. KUNTZ & F. TRICHET [email protected] [email protected] pascale.kuntz,[email protected] - UMR CNRS 6241 Universit de Nantes FRANCEMIS Universit dAmiens FRANCE TENNAXIA Paris FRANCE

2. En partenariat avec IC'09 Hammamet, Mai 2009 - 2/32 3. Aujourdhui Recherche dinformationPas dextension de requtesAucun document sur Pentyne, Hexyne, substance dangereuseSubstance dangereuseAlkyne Pentyne Hexyne (C6H10) IC'09 Hammamet, Mai 2009 - 3/32 4. Ce soir Recherche dinformationT We agsPas dextension de requtesb2.0Documents sur Pentyne, Hexyne, C6H10 , etc.MAIS mmes rsultats pour un chimiste organique et un consultant en risques chimiques utilisateursMAIS rsultats sur Alkyne le lapin IC'09 Hammamet, Mai 2009 - 4/32 5. Demain Recherche dinformation Extension de requtes au moyen dune ontologie de la chimieDocuments sur Pentyne, Hexyne , C6H10 , etc. Substance dangereuseMAIS mmes rsultats Alkyne pour un chimiste organiquePentyne Hexyne (C6H10) et un consultant en risques chimiquesIC'09 Hammamet, Mai 2009 - 5/32 6. Ontologie Hygine-Scurit-EnvironnementConceptualisation communautaire Hydrocarbon, CnHm dangerousConceptualisationsubstancecontextuelleClear gas Alkyne, CnH2n-2Alkane, CnH2n+2Acetylene, Ethyne,Pentyne,Hexyne, 74-86-2, 200-816-9, C2H2627-19-0, C5H8 693-02-7, C6H10 IC'09 Hammamet, Mai 2009 - 6/32 7. Situation (prototype theory [Rosch,73]) Deux observations : Pour une communaut C OntolVerna ogie Perso culair nnalis Pour un domaine D e de D omain e e Dans un contexte E tous les sous-concepts dune catgorie nont pas lamme reprsentativit conceptuelle ; tous les termes dnotant un concept nont pas lamme reprsentativit lexicale.IC'09 Hammamet, Mai 2009 - 7/32 8. Ontologie Hygine-Scurit-Environnement Hydrocarbons, CnHmdangeroussubstanceClear gasAlkynes, CnH2n-2 Alkanes, CnH2n+274-86-2, Acetylene, C2H2, Ethyne, 200-816-9 Acetylene, Ethyne,Pentyne, Hexyne74-86-2, 200-816-9, C2H2627-19-0, C5H8693-02-7, C6H10 #1#3 #2 IC'09 Hammamet, Mai 2009 - 8/32 9. En rsumPour un utilisateur confront une ontologie de domaine Pour chaque concept, il est possible de classer : les sous-concepts par ordre de typicalit (conceptuelle) les termes par ordre de typicalit (lexicale)Alkynes Alkynes 0.3 0.2 0.6 Hexyne 0.5 Hexyne0.9 0.9 Pentyne Ethyne AcetylenePentyne Ethyne , 200-816-9 , 74-86-2, Acetylene, 74-86-2, Acetylene, C2H2, Ethyne, C2H2200-816-9 IC'09 Hammamet, Mai 2009 - 9/32 10. Personnalisation des ontologiesEntre : une ontologie de domaine (OWL 1.0) Sortie : une ontologie de domaine enrichie des valeurs dePrototypicalit Conceptuelle pour chaque lien is-a (dfini entre deux concepts)0.4 0.1 0.9Prototypicalit Lexicale pour chaque terme dnotant un concept (pour chaque concept) A BC D EIC'09 Hammamet, Mai 2009 - 10/32 11. Approche smiotique des gradientsIntension ( proprits ) Expression Extension( termes )( instances ) IC'09 Hammamet, Mai 2009 - 11/32 12. Approche smiotique des gradientsIntension ( proprits ) Chimisteorganique Expression Extension( termes )( instances ) IC'09 Hammamet, Mai 2009 - 12/32 13. Approche smiotique des gradientsIntension ( proprits ) Consultant enrisques chimiquesExpression Extension( termes )( instances ) IC'09 Hammamet, Mai 2009 - 13/32 14. Gradient de Prototypicalit Conceptuelle fond sur une approche smiotique SPG(cp,cf) = ( . intensionnel (cp,cf)+ . expressionnel (cp,cf)+ . extensionnel (cp,cf) ) Avec : + + = 1, [0,1], [0,1], [0,1] , , pondration de linfluence des 3 composantes ]0,+ [ pondration de ltat motionnel IC'09 Hammamet, Mai 2009 - 14/32 15. Composante Intensionnelle (1/6) Pondration des proprits (Au Yeung 2006)Proprit peut flotter Comment dterminer limportance de cette proprit lors de la dfinition de ces concepts ? IC'09 Hammamet, Mai 2009 - 15/32 16. Composante Intensionnelle (2/6) Pondration des propritsProprit peut flotter 00.75 1 Peu important Trs importantIC'09 Hammamet, Mai 2009 - 16/32 17. Composante Intensionnelle (3/6) Vecteur caractristique Concept Canard ( , 0.3 , 0.75 , 0.8, 0.4 , )A des plumes Peut flotter Peut voler Pond un oeuf IC'09 Hammamet, Mai 2009 - 17/32 18. Composante Intensionnelle (4/6) Vecteur caractristiqueSous concepts de cpp1=Nuage de pointsp0 p2IC'09 Hammamet, Mai 2009 - 18/32 19. Composante Intensionnelle (5/6) Vecteur prototype Prototype de cpp1 ~ Barycentre du nuage de points p0 p2IC'09 Hammamet, Mai 2009 - 19/32 20. Composante Intensionnelle (6/6) Typicalit par les propritsIntension ( cp , cf )p1 = 1 distance ( prototype(cp) , cf )p0 p2IC'09 Hammamet, Mai 2009 - 20/32 21. Composante Expressionnelle (1/2) Typicalit par le corpusFond sur le nombre doccurrences des termesnExpression (cf ,cp) = Information ( cf ) Information ( cp )Avec : Information(c) le Contenu en Information du concept c.IC'09 Hammamet, Mai 2009 - 21/32 22. Composante Expressionnelle (2/2) Typicalit par le corpusnExpressional (cf ,cp) = Information ( cf ) Information ( cp )Avec : count ( term ) le nombre doccurrences de term dans lensemble des documents N le nombre de termes total dans le corpus count (document , term) le nombre de documents o le terme apparat count ( document ) le nombre de documents du corpus world ( c ) tous les termes concernant le concept c via la fonction ftermc et tous les sous-concepts de sa descendance. IC'09 Hammamet, Mai 2009 - 22/32 23. Composante Extensionnelle Typicalit par les instancesFonde sur la quantit dinstances dun concept Extension (cf ,cp) = 11 log countI ( cf )countI ( cp ) Avec CountI (c) le nombre dinstances du concept c cpcf3cf1 cf2IC'09 Hammamet, Mai 2009 - 23/32 24. Facteur motionneldelta < 1 S P G delta > 1alpha . intension + bta . expression + gamma . extensionUn tat positif dilue la typicalit sur les concepts les moins reprsentatifsUn tat ngatif concentre la typicalit sur les concepts les plus reprsentatifsIC'09 Hammamet, Mai 2009 - 24/32 25. Gradient de Prototypicalit Lexicale LPG (t , c) =11 log count ( t )count ( ftermc(c) )Avec : count ( t ) le nombre doccurrences du terme t dans les documents ; count( ftermc (c) ) le nombre doccurrences de tous les termes dnotant leconcept dans les documents.IC'09 Hammamet, Mai 2009 - 25/32 26. Web Ontology Langage (OWL) Deux nouvelles proprits :xml:lpg & xml:cpgorganic farming IC'09 Hammamet, Mai 2009 - 26/32 27. Logiciel TooPrag (1/3) Tool dedicated to the Pragmatisation of OntologyEntre : une ontologie de domaine (OWL), un corpus de textes ou un indexLucene. IC'09 Hammamet, Mai 2009 - 27/32 28. Logiciel TooPrag (2/3)Sortie : une ontologie de domaine enrichie avec les valeurs de prototypicalit conceptuelle et prototypicalit lexicale, enregistre en OWL ou dans une base de donnes relationnelle (MySQL). IC'09 Hammamet, Mai 2009 - 28/32 29. Logiciel TooPrag (3/3) Caractristiques : Fonctionnalits ddies ldition dontologies (concepts, instances, termes, ressources, index) IC'09 Hammamet, Mai 2009 - 29/32 30. ExprimentationsOntologie Tennaxia-HSE (dpt INPI N322.408, 13 juin 2008) :7400 concepts (prvision : prs de 100.000 concepts), 20830 termesCorpus de 2500 textes rglementaires (rglements, lois, directives) IC'09 Hammamet, Mai 2009 - 30/32 31. Limites Composante Intensionnelle La pondration des proprits peut savrer chronophage (pour les ontologies volumineuses) Composante Expressionnelle Termes ambigus Contexte autour du terme (non m1, oppos de m1) Anaphores (Pierre a une voiture, cest la mme que la mienne) Facteur motionnel Pondration de ltat motionnel de lutilisateurIC'09 Hammamet, Mai 2009 - 31/32 32. Conclusion & perspectivesLes Ontologies Personnalises Vernaculaires de Domaine sont dfinies suivant : Une spcificit un endogroupe et un domaine ; Une dimension cologique ; La prise en compte de ltat motionnel de lutilisateur. Nos gradients peuvent tre utiles dans plusieurs contextes : valuation des ontologies ; Analyse de corpus de textes ; Recherche dinformation smantique http://www.ethnosiris.com IC'09 Hammamet, Mai 2009 - 32/32 33. Gradients de prototypicalit appliqus la personnalisation d'ontologies X. AIME, F. FURST, P. KUNTZ & F. TRICHET [email protected] [email protected] pascale.kuntz,[email protected] - UMR CNRS 6241 - Universit de Nantes FRANCEMIS Universit dAmiens FRANCE TENNAXIA Paris FRANCE