organiser la fusion d’information par l’analyse formelle de concepts

26
Organiser la fusion d’information par l’analyse formelle de concepts Z. Assaghir, M. Kaytoue, A. Napoli et H. Prade {assaghiz,kaytouem,napoli}@loria.fr , [email protected] Journées d’Intelligence Artificielle Fondamentale 29–30 Juin 2010, Strasbourg

Upload: insa-de-lyon

Post on 29-Nov-2014

384 views

Category:

Education


0 download

DESCRIPTION

Journées d'intelligence artificielle fondamentale, 29-30 juin 2010, Strasbourg Zainab Assaghir, Mehdi Kaytoue, Amedeo Napoli, Henri Prade

TRANSCRIPT

Page 1: Organiser la fusion d’information par l’analyse formelle de concepts

Organiser la fusion d’information parl’analyse formelle de concepts

Z. Assaghir, M. Kaytoue, A. Napoli et H. Prade

{assaghiz,kaytouem,napoli}@loria.fr , [email protected]

Journées d’Intelligence Artificielle Fondamentale29–30 Juin 2010, Strasbourg

Page 2: Organiser la fusion d’information par l’analyse formelle de concepts

Fusion d’information numériques

Dans de nombreux cas l’information délivrée par des sourcesest incertaine, imprécise, et représentée par un intervalle(opinions, capteurs)

Combiner des informations hétérogènes fournies pardifférentes sourcesProduire une information synthétique et utilisable dans unprocessus de décisionA partir d’un ensemble de sources et leur information pourune variable donnée, un opérateur de fusion fm produitcette information synthétique

m1

g1 [1,5]g2 [2,3]g3 [4,7]g4 [6,10]

De nombreux opérateurs – Bloch et al., IJIS01 – Dubois et Prade, DFP01 2 / 26

Page 3: Organiser la fusion d’information par l’analyse formelle de concepts

Opérateurs de fusion basiques

Opérateur conjonctifest le pendant de l’intersection ensemblistepart de l’hypothèse que toutes les sources sont fiablesfournit une information plus précise et certaine, mais peutêtre videfm1(Im1) = [1,5] ∩ [2,3] ∩ [4,7] ∩ [6,10] = ∅

Opérateur disjonctifest le pendant de l’union ensemblistepart de l’hypothèse qu’au moins une des sources est fiablefournit une information moins précise et certaine, souventconsidérée comme peu informativefm1(Im1) = [1,5] ∪ [2,3] ∪ [4,7] ∪ [6,10] = [1,10]

m1

g1 [1,5]g2 [2,3]g3 [4,7]g4 [6,10]

3 / 26

Page 4: Organiser la fusion d’information par l’analyse formelle de concepts

Opérateurs compromis : le cas des SMC

Opérateurs compromisSe situent entre les opérateurs conjonctif et disjonctifUtilisés lorsque les sources sont partiellement en conflit

L’opérateur basé sur les SMCUn ensemble d’intervalles est cohérent si leur intersectionest non-videUn ensemble cohérent est maximal si aucun sur-ensembleest cohérentL’opérateur basé sur les SMC retourne l’union desensembles maximaux cohérentsfm1(Im1) = [2,3] ∪ [4,5] ∪ [6,7]

m1

g1 [1,5]g2 [2,3]g3 [4,7]g4 [6,10]

REF4 / 26

Page 5: Organiser la fusion d’information par l’analyse formelle de concepts

Problème et proposition

Problème de globalité. La fusion des informations de toutesles sources peut être inutile (trop imprécise ou précise...)

Idée. Considérer des sous-ensembles maximaux de sourcesavec leur résultat de fusion. Lesquels ? 2n sous-ensemblespossibles pour n sources différentes !

Proposition. Utiliser l’analyse formelle de concepts pourorganiser les sources suivant leurs résultats de fusion.

Construit un treillis de concepts qui fournit uneclassification des sources selon les résultats de fusion parun opérateur donnéOrdonne des résultats partiels et le résultat global desméthodes de fusion

Assaghir, Kaytoue, Napoli et Prade, MDAI 2010

5 / 26

Page 6: Organiser la fusion d’information par l’analyse formelle de concepts

Plan

1 Analyse Formelle de Concepts

2 Organiser la fusion d’information

3 Une première application

4 Conclusion

Page 7: Organiser la fusion d’information par l’analyse formelle de concepts

Contexte formel

C’est un triplet (G,M, I)G est un ensemble d’objetsM est un ensemble de propriétésI met en relation objets et propriétés :(g,m) ∈ I signifie que l’objet g possède la propriété m

qui se représente par une table binaire, par exemple

m1 m2 m3

g1 × ×g2 × ×g3 × ×g4 × ×g5 × × ×

G = {g1, . . . , g5}M = {m1,m2,m3}(g1,m3) ∈ I

L’objet g1 possède les attributs m1 et m3.L’attribut m1 est possédé par g1,g2 et g5.

7 / 26

Page 8: Organiser la fusion d’information par l’analyse formelle de concepts

Connexion de Galois

Deux opérateurs

à un ensemble d’objets A, associe l’ensemble maximal depropriétés que tous possèdent

A′ = {m ∈ M | ∀g ∈ A ⊆ G : (g,m) ∈ I}

à un ensemble de propriétés B, associe l’ensemblemaximal des objets qui les possèdent tous

B′ = {g ∈ G | ∀m ∈ B ⊆ M : (g,m) ∈ I}

(A,B) avec A′ = B et B′ = A est un concept formel

A est l’extension du concept et B est son intension.

8 / 26

Page 9: Organiser la fusion d’information par l’analyse formelle de concepts

Illustration

Construction d’un concept : applicationdes opérateurs

{g1}′ = {m1,m3}

{m1,m3}′ = {g1,g5}

{g1,g5}′ = {m1,m3}

({g1,g5}, {m1,m3}) est un concept formel

Construction du treillis : ordre desconcepts

(A1,B1) ≤ (A2,B2)⇔ A1 ⊆ A2 (⇔ B2 ⊆ B1)

({g1,g5}, {m1,m3}) ≤ ({g1,g2,g5}, {m1})

m1 m2 m3

g1 × ×g2 × ×g3 × ×g4 × ×g5 × × ×

Nombreux algorithmes, Kuznetsov & Obiedkov, JETAI029 / 26

Page 10: Organiser la fusion d’information par l’analyse formelle de concepts

Cas des données numériques

Discrétisation ou échelonnage conceptuel : compromisPerte d’information importante / problème des seuilsSinon calculabilité/interprétation plus complexes

Utiliser les structures de patronsExtension de l’AFC pour les données complexesÉvite la binarisation des donnéesPas de perte d’informationAlgorithmes performantsDonnées numériques

Ganter & Kuznetsov, ICCS01 – Kaytoue et al., IAF09, ICFCA09, RFIA10, FoIKS10

10 / 26

Page 11: Organiser la fusion d’information par l’analyse formelle de concepts

Premiers éléments

11 / 26

Page 12: Organiser la fusion d’information par l’analyse formelle de concepts

Comment ordonner des descriptions d’objets ?

Cas classiqueConsidérons le treillis des attributs (2M ,⊆). AvecN,O ∈ 2M , on a

N ⊆ O ⇐⇒ N ∩O = N

Avec M = {a,b}, on a par exemple

{a} ⊆ {a,b} ⇐⇒ {a} ∩ {a,b} = {a}

Cas de descriptions complexess’inspirer du cas classique : ∩ possède les propriétés d’uninfimum u dans un demi-treillis.

12 / 26

Page 13: Organiser la fusion d’information par l’analyse formelle de concepts

Structure de patrons

C’est un triplet (G, (D,u), δ)G est un ensemble d’objetsD est infimum-demi-treillis de descriptions ou patronsδ est une fonction qui associe à tout objet g ∈ G sadescription δ(g) ∈ D

L’infimum u est un opérateur idempotent, commutatif etassociatif qui induit un ordre partiel (D,u) des patrons :

c v d ⇐⇒ c u d = c ∀c,d ∈ D

Une connexion de Galois entre (2G,⊆) et (D,v) permet deconstruire un treillis de concepts.

Les algorithmes existants et performants de l’AFC classiquepeuvent donc être utilisés pour tous types de patrons

Ganter & Kuznetsov, ICCS01

13 / 26

Page 14: Organiser la fusion d’information par l’analyse formelle de concepts

1 Analyse Formelle de Concepts

2 Organiser la fusion d’information

3 Une première application

4 Conclusion

Page 15: Organiser la fusion d’information par l’analyse formelle de concepts

Opérateurs de fusion comme un infimum

Espace de fusion Dm. Composé des informations fournies parles sources pour la variable m, et de tous leurs résultats defusion suivant un opérateur de fusion fm.

Si fm est idempotent, commutatif, et associatif alors c’est uninfimum qui induit un ordre partiel (Dm, fm)

ExempleSoit fm1 l’opérateur conjonctifDm1 = {[1,5], [4,7], [6,10], [2,3], [4,5], [6,7], ∅}(Dm1 , fm1) est un inf.demi-treillisce qui équivaut à (Dm1 ,⊆)

m1

g1 [1,5]g2 [2,3]g3 [4,7]g4 [6,10]

15 / 26

Page 16: Organiser la fusion d’information par l’analyse formelle de concepts

Construction du treillis de concepts

(G, (Dm1 , fm1), δ) est une structure de patronsG est ensemble de source(Dm1 , fm1) est un espace de fusion ordonnéδ associe à chaque source son information

Correspondance de Galois entre (2G,⊆) et (Dm1 , fm1)

Premier opérateur : retourne la fusion des informationsassociées aux sources en argument

{g1,g2}� = fm1([1,5], [2,3]) = [2,3]

Second opérateur : donne l’ensemble d’objets maximaldont la fusion est représentée par son argument

[2,3]� = {g ∈ G | [2,3] ⊆ δ(g)} = {g1,g2}

({g1,g2}, [2,3]) est un concept formel

16 / 26

Page 17: Organiser la fusion d’information par l’analyse formelle de concepts

Treillis de concepts et interprétation

Soit un concept (A,d), par exemple, ({g1,g2}, [2,3])Son intension d fournit le résultat de fusion des objets deson extension A, l’origine de l’information fusionnéeA est maximal, i.e. tout ajout d’un objet dans A change dLa cardinalité de l’extension donne le nombre de sourcessupportant le résultat de fusionle concept > donne le résultat de fusion globalclassiquement calculéL’ordre des concepts suit celui de la précision

17 / 26

Page 18: Organiser la fusion d’information par l’analyse formelle de concepts

Le cas de l’opérateur basé sur les SMC

N’est pas un opérateur associatif et n’induit pas d’ordrefm1(fm1([1,5], [2,3]), [4,7]) = [2,3] ∪ [4,7]fm1(fm1([1,5], [4,7]), [2,3]) = [4,5] ∪ [2,3]

Mais il retourne une disjonction de SMCChercher les SMCUtiliser l’opérateur de fusion disjonctif

m1

(g1,g2) [2,3](g1,g3) [4,5](g3,g4) [6,7]

18 / 26

Page 19: Organiser la fusion d’information par l’analyse formelle de concepts

Considérer plusieurs variables

Structure de patrons (G, (D,u), δ)L’information de g1 est δ(g1) = 〈[1,5], [1,9]〉Chaque variable est indépendanteUn opérateur de fusion par dimension du vecteurInduit un ordre partiel de vecteurs (D,u)

{g1,g2}� = 〈[1,5], [1,9]〉 u 〈[2,3], [1,3]〉= 〈fm1([1,5], [2,3]), fm2([1,9], [1,3])〉= 〈[2,3], [1,3]〉

〈[2,3], [1,3]〉� = {g ∈ G | 〈[2,3], [1,3]〉 v δ(g)}= {g1,g2}

({g1,g2}, 〈[2,3], [1,3]〉) est un concept formel

m1 m2

g1 [1,5] [1,9]g2 [2,3] [1,3]g3 [4,7] [6,7]g4 [6,10] [8,9]

19 / 26

Page 20: Organiser la fusion d’information par l’analyse formelle de concepts

1 Analyse Formelle de Concepts

2 Organiser la fusion d’information

3 Une première application

4 Conclusion

Page 21: Organiser la fusion d’information par l’analyse formelle de concepts

Évaluation de pratiques agricoles

Est-il dangereux d’appliquer un pesticide à un champ ?selon divers caractéristiques du pesticide (DT50, koc)données par divers sourcesselon les propriétés du champ (exposition, type, etc.)

Calcul d’un indicateur Igro

Reçoit une valeur synthétique et convexe de chaquecaractéristique ainsi que les propriétésRetourne un intervalle dans [0,10]

valeurs < 7 : danger ; valeurs ≥ 7 : pas de dangerautrement, aucune évaluation ne peut être prise

DT50 kocday L/kg

BUS [2,74]PM11 [15,72]PM12 [44,940]PM13 [44,940]INRA [1.08,8.98]Com98 [2,6] [17,160]AGXf [2,6] [1.08,160]AGXl [15,74] [1.08,160]

21 / 26

Page 22: Organiser la fusion d’information par l’analyse formelle de concepts

Évaluation de pratiques agricoles

Premier travail, Assaghir et al., EUSFLAT 2009Opérateur fondé sur les SMC : convexification du résultatglobal, et Igro retourne un intervalle qui ne permet pasd’évaluer la pratique

DT50 kocday L/kg

BUS [2,74]PM11 [15,72]PM12 [44,940]PM13 [44,940]INRA [1.08,8.98]Com98 [2,6] [17,160]AGXf [2,6] [1.08,160]AGXl [15,74] [1.08,160]

22 / 26

Page 23: Organiser la fusion d’information par l’analyse formelle de concepts

Application

DT50 kocday L/kg

BUS [2,74]PM11 [15,72]PM12 [44,940]PM13 [44,940]INRA [1.08,8.98]Com98 [2,6] [17,160]AGXf [2,6] [1.08,160]AGXl [15,74] [1.08,160]

DT50 (days) koc (L/kg)K1 [2,6] ∅K2 [15,72] ∅K3 ∅ [1.08,8.98]K4 ∅ [44,160]

23 / 26

Page 24: Organiser la fusion d’information par l’analyse formelle de concepts

1 Analyse Formelle de Concepts

2 Organiser la fusion d’information

3 Une première application

4 Conclusion

Page 25: Organiser la fusion d’information par l’analyse formelle de concepts

Conclusion

En résuméOrganiser des résultats de fusion au sein d’un treillis deconceptsIdentifier des résultats partiels et le résultat globalLes ordonner selon leur précision et leur origineConsidérer des opérateurs disjonctif, conjonctif, SMCConsidérer une ou plusieurs variablesPasser à l’échelle grâce aux structures de patrons

PerspectivesÉtude systématique d’autres opérateurs de fusion existantsExtension aux intervalles flousAppliquer aux données symboliques.

Assaghir, Kaytoue, Prade – SUM 2010

25 / 26

Page 26: Organiser la fusion d’information par l’analyse formelle de concepts

Références

Z. Assaghir, M. Kaytoue, A. Napoli et H. Prade. Managing Information Fusion with Formal Concept Analysis.In Modelling Decision in Artificial Intelligence (MDAI), LNCS/LNAI, Springer, 2010.

Z. Assaghir, M. Kaytoue, et H. Prade. A possibility theory-oriented discussion of conceptual patternstructures In Scalable Uncertainty Management (SUM), LNCS, Springer, 2010.

Z. Assaghir et P. Girardin et A. Napoli Fuzzy Logic Approach to Represent and Propagate Imprecision inAgri-Environmental Indicator Assessment In IFSA/EUSFLAT, 2009.

B. Ganter et R. Wille. Formal Concept Analysis. Mathematical Foundations, Springer, 1999.

B. Ganter et S. O. Kuznetsov. Pattern Structures and Their Projections. In International Conference onConceptual Structures, LNCS (2120), Springer, 2001

M. Kaytoue, S. Duplessis, S. O. Kuznetsov, et A. Napoli. Two FCA-Based Methods for Mining GeneExpression Data. In Formal Concept Analysis (ICFCA), LNCS (5548), Springer, pages 251–266, 2009.

M. Kaytoue et A. Napoli. Classification de données numériques par treillis de concepts et structures depatrons. Journées Nationales de l’Intelligence Artificielle Fondamentale (IAF), 2010

M. Kaytoue, Z. Assaghir, N. Messai, et A. Napoli. Two Complementary Classification Methods for Designinga Concept Lattice from Interval Data. In Foundations of Information and Knowledge Systems (FoIKS),LNCS (5956), Springer, pages 345–362, 2010.

26 / 26