m. lafourcade novembre 2005 - 1 analyse sémantique de textes et algorithmes à fourmis lirmm-info...

49
M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

Upload: nicodeme-barthelemy

Post on 03-Apr-2015

108 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 1

Analyse sémantique de texteset algorithmes à fourmis

LIRMM-INFOEquipe TALN

Page 2: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 2

Analyse sémantique ?

Sélection/pondération d’acceptions (WSD)

“L’avocat plaide”

avocat/fruit ou avocat/justice ?

Rattachement de groupes prépositionnels

“Il voit la fille avec un télescope”

“Il (voit avec un télescope ) la fille” ou “Il voit la (fille avec un télescope)” ?

Interprétations multiples

“L’avocat est véreux” 2 mais pas 4 appariements ?

Page 3: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 3

Analyse sémantique ?

Résolution anaphorique

“L’avocat défend son client. Il sera acquitté”

il = avocat ou il = client ?

Instanciation des fonctions lexicales [meltchuk] [schwab]

“Il a une forte fièvre”

Magn(fièvre) = forte ?

Page 4: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 4

Applications ?

Indexation de textes en RI [jaillet, prince, chauché, teissere]

Résolution de la polysémie lexicale (souris)augmentation de la précision

Synonymie (chat/matou) / champs sémantique (cheval/équitation) augmentation du rappel

Traduction Automatique [prince, delorme]

Résolution anaphorique - référent (he/she/it ? his/her/its ?)

Phénomènes contrastifs (river = rivière/fleuve ?)(abats = ofals/giblets ?)

Fonctions lexicales (forte fièvre = high fever)

Page 5: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 5

Plan

Analyse thématique et fourmis

Vecteurs conceptuels

Arbres morphosyntaxiques

Recherche de ressources et création de ponts

Couplage d’un réseau lexical

Relations ontologiques - relations prédicatives - typicalité

Castes de fourmis - agent / patient / ...

Pistes de recherche

Production entre castes - Auto-arrêt du système - Inhibition

Page 6: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 6

Représentation thématique [chauché, lafourcade]

Item lexical = Idées = Vecteur conceptuel

Par exemple, 873 composantes (concepts issus du thésaurus Larousse)

(1)existence, (2)inexistence, (3)matérialité, ..., (516)liberté, ..., (872)jeux, (873)jouets

Une composante du vecteur correspond à l'activation d'un concept.

Combinaison de vecteurs : addition, contextualisation… [lafourcade, prince, schwab]

Vecteurs Conceptuels

Page 7: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 7

Vecteurs Conceptuels

oiseautransports maritimes

et fluviauxarme

frégate(3 sens fusionnés)

Vecteurs conceptuels

Page 8: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 8

Distance angulaire (1/2)

DA(A, B) DA(A’, B)A’

B

A

Vecteurs conceptuels

Page 9: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 9

Distance angulaire (2/2)

Vecteurs conceptuels

DA(pélican, pélican) = 0 (0°)DA(pélican, grand-gosier) = 0,2 (11°)DA(pélican, train) = 1,22 (70°)DA(pélican, oiseau) = 0,46 (26°)DA(pélican, mouette ) = 0,4 (23°)DA(pélican, poisson ) = 0,35 (20°)

distance thématique ≠ distance ontologique (de type est-un)mais distance thématique distance ontologique

Page 10: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 10

finance

échange

profit

Page 11: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 11

Arbres morphosyntaxiques

Arborescence

structure + jeu de variables instanciées

Application SYGFRAN (SYGMART) [chauché]

“L’avocat plaide à la cour”PH

GN GV GNPREP

le avocat plaider à la cour

Page 12: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 12

Transformations (1/3)

Ajout des acceptionsArbres

morphosyntaxiques PH

GN GV GNPREP

le avocat plaider à la cour

avocat/justice

avocat/fruit

cour/justicecour/bâtiment

plaider/justice

Page 13: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 13

Transformations (2/3)

Transformation en graphe

Liens interphases

Calcul de distance entre phrases

Ajout d’informations de surface aux informations de dépendances

Combinaison entre approches localistes et structurelles

Arbresmorpho

syntaxiques

TEXTE

PHPH

PH

Page 14: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 14

Transformations (3/3)

Transformation en graphe

Enumération des rattachements possibles des GNPREP

Arbresmorpho

syntaxiques

PH

GN GV GNPREP

le homme regarde avec un télescopeGN

la fille

Page 15: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 15

Algorithmes à fourmis

Système Multi-Agents réactifs

TSP - recherche opérationnelle - réseau - bioinfo[dorigo] [bertelle] [bonabeau, théraulaz] [bruten] [costa, hertz]

Principe

Stygmergie = communication indirecte par modification de l’environnement

Dépot de phéromones - Evaporation lente

TALN

Agents cognitifs [stéphanini] [sabah]

sinon [lafourcade, guinand] [+cunningham] [zamora]

Page 16: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 16

Environnement

PH

GN GV GNPREP

le avocat plaider à la cour

avocat/justice

avocat/fruit

cour/justicecour/bâtiment

plaider/justice

Algo à fourmis

Page 17: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 17

Environnement

PH

GN GV GNPREP

le avocat plaider à la cour

avocat/justice

avocat/fruit

cour/justicecour/bâtiment

plaider/justice

Fourmilière F-Vecteur constant de l’acception V(F)

(couleur)-Niveau de “sucre” S(F) R+ (1)

Algo à fourmis

Page 18: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 18

Environnement

PH

GN GV GNPREP

le avocat plaider à la cour

avocat/justice

avocat/fruit

cour/justicecour/bâtiment

plaider/justice

Noeud standard N-Vecteur V(N) (coloration) (V unitaire)-Niveau de “sucre” S(N) R+ (1)

Algo à fourmis

Page 19: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 19

Environnement

PH

GN GV GNPREP

le avocat plaider à la cour

avocat/justice

avocat/fruit

cour/justicecour/bâtiment

plaider/justice

Arc A- type- Signaux valués = phéromones (symboles + valeurs numériques)

ex : ph de passage P(A) R+ (0)

Algo à fourmis

Page 20: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 20

Environnement

PH

GN GV GNPREP

le avocat plaider à la cour

avocat/justice

cour/justicecour/bâtiment

plaider/justice

Algo à fourmis

avocat/fruit

Fourmilières ennemies= acceptions concurrentes

FE

Fourmilières potentiellement amies= acceptions +/- compatibles

FA

FE

FA

N

Page 21: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 21

Fourmilière

Production de fourmis

une fourmi à chaque cyle de la simulation

Selon une probabilité liée au niveau de “sucre” S(F)

fonction “sigmoïde”

coût de production (expérimentalement 1/10)

Algo à fourmis

Page 22: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 22

Fourmis

Attributs d’une fourmi f

Durée de vie : expérimentalement 20 cycles

Restitution de la ressource à la mort

Quantité de “sucre” transporté : Q réel dans [0,1]

Référence à la fourmilière d’origine F : V(f) = V(F)

Mode de déplacement courant : Prob = Q

Deux modes de déplacement

Recherche de “sucre”

Retour vers la fourmillère

QuickTime™ et undécompresseur TIFF (LZW)sont requis pour visionner cette image.

Algo à fourmis

Page 23: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 23

Déplacement

Déplacement pseudo-aléatoire de f F

Evaluation des destinations possibles + liste tabou (k = 1)

Modification de l’environnement

Dépot de phéromone sur l’arc traversé : P(A) = P(A) +

Coloration du vecteur du nœud atteint : V(N) = V(N) + V(f)

somme normée et et petits

Création d’un pont d’une fourmillière Fi FA vers F

QuickTime™ et undécompresseur TIFF (LZW)sont requis pour visionner cette image.

cour/justiceplaider/justice

P(A) = F

Fi

Algo à fourmis

Page 24: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 24

Déplacement

Principe général

Position courante = un nœud N avec k voisins Ni via des arc Ai

Fonction d’évaluation de chaque Ni = Eval(Ni)

Fonction d’évaluation de chaque Ai = Eval(Ai)

Fonction d’évaluation globale de la destination dest i

QuickTime™ et undécompresseur TIFF (LZW)sont requis pour visionner cette image.

Algo à fourmis

Page 25: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 25

Déplacement

Mode recherche

action spécifique : prendre du sucre sur Ni N FE

Mode retour

action spécifique : déposer du sucre sur Ni si Ni FA

QuickTime™ et undécompresseur TIFF (LZW)sont requis pour visionner cette image.

Algo à fourmis

Page 26: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 26

Evaporation

A chaque cycle les phéromones P(A) diminue par “évaporation”

Arc entre deux noeuds de l’arbre

P(A) = Min (P(A) - , 0)

Pont en Na et Nb

P(A) = Min (P(A) - d * , 0)

d = distance_ultramétrique(Na, Nb)

Le pont disparait si P(A) = 0

Plus un pont est long, plus il est difficile à maintenir !

QuickTime™ et undécompresseur TIFF (LZW)sont requis pour visionner cette image.

Algo à fourmis

Page 27: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 27

Exemple

QuickTime™ et undécompresseur TIFF (LZW)sont requis pour visionner cette image.

Algo à fourmis

PH

GN GV GNPREP

le avocat plaider à la cour

avocat/justice

avocat/fruit cour/bâtiment

plaider/justicecour/justice

Page 28: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 28

QuickTime™ et undécompresseur TIFF (LZW)

sont requis pour visionner cette image.

Page 29: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 29

QuickTime™ et undécompresseur TIFF (LZW)

sont requis pour visionner cette image.

Page 30: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 30

QuickTime™ et undécompresseur TIFF (LZW)

sont requis pour visionner cette image.

Page 31: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 31

PH

GN GV GNPREP

le homme regarde avec un télescopeGN

la fille

Exemple de rattachement

télescopefilleregarde

homme

Algo à fourmis

Page 32: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 32

Et ça marche tout le temps ?

Algo à fourmis

Page 33: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 33

Ca marche pas !

PH

GN

GV

GN

le avocat mange une glace

mangeravocat/fruit

avocat/loiglace/eau

glace/sorbet

Algo à fourmis

Page 34: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 34

Réseau lexical

manger

nourriture

glace/eau

glace/sorbet

fondre

être vivant

personne

avocat/loi

avocat/fruit

plaider

fruit

tribunal

justicebarreau/loi barreau/

bois

véreux/ver

creuser

véreux/malhonnête

pelle/outil

outil/objet

cour/tribunalagt

hyper

hyper

hyper

attagt

hyper

hyper

patient

agt

agt

objet

instr

hyper

hyper

hyper

rel

relrel

rel

Page 35: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 35

Réseau lexical

manger

nourriture

glace/eau

glace/sorbet

fondre

être vivant

personne

avocat/loi

avocat/fruit

plaider

fruit

tribunal

justicebarreau/loi barreau/

bois

creuser

véreux/malhonnête

pelle/outil

outil/objet

cour/tribunalagt

hyper

hyper

hyper

attagt

hyper

hyper

patient

agt

agt

objet

instr

hyper

hyper

hyper

rel

relrel

rel

V

V

V

V

V

VV

V

V

V

V

VV

V

V

V

V

VV

V

V

véreux/verV

Page 36: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 36

Castes de fourmis

Castes

Fourmis avec fonction d’évaluation particulière

Castes exploitant le réseau lexical

Prédicat recherche agent

Prédicat recherche patient

Prédicat recherche instrument …

Recopie locale

Acceptions et relations du réseau

Page 37: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 37

Prédicat rech. patient

Fourmis créées par un verbe (prédicat)

Mode recherche

Mode retour

QuickTime™ et undécompresseur TIFF (LZW)sont requis pour visionner cette image.

Algo à fourmis

(désespérement)

Page 38: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 38

Algo à fourmis

PH

GNGV

GN

le avocat mange une glace

mangeravocat/fruit

avocat/loiglace/eau

glace/sorbet

Page 39: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 39

Algo à fourmis

PH

GNGV

GN

le avocat mange une glace

mangeravocat/fruit

avocat/loiglace/eau

glace/sorbet

personne nourriture

patient

agent

Page 40: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 40

Algo à fourmis

PH

GNGV

GN

le avocat mange une glace

mangeravocat/fruit

avocat/loiglace/eau

glace/sorbet

personne nourriture

patient

agent

Page 41: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 41

Algo à fourmis

PH

GNGV

GN

le avocat mange une glace

mangeravocat/fruit

avocat/loiglace/eau

glace/sorbet

personneavocat/loi nourriture

glace/sorbet

patient

hypo

agent

hypo

Page 42: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 42

Algo à fourmis

PH

GNGV

GN

le avocat mange une glace

mangeravocat/fruit

avocat/loiglace/eau

glace/sorbet

personneavocat/loi nourriture

glace/sorbet

patient

hypo

agent

hypo

Page 43: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 43

Algo à fourmis

PH

GNGV

GN

le avocat mange une glace

mangeravocat/fruit

avocat/loiglace/eau

glace/sorbet

personneavocat/loi nourriture

glace/sorbet

patient

hypo

agent

hypo

Page 44: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 44

Algo à fourmis

PH

GNGV

GN

le avocat mange une glace

avocat/loiglace/eau

avocat/fruit

personneavocat/loi

nourriture

glace/sorbet

patient

hypo

agent

hypo

personne

hyper

mangeragent

glace/sorbetmanger

Page 45: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 45

Ca marche !

Algo à fourmis

PH

GNGV

GN

le avocat mange une glace

avocat/loiglace/eau

avocat/fruit

personneavocat/loi

nourriture

glace/sorbet

patient

hypo

agent

hypo

personne

hyper

mangeragent

glace/sorbetmanger

Page 46: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 46

Ca marche !

Algo à fourmis

PH

GNGV

GN

le avocat mange une glace

avocat/loiglace/eau

avocat/fruit

personneavocat/loi

nourriture

glace/sorbet

patient

hypo

agent

hypo

personne

hyper

mangeragent

glace/sorbetmanger

Page 47: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 47

Pistes 1/2

Taux de production d’une caste donnée

Ajustement par récompense

Auto-arrêt du système

Par facteurs interne (≠ recuit simulé)

Fourmis « gelantes » - réduit le taux d’évaporation des phéromones

Produites si environnement stable vu depuis la fourmilière

Inhibition

Fourmis tueuses - phéromone d’alerte

Page 48: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 48

Pistes 2/2

Inclusion de schémas fréquents

Rattachement prépositionnel [gala, lafourcade]

Distribution d’acceptions

en général

sur un domaine ?

Fréquence de noms composés

petit gris - serpent de mer

Fréquence pour les locutions

mettre x sur la paille

Page 49: M. Lafourcade novembre 2005 - 1 Analyse sémantique de textes et algorithmes à fourmis LIRMM-INFO Equipe TALN

M. Lafourcade novembre 2005 - 49

Conclusion

Emergence d’une solution par exploitation d’erreurs

Problème de coordination facilité

Architecture générique et extensible

Difficulté à paramétrer le système