cours 11 référence contraintes sur les expressions coréférentes préférences entre référents...

29
Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Upload: alais-berthet

Post on 04-Apr-2015

109 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Cours 11

Référence

Contraintes sur les expressions coréférentes

Préférences entre référents possibles

Algorithmes de résolution des références

Page 2: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Référence

Jean est allé chez un concessionnaire voir une Mazda Bouddha. Il l’a regardée pendant à peu près une heure.

Jean et Il dénotent une même personne

Jean et Il sont des expressions

La personne en question est le référent

Jean et Il réfèrent à cette personne

Jean et Il sont coréférents

Jean est un antécédent de Il

Il est une anaphore

Page 3: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Référence

Quand il l’a achetée, Jean a regardé la voiture avec soin

Jean et Il sont coréférents

Le pronom (Il) est placé avant le groupe nominal (Jean), ce qui est beaucoup plus rare que l'inverse

Jean est un conséquent de Il

Il est une cataphore

Page 4: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Expressions référant à une nouvelle entité

J'ai vu une Mazda Bouddha aujourd'hui

Ils ont livré des Mazda Bouddha au concessionnaire auhourd'hui

Déterminants : un, deux, plusieurs, des, certains, du, un peu de, beaucoup de...

La rue la plus longue de Paris est la rue de Vaugirard

La jeune femme que vous venez de voir est Françoise

Déterminants : le, son, ce...

Page 5: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Référence lexicale

J'ai vu une Mazda Bouddha aujourd'hui à Prague et mon voisin en a une à Paris

J'ai vu une Mazda Bouddha aujourd'hui à Prague mais celle de mon voisin à Paris est plus belle

Pas de coréférence entre le groupe nominal et le pronom (ce sont deux voitures différentes)

Pronoms : en, celui...

Page 6: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Expressions référant à une entité déjà mentionnée

Deux ans plus tard, dans un hôtel à Prague, Luc retrouve Marie. L'hôtel était d'ailleurs celui que tu connais.

Deux ans plus tard, dans un hôtel à Prague, Luc retrouve Marie. Cet établissement était peu élégant.

Déterminants : le, ce...

Luc a vu une Mazda Bouddha aujourd'hui. Il a eu envie de l'acheter, mais sa femme n'est pas d'accord.

Pronoms : il, le, lui, en, se, ce dernier, celui-ci, cela...

Possessifs : son

Page 7: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Référence implicite

Luc a acheté une Mazda Bouddha mais la carrosserie a des défauts.

(la carrosserie de la Mazda)

Luc a promis à Marie de revenir

(le sujet implicite de revenir est Luc)

Luc a permis à Marie de revenir

(le sujet implicite de revenir est Marie)

Page 8: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Contraintes

Accord en personne, en genre et en nombre entre groupe nominal et pronom coréférents

Luc a acheté une voiture mais elle ne lui plaît pas

≠ Luc a acheté une voiture mais je ne lui plais pas

≠ Luc a acheté une voiture mais il ne lui plaît pas

≠ Luc a acheté une voiture mais elle ne leur plaît pas

mais

L'imprimante est encore en panne. Je déteste cet appareil.

Page 9: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Contraintes

Contraintes de coréférence internes à la phrase

Il a acheté une voiture à Luc Il et Luc jamais coréférents

Il lui a acheté une voiture Il et lui jamais coréférents

Il s'est acheté une voiture Il et se toujours coréférents

Il a dit que Luc vient Il et Luc jamais coréférents

Page 10: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Contraintes

Compatibilité entre prédicats et arguments

Le jour où Luc est tombé malade était proche d'une échéance professionnelle importante. Mais il va mieux.

Le jour où Luc est tombé malade et il ne peuvent pas être coréférents

Le prédicat va mieux ne peut pas prendre comme sujet Le jour où Luc est tombé malade

Page 11: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Préférences

Un pronom, plusieurs antécédents possibles

Pour une entité mentionnée plus récemment qu'une autre

Luc est sorti mais Marc est ici. Il va mieux.

Il réfère à Marc plutôt qu'à Luc

Pour le sujet plutôt qu'un complément, pour un complément direct plutôt qu'indirect...

Marie est au téléphone avec Anne. Luc la cherche partout.

Luc a raccompagné sa voisine chez Marie. Elle va mieux.

Page 12: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Préférences

Pour une expression qui occupe la même position que le pronom dans une structure syntaxique parallèle

Luc s'est rapproché de Max. Au contraire, Guy s'est éloigné de lui.

Préférences pragmatiques (on comprend la situation)

Luc a offert trois bandes dessinées à Max. Il adore ça.

Luc a emprunté trois bandes dessinées à Max. Il adore ça.

Luc admire Max. Il est jongleur.

Luc a impressionné Max. Il est jongleur.

Page 13: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Deux algorithmes de résolution de références

PrincipeLe référent le plus plausible pour un pronom est l'entité qui a le plus de

"poids"Algorithme 1 (Lappin & Leass, 1994)Poids initial d'une expressionPoids initial d'une entité en un point du texte : dépend des poids initiaux

des expressions référant à l'entité déjà rencontréesPoids total d'une entité par rapport à un pronom : dépend du pronom et

du poids initial de l'entitéAlgorithme 2 (Brennan, Friedman & Pollard, 1987)(pas vu en 2006-2007)Liste des référents mentionnés dans une phrase, par ordre de poids

décroissant

Page 14: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Algorithme 1

Facteurs de poids initiaux Poids

Pour chaque occurrence 100

Sujet 80

Après There is 70

Autre argument d’un verbe, sans préposition 50

Autre argument d’un verbe, avec préposition 40

Non séparé par une ponctuation 50

Non complément d’un autre groupe nominal 80

Page 15: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Algorithme 1

mettre à jour le poids initial du référent R d'une expression E :

si E réfère à une nouvelle entité

créer une nouvelle entité

ajouter E aux expressions référant à R

R.poids_initial = R.poids_contextuel

pour chaque facteur de poids initial F

calculer E.poids_initial(F)

P = maximum des ER.poids_initial(F) pour toutes les expressions

ER de la même phrase référant à R et déjà rencontrées

R.poids_initial = R.poids_initial + P

Page 16: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Exemple

John saw a beautiful Mazda Buddha at the dealership

John M.B. dealership

Pour chaque occurrence 100 100 100

Sujet 80

Après There is

Compl. direct 50

Compl. indirect

Non séparé 50 50 50

Non compl. d’un GN 80 80 80

Poids initial 310 280 230

Page 17: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Algorithme 1

À chaque expression pouvant référer à une entité

mettre à jour le poids initial de l'entité

À chaque fin de phrase

pour chaque entité mentionnée dans la phrase

entité.poids_contextuel = entité.poids_initial

diviser les poids contextuels de toutes les entités par 2

À chaque pronom de la 3e personne non réfléchi

déterminer le référent du pronom

mettre à jour le poids initial du référent

Page 18: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

ExempleJohn saw a beautiful Mazda Buddha at the dealership. He showed it to Bob.

John Mazda dealership Bob

He it Bob

Poids contextuel 155 140 115

Pour chaque occurrence 100 100 100

Sujet 80

Après There is

Compl. direct 50

Compl. indirect 40

Non séparé 50 50 50

Non compl. d’un GN 80 80 80

Poids initial 465 420 115 270

Page 19: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

ExempleJohn saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to

Bob. He2 bought it2.

John Mazda dealership Bob

He2 it2

Poids contextuel 232,5 210 57,5 135

Pour chaque occurrence 100 100

Sujet 80

Après There is

Compl. direct 50

Compl. indirect

Non séparé 50 50

Non compl. d’un GN 80 80

Poids initial 542,5 490 57,5 135

Page 20: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Algorithme 1

Facteurs de poids finaux Poids

Parallélisme des positions syntaxiques 35

Cataphore - 175

Page 21: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Algorithme 1

Déterminer le référent d'un pronom :

lister les candidats référents jusqu’à la 4e phrase avant

pour chaque candidat

si (il concorde en genre et en nombre avec le pronom

et satisfait les contraintes de coréférence internes à la

phrase)

candidat.poids_total =

candidat.poids_initial +

les facteurs de poids finaux applicables

référent = le candidat dont le poids total est maximal, et s’il y en a plusieurs, le plus proche

Page 22: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

ExempleJohn saw a beautiful Mazda Buddha at the dealership. He1 showed it1...

John Mazda dealership

He1

Poids contextuel 155 140 115

Poids initial 465 140 115

Accord - + +

Contraintes + +

Parallélisme 35

Cataphore

Poids total 175 115

Résultat : le référent de it1 est Mazda

Page 23: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Algorithme 2

(pas vu en 2006-2007)

Pour chaque phrase Pi :

For(Pi) est la liste des entités mentionnées dans Pi, par ordre de poids décroissant (sujet, groupe nominal après There is, complément de verbe sans préposition, complément de verbe avec préposition, complément séparé par une virgule)

Pref(Pi) est l'entité de poids maximal dans For(Pi)

Back(Pi+1) est l'entité de poids maximal parmi celles de For(Pi) mentionnées dans Pi+1

Page 24: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Exemple

John saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to Bob. He2 bought it2.

For(P1) = ( John, Mazda, dealership )

Back(P1) non défini

For(P2) = ( John, Mazda, Bob )

Back(P2) = John

For(P3) = ( John, Mazda )

Back(P3) = John

Page 25: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Algorithme 2pour chaque phrase Pi

lister les pronoms et les candidats référents

lister les couples pronom/référent possibles

pour chaque façon A d’assigner un référent à chaque pronom

si (A viole une contrainte de coréférence interne à la phrase)

éliminer A

calculer Back(Pi), For(Pi), Pref(Pi)

si (Back(Pi) n'est pas un pronom dans Pi et

un autre élément de For(Pi-1) est un pronom dans Pi)

éliminer A

calculer A.score(Back(Pi-1), Pref(Pi), Back(Pi))

choisir un A qui a le score maximal

Page 26: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Exemple

John saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to Bob. He2 bought it2.

PronomsRéférents

A1 He2 John

it2 Mazda

Back(P3) = John For(P3) = ( John, Mazda )

A2 He2 Bob

it2 Mazda

Back(P3) = Mazda For(P3) = ( Bob, Mazda )

A3, A4 it2 dealership

Page 27: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Algorithme 2

A.score(Back_precedent, Pref, Back) :

si Back_precedent = Back ou Back_precedent indéfini

si Pref = Back score = 3

sinon score = 2

sinon

si Pref = Back score = 1

sinon score = 0

Page 28: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Exemple

John saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to Bob. He2 bought it2.

Back(P2) = John

A1 He2 John

it2 Mazda

Back(P3) = John For(P3) = ( John, Mazda )

A1.score = 3

A2 He2 Bob

it2 Mazda

Back(P3) = Mazda For(P3) = ( Bob, Mazda )

A2.score = 0

A3.score = 3A4.score = 1 Résultat : le référent de He2 est John

Page 29: Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références

Exemple avec résultat faux

Bob opened up a new dealership last week. John took a look at the Mazdas in his lot. He ended up buying one.

Back(P2) = Bob

A1 He John

Back(P3) = John For(P3) = ( John )

A1.score = 1

A2 He Bob

Back(P3) = Bob For(P3) = ( Bob )

A2.score = 3

Le résultat est Bob au lieu de John comme référent de He