outils pour le traitement des textes levée d'ambiguïtés morpho-syntaxiques

16
Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la-Vallée

Upload: africa

Post on 17-Jan-2016

26 views

Category:

Documents


0 download

DESCRIPTION

Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques. É ric Laporte Université Paris-Est Marne-la-Vallée. Sommaire. Règles de priorité entre analyses Dépendances entre analyses Règles-exceptions Dépendances entre règles Chevauchements - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Outils pour le traitement des textes

Levée d'ambiguïtésmorpho-syntaxiques

Éric LaporteUniversité Paris-Est Marne-la-

Vallée

Page 2: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Sommaire

Règles de priorité entre analysesDépendances entre analysesRègles-exceptionsDépendances entre règlesChevauchementsIndépendance double : le système Elag

Page 3: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Rappel : indépendance double

Comment assurer que la construction de la grammaire peut être monotone ?

Indépendance des analyses et des règles

LAL ((ai)1 i m, (rj)1 j n) = 1 j n 1 i m LAL (ai, rj)

a LAL ((ai)1 i m, (rj)1 j n) j [1, n] a LAL (a,

rj)

Page 4: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Indépendance double

Réalisation par le système Elag :- chaque règle = un automate qui représente l'ensemble des séquences conformes à la règle- grammaire = intersection des règles- LAL(T, G) = T G

Interface utilisateur :- format utilisateur lisible- format compilé prêt pour intersection

Page 5: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Format utilisateur de grammaires Elag (1/6)

Pour chaque règle

Format utilisateurLisible pour la construction et la maintenance manuelles

Format compiléUn automate qui représente l'ensemble des séquences conformes à la règle, prêt pour intersection

Page 6: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Format utilisateur de grammaires Elag (2/6)

l'un comme maître, l'autre comme domestiqueun,.A:ms La République est uneSupprimer l'analyse <un.A> après <le.DET>

Page 7: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Format utilisateur de grammaires Elag (3/6)

Supprimer toutes les analyses qui comportent une partie s1 suivie d'une partie s2

s1

s2

Page 8: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Format utilisateur de grammaires Elag (4/6)

Dans les règles de ce type,- les parties s1 et s2 peuvent être aussi complexes que nécessaire- peu importe où on place la séparation entre s1 et s2

- les marqueurs <!> ne servent à rien

s1

s2

Page 9: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Format utilisateur de grammaires Elag (5/6)

le Reform club de Londresde,.DET+Dind:mp:fp De grands arbres entourent le parcCette analyse seulement devant <A:p>

s1s2

a1 a2

Page 10: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Format utilisateur de grammaires Elag (6/6)

Supprimer les analyses dans lesquelles un s1 n'est pas suivi d'un a2

Les marqueurs <!> et <=> servent à identifier et délimiter s1 et a2

s1 s2

a1 a2

Page 11: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Format général (1/2)Les marqueurs <!> et <=> servent à identifier et délimiter s1, s2, a1 et a2

Si une analyse contient un s1 immédiatement suivi d'un s2, le point de séparation entre s1 et s2 doit aussi être précédé d'un a1 et suivi d'un a2, sinon elle est supprimée

s1 s2

a1 a2

Page 12: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Format général (2/2)Les marqueurs <!> et <=> servent à identifier et délimiter s1, s2, a1 et a2, etc.Si une analyse contient un s1 immédiatement suivi d'un s2, le point de séparation entre s1 et s2 doit aussi être précédé d'un a1 et suivi d'un a2 (ou précédé d'un b1 et suivi d'un b2, etc.), sinon elle est supprimée

s1 s2

a1 a2

Page 13: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Exemple avec 3 parties non vides

l'un des membres les plus singuliersplus,plaire.V:J1s:J2sJe lui plus dès le premier regardSupprimer l'analyse <plaire.V> après <le.PRO>, sauf...

s1 s2

a1

a2

Page 14: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Quelques précautions (1/3)le Reform club de Londresde,.DET+Dind:mp:fp De grands arbres entourent le parcCette analyse seulement devant <A:p>

s1 s2

Page 15: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Quelques précautions (2/3)

Attention au positionnement de la séparation entre s1 et s2 : si plusieurs variantes, la règle peut s'appliquer plusieurs fois au même endroit

s1 s2

Page 16: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Quelques précautions (3/3)Ajouter des variantes de s1 et s2 augmente le nombre d'applications de la règle (donc la précision)Ajouter des variantes de a1 et a2 augmente le nombre d'analyses acceptées (la règle devient moins stricte)