outils pour le traitement des textes levée d'ambiguïtés morpho-syntaxiques
DESCRIPTION
Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques. É ric Laporte Université Paris-Est Marne-la-Vallée. Sommaire. Règles de priorité entre analyses Dépendances entre analyses Règles-exceptions Dépendances entre règles Chevauchements - PowerPoint PPT PresentationTRANSCRIPT
Outils pour le traitement des textes
Levée d'ambiguïtésmorpho-syntaxiques
Éric LaporteUniversité Paris-Est Marne-la-
Vallée
Sommaire
Règles de priorité entre analysesDépendances entre analysesRègles-exceptionsDépendances entre règlesChevauchementsIndépendance double : le système Elag
Rappel : indépendance double
Comment assurer que la construction de la grammaire peut être monotone ?
Indépendance des analyses et des règles
LAL ((ai)1 i m, (rj)1 j n) = 1 j n 1 i m LAL (ai, rj)
a LAL ((ai)1 i m, (rj)1 j n) j [1, n] a LAL (a,
rj)
Indépendance double
Réalisation par le système Elag :- chaque règle = un automate qui représente l'ensemble des séquences conformes à la règle- grammaire = intersection des règles- LAL(T, G) = T G
Interface utilisateur :- format utilisateur lisible- format compilé prêt pour intersection
Format utilisateur de grammaires Elag (1/6)
Pour chaque règle
Format utilisateurLisible pour la construction et la maintenance manuelles
Format compiléUn automate qui représente l'ensemble des séquences conformes à la règle, prêt pour intersection
Format utilisateur de grammaires Elag (2/6)
l'un comme maître, l'autre comme domestiqueun,.A:ms La République est uneSupprimer l'analyse <un.A> après <le.DET>
Format utilisateur de grammaires Elag (3/6)
Supprimer toutes les analyses qui comportent une partie s1 suivie d'une partie s2
s1
s2
Format utilisateur de grammaires Elag (4/6)
Dans les règles de ce type,- les parties s1 et s2 peuvent être aussi complexes que nécessaire- peu importe où on place la séparation entre s1 et s2
- les marqueurs <!> ne servent à rien
s1
s2
Format utilisateur de grammaires Elag (5/6)
le Reform club de Londresde,.DET+Dind:mp:fp De grands arbres entourent le parcCette analyse seulement devant <A:p>
s1s2
a1 a2
Format utilisateur de grammaires Elag (6/6)
Supprimer les analyses dans lesquelles un s1 n'est pas suivi d'un a2
Les marqueurs <!> et <=> servent à identifier et délimiter s1 et a2
s1 s2
a1 a2
Format général (1/2)Les marqueurs <!> et <=> servent à identifier et délimiter s1, s2, a1 et a2
Si une analyse contient un s1 immédiatement suivi d'un s2, le point de séparation entre s1 et s2 doit aussi être précédé d'un a1 et suivi d'un a2, sinon elle est supprimée
s1 s2
a1 a2
Format général (2/2)Les marqueurs <!> et <=> servent à identifier et délimiter s1, s2, a1 et a2, etc.Si une analyse contient un s1 immédiatement suivi d'un s2, le point de séparation entre s1 et s2 doit aussi être précédé d'un a1 et suivi d'un a2 (ou précédé d'un b1 et suivi d'un b2, etc.), sinon elle est supprimée
s1 s2
a1 a2
Exemple avec 3 parties non vides
l'un des membres les plus singuliersplus,plaire.V:J1s:J2sJe lui plus dès le premier regardSupprimer l'analyse <plaire.V> après <le.PRO>, sauf...
s1 s2
a1
a2
Quelques précautions (1/3)le Reform club de Londresde,.DET+Dind:mp:fp De grands arbres entourent le parcCette analyse seulement devant <A:p>
s1 s2
Quelques précautions (2/3)
Attention au positionnement de la séparation entre s1 et s2 : si plusieurs variantes, la règle peut s'appliquer plusieurs fois au même endroit
s1 s2
Quelques précautions (3/3)Ajouter des variantes de s1 et s2 augmente le nombre d'applications de la règle (donc la précision)Ajouter des variantes de a1 et a2 augmente le nombre d'analyses acceptées (la règle devient moins stricte)