les relations intercatégorielles nom-verbe (observées à travers upery) cécile fabre
Post on 18-Jan-2016
17 Views
Preview:
DESCRIPTION
TRANSCRIPT
Les relations intercatégorielles Nom-Verbe
(observées à travers Upery)
Cécile Fabre
2
Passerelles nom ↔ verbe : qqs travaux antérieurs En TAL
Terminologie Recherche d’information
En sémantique lexicale Les liens N-V calculés par UPery
Exemples et premiers résultats Esquisse de typologie
Perspectives
3
Objectif général
Repérer un contenu informatif comparable à travers ses variantes textuelles
« assessment of semantic similarity has proved to be essential for a variety of Natural Language Processing tasks” (Montemagni et al. 98)
4
Repérer les variantes nom-verbe
« From an information retrieval point of view the same information can be coded in an NP or in a sentence. By unifying higher-order nouns and verbs in the same ontology it will be possible to match expressions with very different syntactic structures but comparable content »
(Vossen 1998)
5
Repérage automatique de variantes terminologiques
(Fabre et Jacquemin 2000)
But : constituer une grammaire permettant d’identifier les reformulations verbales de termes nominaux
Comparaison_N de_P résultat_N ≈ comparer_V les_D résultats_N
Technique_N de_P mesure_N ≈ mesure_V à l’aide d’_P une_D technique_N
Amélioration_N de_P technique_N ≠ techniques_N permettant_V d’_P améliorer_V
6
Acquisition de ressources lexicales pour la RI(Bouillon, Fabre, Sébillot, Jacqmin, 2000)(Galy, 2000)(Claveau 2003)
But : Mettre au point une méthode permettant d’extraire d’un corpus des couples nom-verbe sémantiquement associés
ex de patron calculé (programmation logique inductive) :
V infinitif + (tout sauf un verbe)* + conj de coord + N
7
Modèles lexicaux
On sort du champ balisé des relations sémantiques intracatégorielles
Mel’čuk : les fonctions lexicales
fonctions lexicales syntagmatiquesOper1 :
OBSTACLE => encounter
fonctions lexicales paradigmatiques
S0 : ACHETER => achatV0 : SERMON => jurer S1 : PARLER =>locuteur
8
Pustejovsky : la structure qualiala représentation des noms intègre des informations
relationnelles codées sous forme de prédicats verbaux
couteau
qualia formal : x
telic : couper (e,x,y)
[…]
9
• WordNet 1.5 : pas de relations intercatégorielles“In Princeton WordNet nouns and verbs are not interrelated by basic semantic relations such as hyponymy and synonymy. The effect is that very similar synsets are totally unrelated only because they differ in part of speech” (Vossen 97)
• WordNet 2.0 «Derivationally related forms »« adoption -- (a legal proceeding that creates a parent-child relation […]
RELATED TO->(verb) adopt#5 => adopt, take in --
WordNet
10
EuroWordNet
• EuroWordNet « cross-part-of speech relations »{adorn V} XPOS_NEAR_SYN {adornment N} « The advantages of such explicit cross-part-of
speech relations are:- similar words with different parts of speech are grouped together.[…]- From an information retrieval point of view [...] it will be possible to match expressions with very different syntactic structures but comparable content » (Vossen 97)
11
Ex : commémorer obj
Catégorie Lemme Relation a Jaccard
N commémoration de 25 0.523
N célébration de 17 0.257
N cinquantenaire de 11 0.247
V célébrer obj 24 0.228
N festivité de 5 0.227
N circonstance de 11 0.212
V coïncider suj 10 0.212
N anniversaire de 31 0.203
12
raflecinquantenaire
bicentenairedébarquement
baptêmesoulèvementcentenaire
anniversaire[…]
commémorer (obj) anniversaire (de)
commémorer (obj) commémoration (de)
soulèvementdébarquement
raflebaptême
naissancedéportationmassacreémeute
[…]
13
Premiers chiffres indicatifs :• Part des relations N-V
• Proportion de N-V présentant un lien morphologique : 17 %
déverbauxd'action
autresdéverbaux
pas de lienmorphologique
N-V = 16% des relations impliquant un nom
14
Nom nb de ctxs partagés
verbes
début de 83 commencer suj
hausse de 114 augmenter obj
reprise de 63 relancer obj
retour à 138 revenir à
vainqueur de 61 66
remporter suj gagner suj
Visite à 9 se rendre à
Le parent distributionnel n’est pas forcément le parent morphologique
15
Répartition selon les schémas syntaxiques de correspondance
Nom de X / Verbe Xobj
rétablissement de X / rétablir Xrelèvement de X / baisser X
Nom de X / Verbe Xsuj
rétablissement de X / rétablir Xrelèvement de X / baisser X
Nom en X / Verbe en Xretour en X / revenir en X
Nom à X / Verbe à X rapport à X / remettre à X
Autres
action pour X / favoriser Xlutter pour X / accéder à X
16
Typologie des liens N-V
1- équivalencefusion – regrouper fusion d’entreprises / regrouper des entreprisesrenforcement – durcir renforcement de la législation / durcir la législation2- activité typique, fonctionbouteille – boire bouteille de vodka / boire de la vodkacamion – acheminer camion de vivres / acheminer les vivresvictime – souffrir victime d’un traumatisme / souffrir d’un traumatisme3- antonymiedégradation – améliorer dégradation de l’emploi / l’emploi s’amélioreréunification – diviser réunification du pays / diviser le pays4- contiguïté sémantique ?? succession temporelle élaboration – mettre en œuvre élaboration de la loi / mettre en œuvre la loi distribution – acheter distribution des vivres / acheter les vivres5- collocations, verbes supportsarrêt – rendre arrêt de la cour d’appel /cour d’appel rendrearticle – paraître article de presse / paraître dans la presse[..]
17
Perspectives
Mieux décrire la relation sémantique N-V- observer en contexte les zones de reformulation N V
- étendre l’observation à d’autres corpus
Etudier l’impact de telles ressources en TAL :- « rentabilité » du lien N-V pour la recherche d’information?
- rôle complémentaire par rapport à des ressources de type synonymique ?
18
Bibliographie
Bouillon P., Fabre, C., Sébillot P. et Jacqmin, L. (2000) « Apprentissage de ressources lexicales pour l'extension de requêtes », Traitement automatique des langues, 41(2):367-393, numéro spécial Traitement automatique des langues pour la recherche d'informations , coordonné par Christian Jacquemin, ATALA/Hermes sciences publications, Paris.
Claveau V. (2003) Acquisition automatique de lexiques sémantiques pour la recherche d'information. Thèse de l'Université de Rennes 1, décembre 2003 (http://olst.ling.umontreal.ca/~vincent/publis.html).
Fabre C. et Jacquemin C., (2000), "Boosting Variant Recognition with Light Semantics", actes de COLING (Computational Linguistics), Sarrebrück, août 2000 (voir sur ma page web à l’ERSS)
Galy E. (2000), Repérer en corpus les associations sémantiques privilégiées entre le nom et le verbe : le cas de la fonction dénotée par le nom, Mémoire de maîtrise en Sciences du langage, Université Toulouse-Le Mirail.
Montemagni S. et Pirelli V. (1998), « Augmenting WordNet-like Lexical Resources with Distributional Evidence. An Application-Oriented Perspective« , in S. Harabagiu, editor, Workshop on Use of WordNet in Natural Language Processing Systems: Proceedings of the Conference, pages 87-93. Association for Computational Linguistics
Vossen P. (1997), ‘EuroWordNet: a multilingual database for information retrieval’ In Proceedings of the DELOS workshop on Cross-language Information Retrieval, March 5-7, Zürich
top related