les relations intercatégorielles nom-verbe (observées à travers upery) cécile fabre

18
Les relations intercatégorielles Nom-Verbe (observées à travers Upery) Cécile Fabre

Upload: inez

Post on 18-Jan-2016

17 views

Category:

Documents


0 download

DESCRIPTION

Les relations intercatégorielles Nom-Verbe (observées à travers Upery) Cécile Fabre. Passerelles nom ↔ verbe : qqs travaux antérieurs En TAL Terminologie Recherche d’information En sémantique lexicale Les liens N-V calculés par UPery Exemples et premiers résultats Esquisse de typologie - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

Les relations intercatégorielles Nom-Verbe

(observées à travers Upery)

Cécile Fabre

Page 2: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

2

Passerelles nom ↔ verbe : qqs travaux antérieurs En TAL

Terminologie Recherche d’information

En sémantique lexicale Les liens N-V calculés par UPery

Exemples et premiers résultats Esquisse de typologie

Perspectives

Page 3: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

3

Objectif général

Repérer un contenu informatif comparable à travers ses variantes textuelles

« assessment of semantic similarity has proved to be essential for a variety of Natural Language Processing tasks” (Montemagni et al. 98)

Page 4: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

4

Repérer les variantes nom-verbe

« From an information retrieval point of view the same information can be coded in an NP or in a sentence. By unifying higher-order nouns and verbs in the same ontology it will be possible to match expressions with very different syntactic structures but comparable content »

(Vossen 1998)

Page 5: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

5

Repérage automatique de variantes terminologiques

(Fabre et Jacquemin 2000)

But : constituer une grammaire permettant d’identifier les reformulations verbales de termes nominaux

Comparaison_N de_P résultat_N ≈ comparer_V les_D résultats_N

Technique_N de_P mesure_N ≈ mesure_V à l’aide d’_P une_D technique_N

Amélioration_N de_P technique_N ≠ techniques_N permettant_V d’_P améliorer_V

Page 6: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

6

Acquisition de ressources lexicales pour la RI(Bouillon, Fabre, Sébillot, Jacqmin, 2000)(Galy, 2000)(Claveau 2003)

But : Mettre au point une méthode permettant d’extraire d’un corpus des couples nom-verbe sémantiquement associés

ex de patron calculé (programmation logique inductive) :

V infinitif + (tout sauf un verbe)* + conj de coord + N

Page 7: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

7

Modèles lexicaux

On sort du champ balisé des relations sémantiques intracatégorielles

Mel’čuk : les fonctions lexicales

fonctions lexicales syntagmatiquesOper1 :

OBSTACLE => encounter

fonctions lexicales paradigmatiques

S0 : ACHETER => achatV0 : SERMON => jurer S1 : PARLER =>locuteur

Page 8: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

8

Pustejovsky : la structure qualiala représentation des noms intègre des informations

relationnelles codées sous forme de prédicats verbaux

couteau

qualia formal : x

telic : couper (e,x,y)

[…]

Page 9: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

9

• WordNet 1.5 : pas de relations intercatégorielles“In Princeton WordNet nouns and verbs are not interrelated by basic semantic relations such as hyponymy and synonymy. The effect is that very similar synsets are totally unrelated only because they differ in part of speech” (Vossen 97)

• WordNet 2.0 «Derivationally related forms »« adoption -- (a legal proceeding that  creates a parent-child relation   […]  

RELATED TO->(verb) adopt#5       => adopt, take in -- 

WordNet

Page 10: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

10

EuroWordNet

• EuroWordNet « cross-part-of speech relations »{adorn V} XPOS_NEAR_SYN {adornment N} « The advantages of such explicit cross-part-of

speech relations are:- similar words with different parts of speech are grouped together.[…]- From an information retrieval point of view [...] it will be possible to match expressions with very different syntactic structures but comparable content » (Vossen 97)

Page 11: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

11

Ex : commémorer obj

Catégorie Lemme Relation a Jaccard

N commémoration de 25 0.523

N célébration de 17 0.257

N cinquantenaire de 11 0.247

V célébrer obj 24 0.228

N festivité de 5 0.227

N circonstance de 11 0.212

V coïncider suj 10 0.212

N anniversaire de 31 0.203

Page 12: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

12

raflecinquantenaire

bicentenairedébarquement

baptêmesoulèvementcentenaire

anniversaire[…]

commémorer (obj) anniversaire (de)

commémorer (obj) commémoration (de)

soulèvementdébarquement

raflebaptême

naissancedéportationmassacreémeute

[…]

Page 13: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

13

Premiers chiffres indicatifs :• Part des relations N-V

• Proportion de N-V présentant un lien morphologique : 17 %

déverbauxd'action

autresdéverbaux

pas de lienmorphologique

N-V = 16% des relations impliquant un nom

Page 14: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

14

Nom nb de ctxs partagés

verbes

début de 83 commencer suj

hausse de 114 augmenter obj

reprise de 63 relancer obj

retour à 138 revenir à

vainqueur de 61 66

remporter suj gagner suj

Visite à 9 se rendre à

Le parent distributionnel n’est pas forcément le parent morphologique

Page 15: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

15

Répartition selon les schémas syntaxiques de correspondance

Nom de X / Verbe Xobj

rétablissement de X / rétablir Xrelèvement de X / baisser X

Nom de X / Verbe Xsuj

rétablissement de X / rétablir Xrelèvement de X / baisser X

Nom en X / Verbe en Xretour en X / revenir en X

Nom à X / Verbe à X rapport à X / remettre à X

Autres

action pour X / favoriser Xlutter pour X / accéder à X

Page 16: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

16

Typologie des liens N-V

1- équivalencefusion – regrouper fusion d’entreprises / regrouper des entreprisesrenforcement – durcir renforcement de la législation / durcir la législation2- activité typique, fonctionbouteille – boire bouteille de vodka / boire de la vodkacamion – acheminer camion de vivres / acheminer les vivresvictime – souffrir victime d’un traumatisme / souffrir d’un traumatisme3- antonymiedégradation – améliorer dégradation de l’emploi / l’emploi s’amélioreréunification – diviser réunification du pays / diviser le pays4- contiguïté sémantique ?? succession temporelle élaboration – mettre en œuvre élaboration de la loi / mettre en œuvre la loi distribution – acheter distribution des vivres / acheter les vivres5- collocations, verbes supportsarrêt – rendre arrêt de la cour d’appel /cour d’appel rendrearticle – paraître article de presse / paraître dans la presse[..]

Page 17: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

17

Perspectives

Mieux décrire la relation sémantique N-V- observer en contexte les zones de reformulation N V

- étendre l’observation à d’autres corpus

Etudier l’impact de telles ressources en TAL :- « rentabilité » du lien N-V pour la recherche d’information?

- rôle complémentaire par rapport à des ressources de type synonymique ?

Page 18: Les relations intercatégorielles  Nom-Verbe (observées à travers Upery) Cécile Fabre

18

Bibliographie

Bouillon P., Fabre, C., Sébillot P. et Jacqmin, L. (2000) « Apprentissage de ressources lexicales pour l'extension de requêtes », Traitement automatique des langues,  41(2):367-393, numéro spécial Traitement automatique des langues pour la recherche d'informations , coordonné par Christian Jacquemin, ATALA/Hermes sciences publications, Paris.

Claveau V. (2003) Acquisition automatique de lexiques sémantiques pour la recherche d'information.  Thèse de l'Université de Rennes 1, décembre 2003 (http://olst.ling.umontreal.ca/~vincent/publis.html).

Fabre C. et Jacquemin C., (2000), "Boosting Variant Recognition with Light Semantics", actes de COLING (Computational Linguistics), Sarrebrück, août 2000 (voir sur ma page web à l’ERSS)

Galy E. (2000), Repérer en corpus les associations sémantiques privilégiées entre le nom et le verbe : le cas de la fonction dénotée par le nom, Mémoire de maîtrise en Sciences du langage, Université Toulouse-Le Mirail.

Montemagni S. et Pirelli V. (1998), « Augmenting WordNet-like Lexical Resources with Distributional Evidence. An Application-Oriented Perspective« , in S. Harabagiu, editor, Workshop on Use of WordNet in Natural Language Processing Systems: Proceedings of the Conference, pages 87-93. Association for Computational Linguistics

Vossen P. (1997), ‘EuroWordNet: a multilingual database for information retrieval’ In Proceedings of the DELOS workshop on Cross-language Information Retrieval, March 5-7, Zürich