framenet

44
Guillaume Pitel (LED/LORI A) - 28/02/06 au GREYC 1 FrameNet Théorie, Produit, Processus, Multilingualité et Connexions

Upload: joyce

Post on 12-Jan-2016

45 views

Category:

Documents


0 download

DESCRIPTION

FrameNet. Théorie, Produit, Processus, Multilingualité et Connexio ns. FrameNet. Théorie: Frame Semantics Produit: Base de Frames Processus: Construction et utilisation d’un FrameNet Multilinguisme: Autres versions de FrameNet Connexions: Liens avec WordNet, VerbNet, PropBank. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

1

FrameNet

Théorie, Produit, Processus, Multilingualité et Connexions

Page 2: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC2

FrameNet

• Théorie: Frame Semantics• Produit: Base de Frames• Processus: Construction et

utilisation d’un FrameNet• Multilinguisme: Autres versions de

FrameNet• Connexions: Liens avec WordNet,

VerbNet, PropBank

Page 3: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC3

Frame Semantics

• (Fillmore, 1982), dérivée de la Case Grammar de Fillmore (1968)

• Une Frame est une structure d’arguments appelés Frame

Elements (≈rôles sémantiques) ou FEs associée à une description textuelle reliée à d’autres Frames dans un graphe

annoté par un nombre limité de relations

• Les types de FEs ne sont pas en nombre finis

Page 4: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC4

Frame Semantics

• Un peu la même idée que la Grammaire de Construction: la langue n’est pas régie par quelques principes

généraux, mais par de nombreux/ses constructions/cadres

qui sont mis en relations

• 1 unité lexicale (LU) évoque 1 unique frame• 1 LU = 1 lemme associé à 1 sens (Cruse,

1986)• Chaque frame peut être associée à plusieurs

LU, de plusieurs types (nom, adj, verbe)

Page 5: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC5

Frame Semantics

• Relations entre Frames Inheritance Using (point de vue, présupposition) Subframe (partie d‘une frame

complexe) Causative Inchoative (début d‘un événement) SeeAlso (lien non spécifié)

Page 6: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC6

Frame Semantics

• Inheritance Une frame enfant est l’élaboration de la

frame parent Une enfant doit posséder au minimum

tous les subframes, FEs, et types sémantiques de son parent.

Exemple: Rewards and Punishment est le parent de Revenge

Page 7: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC7

Frame Semantics

• Using Point de vue

Une perspective spécifique sur une frame Ex : Commerce_Sell et Commerce_Buy sont 2

points de vue sur Commerce_Goods_Transfer

Présupposition Un lien plus “encyclopédique”, un arrière-

plan nécessaire pour comprendre la frame, même s’il n’y a pas de lien

Ex: Volubility et Communication

Page 8: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC8

Frame Semantics

• SubFrame Pour les frames décrivant des scénarios

complexes, dont les sous-éléments existent en tant que frame.

Page 9: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC9

Frame Semantics

• Causative_of Le parent dénote la cause de l’état décrit par

l’enfant

• Inchoative_of Le parent dénote l’entrée dans l’état décrit par

l’enfant

• SeeAlso Quand un groupe de frames relativement

similaires doit être différencié avec précaution, chaque élément du groupe a un lien SeeAlso avec un représentant “central”

Page 10: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC10

Frame Semantics

Page 11: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC11

Frame Semantics

• Exemple : Commerce_Sell• Description :These are words describing basic commercial

transactions involving a buyer and a seller exchanging money and goods, taking the perspective of the seller. The words vary individually in the patterns of frame element realization they allow. For example, the typical patterns for SELL: SELLER sells GOODS to BUYER for MONEY. Robin sold a car to Abby for $5,000.

• Core FEs : SELLER, GOOD, BUYER• Non-Core FEs : DURATION(Duration), MANNER, MEANS,

MONEY, PLACE(Location), PURPOSE, PURPOSE_OF_GOODS, RATE, REASON, RELAY, RESULT, REVERSIVE, Time(Time), UNIT

• Relations : Inherits From: Giving Is Used By: Exporting Perspective on: Commerce_goods-transfer

Page 12: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC12

Frame Semantics

• Unités Lexicales : lease.v, rent.v, retail.v, retailer.n, sale.n, sell.v, vend.v, vendor.n

• Voisinage :

Page 13: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC13

Frame Semantics

• Types de FEs Core: arguments conceptuellement

nécessaires Peripheral: arguments précisant le concept

ex: MONEY, MEANS, PLACE

Extra-Thematic: arguments qui sont liés au Frame complet, pas uniquement au concept « central » ex: PURPOSE, REASON,RESULT

• Difficile de choisir dans certains cas (ex MONEY pourrait être Core)

Page 14: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC14

Frame Semantics

• Pour résumer Frame = connaissance encyclopédique

liée au lexique Frame+FEs = comment cette

connaissance met en relation les arguments des unités lexicales qui “implémentent” la frame

Graphe de Frames = liens de généralisation entre connaissances

Page 15: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC15

Construction d’un FrameNet

• Construire une base de donnée lexicale FrameNet, il faut d’abord avoir le graphe de Frames avec

les FEs (modifier les frames coûte très cher) Trouver ensuite les unités lexicales qui sont

liées à chaque Frame (on peut le faire progressivement)

relier à chaque unité lexicale (LU) des informations sur les instanciations grammaticales

Page 16: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC16

Construction d’un FrameNet

• Technique originale (FN Anglais, Espagnol, Japonais): Choisir une LU, et chercher dans son

corpus des exemples à partir de motifs imaginés par le lexicographe

Annoter les phrases ainsi choisies avec les FEs

Page 17: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC17

Construction d’un FrameNet

• Technique systématique (Allemand) Prendre phrases d’un corpus les unes après les

autres Trouver la Frame “centrale” Annoter

• Autres techniques (recherches en cours) Projection à partir d’annotation de

traductions ? Projection interlingue à partir d’un

entraînement sur les FEs ? Recherche des LU à partir de ressources

bilingues ?

Page 18: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC18

Construction d’un FrameNet

• Annotation des anaphores, ellipses, etc. Les core FEs étant nécessaires, on ne

peut pas ne pas les annoter, pourtant ils sont parfois absents de la phrase (soit dans le contexte linguistique, soit dans le contexte implicite)

FrameNet introduit 3 étiquettes : CNI, DNI, INI

Page 19: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC19

Construction d’un FrameNet

• CNI - Constructional Null Instanciation le FE est porté par la construction syntaxique “Get even [with her OFFENDER] [for this

INJURY]. [CNI AVENGER]”

• DNI - Definite Null Instanciation le FE est porté par le discours ou le contexte

de l’énonciation “[The monkey AVENGER] avenged [himself

INJURED_PARTY] [by growing to the size of a giant and setting fire to the city PUNISHMENT]. [DNI OFFENDER]”

Page 20: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC20

Construction d’un FrameNet

• INI - Indefinite Null Instanciation le FE est porté par une valeur implicite,

connue encyclopédiquement “He takes and never gives back. [INI

THEME]

Page 21: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC21

Construction d’un FrameNet

• Types de lemmes intéressants dans FrameNet Verbes Adjectifs Noms Expressions mots multiples

• Seuls sont utiles à décrire les LU ayant un aspect prédicatifs, c’est-à-dire qui décrivent un sens par composition d’arguments.

Page 22: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC22

Construction d’un FrameNet

• Pas intéressant pour les choses et les genres naturels (cf. WordNet)

• Sémantiquement, FrameNet décrit les événements, les états, les relations et les propriétés

Page 23: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC23

Construction d’un FrameNet

Page 24: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC24

Page 25: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC25

Page 26: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC26

Utilisation de FrameNet

• La Frame Semantics a de forts liens avec la Grammaire de Construction Les informations constructionnelles

(Valence, Cadres de sous-catégorisation) servent de base à une GC.

Les liens entre Frames et le graphe de Frames peuvent partiellement être transformés en hiérarchies de constructions.

Page 27: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC27

Utilisation de FrameNet

• Annotation automatique Entraînement à partir d’annotations

manuelles (Gildea & Jurafsky, 2000) Techniques de classification

(clusterisation sémantique + informations grammaticales)

Segmentation automatique des FEs

Page 28: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC28

Utilisation de FrameNet

• Utilisation pour la résolution d’anaphores Riche description des rôles sémantiques Fonctionne aussi parfois pour les

anaphores nulles… Mais ne décrit pas la compatibilité

sémantique comme peut le faire WordNet

Page 29: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC29

Utilisation de FrameNet

• Autres applications Questions/Réponses Systèmes de Dialogue (suffisamment

générique pour “traiter” le hors-domaine, mais facilement spécifiable, cf. SoccerFN & NukeFN)

Résumés (à vérifier..)

Page 30: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC30

Statistiques sur FrameNet

• Version anglaise (développée depuis 1997)

• 739 Frames + 6054 Fes / 135000 phrases annotées

Total Fully annotated

Verbs 3847 2375

Nouns 3971 2411

Adjectives 1691 1126

Other 153 19

Total 9662 5931

Page 31: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC31

Statistiques sur FrameNet

• Utilisateurs principaux : MIT, U Colorado*, Saarland U /DFKI* CMU, Edinburgh, HK Polytechnic, Keio*,

Nat U Singapore Baylor, HKUST, Leipzig, U College

Dublin, USC, U Sydney, U TX Dallas* & Austin*, Xiamen

* collab. FrameNet

Page 32: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC32

Outils FrameNet

• Création FNDesktop (Berkeley) SALSA (Sarrebruck)

• Utilisation Automatic Labeler (devel) Gildea&Jurafsky Projection (devel) Pàdo

• APIs Stanford (limitée) Berkeley (très récente)

Page 33: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC33

Outils FrameNet

(They didn‘t want to pay the move back because the employee had quit.)

Semantics:• Independent frames• Trees of depth one• One edge points to target, others to

frame elements

TIGER Syntax:• Node labels: constituents• Edge labels: gramm. functions• Crossing edges• POS

Page 34: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC34

FrameNet Multilingue

• 4 langues déjà traitées Anglais américain Japonais (Keio & U Tokyo)

Corpus propre, outils de recherche Outils d’édition FN annotation/frame?

Espagnol (U A Barcelona) Lexicographique Corpus propre, FN software 81 Frames, 585 LUs, ~6,900 phrases annotées

Allemand (U Saarlandes) FN frames & FEs corpus propre (TIGER) et soft annotation Creation de LU “unknown” au besoin -> U Texas Austin 20K phrases

Page 35: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC35

FrameNet Multilingue

• Projets en gestation Hebreux Chinois (projection BiFrameNet avec Hownet) Romance FrameNet

Projet lancé avril 2005 Plusieurs partenaires intéressés Besoin d’une structure dirigeante Et d’un support financier

Français (c’est nous) Recherche de techniques pour économiser du temps Mi-parcours de la phase préliminaire Susanne Alt, Benoît Crabbé, Laurent Romary

Page 36: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC36

FrameNet Multilingue

• Graphe de Frames commun à plusieurs langues Cas problématiques:

un frame existe qui devrait être divisé. Ex. driving = aller en voiture en conduisant OU en étant conduit (en Allemand)

deux frames qui n’ont pas de parent

Des FE peuvent être Core ou pas (même problème: raffinement)

Questions techniques: pour l’Allemand = mots collés, verbes disloqués (?).

Page 37: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC37

FrameNet Multilingue

• Romance FrameNet Conception collaborative et simultanée

d’un FN pour plusieurs langues (romanes) Idées proposées

Corpus traduit existant Traduction “contrainte” par la frame à annoter Plusieurs corpus traduits pour des sous-

ensembles de langue, projections avec techniques bilingues.

Page 38: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC38

FrameNet Multilingue

• FrameNet français Annotation de 1000 phrases déjà

annotées en Anglais et Allemand (Europarl)

Récupération des tables du LADL Construction semi-automatisée de la

base de frames françisées Tentative d’annotation automatique en

utilisant un entrainement LSA sur corpus bilingue - utilisable aussi pour projection

Page 39: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC39

FrameNet Multilingue

• Perspectives Plutôt un FN européen utilisant plusieurs

techniques récupération des travaux déjà effectués en

Espagnol et Allemand ne reposant pas sur une traduction N

langues, mais autorisant plusieurs traductions existantes bilingues

Intégration de WordNet, Lien avec les classes de Levin difficile

car propre à l’Anglais

Page 40: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC40

Connexions

• PropBank Classification de Levin 300000 mots (WS Journal) Décrit les structures de valence pour

chaque lemme Pas de connaissance encyclopédique

(notamment pas de liens entre frames) Les rôles des structures de valence ne

sont pas corrélés entre eux hors de la classe de Levin

Page 41: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC41

Connexions

• VerbNet Classes tirées des classes “intersectives” de

Levin Peuvent être plus ou moins corrélées à des

frames Dans Giuglea & Moschitti (2004), les classes de

VerbNet (par exemple Judgment) sont projetées dans plusieurs frames (Rewards and Punishments, Judgment Communication, Pardon, Arraignment, etc.)

Les projections sont faites par similarité de LU liées aux classes et ensuite par les motifs d’ “alternation”

Page 42: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC42

Connexions

• WordNet Plusieurs synsets peuvent être reliés

aux FEs Potentiellement utile pour affiner les

descriptions de frames (usages typiques)

Utilisation envisageable pour l’annotation automatique

Page 43: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC43

Connexions

• Dans le cadre de LIRICS (prg e-Contents) Développement d’un méta-modèle permettant

d’intégrer les 4 approches Outils d’annotation multilingue

Synchronisation des versions pour un développement collaboratif

Exportation d’anciennes données Etude de l’intégration d’outils statistiques pour

faciliter le développement • préannotation, • validation par annotation auto

Page 44: FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC44

Journée d’étude

• JE ATALA le 13 mai• Deadline le 13 mars• Ressources pour un FrameNet

français