framenet
DESCRIPTION
FrameNet. Théorie, Produit, Processus, Multilingualité et Connexio ns. FrameNet. Théorie: Frame Semantics Produit: Base de Frames Processus: Construction et utilisation d’un FrameNet Multilinguisme: Autres versions de FrameNet Connexions: Liens avec WordNet, VerbNet, PropBank. - PowerPoint PPT PresentationTRANSCRIPT
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
1
FrameNet
Théorie, Produit, Processus, Multilingualité et Connexions
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC2
FrameNet
• Théorie: Frame Semantics• Produit: Base de Frames• Processus: Construction et
utilisation d’un FrameNet• Multilinguisme: Autres versions de
FrameNet• Connexions: Liens avec WordNet,
VerbNet, PropBank
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC3
Frame Semantics
• (Fillmore, 1982), dérivée de la Case Grammar de Fillmore (1968)
• Une Frame est une structure d’arguments appelés Frame
Elements (≈rôles sémantiques) ou FEs associée à une description textuelle reliée à d’autres Frames dans un graphe
annoté par un nombre limité de relations
• Les types de FEs ne sont pas en nombre finis
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC4
Frame Semantics
• Un peu la même idée que la Grammaire de Construction: la langue n’est pas régie par quelques principes
généraux, mais par de nombreux/ses constructions/cadres
qui sont mis en relations
• 1 unité lexicale (LU) évoque 1 unique frame• 1 LU = 1 lemme associé à 1 sens (Cruse,
1986)• Chaque frame peut être associée à plusieurs
LU, de plusieurs types (nom, adj, verbe)
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC5
Frame Semantics
• Relations entre Frames Inheritance Using (point de vue, présupposition) Subframe (partie d‘une frame
complexe) Causative Inchoative (début d‘un événement) SeeAlso (lien non spécifié)
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC6
Frame Semantics
• Inheritance Une frame enfant est l’élaboration de la
frame parent Une enfant doit posséder au minimum
tous les subframes, FEs, et types sémantiques de son parent.
Exemple: Rewards and Punishment est le parent de Revenge
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC7
Frame Semantics
• Using Point de vue
Une perspective spécifique sur une frame Ex : Commerce_Sell et Commerce_Buy sont 2
points de vue sur Commerce_Goods_Transfer
Présupposition Un lien plus “encyclopédique”, un arrière-
plan nécessaire pour comprendre la frame, même s’il n’y a pas de lien
Ex: Volubility et Communication
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC8
Frame Semantics
• SubFrame Pour les frames décrivant des scénarios
complexes, dont les sous-éléments existent en tant que frame.
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC9
Frame Semantics
• Causative_of Le parent dénote la cause de l’état décrit par
l’enfant
• Inchoative_of Le parent dénote l’entrée dans l’état décrit par
l’enfant
• SeeAlso Quand un groupe de frames relativement
similaires doit être différencié avec précaution, chaque élément du groupe a un lien SeeAlso avec un représentant “central”
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC10
Frame Semantics
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC11
Frame Semantics
• Exemple : Commerce_Sell• Description :These are words describing basic commercial
transactions involving a buyer and a seller exchanging money and goods, taking the perspective of the seller. The words vary individually in the patterns of frame element realization they allow. For example, the typical patterns for SELL: SELLER sells GOODS to BUYER for MONEY. Robin sold a car to Abby for $5,000.
• Core FEs : SELLER, GOOD, BUYER• Non-Core FEs : DURATION(Duration), MANNER, MEANS,
MONEY, PLACE(Location), PURPOSE, PURPOSE_OF_GOODS, RATE, REASON, RELAY, RESULT, REVERSIVE, Time(Time), UNIT
• Relations : Inherits From: Giving Is Used By: Exporting Perspective on: Commerce_goods-transfer
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC12
Frame Semantics
• Unités Lexicales : lease.v, rent.v, retail.v, retailer.n, sale.n, sell.v, vend.v, vendor.n
• Voisinage :
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC13
Frame Semantics
• Types de FEs Core: arguments conceptuellement
nécessaires Peripheral: arguments précisant le concept
ex: MONEY, MEANS, PLACE
Extra-Thematic: arguments qui sont liés au Frame complet, pas uniquement au concept « central » ex: PURPOSE, REASON,RESULT
• Difficile de choisir dans certains cas (ex MONEY pourrait être Core)
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC14
Frame Semantics
• Pour résumer Frame = connaissance encyclopédique
liée au lexique Frame+FEs = comment cette
connaissance met en relation les arguments des unités lexicales qui “implémentent” la frame
Graphe de Frames = liens de généralisation entre connaissances
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC15
Construction d’un FrameNet
• Construire une base de donnée lexicale FrameNet, il faut d’abord avoir le graphe de Frames avec
les FEs (modifier les frames coûte très cher) Trouver ensuite les unités lexicales qui sont
liées à chaque Frame (on peut le faire progressivement)
relier à chaque unité lexicale (LU) des informations sur les instanciations grammaticales
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC16
Construction d’un FrameNet
• Technique originale (FN Anglais, Espagnol, Japonais): Choisir une LU, et chercher dans son
corpus des exemples à partir de motifs imaginés par le lexicographe
Annoter les phrases ainsi choisies avec les FEs
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC17
Construction d’un FrameNet
• Technique systématique (Allemand) Prendre phrases d’un corpus les unes après les
autres Trouver la Frame “centrale” Annoter
• Autres techniques (recherches en cours) Projection à partir d’annotation de
traductions ? Projection interlingue à partir d’un
entraînement sur les FEs ? Recherche des LU à partir de ressources
bilingues ?
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC18
Construction d’un FrameNet
• Annotation des anaphores, ellipses, etc. Les core FEs étant nécessaires, on ne
peut pas ne pas les annoter, pourtant ils sont parfois absents de la phrase (soit dans le contexte linguistique, soit dans le contexte implicite)
FrameNet introduit 3 étiquettes : CNI, DNI, INI
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC19
Construction d’un FrameNet
• CNI - Constructional Null Instanciation le FE est porté par la construction syntaxique “Get even [with her OFFENDER] [for this
INJURY]. [CNI AVENGER]”
• DNI - Definite Null Instanciation le FE est porté par le discours ou le contexte
de l’énonciation “[The monkey AVENGER] avenged [himself
INJURED_PARTY] [by growing to the size of a giant and setting fire to the city PUNISHMENT]. [DNI OFFENDER]”
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC20
Construction d’un FrameNet
• INI - Indefinite Null Instanciation le FE est porté par une valeur implicite,
connue encyclopédiquement “He takes and never gives back. [INI
THEME]
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC21
Construction d’un FrameNet
• Types de lemmes intéressants dans FrameNet Verbes Adjectifs Noms Expressions mots multiples
• Seuls sont utiles à décrire les LU ayant un aspect prédicatifs, c’est-à-dire qui décrivent un sens par composition d’arguments.
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC22
Construction d’un FrameNet
• Pas intéressant pour les choses et les genres naturels (cf. WordNet)
• Sémantiquement, FrameNet décrit les événements, les états, les relations et les propriétés
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC23
Construction d’un FrameNet
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC24
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC25
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC26
Utilisation de FrameNet
• La Frame Semantics a de forts liens avec la Grammaire de Construction Les informations constructionnelles
(Valence, Cadres de sous-catégorisation) servent de base à une GC.
Les liens entre Frames et le graphe de Frames peuvent partiellement être transformés en hiérarchies de constructions.
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC27
Utilisation de FrameNet
• Annotation automatique Entraînement à partir d’annotations
manuelles (Gildea & Jurafsky, 2000) Techniques de classification
(clusterisation sémantique + informations grammaticales)
Segmentation automatique des FEs
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC28
Utilisation de FrameNet
• Utilisation pour la résolution d’anaphores Riche description des rôles sémantiques Fonctionne aussi parfois pour les
anaphores nulles… Mais ne décrit pas la compatibilité
sémantique comme peut le faire WordNet
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC29
Utilisation de FrameNet
• Autres applications Questions/Réponses Systèmes de Dialogue (suffisamment
générique pour “traiter” le hors-domaine, mais facilement spécifiable, cf. SoccerFN & NukeFN)
Résumés (à vérifier..)
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC30
Statistiques sur FrameNet
• Version anglaise (développée depuis 1997)
• 739 Frames + 6054 Fes / 135000 phrases annotées
Total Fully annotated
Verbs 3847 2375
Nouns 3971 2411
Adjectives 1691 1126
Other 153 19
Total 9662 5931
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC31
Statistiques sur FrameNet
• Utilisateurs principaux : MIT, U Colorado*, Saarland U /DFKI* CMU, Edinburgh, HK Polytechnic, Keio*,
Nat U Singapore Baylor, HKUST, Leipzig, U College
Dublin, USC, U Sydney, U TX Dallas* & Austin*, Xiamen
* collab. FrameNet
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC32
Outils FrameNet
• Création FNDesktop (Berkeley) SALSA (Sarrebruck)
• Utilisation Automatic Labeler (devel) Gildea&Jurafsky Projection (devel) Pàdo
• APIs Stanford (limitée) Berkeley (très récente)
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC33
Outils FrameNet
(They didn‘t want to pay the move back because the employee had quit.)
Semantics:• Independent frames• Trees of depth one• One edge points to target, others to
frame elements
TIGER Syntax:• Node labels: constituents• Edge labels: gramm. functions• Crossing edges• POS
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC34
FrameNet Multilingue
• 4 langues déjà traitées Anglais américain Japonais (Keio & U Tokyo)
Corpus propre, outils de recherche Outils d’édition FN annotation/frame?
Espagnol (U A Barcelona) Lexicographique Corpus propre, FN software 81 Frames, 585 LUs, ~6,900 phrases annotées
Allemand (U Saarlandes) FN frames & FEs corpus propre (TIGER) et soft annotation Creation de LU “unknown” au besoin -> U Texas Austin 20K phrases
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC35
FrameNet Multilingue
• Projets en gestation Hebreux Chinois (projection BiFrameNet avec Hownet) Romance FrameNet
Projet lancé avril 2005 Plusieurs partenaires intéressés Besoin d’une structure dirigeante Et d’un support financier
Français (c’est nous) Recherche de techniques pour économiser du temps Mi-parcours de la phase préliminaire Susanne Alt, Benoît Crabbé, Laurent Romary
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC36
FrameNet Multilingue
• Graphe de Frames commun à plusieurs langues Cas problématiques:
un frame existe qui devrait être divisé. Ex. driving = aller en voiture en conduisant OU en étant conduit (en Allemand)
deux frames qui n’ont pas de parent
Des FE peuvent être Core ou pas (même problème: raffinement)
Questions techniques: pour l’Allemand = mots collés, verbes disloqués (?).
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC37
FrameNet Multilingue
• Romance FrameNet Conception collaborative et simultanée
d’un FN pour plusieurs langues (romanes) Idées proposées
Corpus traduit existant Traduction “contrainte” par la frame à annoter Plusieurs corpus traduits pour des sous-
ensembles de langue, projections avec techniques bilingues.
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC38
FrameNet Multilingue
• FrameNet français Annotation de 1000 phrases déjà
annotées en Anglais et Allemand (Europarl)
Récupération des tables du LADL Construction semi-automatisée de la
base de frames françisées Tentative d’annotation automatique en
utilisant un entrainement LSA sur corpus bilingue - utilisable aussi pour projection
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC39
FrameNet Multilingue
• Perspectives Plutôt un FN européen utilisant plusieurs
techniques récupération des travaux déjà effectués en
Espagnol et Allemand ne reposant pas sur une traduction N
langues, mais autorisant plusieurs traductions existantes bilingues
Intégration de WordNet, Lien avec les classes de Levin difficile
car propre à l’Anglais
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC40
Connexions
• PropBank Classification de Levin 300000 mots (WS Journal) Décrit les structures de valence pour
chaque lemme Pas de connaissance encyclopédique
(notamment pas de liens entre frames) Les rôles des structures de valence ne
sont pas corrélés entre eux hors de la classe de Levin
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC41
Connexions
• VerbNet Classes tirées des classes “intersectives” de
Levin Peuvent être plus ou moins corrélées à des
frames Dans Giuglea & Moschitti (2004), les classes de
VerbNet (par exemple Judgment) sont projetées dans plusieurs frames (Rewards and Punishments, Judgment Communication, Pardon, Arraignment, etc.)
Les projections sont faites par similarité de LU liées aux classes et ensuite par les motifs d’ “alternation”
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC42
Connexions
• WordNet Plusieurs synsets peuvent être reliés
aux FEs Potentiellement utile pour affiner les
descriptions de frames (usages typiques)
Utilisation envisageable pour l’annotation automatique
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC43
Connexions
• Dans le cadre de LIRICS (prg e-Contents) Développement d’un méta-modèle permettant
d’intégrer les 4 approches Outils d’annotation multilingue
Synchronisation des versions pour un développement collaboratif
Exportation d’anciennes données Etude de l’intégration d’outils statistiques pour
faciliter le développement • préannotation, • validation par annotation auto
Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC44
Journée d’étude
• JE ATALA le 13 mai• Deadline le 13 mars• Ressources pour un FrameNet
français