framenet

Post on 12-Jan-2016

45 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

FrameNet. Théorie, Produit, Processus, Multilingualité et Connexio ns. FrameNet. Théorie: Frame Semantics Produit: Base de Frames Processus: Construction et utilisation d’un FrameNet Multilinguisme: Autres versions de FrameNet Connexions: Liens avec WordNet, VerbNet, PropBank. - PowerPoint PPT Presentation

TRANSCRIPT

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

1

FrameNet

Théorie, Produit, Processus, Multilingualité et Connexions

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC2

FrameNet

• Théorie: Frame Semantics• Produit: Base de Frames• Processus: Construction et

utilisation d’un FrameNet• Multilinguisme: Autres versions de

FrameNet• Connexions: Liens avec WordNet,

VerbNet, PropBank

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC3

Frame Semantics

• (Fillmore, 1982), dérivée de la Case Grammar de Fillmore (1968)

• Une Frame est une structure d’arguments appelés Frame

Elements (≈rôles sémantiques) ou FEs associée à une description textuelle reliée à d’autres Frames dans un graphe

annoté par un nombre limité de relations

• Les types de FEs ne sont pas en nombre finis

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC4

Frame Semantics

• Un peu la même idée que la Grammaire de Construction: la langue n’est pas régie par quelques principes

généraux, mais par de nombreux/ses constructions/cadres

qui sont mis en relations

• 1 unité lexicale (LU) évoque 1 unique frame• 1 LU = 1 lemme associé à 1 sens (Cruse,

1986)• Chaque frame peut être associée à plusieurs

LU, de plusieurs types (nom, adj, verbe)

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC5

Frame Semantics

• Relations entre Frames Inheritance Using (point de vue, présupposition) Subframe (partie d‘une frame

complexe) Causative Inchoative (début d‘un événement) SeeAlso (lien non spécifié)

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC6

Frame Semantics

• Inheritance Une frame enfant est l’élaboration de la

frame parent Une enfant doit posséder au minimum

tous les subframes, FEs, et types sémantiques de son parent.

Exemple: Rewards and Punishment est le parent de Revenge

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC7

Frame Semantics

• Using Point de vue

Une perspective spécifique sur une frame Ex : Commerce_Sell et Commerce_Buy sont 2

points de vue sur Commerce_Goods_Transfer

Présupposition Un lien plus “encyclopédique”, un arrière-

plan nécessaire pour comprendre la frame, même s’il n’y a pas de lien

Ex: Volubility et Communication

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC8

Frame Semantics

• SubFrame Pour les frames décrivant des scénarios

complexes, dont les sous-éléments existent en tant que frame.

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC9

Frame Semantics

• Causative_of Le parent dénote la cause de l’état décrit par

l’enfant

• Inchoative_of Le parent dénote l’entrée dans l’état décrit par

l’enfant

• SeeAlso Quand un groupe de frames relativement

similaires doit être différencié avec précaution, chaque élément du groupe a un lien SeeAlso avec un représentant “central”

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC10

Frame Semantics

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC11

Frame Semantics

• Exemple : Commerce_Sell• Description :These are words describing basic commercial

transactions involving a buyer and a seller exchanging money and goods, taking the perspective of the seller. The words vary individually in the patterns of frame element realization they allow. For example, the typical patterns for SELL: SELLER sells GOODS to BUYER for MONEY. Robin sold a car to Abby for $5,000.

• Core FEs : SELLER, GOOD, BUYER• Non-Core FEs : DURATION(Duration), MANNER, MEANS,

MONEY, PLACE(Location), PURPOSE, PURPOSE_OF_GOODS, RATE, REASON, RELAY, RESULT, REVERSIVE, Time(Time), UNIT

• Relations : Inherits From: Giving Is Used By: Exporting Perspective on: Commerce_goods-transfer

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC12

Frame Semantics

• Unités Lexicales : lease.v, rent.v, retail.v, retailer.n, sale.n, sell.v, vend.v, vendor.n

• Voisinage :

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC13

Frame Semantics

• Types de FEs Core: arguments conceptuellement

nécessaires Peripheral: arguments précisant le concept

ex: MONEY, MEANS, PLACE

Extra-Thematic: arguments qui sont liés au Frame complet, pas uniquement au concept « central » ex: PURPOSE, REASON,RESULT

• Difficile de choisir dans certains cas (ex MONEY pourrait être Core)

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC14

Frame Semantics

• Pour résumer Frame = connaissance encyclopédique

liée au lexique Frame+FEs = comment cette

connaissance met en relation les arguments des unités lexicales qui “implémentent” la frame

Graphe de Frames = liens de généralisation entre connaissances

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC15

Construction d’un FrameNet

• Construire une base de donnée lexicale FrameNet, il faut d’abord avoir le graphe de Frames avec

les FEs (modifier les frames coûte très cher) Trouver ensuite les unités lexicales qui sont

liées à chaque Frame (on peut le faire progressivement)

relier à chaque unité lexicale (LU) des informations sur les instanciations grammaticales

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC16

Construction d’un FrameNet

• Technique originale (FN Anglais, Espagnol, Japonais): Choisir une LU, et chercher dans son

corpus des exemples à partir de motifs imaginés par le lexicographe

Annoter les phrases ainsi choisies avec les FEs

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC17

Construction d’un FrameNet

• Technique systématique (Allemand) Prendre phrases d’un corpus les unes après les

autres Trouver la Frame “centrale” Annoter

• Autres techniques (recherches en cours) Projection à partir d’annotation de

traductions ? Projection interlingue à partir d’un

entraînement sur les FEs ? Recherche des LU à partir de ressources

bilingues ?

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC18

Construction d’un FrameNet

• Annotation des anaphores, ellipses, etc. Les core FEs étant nécessaires, on ne

peut pas ne pas les annoter, pourtant ils sont parfois absents de la phrase (soit dans le contexte linguistique, soit dans le contexte implicite)

FrameNet introduit 3 étiquettes : CNI, DNI, INI

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC19

Construction d’un FrameNet

• CNI - Constructional Null Instanciation le FE est porté par la construction syntaxique “Get even [with her OFFENDER] [for this

INJURY]. [CNI AVENGER]”

• DNI - Definite Null Instanciation le FE est porté par le discours ou le contexte

de l’énonciation “[The monkey AVENGER] avenged [himself

INJURED_PARTY] [by growing to the size of a giant and setting fire to the city PUNISHMENT]. [DNI OFFENDER]”

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC20

Construction d’un FrameNet

• INI - Indefinite Null Instanciation le FE est porté par une valeur implicite,

connue encyclopédiquement “He takes and never gives back. [INI

THEME]

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC21

Construction d’un FrameNet

• Types de lemmes intéressants dans FrameNet Verbes Adjectifs Noms Expressions mots multiples

• Seuls sont utiles à décrire les LU ayant un aspect prédicatifs, c’est-à-dire qui décrivent un sens par composition d’arguments.

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC22

Construction d’un FrameNet

• Pas intéressant pour les choses et les genres naturels (cf. WordNet)

• Sémantiquement, FrameNet décrit les événements, les états, les relations et les propriétés

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC23

Construction d’un FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC24

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC25

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC26

Utilisation de FrameNet

• La Frame Semantics a de forts liens avec la Grammaire de Construction Les informations constructionnelles

(Valence, Cadres de sous-catégorisation) servent de base à une GC.

Les liens entre Frames et le graphe de Frames peuvent partiellement être transformés en hiérarchies de constructions.

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC27

Utilisation de FrameNet

• Annotation automatique Entraînement à partir d’annotations

manuelles (Gildea & Jurafsky, 2000) Techniques de classification

(clusterisation sémantique + informations grammaticales)

Segmentation automatique des FEs

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC28

Utilisation de FrameNet

• Utilisation pour la résolution d’anaphores Riche description des rôles sémantiques Fonctionne aussi parfois pour les

anaphores nulles… Mais ne décrit pas la compatibilité

sémantique comme peut le faire WordNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC29

Utilisation de FrameNet

• Autres applications Questions/Réponses Systèmes de Dialogue (suffisamment

générique pour “traiter” le hors-domaine, mais facilement spécifiable, cf. SoccerFN & NukeFN)

Résumés (à vérifier..)

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC30

Statistiques sur FrameNet

• Version anglaise (développée depuis 1997)

• 739 Frames + 6054 Fes / 135000 phrases annotées

Total Fully annotated

Verbs 3847 2375

Nouns 3971 2411

Adjectives 1691 1126

Other 153 19

Total 9662 5931

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC31

Statistiques sur FrameNet

• Utilisateurs principaux : MIT, U Colorado*, Saarland U /DFKI* CMU, Edinburgh, HK Polytechnic, Keio*,

Nat U Singapore Baylor, HKUST, Leipzig, U College

Dublin, USC, U Sydney, U TX Dallas* & Austin*, Xiamen

* collab. FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC32

Outils FrameNet

• Création FNDesktop (Berkeley) SALSA (Sarrebruck)

• Utilisation Automatic Labeler (devel) Gildea&Jurafsky Projection (devel) Pàdo

• APIs Stanford (limitée) Berkeley (très récente)

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC33

Outils FrameNet

(They didn‘t want to pay the move back because the employee had quit.)

Semantics:• Independent frames• Trees of depth one• One edge points to target, others to

frame elements

TIGER Syntax:• Node labels: constituents• Edge labels: gramm. functions• Crossing edges• POS

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC34

FrameNet Multilingue

• 4 langues déjà traitées Anglais américain Japonais (Keio & U Tokyo)

Corpus propre, outils de recherche Outils d’édition FN annotation/frame?

Espagnol (U A Barcelona) Lexicographique Corpus propre, FN software 81 Frames, 585 LUs, ~6,900 phrases annotées

Allemand (U Saarlandes) FN frames & FEs corpus propre (TIGER) et soft annotation Creation de LU “unknown” au besoin -> U Texas Austin 20K phrases

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC35

FrameNet Multilingue

• Projets en gestation Hebreux Chinois (projection BiFrameNet avec Hownet) Romance FrameNet

Projet lancé avril 2005 Plusieurs partenaires intéressés Besoin d’une structure dirigeante Et d’un support financier

Français (c’est nous) Recherche de techniques pour économiser du temps Mi-parcours de la phase préliminaire Susanne Alt, Benoît Crabbé, Laurent Romary

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC36

FrameNet Multilingue

• Graphe de Frames commun à plusieurs langues Cas problématiques:

un frame existe qui devrait être divisé. Ex. driving = aller en voiture en conduisant OU en étant conduit (en Allemand)

deux frames qui n’ont pas de parent

Des FE peuvent être Core ou pas (même problème: raffinement)

Questions techniques: pour l’Allemand = mots collés, verbes disloqués (?).

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC37

FrameNet Multilingue

• Romance FrameNet Conception collaborative et simultanée

d’un FN pour plusieurs langues (romanes) Idées proposées

Corpus traduit existant Traduction “contrainte” par la frame à annoter Plusieurs corpus traduits pour des sous-

ensembles de langue, projections avec techniques bilingues.

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC38

FrameNet Multilingue

• FrameNet français Annotation de 1000 phrases déjà

annotées en Anglais et Allemand (Europarl)

Récupération des tables du LADL Construction semi-automatisée de la

base de frames françisées Tentative d’annotation automatique en

utilisant un entrainement LSA sur corpus bilingue - utilisable aussi pour projection

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC39

FrameNet Multilingue

• Perspectives Plutôt un FN européen utilisant plusieurs

techniques récupération des travaux déjà effectués en

Espagnol et Allemand ne reposant pas sur une traduction N

langues, mais autorisant plusieurs traductions existantes bilingues

Intégration de WordNet, Lien avec les classes de Levin difficile

car propre à l’Anglais

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC40

Connexions

• PropBank Classification de Levin 300000 mots (WS Journal) Décrit les structures de valence pour

chaque lemme Pas de connaissance encyclopédique

(notamment pas de liens entre frames) Les rôles des structures de valence ne

sont pas corrélés entre eux hors de la classe de Levin

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC41

Connexions

• VerbNet Classes tirées des classes “intersectives” de

Levin Peuvent être plus ou moins corrélées à des

frames Dans Giuglea & Moschitti (2004), les classes de

VerbNet (par exemple Judgment) sont projetées dans plusieurs frames (Rewards and Punishments, Judgment Communication, Pardon, Arraignment, etc.)

Les projections sont faites par similarité de LU liées aux classes et ensuite par les motifs d’ “alternation”

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC42

Connexions

• WordNet Plusieurs synsets peuvent être reliés

aux FEs Potentiellement utile pour affiner les

descriptions de frames (usages typiques)

Utilisation envisageable pour l’annotation automatique

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC43

Connexions

• Dans le cadre de LIRICS (prg e-Contents) Développement d’un méta-modèle permettant

d’intégrer les 4 approches Outils d’annotation multilingue

Synchronisation des versions pour un développement collaboratif

Exportation d’anciennes données Etude de l’intégration d’outils statistiques pour

faciliter le développement • préannotation, • validation par annotation auto

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC44

Journée d’étude

• JE ATALA le 13 mai• Deadline le 13 mars• Ressources pour un FrameNet

français

top related