extraire et représenter des déplacements : à partir …...extraire et représenter des...

79
[email protected] 04/03/2016 Extraire et représenter des déplacements : à partir de descriptions textuelles Mauro Gaio

Upload: others

Post on 10-Jul-2020

10 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

[email protected] 04/03/2016

Extraire et représenter des déplacements :à partir de descriptions textuelles

Mauro Gaio

Page 2: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 2/38

ProblématiqueLes déplacements décrits textuellement

Où :

Publications scientifiques géographiques, historiques, géologiques, . . .Publications grands publiques quotidiens, mensuels, guides, . . .Œuvres littéraires récits fictionnels, récits vécus, . . .

Avec quoi,(plusieurs catégories lexicales) :

Verbes déplacer, entrer, arriver, . . .Adverbes lentement, progressivement, . . .Prépositions par, jusqu’à, autour, . . .Adjectifs glissant, grimpant, ascensionnel, . . .Noms communs départ, pause, . . .Constructions syntaxiques [V Pré], [V Pré SN],

[SN V Pré SN] . . .

Page 3: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 2/38

ProblématiqueLes déplacements décrits textuellement

Où :

Publications scientifiques géographiques, historiques, géologiques, . . .Publications grands publiques quotidiens, mensuels, guides, . . .Œuvres littéraires récits fictionnels, récits vécus, . . .

Avec quoi,(plusieurs catégories lexicales) :

Verbes déplacer, entrer, arriver, . . .Adverbes lentement, progressivement, . . .Prépositions par, jusqu’à, autour, . . .Adjectifs glissant, grimpant, ascensionnel, . . .Noms communs départ, pause, . . .Constructions syntaxiques [V Pré], [V Pré SN],

[SN V Pré SN] . . .

Lesquels :les itinéraires enmilieu ouvert

Page 4: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 3/38

Contexte expérimentalDans des récits de voyage

Page 5: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 3/38

Contexte expérimentalDans des récits de voyage

Page 6: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 3/38

Contexte expérimentalDans des récits de voyage

Page 7: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 3/38

Contexte expérimentalDans des récits de voyage

Page 8: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 3/38

Contexte expérimentalDans des récits de voyage

Page 9: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 3/38

Contexte expérimentalDans des récits de voyage

Page 10: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 4/38

Contexte expérimentalOu alors des descriptions d’itinéraires pour randonnée

Page 11: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 4/38

Contexte expérimentalOu alors des descriptions d’itinéraires pour randonnée

Page 12: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 4/38

Contexte expérimentalOu alors des descriptions d’itinéraires pour randonnée

Page 13: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 4/38

Contexte expérimentalOu alors des descriptions d’itinéraires pour randonnée

Page 14: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 4/38

Contexte expérimentalOu alors des descriptions d’itinéraires pour randonnée

Page 15: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 4/38

Contexte expérimentalOu alors des descriptions d’itinéraires pour randonnée

Page 16: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 5/38

Exemple de finalité pratiqueUne forme de résumé universel

Page 17: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 6/38

Plan de l’exposéPar objectifs :

Modélisation computationelle de l’itinéraire

• quelles connaissances interdisciplinaires pour quel modèleopératoire ?

Annotation (automatique) des informations dans les textes

• quelles étapes et quel langage support pour quelleinformation ?

Utilisabilité

• quelques exemples d’expérimentations (outil d’annotation,désambiguïsation, reconstruction de l’itinéraire)

Page 18: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements 04/03/2016 – 7/38

PLA

N 1 Modélisation computationelle de l’itiné-raire

2 Annotation (automatique) des informa-tions dans le textes

3 Utilisabilité : quelques exemples

Page 19: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 8/38

BackgroundLinguistique, psycho-linguistique, sciences cognitives et TAL

Comment localiser avec la langue ?• « Figure / Fond » (Talmy, 1985 ; Vandeloise, 1986)

• Entité à localiser ou qui se déplacefigure, target/cible

• Entité de référence ou entité par rapport à laquelle la figure se déplaceground/fond, site

• Entités Nommées• Nombreuses Typologies : personnes, lieux, organnisations, . . . (Tran, 2006 ;

Ehrmann 2008)• Méthodes pour la reconnaissance et la classification automatique

(Nadeau and Sekine, 2007 ; Friburger and Maurel, 2004)

. . . hameau des Fontanettes. . .

. . . le territoire aride au sud de la région d’Aragon. . .

. . . nous descendîmes vers le pied de la Maadetta . . .

Page 20: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 9/38

BackgroundLinguistique, psycho-linguistique, sciences cognitives et TAL

Comment évoquer la dynamique de la Spatialité ?

• Les langues à cadre verbal : changement de lieu dans le verbe 1 (Talmy,1991 ; Kopecka, 2009 ; Aurnague and Vieu, 2015)

• Le concept d’aspect du verbe (O. Ducrot et T. Todorov, 1972)• manifestation dans le temps de l’action (ou de la qualité) ;

Indique de la façon dont elle remplit la période concernée par l’énonciation.

• 2 catégories aspectuelles :• les verbes imperfectifs : l’arrêt de l’action ou de l’état ne détermine pas une

situation nouvelle marcher, grimper, voir, observer, . . .• les verbes perfectifs : après l’arrêt une nouvelle situation s’ouvre arriver,

partir, identifier, reconnaître, . . .

À Pralognan suivre la route. . .On parvient au refuge du col de la Vanoise.

1. les langues à satellite exprimant cette notion dans un morphème associé au verbe

Page 21: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 10/38

BackgroundLinguistique, psycho-linguistique, sciences cognitives et TAL

Verbe de mouvement, Préposition locative et leurs interactions• Fonctionnement et typologie des verbes (Tesnière 1959 ; Boons, 1987 ; Muller,

1998 ; Sarda, 1999)• notamment verbes de déplacement vs mouvement

. . . se rendre, partir, marcher . . .

. . . s’agenouiller, se plier, s’étirer . . .

• Combinatoire de ces verbes avec différents types de prépositions(Boons, 1997 ; Laur 1993, Asher & Sablayrolles 1996, Kopecka 2009)

• en particulier notion de polarité aspectuelle : initiale (sortir de), mediane(traverser par), finale (entrer dans)

. . . passer sur le pont du Chanton. . .

. . . on parvient au Lac des Vaches que l’on traverse sur des rochers.

. . . ne pas partir vers la Pointe du Creux Noir.

Page 22: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 11/38

BackgroundLinguistique, psycho-linguistique, sciences cognitives et TAL

Et l’itinéraire dans tout ça ?

• Les bases conceptuelles sont posées par M Denis (Denis, 1997)

• Confirmées et affinées par de nombreux travaux (Brosset et al., 2008 ;Sajakovsky et al. 2011 ; Kettunen et al., 2014)

Les éléments clefs

• point de repèrelandmark

• point de passage (relais ou étape)waypoint or decision point

• action (activité)instruction

• autres(commentaire, observation, description) . . .comment

Page 23: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 11/38

BackgroundLinguistique, psycho-linguistique, sciences cognitives et TAL

Et l’itinéraire dans tout ça ?

• Les bases conceptuelles sont posées par M Denis (Denis, 1997)

• Confirmées et affinées par de nombreux travaux (Brosset et al., 2008 ;Sajakovsky et al. 2011 ; Kettunen et al., 2014)

Les éléments clefs

• point de repèrelandmark

• point de passage (relais ou étape)waypoint or decision point

• action (activité)instruction

• autres(commentaire, observation, description) . . .comment

Page 24: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 11/38

BackgroundLinguistique, psycho-linguistique, sciences cognitives et TAL

Et l’itinéraire dans tout ça ?

• Les bases conceptuelles sont posées par M Denis (Denis, 1997)

• Confirmées et affinées par de nombreux travaux (Brosset et al., 2008 ;Sajakovsky et al. 2011 ; Kettunen et al., 2014)

Les éléments clefs

• point de repèrelandmark

• point de passage (relais ou étape)waypoint or decision point

• action (activité)instruction

• autres(commentaire, observation, description) . . .comment

Page 25: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 11/38

BackgroundLinguistique, psycho-linguistique, sciences cognitives et TAL

Et l’itinéraire dans tout ça ?

• Les bases conceptuelles sont posées par M Denis (Denis, 1997)

• Confirmées et affinées par de nombreux travaux (Brosset et al., 2008 ;Sajakovsky et al. 2011 ; Kettunen et al., 2014)

Les éléments clefs

• point de repèrelandmark

• point de passage (relais ou étape)waypoint or decision point

• action (activité)instruction

• autres(commentaire, observation, description) . . .comment

Page 26: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 11/38

BackgroundLinguistique, psycho-linguistique, sciences cognitives et TAL

Et l’itinéraire dans tout ça ?

• Les bases conceptuelles sont posées par M Denis (Denis, 1997)

• Confirmées et affinées par de nombreux travaux (Brosset et al., 2008 ;Sajakovsky et al. 2011 ; Kettunen et al., 2014)

Les éléments clefs

• point de repèrelandmark

• point de passage (relais ou étape)waypoint or decision point

• action (activité)instruction

• autres(commentaire, observation, description) . . .comment

Page 27: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 12/38

Modélisation computationelle de l’itinéraire

Modèle conceptuel de l’itinéraire (Loustau, 2008) avec MADS (Parent & al., 2006)

Page 28: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements 04/03/2016 – 13/38

PLA

N 1 Modélisation computationelle de l’itiné-raire

2 Annotation (automatique) des informa-tions dans le textes

Parser et « Géoparser » le texteLangage d’annotation « multi-couche »

3 Utilisabilité : quelques exemples

Page 29: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 14/38

Parser ?

Opération qui suppose une formalisation du texte, par un ensemble derègles de syntaxe formant une grammaire formelle.

La structure révélée par l’analyse donne alors précisément la façon dontles règles de syntaxe sont combinées dans le texte.

Cette structure est souvent une hiérarchie de syntagmes, représentablepar un arbre syntaxique dont les nœuds peuvent être décorés (dotésd’informations complémentaires).

Page 30: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 15/38

Parser le texteEntité Nommée Étendue (ENE)

Deux catégories : “Pure” et “Descriptive” (Jonasson, 1994)

Pure : niveau 0(1) Florence

Extension Descriptive : niveau 1

(2) il sindaco��

di Venezia

Extension Descriptive : niveau 2

(3) Parque Natural del��

Delta del Ebro

Extension Descriptive : Niveau 3

(4) the owner of

��

the restaurant of Neuvic Lake

Page 31: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 15/38

Parser le texteEntité Nommée Étendue (ENE)

Deux catégories : “Pure” et “Descriptive” (Jonasson, 1994)

Pure : niveau 0(1) Florence

Extension Descriptive : niveau 1

(2) il sindaco��

di Venezia

Extension Descriptive : niveau 2

(3) Parque Natural del��

Delta del Ebro

Extension Descriptive : Niveau 3

(4) the owner of

��

the restaurant of Neuvic Lake

Page 32: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 15/38

Parser le texteEntité Nommée Étendue (ENE)

Deux catégories : “Pure” et “Descriptive” (Jonasson, 1994)

Pure : niveau 0(1) Florence

Extension Descriptive : niveau 1

(2) il sindaco��

di Venezia

Extension Descriptive : niveau 2

(3) Parque Natural del��

Delta del Ebro

Extension Descriptive : Niveau 3

(4) the owner of

��

the restaurant of Neuvic Lake

Page 33: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 15/38

Parser le texteEntité Nommée Étendue (ENE)

Deux catégories : “Pure” et “Descriptive” (Jonasson, 1994)

Pure : niveau 0(1) Florence

Extension Descriptive : niveau 1

(2) il sindaco��

di Venezia

Extension Descriptive : niveau 2

(3) Parque Natural del��

Delta del Ebro

Extension Descriptive : Niveau 3

(4) the owner of

��

the restaurant of Neuvic Lake

Page 34: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 16/38

Géoparser le texteEntité Spatiale Nommée Étendue (ESNE)

Deux catégories (Gaio et al. 2012, Moncla et al., 2014)

Absolue(5) Pau

(6) gave de��

Pau

(7) les rives du gave de��

Pau

Relative(8) le sud de Pau

(9) la rive droite du gave de��

Pau

(10) proche de la rive droite du gave de��

Pau

Page 35: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 17/38

Parser les Constructions LocativesStructure syntaxique simple

Les structures VT (Gaio et al. 2012)

Constat : plusieurs constructions locatives dans lesquelles unecombinaison Verbe, Prép, SN apparaît.

Choix : la structure syntaxique la plus fréquente (en français)[Verbe,Grp.Prepositionnel∗, SyntagmeNominal]

« Toponyme » utilisé par convenance avec un sens plus large pour faire apparaître larécursivité. Désormais rebaptisé : Entité Spatiale Nommée Étendue (ESNE)

Page 36: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 18/38

Parser les Constructions LocativesVue d’ensemble de la structure VT

Page 37: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 19/38

Encoder l’annotation des structures locativesPersonnalisation d’un ML

Que choisir ? Avec à minima 3 objectifs

• conférer plus de cohérence lors du traitement d’un corpus multilinguesentrelacé

• disposer de différents points de vue sur un même document• promouvoir une sorte de format d’annotation standard pour établir

des corpus de référence

Page 38: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 19/38

Encoder l’annotation des structures locativesPersonnalisation d’un ML

Que choisir ? Avec à minima 3 objectifs

• GML, KML, . . .à exclure car conçus pour l’encodage des données spatiales

• SpatialML ou ISO-Spacetrop spécialisés info. spatiale ou spatio-temporelle et difficilementadaptables aux humanités numériques

• Notre choix la personnalisation de TEI• un ensemble de directives fournissant des méthodes de codage• personnalisable grâce à ODD ou à d’autres langages XML de

spécification (DTD, Xml-Schema, RELAX NG)

Page 39: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 20/38

Personnalisation de TEIAnnotation cohérente sur des textes multilingues

Page 40: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 21/38

Personnalisation de TEIDifférents points de vue sur un seul document

Page 41: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 22/38

Personnalisation de TEISegmentation du texte : morpho-syntaxe + sémantique très locale

Un tout petit sous-ensemble des balises TEI

Éléments du texte Balise Attributphrase (sentence) <s>

mot (word) <w> lemma, type (POS), sub-type (sémantique)

ponctuation <pc> force, typesyntagme (phrase) <phr> type, subtype, function

Page 42: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 22/38

Personnalisation de TEISegmentation du texte : morpho-syntaxe + sémantique très locale

Un tout petit sous-ensemble des balises TEI

Page 43: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 23/38

Personnalisation de TEI : couche génériqueEntité Nommée Étendue (ENE)

Une catégorisation à base d’une sémantique « générique »

Essentiellement 3 balises TEIBalise Attribue

type subtype

<name>cat. Entité Nommée(lieu, personne, org, . . . )

sous cat. sémantique(Non de rue, acronyme,. . . )

<term> N, offset, mesure

sous cat. sémantique(morpho.,orientation, direction,unité de mesure, . . . )

<rs>expandedName, rela-tive, sequence, . . .

Page 44: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 24/38

Personnalisation de TEI : couche génériqueEntité Nommée Étendue (ENE) : avec encapsulation

active

Page 45: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 24/38

Personnalisation de TEI : couche génériqueEntité Nommée Étendue (ENE) : avec encapsulation

passive

Page 46: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 25/38

Vers des (sur)couches spécialiséesVue d’ensemble

Spécialisation des certains éléments génériques

Élements du texte Couche générique Couche Geospatialerelations spatiales ettemporelles relations <term>

<offset>

exp. de mesures <measure>extension de l’ENE <geogFeat>

ENE (level > 0) <rs><geogName><placeName>

<place>

1 Ajout d’attributs pour encoder la sémantique• type, soustype, fonction, . . .

2 Ajout de nouvelles balises (ex : pour inclure des ressources externes)• <location>, <geo>, . . .

3 ajout d’une balise pour encoder l’incertitude• <certainty>

Page 47: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 25/38

Vers des (sur)couches spécialiséesVue d’ensemble

Spécialisation des certains éléments génériques

Élements du texte Couche générique Couche Geospatialerelations spatiales ettemporelles relations <term>

<offset>

exp. de mesures <measure>extension de l’ENE <geogFeat>

ENE (level > 0) <rs><geogName><placeName>

<place>

1 Ajout d’attributs pour encoder la sémantique• type, soustype, fonction, . . .

2 Ajout de nouvelles balises (ex : pour inclure des ressources externes)• <location>, <geo>, . . .

3 ajout d’une balise pour encoder l’incertitude• <certainty>

Page 48: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 25/38

Vers des (sur)couches spécialiséesVue d’ensemble

Spécialisation des certains éléments génériques

Élements du texte Couche générique Couche Geospatialerelations spatiales ettemporelles relations <term>

<offset>

exp. de mesures <measure>extension de l’ENE <geogFeat>

ENE (level > 0) <rs><geogName><placeName>

<place>

1 Ajout d’attributs pour encoder la sémantique• type, soustype, fonction, . . .

2 Ajout de nouvelles balises (ex : pour inclure des ressources externes)• <location>, <geo>, . . .

3 ajout d’une balise pour encoder l’incertitude• <certainty>

Page 49: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 25/38

Vers des (sur)couches spécialiséesVue d’ensemble

Spécialisation des certains éléments génériques

Élements du texte Couche générique Couche Geospatialerelations spatiales ettemporelles relations <term>

<offset>

exp. de mesures <measure>extension de l’ENE <geogFeat>

ENE (level > 0) <rs><geogName><placeName>

<place>

1 Ajout d’attributs pour encoder la sémantique• type, soustype, fonction, . . .

2 Ajout de nouvelles balises (ex : pour inclure des ressources externes)• <location>, <geo>, . . .

3 ajout d’une balise pour encoder l’incertitude• <certainty>

Page 50: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 25/38

Vers des (sur)couches spécialiséesVue d’ensemble

Spécialisation des certains éléments génériques

Élements du texte Couche générique Couche Geospatialerelations spatiales ettemporelles relations <term>

<offset>

exp. de mesures <measure>extension de l’ENE <geogFeat>

ENE (level > 0) <rs><geogName><placeName>

<place>

1 Ajout d’attributs pour encoder la sémantique• type, soustype, fonction, . . .

2 Ajout de nouvelles balises (ex : pour inclure des ressources externes)• <location>, <geo>, . . .

3 ajout d’une balise pour encoder l’incertitude• <certainty>

Page 51: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 26/38

Vers une (sur)couche spécialisée ESNEExemple : la balise <geogFeat>

Encodage d’une ESNE (1)

• <term type="N"> est encapsulé dans la balise <geogFeat>

river Ribble

<w lemma="the" type="DET">the</w><term type="N" ><w lemma="river" type="N">river</w>

</term><name><w type="NPr">Ribble</w>

</name>

<w lemma="the" type="DET">the</w><geogFeat>

<term type="N" stype="morphological"><w lemma="river" type="N">river</w>

</term></geogFeat><name>

<w type="NPr">Ribble</w></name>

Page 52: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 27/38

Vers une (sur)couche spécialisée ESNEExemple : les balises <geogName> et <placeName>

Encodage d’une ESNE (2)

• <rs type="expandedName"> devient <geogName> ainsiqu’un <placeName> ESNE absolue ou relative

• <rs type="expandedName"> devient <placeName type="absolue">• <rs type="relative"> devient <placeName type="relative">

Page 53: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 28/38

Vers une (sur)couche spécialisée ESNEExemple : les balises <geogName> et <placeName>

After 1km the river Ribble<rs is="rs2" n="1" type="relative"><term type="offset"

stype="direction"><w lemma="after"

type="PREP">After</w></term><term type="measure"><w lemma="1" type="NUM" >1</w><w lemma="kilometer" type="SYM"

>km</w></term><w lemma="the" type="DET">the</w>

<rs id="rs1" n="1" type="expandedName"<term type="N" stype="morpho"><w lemma="river" type="N">river</w>

</term><name><w type="NPr">Ribble</w>

</name></rs>

</rs>

<geogName type="H" subtype="STM" n="1"><geogFeat>

<w lemma="river" type="N">river</w></geogFeat><w lemma="the" type="DET" >the</w><name>

<w type="NPr">Ribble</w></name></geogName>

Page 54: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 29/38

Vers une (sur)couche spécialisée ESNEExemple : les balises <geogName> et <placeName>

After 1km the river Ribble<rs is="rs2" n="1" type="relative"><term type="offset"

stype="direction"><w lemma="after"

type="PREP">After</w></term><term type="measure"><w lemma="1" type="NUM" >1</w><w lemma="kilometer" type="SYM"

>km</w></term><w lemma="the" type="DET">the</w>

<rs id="rs1" n="1" type="expandedName"<term type="N" stype="morpho"><w lemma="river" type="N">river</w>

</term><name><w type="NPr">Ribble</w>

</name></rs>

</rs>

<placeName type="relative"><offset type="direction" ><w lemma="after"

type="PREP">After</w></offset><measure type="distance" un i t="km"

quantity="1"><w lemma="1" type="NUM" >1</w>

<w lemma="kilometer" type="SYM">km</w>

</measure<geogName type="H" subtype="STM" n="1"><geogFeat><w lemma="river" type="N">river</w>

</geogFeat><w lemma="the" type="DET" >the</w><name><w type="NPr">Ribble</w>

</name></geogName>

</placeName>

Page 55: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 30/38

Vers une (sur)couche spécialisée ESNEExemple : prise en compte des différences entre Français and Allemand

cabane du Tracuit (FR)

<geogName><geogFeat>

<w lemma="cabane" type="N">cabane</w></geogFeat><w lemma="de" type="PREPDET">du</w><name>

<w type="NPr">Tracuit</w></name>

</geogName>

Tracuithütte (DE)

<geogName><w type="NPr">

<m xml: id="m1">Tracuit</m><m xml: id="m2" baseForm="hütte">hütte</m>

</w><geogFeat><ptr target="#m2" /></geogFeat><name><ptr target="#m1" /></name>

</geogName>

Page 56: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements 04/03/2016 – 31/38

PLA

N 1 Modélisation computationelle de l’itiné-raire

2 Annotation (automatique) des informa-tions dans le textes

3 Utilisabilité : quelques exemplesAnnotation vers une sorte de standar-disationDésambiguïsation des ESNE grâce aucontexte géographiqueOutil automatique de reconstructiond’itinéraire

Page 57: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 32/38

Outil d’AnnotationPermettre une sorte de standardisation

Généré l’outil « à la volet »

http://erig.univ-pau.fr/PERDIDO/demo/TextTagging.mp4

Page 58: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 32/38

Outil d’AnnotationPermettre une sorte de standardisation

Généré l’outil « à la volet »

http://erig.univ-pau.fr/PERDIDO/demo/TextTagging.mp4

Page 59: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 32/38

Outil d’AnnotationPermettre une sorte de standardisation

Généré l’outil « à la volet »

http://erig.univ-pau.fr/PERDIDO/demo/TextTagging.mp4

Objectif : créer des corpus annotés autonomes• en terme d’instances• et en terme de la syntaxe et la sémantique du langage utilisé

Page 60: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 33/38

Géocodage ou désambiguïsation des toponymes

Où sont localisés ces lieux ?

1 Refuge des Barmettes2 Lac Long3 Lac des Assiettes

Page 61: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 33/38

Géocodage ou désambiguïsation des toponymes

Où sont localisés ces lieux ?

1 Refuge des Barmettes : N 45.389444 - W 6.7527782 Lac Long3 Lac des Assiettes

Page 62: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 33/38

Géocodage ou désambiguïsation des toponymes

Où sont localisés ces lieux ?

1 Refuge des Barmettes : N 45.389444 - W 6.7527782 Lac Long : > 100 localisations3 Lac des Assiettes

Page 63: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 33/38

Géocodage ou désambiguïsation des toponymes

Où sont localisés ces lieux ?

1 Refuge des Barmettes : N 45.389444 - W 6.7527782 Lac Long : > 100 localisations3 Lac des Assiettes : Absent des ressources avec coord.

Page 64: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 34/38

Géocodage ou désambiguïsation des ESNEPrise en compte du contexte spatiale

Où sont localisés ces lieux ?

Pour se rendre au Lac Long , quitter le Refuge des Barmettes et marcher pendant 2 km à

l’Est pour attendre le Lac des Assiettes .

Page 65: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 34/38

Géocodage ou désambiguïsation des ESNEPrise en compte du contexte spatiale

Où sont localisés ces lieux ?

Pour se rendre au Lac Long, quitter le Refuge des Barmettes et marcher pendant 2 km àl’Est pour attendre le Lac des Assiettes.

Page 66: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 34/38

Géocodage ou désambiguïsation des ESNEPrise en compte du contexte spatiale

Où sont localisés ces lieux ?

Pour se rendre au Lac Long , quitter le Refuge des Barmettes et marcher pendant 2 km àl’Est pour attendre le Lac des Assiettes.

Page 67: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 34/38

Géocodage ou désambiguïsation des ESNEPrise en compte du contexte spatiale

Où sont localisés ces lieux ?

Pour se rendre au Lac Long , quiitter le Refuge des Barmettes et marcher pendant 2 kmà l’Est pour attendre le Lac des Assiettes.

Page 68: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 34/38

Géocodage ou désambiguïsation des ESNEPrise en compte du contexte spatiale

Où sont localisés ces lieux ?

Pour se rendre au Lac Long, quitter le Refuge des Barmettes et marcher pendant

2 km à l’Est pour attendre le Lac des Assiettes .

Page 69: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 34/38

Géocodage ou désambiguïsation des ESNEPrise en compte du contexte spatiale

Où sont localisés ces lieux ?

Pour se rendre au Lac Long, quitter le Refuge des Barmettes et marcher pendant

2 km à l’Est pour attendre le Lac des Assiettes .

Page 70: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 34/38

Géocodage ou désambiguïsation des ESNEPrise en compte du contexte spatiale

Où sont localisés ces lieux ?

Pour se rendre au Lac Long, quitter le Refuge des Barmettes et marcher pendant

2 km à l’Est pour attendre le Lac des Assiettes.

Importance de la composante statique et dynamique de la spatialité.

Page 71: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 35/38

Outil automatique de reconstruction d’itinérairePERDIDO

• Une Vidéo de 19s• ou alors une Vraie démo

Page 72: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 36/38

Un outil automatique de reconstruction d’itinérairePerdido

Page 73: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 36/38

Un outil automatique de reconstruction d’itinérairePerdido

Page 74: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 36/38

Un outil automatique de reconstruction d’itinérairePerdido

Page 75: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 36/38

Un outil automatique de reconstruction d’itinérairePerdido

Page 76: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 36/38

Un outil automatique de reconstruction d’itinérairePerdido

Page 77: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 36/38

Un outil automatique de reconstruction d’itinérairePerdido

Page 78: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Merci pour votre attention

Ces travaux ont été partiellement soutenus par :

Page 79: Extraire et représenter des déplacements : à partir …...Extraire et représenter des déplacements 04/03/2016 – 2/38 Problématique Les déplacements décrits textuellement

Extraire et représenter des déplacements04/03/2016 – 38/38

Quelques publications . . .

• Moncla, L., Gaio, M., Nogueras-Iso, J., et Mustière, S. (2016) Reconstruction ofitineraries from annotated text with an informed spanning tree algorithm. InIJGIS, 22 pages

• Moncla, L. et Gaio, M. (2015) A Multi-Layer Markup Language for GeospatialSemantic Annotations. Proceedings of the 9th Workshop on GeographicInformation Retrieval (GIR’15), 10 pages

• Moncla, L., Renteria-Agualimpia, W., Nogueras-Iso, J., et Gaio, M. (2014)Geocoding for texts with fine-grain toponyms : an experiment on ageoparsed hiking descriptions corpus. Proceedings of the 22nd ACMSIGSPATIAL Conference, pp. 183-192 Dallas, Texas, USA.

• Moncla, L., Gaio, M., et Mustière, S. (2014) Automatic itinerary reconstructionfrom texts. Proceedings of the 8th GIScience Conference. pp. 253-267,Vienna, Austria.

• Gaio, M., Sallaberry, C. et Nguyen, V.T. (2012) Typage de noms toponymiquesà des fins d’indexations géographiques. Revue TAL, 53(2), 35 pages