comprendre pour apprendre … et apprendre pour comprendre brigitte grau institut dinformatique...

46
Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut d’Informatique d’Entreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger des Recherches de l’Université Paris

Upload: cendrillon-colin

Post on 03-Apr-2015

110 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

Comprendre pour apprendre … et apprendre pour comprendre

Brigitte Grau

Institut d’Informatique d’Entreprise (IIE)

Groupe LIR - LIMSI

Habilitation à Diriger des Recherches de l’Université Paris 11

Page 2: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

2

COMPRENDRE Objectif initial : modéliser la compréhension en

profondeur Compréhension humaine Modélisation des connaissances et des processus Connaissances pragmatiques :

Formalismes proposés : schéma, scénarios, etc. Exemple

Objectif actuel : procéder à une analyse automatique de textes selon les applications Décomposer le processus de compréhension en différents

points de vue sur le texte Restituer l’information contenue dans les textes

CadreAnalyse de texte et apprentissageQuestion réponse

CompréhensionApprendre des textes

Page 3: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

3

Restituer l’information

Quel accès au contenu ?

Savoir de quoi parle un texte : ses thématiques Résumé automatique, visualisation de texte : résumé

dynamique Exemple de présentation

Trouver une information précise Question-réponse Exemple

Adaptation du processus de compréhension à la tâche

CadreAnalyse de texte et apprentissageQuestion réponse

CompréhensionApprendre des textes

Page 4: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

4

Comprendre mais aussi apprendre De l’analyse thématique des textes

Objectif : construire des représentations structurées de connaissances pragmatiques

Réutiliser le résultat des processus de compréhension pour structurer des connaissances sur les situations

De Question-Réponse

Q-R comme un processus itératif de recherche de la connaissance manquante au processus de résolution Acquisition de relations entre entités

Validation par le résultat du processus : Réponse correcte ou non

CadreAnalyse de texte et apprentissageQuestion réponse

CompréhensionApprendre des textes

Page 5: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

5

Pour apprendre

Les textes comme source de connaissances

Analyse thématique et Question-Réponse pour structurer l’information contenue dans les textes

CadreAnalyse de texte et apprentissageQuestion réponse

CompréhensionApprendre des textes

Page 6: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

6

Analyse thématique Savoir

De quoi parle un texte : ses thèmes Ce qu’il en dit, Comment il le dit.

Analyse thématique Segmentation Identification Structuration

Adaptation au type de texte Texte narratif (Attentat) Texte expositif (Vin jaune)

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

Page 7: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

7

Analyse thématique Fondée sur les propriétés du texte

Cohésion lexicale Présence de marqueurs linguistiques Répétition de mots et chaînes anaphoriques

Dépendante des connaissances Connaissances disponibles ou acquises

automatiquement Réseau de cooccurrences Marques linguistiques :

Meta-descripteurs introducteur de cadre (Charolles)

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

Page 8: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

8

Segmentation thématique

Méthodes développées

Mesure de la cohésion avec un réseau de cooccurrences Textes narratifs (SEGCOHLEX, Olivier Ferret)

Méthode mixte (projet REGAL(1)

) Textes expositifs De type TextTiling (Hearst) :

Pas de ressources utilisées : répétition et répartition des mots

Marques linguistiques Indiquent des débuts de segment ou des regroupements

(1) Projet Cognitique (2000-2003) : CEA (O. Ferret), Lalicc (J.L. Minel), Lattice (M. Charolles)

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

Page 9: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

9

SEGCOHLEX : segmentation par cohésion lexicale Construction du réseau de cooccurrences

Corpus : 24 mois du journal « Le Monde » (entre 1990 et 1994)

31 000 lemmes et 7 millions de relations pondérées par la mesure de leur information mutuelle

Lemme1 Lemme2 Nombre occurrences

Valeur de cohésion

Type de lien

imprimante ordinateur 13 0,227 pragmatique

bateau voilier 125 0,224 sémantique

prêtre curé 44 0,209 sémantique

policier cambriolage 41 0,190 pragmatique

chômage emploi 1985 0,167 sémantique

prendre racine 120 0,110 lexico-syntaxique

collision franc 7 0,076 bruit

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

Page 10: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

10

Calcul de la cohésionRéseau de cooccurrences

Texte

Valeurs de

cohésion

PositionsRupture

0,21 0,13

0,14

0,100,17

0,18

0,130,11 0,12

0,18

0,22 0,28

1,0 1,14 1,0 1,0 1,0 1,0 1,0 1,0 1,2 1,0 1,00,2 0,3

0,43 0,48 0,23 0,320,23

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

Fenêtre

Page 11: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

11

Exemple : Attentat de MLK

Il y a quelques années, je me trouvais dans un grand magasin de Harlem, entouré de quelques centaines de personnes. J'étais en train de dédicacer des exemplaires de mon livre "Stride toward Freedom", qui relate le boycottage des autobus de Montgomery en 1955-56. Soudain, tandis que j'apposais ma signature sur une page,

je sentis quelque chose de pointu s'enfoncer brutalement dans ma poitrine. Je venais d'être poignardé à l'aide d'un coupe-papier, par une femme qui devait être reconnue folle par la suite. On me transporta d'urgence à l'Hôpital de Harlem

où je restai de longues heures sur un lit tandis qu'on faisait mille préparatifs pour extraire l'arme de mon corps. Beaucoup plus tard, quand je fus en état de m'entretenir avec le Dr. Aubrey Maynard, le chirurgien en chef qui exécuta cette délicate et dangereuse intervention, j'appris les raisons de cette longue attente avant l'opération. La lame de l'instrument avait touché l'aorte et, pour l'extraire, il fallait ouvrir toute la cage thoracique.

Segment 1Séance

de dédicace

Segment 2Attentat

Segment 3Hôpital

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

Page 12: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

12

Courbe et segments calculés

0

5

10

15

20

25

30

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61

Position dans le texte

Cohésion initiale

Cohésion segmentée

Pointu Entretenir

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

Page 13: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

13

Résultat : Attentat de MLKIl y a quelques années, je me trouvais dans un grand magasin de

Harlem, entouré de quelques centaines de personnes. J'étais en train de dédicacer des exemplaires de mon livre "Stride toward Freedom", qui relate le boycottage des autobus de Montgomery en 1955-56. Soudain, tandis que j'apposais ma signature sur une page,

je sentis quelque chose de pointu s'enfoncer brutalement dans ma poitrine. Je venais d'être poignardé à l'aide d'un coupe-papier, par une femme qui devait être reconnue folle par la suite. On me transporta d'urgence à l'Hôpital de Harlem

où je restai de longues heures sur un lit tandis qu'on faisait mille préparatifs pour extraire l'arme de mon corps. Beaucoup plus tard, quand je fus en état de m'entretenir avec le Dr. Aubrey Maynard, le chirurgien en chef qui exécuta cette délicate et dangereuse intervention, j'appris les raisons de cette longue attente avant l'opération. La lame de l'instrument avait touché l'aorte et, pour l'extraire, il fallait ouvrir toute la cage thoracique.

Segment 1Séance

de dédicace

Segment 2Attentat

Segment 3Hôpital

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

Page 14: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

14

2 méthodes de structuration Structure par emboîtement de segments

Projet REGAL Structure « gros grain » Exemple

Structure phrase par phrase

DST (Nicolas Hernandez) Structure « grain fin » Apprentissage des relations entre 2 phrases

Subordination, coordination, absence de relation Critères : marques linguistiques, cohésion lexicale, suivi thème-

rhème, parallélisme syntaxique

Exemple

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

Page 15: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

15

Analyse thématique :Conclusion et perspectives

Typage du rôle rhétorique de segments ou d’énoncés importants

Identification des thèmes

Structure

Faire coopérer analyse globale et locale

Transposer sur les textes narratifs

Visualisation et navigation

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

Page 16: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

16

Analyse pour l’apprentissage Apprentissage : caractéristiques

Automatique Incrémental et non supervisé A partir des textes Garde la relation au texte

Principe d’accumulation Similarité entre entités Agrégation de ces entités

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

Page 17: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

17

Agrégation des UTS d’un même domaine

Construction de classes de noms pour un même verbe et une même relation Construction des Domaines Structurés

Mémoire thématique Réseau de Cooccurrences

Corpus

Segments/UTLs

Domaine sémantique

UTL UTL

UTL UTL

)(pcohesion

),( DUTLsimilarité

Agrégation Domaine structuré

UTS UTS

UTS UTSAgrégation

UTS

Verbe->S->NomVerbe->COD->NomVerbe->Prep->Nom

Segmentation : lemmes du texte + lemmes inférés

Unités Thématiques Lexicales (UTL)

Ensemble de lemmes

Agrégation des UTLs similaires

Lemmes récurrents

Domaines sémantiques : ensemble de lemmes pondérés

Filtrage des classes selon l’importance des mots dans le domaine

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

Rosa (Olivier Ferret)

Svetlan’ (Gael de Chalendar)

Analyse syntaxique des phrases des segments

Unités Thématiques Structurées (UTS)

Ensemble de triplets <verbe, relation, nom>

Page 18: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

18

Exemple de domaine

Lemmes du texte

Lemmes du texte et lemmes inférés

Lemmes inférés

Lemmes du texte non segmenté

mots occ. poids juge d'instruction 58 0.501 garde à vue 50 0.442 bien social 46 0.428 inculpation 49 0.421 écrouer 45 0.417 chambre d'accusation 47 0.412 recel 42 0.397 présumer 45 0.382 police judiciaire 42 0.381 escroquerie 42 0.381

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

1

2

3

4

Page 19: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

19

Exemple de domaine structuré

Researcher, patientSujet3Call

Virus, antibodyCOD3Carry

Physician, careCOD4Meet

Treatment, careSujet11Get

Care, treatment, medicationCOD8Receive

Care, medicationCOD4Give

Nurse, surgeryCOD6Say

Care, treatmentCOD35Provide

Surgery, illness, treatmentSujet24Be

ClasseRelationNbOccVerbe

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

Expérimentations en français et en anglais

Page 20: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

20

MLKCirconstances

a) [Être_localisé] —(objet) —> [Événement]

(lieu) —> [Magasin]

b) [Fou] —(source) —> [Femme]

Description

a) [Poignarder] —(agent) —> [Femme]

(destinat.) —> [Poitrine] — (partieDe) —> [Homme: MLK]

(instrument) —> [CoupePapier](manière) —> [Brutalement]

b) [Transporter] —(agent) —> [Humain] (patient) —> [Homme: MLK] (destination) —> [Hôpital] (manière) —> [Rapidement]

États incidents

a) [Être_blessé] —(patient) —> [Homme: MLK]

b) [Être_hospitalisé] —(patient) —> [Homme: MLK]

Relations causales : D.a -> I.aD.b-> I.b

C

D

(1), (2), (4)

[ (6) (7) ]

(10) (11)

(8)C

D

(9)

(12)

D

[ (3) (5) ]

UT Tentative de meurtre

UT Dédicace UT Hôpital

TP

changement déviation

Texte analysé manuellement

Calcul de similaritéet

Aggrégation de graphes

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

U T A r r i v é e

d ' u n c h e f d ' é t a t

T P T P

T P

C

D

I

C

D

C

D

C

D

I

U T T e n t a t i v e

d e m e u r t r e

1 è r e o c c u r r e n c e d ' u n e U T

U T a g r é g e a n t p l u s i e u r s o c c u r r e n c e s

1 è r e o c c u r r e n c e d ' u n é p i s o d e

é p i s o d e a g r é g e a n t p l u s i e u r s

o c c u r r e n c e s

c h a n g e m e n t

C

D

U T P a r t i e d e c a r t e s

I

D d é v i a t i o n

U T D i s c o u r s

U T D é d i c a c e

c h a n g e

m e n t

U T B o u s c u l a d e

c h a n g e m e n t

C

D

U T R é p a r e r

v o i t u r e

U T A l l e r

S u p e r m a r c h é

d é v i a t i o n

c h a n g e m e n t

I

T P

C

D

C

D

I

U T H ô p i t a l

d é v i a t i o

n

d é v i a t i o n

T P

C : Circonstances D : Description I : Etats Incidents

Mémoire épisodique

Page 21: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

21

MLK

Base de connaissances sémantiques

Graphes conceptuels

Unités thématiques

Ensemble de graphes conceptuels Structure en : Circonstances, Description, États incidents

Similarité UT – épisode en mémoire

Tient compte de la structure Similarité de graphes

Fondée sur l’opération de projection

Agrégation

Fondée sur l’opération de jointure

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

Page 22: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

22

Apprentissage et Analyse :Conclusion et

perspectives Analyse conceptuelle automatique des situations Affiner la délimitation automatique des situations Représentation des situations fondée sur une base de

connaissances sémantique Résultats de SVETLAN : emplois des verbes contextualisés WordNet : relations hiérarchiques VerbNet : structures de cas des verbes FrameNet : situations et événements

Intégrer ces différentes bases de connaissances

Itérer sur l’apprentissage Généralisation des événements

CadreAnalyse de texte et apprentissageQuestion réponse

Analyse thématiqueApprentissage de domaineMémoire épisodique

Page 23: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

23

Analyse robuste de texte pour trouver des réponses à des questions Processus différents selon :

Domaine ouvert ou domaine de spécialité

Domaine ouvert : démarche analogue à l’analyse thématique

Définition de processus robustes Utilisation de ressources existantes ou acquises

automatiquement

Stratégies différentes selon :

Le type d’information cherché La ressource interrogée Les résultats obtenus par chaque processus (à développer)

Évaluation des résultats

CadreAnalyse de texte et apprentissageQuestion réponse

ProblématiqueMéthodeRésultats et perspectives

Page 24: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

24

Qui a poignardé Henri IV ?

NOM de PERSONNE

Patron d’extraction : Personne <poignarder> Henri IV Personne VerbePrincipal Focus

Méthodes

Q

GN GV GN

VAuxPrn NPr

sujet COD

Répondre à des questionsQuestion

Entité nommée

Critères syntaxiques :

Personne <poignarder> Henri IV

SUJET COD

CadreAnalyse de texte et apprentissageQuestion réponse

ProblématiqueMéthodes de résolutionRésultats et perspectives

… C’est à Paris, rue de la Ferronnerie, qu’Henri IV a rendu son dernier soupir… D’autre part, on peut rappeler que les rues encombrées et étroites du Paris d’avant Haussmann étaient très favorables aux guets-apens. La facilité avec laquelle Ravaillac a pu poignarder Henri IV peut paraître incroyable ! …

Page 25: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

25

Où a été tué Henri IV ?

Méthodes

Répondre à des questionsQuestions

Critères sémantiques Tuer synonyme PoignarderQui a tué Henri IV ?

LIEU dans le contexte

CadreAnalyse de texte et apprentissageQuestion réponse

ProblématiqueMéthodes de résolutionRésultats et perspectives

plus

Critères sémantiques Tuer => Mort Rendre son dernier soupir <=> Mourir

LIEU (VILLE, PAYS, etc)

… C’est à Paris, rue de la Ferronnerie, qu’Henri IV a rendu son dernier soupir… D’autre part, on peut rappeler que les rues encombrées et étroites du Paris d’avant Haussmann étaient très favorables aux guets-apens. La facilité avec laquelle Ravaillac a pu poignarder Henri IV peut paraître incroyable ! …

Page 26: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

26

Variations question vs passage-réponse Analyse des questions

Extraction de caractéristiques de la réponse Analyse des passages

Entités nommées Variation au niveau des termes

Règles de réécritures de Fastr (C. Jacquemin) Variation au niveau des phrases

Patrons d’extraction ayant le focus de la question en élément pivot Grammaires locales utilisant Scol (Abney)

Evaluation de paraphrases (A.L. Ligozat et V. Barbier)

Validation par le Web

CadreAnalyse de texte et apprentissageQuestion réponse

ProblématiqueMéthodes de résolutionRésultats et perspectives

Page 27: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

27

Systèmes monolingues

QALC : anglais

Evalué à Trec de 1998 à 2001 30-35% de réponses correctes 2 fois dans les 10 premiers

5 réponses longues : 6ème 1 réponse courte : 9ème

FRASQUES : français

Projet Technolangue EVALDA (2004): EQueR : 1ère évaluation sur le français 5 réponses

Résultats à EQueR 2 et 3ème selon la tâche

45% réponses longues 30% réponses courtes

CadreAnalyse de texte et apprentissageQuestion réponse

ProblématiqueMéthodeRésultats et perspectives

Page 28: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

28

Question-Réponse multilingue Question en français – réponse en anglais

Indispensable sur le Web

Variation supplémentaire

Traduction des termes : choix de la traduction correcte

Validation par les bi-termes

MUSQAT : évaluation à CLEF

20% des réponses

Parmi les premiers 1er système : 25% des réponses

CadreAnalyse de texte et apprentissageQuestion réponse

ProblématiqueMéthodeRésultats et perspectives

Page 29: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

29

Question-Réponse : Projet CONIQUE(1) 3 axes :

Justification des réponses trouvées Vérification de la présence de toutes les informations données

dans la question Acquisition de relations pour l’inférence Dépendante du contexte

Catégorisation des réponses données à l’utilisateur Présentation interactive des résultats - Navigation

Résolution itérative

Les textes comme source de connaissances : Recherche de relations dans les textes à partir de leur

expression en langue(1) Projet ANR non thématique (2006-2009) : CEA (O. Ferret) et Lallic (J.L. Minel)

CadreAnalyse de texte et apprentissageQuestion réponse

ProblématiqueMéthodeRésultats et perspectives

Page 30: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

30

Quel coureur espagnol a gagné une étape du tour de France en 2003 ? 

Justification de la réponse

25 juillet 2003 – Pablo Lastras a remporté la 18e étape du Tour de France cycliste, vendredi, entre Bordeaux et Saint-Maixent-L'École.

Vendredi 15 août 2003 Les cinq étapes du Tour de Burgos 2003 ont été remportées par cinq coureurs différents : Carlos Garcia Quesada, José Vicente Garcia Acosta, Dave Bruylandts, David Millar (CLM) et enfin Gorka Gonzalez Larranaga, qui remporte dans la dernière étape sa première victoire chez les professionnels.La victoire finale revient au coureur le plus régulier, l'Espagnol Pablo Lastras, qui s'était distingué durant le Tour de France en remportant la 18e étape.

Pablo Lastras

Justification :

coureur espagnol

CadreAnalyse de texte et apprentissageQuestion réponse

ProblématiqueMéthodeRésultats et perspectives

Page 31: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

31

Bilan

Anathème

Segcohlex

DST REGAL

Suivi de la cohérence

ROSA

Svetlan

MLK QALC

Pragmatique & dialogue

Structuration des

connaissances

Analyse du texte Apprentissage par accumulation Application sur le texte

Extraction d'information

Classification

Visualisation

Résumé

Lexique Réseau de cooccurrences

Domaines

Classes de noms

Episodes Schémas

Sacs de mots Grammaires locales HC

Abstraction Inférences Analogie

Agrégation Grammaires locales contextuelles Analyse syntaxique de surface

Processus et Niveau de compréhension

WordNet

Bilan Perspectives

Page 32: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

32

Conclusion

Modéliser un continuum entre processus et structuration des connaissances

Stratégie d’application de processus

Évaluation automatique de leurs performances

Construire une plate-forme d’expérimentation et d’évaluation

Bilan Perspectives

Page 33: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

33

Merci

Page 34: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

34

Rôles

Relations causales

Relations temporelles

Evénements

Réparer un véhicule

Rôles : personne, outil, véhiculeConditions:

Description

Résultat

Démonter pièce

Trouver panne

Une situation

Inférence

Structuration

Véhicule en panne

Connaître la mécaniqueVéhicule = rôle (véhicule)

Agent = rôle (personne)

Réparer pièceRemonter pièce

Agent = rôle (personne)

Véhicule fonctionneVéhicule = rôle (véhicule)

1

2

3

4

1.Résultat = pièce

Agent = rôle (personne)Pièce = 1.résultat

Ses propriétés

Page 35: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

35

Un graphe de schémas

Pas de méthode pour élaborer et organiser les connaissances

Quel niveau de granularité, quels regroupements ?

Quelle structure hiérarchique ?

Réparer véhicule

Réparer objet

Remettre en état entité

Réparer pièce

Réparer objet-mécanique

Etre garagiste

Avoir profession

Connaître mécanique

Trouver panne

Soigner être-animé

Sorte-de

Fait appel-à

Page 36: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

36

<p id="p1">En 1991, à la Station INRA de Dijon, Patrick Étiévant et Bruno Martin commençaient l'analyse du vin jaune, produit seulement dans le Jura. Le goût spécifique de ces vins résulte de leur technique d'élevage: on laisse le vin vieillir entonneau pendant plusieurs années, sous un voile épais de levures Saccharomyces cerevisiae. Ce type de vin est également fabriqué en Alsace, en Bourgogne et à Gaillac sous le nom de vin de fleur ou vin de voile; il n'a d'équivalent à l'étranger que dans le xérès, les sherrys ou le tokay de Hongrie. Quelles molécules sont responsables de son goût caractéristique?</p>

<p id="p2">Les vins contiennent des centaines de composés volatils, dont un dixième sont aromatiques, de sorte que la détection des molécules responsables d'un arôme particulier est notoirement difficile: chercher le coupable, parmi 300 suspects... Au début des années 1970, certains avaient cru que la solérone (le 4 acétyl gamma butyrolactone) était l'arôme principal du vin jaune, mais, en 1982, Pierre Dubois, à Dijon, retrouva la solérone dans des vins rouges: la molécule avait un alibi.</p>

<p id="p3">On soupçonna alors le 4,5 diméthyl 3 hydroxy 2(5H) furanone, ou sotolon, molécule construite autour d'un cycle de quatre atomes de carbone et d'un atome d'oxygène. Comme le sotolon et la solérone sont en concentrations minimes dans les vins de voile et, de surcroît, chimiquement instables, les chimistes dijonnais ont cherché à optimiser leur extraction afin de déterminer la molécule responsable du goût de jaune.</p>

<p id="p4">L'analyse la plus directe d'extraits de vins est la chromatographie: on injecte un échantillon dans un solvant que l'on vaporise et on fait traverser au mélange une colonne revêtue intérieurement d'un polymère, qui retient les divers composés du mélange à des degrés divers; en bas de la colonne, on détecte la sortie des composés séparés. Le premier travail des chimistes fut la mise au point d'une variante de cette technique pour identifier les composés présents en quantités minimes dans des mélanges complexes.</p>

<p id="p5">Les chromatogrammes d'échantillons de vin furent alors comparés à ceux de solutions pures de sotolon et de solérone de synthèse: le sotolon est ainsi présent entre 40 et 150 parties par milliard dans les sherrys; la solérone semble moins spécifique, et ses concentrations sont supérieures dans les sherrys, ce qui explique pourquoi on l'a d'abord trouvée dans ces vins.</p>

<p id="p6">Enfin les dosages, complétés de tests sensoriels des fractions séparées, montrèrent que la solérone, aux concentrations trouvées dans du savagnin (le cépage à partir du quel on fabrique le vin jaune), n'était perçue par les consommateurs ni dans les vins, ni dans des solutions modèles: la solérone n'était pas la molécule caractéristique; le jugement était sans appel.</p>

<p id="p7">En 1992, les chimistes se consacrèrent alors complètement au sotolon, qui avait été observé dans des molasses de canne à sucre, dans des graines de fenugrec, dans de la sauce de soja, dans du saké... Il était également présent dans certains vins botrytisés, c'est-à-dire faits à partir de raisins surmaturés et atteints par la pourriture noble: ce champignon, Botrytis cinerea, fait, par exemple, les sauternes ou les vins dits de vendanges tardives. Le sotolon n'a pas été trouvé dans les vins rouges ni dans les vins oxydés et, surtout, il fut déterminé que son seuil de perception était de 15 parties par milliard seulement.</p>

<p id="p8">Mieux encore, des tests de consommation montrèrent que les vins de voile étaient jugés typiques, avec une note de noix, quand la concentration en sotolon était forte dans ces vins. A plus forte concentration, les jurys de dégustation décrivirent une note de curry.</p>

<p id="p9">La piste du sotolon est aujourd'hui suivie par Élisabeth Guichard, qui a mis au point une méthode rapide de dosage: la concentration en sotolon dans le vin de paille (un vin préparé à partir de baies séchées sur des claies), qui n'avaitpas été observée, est comprise entre 6 et 15 parties par milliard; le sotolon du vin jaune est synthétisé à la fin de la phase de croissance exponentielle des levures. Dans des vins vieillis respectivement un an, deux ans, trois ans, quatre ans, cinq ans et six ans, la quantité de sotolon est faible dans les débuts de la maturation et augmente notablement après quatre ans d'élevage, surtout dans les caves pas trop fraîches.</p>

<p id="p10">Des prélèvements à différentes profondeurs, sous le voile, dans les tonneaux, ont révélé que le sotolon est deux fois plus concentré au milieu et au fond des tonneaux que juste sous le voile. On suppose que le sotolon est indirectement produit par les levures du voile, quand le degré alcoolique est élevé: celles-ci transformeraient un acide aminé du vin en uncétoacide, qui serait libéré à la mort des levures, tombant au fond du tonneau; puis une réaction chimique transformerait lecétoacide en sotolon, enrichissant d'abord le fond, puis le milieu, puis les couches supérieures du vin.</p>

<p id="p11">Puisque le sotolon est bien la molécule du goût de jaune, on cherche aujourd'hui des souches de levures qui ont la capacité d'en produire beaucoup; on cherche aussi les conditions qui favorisent la production de ce goût.</p>

Thème général : vin jaune

<p id="p1">En 1991, à la Station INRA de Dijon, Patrick Étiévant et Bruno Martin commençaient l'analyse du vin jaune, produit seulement dans le Jura. Le goût spécifique de ces vins résulte de leur technique d'élevage: on laisse le vin vieillir entonneau pendant plusieurs années, sous un voile épais de levures Saccharomyces cerevisiae. Ce type de vin est également fabriqué en Alsace, en Bourgogne et à Gaillac sous le nom de vin de fleur ou vin de voile; il n'a d'équivalent à l'étranger que dans le xérès, les sherrys ou le tokay de Hongrie. Quelles molécules sont responsables de son goût caractéristique?</p>

<p id="p2">Les vins contiennent des centaines de composés volatils, dont un dixième sont aromatiques, de sorte que la détection des molécules responsables d'un arôme particulier est notoirement difficile: chercher le coupable, parmi 300 suspects... Au début des années 1970, certains avaient cru que la solérone (le 4 acétyl gamma butyrolactone) était l'arôme principal du vin jaune, mais, en 1982, Pierre Dubois, à Dijon, retrouva la solérone dans des vins rouges: la molécule avait un alibi.</p>

<p id="p3">On soupçonna alors le 4,5 diméthyl 3 hydroxy 2(5H) furanone, ou sotolon, molécule construite autour d'un cycle de quatre atomes de carbone et d'un atome d'oxygène. Comme le sotolon et la solérone sont en concentrations minimes dans les vins de voile et, de surcroît, chimiquement instables, les chimistes dijonnais ont cherché à optimiser leur extraction afin de déterminer la molécule responsable du goût de jaune.</p>

<p id="p4">L'analyse la plus directe d'extraits de vins est la chromatographie: on injecte un échantillon dans un solvant que l'on vaporise et on fait traverser au mélange une colonne revêtue intérieurement d'un polymère, qui retient les divers composés du mélange à des degrés divers; en bas de la colonne, on détecte la sortie des composés séparés. Le premier travail des chimistes fut la mise au point d'une variante de cette technique pour identifier les composés présents en quantités minimes dans des mélanges complexes.</p>

<p id="p5">Les chromatogrammes d'échantillons de vin furent alors comparés à ceux de solutions pures de sotolon et de solérone de synthèse: le sotolon est ainsi présent entre 40 et 150 parties par milliard dans les sherrys; la solérone semble moins spécifique, et ses concentrations sont supérieures dans les sherrys, ce qui explique pourquoi on l'a d'abord trouvée dans ces vins.</p>

<p id="p6">Enfin les dosages, complétés de tests sensoriels des fractions séparées, montrèrent que la solérone, aux concentrations trouvées dans du savagnin (le cépage à partir du quel on fabrique le vin jaune), n'était perçue par les consommateurs ni dans les vins, ni dans des solutions modèles: la solérone n'était pas la molécule caractéristique; le jugement était sans appel.</p>

<p id="p7">En 1992, les chimistes se consacrèrent alors complètement au sotolon, qui avait été observé dans des molasses de canne à sucre, dans des graines de fenugrec, dans de la sauce de soja, dans du saké... Il était également présent dans certains vins botrytisés, c'est-à-dire faits à partir de raisins surmaturés et atteints par la pourriture noble: ce champignon, Botrytis cinerea, fait, par exemple, les sauternes ou les vins dits de vendanges tardives. Le sotolon n'a pas été trouvé dans les vins rouges ni dans les vins oxydés et, surtout, il fut déterminé que son seuil de perception était de 15 parties par milliard seulement.</p>

<p id="p8">Mieux encore, des tests de consommation montrèrent que les vins de voile étaient jugés typiques, avec une note de noix, quand la concentration en sotolon était forte dans ces vins. A plus forte concentration, les jurys de dégustation décrivirent une note de curry.</p>

<p id="p9">La piste du sotolon est aujourd'hui suivie par Élisabeth Guichard, qui a mis au point une méthode rapide de dosage: la concentration en sotolon dans le vin de paille (un vin préparé à partir de baies séchées sur des claies), qui n'avaitpas été observée, est comprise entre 6 et 15 parties par milliard; le sotolon du vin jaune est synthétisé à la fin de la phase de croissance exponentielle des levures. Dans des vins vieillis respectivement un an, deux ans, trois ans, quatre ans, cinq ans et six ans, la quantité de sotolon est faible dans les débuts de la maturation et augmente notablement après quatre ans d'élevage, surtout dans les caves pas trop fraîches.</p>

<p id="p10">Des prélèvements à différentes profondeurs, sous le voile, dans les tonneaux, ont révélé que le sotolon est deux fois plus concentré au milieu et au fond des tonneaux que juste sous le voile. On suppose que le sotolon est indirectement produit par les levures du voile, quand le degré alcoolique est élevé: celles-ci transformeraient un acide aminé du vin en uncétoacide, qui serait libéré à la mort des levures, tombant au fond du tonneau; puis une réaction chimique transformerait lecétoacide en sotolon, enrichissant d'abord le fond, puis le milieu, puis les couches supérieures du vin.</p>

<p id="p11">Puisque le sotolon est bien la molécule du goût de jaune, on cherche aujourd'hui des souches de levures qui ont la capacité d'en produire beaucoup; on cherche aussi les conditions qui favorisent la production de ce goût.</p>

Exemple d’exploration d’un texte

Page 37: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

37

<p id="p1">En 1991, à la Station INRA de Dijon, Patrick Étiévant et Bruno Martin commençaient l'analyse du vin jaune, produit seulement dans le Jura. Le goût spécifique de ces vins résulte de leur technique d'élevage: on laisse le vin vieillir entonneau pendant plusieurs années, sous un voile épais de levures Saccharomyces cerevisiae. Ce type de vin est également fabriqué en Alsace, en Bourgogne et à Gaillac sous le nom de vin de fleur ou vin de voile; il n'a d'équivalent à l'étranger que dans le xérès, les sherrys ou le tokay de Hongrie. Quelles molécules sont responsables de son goût caractéristique?</p>

<p id="p2">Les vins contiennent des centaines de composés volatils, dont un dixième sont aromatiques, de sorte que la détection des molécules responsables d'un arôme particulier est notoirement difficile: chercher le coupable, parmi 300 suspects... Au début des années 1970, certains avaient cru que la solérone (le 4 acétyl gamma butyrolactone) était l'arôme principal du vin jaune, mais, en 1982, Pierre Dubois, à Dijon, retrouva la solérone dans des vins rouges: la molécule avait un alibi.</p>

<p id="p3">On soupçonna alors le 4,5 diméthyl 3 hydroxy 2(5H) furanone, ou sotolon, molécule construite autour d'un cycle de quatre atomes de carbone et d'un atome d'oxygène. Comme le sotolon et la solérone sont en concentrations minimes dans les vins de voile et, de surcroît, chimiquement instables, les chimistes dijonnais ont cherché à optimiser leur extraction afin de déterminer la molécule responsable du goût de jaune.</p>

<p id="p4">L'analyse la plus directe d'extraits de vins est la chromatographie: on injecte un échantillon dans un solvant que l'on vaporise et on fait traverser au mélange une colonne revêtue intérieurement d'un polymère, qui retient les divers composés du mélange à des degrés divers; en bas de la colonne, on détecte la sortie des composés séparés. Le premier travail des chimistes fut la mise au point d'une variante de cette technique pour identifier les composés présents en quantités minimes dans des mélanges complexes.</p>

<p id="p5">Les chromatogrammes d'échantillons de vin furent alors comparés à ceux de solutions pures de sotolon et de solérone de synthèse: le sotolon est ainsi présent entre 40 et 150 parties par milliard dans les sherrys; la solérone semble moins spécifique, et ses concentrations sont supérieures dans les sherrys, ce qui explique pourquoi on l'a d'abord trouvée dans ces vins.</p>

<p id="p6">Enfin les dosages, complétés de tests sensoriels des fractions séparées, montrèrent que la solérone, aux concentrations trouvées dans du savagnin (le cépage à partir du quel on fabrique le vin jaune), n'était perçue par les consommateurs ni dans les vins, ni dans des solutions modèles: la solérone n'était pas la molécule caractéristique; le jugement était sans appel.</p>

<p id="p7">En 1992, les chimistes se consacrèrent alors complètement au sotolon, qui avait été observé dans des molasses de canne à sucre, dans des graines de fenugrec, dans de la sauce de soja, dans du saké... Il était également présent dans certains vins botrytisés, c'est-à-dire faits à partir de raisins surmaturés et atteints par la pourriture noble: ce champignon, Botrytis cinerea, fait, par exemple, les sauternes ou les vins dits de vendanges tardives. Le sotolon n'a pas été trouvé dans les vins rouges ni dans les vins oxydés et, surtout, il fut déterminé que son seuil de perception était de 15 parties par milliard seulement.</p>

<p id="p8">Mieux encore, des tests de consommation montrèrent que les vins de voile étaient jugés typiques, avec une note de noix, quand la concentration en sotolon était forte dans ces vins. A plus forte concentration, les jurys de dégustation décrivirent une note de curry.</p>

<p id="p9">La piste du sotolon est aujourd'hui suivie par Élisabeth Guichard, qui a mis au point une méthode rapide de dosage: la concentration en sotolon dans le vin de paille (un vin préparé à partir de baies séchées sur des claies), qui n'avaitpas été observée, est comprise entre 6 et 15 parties par milliard; le sotolon du vin jaune est synthétisé à la fin de la phase de croissance exponentielle des levures. Dans des vins vieillis respectivement un an, deux ans, trois ans, quatre ans, cinq ans et six ans, la quantité de sotolon est faible dans les débuts de la maturation et augmente notablement après quatre ans d'élevage, surtout dans les caves pas trop fraîches.</p>

<p id="p10">Des prélèvements à différentes profondeurs, sous le voile, dans les tonneaux, ont révélé que le sotolon est deux fois plus concentré au milieu et au fond des tonneaux que juste sous le voile. On suppose que le sotolon est indirectement produit par les levures du voile, quand le degré alcoolique est élevé: celles-ci transformeraient un acide aminé du vin en uncétoacide, qui serait libéré à la mort des levures, tombant au fond du tonneau; puis une réaction chimique transformerait lecétoacide en sotolon, enrichissant d'abord le fond, puis le milieu, puis les couches supérieures du vin.</p>

<p id="p11">Puisque le sotolon est bien la molécule du goût de jaune, on cherche aujourd'hui des souches de levures qui ont la capacité d'en produire beaucoup; on cherche aussi les conditions qui favorisent la production de ce goût.</p>

Thème général : vin jaune

<p id="p1">En 1991, à la Station INRA de Dijon, Patrick Étiévant et Bruno Martin commençaient l'analyse du vin jaune, produit seulement dans le Jura. Le goût spécifique de ces vins résulte de leur technique d'élevage: on laisse le vin vieillir entonneau pendant plusieurs années, sous un voile épais de levures Saccharomyces cerevisiae. Ce type de vin est également fabriqué en Alsace, en Bourgogne et à Gaillac sous le nom de vin de fleur ou vin de voile; il n'a d'équivalent à l'étranger que dans le xérès, les sherrys ou le tokay de Hongrie. Quelles molécules sont responsables de son goût caractéristique?</p>

<p id="p2">Les vins contiennent des centaines de composés volatils, dont un dixième sont aromatiques, de sorte que la détection des molécules responsables d'un arôme particulier est notoirement difficile: chercher le coupable, parmi 300 suspects... Au début des années 1970, certains avaient cru que la solérone (le 4 acétyl gamma butyrolactone) était l'arôme principal du vin jaune, mais, en 1982, Pierre Dubois, à Dijon, retrouva la solérone dans des vins rouges: la molécule avait un alibi.</p>

<p id="p3">On soupçonna alors le 4,5 diméthyl 3 hydroxy 2(5H) furanone, ou sotolon, molécule construite autour d'un cycle de quatre atomes de carbone et d'un atome d'oxygène. Comme le sotolon et la solérone sont en concentrations minimes dans les vins de voile et, de surcroît, chimiquement instables, les chimistes dijonnais ont cherché à optimiser leur extraction afin de déterminer la molécule responsable du goût de jaune.</p>

<p id="p4">L'analyse la plus directe d'extraits de vins est la chromatographie: on injecte un échantillon dans un solvant que l'on vaporise et on fait traverser au mélange une colonne revêtue intérieurement d'un polymère, qui retient les divers composés du mélange à des degrés divers; en bas de la colonne, on détecte la sortie des composés séparés. Le premier travail des chimistes fut la mise au point d'une variante de cette technique pour identifier les composés présents en quantités minimes dans des mélanges complexes.</p>

<p id="p5">Les chromatogrammes d'échantillons de vin furent alors comparés à ceux de solutions pures de sotolon et de solérone de synthèse: le sotolon est ainsi présent entre 40 et 150 parties par milliard dans les sherrys; la solérone semble moins spécifique, et ses concentrations sont supérieures dans les sherrys, ce qui explique pourquoi on l'a d'abord trouvée dans ces vins.</p>

<p id="p6">Enfin les dosages, complétés de tests sensoriels des fractions séparées, montrèrent que la solérone, aux concentrations trouvées dans du savagnin (le cépage à partir du quel on fabrique le vin jaune), n'était perçue par les consommateurs ni dans les vins, ni dans des solutions modèles: la solérone n'était pas la molécule caractéristique; le jugement était sans appel.</p>

<p id="p7">En 1992, les chimistes se consacrèrent alors complètement au sotolon, qui avait été observé dans des molasses de canne à sucre, dans des graines de fenugrec, dans de la sauce de soja, dans du saké... Il était également présent dans certains vins botrytisés, c'est-à-dire faits à partir de raisins surmaturés et atteints par la pourriture noble: ce champignon, Botrytis cinerea, fait, par exemple, les sauternes ou les vins dits de vendanges tardives. Le sotolon n'a pas été trouvé dans les vins rouges ni dans les vins oxydés et, surtout, il fut déterminé que son seuil de perception était de 15 parties par milliard seulement.</p>

<p id="p8">Mieux encore, des tests de consommation montrèrent que les vins de voile étaient jugés typiques, avec une note de noix, quand la concentration en sotolon était forte dans ces vins. A plus forte concentration, les jurys de dégustation décrivirent une note de curry.</p>

<p id="p9">La piste du sotolon est aujourd'hui suivie par Élisabeth Guichard, qui a mis au point une méthode rapide de dosage: la concentration en sotolon dans le vin de paille (un vin préparé à partir de baies séchées sur des claies), qui n'avaitpas été observée, est comprise entre 6 et 15 parties par milliard; le sotolon du vin jaune est synthétisé à la fin de la phase de croissance exponentielle des levures. Dans des vins vieillis respectivement un an, deux ans, trois ans, quatre ans, cinq ans et six ans, la quantité de sotolon est faible dans les débuts de la maturation et augmente notablement après quatre ans d'élevage, surtout dans les caves pas trop fraîches.</p>

<p id="p10">Des prélèvements à différentes profondeurs, sous le voile, dans les tonneaux, ont révélé que le sotolon est deux fois plus concentré au milieu et au fond des tonneaux que juste sous le voile. On suppose que le sotolon est indirectement produit par les levures du voile, quand le degré alcoolique est élevé: celles-ci transformeraient un acide aminé du vin en uncétoacide, qui serait libéré à la mort des levures, tombant au fond du tonneau; puis une réaction chimique transformerait lecétoacide en sotolon, enrichissant d'abord le fond, puis le milieu, puis les couches supérieures du vin.</p>

<p id="p11">Puisque le sotolon est bien la molécule du goût de jaune, on cherche aujourd'hui des souches de levures qui ont la capacité d'en produire beaucoup; on cherche aussi les conditions qui favorisent la production de ce goût.</p>

Thème local :

Thème global :

Meta-descripteurs :

vin

mélange, composé

analyse, technique

Thème local :

Thème global :

Meta-descripteurs :

vin

goût, noisette

caractéristique

Exemple d’exploration d’un texte

Page 38: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

38

<p id="p1">En 1991, à la Station INRA de Dijon, Patrick Étiévant et Bruno Martin commençaient l'analyse du vin jaune, produit seulement dans le Jura. Le goût spécifique de ces vins résulte de leur technique d'élevage: on laisse le vin vieillir entonneau pendant plusieurs années, sous un voile épais de levures Saccharomyces cerevisiae. Ce type de vin est également fabriqué en Alsace, en Bourgogne et à Gaillac sous le nom de vin de fleur ou vin de voile; il n'a d'équivalent à l'étranger que dans le xérès, les sherrys ou le tokay de Hongrie. Quelles molécules sont responsables de son goût caractéristique?</p>

<p id="p2">Les vins contiennent des centaines de composés volatils, dont un dixième sont aromatiques, de sorte que la détection des molécules responsables d'un arôme particulier est notoirement difficile: chercher le coupable, parmi 300 suspects... Au début des années 1970, certains avaient cru que la solérone (le 4 acétyl gamma butyrolactone) était l'arôme principal du vin jaune, mais, en 1982, Pierre Dubois, à Dijon, retrouva la solérone dans des vins rouges: la molécule avait un alibi.</p>

<p id="p3">On soupçonna alors le 4,5 diméthyl 3 hydroxy 2(5H) furanone, ou sotolon, molécule construite autour d'un cycle de quatre atomes de carbone et d'un atome d'oxygène. Comme le sotolon et la solérone sont en concentrations minimes dans les vins de voile et, de surcroît, chimiquement instables, les chimistes dijonnais ont cherché à optimiser leur extraction afin de déterminer la molécule responsable du goût de jaune.</p>

<p id="p4">L'analyse la plus directe d'extraits de vins est la chromatographie: on injecte un échantillon dans un solvant que l'on vaporise et on fait traverser au mélange une colonne revêtue intérieurement d'un polymère, qui retient les divers composés du mélange à des degrés divers; en bas de la colonne, on détecte la sortie des composés séparés. Le premier travail des chimistes fut la mise au point d'une variante de cette technique pour identifier les composés présents en quantités minimes dans des mélanges complexes.</p>

<p id="p5">Les chromatogrammes d'échantillons de vin furent alors comparés à ceux de solutions pures de sotolon et de solérone de synthèse: le sotolon est ainsi présent entre 40 et 150 parties par milliard dans les sherrys; la solérone semble moins spécifique, et ses concentrations sont supérieures dans les sherrys, ce qui explique pourquoi on l'a d'abord trouvée dans ces vins.</p>

<p id="p6">Enfin les dosages, complétés de tests sensoriels des fractions séparées, montrèrent que la solérone, aux concentrations trouvées dans du savagnin (le cépage à partir du quel on fabrique le vin jaune), n'était perçue par les consommateurs ni dans les vins, ni dans des solutions modèles: la solérone n'était pas la molécule caractéristique; le jugement était sans appel.</p>

<p id="p7">En 1992, les chimistes se consacrèrent alors complètement au sotolon, qui avait été observé dans des molasses de canne à sucre, dans des graines de fenugrec, dans de la sauce de soja, dans du saké... Il était également présent dans certains vins botrytisés, c'est-à-dire faits à partir de raisins surmaturés et atteints par la pourriture noble: ce champignon, Botrytis cinerea, fait, par exemple, les sauternes ou les vins dits de vendanges tardives. Le sotolon n'a pas été trouvé dans les vins rouges ni dans les vins oxydés et, surtout, il fut déterminé que son seuil de perception était de 15 parties par milliard seulement.</p>

<p id="p8">Mieux encore, des tests de consommation montrèrent que les vins de voile étaient jugés typiques, avec une note de noix, quand la concentration en sotolon était forte dans ces vins. A plus forte concentration, les jurys de dégustation décrivirent une note de curry.</p>

<p id="p9">La piste du sotolon est aujourd'hui suivie par Élisabeth Guichard, qui a mis au point une méthode rapide de dosage: la concentration en sotolon dans le vin de paille (un vin préparé à partir de baies séchées sur des claies), qui n'avaitpas été observée, est comprise entre 6 et 15 parties par milliard; le sotolon du vin jaune est synthétisé à la fin de la phase de croissance exponentielle des levures. Dans des vins vieillis respectivement un an, deux ans, trois ans, quatre ans, cinq ans et six ans, la quantité de sotolon est faible dans les débuts de la maturation et augmente notablement après quatre ans d'élevage, surtout dans les caves pas trop fraîches.</p>

<p id="p10">Des prélèvements à différentes profondeurs, sous le voile, dans les tonneaux, ont révélé que le sotolon est deux fois plus concentré au milieu et au fond des tonneaux que juste sous le voile. On suppose que le sotolon est indirectement produit par les levures du voile, quand le degré alcoolique est élevé: celles-ci transformeraient un acide aminé du vin en uncétoacide, qui serait libéré à la mort des levures, tombant au fond du tonneau; puis une réaction chimique transformerait lecétoacide en sotolon, enrichissant d'abord le fond, puis le milieu, puis les couches supérieures du vin.</p>

<p id="p11">Puisque le sotolon est bien la molécule du goût de jaune, on cherche aujourd'hui des souches de levures qui ont la capacité d'en produire beaucoup; on cherche aussi les conditions qui favorisent la production de ce goût.</p>

Thème général : vin jaune

<p id="p1">En 1991, à la Station INRA de Dijon, Patrick Étiévant et Bruno Martin commençaient l'analyse du vin jaune, produit seulement dans le Jura. Le goût spécifique de ces vins résulte de leur technique d'élevage: on laisse le vin vieillir entonneau pendant plusieurs années, sous un voile épais de levures Saccharomyces cerevisiae. Ce type de vin est également fabriqué en Alsace, en Bourgogne et à Gaillac sous le nom de vin de fleur ou vin de voile; il n'a d'équivalent à l'étranger que dans le xérès, les sherrys ou le tokay de Hongrie. Quelles molécules sont responsables de son goût caractéristique?</p>

<p id="p2">Les vins contiennent des centaines de composés volatils, dont un dixième sont aromatiques, de sorte que la détection des molécules responsables d'un arôme particulier est notoirement difficile: chercher le coupable, parmi 300 suspects... Au début des années 1970, certains avaient cru que la solérone (le 4 acétyl gamma butyrolactone) était l'arôme principal du vin jaune, mais, en 1982, Pierre Dubois, à Dijon, retrouva la solérone dans des vins rouges: la molécule avait un alibi.</p>

<p id="p3">On soupçonna alors le 4,5 diméthyl 3 hydroxy 2(5H) furanone, ou sotolon, molécule construite autour d'un cycle de quatre atomes de carbone et d'un atome d'oxygène. Comme le sotolon et la solérone sont en concentrations minimes dans les vins de voile et, de surcroît, chimiquement instables, les chimistes dijonnais ont cherché à optimiser leur extraction afin de déterminer la molécule responsable du goût de jaune.</p>

<p id="p4">L'analyse la plus directe d'extraits de vins est la chromatographie: on injecte un échantillon dans un solvant que l'on vaporise et on fait traverser au mélange une colonne revêtue intérieurement d'un polymère, qui retient les divers composés du mélange à des degrés divers; en bas de la colonne, on détecte la sortie des composés séparés. Le premier travail des chimistes fut la mise au point d'une variante de cette technique pour identifier les composés présents en quantités minimes dans des mélanges complexes.</p>

<p id="p5">Les chromatogrammes d'échantillons de vin furent alors comparés à ceux de solutions pures de sotolon et de solérone de synthèse: le sotolon est ainsi présent entre 40 et 150 parties par milliard dans les sherrys; la solérone semble moins spécifique, et ses concentrations sont supérieures dans les sherrys, ce qui explique pourquoi on l'a d'abord trouvée dans ces vins.</p>

<p id="p6">Enfin les dosages, complétés de tests sensoriels des fractions séparées, montrèrent que la solérone, aux concentrations trouvées dans du savagnin (le cépage à partir du quel on fabrique le vin jaune), n'était perçue par les consommateurs ni dans les vins, ni dans des solutions modèles: la solérone n'était pas la molécule caractéristique; le jugement était sans appel.</p>

<p id="p7">En 1992, les chimistes se consacrèrent alors complètement au sotolon, qui avait été observé dans des molasses de canne à sucre, dans des graines de fenugrec, dans de la sauce de soja, dans du saké... Il était également présent dans certains vins botrytisés, c'est-à-dire faits à partir de raisins surmaturés et atteints par la pourriture noble: ce champignon, Botrytis cinerea, fait, par exemple, les sauternes ou les vins dits de vendanges tardives. Le sotolon n'a pas été trouvé dans les vins rouges ni dans les vins oxydés et, surtout, il fut déterminé que son seuil de perception était de 15 parties par milliard seulement.</p>

<p id="p8">Mieux encore, des tests de consommation montrèrent que les vins de voile étaient jugés typiques, avec une note de noix, quand la concentration en sotolon était forte dans ces vins. A plus forte concentration, les jurys de dégustation décrivirent une note de curry.</p>

<p id="p9">La piste du sotolon est aujourd'hui suivie par Élisabeth Guichard, qui a mis au point une méthode rapide de dosage: la concentration en sotolon dans le vin de paille (un vin préparé à partir de baies séchées sur des claies), qui n'avaitpas été observée, est comprise entre 6 et 15 parties par milliard; le sotolon du vin jaune est synthétisé à la fin de la phase de croissance exponentielle des levures. Dans des vins vieillis respectivement un an, deux ans, trois ans, quatre ans, cinq ans et six ans, la quantité de sotolon est faible dans les débuts de la maturation et augmente notablement après quatre ans d'élevage, surtout dans les caves pas trop fraîches.</p>

<p id="p10">Des prélèvements à différentes profondeurs, sous le voile, dans les tonneaux, ont révélé que le sotolon est deux fois plus concentré au milieu et au fond des tonneaux que juste sous le voile. On suppose que le sotolon est indirectement produit par les levures du voile, quand le degré alcoolique est élevé: celles-ci transformeraient un acide aminé du vin en uncétoacide, qui serait libéré à la mort des levures, tombant au fond du tonneau; puis une réaction chimique transformerait lecétoacide en sotolon, enrichissant d'abord le fond, puis le milieu, puis les couches supérieures du vin.</p>

<p id="p11">Puisque le sotolon est bien la molécule du goût de jaune, on cherche aujourd'hui des souches de levures qui ont la capacité d'en produire beaucoup; on cherche aussi les conditions qui favorisent la production de ce goût.</p>

Thème local :

Thème global :

Meta-descripteurs :

vin

mélange, composé

analyse, technique

Thèmes local :

Thème global :

Méta-descripteureurs :

vin

goût, noisette

caractéristique

<seg>

L'analyse la plus directe d'extraits de

vins est la chromatographie : on injecte

un échantillon dans un solvant que l'on

vaporise et on fait traverser au

mélange une colonne revêtue

intérieurement d'un polymère, qui

retient les divers composés du

mélange à des degrés divers ; en bas

de la colonne, on détecte la sortie des

composés séparés. Le premier travail

des chimistes fut la mise au point d'une

variante de cette technique pour

identifier les composés présents en

quantités minimes dans des mélanges

complexes.

</seg>

Exemple d’exploration d’un texte

Page 39: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

39

Question-réponse

25 juillet 2003 – Pablo Lastras a remporté la 18e étape du Tour de France cycliste, vendredi, entre Bordeaux et Saint-Maixent-L'École.

Quel coureur espagnol a gagné une étape du tour de France en 2003 ? 

Pablo Lastras

Justification :

Réponse Justification de la réponse

Page 40: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

40

DST – type de relations

(1) Les résumés par extraction sélectionnent des phrases d’un texte source selon leur importance.

(2) Les critères d’importance incluent la présence de termes fréquents, des mots clefs tels que « en résumé », « meilleur », et la position de la phrase dans le texte.

(3) Cette approche est illustrée par le système ADAM.

(4) Un autre exemple est donné par [2].

(5) Le problème de cette approche est que les phrases extraites ne constituent pas toujours un texte cohérent du fait d’anaphores ambiguës.

Structuration fine de texte

Page 41: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

41

DST – Types de relations(1) Les résumés par extraction sélectionnent des phrases d’un texte source selon leur

importance.

(2) Les critères d’importance incluent la présence de termes fréquents, des mots clefs tels que « en résumé », « meilleur », et la position de la phrase dans le texte.

Subordination

(3) Cette approche est illustrée par le système ADAM.(4) Un autre exemple est donné par [2].

Coordination

(1) (2)

(3)

(4)

Structure construite

Structuration fine de texte

Page 42: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

42

REGAL - Principe de structuration

Algorithme Recherche des 2 segments

non-consécutifs les plus liés

Application récursive pour les segments englobés ou non englobés restant

Repérage de structures emboîtées [Masson, 1998]

Digressions, développements d’aspects particuliers

Fréquent dans textes expositifs

Structuration descendante de texte

Page 43: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

43

Compréhension de ce dont parle un texte Analyse thématique

Texte expositif

Les sujets (ex. Analyse thématique) Leur description

- hypothèses- méthodes- résultats

Leur structure

Texte narratif

Les situations (ex. Dédicace, Attentat) Leur description

- conditions- description- conséquences

Leur structure

Connaissances Forme (du texte, marques de surface) Syntaxe (phrase) Lexico-sémantico-pragmatiques

- lexique - ontologie- réseau de cooccurrences - domaines- schémas

Représentation du texte (des thèmes) + ou - structurée selon structuration des connaissances

Méthodes :Selon connaissances disponibles :

- Cohésion lexicale- Analyses de surface- Inférences

Page 44: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

44

Représentation du texte (des thèmes) + ou - structurée selon structuration des connaissannces

Méthodes :- Cohésion lexicale

Connaissances Forme (du texte, marques de surface) Syntaxe (phrase) Lexico-sémantico-pragmatiques

- lexique - ontologie- réseau de cooccurrences

Acquisition (partielle)- à partir de textes- en contexte- reste en relation avec la source

Méthodes :- similarité et agrégation

- domaines- classes de noms/verbe - schémas

- analyse distributionnelle- abstraction

- Analyse de surface

- Inférences

Compréhension de ce dont parle un texte Analyse thématique

Page 45: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

45

Résumé par abstraction

Résumé par sélection et génération

Résumé

Résumé par extraction

Thèmes

Résumé parabstraction

Résumé par sélection et génération

Résumé parextraction

Structure rhétorico-thématique

Résumé

Méthodes existantes

Méthode proposée

Introduction

DéfinitionExemple

DéfinitionExemple

Page 46: Comprendre pour apprendre … et apprendre pour comprendre Brigitte Grau Institut dInformatique dEntreprise (IIE) Groupe LIR - LIMSI Habilitation à Diriger

46

Rôles

Relations causales

Relations temporelles

Evénements

Réparer un véhicule

Rôles : personne, outil, véhiculeConditions:

Description

Résultat

Démonter pièce

Trouver panne

Une situation

Inférence

Structuration

Véhicule en panne

Connaître la mécaniqueVéhicule = rôle (véhicule)

Agent = rôle (personne)

Réparer pièceRemonter pièce

Agent = rôle (personne)

Véhicule fonctionneVéhicule = rôle (véhicule)

1

2

3

4

1.Résultat = pièce

Agent = rôle (personne)Pièce = 1.résultat

Ses propriétés