dialekti valsamou - presentation - 08 juin 2015

30
Apprentissage automatique pour l'extraction de réseaux de régulation géniques à partir d'articles DigiCosme ‐ Groupe de travail D2K Dialekti VALSAMOU ‐ 8 juin 2015 0

Upload: maiage-inra-paris-sud-limsi-cnrs

Post on 22-Jan-2018

238 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Dialekti VALSAMOU - Presentation - 08 juin 2015

Apprentissage automatique pourl'extraction de réseaux de régulation

géniques à partir d'articlesDigiCosme ‐ Groupe de travail D2K

Dialekti VALSAMOU ‐ 8 juin 2015

0

Page 2: Dialekti VALSAMOU - Presentation - 08 juin 2015

Plan de la présentation1.  Du texte aux connaissances

Un cas typique d'IE : du texte à l'ontologie2.  Le cas d'IE pour l'extraction d'un réseau, exemples de la vraievieChallenge BioNLP '13, ma thèse, ...

3.  Approfondir en IEUn système complet : du 0 au réseau (ou presque)Apprentissage pour l'extraction de relations

Page 3: Dialekti VALSAMOU - Presentation - 08 juin 2015

Du texte aux connaissancesUn exemple sur les bacteries

Page 4: Dialekti VALSAMOU - Presentation - 08 juin 2015

Du texte aux connaissancesUn exemple sur les bacteries

Page 5: Dialekti VALSAMOU - Presentation - 08 juin 2015

Du texte aux connaissancesUn exemple sur les bacteries

Page 6: Dialekti VALSAMOU - Presentation - 08 juin 2015

IE pour l'extraction d'un réseauChallenge BioNLP '13 : Tâche GRN, extraction d'un réseau

de régulation génique

Page 7: Dialekti VALSAMOU - Presentation - 08 juin 2015

IE pour l'extraction d'un réseauChallenge BioNLP '13 : Tâche GRN, extraction d'un réseau

de régulation génique

Page 8: Dialekti VALSAMOU - Presentation - 08 juin 2015

IE pour l'extraction d'un réseauChallenge BioNLP '13 : Tâche PC, Pathway curation

Page 9: Dialekti VALSAMOU - Presentation - 08 juin 2015

Réseau de régulation ailleurs :

IE pour l'extraction d'un réseauArabidopsis thaliana

Gene regulatory network for secondary cell wall biosynthesis in Arabidopsis root xylem. (Interactions)

Page 10: Dialekti VALSAMOU - Presentation - 08 juin 2015

IE pour l'extraction d'un réseauArabidopsis thaliana

Modèle de connaissance pour le réseau de régulation de la phasede développement de la graine

Page 11: Dialekti VALSAMOU - Presentation - 08 juin 2015

Un cycle complet d' IEComposantes

Page 12: Dialekti VALSAMOU - Presentation - 08 juin 2015

Un cycle complet d'IEArchitecture de la suite Alvis

Page 13: Dialekti VALSAMOU - Presentation - 08 juin 2015

Un cycle complet d'IEEditeur en ligne d'annotations

Page 14: Dialekti VALSAMOU - Presentation - 08 juin 2015

Un cycle complet d'IESchéma et Modèle A.thaliana

Modèle de connaissance pour le réseau de régulation de la phasede développement de la graine

Page 15: Dialekti VALSAMOU - Presentation - 08 juin 2015

Un cycle complet d'IEApprentissage Automatique

1.  Traitement linguistique :lemmmatisation,segmentation,POS tagginganalyse syntactique,...

2.  Extraction d'Entités Nommées3.  Résolution d'anaphores et coréférences4.  Extraction de relations (binaire) et événements (n‐naire)

Page 16: Dialekti VALSAMOU - Presentation - 08 juin 2015

Un cycle complet d'IEApprentissage Automatique

1.  Traitement linguistique2.  Extraction d'Entités Nommées :

terminologies (source ou résultat),ontologies, (source, alignement..)règles,apprentissage, ...

3.  Résolution d'anaphores et coréférences4.  Extraction de relations (binaire) et événements (n‐naire)

Page 17: Dialekti VALSAMOU - Presentation - 08 juin 2015

Un cycle complet d'IEApprentissage Automatique

1.  Traitement linguistique2.  Extraction d'Entités Nommées3.  Résolution d'anaphores et coréférences :

systèmes de règles4.  Extraction de relations (binaire) et événements (n‐naire)

Page 18: Dialekti VALSAMOU - Presentation - 08 juin 2015

Un cycle complet d'IEApprentissage Automatique

1.  Traitement linguistique2.  Extraction d'Entités Nommées3.  Résolution d'anaphores et coréférences4.  Extraction de relations (binaire) et événements (n-naire) :

rel. binaires : entre deux arguments (entités)événements : relations plus complèxes

approches à features ou à noyau (fonctions de similarité)plusieurs type d'informations exploitéespre‐traitement des données : syntaxe, surface, ..sources et outils externes (semantique distributionnelle)

Page 19: Dialekti VALSAMOU - Presentation - 08 juin 2015

Un cycle complet d'IEExtraction de Relations par AlvisRE

Approche à noyau, basée sur informations syntaxiques etsémantiques1.  Preparation de la représentation

Calcul de co‐occurrencesChemin entre arguments sur le graphe de dépencencessyntaxiques

2.  Calcul de matrice de similaritéFonction de similarité: alignement global de séquence

3.  ClassificationSVM linéaire (Empirical Kernel Map)

Page 20: Dialekti VALSAMOU - Presentation - 08 juin 2015

Un cycle complet d'IEExtraction de Relations par AlvisRE

Combine l'intuition d'une fonction de similarité...Pas besoin de feature engineering

.. avec une représentation vectoriellecompatible avec les features supplémentaires

Chaque instance est représentée parUn vecteur composé de la similarité entre cette instance ettous les instances d'entraînement

Page 21: Dialekti VALSAMOU - Presentation - 08 juin 2015

Représentation

Un cycle complet d'IEExtraction de Relations par AlvisRE

Page 22: Dialekti VALSAMOU - Presentation - 08 juin 2015

Représentation

Un cycle complet d'IEExtraction de Relations par AlvisRE

Page 23: Dialekti VALSAMOU - Presentation - 08 juin 2015

Représentation

Un cycle complet d'IEExtraction de Relations par AlvisRE

Page 24: Dialekti VALSAMOU - Presentation - 08 juin 2015

Représentation

Un cycle complet d'IEExtraction de Relations par AlvisRE

Page 25: Dialekti VALSAMOU - Presentation - 08 juin 2015

Représentation

Un cycle complet d'IEExtraction de Relations par AlvisRE

Page 26: Dialekti VALSAMOU - Presentation - 08 juin 2015

Représentation

Un cycle complet d'IEExtraction de Relations par AlvisRE

Page 27: Dialekti VALSAMOU - Presentation - 08 juin 2015

Alignement

Un cycle complet d'IEExtraction de Relations par AlvisRE

Page 28: Dialekti VALSAMOU - Presentation - 08 juin 2015

Results on Benchmarks

Un cycle complet d'IEExtraction de Relations par AlvisRE

Corpus "Concurrence" AlvisRE‐‐ PRE REC F1 PRE REC F1LLL 70,9 95,4 79,7 63,3 77,1 69,5BB 28 82 42 70 51 59

Page 30: Dialekti VALSAMOU - Presentation - 08 juin 2015

merci!