ble-presentation
TRANSCRIPT
Dialekti Valsamou ~ 17 Février 2011Réunion Équipe Bibliome
Projet FSOV/SAM
Dialekti Valsamou ~ 17 Février 2011Réunion Équipe Bibliome
Les Partenaires
● INRA ● Clermont-Ferrand
– Unité Génétique, Diversité et Ecophysiologie des Céréales (GDEC) [Coordinateur]
● MIG (!)● ARVALIS - Institut du végétal● UFS (Union Française des Semenciers)
Dialekti Valsamou ~ 17 Février 2011Réunion Équipe Bibliome
L'objectif
● Le partage de connaissances entre partenaires en forme d'une...
Base de Connaissances● Base de données extraite de la bibliographie● Vérifiée, testée par les experts & des expériences (ex .
phénotypage)● Mise à jour en continu
Dialekti Valsamou ~ 17 Février 2011Réunion Équipe Bibliome
L'organisation
● En trois années● Création de la base● Validation● ...
● MIG est impliqué surtout dans la phase 1 – création de la base
Dialekti Valsamou ~ 17 Février 2011Réunion Équipe Bibliome
Nos propres objectifs
● Moteur de recherche (AlvisIR)● Aide à la recherche manuelle par les partenaires● Permet le retour par les partenaires
● Ontologie ● Gène● Marqueur● Variété● Caractère (phénotype)
Dialekti Valsamou ~ 17 Février 2011Réunion Équipe Bibliome
Notre Partie* l'étoile indique 'In progress/Coming'
● Extraction des articles à partir du web– Trouver– Récupérer– Transformer en texte
● TAL des articles– Définir les bons outils (lexiques, termes etc)
● Aide par des Experts
● Transformer l'information en Ontologie● Créer une Base de Données
Dialekti Valsamou ~ 17 Février 2011Réunion Équipe Bibliome
Extraction d'Information à partir du Web [1]
● Collection: recherche par mots-clés ou par « Related/Citing » - offline , batch
● Web of Science – Thomson Reuters● Web service pour les détails bibliographiques
– Pas de liens vers les éditeurs/article– Identifient unique Thomson/Reuters
● « Article Match Retrieval » Service (xml toujours)– DOI/PupMed ID/etc– Liens vers la page normale de WoS
Dialekti Valsamou ~ 17 Février 2011Réunion Équipe Bibliome
Extraction d'Information à partir du Web [2]
● Récupérer le lien vers l'éditeur● DOI : dx.doi.org● PMID : google-scholar *● UT : WoS (à voir) *
● Récupérer le pdf / html chez l'éditeur● Transformer en texte *
● PDF– Acrobat / Pdftotext– Abbyy
● HTML ***
Dialekti Valsamou ~ 17 Février 2011Réunion Équipe Bibliome
Traitement du texte
● Utilisation d' AlvisNLP● Les bons lexiques
● Utilisation des ressources disponibles : *– Données BIO: GrainGenes, MASWheat, SwissProt,...– Données Agro : GG,MASWheat, listes Arvalis, commerciales...
● Validation par les experts nécessaire *– mais pas donnée.... surtout pour les données type 'langue
naturelle' + agronomiques
Dialekti Valsamou ~ 17 Février 2011Réunion Équipe Bibliome
Moteur de Recherche [1]
● Utilisation d' AlvisIR● Recherches par mots-clés, catégories, … - online*● Résultats avec « valeur ajoutée »
● Snippets, étiquettés et coloriés● Lien vers la source● Structures et statistiques extraites
● Question des privilèges des utilisateurs (partenaires) *
Dialekti Valsamou ~ 17 Février 2011Réunion Équipe Bibliome
Moteur de Recherche [2]
● Adaptation d'AlvisIR *● Info biliographique ● Structures/champs pertinents● Autres idées bienvenues
● Retour par les utilisateurs *● Validation/ évaluation des résultats par les utilisateurs
– Utilisation de cette information (?)
Dialekti Valsamou ~ 17 Février 2011Réunion Équipe Bibliome
Ontologie
● La même nécessité des lexiques et validation● PLUS :
● Relations entre les termes à– Définir à la main *– Donner par les experts *– Apprendre *– Valider par les experts *
● Interface appropriée
Dialekti Valsamou ~ 17 Février 2011Réunion Équipe Bibliome
Base de Données
● A voir … ****● Questions de caractère
– Informatique– Administratif– Pratique– De stratégies / préférences des partenaires
Dialekti Valsamou ~ 17 Février 2011Réunion Équipe Bibliome
Prochaines Étapes
● L'utilisation et verification de la base de connaissance par les partenaires
Dialekti Valsamou ~ 17 Février 2011Réunion Équipe Bibliome
Merci de votre patience !
D'autres questions ?