wp5: microbial bioinformatics (mb)

12
WP5: Microbial bioinformatics (MB) Assemblée Générale n°3 Institut Français Bioinformatique – les 30 & 31 Janvier 2017 Coordination: C. Médigue & S. brisse

Upload: others

Post on 16-Oct-2021

3 views

Category:

Documents


0 download

TRANSCRIPT

WP5: Microbial bioinformatics (MB)

AssembléeGénéralen°3InstitutFrançaisBioinformatique– les30&31Janvier2017

Coordination: C. Médigue & S. brisse

Partenaires du thème MB

10 plate-formes:l IFB-NE: bilille (M. Pupin)l IFB-APLIBIO: MicroScope (C. Médigue),

IPasteur (O. Gascuel), MIGALE (JF. Gibrat), eBio (D. Gautheret)

l IFB-SO: CBiB (M. Nikolski), GenoToul (C. Gaspin), ISFinder (M. Chandler)

l IFB-GS: IGS (JM Claverie), CAZy (B. Henrissat)

Rassemble des experts qui développent:l Des bases de données manuellement curéesl Des outils bioinformatiques dédiés

En réponse aux besoins générés par les projets mis en place par les PIA et les besoins en analyse de données métagénomiques :

Développer des pipelines permettant la gestion et l’analyse d’échantillons métagénomique (pre-processing des données, assignation taxonomique, assemblage, annotation syntaxique & fonctionnelle)

=> service complet d’annotation de données métagénomique

MB: objectifs

Développer des BD et outils destinés à l’analyse de centaines de génomes, en particulier dans le contexte d’analyses épidémiologiques

Intégration de données d’annotation d’éléments spécifiques sur les génomes microbiens (CRISPR, IS, etc) et de fonctions biologiques particulières (gènes NRP synthétases, enzymes CAZy, etc)

Task1

Task2

Task3

Pipelines développés/en cours§ Pre-processing des données et assignation taxonomique (basée sur

Centrifuge aujourd’hui)§ Test en cours: utilisation de SortMeRNA sur une BD curée de 16S

§ Metagenome Assembly (selected assembly tools, scaffolding, polishing, &statistics)

§ En cours: étape de « binning des données avant ET après l’assemblage§ Annotation syntaxique & fonctionnelle de métagénomes: intègre

DIAMOND pour l’analyse de pathogènes (résistance, virulence, toxines)§ En cours: extraction de WorkFlows MicroScope

§ Beta version de CRISPRdetect: détection de CRISPR sur les séquences d’ADN-> source code on GitHUB: https://github.com/JurMich/CRISPRDetect

Task1

§ CoreGeneBuilder: construction automatique du core genome de N souches-> source code GitHUB (v1) https://github.com/C3BI-pasteur-fr/CoreGeneBuilder/En cours: implémentation du core genome « genotyping » (cgMLST) pour des espèces d’intérêt médical

Task2

Task3

Mise à disposition dans le Cloud IFB

Task1

CoreGeneBuilder est disponible sous l'Appliance 'CoreGeneBuilder’.

Task2

Task3

• ensemble des workflows permettant d’offrir un service d’annotation de métagénomes• architecture micro-service • Déploiement sur une instance Cloud OpenStackde l’IFB-Core

Version 3 (en cours):

Version 1&2: déjà déployée

https://cloud.france-bioinformatique.fr/cloud

CRISPRdetect et antiSMASH(cluster de gènes de métabolites secondaires): disponibles sous l’Appliance « MicrobAnnot »

BD pour la génomique épidémiologique

Task2

Shared nomenclatures :proposal for L. monocytogenes

BIGSdb instance @ pasteur• Automated curation

/queries using RESTfulAPIs in progress (K. Jolley@ Oxford)

http://bigsdb.pasteur.fr/listeria

BD d’éléments génétiques d’intérêt

Task3

• The update version of CRISPRdb data is now online- Collaboration with David Couvin (eBIO)

http://crispr.i2bc.paris-saclay.fr/crispr/

• Norine : database of nonribosomal peptidesEn cours: nouvelles données NRPs extraites automatiquement de la littérature

- intégration du nouveau logiciel de prédiction des CRISPR et le logiciel de prédiction des gènes Cas développé à l’Institut Pasteur

- moderniser l'interface d'interrogation de la base de données

- fournir de nouveaux outils d'analyse

CRISPR-Cas++ (projet IFB 2016)I2BC/Pasteur/Lille

Publications in 2016-early 2017Norine : NAR Database Issue 2016

cgMLST Listeria monocytogenes :Nature Microbiol. 2016

MicroScope : NAR Database Issue 2017 - AntiSMAH

- Interface de soumission des génomes

INSYGHT : Bioinformatics 2016

CAZyChip : BMC Genomics 2016

Formations dans le cadre de l’axe MB

Ø September 12th-16th 2016: summer course on « Functional and taxonomic analysis of metagenomic data » (Institut Pasteur) => Organisation et animation des tutoriels (Adrien Josso et Erwan Corre)

Ø WorkshopsurlaGenomique épidémiologique printempsouautomne2017(InstitutPasteur)

Ø Juillet 2017: summer School 2017 on Metagenomes analysis (Genopole Evry, FG, IFB) : Exposés invités, démos & tutoriels (VM PathoTrack)

Perspectives

Ø Répondre à l’interrogation du SAB = « Proposed cross-links will be valuable but it was unclear how much integrationbetween resources has been achieved to date »

Ø A partir de l’ensemble des composants d’annotation déployés dans le Cloud IFB, développer un pipeline complet d’annotation de métagénomes (+ interfaces graphiques)

Ø Déploiement de la plateforme MicroScope dans le Cloud IFB (projet IFB MICROCLOUD)

Ø Relier les données d’épidémiologie avec les données d’annotation fonctionnelles des souches étudiées (lien BIGSDB –MicroScope)

=> Interopérabilité des données: web sémantique – format RDF (Resource Description Framework)

Ø the EXCELERATE ELIXIR project• use case “Marine metagenomic infrastructure as driver for research and industrial innovation” (Database for Marine metagenomics)• WP technologiques “Capacity Building in Genome Assembly and Annotation”

Le pôle MB et ELIXIR

Ø Implementation Study on Integration of Data Node Resourcestasks 3 “A microbial metabolism resource for Systems Biology »

3 noeuds ELIXIR: ELIXIR-EMBL, ELIXIR-CH, ELIXIR-FR

=> Interopérabilité des ressources SP/HAMAP, EmsemblBacteria, MicroScope, Rhea/ChEBI via le format RDF/SPARQL

Les participantsl CEA – LabGEM / MicroScope

- Adrien Josso, Stéphane Cruveiller, David Vallenet, Claudine Médigue

l Institut Pasteur – GEM & C3BI/hub- Elise Larsonneur, Alexandra Moura, Eduardo Rocha, Sylvain Brisse

l Lille University – platform bilille- Juraj Michalik, Loïc Coudert, Maude Pupin