Download - WP5: Microbial bioinformatics (MB)
WP5: Microbial bioinformatics (MB)
AssembléeGénéralen°3InstitutFrançaisBioinformatique– les30&31Janvier2017
Coordination: C. Médigue & S. brisse
Partenaires du thème MB
10 plate-formes:l IFB-NE: bilille (M. Pupin)l IFB-APLIBIO: MicroScope (C. Médigue),
IPasteur (O. Gascuel), MIGALE (JF. Gibrat), eBio (D. Gautheret)
l IFB-SO: CBiB (M. Nikolski), GenoToul (C. Gaspin), ISFinder (M. Chandler)
l IFB-GS: IGS (JM Claverie), CAZy (B. Henrissat)
Rassemble des experts qui développent:l Des bases de données manuellement curéesl Des outils bioinformatiques dédiés
En réponse aux besoins générés par les projets mis en place par les PIA et les besoins en analyse de données métagénomiques :
Développer des pipelines permettant la gestion et l’analyse d’échantillons métagénomique (pre-processing des données, assignation taxonomique, assemblage, annotation syntaxique & fonctionnelle)
=> service complet d’annotation de données métagénomique
MB: objectifs
Développer des BD et outils destinés à l’analyse de centaines de génomes, en particulier dans le contexte d’analyses épidémiologiques
Intégration de données d’annotation d’éléments spécifiques sur les génomes microbiens (CRISPR, IS, etc) et de fonctions biologiques particulières (gènes NRP synthétases, enzymes CAZy, etc)
Task1
Task2
Task3
Pipelines développés/en cours§ Pre-processing des données et assignation taxonomique (basée sur
Centrifuge aujourd’hui)§ Test en cours: utilisation de SortMeRNA sur une BD curée de 16S
§ Metagenome Assembly (selected assembly tools, scaffolding, polishing, &statistics)
§ En cours: étape de « binning des données avant ET après l’assemblage§ Annotation syntaxique & fonctionnelle de métagénomes: intègre
DIAMOND pour l’analyse de pathogènes (résistance, virulence, toxines)§ En cours: extraction de WorkFlows MicroScope
§ Beta version de CRISPRdetect: détection de CRISPR sur les séquences d’ADN-> source code on GitHUB: https://github.com/JurMich/CRISPRDetect
Task1
§ CoreGeneBuilder: construction automatique du core genome de N souches-> source code GitHUB (v1) https://github.com/C3BI-pasteur-fr/CoreGeneBuilder/En cours: implémentation du core genome « genotyping » (cgMLST) pour des espèces d’intérêt médical
Task2
Task3
Mise à disposition dans le Cloud IFB
Task1
CoreGeneBuilder est disponible sous l'Appliance 'CoreGeneBuilder’.
Task2
Task3
• ensemble des workflows permettant d’offrir un service d’annotation de métagénomes• architecture micro-service • Déploiement sur une instance Cloud OpenStackde l’IFB-Core
Version 3 (en cours):
Version 1&2: déjà déployée
https://cloud.france-bioinformatique.fr/cloud
CRISPRdetect et antiSMASH(cluster de gènes de métabolites secondaires): disponibles sous l’Appliance « MicrobAnnot »
BD pour la génomique épidémiologique
Task2
Shared nomenclatures :proposal for L. monocytogenes
BIGSdb instance @ pasteur• Automated curation
/queries using RESTfulAPIs in progress (K. Jolley@ Oxford)
http://bigsdb.pasteur.fr/listeria
BD d’éléments génétiques d’intérêt
Task3
• The update version of CRISPRdb data is now online- Collaboration with David Couvin (eBIO)
http://crispr.i2bc.paris-saclay.fr/crispr/
• Norine : database of nonribosomal peptidesEn cours: nouvelles données NRPs extraites automatiquement de la littérature
- intégration du nouveau logiciel de prédiction des CRISPR et le logiciel de prédiction des gènes Cas développé à l’Institut Pasteur
- moderniser l'interface d'interrogation de la base de données
- fournir de nouveaux outils d'analyse
CRISPR-Cas++ (projet IFB 2016)I2BC/Pasteur/Lille
Publications in 2016-early 2017Norine : NAR Database Issue 2016
cgMLST Listeria monocytogenes :Nature Microbiol. 2016
MicroScope : NAR Database Issue 2017 - AntiSMAH
- Interface de soumission des génomes
INSYGHT : Bioinformatics 2016
CAZyChip : BMC Genomics 2016
Formations dans le cadre de l’axe MB
Ø September 12th-16th 2016: summer course on « Functional and taxonomic analysis of metagenomic data » (Institut Pasteur) => Organisation et animation des tutoriels (Adrien Josso et Erwan Corre)
Ø WorkshopsurlaGenomique épidémiologique printempsouautomne2017(InstitutPasteur)
Ø Juillet 2017: summer School 2017 on Metagenomes analysis (Genopole Evry, FG, IFB) : Exposés invités, démos & tutoriels (VM PathoTrack)
Perspectives
Ø Répondre à l’interrogation du SAB = « Proposed cross-links will be valuable but it was unclear how much integrationbetween resources has been achieved to date »
Ø A partir de l’ensemble des composants d’annotation déployés dans le Cloud IFB, développer un pipeline complet d’annotation de métagénomes (+ interfaces graphiques)
Ø Déploiement de la plateforme MicroScope dans le Cloud IFB (projet IFB MICROCLOUD)
Ø Relier les données d’épidémiologie avec les données d’annotation fonctionnelles des souches étudiées (lien BIGSDB –MicroScope)
=> Interopérabilité des données: web sémantique – format RDF (Resource Description Framework)
Ø the EXCELERATE ELIXIR project• use case “Marine metagenomic infrastructure as driver for research and industrial innovation” (Database for Marine metagenomics)• WP technologiques “Capacity Building in Genome Assembly and Annotation”
Le pôle MB et ELIXIR
Ø Implementation Study on Integration of Data Node Resourcestasks 3 “A microbial metabolism resource for Systems Biology »
3 noeuds ELIXIR: ELIXIR-EMBL, ELIXIR-CH, ELIXIR-FR
=> Interopérabilité des ressources SP/HAMAP, EmsemblBacteria, MicroScope, Rhea/ChEBI via le format RDF/SPARQL