bioinformatique abi-1001 2 ième partie: la bioinformatique structurale la bioinformatique...

42
Bioinformatique Bioinformatique ABI-1001 ABI-1001 2 2 ième ième partie: partie: La Bioinformatique Structurale La Bioinformatique Structurale

Upload: fernande-belin

Post on 04-Apr-2015

120 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

BioinformatiqueBioinformatiqueABI-1001ABI-1001

BioinformatiqueBioinformatiqueABI-1001ABI-1001

2 2 ième ième partie:partie:

La Bioinformatique StructuraleLa Bioinformatique Structurale2 2 ième ième partie:partie:

La Bioinformatique StructuraleLa Bioinformatique Structurale

Page 2: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Avant-propos…Avant-propos…

• La bioinformatique La bioinformatique structurale est devenue structurale est devenue une nécessité, compte une nécessité, compte tenu de la croissance tenu de la croissance exponentielle des données exponentielle des données génomiques.génomiques.– 22 millions de séquences 22 millions de séquences

dans plus de 100000 dans plus de 100000 espèces (GenBank). espèces (GenBank).

– Double de volume à tous les Double de volume à tous les 15 mois15 mois

– Un peu moins de 30000 Un peu moins de 30000 structures connues dans structures connues dans PDB.PDB.

– Chaque structure ~25000$Chaque structure ~25000$

• La bioinformatique La bioinformatique structurale est devenue structurale est devenue une nécessité, compte une nécessité, compte tenu de la croissance tenu de la croissance exponentielle des données exponentielle des données génomiques.génomiques.– 22 millions de séquences 22 millions de séquences

dans plus de 100000 dans plus de 100000 espèces (GenBank). espèces (GenBank).

– Double de volume à tous les Double de volume à tous les 15 mois15 mois

– Un peu moins de 30000 Un peu moins de 30000 structures connues dans structures connues dans PDB.PDB.

– Chaque structure ~25000$Chaque structure ~25000$

Page 3: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Importance de la structure 3DImportance de la structure 3D

• Classification structurale et élaboration de Classification structurale et élaboration de bibliothèque protéomique.bibliothèque protéomique.

• Comparaisons de structures Comparaisons de structures Fonction. Fonction.

• Alignements structuraux Alignements structuraux mieux conservés que mieux conservés que la séquence la séquence évolution. évolution.

• Ingénierie et modélisation des protéines Ingénierie et modélisation des protéines recherche de nouveaux médicaments (drug recherche de nouveaux médicaments (drug design) et de mutants spécifiques.design) et de mutants spécifiques.

• Classification structurale et élaboration de Classification structurale et élaboration de bibliothèque protéomique.bibliothèque protéomique.

• Comparaisons de structures Comparaisons de structures Fonction. Fonction.

• Alignements structuraux Alignements structuraux mieux conservés que mieux conservés que la séquence la séquence évolution. évolution.

• Ingénierie et modélisation des protéines Ingénierie et modélisation des protéines recherche de nouveaux médicaments (drug recherche de nouveaux médicaments (drug design) et de mutants spécifiques.design) et de mutants spécifiques.

Page 4: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Le dogme central de la biologie structuraleLe dogme central de la biologie structurale

• La fonction d’une protéine La fonction d’une protéine est tributaire de sa est tributaire de sa structure.structure.

– Activité enzymatique.Activité enzymatique.• a.a. du site catalytiquea.a. du site catalytique• Identité du substratIdentité du substrat• Cofacteur et site de Cofacteur et site de

régulationrégulation

– Rôle biologique et Rôle biologique et localisation cellulaire ou localisation cellulaire ou tissulaire.tissulaire.

– Implication phénotypique et Implication phénotypique et pathologique.pathologique.

• La fonction d’une protéine La fonction d’une protéine est tributaire de sa est tributaire de sa structure.structure.

– Activité enzymatique.Activité enzymatique.• a.a. du site catalytiquea.a. du site catalytique• Identité du substratIdentité du substrat• Cofacteur et site de Cofacteur et site de

régulationrégulation

– Rôle biologique et Rôle biologique et localisation cellulaire ou localisation cellulaire ou tissulaire.tissulaire.

– Implication phénotypique et Implication phénotypique et pathologique.pathologique.

StructureStructure

Gène (ADN)Gène (ADN)

FonctionFonction

Phénotype,Pathologie…Phénotype,Pathologie…

Page 5: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Le génome: le Klondike…(Data Mining)Le génome: le Klondike…(Data Mining)

Recherche de gènes Recherche de gènes ou ou

de séquences similairesde séquences similaires

Recherche de gènes Recherche de gènes ou ou

de séquences similairesde séquences similaires

Prédiction de structure Prédiction de structure et de fonctionet de fonction

Prédiction de structure Prédiction de structure et de fonctionet de fonction

Homologie Homologie comparativecomparativeHomologie Homologie comparativecomparative

Reconnaissance de Reconnaissance de repliement protéique repliement protéique

(Threading)(Threading)

Reconnaissance de Reconnaissance de repliement protéique repliement protéique

(Threading)(Threading)

Prédiction Ab Prédiction Ab initioinitio

Prédiction Ab Prédiction Ab initioinitio

Page 6: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

La bioinformatique structurale???La bioinformatique structurale???

• VisualisationVisualisation– Création de software pouvant traiter le plus d’information Création de software pouvant traiter le plus d’information

structurale possible (ex. surface électrostatique, site fonctionnel, structurale possible (ex. surface électrostatique, site fonctionnel, zone de variabilité génétique…).zone de variabilité génétique…).

• ClassificationClassification– Regroupement de structures similaires en famille, superfamille et Regroupement de structures similaires en famille, superfamille et

subdivision. Classification selon certain domaines structuraux ou subdivision. Classification selon certain domaines structuraux ou catalytiques (ex. SCOP, CATH).catalytiques (ex. SCOP, CATH).

• PrédictionPrédiction– Modélisation par homologie de séquence, technique de Modélisation par homologie de séquence, technique de

reconnaissance de repliement et prédiction Ab initio.reconnaissance de repliement et prédiction Ab initio.

• SimulationSimulation– Utilisation de mécanique ou de dynamique moléculaire afin de Utilisation de mécanique ou de dynamique moléculaire afin de

déterminer la conformation énergétiquement favorable d’une déterminer la conformation énergétiquement favorable d’une protéine. Arrimage moléculaire (docking).protéine. Arrimage moléculaire (docking).

• VisualisationVisualisation– Création de software pouvant traiter le plus d’information Création de software pouvant traiter le plus d’information

structurale possible (ex. surface électrostatique, site fonctionnel, structurale possible (ex. surface électrostatique, site fonctionnel, zone de variabilité génétique…).zone de variabilité génétique…).

• ClassificationClassification– Regroupement de structures similaires en famille, superfamille et Regroupement de structures similaires en famille, superfamille et

subdivision. Classification selon certain domaines structuraux ou subdivision. Classification selon certain domaines structuraux ou catalytiques (ex. SCOP, CATH).catalytiques (ex. SCOP, CATH).

• PrédictionPrédiction– Modélisation par homologie de séquence, technique de Modélisation par homologie de séquence, technique de

reconnaissance de repliement et prédiction Ab initio.reconnaissance de repliement et prédiction Ab initio.

• SimulationSimulation– Utilisation de mécanique ou de dynamique moléculaire afin de Utilisation de mécanique ou de dynamique moléculaire afin de

déterminer la conformation énergétiquement favorable d’une déterminer la conformation énergétiquement favorable d’une protéine. Arrimage moléculaire (docking).protéine. Arrimage moléculaire (docking).

Page 7: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Rappel sur la structure des protéinesRappel sur la structure des protéines

• Structure primaire:Structure primaire: – l’ordre des a.a. le long de la l’ordre des a.a. le long de la

chaîne polypeptidique, i.e. la chaîne polypeptidique, i.e. la séquence.séquence.

• Structure secondaireStructure secondaire::– l’organisation locale du l’organisation locale du

squelette de la protéine; squelette de la protéine; hélice hélice , feuillet , feuillet , les tours , les tours et les boucles.et les boucles.

• Structure tertiaire: Structure tertiaire: – assemblage spatial des assemblage spatial des

éléments de structures éléments de structures secondaires.secondaires.

• Structure quaternaire:Structure quaternaire: – formation d’un complexe formation d’un complexe

multimèrique de protéines.multimèrique de protéines.

• Structure primaire:Structure primaire: – l’ordre des a.a. le long de la l’ordre des a.a. le long de la

chaîne polypeptidique, i.e. la chaîne polypeptidique, i.e. la séquence.séquence.

• Structure secondaireStructure secondaire::– l’organisation locale du l’organisation locale du

squelette de la protéine; squelette de la protéine; hélice hélice , feuillet , feuillet , les tours , les tours et les boucles.et les boucles.

• Structure tertiaire: Structure tertiaire: – assemblage spatial des assemblage spatial des

éléments de structures éléments de structures secondaires.secondaires.

• Structure quaternaire:Structure quaternaire: – formation d’un complexe formation d’un complexe

multimèrique de protéines.multimèrique de protéines.

CESTLALIGNEMENTDESAACESTLALIGNEMENTDESAA

Page 8: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Visualisation: format de fichierVisualisation: format de fichier

• Il existe plusieurs formats de données et de protocoles Il existe plusieurs formats de données et de protocoles pour représenter la structure des macromolécules.pour représenter la structure des macromolécules.

– PDB(Protein Data Bank), mmCIF (macromolecular PDB(Protein Data Bank), mmCIF (macromolecular Crystallographic Information File), XML (extensible markup Crystallographic Information File), XML (extensible markup language), DTD (Document Type Definition)…language), DTD (Document Type Definition)…

• De par sa De par sa simplicitésimplicité et son et son efficacitéefficacité à représenter des à représenter des structures tridimensionnelles, le format PDB (Protein Data structures tridimensionnelles, le format PDB (Protein Data Bank) reste tout de même le format Bank) reste tout de même le format le plus supportéle plus supporté par par les programmes de visualisation et d’échange de données les programmes de visualisation et d’échange de données structurales.structurales.

• Il existe plusieurs formats de données et de protocoles Il existe plusieurs formats de données et de protocoles pour représenter la structure des macromolécules.pour représenter la structure des macromolécules.

– PDB(Protein Data Bank), mmCIF (macromolecular PDB(Protein Data Bank), mmCIF (macromolecular Crystallographic Information File), XML (extensible markup Crystallographic Information File), XML (extensible markup language), DTD (Document Type Definition)…language), DTD (Document Type Definition)…

• De par sa De par sa simplicitésimplicité et son et son efficacitéefficacité à représenter des à représenter des structures tridimensionnelles, le format PDB (Protein Data structures tridimensionnelles, le format PDB (Protein Data Bank) reste tout de même le format Bank) reste tout de même le format le plus supportéle plus supporté par par les programmes de visualisation et d’échange de données les programmes de visualisation et d’échange de données structurales.structurales.

Page 9: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Le format PDBLe format PDB

• Contient:Contient:

– Les coordonnées atomiques, Les coordonnées atomiques,

– Certaines spécificités chimiques et biochimiques,Certaines spécificités chimiques et biochimiques,

– Des détails expérimentaux, Des détails expérimentaux,

– Des informations structurales comme la reconnaissance de Des informations structurales comme la reconnaissance de structures secondaires,structures secondaires,

– Les liaisons hydrogènes,Les liaisons hydrogènes,

– L’assemblage biologique et les sites actifs.L’assemblage biologique et les sites actifs.

• Contient:Contient:

– Les coordonnées atomiques, Les coordonnées atomiques,

– Certaines spécificités chimiques et biochimiques,Certaines spécificités chimiques et biochimiques,

– Des détails expérimentaux, Des détails expérimentaux,

– Des informations structurales comme la reconnaissance de Des informations structurales comme la reconnaissance de structures secondaires,structures secondaires,

– Les liaisons hydrogènes,Les liaisons hydrogènes,

– L’assemblage biologique et les sites actifs.L’assemblage biologique et les sites actifs.

Page 10: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Le format PDBLe format PDB

HEADER ELECTRON TRANSPORT 19-MAR-90 2TRX 2TRXA 1COMPND THIOREDOXIN 2TRXA 2SOURCE (ESCHERICHIA $COLI) 2TRX 4AUTHOR S.K.KATTI,D.M.LE*MASTER,H.EKLUND 2TRX 5REVDAT 2 15-JAN-93 2TRXA 1 HEADER COMPND 2TRXA 3REVDAT 1 15-OCT-91 2TRX 0 2TRX 6JRNL AUTH S.K.KATTI,D.M.LE*MASTER,H.EKLUND 2TRX 7JRNL TITL CRYSTAL STRUCTURE OF THIOREDOXIN FROM ESCHERICHIA 2TRX 8JRNL TITL 2 $COLI AT 1.68 ANGSTROMS RESOLUTION 2TRX 9JRNL REF J.MOL.BIOL. V. 212 167 1990 2TRX 10JRNL REFN ASTM JMOBAK UK ISSN 0022-2836 070 2TRX 11REMARK 1

HEADER – Fonction, date, code d’accès PDB.CMPND – Nom de la protéine ou de la macromolécule.SOURCE – Origine ou source de la molécule (espèce).REVDAT – Date de révision.JRNL – Première référence décrivant la structure (auteur, journal…).REMARK – Des commentaires de l’auteur sur la structure.

HEADER – Fonction, date, code d’accès PDB.CMPND – Nom de la protéine ou de la macromolécule.SOURCE – Origine ou source de la molécule (espèce).REVDAT – Date de révision.JRNL – Première référence décrivant la structure (auteur, journal…).REMARK – Des commentaires de l’auteur sur la structure.

Page 11: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

SEQRES – Séquence de la protéine par code à trois lettres.SEQRES – Séquence de la protéine par code à trois lettres.HET – Le nom des hétéroatomes.HET – Le nom des hétéroatomes.SEQRES – Séquence de la protéine par code à trois lettres.SEQRES – Séquence de la protéine par code à trois lettres.HET – Le nom des hétéroatomes.HET – Le nom des hétéroatomes.

Le format PDBLe format PDB

REMARK 6 CORRECTION. CORRECT CLASSIFICATION ON HEADER RECORD AND 2TRXA 5REMARK 6 REMOVE E.C. CODE. 15-JAN-93. 2TRXA 6SEQRES 1 A 108 SER ASP LYS ILE ILE HIS LEU THR ASP ASP SER PHE ASP 2TRX 74SEQRES 2 A 108 THR ASP VAL LEU LYS ALA ASP GLY ALA ILE LEU VAL ASP 2TRX 75SEQRES 3 A 108 PHE TRP ALA GLU TRP CYS GLY PRO CYS LYS MET ILE ALA 2TRX 76SEQRES 4 A 108 PRO ILE LEU ASP GLU ILE ALA ASP GLU TYR GLN GLY LYS 2TRX 77SEQRES 5 A 108 LEU THR VAL ALA LYS LEU ASN ILE ASP GLN ASN PRO GLY 2TRX 78SEQRES 6 A 108 THR ALA PRO LYS TYR GLY ILE ARG GLY ILE PRO THR LEU 2TRX 79SEQRES 7 A 108 LEU LEU PHE LYS ASN GLY GLU VAL ALA ALA THR LYS VAL 2TRX 80SEQRES 8 A 108 GLY ALA LEU SER LYS GLY GLN LEU LYS GLU PHE LEU ASP 2TRX 81SEQRES 9 A 108 ALA ASN LEU ALA 2TRX 82HET CU 109 1 COPPER ++ ION 2TRX 100HET CU 109 1 COPPER ++ ION 2TRX 101HET MPD 601 8 2-METHYL-2,4-PENTANEDIOL 2TRX 102HET MPD 602 8 2-METHYL-2,4-PENTANEDIOL 2TRX 103

Page 12: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Le format PDBLe format PDB

FORMUL 3 CU 2(CU1 ++) 2TRX 110FORMUL 4 MPD 8(C6 H14 O2) 2TRX 111 FORMUL 5 HOH *140(H2 O1) 2TRX 112 HELIX 1 A1A SER A 11 LEU A 17 1 DISORDERED IN MOLECULE B 2TRX 113HELIX 2 A2A CYS A 32 TYR A 49 1 BENT BY 30 DEGREES AT RES 39 2TRX 114HELIX 3 A3A ASN A 59 ASN A 63 1 2TRX 115HELIX 4 31A THR A 66 TYR A 70 5 DISTORTED H-BONDING C-TERMINS 2TRX 116HELIX 5 A4A SER A 95 LEU A 107 1 2TRX 117SHEET 1 B1A 5 LYS A 3 THR A 8 0 2TRX 123SHEET 2 B1A 5 LEU A 53 ASN A 59 1 O VAL A 55 N ILE A 5 2TRX 124SHEET 3 B1A 5 GLY A 21 TRP A 28 1 N TRP A 28 O LEU A 58 2TRX 125SHEET 4 B1A 5 PRO A 76 LYS A 82 -1 O THR A 77 N PHE A 27 2TRX 126SHEET 5 B1A 5 VAL A 86 GLY A 92 -1 N GLY A 92 O LYS A 82 2TRX 127 SSBOND 1 CYS A 32 CYS A 35 2TRX 143

FORMUL – Formule chimique des hétéroatomes.FORMUL – Formule chimique des hétéroatomes.HELIX – Localisation des hélices tel qu’indiquée par l’auteur.HELIX – Localisation des hélices tel qu’indiquée par l’auteur.SHEET – Localisation des feuillets SHEET – Localisation des feuillets tel qu’indiquée par l’auteur. tel qu’indiquée par l’auteur.SSBOND – Localisation et existence de ponts disulfures.SSBOND – Localisation et existence de ponts disulfures.

FORMUL – Formule chimique des hétéroatomes.FORMUL – Formule chimique des hétéroatomes.HELIX – Localisation des hélices tel qu’indiquée par l’auteur.HELIX – Localisation des hélices tel qu’indiquée par l’auteur.SHEET – Localisation des feuillets SHEET – Localisation des feuillets tel qu’indiquée par l’auteur. tel qu’indiquée par l’auteur.SSBOND – Localisation et existence de ponts disulfures.SSBOND – Localisation et existence de ponts disulfures.

Page 13: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Le format PDBLe format PDB

ORIGX1 1.000000 0.000000 0.000000 0.00000 2TRX 146ORIGX2 0.000000 1.000000 0.000000 0.00000 2TRX 147 ORIGX3 0.000000 0.000000 1.000000 0.00000 2TRX 148 SCALE1 0.011173 0.000000 0.004858 0.00000 2TRX 149 SCALE2 0.000000 0.019585 0.000000 0.00000 2TRX 150 SCALE3 0.000000 0.000000 0.018039 0.00000 2TRX 151 ATOM 1 N SER A 1 21.389 25.406 -4.628 1.00 23.22 2TRX 152 ATOM 2 CA SER A 1 21.628 26.691 -3.983 1.00 24.42 2TRX 153ATOM 3 C SER A 1 20.937 26.944 -2.679 1.00 24.21 2TRX 154 ATOM 4 O SER A 1 21.072 28.079 -2.093 1.00 24.97 2TRX 155 ATOM 5 CB SER A 1 21.117 27.770 -5.002 1.00 28.27 2TRX 156 ATOM 6 OG SER A 1 22.276 27.925 -5.861 1.00 32.61 2TRX 157 ATOM 7 N ASP A 2 20.173 26.028 -2.163 1.00 21.39 2TRX 158 ATOM 8 CA ASP A 2 19.395 26.125 -0.949 1.00 21.57 2TRX 159 ATOM 9 C ASP A 2 20.264 26.214 0.297 1.00 20.89 2TRX 160 ATOM 10 O ASP A 2 19.760 26.575 1.371 1.00 21.49 2TRX 161ORIGXn – Facteurs de transformation en coordonnées ORIGXn – Facteurs de transformation en coordonnées orthogonales.orthogonales.

SCALEn – Facteurs pour transformer en coor. fractionnaires SCALEn – Facteurs pour transformer en coor. fractionnaires du cristal.du cristal.

ATOM – Coordonnées atomiques de la molécule.ATOM – Coordonnées atomiques de la molécule.

ORIGXn – Facteurs de transformation en coordonnées ORIGXn – Facteurs de transformation en coordonnées orthogonales.orthogonales.

SCALEn – Facteurs pour transformer en coor. fractionnaires SCALEn – Facteurs pour transformer en coor. fractionnaires du cristal.du cristal.

ATOM – Coordonnées atomiques de la molécule.ATOM – Coordonnées atomiques de la molécule.

Page 14: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Le format PDBLe format PDB

ATOM 1 N SER A 1 21.389 25.406 -4.628 1.00 23.22 2TRX 152ATOM 2 CA SER A 1 21.628 26.691 -3.983 1.00 24.42 2TRX 153 ATOM 3 C SER A 1 20.937 26.944 -2.679 1.00 24.21 2TRX 154 ATOM 4 O SER A 1 21.072 28.079 -2.093 1.00 24.97 2TRX 155 ATOM 5 CB SER A 1 21.117 27.770 -5.002 1.00 28.27 2TRX 156 ATOM 6 OG SER A 1 22.276 27.925 -5.861 1.00 32.61 2TRX 157 ATOM 7 N ASP A 2 20.173 26.028 -2.163 1.00 21.39 2TRX 158 ATOM 8 CA ASP A 2 19.395 26.125 -0.949 1.00 21.57 2TRX 159 ATOM 9 C ASP A 2 20.264 26.214 0.297 1.00 20.89 2TRX 160ATOM 10 O ASP A 2 19.760 26.575 1.371 1.00 21.49 2TRX 161

# de l’atome# de l’atome# de l’atome# de l’atomeNom de Nom de l’atomel’atomeNom de Nom de l’atomel’atome

Nom duNom du résidurésiduNom duNom du résidurésidu

# du résidu# du résidu# du résidu# du résidu

Coord. en X (Å)Coord. en X (Å)Coord. en X (Å)Coord. en X (Å)

Coord. en Y (Å)Coord. en Y (Å)Coord. en Y (Å)Coord. en Y (Å)

Coord. en Z (Å)Coord. en Z (Å)Coord. en Z (Å)Coord. en Z (Å)

OccupantOccupantOccupantOccupant

B-factor (nmB-factor (nm22))(facteur isotropique)(facteur isotropique)

B-factor (nmB-factor (nm22))(facteur isotropique)(facteur isotropique)

D’autres informations disponibles à:http://www.rcsb.org/pdb/docs/format/pdbguide2.2/guide2.2_frame.html

Page 15: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

The Protein Data BankThe Protein Data Bank

1R6T

Page 16: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

The Protein Data BankThe Protein Data Bank

Page 17: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

The Protein Data BankThe Protein Data Bank

Page 18: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

{{

The Protein Data BankThe Protein Data Bank

Page 19: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

The Protein Data BankThe Protein Data Bank

Page 20: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

The Protein Data BankThe Protein Data Bank

Page 21: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

The Protein Data BankThe Protein Data Bank

Page 22: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

The Protein Data Bank/Sting MilleniumThe Protein Data Bank/Sting Millenium

Page 23: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

The Protein Data Bank/SwissProtThe Protein Data Bank/SwissProt

Page 24: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

The Protein Data BankThe Protein Data Bank

Page 25: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

The Protein Data BankThe Protein Data Bank

Page 26: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

D’autres bases de données structurales…D’autres bases de données structurales…

• Biological Macromolecule Crystallization Database and the NASA ArcBiological Macromolecule Crystallization Database and the NASA Archive for Protein Crystal Growth Data. hive for Protein Crystal Growth Data. – Contient les données et les conditions de cristallisation. Archives de la Contient les données et les conditions de cristallisation. Archives de la

NASA sur la cristallisation en apesanteur.NASA sur la cristallisation en apesanteur.

• Cambridge Structural Database (CSD) Cambridge Structural Database (CSD) – Structures de petites molécules organiques, 1D, 2D et 3D.Structures de petites molécules organiques, 1D, 2D et 3D.

• The Molecular Modeling Database (MMDB)The Molecular Modeling Database (MMDB)– Liens vers la littérature, la séquence et l’information génomique.Liens vers la littérature, la séquence et l’information génomique.

• PQS Protein Quaternary Structure PQS Protein Quaternary Structure – Procure des renseignements sur la structure de l’unité biologique active Procure des renseignements sur la structure de l’unité biologique active

d’une protéine.d’une protéine.

• ReliBase:protein-ligand databasesReliBase:protein-ligand databases– Contient les informations sur la liaison des ligands (inhibiteurs, cofacteurs, Contient les informations sur la liaison des ligands (inhibiteurs, cofacteurs,

métaux lourds, ions…)métaux lourds, ions…)

Page 27: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

D’autres bases de données structurales…D’autres bases de données structurales…

• Base de données sur certaines familles de protéines:Base de données sur certaines familles de protéines:– The Protein Kinase Resource. The Protein Kinase Resource.

– Metalloproteins. Metalloproteins.

– Membrane Proteins of known 3D structureMembrane Proteins of known 3D structure

• Database of Macromolecular Movements. Database of Macromolecular Movements. – Animations(*.gif) et films(*.mpg) qui décrivent le mouvement connu de Animations(*.gif) et films(*.mpg) qui décrivent le mouvement connu de

certaine protéine. Assez spectaculaire parfois…certaine protéine. Assez spectaculaire parfois…quand on est conscient de la beauté de la chose.quand on est conscient de la beauté de la chose.

Une Une Topoisomérase Topoisomérase en plein en plein travail…travail…

Une Une Topoisomérase Topoisomérase en plein en plein travail…travail…

ATPase CaATPase Ca+2+2 ATPase CaATPase Ca+2+2

Page 28: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Et si on intégrait tout…Et si on intégrait tout…

Page 29: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Et si on intégrait tout…Et si on intégrait tout…

Page 30: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Et si on intégrait tout…Et si on intégrait tout…

Page 31: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Et si on intégrait tout…Et si on intégrait tout…

Page 32: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Et si on intégrait tout…Et si on intégrait tout…

Page 33: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Visualisation moléculaire…les jouets!Visualisation moléculaire…les jouets!

• La plupart des programmes de visualisation La plupart des programmes de visualisation permettent de visionner des macromolécules permettent de visionner des macromolécules comme les protéines et l’ADN/ARN selon divers comme les protéines et l’ADN/ARN selon divers formats de fichier. Certains possèdent des formats de fichier. Certains possèdent des caractéristiques spécifiques (affichage des caractéristiques spécifiques (affichage des orbitales moléculaires, densités d’électrons…), orbitales moléculaires, densités d’électrons…), d’autres s’utilisent comme plug-in de browser d’autres s’utilisent comme plug-in de browser web.web.

• Pour une liste exhaustive:Pour une liste exhaustive:

• La plupart des programmes de visualisation La plupart des programmes de visualisation permettent de visionner des macromolécules permettent de visionner des macromolécules comme les protéines et l’ADN/ARN selon divers comme les protéines et l’ADN/ARN selon divers formats de fichier. Certains possèdent des formats de fichier. Certains possèdent des caractéristiques spécifiques (affichage des caractéristiques spécifiques (affichage des orbitales moléculaires, densités d’électrons…), orbitales moléculaires, densités d’électrons…), d’autres s’utilisent comme plug-in de browser d’autres s’utilisent comme plug-in de browser web.web.

• Pour une liste exhaustive:Pour une liste exhaustive:

http://www.ks.uiuc.edu/Development/biosoftdb/biosoft.cgi?&category=1

Page 34: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Visualisation moléculaire…les jouets!Visualisation moléculaire…les jouets!

CapacitésCapacités CommentairesCommentaires AvantagesAvantages DésavantagesDésavantages

Rasmol*Rasmol*• PrésentationPrésentation

• Interrogations Interrogations structuralesstructurales

• Léger et vraiment Léger et vraiment puissantpuissant

• Rapide et GratuitRapide et Gratuit

• Ligne de commande Ligne de commande puissantepuissante

• Grand éventail de Grand éventail de représentation graphiquereprésentation graphique

• 1 seule structure à la 1 seule structure à la foisfois

• Graphisme laid, Graphisme laid,

• Mal adapté au WebMal adapté au Web

PyMolPyMol • PrésentationPrésentation

• PuissantPuissant

• Entrées via l'interface Entrées via l'interface graphique ou ligne de graphique ou ligne de

commandecommande

• Grand éventail de Grand éventail de représentation graphiquereprésentation graphique

• Fonctionne sur toute les Fonctionne sur toute les plates-formesplates-formes

• Difficile à maîtriserDifficile à maîtriser

• Exigeant du point de Exigeant du point de vue CPU et mémoirevue CPU et mémoire

QuickPDBQuickPDB • Requête de structureRequête de structure • Interface simple et outil Interface simple et outil d'affichage de séquenced'affichage de séquence

• Permet de considérer la Permet de considérer la séquence et la structure séquence et la structure

simultanémentsimultanément

• Interface Web, Structure Interface Web, Structure JavaJava

• Très BasicTrès Basic

VMD*VMD* • Analyse structurale et Analyse structurale et présentationprésentation

• Beaucoup d'outil pour Beaucoup d'outil pour la dynamique moléculaire la dynamique moléculaire

et la modélisationet la modélisation

• Souris et/ou un scripte Souris et/ou un scripte de langage puissantde langage puissant

• Facile à utiliserFacile à utiliser

• Toujours sous Toujours sous développementdéveloppement

• Exigeant du point de Exigeant du point de vue CPU et mémoirevue CPU et mémoire

• Surtout orienté Surtout orienté dynamique moléculaire.dynamique moléculaire.

Cn3D*Cn3D*

• PrésentationPrésentation

• Interrogations Interrogations structuralesstructurales

• Léger et vraiment Léger et vraiment puissantpuissant

• Beau GraphismeBeau Graphisme

• Rapide et GratuitRapide et Gratuit

• Grand éventail de Grand éventail de représentation graphiquereprésentation graphique

• Outil de séquenceOutil de séquence

• 1 seule structure à la 1 seule structure à la foisfois

• Ne supporte pas le Ne supporte pas le format PDBformat PDB

MolmolMolmol• Analyse structurale et Analyse structurale et

présentationprésentation

• PuissantPuissant

• Beaucoup d’outil Beaucoup d’outil d’analysed’analyse

• Beau graphisme Beau graphisme

• Gamme étendue d'outil Gamme étendue d'outil d’analysed’analyse

• Peu intuitifPeu intuitif

Page 35: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Visualisation moléculaire…les jouets!Visualisation moléculaire…les jouets!

CapacitésCapacités CommentairesCommentaires AvantagesAvantages DésavantagesDésavantages

BiodesignerBiodesigner• PrésentationPrésentation

• Interrogations et Interrogations et analyses structuralesanalyses structurales

• PuissantPuissant

• Outils d’alignement, de Outils d’alignement, de superposition et d’éditionsuperposition et d’édition

• Plusieurs structures à la Plusieurs structures à la foisfois

• Grand éventail de Grand éventail de représentation graphiquereprésentation graphique

• Exigeant du point de Exigeant du point de vue CPU et mémoirevue CPU et mémoire

• Pas pour débutantPas pour débutant

WebLab WebLab ViewerViewer

• PrésentationPrésentation• Beau graphismeBeau graphisme

• Facile d’utilisationFacile d’utilisation

• Grand éventail de Grand éventail de représentation graphiquereprésentation graphique

• Fonctionne sur toute les Fonctionne sur toute les plates-formesplates-formes

• Outil de visualisation Outil de visualisation seulementseulement

Rastop*Rastop* • Rasmol amélioréRasmol amélioré• Plus puissant que Plus puissant que

Rasmol Rasmol

• Nouvelles fonctionsNouvelles fonctions

• Interface graphique Interface graphique amélioréeaméliorée

• Plate-forme Windows Plate-forme Windows seulementseulement

Chime/ Chime/ ProteinProtein

Explorer*Explorer*• PrésentationPrésentation • Plug-in WebPlug-in Web

• Souris et/ou un scripte Souris et/ou un scripte de langage puissantde langage puissant

• Facile à utiliserFacile à utiliser

• Toujours sous Toujours sous développementdéveloppement

• Peu versatilePeu versatile

• Peu/pas d’outils Peu/pas d’outils d’analyse d’analyse

Molecular Molecular Operating Operating

Environment Environment (MOE)*/ (MOE)*/ Insight Insight (Merck)(Merck)

• Multiple capacité Multiple capacité d’analyses et d’analyses et

d’interrogations d’interrogations structuralesstructurales

• Simulation et Simulation et ModélisationModélisation

• Présentation et Présentation et VisualisationVisualisation

• Très puissantTrès puissant

• Beaucoup d’outils Beaucoup d’outils d’analysesd’analyses

• Grand éventail de Grand éventail de représentation graphiquereprésentation graphique

•Gamme étendue d'outils Gamme étendue d'outils d’analysesd’analyses

• Homologie et Homologie et superposition structuralesuperposition structurale

• Toujours sous Toujours sous développementdéveloppement

• Licence dispendieuse $Licence dispendieuse $$$$$

Page 36: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Exemple…Exemple…

• MPNSEPASLLELFNSIATQGELVRSLKAGNAMPNSEPASLLELFNSIATQGELVRSLKAGNASKDEIDSAVKXLVSLKXSYKAAAGEDYKADSKDEIDSAVKXLVSLKXSYKAAAGEDYKADCPPGNPAPTSNHGPDATEAEEDFVDPWTVCPPGNPAPTSNHGPDATEAEEDFVDPWTVQTSSAKGIDYDKLIVRFGSSKIDKELINRIERQTSSAKGIDYDKLIVRFGSSKIDKELINRIERATGQRPHHFLRRGIFFSHRDXNQVLDAYENATGQRPHHFLRRGIFFSHRDXNQVLDAYENKKPFYLYTGRGPSSEAXHVGHLIPFIFTKWLKKPFYLYTGRGPSSEAXHVGHLIPFIFTKWLQDVFNVPLVIQXTDDEKYLWKDLTLDQAYGQDVFNVPLVIQXTDDEKYLWKDLTLDQAYGDAVENAKDIIACGFDINKTFIFSDLDYXGXSSDAVENAKDIIACGFDINKTFIFSDLDYXGXSSGFYKNVVKIQKHVTFNQVKGIFGFTDSDCIGGFYKNVVKIQKHVTFNQVKGIFGFTDSDCIGKISFPAIQAAPSFSNSFPQIFRDRTDIQCLIPKISFPAIQAAPSFSNSFPQIFRDRTDIQCLIPCAIDQDPYFRXTRDVAPRIGYPKPALLHSTFCAIDQDPYFRXTRDVAPRIGYPKPALLHSTFFPALQGAQTKXSASDPNSSIFLTDTAKQIKTFPALQGAQTKXSASDPNSSIFLTDTAKQIKTKVNKHAFSGGRDTIEEHRQFGGNCDVDVSKVNKHAFSGGRDTIEEHRQFGGNCDVDVSFXYLTFFLEDDDKLEQIRKDYTSGAXLTGELFXYLTFFLEDDDKLEQIRKDYTSGAXLTGELKKALIEVLQPLIAEHQARRKEVTDEIVKEFXTKKALIEVLQPLIAEHQARRKEVTDEIVKEFXTPRKLAAALEHHHHHHPRKLAAALEHHHHHH

• Database: PDBDatabase: PDB• No CDsearchNo CDsearch

• MPNSEPASLLELFNSIATQGELVRSLKAGNAMPNSEPASLLELFNSIATQGELVRSLKAGNASKDEIDSAVKXLVSLKXSYKAAAGEDYKADSKDEIDSAVKXLVSLKXSYKAAAGEDYKADCPPGNPAPTSNHGPDATEAEEDFVDPWTVCPPGNPAPTSNHGPDATEAEEDFVDPWTVQTSSAKGIDYDKLIVRFGSSKIDKELINRIERQTSSAKGIDYDKLIVRFGSSKIDKELINRIERATGQRPHHFLRRGIFFSHRDXNQVLDAYENATGQRPHHFLRRGIFFSHRDXNQVLDAYENKKPFYLYTGRGPSSEAXHVGHLIPFIFTKWLKKPFYLYTGRGPSSEAXHVGHLIPFIFTKWLQDVFNVPLVIQXTDDEKYLWKDLTLDQAYGQDVFNVPLVIQXTDDEKYLWKDLTLDQAYGDAVENAKDIIACGFDINKTFIFSDLDYXGXSSDAVENAKDIIACGFDINKTFIFSDLDYXGXSSGFYKNVVKIQKHVTFNQVKGIFGFTDSDCIGGFYKNVVKIQKHVTFNQVKGIFGFTDSDCIGKISFPAIQAAPSFSNSFPQIFRDRTDIQCLIPKISFPAIQAAPSFSNSFPQIFRDRTDIQCLIPCAIDQDPYFRXTRDVAPRIGYPKPALLHSTFCAIDQDPYFRXTRDVAPRIGYPKPALLHSTFFPALQGAQTKXSASDPNSSIFLTDTAKQIKTFPALQGAQTKXSASDPNSSIFLTDTAKQIKTKVNKHAFSGGRDTIEEHRQFGGNCDVDVSKVNKHAFSGGRDTIEEHRQFGGNCDVDVSFXYLTFFLEDDDKLEQIRKDYTSGAXLTGELFXYLTFFLEDDDKLEQIRKDYTSGAXLTGELKKALIEVLQPLIAEHQARRKEVTDEIVKEFXTKKALIEVLQPLIAEHQARRKEVTDEIVKEFXTPRKLAAALEHHHHHHPRKLAAALEHHHHHH

• Database: PDBDatabase: PDB• No CDsearchNo CDsearch

blastpblastpblastpblastp

Page 37: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Exemple…Exemple…

Protein Protein Data Data BankBank

Protein Protein Data Data BankBank

Pas nécessairePas nécessairePas nécessairePas nécessaire

Page 38: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Exemple…Exemple… Le >Le >Le >Le > Le <Le <Le <Le <

Lien vers Lien vers la structurela structure

Identité Identité (similitude)(similitude)Identité Identité (similitude)(similitude)

Page 39: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Exemple…Exemple…

Afficher la Afficher la structure structure avec Cn3Davec Cn3D

Afficher la Afficher la structure structure avec Cn3Davec Cn3D

Choisir une Choisir une chaînechaîneChoisir une Choisir une chaînechaîne

Page 40: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Enfin!Enfin!

Page 41: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

Quelques tutoriaux!Quelques tutoriaux!

• Visual Molecular Dynamics (Visual Molecular Dynamics (VVMMDD))– http://www.ks.uiuc.edu/Research/vmd/current/tutorial/html/node2.htmlhttp://www.ks.uiuc.edu/Research/vmd/current/tutorial/html/node2.html

• Cn3DCn3D– http://www.ncbi.nlm.nih.gov/Structure/CN3D/cn3dtutP3.shtmlhttp://www.ncbi.nlm.nih.gov/Structure/CN3D/cn3dtutP3.shtml

• Chime/ Protein ExplorerChime/ Protein Explorer– http://molvis.sdsc.edu/pe_alpha/protexpl/pe_tut.htmhttp://molvis.sdsc.edu/pe_alpha/protexpl/pe_tut.htm

• Visual Molecular Dynamics (Visual Molecular Dynamics (VVMMDD))– http://www.ks.uiuc.edu/Research/vmd/current/tutorial/html/node2.htmlhttp://www.ks.uiuc.edu/Research/vmd/current/tutorial/html/node2.html

• Cn3DCn3D– http://www.ncbi.nlm.nih.gov/Structure/CN3D/cn3dtutP3.shtmlhttp://www.ncbi.nlm.nih.gov/Structure/CN3D/cn3dtutP3.shtml

• Chime/ Protein ExplorerChime/ Protein Explorer– http://molvis.sdsc.edu/pe_alpha/protexpl/pe_tut.htmhttp://molvis.sdsc.edu/pe_alpha/protexpl/pe_tut.htm

Page 42: Bioinformatique ABI-1001 2 ième partie: La Bioinformatique Structurale La Bioinformatique Structurale 2 ième partie: La Bioinformatique Structurale La

À suivre…après la pause!À suivre…après la pause!

CaféineCaféine