introduction au repliement des protéines et à la simulation moléculaire le repliement des...
TRANSCRIPT
Introduction au Repliement Introduction au Repliement des Protéines et à la des Protéines et à la
Simulation MoléculaireSimulation Moléculaire–Le Repliement des Protéines–La Dynamique Moléculaire (DM)–Le Dynamique Brownienne (DB)
Septembre, 2006
Université des Sciences de Tokyo Tadashi Ando
Le Problème du Le Problème du Repliement des ProtéinesRepliement des Protéines
“Prédire la structure tridimensionnelle d'une protéine à partir d'une séquence d'acide animés.”
“Comment une protéine se replie t'elle vers cette structure?”
Cette question n'a pas encore été résolue depuis près d'un
demi-siècle.
Les Protéines peuvent se Les Protéines peuvent se plier dans des structures 3 plier dans des structures 3 D de manière spontanéeD de manière spontanée
La structure tridimensionnelle d'une protéine est auto-organisée dans la solution.
Si nous arrivons à calculer précisément l'énergie du système, il sera possible de prédire la structure de
la protéine !
La structure corresponds à l'état d'un système protéine-solvant ayant la plus faible énergie libre. (travaux de
Anfinsen)
Paradoxe de Levinthal Paradoxe de Levinthal Nous supposons qu'il existe trois conformations pour
chaque acide animé (ex : hélice α, feuillet β et un état désordonné). Si une protéine est constituée de 100 résidus d'acides animés, le nombre total de conformations est de
3100 = 515377520732011331036461129765621272702107522001
. 5 x 1047.
Si 100 picosecondes (10-10 sec) sont nécessaires pour passer d'une conformation à une autre, une recherche aléatoire pour toutes ces conformations durera
5 x 1047 x 10-10 sec . 1.6 x 1030 années.
Cependant, le repliement de protéine s'effectue sur une échelle en millisecondes ou secondes. C'est pourquoi, le repliement des protéines ne pourra pas se faire via une recherche aléatoire mais avec un processus de recherche plus sophistiqué.
Nous nous intéressons au processus de repliement par l'utilisation de techniques de simulation moléculaire.
Pourquoi le “Repliement Pourquoi le “Repliement des Protéines” est-il si des Protéines” est-il si
important ?important ?Les Protéines jouent un rôle important chez les organismes vivant.Certaines protéines sont étroitement liées à des maladies. Et des informations sur la structure d'une protéine sont nécessaires pour expliquer et prédire la fonction de son gène ainsi que pour modéliser les molécules qui se lient à la protéine dans la conception de médicaments. Aujourd'hui, la totalité des séquences du génome (la série complète de gènes) de différents organismes ont été déchiffrées et nous réalisons que les fonctions de nombreux gènes sont inconnues alors qu'ils jouent souvent un rôle dans certaines maladies. C'est pourquoi, comprendre le repliement des protéines aiderait dans l'examen des fonctions de ces gènes pour concevoir des médicaments utiles afin de lutter efficacement contre des maladies. De plus, cette compréhension ouvrira la voie à la conception de protéines ayant de nouvelles fonctions pour la conception de nouvelles nano machines.
Pourquoi le “Pliage des Pourquoi le “Pliage des Protéines” est-il un problème Protéines” est-il un problème
si compliqué ?si compliqué ?Du point de vue de la simulation informatique,
Il est difficile de simuler la totalité du processus de repliement d'une protéine à l'échelle atomique et ce même en utilisant les ordinateurs à la pointe de la technologie.Personne ne sait si la précision des fonctions d'énergie et des paramètres actuels sont suffisant pour simuler le repliement des protéines.
…, laissez moi vous relater une conversation avec Francis en 1975 (qui reçu le prix Nobel pour avoir découvert la structure de l'ADN). Crick déclarait qu'il est très difficile d'envisager qu'un problème scientifique ne soit pas résolu dans les 20 années à venir … excepté la mise au point d'un modèle de fonction cérébral et de repliement de protéine". Même si Crick était plus interessé par la fonction cerebrale, il déclarait que les 2 problèmes étaient difficiles car ils supposaient de nombreuses interactions associatives dans un espace tridimensionnel.
(Levitt M, “Through the breach.” Curr. Opin. Struct. Biol. 1996, 1, 193-194)
La Dynamique moléculaire La Dynamique moléculaire (MD)(MD)
Dans une simulation de dynamique moléculaire, nous simulons les mouvements des atomes sur une échelle de temps en accords avec les équations du mouvement de Newton. Les équations pour un système constitué de N atomes peut être écrit comme suit :
Ici, ri et mi représentent la position et la masse de l'atome i et Fi(t) est la force qui s'applique à l'atome i au temps t. Fi(t) est donné par :
où V(r1, r2, …, rN) corresponds à l'énergie potentielle du système qui dépends des positions des N atomes dans le système. ∇i corresponds à :
). , 2, 1,( ,d
d2
2
Nitt
tm i
ii F
r
,,,, 21 Nii V rrrF
zyxi
kji
(1)
(3)
(2)
Intégration par l'utilisation Intégration par l'utilisation d'une méthode de d'une méthode de
différence finiedifférence finieLes positions aux temps (t + Δt ) et (t − Δt ) peuvent être
écrites en utilisant l'expansion de Taylor autour de t,
La somme de ces 2 équations est
En utilisant (1), on obtient l'équation suivante:
Nous devons calculer (6) de manière itérative pour obtenir les trajectoires des atomes dans le système (algorithme de Verlet).
.
6
1
2
1
,6
1
2
1
432
432
tOttttttttt
tOttttttttt
iiiii
iiiii
rrrrr
rrrrr
.242tOttttttt iiii
rrrr
.12
42tOtt
mttttt i
iiii Frrr
(4a)
(4b)
(6)
(5)
Forces en jeu dans le Forces en jeu dans le repliement des Protéinesrepliement des ProtéinesInteractions électrostatiquesInteractions de van der WaalsLiaisons d'hydrogèneInteractions hydrophobiques (Les molécules hydrophobiques s'associent dans un solvant aqueux comme si les molécules d'eau était pour eux un répulsif. C'est comparable à la séparation pétrole/eau. La présence de l'eau est importante pour cette intéraction.)
Fonctions d'énergie Fonctions d'énergie utilisées dans la utilisées dans la
simulation moléculairesimulation moléculaire
p a irs ,t ice le c tro s ta
p a irs , d e r W a a lsv a n
61 2
H b o n d s
1 01 2
d ih e d ra lsa n g le s
2
0
b o n d s
2
0to ta lc o s1
jiij
ji
jiij
ij
ij
ij
ij
ij
ij
ij
b
r
r
B
r
A
r
D
r
C
nKKrrKV
Terme Electrostatiqu
e
liaison hydrogène
Terme de Van der Waals
élongation de la liaison
Angle dièdreAngle du repliement
r ΦΘ
+ ーO H
rr r
Partie exigeant le plus de temps.
Méthodologie pour les Méthodologie pour les simulations de DMsimulations de DM
Sans molécules d'eau Avec molécules d'eau
Atomes : 304 Atomes : 304 + 7,377 = 7,681
La DM exige une La DM exige une puissance de calcul puissance de calcul
énormeénormeL'échelle de temps de la DM (Δt) est limitée à environ une femtoseconde (10-15 sec).← La taille de Δt devrait être approximativement égale au dixième de la durée du mouvement le plus rapide du système. Pour les simulations de protéines, du fait des mouvements d'élongation de la liaison des atomes légers (ex. O-H, C-H), qui ont une période d'environ 10-14 sec et qui accomplissent les mouvements les plus rapides des simulations biomoléculaires, Δt est généralement fixé à environ 1 femtoseconde.
Un très grand nombre de molécules d'eau sont utilisées dans les simulation de DM biomoléculaire.← Le nombre de paires d'atomes estimées pour les interactions non-liées (van der Waals, intéractions électrostatiques) augmente d'un facteur N 2 (N corresponds au nombre d'atomes).
Il est difficile d'effectuer une simulation sur une longue durée . Généralement, on effectue des simulations sur quelques dizaines
de nanosecondes.
Echelle de temps – Echelle de temps – Mouvements de Protéines et Mouvements de Protéines et
DMDM
Durée
10-15 10-610-910-12 10-3 100
(s)(fs) (ps) (μs)(ns) (ms)
Élongation de la liaison
Perméation d'un ion à l'intérieur d'une
PorineVibrations élastiques
des protéines
Il est toujours difficile de simuler un processus de repliement d'une protéine dans sa totalité par l'utilisation des méthodes de DM conventionnelles.
DM
Plier une hélice αPlier un feuillet
βPlier une protéine
Plus rapidement, plus Plus rapidement, plus grand!grand!
Ordinateur spécialiséLe calcul des intéractions non-liées est effectué en utilisant une puce spéciale qui a été developpée uniquement pour cet objectif. Par exemple;
MDM (Machine pour les dynamiques moléculaires) ou MD-Grape: RIKENMD Engine: Compagnie pharmaceutique Taisho., et compagnie Fuji Xerox.
ParallélisationUn même travail est divisé en plusieurs plus petits qui sont simultanément calculés sur des machines multi-processeurs, Aujourd'hui, presque tous les programmes de DM pour les simulations biomoléculaires (ex. AMBER, CHARMm, GROMOS, NAMD, MARBLE, etc) peuvent fonctionner sur des ordinateurs en parallèle.
Dynamique Brownienne (DB)Dynamique Brownienne (DB)La contribution à la dynamique d'un solvant est inclus en tant que force aléatoire dissipative (dérivé d'Einstein en 1905). C'est pourquoi, les molécules d'eau ne sont pas traitées explicitement.Puisque l'algorithme de DB est soumis à des conditions d'absorption d'un solvant élevé et de mémoire de l'inertie perdue sur des durées très courtes, des échelles de temps plus longues peuvent être utilisées.
La méthode DB est adaptée pour les longues simulations.
Méthodologies pour les Méthodologies pour les simulations de DBsimulations de DB
Sans molécule d'eau Avec molécules d'eau
Atomes : 304 Atomes: 304 + 7,377 = 7,681
Algorithme de DBAlgorithme de DBL'équation de Langevin peut être énoncée comme suit
Ici, ri et mi représentent respectivement la position et la masse de l'atome i,. ζi est la force de friction et est déterminée par la loi de Stokes, c'est à dire, ζi = 6πai
Stokesη où aiStokes est le rayon de Stokes de l'atome i et η corresponds à la
viscosité de l'eau. Fi est la force de l'atome i. Ri est la force aléatoire de l'atome i ayant une moyenne zéro <Ri(t)> = 0 et une variance de <Ri(t)Rj(t)> = 6ζikTδijδ(t); ceci est dérivé des effets du solvant.
Pour la limite sur-amortie, on fixe à 0 la partie gauche de l'équation 7,
L'intégration de l'équation 8 est appelée Dynamique Brownienne ;
ou Δt est l'échelle de temps et ωi est le vecteur aléatoire obtenu à partir d'une distribution gaussienne.
iii
ii
i ttm RF
rr
d
d
d
d2
2
iii
it
RFr
d
d
i
ii
i
iit
Tkt
tttt ω
Frr
B
2)()()(
(7)
(9)
(8)
Temps de calcul pour les Temps de calcul pour les DBDB
1,002.0577.681Pentium4 2,8 GHz
MD
IBM Regatta
8 CPU
Pentium4 2,8 GHz
Pentium4 2,8 GHz
Ordinateur
6053.4304BD
+MTS†
304
304
Nombre d'atome
16112.8BD
+MTS†
53,038,8BD
EfficacitéTemps (sec)
Algorithme
†Algorithme MTS (pas temporels multiples): Cette méthode réduit la fréquence des calculs des parties les plus demandées ( énergie non-lié ) .
Temps de calcul requis pour simuler un peptide durant 1 nanoseconde.
Simulation du repliement d'un Simulation du repliement d'un peptide “hélice peptide “hélice α”α” en utilisant en utilisant
la DBla DB
Pro
port
ion d
e
con
tact
s nati
fs
Durée de la simulation (nsec)
0 300200100 4000
0.20.4
0.60.8
1.0
Simulation du repliement d'un Simulation du repliement d'un peptide feuillet peptide feuillet ββ en utilisant en utilisant
la DBla DB
Pro
port
ion d
e
con
tact
s nati
fs
Durée de la simulation (nsec)
0 300200100 4000
0.20.4
0.60.8
1.0
Echelle de temps – Echelle de temps – Mouvement de Protéines et Mouvement de Protéines et
DBDB
Time
10-15 10-610-910-12 10-3 100
(s)(fs) (ps) (μs)(ns) (ms)
Les méthodes de DB permettent de simuler sur une plus longue durée.
DB
Plier une hélice α
Plier un feuillet β
Plier une Protéine
DM
Élongation de la liaison
Perméation d'un ion à l'intérieur d'une Porine
Vibrations élastiques des protéines
ConclusionsConclusionsLe problème du repliement des protéines est l'un des problèmes historiques de la biologie. Résoudre ce problème ouvrirait une nouvelle perspective vers une nouvelle étape de la biologie génomique. En DM, les équations du mouvement de Newton appliquées aux atomes d'un système sont intégrées par l'utilisation d'une méthode de différence finie. En DM, l'échelle de temps est limitée à environ une femtoseconde et le traitement d'un très grand nombre de molécules d'eau est essentiel. A cet égard, il est difficile d'effectuer une simulation sur une longue durée. Au contraire, le repliement des protéines demande une échelle de temps allant de la milliseconde à la seconde.Les développements des algorithmes de parallélisation et les ordinateurs spécialisés permettent de simuler plus rapidement des systèmes plus grands.La DB est une approche prospective pour des simulations de longue durée.