introduction au repliement des protéines et à la simulation moléculaire le repliement des...

Introduction au Repliement Introduction au Repliement des Protéines et à la des Protéines et à la

Simulation MoléculaireSimulation Moléculaire–Le Repliement des Protéines–La Dynamique Moléculaire (DM)–Le Dynamique Brownienne (DB)

Septembre, 2006

Université des Sciences de Tokyo Tadashi Ando

Le Problème du Le Problème du Repliement des ProtéinesRepliement des Protéines

“Prédire la structure tridimensionnelle d'une protéine à partir d'une séquence d'acide animés.”

“Comment une protéine se replie t'elle vers cette structure?”

Cette question n'a pas encore été résolue depuis près d'un

demi-siècle.

Les Protéines peuvent se Les Protéines peuvent se plier dans des structures 3 plier dans des structures 3 D de manière spontanéeD de manière spontanée

La structure tridimensionnelle d'une protéine est auto-organisée dans la solution.

Si nous arrivons à calculer précisément l'énergie du système, il sera possible de prédire la structure de

la protéine !

La structure corresponds à l'état d'un système protéine-solvant ayant la plus faible énergie libre. (travaux de

Anfinsen)

Paradoxe de Levinthal Paradoxe de Levinthal Nous supposons qu'il existe trois conformations pour

chaque acide animé (ex : hélice α, feuillet β et un état désordonné). Si une protéine est constituée de 100 résidus d'acides animés, le nombre total de conformations est de

3100 = 515377520732011331036461129765621272702107522001

. 5 x 1047.

Si 100 picosecondes (10-10 sec) sont nécessaires pour passer d'une conformation à une autre, une recherche aléatoire pour toutes ces conformations durera

5 x 1047 x 10-10 sec . 1.6 x 1030 années.

Cependant, le repliement de protéine s'effectue sur une échelle en millisecondes ou secondes. C'est pourquoi, le repliement des protéines ne pourra pas se faire via une recherche aléatoire mais avec un processus de recherche plus sophistiqué.

Nous nous intéressons au processus de repliement par l'utilisation de techniques de simulation moléculaire.

Pourquoi le “Repliement Pourquoi le “Repliement des Protéines” est-il si des Protéines” est-il si

important ?important ?Les Protéines jouent un rôle important chez les organismes vivant.Certaines protéines sont étroitement liées à des maladies. Et des informations sur la structure d'une protéine sont nécessaires pour expliquer et prédire la fonction de son gène ainsi que pour modéliser les molécules qui se lient à la protéine dans la conception de médicaments. Aujourd'hui, la totalité des séquences du génome (la série complète de gènes) de différents organismes ont été déchiffrées et nous réalisons que les fonctions de nombreux gènes sont inconnues alors qu'ils jouent souvent un rôle dans certaines maladies. C'est pourquoi, comprendre le repliement des protéines aiderait dans l'examen des fonctions de ces gènes pour concevoir des médicaments utiles afin de lutter efficacement contre des maladies. De plus, cette compréhension ouvrira la voie à la conception de protéines ayant de nouvelles fonctions pour la conception de nouvelles nano machines.

Pourquoi le “Pliage des Pourquoi le “Pliage des Protéines” est-il un problème Protéines” est-il un problème

si compliqué ?si compliqué ?Du point de vue de la simulation informatique,

Il est difficile de simuler la totalité du processus de repliement d'une protéine à l'échelle atomique et ce même en utilisant les ordinateurs à la pointe de la technologie.Personne ne sait si la précision des fonctions d'énergie et des paramètres actuels sont suffisant pour simuler le repliement des protéines.

…, laissez moi vous relater une conversation avec Francis en 1975 (qui reçu le prix Nobel pour avoir découvert la structure de l'ADN). Crick déclarait qu'il est très difficile d'envisager qu'un problème scientifique ne soit pas résolu dans les 20 années à venir … excepté la mise au point d'un modèle de fonction cérébral et de repliement de protéine". Même si Crick était plus interessé par la fonction cerebrale, il déclarait que les 2 problèmes étaient difficiles car ils supposaient de nombreuses interactions associatives dans un espace tridimensionnel.

(Levitt M, “Through the breach.” Curr. Opin. Struct. Biol. 1996, 1, 193-194)

La Dynamique moléculaire La Dynamique moléculaire (MD)(MD)

Dans une simulation de dynamique moléculaire, nous simulons les mouvements des atomes sur une échelle de temps en accords avec les équations du mouvement de Newton. Les équations pour un système constitué de N atomes peut être écrit comme suit :

Ici, ri et mi représentent la position et la masse de l'atome i et Fi(t) est la force qui s'applique à l'atome i au temps t. Fi(t) est donné par :

où V(r1, r2, …, rN) corresponds à l'énergie potentielle du système qui dépends des positions des N atomes dans le système. ∇i corresponds à :

). , 2, 1,( ,d

d2

2

Nitt

tm i

ii F

r

,,,, 21 Nii V rrrF

zyxi

kji

(1)

(3)

(2)

Intégration par l'utilisation Intégration par l'utilisation d'une méthode de d'une méthode de

différence finiedifférence finieLes positions aux temps (t + Δt ) et (t − Δt ) peuvent être

écrites en utilisant l'expansion de Taylor autour de t,

La somme de ces 2 équations est

En utilisant (1), on obtient l'équation suivante:

Nous devons calculer (6) de manière itérative pour obtenir les trajectoires des atomes dans le système (algorithme de Verlet).

.

6

1

2

1

,6

1

2

1

432

432

tOttttttttt

tOttttttttt

iiiii

iiiii

rrrrr

rrrrr

.242tOttttttt iiii

rrrr

.12

42tOtt

mttttt i

iiii Frrr

(4a)

(4b)

(6)

(5)

Forces en jeu dans le Forces en jeu dans le repliement des Protéinesrepliement des ProtéinesInteractions électrostatiquesInteractions de van der WaalsLiaisons d'hydrogèneInteractions hydrophobiques (Les molécules hydrophobiques s'associent dans un solvant aqueux comme si les molécules d'eau était pour eux un répulsif. C'est comparable à la séparation pétrole/eau. La présence de l'eau est importante pour cette intéraction.)

Fonctions d'énergie Fonctions d'énergie utilisées dans la utilisées dans la

simulation moléculairesimulation moléculaire

p a irs ,t ice le c tro s ta

p a irs , d e r W a a lsv a n

61 2

H b o n d s

1 01 2

d ih e d ra lsa n g le s

2

0

b o n d s

2

0to ta lc o s1

jiij

ji

jiij

ij

ij

ij

ij

ij

ij

ij

b

r

qq

r

B

r

A

r

D

r

C

nKKrrKV

Terme Electrostatiqu

e

liaison hydrogène

Terme de Van der Waals

élongation de la liaison

Angle dièdreAngle du repliement

r ΦΘ

＋ーO H

rr r

Partie exigeant le plus de temps.

Méthodologie pour les Méthodologie pour les simulations de DMsimulations de DM

Sans molécules d'eau Avec molécules d'eau

Atomes : 304 Atomes : 304 + 7,377 = 7,681

La DM exige une La DM exige une puissance de calcul puissance de calcul

énormeénormeL'échelle de temps de la DM (Δt) est limitée à environ une femtoseconde (10-15 sec).← La taille de Δt devrait être approximativement égale au dixième de la durée du mouvement le plus rapide du système. Pour les simulations de protéines, du fait des mouvements d'élongation de la liaison des atomes légers (ex. O-H, C-H), qui ont une période d'environ 10-14 sec et qui accomplissent les mouvements les plus rapides des simulations biomoléculaires, Δt est généralement fixé à environ 1 femtoseconde.

Un très grand nombre de molécules d'eau sont utilisées dans les simulation de DM biomoléculaire.← Le nombre de paires d'atomes estimées pour les interactions non-liées (van der Waals, intéractions électrostatiques) augmente d'un facteur N 2 (N corresponds au nombre d'atomes).

Il est difficile d'effectuer une simulation sur une longue durée . Généralement, on effectue des simulations sur quelques dizaines

de nanosecondes.

Echelle de temps – Echelle de temps – Mouvements de Protéines et Mouvements de Protéines et

DMDM

Durée

10-15 10-610-910-12 10-3 100

(s)(fs) (ps) (μs)(ns) (ms)

Élongation de la liaison

Perméation d'un ion à l'intérieur d'une

PorineVibrations élastiques

des protéines

Il est toujours difficile de simuler un processus de repliement d'une protéine dans sa totalité par l'utilisation des méthodes de DM conventionnelles.

DM

Plier une hélice αPlier un feuillet

βPlier une protéine

Plus rapidement, plus Plus rapidement, plus grand!grand!

Ordinateur spécialiséLe calcul des intéractions non-liées est effectué en utilisant une puce spéciale qui a été developpée uniquement pour cet objectif. Par exemple;

MDM (Machine pour les dynamiques moléculaires) ou MD-Grape: RIKENMD Engine: Compagnie pharmaceutique Taisho., et compagnie Fuji Xerox.

ParallélisationUn même travail est divisé en plusieurs plus petits qui sont simultanément calculés sur des machines multi-processeurs, Aujourd'hui, presque tous les programmes de DM pour les simulations biomoléculaires (ex. AMBER, CHARMm, GROMOS, NAMD, MARBLE, etc) peuvent fonctionner sur des ordinateurs en parallèle.

Dynamique Brownienne (DB)Dynamique Brownienne (DB)La contribution à la dynamique d'un solvant est inclus en tant que force aléatoire dissipative (dérivé d'Einstein en 1905). C'est pourquoi, les molécules d'eau ne sont pas traitées explicitement.Puisque l'algorithme de DB est soumis à des conditions d'absorption d'un solvant élevé et de mémoire de l'inertie perdue sur des durées très courtes, des échelles de temps plus longues peuvent être utilisées.

La méthode DB est adaptée pour les longues simulations.

Méthodologies pour les Méthodologies pour les simulations de DBsimulations de DB

Sans molécule d'eau Avec molécules d'eau

Atomes : 304 Atomes: 304 + 7,377 = 7,681

Algorithme de DBAlgorithme de DBL'équation de Langevin peut être énoncée comme suit

Ici, ri et mi représentent respectivement la position et la masse de l'atome i,. ζi est la force de friction et est déterminée par la loi de Stokes, c'est à dire, ζi = 6πai

Stokesη où aiStokes est le rayon de Stokes de l'atome i et η corresponds à la

viscosité de l'eau. Fi est la force de l'atome i. Ri est la force aléatoire de l'atome i ayant une moyenne zéro <Ri(t)> = 0 et une variance de <Ri(t)Rj(t)> = 6ζikTδijδ(t); ceci est dérivé des effets du solvant.

Pour la limite sur-amortie, on fixe à 0 la partie gauche de l'équation 7,

L'intégration de l'équation 8 est appelée Dynamique Brownienne ;

ou Δt est l'échelle de temps et ωi est le vecteur aléatoire obtenu à partir d'une distribution gaussienne.

iii

ii

i ttm RF

rr

d

d

d

d2

2

iii

it

RFr

d

d

i

ii

i

iit

Tkt

tttt ω

Frr

B

2)()()(

(7)

(9)

(8)

Temps de calcul pour les Temps de calcul pour les DBDB

1,002.0577.681Pentium4 2,8 GHz

MD

IBM Regatta

8 CPU

Pentium4 2,8 GHz

Pentium4 2,8 GHz

Ordinateur

6053.4304BD

+MTS†

304

304

Nombre d'atome

16112.8BD

+MTS†

53,038,8BD

EfficacitéTemps (sec)

Algorithme

†Algorithme MTS (pas temporels multiples): Cette méthode réduit la fréquence des calculs des parties les plus demandées （ énergie non-lié ） .

Temps de calcul requis pour simuler un peptide durant 1 nanoseconde.

Simulation du repliement d'un Simulation du repliement d'un peptide “hélice peptide “hélice α”α” en utilisant en utilisant

la DBla DB

Pro

port

ion d

e

con

tact

s nati

fs

Durée de la simulation (nsec)

0 300200100 4000

0.20.4

0.60.8

1.0

Simulation du repliement d'un Simulation du repliement d'un peptide feuillet peptide feuillet ββ en utilisant en utilisant

la DBla DB

Pro

port

ion d

e

con

tact

s nati

fs

Durée de la simulation (nsec)

0 300200100 4000

0.20.4

0.60.8

1.0

Echelle de temps – Echelle de temps – Mouvement de Protéines et Mouvement de Protéines et

DBDB

Time

10-15 10-610-910-12 10-3 100

(s)(fs) (ps) (μs)(ns) (ms)

Les méthodes de DB permettent de simuler sur une plus longue durée.

DB

Plier une hélice α

Plier un feuillet β

Plier une Protéine

DM

Élongation de la liaison

Perméation d'un ion à l'intérieur d'une Porine

Vibrations élastiques des protéines

ConclusionsConclusionsLe problème du repliement des protéines est l'un des problèmes historiques de la biologie. Résoudre ce problème ouvrirait une nouvelle perspective vers une nouvelle étape de la biologie génomique. En DM, les équations du mouvement de Newton appliquées aux atomes d'un système sont intégrées par l'utilisation d'une méthode de différence finie. En DM, l'échelle de temps est limitée à environ une femtoseconde et le traitement d'un très grand nombre de molécules d'eau est essentiel. A cet égard, il est difficile d'effectuer une simulation sur une longue durée. Au contraire, le repliement des protéines demande une échelle de temps allant de la milliseconde à la seconde.Les développements des algorithmes de parallélisation et les ordinateurs spécialisés permettent de simuler plus rapidement des systèmes plus grands.La DB est une approche prospective pour des simulations de longue durée.

introduction au repliement des protéines et à la simulation moléculaire le repliement des...

Documents