master 1 biochimie isabelle milazzo umr cnrs 6014 equipe de chimie organique biologique et...
TRANSCRIPT
Master 1 Biochimie
Isabelle MILAZZOUMR CNRS 6014
Equipe de Chimie Organique Biologique et Structurale
Modélisation
à partir de données expérimentales de RMN
ModélisationMoléculaire
Stratégie générale de la détermination de la structure 3D de polypeptides
Attribution des fréquences de résonanceMesure des paramètres structuraux RMN
Structure secondaireContraintes de distancesContraintes angulaires
Calcul de structures initialesGéométrie des distances
Raffinement des structuresDynamique Moléculaire
(recuit simulé)Structures finales
Analyse RMN
A. Principes de la modélisation moléculaireI. GénéralitésII. Représentation empirique de l'énergie moléculaireIII. Les méthodes de calculs empiriques
1. Algorithmes de minimisation d'énergie2. Dynamique moléculaire
B. Détermination de la structure 3D d'une protéine à partir de données de RMN
I. Contraintes RMN utilisées pour les calculsII. Les méthodes de modélisation moléculaire appliquées aux peptides et
protéinesIII. Evaluation de la qualité des structures
Plan du Cours
I.Généralités
Modélisation Moléculaire = regroupement de différentes techniques pour
Qu'est-ce que la Modélisation Moléculaire ?
calcul graphisme
construire visualiser manipuler
analyser
des molécules
Calculs
Les calculs peuvent être effectués :
-soit sur une station de travail en local (calculs courts)
- soit sur un cluster de processeurs ou un CRAY (calculs longs)
• Visualisation infographique et dessin de moléculesà partir de données structurales et par l'utilisation d'un système informatique
• Utilisation de champs de forces empiriques pour déterminer les propriétés moléculaires ainsi que les distances intra- et inter-atomiques
• Corrélation entre des propriétés moléculaires et une structure moléculaire donnée
• Evaluation de la validité d'une structure moléculaire
• Obtention d'informations sur les mouvements dynamiques des molécules et sur leurs énergies
• Utilisation de banques de donnéespour identifier des systèmes moléculaires avec des points communs
• Application de la représentation infographique à la reconnaissance de molécules issues de chimie organique, bio-organique et médicale ainsi que des sciences des matériaux
Objectifs de la Modélisation Moléculaire
• Simuler une réaction chimique
• Simuler le mouvement des atomes d'hydrogène avec précision
• Simuler le comportement d'une molécule à très basse température
Ce que la Modélisation Moléculaire ne peut pas faire …
Principe Général de la Modélisation Moléculaire
molécule
Environnement(solvant, macromolécule, ...)
Etat d'équilibre molécule-environnement = minimum d'énergie E
E contient 3 termes :1- Einterne (molécule)2- Einteractions (molécule-environnement)3- Esolvant (environnement)
1. Méthodes quantiques ab initio
Molécules concernées : petites molécules ou fragments moléculaires
Nb d'atomes : ~ 10
Objectif : déterminer l'énergie et la distribution électronique-> Energies moléculaires calculées avec l'équation de Schrödingeravec le formalisme des orbitales moléculaires.
Principe :- on ne traite que des électrons : les noyaux sont considérés comme fixes(approximation de Born-Oppenheimer)-résolution de l'équation de Schrödinger sans approximation
Méthodes de calcul
2. Méthodes quantiques semi-empiriques
Molécules concernées : molécules de taille moyenne
Nb d'atomes : ~ 100
Objectif : déterminer l'énergie et la distribution électronique
Principe :- idem méthodes ab initiomais on ne regarde que les électrons de valence-résolution de l'équation de Schrödinger avec approximations
Méthodes de calcul
3. Méthodes empiriques
Molécules concernées : molécules de grande tailleType de molécules : Hydrocarbures, Polymères, Protéines, Acides nucléiques, Membranes, Polysaccharides, ...
Nb d'atomes : > 100 et < 10 000
Objectif : déterminer les minimas de l'énergie globale d'interaction (réduite à Einterne)
Principe :- Molécule = billes + ressorts (forces harmoniques)associés à une série de fonctions de potentiel :
Etot = Eparam1 + Eparam2 + Eparam3 + Eparam4 + ...
La somme de ces fonctions est exprimée sous la forme d'un champ de forces moléculaire ("force field")
Méthodes de calcul
II.Représentation empirique de l'énergie moléculaire
Notions de Structure Moléculaire
Etotal = Eliés + Enon_liés
1. Energies d'interactions entre atomes liés
a. Déformation du squelette
Elongation des liaisons Ebond kb(b b0)2
liaisons
C=C, kb = 570 kcal/mol.Å2, b0 = 1.229 Å
C-C, kb = 310 kcal/mol.Å2, b0 = 1.526 Å
0
50
100
150
200
250
300
0 0,5 1 1,5 2 2,5
longueur de liaison (Å)
E (
kcal/m
ol)
1. Energies d'interactions entre atomes liés
a. Déformation du squelette
Distorsion des angles de valence
Eangle k( 0 )2
anglesvalence
1. Energies d'interactions entre atomes liés
b. Energie de torsion
Etorsion k 1 cos(n ) angletorsion
0
0,5
1
1,5
2
2,5
0 60 120 180 240 300 360
E
ici, k=1, n=3 et =0
1. Energies d'interactions entre atomes liés
c. Energie des angles impropres
Eimpropres k ( 0)2
impr
0,0E+00
2,0E+04
4,0E+04
6,0E+04
0 60 120 180 240 300 360
°
E (
kca
l/m
ol)
atome A de type sp2, =0
AX
Y
Z
atome A de type sp3, =35.26°
2. Energies d'interactions entre atomes non liés
a. Energie d'interactions électrostatiques
Eélec 1
40r
qiqj
riji, j Loi de Coulomb
0 = permittivité du vide (0 = 1)r = permittivité relative
qiqi
0
0
-600
-400
-200
200
400
600
1 2 3 4
distance interatomique (Å)
E (
kcal/m
ol)
qiqj > 0
qiqj < 0
2. Energies d'interactions entre atomes non liés
a. Energie d'interactions électrostatiques
Calcul des charges qi et qj
À partir de méthodes ab initio ou semi-empiriques
• Del Ré:calcul des charges sur les liaisons de type (sigma)
• Gasteiger-Marsili:calcul des charges sur les liaisons de type (sigma) et (pi)fait appel à la notion d'électronégativité
• Hückel:calcul des charges sur les liaisons de type fait appel à la notion d'électronégativité
• Gasteiger-Hückel:associe le calcul des charges par la méthode de Gasteiger-Marsiliet celui des charges par Hückel
• Pullman:associe le calcul des charges par la méthode de Del Réet celui des charges par la méthode de Hückelplus adapté pour les peptides et les protéines
2. Energies d'interactions entre atomes non liés
b. Energie d'interactions de van der Waals
Evdw A ij
rij12
Bij
rij6i,j
Potentiel de Lennard-Jones
terme répulsif terme attractif
att
ract
ion
répu
lsio
n
r
E
3. Notion de champ de forces
Champ de forces = ensemblefonctions d'énergie potentielle+ paramètres numériques (constantes de forces, valeurs d'équilibre, etc.)obtenus expérimentalement ou évalués théoriquement
Exemples de champs de forces pour les molécules biologiques:
AMBER (Kollman, 1981) peptides, acides nucléiques SYBYL, ...(Assisted Method Building and Energy Refinement)CHARMM (Karplus, 1983) mo. biologiques, macromo., QUANTA, X-PLOR, CNS
interactions petites mo.-macromo.(Chemistry at HARvard Macromolecular Mechanics)ECEPP (Scheraga, 1983) peptides et protéines INSIGHT(Empirical Conformational Energy Program for Peptides)CVFF (Hagler, 1985) INSIGHT(Consistent Valence ForceField)
3. Notion de champ de forces
Extraits du champ de forces CHARMM
BOND CT1 C 250.000 {SD= .034} 1.490 ! ALLOW ALI PEP POL ARO ! Ala Dipeptide ab initio calc's (LK) fixed from 10/90 (5/91) BOND CT1 CT1 222.500 {SD= .036} 1.500 ! ALLOW ALI ! alkane update, adm jr., 3/2/92 BOND CT2 C 250.000 {SD= .034} 1.490 ! ALLOW ALI PEP POL ARO ! Ala Dipeptide ab initio calc's (LK) fixed from 10/90 (5/91) BOND CT2 CT1 222.500 {SD= .036} 1.538 ! ALLOW ALI ! alkane update, adm jr., 3/2/92 BOND CT2 CT2 222.500 {SD= .036} 1.530 ! ALLOW ALI ! alkane update, adm jr., 3/2/92 BOND CT3 C 250.000 {SD= .034} 1.490 ! ALLOW ALI PEP POL ARO ! Ala Dipeptide ab initio calc's (LK) fixed from 10/90 (5/91) ...
ANGLE CT1 CT1 C 52.00 {SD= .075} 108.0000 ! ALLOW ALI PEP POL ARO ! Alanine Dipeptide ab initio calc's (LK) ANGLE CT1 CT1 CT1 53.35 {SD= .074} 111.0000 UB 8.000 2.561 ! ALLOW ALI ! alkane update, adm jr., 3/2/92 ANGLE CT1 CT2 CT1 58.35 {SD= .071} 113.5000 UB 11.160 2.561 ! ALLOW ALI ! alkane frequencies (MJF), alkane geometries (SF) ANGLE CT2 CT1 C 52.00 {SD= .075} 108.0000 ! ALLOW ALI PEP POL ARO ! Alanine Dipeptide ab initio calc's (LK) ...
DIHEDRAL C CT1 NH1 C .20 {SD= 1.217} 1 180.0000 ! ALLOW PEP ! ala dipeptide update for new C VDW Rmin, adm jr., 3/3/93c DIHEDRAL C CT2 NH1 C .20 {SD= 1.217} 1 180.0000 ! ALLOW PEP ! ala dipeptide update for new C VDW Rmin, adm jr., 3/3/93c DIHEDRAL CT1 C NH1 CT1 MULTIPLE= 2 1.60 1 .0000 ! ALLOW PEP ! Revised to adjust NMA cis/trans energy difference. (LK) 2.50 2 180.0000 ! ALLOW PEP ! Gives appropriate NMA cis/trans barrier. (LK) DIHEDRAL CT1 CT1 NH1 C 1.80 {SD= .406} 1 .0000 ! ALLOW PEP ! ala dipeptide update for new C VDW Rmin, adm jr., 3/3/93c ...
IMPROPER NH1 X X H 20.00 {SD= .122} 0 .0000 ! ALLOW PEP POL ARO ! NMA Vibrational Modes (LK) IMPROPER NH2 X X H 4.00 {SD= .272} 0 .0000 ! ALLOW POL ! adm jr., 8/13/90 acetamide geometry and vibrations IMPROPER O CT1 NH2 CC 45.00 {SD= .081} 0 .0000 ! ALLOW PEP POL ! adm jr., 8/13/90 acetamide geometry and vibrations IMPROPER O CT2 NH2 CC 45.00 {SD= .081} 0 .0000 ! ALLOW PEP POL ! adm jr., 8/13/90 acetamide geometry and vibrations IMPROPER O CT3 NH2 CC 45.00 {SD= .081} 0 .0000 ! ALLOW PEP POL ! adm jr., 8/13/90 acetamide geometry and vibrations IMPROPER O NH2 CT1 CC 45.00 {SD= .081} 0 .0000 ! ALLOW PEP POL ! adm jr., 8/13/90 acetamide geometry and vibrations IMPROPER O NH2 CT2 CC 45.00 {SD= .081} 0 .0000 ! ALLOW PEP POL ! adm jr., 8/13/90 acetamide geometry and vibrations ...
3. Notion de champ de forces
Extraits du champ de forces CHARMM
Représentation des états d'énergie
= puits d'énergie
III.Les méthodes de calculs
empiriques
2 grandes familles :
1. Mécanique moléculaire (minimisation de l'énergie)Objectif:- déterminer les minimas de l'énergie globale d'interaction(réduite à Einterne)
2. Dynamique moléculaireObjectifs: - simuler les mouvements intramoléculaires- optimiser les structures d'une façon plus efficace
Les méthodes de calcul empiriques
III.1.Algorithmes de
minimisation d’énergie
déterminer les minimas de l'énergie globale d'interaction
(réduite à Einterne)
Algorithmes de minimisation d’énergie
coor. arbitraire
unit
é d
'énerg
ie a
rbit
rair
e
Objectif
Algorithmes de minimisation d’énergie
PrincipeEtant donné une fonction (une ou plusieurs variables indépendantes),trouver la valeur de la (ou des) variables(s) pour lesquelles la valeur de la fonctionest la plus faible= si la fonction est continue ou dérivable :
- dérivée première nulle
Deux types de mimima possibles :
Remarque
Pas de méthode de minimisation pour déterminer le minimum global détermination uniquement du minimum local le plus proche
coor. arbitraire
unit
é d
'énerg
ie a
rbit
rair
e- minimum global : valeur la plus faible de la fonction
- minima locaux : valeur minimum de la fonction dans un voisinage fini
F(xi )
xi
0
2F(xi)
xi2
0
- dérivée seconde positive
Principe
Soit une fonction F(x,y,z)Il s'agit de trouver un nouveau jeu de coordonnées (x',y',z') tel que
F(x',y',z') < F(x,y,z)
algorithmes itératifs qui, à chaque étape, déterminent un pointoù la fonction a une valeur plus faible
Différents types de méthodes :1. Méthodes directes
(Simplex - Random Search - Grid)2. Méthodes des dérivées premières (utilisent uniquement la pente de la surface)
(Steepest Descent - Conjugate Gradient - Powell)3. Méthodes des dérivées secondes (utilisent la pente et la courbure de la surface)
(Newton-Raphson)
Algorithmes de minimisation d’énergie
Méthode Simplex
X2
X1
Principe
simplex = figure géométrique à N+1 sommets dans un espace à N dimensionsEx. 1: dans un plan, simplex = triangleEx. 2: dans un espace à 3 dim., simplex = tétraèdre
1
2
3
4
5
6
78
9
10 Problème !
Méthode Simplex
Avantage
méthode robuste (minimisation même de fonctions non continues)
Inconvénients
nombre important d'évaluations de la fonction taille mémoire prop. à N2 si N variables méthode peu efficace
utilisation pour rectifier une mauvaise géométrie de départ
Méthode de la plus grande pente ("Steepest Descent")
Principe
A chaque étape de l'itération, recherche la direction de descente maximale(ou plus grande pente)
On déplace x de x et on cherche F(x+x)
F(x x) F(x)
x
1!
dF(x)
dx
La direction x est dite direction de descente si x. F(x) < 0
Si x est suffisamment petit, F(x+x) écrite sous forme d'une série de Taylor :
F(x) x.F(x) F(x) = gradient de F(x)
Méthode de la plus grande pente ("Steepest Descent")
Avantage
Convergence rapide pour des structures loin du minimum
Inconvénient
Convergence lente autour du minimum (oscillation des directions)
utilisation sur les structures initiales dans les premières étapes de minimisationpour rectifier les mauvais contacts
Méthode du gradient conjugué
Principe
Même principe que méthode de Steepest Descentmais utilise l'information issue des itérations précédentespour définir plus finement la direction et le pas
Avantages
Accélère la convergenceEvite les oscillations autour du minimum
Inconvénient
Plus coûteuse en temps de calcul (x2 comparé à Steepest Descent)Inutilisable pour des structures présentant de mauvais contacts
Méthode de Powell
Principe
Même principe que méthode de Gradient Conjuguémais avec règles d'avancement supplémentaires
III.2.Dynamique moléculaire
Principes de base de la dynamique
Objectif
Simuler les mouvements des atomes à l'intérieur d'une molécule pour regarder les fluctuations autour d'un minimum
description thermodynamique du système étudié(entropie, énergie libre, chaleur spécifique, etc.)
pour passer d'un minimum d'énergie à un autre optimiser les structures de façon plus efficace
coor. arbitraire
unit
é d
'énerg
ie a
rbit
rair
e
T (Ec)
Principes de base de la dynamique
Remarque
ps ns s ms sEchelle de temps
Mouvements détectableslocaux
Dynamique moléculaire
globaux
repliementmouvements de domaines
Principe
Déplacement des atomes les uns par rapport aux autressous l'action d'un champ de forces reproduisant au mieuxl'ensemble de leurs interactions
Chaque atome est considéré comme une masse ponctuelledont le mouvement dépend et est déterminépar l'ensemble des forces exercées par tous les atomes en fonction du temps
Principes de base de la dynamique
Principe
Au temps t, chaque atome i, de vecteur position ri et de masse mi
obéit aux équations de mouvements de Newton :
dri(t)
dtvi(t)
Fi miai mi
dvi(t)
dtmi
dri2(t)
dt
La force Fi exercée sur l'atome i par les autres atomes est donnée par
Fi
V r1(t),r2(t),...,rN(t) ri(t)
où V = fonction de l'énergie potentielle totale d'interactionsauxquelles est soumise la molécule
Intégration de ces équations de mouvement évolution de chaque atome en fonction du temps = trajectoiresous forme d'une série de positions et de vitesses dans l'espace
Principes de base de la dynamique
Déroulement d'une dynamique
3 étapes :1. thermalisation2. équilibration 3. production
Types de dynamique
Dynamique dans le vide
Avantages
Plus grande simplicitéPlus grande rapidité de calculPermet un temps de dynamique plus long
Inconvénients
Simulation d'une molécule hors de son contexte normalAugmentation des interactions électrostatiques dans la moléculeImpossibilité de simuler les effets hydrophobes
Types de dynamique
Dynamique en présence de solvant
Avantages
Meilleure prise en compte de l'effet électrostatiquePossibilité de formation de liaison H avec le solvantPrise en compte (partielle) de l'effet hydrophobeMeilleure stabilité du système
Inconvénients
Evaluation de tous les termes plus longuesNe permet pas de longue dynamique
Exemple d'analyse d'une dynamique
Fluctuations
Calcul de l'écart quadratique moyen(RMSD : Root Mean Square Deviation)
de chaque structurepar rapport à une structure de référence
RMSD(x) xi xmoy 2
i1,N
N
Structure de référence :structure moyenne de la dynamique structure expérimentalestructure de départ
Exemple d'analyse d'une dynamique
Fluctuations
Exemple : Fluctuations lors d'une dynamique de 60 ps de la bactériorhodopsine