spectrométrie de masse des peptides et protéines...
Post on 16-Sep-2018
215 Views
Preview:
TRANSCRIPT
Spectrométrie de Masse
des
Peptides et Protéines
APPLICATIONS
Identification de protéines
Analyse protéomique
Vérification de séquences de protéines
Vérification de séquence de protéine
• Clivage de la protéine par une (ou des)
endoprotéase(s) spécifique(s)
• Analyse des peptides formés par MALDI-MS,
sans séparation chromatographique préalable
Vérification de séquence de protéine
Exemple : correction de la séquence de
l ’isoleucyl-ARNt synthétase du
colibacille (environ 1100 acides aminés)
Il existe 15 zones de désaccord entre les
deux séquences répertoriées dans la base
SwissProt
Vérification de Séquence
IRS1
IRS2
Peptide trouvé dans le
spectre de masse
Masse en accord avec
la séquence
Analyse détaillée des peptides couvrant les 15 zones de désaccord
Vérification de Séquence
• Pb : la cartographie peptidique à l’aide d’une seule
protéase permet d’obtenir un taux de vérification de
séquence qui varie entre 60 et 90 % environ
• Origine du pb : la discrimination spectrale
Dans un mélange complexe de peptides trypsiques, ce
sont les peptides terminés par Arg (cf pKa) qui répondent
mieux que les peptides terminés par Lys
• L’utilisation combinée de plusieurs protéases spécifiques
permet le plus souvent de résoudre ce problème
Correction de la Séquence de l’IleRS
Strech
number
Sequences a Released peptides
b
Calculated
mass (Da) c
Measured
mass(Da)
Correct
sequence
1 157DFKT-E
161
GLQNWK
143LGV...DFK
159 T
157DFK...WCV
188 D
1978.97
3522.92
1978.91
3522.93
IleRS1 157
DFKTE161
2 197AEVEYYDKTSPSIDVAFQ
214
RKLSITT-LLRPSTLLSR
205TSP...ALK
222 T
189DCR...EYY
202 D
1904.95
1618.70
1905.03
1618.74
IleRS1 197
AEVEYYDKTSPSIDVAFQ214
3 242RRGLC--TAQSL-LHQISTMRWW
263
TP-WTLPANRAISIAPDFDYALV
225FAV...ANR
250 T
251AIS...LAK
274 T
2854.52
2531.37
2854.56
2531.43
IleRS2 242
TPWTLPANRAISIAPDFDYALV263
4 289YTILGTVKGADVELLR
304
-SRH-KRC--GAA--A
284IGV...LLR
304 T
275DLV...TVK
296 K
2233.24
2437.29
2233.30
2437.24
IleRS1 289
YTILGTVKGADVELLR304
5 383V
A
352TAN...LQE
388 E
378AND...QEK
389 K
3858.97
1312.75
3859.10
1312.70
IleRS1 383
V
6 586C
R
587QVL...QGR
600 T
583APY...GRK
601 K
1514.76
2130.11
1514.71
2130.08
IleRS2 586
R
7 636Q
E
622DIL...AVS
640 D
626LWV...LKR
646 T
2127.04
2384.17
2127.02
2384.22
IleRS2 636
E
8 650S
T
649DSY...NGF
668 D 2397.28 2397.31 IleRS1
650S
9 677PE
678
RR
673DMV...LDR
685 T
673DMV...VVL
683 D
1560.77
1289.64
1560.81
1289.67
IleRS1 677
PE678
10 689GCAKAAQEDILKAYEAYDFHEVVQ
712
VVR-RHRKTSSRRTKHTISTKWYK
684DRW...AQE
696 D
697DIL...EAY
705 D
1404.66
1085.54
1404.60
1085.48
IleRS1 689
GCAKAAQEDILKAYEAYDFHEVVQ712
11 723V
G
706DFH...IIK
731 D 3204.56 3204.62 IleRS1
723V
12 736TPKRTVW
742
YA-GHSV
734QYTPKR
739 T
792.43 792.44 IleRS1 736
TPKRTVW742
13 786L
F
781REK...WYE
792 E
771DEV...GLA
798 D
1322.5
3310.57
1322.1
3310.65
IleRS2 786
F
14 829N
K
821VIE...ADK
829 K
828DKK...ALG
855 D
1029.56
2831.53
1029.59
2831.57
IleRS2
829K
15 866GAT-
868
DRRY
856DEL...TVA
870 D
860FVL...VLK
870 T
1591.86
2823.40
1591.83
2823.31
IleRS2 866
GAT868
a : top: IleRS1, bottom IleRS2; numbering refers to the correct sequence; b : corresponding proteases are designated by letters T: trypsin; E : EndoGluC;
D : EndoAspN. K : EndoLysC. c : monoisotopic masses, [M + H]+ ion
Résultat de l’analyse
• Les deux séquences
publiées étaient
fausses
• 9 erreurs dans l’une, 6
erreurs dans l ’autre...
Identification de protéines
Identification de protéine
• Une protéine dont l’activité est caractérisée (dosée) est analysée par électrophorèse 1D en conditions dénaturantes
• La bande de gel correspondant à l’activité connue est excisée, puis soumise à l’action d’une protéase
• Les peptides engendrés par ce clivage sont extraits et analysés par MALDI-MS
Identification de Protéines
Une protéine peut être identifiée par la mesure de masse
(avec une grande exactitude) de plusieurs segments peptidiques
Clivage
protéolytique
in silico et
in vitro
Digest in-gel /Endo Lys C - MALDI
m/z1200 1400 1600 1800
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
[Abs. Int. *10^ 3]
IMP nucléotidase S. cerevisiae
1479.73
1216.58
Commentaires
• Tous les peptides ne sont pas détectés
Deux raisons :
• non-extraction de certains peptides du gel
• Discrimination en mode MALDI pour des mélanges complexes (les peptides contenant Arg prédominent)
Dans cet exemple, deux signaux ne sont pas assignés à la protéine identifiée
Identification de l ’ORF YOR155c
• 8 pics sur 10 sont attribués => réponse unique
ORF YOR155c ( logiciel d’identification par empreinte peptidique PMF (MS-Fit de Protein Prospector)
• 1 pic analysé en MS/MS => séquence confirmée et réponse unique et identique (logiciel d’identification par ions fragments MS-Tag de Protein Prospector))
• 2 pics non attribués : m/z 1216.58 et 1479.73
Identification de l ’ORF YOR155c
• Pic à m/z 1216.58 : EEWLLPRMoxK
1216.63 calc. voisin du pic EEWLLPRMK
Artefact de l’électrophorèse
• Pic à m/z 1479.73
Hypothèse : excision Met initiatrice suivie d’une acétylation ( m/z 1479.76 calc. en accord) AcSSRYRVEYHLK
Confirmation par analyse des ions de séquence en mode MS/MS pour l’ion 1479.73
Analyse
protéomique
Analyse d’expression différentielle
Comparaison des protéomes entre une lignée
cellulaire de référence et une lignée soumise
à un stress
Aspects fondamentaux et appliqués
Application à diverses pathologies telles que
différentes formes de cancers, diabète, …
Evolution vers une protéomique « clinique »
Cas 1 Cas 2 Cas 3 Cas 4
Tissu
non
tumoral
CHC
Diminution de l’expression dans les CHC
Application : cancer du foie - patients infectés/VHC
Blanc J.F. et al. Proteomics, 2005
Excision du fragment de gel
contenant la / les protéine(s)
Digestion par
une endoprotéase
Extraction
des peptides
Analyse MALDI
Peptides en solution
Analyse protéomique
Recherche dans les
bases de données
Identification
de la protéine
m/z1000 1500 2000 2500 3000
50
100
150
200
250
300
350
400
450
500
550
600
650
[Abs. Int.]
Analyse d’une bande de gel d’électrophorèse
SDS-PAGE (1D)
1500 2000 2500 3000 3500 m/z0,0
0,2
0,4
0,6
0,8
1,0
1,2
9x10Intens.
1611,95
2197,24
1402,72
2706,40
2733,47
3452,48
2496,32
2872,48
1833,98
2013,10
2465,20
,
H
H
H
H
H
H
G
G
G
G
G
G G
G
F
FF
F
FH
Protéome de Saccharomyces cerevisiae
Mesure MALDI-MS -PMF Masse mesurée : 1549,76 (étalonnage externe)
Nombre
d’acides
aminés
Masse
(Da)
Delta
masse
(ppm)
Séquence
Identification
13 1549.77 6.5 VAMESEMDQRILK P36066
13 1549.77 6.5 NTINNYEVMPNLK P03881
14 1549.90 90 RKANIALRGQASHK P48233
Protéome de Saccharomyces cerevisiae
Masse mesurée : 1549,85 (étalonnage interne)
Nombre
d’acides
aminés
Masse
(Da)
Delta
masse
(ppm)
Séquence
Identification
13 1549.77 50 VAMESEMDQRILK P36066
13 1549.77 50 NTINNYEVMPNLK P03881
14 1549.90 30 RKANIALRGQASHK P48233
13 1549.83 13 RTNAENEFVTIKK Kératine
Homo sapiens
10050
2010
1560,77 EC
1611,95 SC0
50
100
150
200
250
nb de réponses
ppm
1560,77 EC
1611,95 SC
Analyse protéomique
Nombre de séquences pouvant correspondre à un peptide
en fonction de l’exactitude de la mesure de masse
SC Saccharomyces cerevisiae EC Escherichia coli
Analyse protéomique
Minimum de 3 peptides pour une empreinte
Nombre de séquences pouvant correspondre à un peptide
en fonction de l’exactitude de la mesure de masse
EC Escherichia coli
10050
2010
3 peptides
1560,77 EC0
20
40
60
80
100
120
140
nb de séquences
ppm
3 peptides
1560,77 EC
Actuellement, les identifications de protéines
sont validées uniquement après identification
de plusieurs séquences au moyen de la
MS/MS
Caractérisation des modifications post-traductionnelles des protéines
Caractérisation de Protéines
Une protéine peut être identifiée sans ambiguïté par la séquence (ordre d’enchaînement) des Acides Aminés (AA) de plusieurs segments peptidiques
La caractérisation complète nécessite la connaissance (atome par atome) de toute la structure primaire de la protéine. Ceci implique notamment les modifications post-traductionnelles (PTM)
Modifications post-traductionnelles
Modifications post-traductionnelles
• Environ 300 recensées actuellement
• Presque tous les acides aminés peuvent être affectés
• L’information sur ces modifications ne peut être obtenue qu’à partir des protéines matures
• Ces modifications ont divers rôles, souvent cruciaux : structuration, régulation de l’activité ou de la durée de vie, sélectivité des interactions protéine-protéine
Modifications post-traductionnelles
Acide aminé
modifié
Nature de la
modification
Rôle possible
N-terminal Acétylation,
alkylation,
pyroglutamylation, …
Protection, durée de
vie
Cys Pont disulfure Structuration,
régulation
Ser, Thr Phosphorylation Régulation
Ser,Thr O-glycosylation interactions
Tyr, Phosphorylation,
sulfatation
Régulation,
interactions
Asn N-glycosylation Interactions, durée
de vie
Pro Hydroxylation Stabilisation
Glu Gamma-carboxylation Interactions/Ca
Glu Polyglutamylation,
polyglycylation
Interactions
Lys Méthylation ?
Incréments de masse apportés par quelques
modifications
Nature Delta masse
Acétylation 42.011
Phosphorylation 79.97
Méthylation 14.016
Hydroxylation, Oxydation Met 15.99
Carboxylation Glu, Asp 43.99
Myristoylation 210.20
Maturation du N-terminal
• Excision de la méthionine initiatrice par la méthionyl-aminopeptidase, conditionnée par la taille du second acide aminé
• Excision pour des résidus de faible taille : Gly, Ala, Ser, …
• Absence d’excision pour des résidus de grande taille : Phe, Trp, Arg, … (environ 40%)
• Ce n’est pas un phénomène de « tout ou rien » pour les résidus de taille intermédiaire
Cas de la stathmine
• La stathmine humaine exprimée chez E. coli
ne migre pas comme la protéine de type
« sauvage » en électrophorèse
• Hypothèse d ’excision de la méthionine et
de non-acétylation, selon la séquence
Humaine Acétyl-Ala-Ser-Ser-Asp-…
Recomb. (Met)-Ala-Ser-Ser-Asp-...
Vérification par mesure de masse en mode MALDI
2+
1+
Référence interne
Cytochrome c
Confirmation de l’hypothèse - Différence d’une charge
expliquant la différence de migration électrophorétique
PHOSPHORYLATION
Phosphorylation
• Modification Post-Traductionnelle (MPT) réversible qui forme les bases des voies de signalisation cellulaire
• Plus de 30% des protéines (protéome eukaryote) sont susceptibles d’être phosphorylées à un moment donné de leur existence
• Compréhension de la régulation de processus cellulaires
• Implications importantes pour comprendre des processus patho-physiologiques (cancers, …)
Phosphorylation
N CH C
CH2
R'
O
O
N CH C
CH
R'
O
CH3
O
N CH C
CH2
R'
O
O
P
O
OHHO P
O
OHHO
P
O
OHHO
R R R
H H H
Serine (S) Threonine (T) Tyrosine (Y)
Modification de la chaîne latérale:
MS : + 80 Da par groupe phosphate (HPO3)
Méthodes d’enrichissement de phosphopeptides
• Chromatographie d’affinité pour des ions métalliques immobilisés (IMAC)
– ZipTip MC (Millipore)
– Phos-Select (Sigma)
– POROS 20 MC (Sigma)
• Chromatographie d’affinité sur support de TiO2
– HyperSep Tip TiO2 (Thermo)
– Phos-Trap (Perkin Elmer)
Phos-Select (Sigma)
m/z800 900 1000 1100 1200 1300 1400 1500 1600 1700 1800 1900 2000 2100 2200 2300 2400
%
0
100
%
0
100
%
0
100
071220_beta saceine_1pmu_PhosSelect_Elution2_acyano 5 (0.552) Cm (5:162) 1: TOF MS LD+ 1.46e32062.8779
1964.8926
1946.88701105.5327977.4609
959.4558876.40201233.5957 1361.6489 1688.75511490.7324 1812.9314
1965.8853
1966.9109
2063.8950
2064.8955
2065.8633
071220_beta saceine_1pmu_PhosSelect_Wash2_acyano 145 (3.126) Cm (6:158) 1: TOF MS LD+ 9201383.8196
1270.7483994.5795830.4612 1137.5840 1272.7383
1384.8167
1385.8416
2151.17481386.8257
1769.98411387.8103 2061.92721964.92502282.2642
071220_beta saceine_1pmu_H2O_acyano 117 (2.624) Cm (5:160) 1: TOF MS LD+ 1.93e41383.8333
1270.74831137.5840994.5911830.4718
1384.8303
1385.8416
2151.1748
2062.89451386.8257
1768.93381387.8376 1729.9478 1964.90891885.0222
2152.1797 2282.2114
2281.2471
2154.20652284.2290
Elution
Lavage
Avant
enrichissement
72
2.84 e3
1.46 e3
Perte d’acide phosphorique lors d’un processus de fragmentation en mode CID
Déphosphorylation -80 Da
Perte de neutre (H3PO4) - 98Da
Confirmation d’une phosphorylation : perte de neutre en MS/MS
CID / ECD et ETD - Peptides
Dans le cas des peptides, les ruptures observées en CID concernent les liaisons peptidiques et les liaisons impliquant les modifications post-traductionnelles (PTM).
La rupture de ces dernières empêche souvent leur localisation précise, notamment pour la phosphorylation, la sulfatation, la O-glycosylation.
La dissociation non-ergodique de type ECD et ETD provoque la rupture aléatoire de liaisons N-Ca, et la formation d’ions de type c et z, laissant les chaînes latérales intactes.
CID ETD
Comparaison d’un mode de fragmentation CID et ETD d’un peptide phosphorylé sur une sérine (ion 3+)
ETD et analyse top-down
L’ETD est également utilisable à partir de protéines entières en raison de sa capacité à fournir des séquences contiguës d’acides aminés sur de long segments à partir des ions c et z (approche top down opposée à une approche bottom up)
Stratégie top-down
Identifier une protéine par sa séquence partielle en partant de la protéine intacte
A D Catherman, OS Skinner, NL Kelleher
Top Down proteomics: Facts and perspectives, BBRC 445 (2014) 683–693
Stratégie top-down
Associe la mesure de masse de la protéine avec une grande exactitude à des analyses d’ions fragments sur la protéine entière.
Ceci peut se pratiquer avec des instruments de type FT-ICR (mode de fragmentation : ECD) et Orbitrap (mode de fragmentation : ETD).
Le séquençage n’est que partiel, mais est suffisant pour l’identification, et l’information sur la localisation des modifications post-traductionnelles peut être obtenue pour les zones séquencées en N- et C-terminal
GLYCOSYLATION
N- et O-glycosylation
N - glycosylation
Mise en évidence de peptide glycosylé
Variabilité de l’état de la glycosylation sur un site
Analyse MALDI de N-glycannes après action de la PNGase F
Modifications post-traductionnelles du facteur IX
Domaine d’activation du
Facteur IX
S P
Glyc
Glyc GlycGlyc
Glyc
Analyse MALDI du peptide d’activation du FIX
A146 T148 Y155 S158 R180
S P
A146 A148 Y155 S158 R180
S P A146 A148 Y155 S158 R180
S P ou
A146 T148 Y155 S158 R180
S P ou
6000
4000
3000
2000
1000
5000
4030 4180 4130 4080
Da
m/z
4019.2
4049.2 4129.3
4099.3
S P
S P
A146 A148 Y155 S158 R180
Analyse en MALDI MS du peptide
d’activation du FIX recombinant
m/z
4019.2
3939.2
4099.2
4304.4
Matrice ATT
Ions négatifs
et
ou
80
160
Modifications post-traductionnelles
Méthodologies
• Phosphorylation : MS/MS et pertes de neutres
+ enrichissement /chromatographie
(Analyse quantitative possible : PhIAT)
• Glycosylation : MS/MS et endoglycosidases
POLY-GLYCYLATION
Une modification particulière : la polyglycylation du
domaine C-terminal de la tubuline sur des résidus Glu
top related