protéomique
Post on 13-Jan-2016
37 Views
Preview:
DESCRIPTION
TRANSCRIPT
Protéomique
Schizosaccharomyces pombehttp://www.nature.com/msb/journal/v3/n1/fig_tab/msb4100117_F3.html
Protéome = ensemble des protéines d’une cellule, ou d’une organelle, à un instant donné (et donc sous des conditions données)
Connaissance du génome n’implique pas la connaissance du protéome (régulation de la transcription, de la traduction, de la localisation cellulaire, etc.)
Connaissance du transcriptome n’implique pas la connaissance du protéome (régulation de la traduction et de la localisation cellulaire, durée de vie des protéines, etc.)
Protéomique
Protéome = ensemble des protéines d’une cellule, ou d’une organelle, à un instant donné (et donc sous des conditions données)
Génome = ensemble des gènes d’un organisme, ou d’une espèce
Y-a-t-il un parallèle complet entre génomique et protéomique ?
Génome versus Transcriptome et Protéome
http://www.ac-grenoble.fr/xmallet/IMG/gene_proteine.jpg
http://www.defl.ca/~debloisj_dev/cellules/images/Cell_fundp.ac.be/cellule.jpg
Protéomique
Protéome = ensemble des protéines d’une cellule, ou d’une organelle, à un instant donné (et donc sous des conditions données)
Génome = ensemble des gènes d’un organisme, ou d’une espèce
Y-a-t-il un parallèle complet entre génomique et protéomique ?
Génome : taux d’erreur de la réplication, ~10-7
modifications de la chromatine (méthylation, etc.)Protéome : taux d’erreur de la transcription, 10-4 - 10-5
erreur/polymorphisme de l’épissage
erreur/polymorphisme de l’édition
erreur de la traduction, 10-4
repliement
modifications post-traductionnelles (irréversible/réversibles)
localisation cellulaire
Électrophorèse 2D
http://www-lmmb.ncifcrf.gov/phosphoDB/2d-description.gif
Electrophorèse 2D
http://www.bio.davidson.edu/COURSES/genomics/2003/clement/Cox5b_Mouse%20Liver%202D%20Gel.jpg
DIFFÉRENTES VISIONS DE LA PROTÉOMIQUE
• Protéomique fonctionnelle : interactions protéines-protéines (double-hybride, PCA, Tap-Tag MS-MS, etc.), etc.
• Protéomique structurale : structure tridimensionnelle de toutes les protéines (cristallographie, RMN, etc.)
• Pharmacoprotéomique
• Etc.
--> description de toutes les protéines à un instant t en utilisant la spectrométrie de masse
http://assoxenope.free.fr/cours/proteomique.pdf
http://assoxenope.free.fr/cours/proteomique.pdf
http://assoxenope.free.fr/cours/proteomique.pdf
http://www.erudit.org/revue/ms/2004/v20/n5/008428arf001n.jpg
http://assoxenope.free.fr/cours/proteomique.pdf
http://assoxenope.free.fr/cours/proteomique.pdf
http://assoxenope.free.fr/cours/proteomique.pdf
Le peptide trypsique
NH3+
C
C
R1
O
NH
C
C
NH
R2
O
C
C
R3
O
NH
C
C
OOH
CH2
(CH2)3
NH3+
Se termine par une Lysine ou une Arginine donc 2 sites basiques protonables par peptide : le NH2 terminal et le NH2 de la chaîne latérale de la Lys ou de l’Arg
Lysine
coursenligne.u-strasbg.fr/depotcel/DepotCel/279/Intranet/Carapito.ppt
http://assoxenope.free.fr/cours/proteomique.pdf
http://assoxenope.free.fr/cours/proteomique.pdf
http://pbil.univ-lyon1.fr/events/jobim2005/presentations/vandenbrouck.pdf
www.univ-lille1.fr/master-proteomique/proteowiki/images/2/23/Structure_d%27une_source_MALDI.png
Désorption-ionisation laser assistée par matriceMatrix-Assisted Laser Desoption/Ionisation (MALDI)
Avantages : * Possibilité d'ioniser des molécules de hautes masses moléculaires * Méthode d'ionisation douce : peu de fragmentation des ions moléculaires * Permet d'analyser des échantillons de faible concentration (de l'ordre de la picomole (10-12) et de la femtomole (10-15) ) * Produit principalement des ions monochargés, spectre plus simple à analyser * Grande tolérance aux sels et aux tampons
Tampon et sels Masse molaire (en g/mol)
Concentration maximale compatible avec le MALDI (en mM)
Tris 121 100
HEPES 238 100
Bicine 163 50
Urée 60 500
Guanidine 96 250
DTT 154 500
Glycérol 92 130
PEG 2000 2000 0,5
Triton X-100 628 1,6
NP 40 603 1,7
SDS 288 0,35
Inconvénients : * Formation d'adduits (combinaison directe de 2 espèces chimiques distinctes) et d'ions de matrice
Désorption-ionisation laser assistée par matrice (MALDI)
http://www.univ-lille1.fr/master-proteomique/proteowiki/index.php/D%C3%A9sorption-ionisation_laser_assist%C3%A9e_par_matrice
Ionisation par électrosprayElectrospray Ionisation (ESI)
Pression
élevée
Pression faible
http://www.univ-lille1.fr/master-proteomique/proteowiki/index.php/Ionisation_par_%C3%A9lectrospray
[M+nH]n+
n pouvant aller jusqu'à plusieurs dizaines
m/z = (M+3)/3, (M+4)/4, (M+5)/5, (M+6)/6
Avantages :• molécules en solution• La multicharge permet l’étude de molécule de plus haut
poids moléculaire que la limite de l'analyseur
Inconvénients :• complique l'analyse de spectre
http://assoxenope.free.fr/cours/proteomique.pdf
m étant la massev la vitessel la distance parcourue pendant le volt le temps de volz la charge de l’ionV la tension accélératricee étant la charge élémentaire
Temps de volTime Of Flight (TOF)
QuickTime™ et undécompresseur TIFF (LZW)
sont requis pour visionner cette image.
QuickTime™ et undécompresseur TIFF (LZW)sont requis pour visionner cette image.
QuickTime™ et undécompresseur TIFF (LZW)
sont requis pour visionner cette image.
http://fr.wikipedia.org/wiki/Spectrom%C3%A8tre_de_masse#L.27ionisation_.C3.A9lectronique_.28EI.29
• Le temps de vol• L'analyseur quadripolaire• Le piège ionique quadripolaire• Le FT-ICR• L'orbitrappe• L'analyseur à secteur magnétique
• Chambre d'ionisation• Jonction au silicium• Scintillateur• Cage de Faraday• Détecteur à induction• Multiplicateur d'électrons• Détection dans un spectromètre de masse à résonance cylcotronique• Détecteur hybride• Détecteur cryogéniquehttp://www.univ-lille1.fr/master-proteomique/proteowiki/index.php/Portail:Spectrom%C3%A9trie_de_masse
Détecteur en spectrométrie de masse
+ grande diversité de fabricants
Multitudes de types d’information et de formats de fichier
http://w3.umh.ac.be/~ichim/docs/99-05/principe.gif
Spectrométrie de masse en tandem
CH
R1
R2
CO NH
a b c
x y z
NH2 CH CO NH CH COOH
R3CH2
v w
d
Règles de fragmentation des peptides Biemann, 1990
Ions de série a, b et c : charge positive portée par la partie N-terminal
Ions de série x, y et z : charge positive portée par la partie C-terminal
Ions de série d, v et w : fragmentation des chaînes latérales
Fragmentations basse énergie
Fragmentations haute énergie
Biemann K., Appendix 5, Nomenclature for peptide fragment ions (positive ions), Methods Enzymol, 1990, 193, 886-7
coursenligne.u-strasbg.fr/depotcel/DepotCel/279/Intranet/Carapito.ppt
+ALLLFSDGR+
Fragmentation des peptides : La loi du proton mobile
+ALLLFSDGR+
+ALLLFSDGR+
+ALLLFSDGR+
+ALLLFSDGR+
Fragmentation dans la cellule de collision
Les peptides ne cassent qu'une seule fois pour générer préférentiellement les fragments y et b
+ALLLFSDGR+
+ALLLFSDGR+
Dongré et al., Journal of Mass Spectrometry, Vol. 31, 339-350 (1996)
+A+AL+ALL+ALLL+ALLLF+ALLLFS+ALLLFSD+ALLLFSDG
Fragments b
LLLFSDGR+
LLFSDGR+
LFSDGR+
FSDGR+
SDGR+
DGR+
GR+
R+
Fragments y
coursenligne.u-strasbg.fr/depotcel/DepotCel/279/Intranet/Carapito.ppt
En abscisse, le rapport masse/charge ; en ordonnée, le pourcentage des ions possédant une masse donnée. En pratique, seul l'espacement entre les pics est interprété, pas leur hauteur. En interprétant ces espacements, il est possible de reconstituer la séquence peptidique. Sur cet exemple, la lecture du spectre de droite à gauche permet de reconstituer la séquence EWMPGQPR
Exemple de spectre MS/MS
http://interstices.info/upload/proteomique/schema-spectre.gif
Peptide Mass Fingerprint
Cut out2D-Gel
Spot
http://www.umiacs.umd.edu/~nedwards/teaching/BCHM676_Spring_2007/handouts/Lecture3.ppt
Concentrations as low as 10 femtomoles (10-15)
Peptide Mass Fingerprint
Trypsin Digest
http://www.umiacs.umd.edu/~nedwards/teaching/BCHM676_Spring_2007/handouts/Lecture3.ppt
Peptide Mass Fingerprint
MS
http://www.umiacs.umd.edu/~nedwards/teaching/BCHM676_Spring_2007/handouts/Lecture3.ppt
Peptide Mass Fingerprint
http://www.umiacs.umd.edu/~nedwards/teaching/BCHM676_Spring_2007/handouts/Lecture3.ppt
Protein Sequence
• Myoglobin GLSDGEWQQV LNVWGKVEAD IAGHGQEVLI RLFTGHPETL EKFDKFKHLK TEAEMKASED LKKHGTVVLT ALGGILKKKG HHEAELKPLA QSHATKHKIP IKYLEFISDA IIHVLHSKHP GDFGADAQGA MTKALELFRN DIAAKYKELG FQG
http://www.umiacs.umd.edu/~nedwards/teaching/BCHM676_Spring_2007/handouts/Lecture3.ppt
Protein Sequence
• Myoglobin GLSDGEWQQV LNVWGKVEAD IAGHGQEVLI RLFTGHPETL EKFDKFKHLK TEAEMKASED LKKHGTVVLT ALGGILKKKG HHEAELKPLA QSHATKHKIP IKYLEFISDA IIHVLHSKHP GDFGADAQGA MTKALELFRN DIAAKYKELG FQG
http://www.umiacs.umd.edu/~nedwards/teaching/BCHM676_Spring_2007/handouts/Lecture3.ppt
Peptide Masses
1811.90 GLSDGEWQQVLNVWGK
1606.85 VEADIAGHGQEVLIR
1271.66 LFTGHPETLEK
1378.83 HGTVVLTALGGILK
1982.05 KGHHEAELKPLAQSHATK
1853.95 GHHEAELKPLAQSHATK
1884.01 YLEFISDAIIHVLHSK
1502.66 HPGDFGADAQGAMTK
748.43 ALELFR
http://www.umiacs.umd.edu/~nedwards/teaching/BCHM676_Spring_2007/handouts/Lecture3.ppt
Peptide Mass Fingerprint
GL
SD
GE
WQ
QV
LN
VW
GK
VE
AD
IAG
HG
QE
VL
IR
LF
TG
HP
ET
LE
K
HG
TV
VL
TA
LG
GIL
K
KG
HH
EA
EL
KP
LA
QS
HA
TK
GH
HE
AE
LK
PL
AQ
SH
AT
KY
LE
FIS
DA
IIH
VL
HS
K
HP
GD
FG
AD
AQ
GA
MT
K
AL
EL
FR
http://www.umiacs.umd.edu/~nedwards/teaching/BCHM676_Spring_2007/handouts/Lecture3.ppt
QuickTime™ et undécompresseur TIFF (LZW)
sont requis pour visionner cette image.
http://www.expasy.ch/pig/publi/Thesis-StevenGay.pdf
Sensitivité versus spécificité
• Sensitivité : identifier le plus de protéines (le moins de faux négatifs)
• Spécificité : identifier le plus de vrais positifs
PLOS Comp. Biol. (2008) 4:e12
Le Dalton est une unité de masse qui correspond à peu près à la masse d’un atome d’hydrogène.Exprimé en g, 1 Da correspond à environ 1,66 10-24 g.
Petit rappel
Glycine 75Alanine 89Sérine 105Proline 115Valine 117Thréonine 119Cystéine 121Isoleucine 131Leucine 131Asparagine 132Aspartate 133Glutamine 146Lysine 146Glutamate 147Méthionine 149Histidine 155Phénylalanine 165Arginine 174Tyrosine 181Tryptophane 204
Précision de la spectrométrie de masse : 0,1 dalton à 10 daltons
Modifications post-traductionnelles
Acétylation 33Méthylation 15Glutamylation 146Glycylation 75Glycosylation >30Isoprénylation >100Phosphorylation 95
Digest with specific protease
Trypsin (K, R; not followed by P)Chymotrypsin (F, W, Y, L, M)Lys-C (K)Arg-C (R)Asp-N (D, N-terminal)V8-bicarb (E)V8-biphosph (E, D){CNBr (M)}
http://academic.uofs.edu/organization/IMBM/PMF_talk.ppt
Digest with specific protease
Why trypsin?
High specificity (K or R, not followed by P)
Acetylated form commercially available
(acetylation lessens autodigestion)
Autolysis peaks are great internal calibrants
(842.509 and 2212.11)
(2254.12), guanidinated
http://academic.uofs.edu/organization/IMBM/PMF_talk.ppt
Digest with specific protease
>RBME00320 Contig0311_1089618_1091255 EC-mopA 60 KDa chaperonin GroELMAAKDVKFGR TAREKMLRGV DILADAVKVT LGPKGRNVVI EKSFGAPRIT KDGVSVAKEV ELEDKFENMG AQMLREVASK TNDTAGDGTT TATVLGQAIV QEGAKAVAAG MNPMDLKRGI DLAVNEVVAE LLKKAKKINT SEEVAQVGTI SANGEAEIGK MIAEAMQKVG NEGVITVEEA KTAETELEVV EGMQFDRGYL SPYFVTNPEK MVADLEDAYI LLHEKKLSNL QALLPVLEAV VQTSKPLLII AEDVEGEALA TLVVNKLRGG LKIAAVKAPG FGDCRKAMLE DIAILTGGQV ISEDLGIKLE SVTLDMLGRA KKVSISKENT TIVDGAGQKA EIDARVGQIK QQIEETTSDY DREKLQERLA KLAGGVAVIR VGGATEVEVK EKKDRVDDAL NATRAAVEEG IVAGGGTALL RASTKITAKG VNADQEAGIN IVRRAIQAPA RQITTNAGEE ASVIVGKILE NTSETFGYNT ANGEYGDLIS LGIVDPVKVV RTALQNAASV AGLLITTEAM IAELPKKDAA PAGMPGGMGG MGGMDF
546 aa 60 kDa; 57 461 Da pI = 4.75
http://academic.uofs.edu/organization/IMBM/PMF_talk.ppt
Digest with specific protease
Trypsin yields 47 peptides (theoretically)
501.3 533.3 544.3 545.3 614.4 634.3
674.3 675.4 701.4 726.4 822.4 855.5
861.4 879.4 921.5 953.4 974.5 988.5
1000.6 1196.6 1217.6 1228.5 1232.6 1233.7
1249.6 1249.6 1344.7 1455.8 1484.6 1514.8
1582.9 1583.9 1616.8 1726.7 1759.9 1775.9
1790.6 1853.9 1869.9 2286.2 2302.2 2317.2
2419.2 2526.4 2542.4 3329.6 4211.4
Peptide masses in Da:
http://us.expasy.org/tools/peptide-mass.html
http://academic.uofs.edu/organization/IMBM/PMF_talk.ppt
Digest with specific protease
Trypsin yields 47 peptides (theoretically)
501.3 533.3 544.3 545.3 614.4 634.3
674.3 675.4 701.4 726.4 822.4 855.5
861.4 879.4 921.5 953.4 974.5 988.5
1000.6 1196.6 1217.6 1228.5 1232.6 1233.7
1249.6 1249.6 1344.7 1455.8 1484.6 1514.8
1582.9 1583.9 1616.8 1726.7 1759.9 1775.9
1790.6 1853.9 1869.9 2286.2 2302.2 2317.2
2419.2 2526.4 2542.4 3329.6 4211.4
Peptide masses in Da:
http://us.expasy.org/tools/peptide-mass.html
http://academic.uofs.edu/organization/IMBM/PMF_talk.ppt
Théorie et Pratique
Supposant que l’on connaisse la séquence exacte, on peut prédire une liste de peptides (et leur masse), mais on va en voir moins par MS
Digestion incomplète :¤ enzyme n’est pas parfait (e.g. trypsine coupe
moins bien quand un a.a. basique est adjacent au site de
clivage)¤ empêchement stérique¤ cinétiquePeptides perdus au cours de l’expérience :¤ lavages¤ mauvaise ionisationPeptides supplémentaires :¤ contaminations¤ clivage non spécifique¤ modifications (e.g. oxydation de la méthionine)
Digest with specific protease
Trypsin yields 47 peptides (theoretically)
501.3 533.3 544.3 545.3 614.4 634.3
674.3 675.4 701.4 726.4 822.4 855.5
861.4 879.4 921.5 953.4 974.5 988.5
1000.6 1196.6 1217.6 1228.5 1232.6 1233.7
1249.6 1249.6 1344.7 1455.8 1484.6 1514.8
1582.9 1583.9 1616.8 1726.7 1759.9 1775.9
1790.6 1853.9 1869.9 2286.2 2302.2 2317.2
2419.2 2526.4 2542.4 3329.6 4211.4
Peptide masses in Da:
http://us.expasy.org/tools/peptide-mass.html
http://academic.uofs.edu/organization/IMBM/PMF_talk.ppt
501.3 533.3 544.3 545.3 614.4 634.3
674.3 675.4 701.4 726.4 822.4 855.5
861.4 879.4 921.5 953.4 974.5 988.5999.71000.6 1196.6 1217.6 1228.5 1232.6 1233.71245.41249.6 1249.6 1344.7 1455.8 1484.6 1514.8
1582.9 1583.9 1616.8 1726.7 1759.9 1775.91786.21790.6 1853.9 1869.9 2286.2 2302.2 2317.2
2419.2 2526.4 2542.4 3329.6 4211.4
Fragfit : une approche simple
Fragfit (PNAS, 1993, 90:5011-5015
1. Requiert une liste de peptides (et leur masse) et une base de données de séquences protéiques
2. Calcule, pour chaque protéine, la liste théorique3. Calcule, pour chaque protéine, le nombre de
peptides qui “matchent” (en fonction d’un seuil défini a priori)
4. Donne la liste des protéines par ordre décroissant de nombre de matches
QuickTime™ et undécompresseur TIFF (LZW)
sont requis pour visionner cette image.
QuickTime™ et undécompresseur TIFF (LZW)
sont requis pour visionner cette image.
Seulement une protéine avec 5 matches parmi > 100 000 protéines
Journal of the American Society for Mass Spectrometry (2003) 14:931-942
• Quel seuil choisir ?• Favorise les grosses
protéines (e.g. titine, 3 Mda)
Remplacer le nombre de fragments trouvés par la fréquence des fragments
trouvés
http://www.bioinformatics.ca/workshop_pages/proteomics/lectures/DAY2/2.4.pdf
http://www.bioinformatics.ca/workshop_pages/proteomics/lectures/DAY2/2.4.pdf
http://www.bioinformatics.ca/workshop_pages/proteomics/lectures/DAY2/2.4.pdf
http://www.bioinformatics.ca/workshop_pages/proteomics/lectures/DAY2/2.4.pdf
http://www.bioinformatics.ca/workshop_pages/proteomics/lectures/DAY2/2.4.pdf
http://www.bioinformatics.ca/workshop_pages/proteomics/lectures/DAY2/2.4.pdf
http://www.bioinformatics.ca/workshop_pages/proteomics/lectures/DAY2/2.4.pdf
http://www.bioinformatics.ca/workshop_pages/proteomics/lectures/DAY2/2.4.pdf
http://www.bioinformatics.ca/workshop_pages/proteomics/lectures/DAY2/2.4.pdf
http://www.bioinformatics.ca/workshop_pages/proteomics/lectures/DAY2/2.4.pdf
MASCOT, une approche probabiliste
Perkins et al. (1999) Electrophoresis 20:3551-3567
Définir un modèle et calculer la probabilité qu’un spectre correspond à une protéine
particulière• Distribution a priori de la taille des peptides en fonction
de la taille de la protéine• Probabilité de non coupure par la protéase• Probabilité de modifications post-traductionelles ou
chimiques (en particulier des extrémités N et C terminales)
• Précision de la mesure de la masse (intervalle)
MASCOT, une approche probabiliste
Avantages :• Fournit naturellement une e-value• Corrige naturellement pour la taille des protéines
Inconvénients :• Temps calcul• Limitations du modèle
http://assoxenope.free.fr/cours/proteomique.pdf
Génome versus Transcriptome et Protéome
http://www.ac-grenoble.fr/xmallet/IMG/gene_proteine.jpg
http://www.defl.ca/~debloisj_dev/cellules/images/Cell_fundp.ac.be/cellule.jpg
Quelles améliorations ?
• Fournir des informations supplémentaires (taille de la protéine, pI, etc.)
• Utiliser une banque de spectres pré-établis plutôt qu’une banque de séquences (suppose que le spectre est assez reproductible)
• Développer des statistiques permettant de garder le taux de faux positifs en dessous de e.g. 5%
• Filtrer les spectres de masse a priori pour éliminer les contaminants
• Utiliser des distributions plutôt que des intervalles pour prendre en compte l’erreur de mesure
• Identifier des mélanges de protéines (cadre Bayésien)• Approche consensus• Séquençage (étiquette - 3 a.a. - ou ensemble du
fragment)
top related