développement de méthodes d'analyse de l'adn par clivage d'une

346
eveloppement de m´ ethodes d’analyse de l’ADN par clivage d’une chim` ere ARN/ADN et par spectrom´ etrie de masse MALDI-TOF Florence Mauger To cite this version: Florence Mauger. D´ eveloppement de m´ ethodes d’analyse de l’ADN par clivage d’une chim` ere ARN/ADN et par spectrom´ etrie de masse MALDI-TOF. G´ en´ etique. Universit´ e Pierre et Marie Curie - Paris VI, 2012. Fran¸ cais. <NNT : 2012PAO66252>. <tel-00833267> HAL Id: tel-00833267 https://tel.archives-ouvertes.fr/tel-00833267 Submitted on 12 Jun 2013 HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destin´ ee au d´ epˆ ot et ` a la diffusion de documents scientifiques de niveau recherche, publi´ es ou non, ´ emanant des ´ etablissements d’enseignement et de recherche fran¸cais ou ´ etrangers, des laboratoires publics ou priv´ es.

Upload: letuyen

Post on 05-Jan-2017

234 views

Category:

Documents


5 download

TRANSCRIPT

  • Developpement de methodes danalyse de lADN par

    clivage dune chimere ARN/ADN et par spectrometrie

    de masse MALDI-TOF

    Florence Mauger

    To cite this version:

    Florence Mauger. Developpement de methodes danalyse de lADN par clivage dune chimereARN/ADN et par spectrometrie de masse MALDI-TOF. Genetique. Universite Pierre et MarieCurie - Paris VI, 2012. Francais. .

    HAL Id: tel-00833267

    https://tel.archives-ouvertes.fr/tel-00833267

    Submitted on 12 Jun 2013

    HAL is a multi-disciplinary open accessarchive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come fromteaching and research institutions in France orabroad, or from public or private research centers.

    Larchive ouverte pluridisciplinaire HAL, estdestinee au depot et a la diffusion de documentsscientifiques de niveau recherche, publies ou non,emanant des etablissements denseignement et derecherche francais ou etrangers, des laboratoirespublics ou prives.

    https://hal.archives-ouvertes.frhttps://tel.archives-ouvertes.fr/tel-00833267

  • THESE DE DOCTORAT DE LUNIVERSITE PIERRE ET MARIE CURIE

    Spcialit Chimie Molculaire ED406

    Prsente par

    Florence Mauger

    Pour obtenir le grade de Docteur de luniversit Pierre et Marie Curie

    Dveloppement de mthodes danalyse de lADN

    par clivage

    dune chimre ARN/ADN

    et par spectromtrie de masse MALDI-TOF

    Soutenue le 10 Juillet 2012 devant le jury compos de :

    Mme. Jeanine Tortajada Universit EVRY Val dEssonne Rapporteur

    M. Codjo Hountondji Universit Pierre et Marie Curie Rapporteur

    M. Christian Rolando Universit Lille 1 Examinateur

    M. Germain Trugnan Universit Pierre et Marie Curie Examinateur

    M. Jean-Claude Tabet Universit Pierre et Marie Curie Directeur de thse

    M. Ivo Gut CNAG Barcelona co-Directeur de thse

  • Remerciements

    2

    Remerciements

    Ce projet de thse prsent dans ce mmoire a t ralis au Laboratoire de Dveloppement et

    de Production au sein du CEA/DSV/Institut de Gnomique/Centre National de Gnotypage. Il

    a t effectu sous la direction du Professeur Jean-Claude Tabet, Professeur mrite de

    lUniversit Pierre et Marie Curie et du Docteur Ivo Gut, Directeur du Centro Nacional de

    Analisis Genomico Barcelona et responsable du projet READNA.

    Je tiens remercier le Docteur Mark Lathrop, ancien Directeur du CNG, et les membres de la

    commission de formation du CEA pour mavoir permis deffectuer cette thse dans le cadre

    dune formation professionnelle. Je tiens plus particulirement remercier le Professeur Jean-

    Claude Tabet et le Docteur Ivo Gut davoir accept dtre mes directeurs de thse, pour le

    temps quils ont consacr mes recherches et pour leurs disponibilits.

    Je remercie vivement la Professeur Jeanine Tortajada et le Professeur Codjo Hountondji

    davoir accept dtre rapporteurs ainsi que le Directeur de recherche Christian Rolando et le

    Professeur Germain Trugnan davoir bien voulu tre examinateurs du jury de cette thse.

    Je tiens galement remercier le Docteur David Gelfang, le Docteur Keith Bauer et le

    Docteur Thomas Myers, de la socit ROCHE MOLECULAR pour leur collaboration

    essentielle concernant le dveloppement des ADN polymrases.

    Je remercie galement Jrmy Semhoun pour llaboration du logiciel de calcul des masses,

    Caroline Horgues, Steven Mcginn, Jorg Tost et Alexandre How Kit pour leur collaboration

    sur le projet de lanalyse de la mthylation de lADN et Ekatherina Darii pour son aide pour

    les expriences par ESI-ITMSn. Je tiens galement remercier, Cline Besse, Christian

    Daviaud, Cline Lacrouts davoir eu la gentillesse et la patience de corriger mon mmoire.

    Enfin, je remercie la Communaut europenne pour le financement de cette tude au sein du

    projet READNA 2008-2012.

  • Sommaire

    3

    Sommaire

    Remerciements 2

    Sommaire 3

    Abrviation 11

    Introduction gnrale 12

    1. Les modifications de lADN 13

    1.1. LADN 13

    1.2. Les modifications de lADN 15

    1.2.1. Les modifications de la squence 15

    1.2.2. Les modifications pigntiques 16

    2. Les mthodes danalyse de lADN 17

    2.1. Le squenage de premire gnration 18

    2.1.1. Le squenage de Sanger 18

    2.1.2. Le squenage de Maxam et Gilbert 20

    2.2. Le squenage de seconde gnration 20

    2.2.1. Le squenage sur phase solide 20

    2.2.2. Le squenage par hybridation sur puce 21

    2.2.3. Le squenage cyclique sur puce 22

    2.2.4. Le squenage par microlectrophorse 23

    2.2.5. Le squenage par nanopore 23

    2.3. Le squenage de nouvelle gnration NGS 24

    3. Les mthodes danalyse de lADN par spectromtrie de masse 25

    3.1. La spectromtrie de masse ESI-IT et MALDI-TOF 25

    3.1.1. La spectromtrie de masse ESI-IT 25

    3.1.2. La spectromtrie de masse MALDI-TOF 31

    3.2. Les mthodes danalyse de lADN 42

    3.2.1. Les mthodes directes 43

    3.2.2. Les mthodes indirectes 45

  • Sommaire

    4

    4. Dveloppement de mthodes danalyse de lADN par clivage dune chimre

    ARN/ADN et par spectromtrie de masse MALDI-TOF 47

    4.1. Le principe 47

    4.1.1. La chimre ARN/ADN 48

    4.1.2. Le clivage de la chimre ARN/ADN 49

    4.1.3. Lanalyse par MALDI-TOF MS 50

    4.2. Les mthodes 51

    4.2.1. Les mthodes actuelles 51

    4.2.2. Le dveloppement de nouvelles mthodes 53

    Chapitre 1. Analyse de la chimre ARN/ADN par spectromtrie de masse en tandem 55

    1. Introduction 56

    2. Matriels et Mthodes 58

    2.1. Matriels 58

    2.2. Mthodes 60

    2.2.1. Le clivage 60

    2.2.2. Le dessalage 60

    2.2.3. Lanalyse par spectromtrie de masse MALDI-TOF/TOF 60

    2.2.4. Lanalyse spectromtrie de masse ESI-IT 61

    2.2.5. Les ions fragments 61

    3. Rsultats 62

    3.1. La chimre ARN/ADN 62

    3.1.1. La formation de la chimre ARN/ADN 62

    3.1.2. La nomenclature des ions fragments 62

    3.1.3. Le seuil de dtection des chimres ARN/ADN par MALDI-TOF/TOF 63

    3.2. Lanalyse des chimres ARN/ADN de 4-mer par MALDI-TOF/TOF 65

    3.2.1. Les fragmentations en mode CID des chimres avec une base B4(A) 65

    3.2.2. Les fragmentations en mode CID des chimres avec une base B4(C) 69

    3.2.3. Les fragmentations en mode CID des chimres avec une base B4(G) 72

    3.2.4. Les fragmentations en mode CID des chimres avec une base B4(U) 74

    3.2.5. Le bilan des fragmentations en mode CID 76

  • Sommaire

    5

    3.3. Les fragmentations en phase gazeuse de la chimre GCTA 79

    3.3.1. Limpact de la fluence du laser 79

    3.3.2. Les fragmentations en mode CID par MALDI-TOF/TOF 83

    3.3.3. Les fragmentations en mode CID par ESI-ITMSn 84

    3.3.4. Le bilan des fragmentations en mode CID 95

    3.4. Les fragmentations en mode CID des chimres ARN/ADN suprieures 4-mer par

    MALDI-TOF/TOF 97

    3.4.1. Les fragmentations en mode CID des chimres ARN/ADN de 5-mer 97

    3.4.2. Les fragmentations en mode CID des chimres ARN/ADN de 7-mer 102

    3.4.3. Les fragmentations en mode CID des chimres ARN/ADN de 10-mer 104

    4. Discussion 106

    4.1. Les conditions exprimentales 106

    4.1.1. La prparation de la chimre ARN/ADN 106

    4.1.2. Lanalyse par MALDI-TOF/TOF 107

    4.2. Les fragmentations par MALDI-TOF-TOF de la chimre ARN/ADN 109

    4.2.1. La dtection des ions 109

    4.2.2. Les fragmentations en mode CID 110

    4.2.3. Le squenage 114

    4.3. Les fragmentations en mode CID de la chimre GCTA 114

    4.3.1. Lanalyse par ESI-ITMSn 115

    4.3.2. Les ions multichargs 115

    4.3.3. Les fragmentations par spectromtrie de masse en tandem 116

    5. Conclusion 117

    Chapitre 2. Multiplex microhaplotypage par clivage dune chimre ARN/ADN simple-

    brin et par MALDI-TOF MS 120

    1. Introduction 121

    2. Matriels et Mthodes 123

    2.1. Matriels 123

    2.2. Mthodes 125

    2.2.1. PCR 125

  • Sommaire

    6

    2.2.2. Llongation linaire par lADN polymrase G46E CS6R 126

    2.2.3. Le clivage 126

    2.2.4. Le dessalage 126

    2.2.5. Lanalyse par spectromtrie de masse MALDI-TOF 127

    3. Rsultats 127

    3.1. La PCR 128

    3.2. La chimre ARN/ADN simple-brin 129

    3.3. Le clivage de la chimre ARN/ADN 130

    3.4. Le dessalage des fragments de clivage 130

    3.5. Lanalyse des spectres de masse MALDI-TOF 130

    3.5.1. La matrice HCCA 131

    3.5.2. Les paramtres danalyse 131

    3.5.3. Les microhaplotypes 131

    3.5.4. Le microhaplotype ASTW du locus HLA-DRB1-227 132

    3.5.5. Les microhaplotypes HCACH du locus HLA-A-98 et MGAR du locus HLA-A-453 134

    3.6. Lanalyse des individus 135

    4. Discussion 137

    4.1. La PCR 137

    4.2. La chimre ARN/ADN simple-brin 138

    4.2.1. LADN polymrase G46E CS6R 138

    4.2.2. Les amorces 138

    4.3. Lanalyse des microhaplotypes 139

    4.3.1. Le clivage 139

    4.3.2. Le dessalage 139

    4.3.2. Lanalyse par MALDI-TOF MS 140

    4.3.3. Les caractristiques de la mthode 140

    5. Conclusion 141

    Chapitre 3. Analyse de la mthylation de lADN par clivage dune chimre ARN/ADN

    simple-brin et par MALDI-TOF MS 143

    1. Introduction 144

  • Sommaire

    7

    2. Matriels et Mthodes 146

    2.1. Matriels 146

    2.2. Mthodes 148

    2.2.1. La conversion au bisulfite 148

    2.2.2. Les mlanges dADN 149

    2.2.3. La PCR 149

    2.2.4. La purification de la PCR 150

    2.2.5. Llongation linaire par lADN polymrase KB17 150

    2.2.6. Le clivage 151

    2.2.7. Le dessalage 151

    2.2.8. Lanalyse par spectromtrie de masse MALDI-TOF 151

    3. Rsultats 153

    3.1. Le principe de la mthode 153

    3.1.1. La conversion au bisulfite 154

    3.1.2. La PCR 154

    3.1.3. Llongation linaire par lADN polymrase KB17 155

    3.1.4. Les fragments de clivage des CpGs 157

    3.1.5. Lanalyse par spectromtrie de masse MALDI-TOF 162

    3.1.6. Lanalyse de la mthylation de lADN 162

    3.2. Lanalyse du locus CDKN2A-msp1 163

    3.2.1. Les fragments de clivage du locus 163

    3.2.2. Llongation linaire ATP 166

    3.2.3. Llongation linaire GTP 168

    3.3. La quantification de la mthylation de lADN 169

    3.3.1. La courbe dtalonnage du locus CDKN2A-msp1 170

    3.3.2. La courbe dtalonnage du locus CDKN2A-msp3b 171

    3.4. Lanalyse des individus 175

    3.4.1. Les loci des gnes CDKN2A et RASSF1A 175

    3.4.2. Lanalyse des loci des gnes CDKN2A et RASSF1A 175

  • Sommaire

    8

    3.4.3. Le pourcentage de mthylation de lADN des loci CDKN2A-msp1et msp3b 176

    4. Discussion 178

    4.1. La conversion au bisulfite 179

    4.2. La PCR 179

    4.2.1. Les amorces 179

    4.2.2. Le biais de PCR 179

    4.3. Lanalyse de la mthylation de lADN 181

    4.3.1. Le re-squenage 181

    4.3.2. Lanalyse des CpGs 182

    4.3.3. La quantification de la mthylation de lADN 183

    4.4. Lanalyse des individus 186

    4.5. Lavantage de cette mthode 186

    5. Conclusion 187

    Chapitre 4. Re-squenage de lADN par clivage dune ribo-PCR et par MALDI-TOF

    MS 189

    1. Introduction 190

    2. Matriels et Mthodes 192

    2.1. Matriels 192

    2.2. Mthodes 193

    2.2.1. La ribo-PCR par lADN polymrase KB17 193

    2.2.2. Le clivage 195

    2.2.3. Le dessalage 195

    2.2.4. Lanalyse par spectromtrie de masse MALDI-TOF 195

    3. Rsultats 196

    3.1. La ribo-PCR par lADN polymrase KB17 197

    3.2. Les fragments de clivage 197

    3.3. Lanalyse des spectres de masse MALDI-TOF 201

    3.3.1. Lanalyse du locus NOS1 201

    3.3.2. Lanalyse du locus H19 204

    3.3.3. Lanalyse du duplex des loci NOS1 et H19 207

  • Sommaire

    9

    3.3.4. Lanalyse du locus SLCO1B1 208

    3.4. Lanalyse des individus 210

    4. Discussion 213

    4.1. LADN polymrase KB17 213

    4.1.1. Les proprits 213

    4.1.2. La squence spcifique damplification 213

    4.1.2. Le multiplexage des ribo-PCRs 214

    4.2. Lanalyse par MALDI-TOF MS 215

    4.2.1. Le mode linaire 215

    4.2.2. Ltalonnage 215

    4.2.3. Lanalyse du double-brin 216

    4.2.4. La dtection des fragments de clivage 216

    4.3. Les avantages de la mthode 217

    5. Conclusion 218

    Chapitre 5. Multiplex allle-spcifique gnotypage par clivage dune riboPAP-PCR et

    par MALDI-TOF MS 220

    1. Introduction 221

    2. Matriels et Mthodes 223

    2.1. Matriels 223

    2.2. Mthodes 225

    2.2.1. La riboPAP-PCR par lADN polymrase FP-1 225

    2.2.2. Le clivage 226

    2.2.3. Le dessalage 226

    2.2.4. Lanalyse par spectromtrie de masse MALDI-TOF 226

    3. Rsultats 227

    3.1. Le principe de la mthode 227

    3.2. La riboPAP-PCR par lADN polymrase FP-1 229

    3.3. Les fragments de clivage 230

    3.4. Lanalyse des spectres de masse MALDI-TOF 232

    3.4.1. Lanalyse du locus NOS1 232

  • Sommaire

    10

    3.4.2. Lanalyse du locus H19 234

    3.4.3. Lanalyse du duplex des loci SLCO1B1 235

    3.4.4. Les flags du duplex des loci SLCO1B1 236

    3.5. Lanalyse des individus 243

    4. Discussion 244

    4.1. La raction PAP 245

    4.2. Les amorces 245

    4.3. LADN polymrase FP-1 246

    4.4. Les tags et les flags 247

    4.5. Lavantage de la mthode 248

    5. Conclusion 248

    Conclusion gnrale et perspectives 250

    Annexes 259

    Annexe 1. SNP genotyping using alkali cleavage of RNA/DNA chimeras and MALDI-TOF

    MS 260

    Annexe 2. DNA sequencing by MALDI-TOF MS using alkali cleavage of RNA/DNA

    chimeras 271

    Annexe 3. Ribo-PCR. A facile method for the preparation of chimeric RNA/DNA applied to

    DNA sequencing 283

    Annexe 4. Ribonucleotide tag nucleic acid detection 297

    Annexe 5. High specificity single tube multiplex genotyping using ribo-PAP PCR, tag

    primers, alkali cleavage of RNA/DNA chimeras and MALDI-TOF MS 319

    Rfrences bibliographiques 331

  • Abrviations

    11

    Abrviations

    A : Adnine

    ADN : Acide dsoxyribonuclique

    ATP: Adnosine5triphosphate

    ARN : Acide ribonuclique

    C : Cytosine

    CMe

    : 5-mthylecytosine

    CDKN2A :cyclin-dependent kinase inhibitor 2A

    CpG : dinuclotide cytosine guanine

    CEPH : Centre dEtude du polymorphisme Humain

    - Fondation Jean DAUSET

    CID : Collision-induced dissociation

    CMH : Complexe dhistocompatibilit chez

    lhumain

    CTP : Cytidine 5triphosphate

    Da : Dalton unit de masse molculaire des

    biologistes

    dATP : dsoxyadnosine 5triphosphate

    dCTP : dsoxycytidine 5triphosphate

    dGTP : dsoxyguanosine 5triphosphate

    dNTP : dsoxynucloside 5 triphosphate

    dTTP : dsoxythymidine 5triphosphate

    ESI : dsorption/ionisation par lectronbulisation

    Flag : brin dADN complmentaire de la Tag

    G : Guanine

    GTP : Guanosine 5triphosphate

    H : Adnine ou Cytosine ou Thymine

    H19 :gne situ sur le chromome 11

    HCCA : acide -cyano 4-hydroxycinnamique

    HLA : Antigne des leucocytes humains

    HPA : acide 3-hydroxypicolinique

    IT : Trappe ionique

    kV : kilovolt

    M : Adnine ou Cytosine

    MALDI : Matrix-assisted laser

    desorption/ionization

    MS : Spectromtrie de masse

    MS/MS : Spectromtrie de masse en tandem

    NTP : ribonucloside 5triphospahte

    NOS1 :oxyde nitrique acide neuronale

    PAP : Polymrisation active par

    pyrophosphorolyse

    Pb : paire de bases

    PCR : Raction de polymrisation en chane

    R : Adnine ou Guanine

    RASSF1A :Rass association domain-containing

    protein 1

    riboPAP-PCR : PCR active par

    pyrophosphorolyse de chimre ARN/ADN

    ribo-PCR : PCR de chimre ARN/ADN

    S : Cytosine ou Guanine

    SCLO1B1: Solute carrier organic anion transporter

    family member 1B1

    SNP : Single nucleotide polymorphisms

    T : Thymine

    Tag: squence rptitive

    THAP : Trihydroxyactophnone

    TOF : Time of Flight : temps de vol

    Tris : tris(hydroxymethyl)aminomethane

    U : Uracile

    UMe

    : 5-mthyluracile

    UNG : Uracile-N-glycosylase

    UTP : Uridine 5triphosphate

    W : Adnine ou Thymine

    Y : Thymine ou Cytosine

  • Introduction gnrale

    12

    Introduction gnrale

  • Introduction gnrale

    13

    Introduction gnrale

    En 1990, le projet du gnome humain a eu pour but le squenage du gnome entier. Il sest

    achev en 2004 grce un consortium public international (Lander et al. 2001) et une

    compagnie prive Celera Genomics (Venter et al. 2001). Il a permis ltude de linformation

    gntique porte par lensemble du gnome humain qui contient environ 20 000 gnes.

    Depuis, les projets de recherche se focalisent sur lanalyse des modifications de la squence

    de lADN, notamment ltude des polymorphismes ou de la mthylation de lADN. Les

    mthodes de squenage actuellement dveloppes visent au re-squenage de lADN afin

    dtudier les polymorphismes pouvant servir de marqueurs pour didentification de maladies

    hrditaires. Le dveloppement de nouvelles mthodes efficaces, rapides, rentables, est donc

    une ncessit pour lavance de la biologie molculaire.

    Les travaux raliss au cours de ce projet de thse ont pour but la mise au point de mthodes

    danalyse de lADN par clivage dune chimre ARN/ADN et par spectromtrie de masse

    MALDI-TOF. Ce projet rentre dans le cadre du projet europen, READNA (REvolutionary

    Approaches and Devices for Nucleic Acid analysis), 2008-2012, visant dvelopper de

    nouvelles mthodes danalyse de lADN.

    Tout dabord, les modifications de lADN seront exposes. Puis, les principales mthodes

    danalyses de lADN et celles par spectromtrie de masse MALDI-TOF seront dcrites.

    Enfin, le principe de ce travail, qui est le dveloppement de mthodes danalyse des

    modifications de lADN par clivage chimique dune chimre ARN/ADN et par spectromtrie

    de masse MALDI-TOF sera dtaill.

    1. Les modifications de lADN

    1.1. LADN

    LADN est une macromolcule qui est compose de nuclotides. Sa structure a t dcouverte

    en 1953 par Watson et Crick (Watson et Crick. 1953). LADN gnomique humain est

    constitu de 23 paires de chromosomes et contient 3,3 milliards de nuclotides.

  • Introduction gnrale

    14

    Les nuclotides sont composs dun groupement phosphate (ou acide phosphorique), dun

    aldopentose (2-doxy-D-ribose pour lADN et D-ribose pour lARN) et dune base

    htrocyclique azote (purine ou pyrimidine).

    La molcule dADN est constitue de quatre bases. La cytosine (C), la thymine (T) (pour

    lADN et luracile (U) pour lARN) drivent de la pyrimidine tandis que ladnine (A) et la

    guanine (G) drivent de la purine (figure 1).

    Figure 1 : Les diffrentes bases de lADN: ladnine, la guanine, la thymine (luracile pour lARN) et

    la 5-mthylcytosine et la 5-hydroxymthylcytosine qui drivent de la cytosine.

    De plus, chez les mammifres, la cytosine adjacente base guanine formant ainsi un

    dinuclotide CpG, peut tre mthyle. La 5-mthylcytosine est considre comme tant la

    cinquime base mais sa frquence dans le gnome humain nest que denviron 1%. Enfin, la

    5-hydroxymthylcytosine a t rcemment dcouverte dans les neurones et les cellules

  • Introduction gnrale

    15

    souches embryonnaires de mammifres et elle est synthtise partir de la 5-mthylcytosine

    par une raction doxydation catalyse par la protine TET (Kriaucionis et Heintz. 2009;

    Tahiliani et al. 2009).

    Les bases sont relies par la liaison entre la liaison N osidique entre le 9-N des purines ou 1-

    N des pyrimidines et le 1- du sucre. Une liaison ester relie le groupement phosphate au sucre

    en position 3. Les nuclotides sont lis entre eux par lintermdiaire du groupement

    phosphate en position 5 du nucloside adjacent.

    LADN est compos dun double-brin formant une hlice. Ces deux brins, orients dans le

    sens 5 vers 3, sont relis entre eux par des liaisons hydrognes entre les bases purines dun

    brin et les bases pyrimidines de lautre brin. Les bases sont complmentaires deux deux,

    deux liaisons hydrognes relient ladnine et la thymine tandis que trois liaisons hydrognes

    relient la cytosine et la guanine. Les deux brins sont complmentaires et antiparallles.

    1.2. Les modifications de lADN

    La nature, lordre de la squence des bases A, C, G, T constitue un code gntique qui

    dtermine le caractre phnotypique de chaque individu. Il existe deux catgories de

    modifications de lADN : des modifications de la squence et les modifications pigntiques.

    1.2.1. Les modifications de la squence

    Tout dabord, un SNP (Single Nucleotide Polymorphism) est une modification dun

    nuclotide une position donne du gnome, comprenant en gnrale deux allles. Il

    reprsente la forme la plus abondante de variations gntiques : sa frquence est suprieure

    1 % dans la population et il est prsent environ toutes les 1000 pb dans le gnome humain. Il

    est considr comme un marqueur idal pour tudier la diversit des populations, les maladies

    et le traitement adquat administrer au patient.

    Un microsatellite est une squence rptitive de 2 10 nuclotides. Un motif donn peut tre

    prsent des milliers dexemplaire dans le gnome. Il est prsent dans tout le gnome et le

    plus frquemment au niveau des introns et des exons du gne. La localisation des squences

    tant bien conserve, le nombre de rptition constitue un marqueur gntique.

  • Introduction gnrale

    16

    Il peut y avoir galement une dltion ou insertion dun ou plusieurs nuclotides.

    Enfin, les mutations dune ou plusieurs bases sont gnralement spontanes mais des facteurs

    mutagnes, comme la radioactivit, lenvironnement et certains produits chimiques peuvent

    les provoquer. Leurs frquences sont infrieures 1 % dans le gnome.

    1.2.2. Les modifications pigntiques

    1.2.2.1. La mthylation de lADN

    LADN peut tre galement modifi autour de sa squence, cest une modification

    pigntique. Ces modifications interviennent sur la structure de lADN et nimpliquent

    aucun changement de la squence primaire. Ces mutations pigntiques sont plus frquentes

    que les mutations classiques de lADN.

    Dans le gnome humain, lADN est mthyl sous la forme de la 5-mthycytosine dun

    dinuclotide CpG. Cette modification post-rplicative, est un transfert, par lADN

    mthyltransfrase (DNMT), du mthyle de la S-adnosyl-L-mthionine (SAM) alors convertie

    en S-adnosylhomocystine (SAH) sur une cytosine dun dinuclotide CpG (Smith et al. 1992;

    Svedruzi 2008).

    1.2.2.2. Les lots CpGs

    De 60 90% des dinuclotides CpGs sont mthyls et sont localiss dans les rgions de

    chromatines condenses. Ils sont par consquent inaccessibles au processus de transcription.

    Cependant, des regroupements de dinuclotide CpGs denvirons 1 4 kb, sont appels lots

    CpG et constituent des marqueurs pigntiques.

    Les lots CpGs ont une teneur en dinuclotide CpGs de plus de 50%, une longueur suprieure

    200 pb et un ratio suprieur 0,6 du nombre observ de dinuclotides CpG par rapport au

    nombre de bases C et G prsentes dans le segment (Gardiner-Garden et Frommer. 1987). Ils

    sont concentrs en majorit dans les rgions promotrices et celles du premier exon de la

    plupart des gnes. Environ 30 000 lots CpG, se rpartissent en moyenne tous les 100 kb

    recouvrant ainsi environ 1 2 % du gnome (Antequera et Bird. 1993). 75 % des sites de

  • Introduction gnrale

    17

    transcription et 88 % des promoteurs actifs sont associs des lots CpGs et pourraient tre

    rguls par la mthylation de lADN.

    Les rgions diffrentiellements mthyles (DMR) vont essentiellement agir sur la rgulation

    de lexpression du gne. Elles peuvent se produire spontanment ou en rponse

    lenvironnement et conduisent des changements des tats dactivation ou dinhibition des

    gnes. Leurs tudes suscites depuis plusieurs annes un grand intrt car elles permettent

    notamment ltude de maladies comme les syndromes lis la perte dempreinte parentale et

    certains cancers dtiologie non identifis (Robertson 2005).

    1.2.2.3. Les marqueurs pigntiques potentiels

    Par ailleurs, les rgions situes proximit (environ 2 kb) des lots CpGs qui contiennent une

    plus faible densit sont appels lots CpG Shore. Ils seraient en relation dans certains cancers

    avec les DMR (Irizarry et al. 2009). Ces rgions prsentent une forte corrlation inverse entre

    la mthylation et l'tat de l'expression des gnes. Les DMR associs ces lots CpGs Shore

    peuvent distinguer diffrents types de cancers (Hansen et al. 2011).

    Ltude des marqueurs pigntiques pourrait donc tre tendue ltude du mthylome

    entier, plutt de se concentrer que sur ltude seule des lots CpGs. Le mthylome contient des

    rgions de moins en moins denses dlots CpGs : les lots CpGs Shore (adjacents aux lots

    CpGs), les lots CpGs Shelf (adjacents aux lots CpGs shore) et les lots Open-sea ou Ocean

    (isols dans le gnome).

    Enfin, des tudes rcentes suggrent que la 5-hydroxymthylcytosine pourrait tre galement

    un marqueur pigntique (Ruzov et al. 2011) et avoir un rle biochimique en tant

    qu'intermdiaire dans le procd de dmthylation de l'ADN (He et al. 2011; Maiti et Drohat

    2011).

    2. Les mthodes danalyse de lADN

    Diffrentes mthodes de squenage de l'ADN ont t dveloppes : le squenage de

    premire gnration : par la mthode de Sanger et par la mthode de Maxam et Gilbert ; le

    squenage de deuxime gnration : sur phase solide, par hybridation, par spectromtrie de

  • Introduction gnrale

    18

    masse (partie 3.2), cyclique sur puce, par microlectrophorse et par nanopore et le

    squenage de nouvelle gnration NGS (Next Generation Sequencing) est galement en

    cours de dveloppement car ce domaine est en pleine mutation (Shendure et al. 2011).

    Par ailleurs, il est difficile d'affirmer avec certitude quelle sera la mthode la plus adapte

    pour une problmatique donne. Toutefois, certains paramtres sont importants pour le choix

    de la mthode adquate, comme le cot, l'exactitude des donnes, la fiabilit de la mthode, la

    capacit haut-dbit et la longueur des squences. Le dveloppement de protocoles robustes,

    simples pour la construction de bibliothque et la cration d'outils bio-informatiques pour

    l'interprtation des quantits massives de donnes sont des dfis majeurs pour lessor de

    nouvelles mthodes danalyse de lADN.

    2.1. Le squenage de premire gnration

    Dans les annes 1970, les deux premires mthodes de squenage de lADN ont t

    dveloppes indpendamment. Lapproche de Sanger est une synthse enzymatique tandis

    que celle de Maxam et Gilbert est une dgradation chimique. Frederik Sanger et Walter

    Gilbert ont obtenus le prix Nobel de chimie en 1980 pour cette dcouverte.

    2.1.1. Le squenage de Sanger

    Le squenage par didsoxy de Sanger ou squenage enzymatique (Sanger et al. 1977;

    Sanger et al. 1977; Sanger 1988) implique une ADN polymrase , ADN dpendant,

    synthtisante une copie complmentaire du simple-brin d'ADN partir de lextrmit 3 de

    lamorce. Le principe de la mthode est illustr dans la figure 2.

    http://fr.wikipedia.org/wiki/Prix_Nobel_de_chimie

  • Introduction gnrale

    19

    Figure 2 : Schma de principe du squenage didsoxy de Sanger, reproduit et modifi dApplied

    Biosystems ladresse internet suivant : (http: // www3.appliedbiosystems.com/ cms/ groups/

    mcb_support/ documents/ generaldocuments/ cms_041003.pdf).

    Lors de llongation linaire, le dsoxynuclotide ajout est complmentaire du nuclotide du

    brin d'ADN. La cration d'un pont phosphodiester entre le groupement 3-OH de l'extrmit

    de l'amorce et le groupement 5-phosphate du dsoxynuclotide incorpor allonge la chane.

    Les quatre dsoxyribonuclotides (dATP, dCTP, dGTP et dTTP) sont ajouts, ainsi quune

    faible concentration de l'un des quatre didsoxyribonuclotides (ddATP, ddCTP, ddGTP ou

    ddTTP). Les didsoxyribonuclotides incorpors dans le brin synthtis empchent la

    poursuite de llongation. La faible concentration du didsoxynuclotide par rapport au

    dsoxynuclotide entrane statistiquement un mlange de fragments dADN de tailles

    diffrentes se terminant tous par un didsoxynuclotide. Cette terminaison permet didentifier

    la position de la base du nuclotide dans la squence dADN. Plusieurs longations sont

    ralises en parallle avec les quatre didsoxynuclotides diffrents.

    Ces fragments sont ensuite spars par lectrophorse sur gel de polyacrylamide ou sur

    squenceur capillaire. La dtection des fragments est ralise par lintermdiaire dun

    marqueur radioactif ou fluorescent. Le marqueur radioactif (isotopes 32

    P, 33

    P ou 35

    S) est port

    http://www3.appliedbiosystems.com/cms/groups/mcb_support/documents/generaldocuments/cms_041003.pdfhttp://www3.appliedbiosystems.com/cms/groups/mcb_support/documents/generaldocuments/cms_041003.pdfhttp://fr.wikipedia.org/wiki/DNTPhttp://fr.wikipedia.org/wiki/Did%C3%A9soxyribonucl%C3%A9otidehttp://fr.wikipedia.org/wiki/Did%C3%A9soxyribonucl%C3%A9otidehttp://fr.wikipedia.org/wiki/%C3%89lectrophor%C3%A8se_sur_un_gel_de_polyacrylamide

  • Introduction gnrale

    20

    par le dsoxynuclotide ou le didsoxynuclotide (Tabor et al. 1987). Le marqueur

    fluorescent est fix soit sur lamorce soit sur les didsoxynuclotides.

    Le squenage enzymatique a t le plus rpandu pendant de nombreuses annes et a permis

    le squenage du projet du gnome humain.

    2.1.2. Le squenage de Maxam et Gilbert

    La mthode de Maxam et Gilbert est une mthode de dgradation chimique de lADN.

    Chaque base A, C, G et T possdent des ractivits diffrentes et peuvent donc tre modifies

    afin dtre clives slectivement (Maxam et Gilbert 1977). La squence du brin dADN est

    dtermine laide de lassemblage de lordre de coupure des bases des fragments de clivage.

    Cette mthode est constitue de 6 tapes. Un marquage radioactif par le 32

    P est ralis sur les

    extrmits des deux brins d'ADN. Le fragment dADN tudier est alors slectionn et les

    deux brins dADN sont ensuite spars. Les bases dADN sont modifies spcifiquement et

    paralllement : les bases G sont alkyles, les bases A et G sont dpurines et les bases C et T

    sont hydrolyses. La pipridine permet alors de cliver le brin dADN aprs chaque base

    modifie. Lanalyse des fragments de clivage est similaire celle de la mthode de Sanger.

    Les fragments dADN sont spars par lectrophorse capillaire afin de reconstituer la

    squence dADN.

    Les inconvnients de cette mthode sont lanalyse de fragments d'ADN de moins de 250 pb et

    lutilisation de ractifs chimiques toxiques.

    2.2. Le squenage de seconde gnration

    2.2.1. Le squenage sur phase solide

    Linnovation de cette mthode est de gnrer des simple-brins dADN (Hultman et al. 1989;

    Jones et al. 1991; Kaneoka et al. 1991; Zimmerman et al. 1992.) par la capture sur une phase

    solide. Un des deux brins d'ADN est biotinyl via une raction de PCR pour laquelle une des

    deux amorces est biotinyle. La molcule d'ADN hmi-biotinyl est alors fixe sur des billes

    http://fr.wikipedia.org/wiki/Did%C3%A9soxyribonucl%C3%A9otide

  • Introduction gnrale

    21

    magntiques de streptavidine, formant un complexe spcifique avec la biotine. Les brins sont

    spars par lavage des billes par une solution basique. Les brins biotinyls sont alors spars

    par lintermdiaire dun aimant. Les ractions de squenage peuvent tre effectues

    indpendamment : par le brin biotinyl, par le brin non biotinyl ou par les deux.

    Le squenage chimique sur phase solide par capture au niveau des terminaisons

    didsoxynuclotides limine les inconvnients du marquage chimique de l'amorce et des

    terminaisons, les amorces fluorescentes tant couples la phase solide par capture des

    terminaisons didsoxynuclotides (Ju. 1999). Aprs la raction de squenage, les fragments

    d'ADN biotinyls sont capturs par les billes magntiques recouvertes de streptavidine, tandis

    que les autres composants de la raction de squenage sont lavs. Seuls les brins constitus

    de la terminaison didsoxynuclotide sont librs des billes magntiques et donc squencs.

    Cette mthode permet dviter llongation possible de lautre brin complmentaire de lADN

    par lamorce et ainsi damliorer la fiabilit des rsultats.

    2.2.2. Le squenage par hybridation sur puce

    Le principe du squenage par hybridation (SBH) repose sur lutilisation de puces ADN.

    Elles sont constitues de multiples sondes, utilises pour dcoder la squence d'ADN. LADN

    est fractionn en de multiples fragments et hybrid sur la puce laide de sondes

    complmentaires. La puce dADN est ensuite analyse par la dtection des oligonuclotides

    hydrids. Lanalyse par informatique des diffrentes portions de la squence dADN permet

    ensuite de reconstituer la squence entire de lADN.

    Le principal avantage de cette approche est le re-squenage du gnome de lindividu par la

    comparaison de sa squence avec celle dune squence de rfrence. Le mme concept est

    utilis par plusieurs plates-formes de gnotypage (Affymetrix et Perlegen-Pfizer) sur puce

    mais seuls les polymorphismes prdfinis peuvent tre dtects alors quavec cette mthode

    tous les polymorphismes sont identifis.

    Labsence de recouvrements redondants de la squence pour assurer la fiabilit des analyses

    contrairement dautres mthodes de squenage constitue une limitation de cette mthode. Il

    peut en rsulter un taux lev de faux positif (3 %) (Patil et al. 2001).

  • Introduction gnrale

    22

    Cette mthode est trs prcise pour ltude de petits gnomes haplodes (Gresham et al. 2006)

    contrairement ltude des grands gnomes diplodes du fait de leur htrognit. Une

    approche en deux tapes a t dveloppe pour ltude des gnomes bactriens (Albert et al.

    2005; Herring et al. 2006) : la dcouverte de lemplacement approximatif des mutations et

    suivie de la cartographie plus prcise des mutations.

    2.2.3. Le squenage cyclique sur puce

    Les plates-formes actuelles de squenage (de 454/Roche, Illumina, Applied Biosystems / Life

    Technologies, Dover, Helicos Biosciences, et Ion Torrent-Life Technologie) ne reposent pas

    sur le squenage de Sanger mais sur le principe dun squenage cyclique sur puce (figure 3)

    ( Shendure et Ji 2008; Metzker 2009).

    Figure 3 : Schma de principe du squenage cyclique sur puce, reproduit et modifi du site internet

    ladresse suivante : http:/ /www.currentprotocols.com/protcol/mb0701.

    Il permet de faibles cots par le dcodage bidimensionnel sur puce de millions

    (potentiellement de milliards) de bases de diffrents fragments dADN. Ces fragments

    dADN, de squences individuelles, peuvent tre squencs.

    Le squenage est clonal car chaque fragment contient une seule espce d'ADN (une seule

    molcule ou plusieurs identiques) immobilise sur la puce. Les fragments peuvent tre

    disposs de faon ordonn ou alatoire. Chaque squence d'ADN comprend gnralement une

    squence inconnue d'intrt corrle avec celles des adaptateurs universels. Un point

    important de cette approche est de pouvoir utiliser un volume de ractif unique sur la puce et

    de tout raliser en parallle grce aux fragments analyss sur une mme surface.

  • Introduction gnrale

    23

    Le squenage est cyclique car chaque cycle une tape enzymatique identifie la nature et la

    position de la base de chaque squence en parallle. Lidentification seffectue par

    fluorescence dun groupement fix, ou par la mesure de la libration de proton. la fin de

    chaque cycle, les donnes sont acquises par un capteur CCD (Charged Coupled Device) ou

    par une puce semi-conducteur agissant comme un pH-mtre (Torrent Ion). Les cycles

    suivants dterminent les positions des bases. Une squence pour chaque fragment d'ADN peut

    tre dtermine par l'analyse de la srie complte des donnes couvrant sa position.

    Les diffrentes plates-formes du squenage cyclique sur puce reposent sur le mme principe

    de base mais diffrent par la mthode utilise pour gnrer les fragments d'ADN, par la

    biochimie utilise pour effectuer le squenage cyclique et par la mthode de dtection.

    2.2.4. Le squenage par microlectrophorse

    Le squenage classique de Sanger est ralis avec des volumes de ractifs de lordre du

    microlitre. Un des objectifs de la microlectrophorse est lutilisation de la miniaturisation

    dveloppe dans l'industrie des semi-conducteurs pour permettre une miniaturisation du

    squenage classique didsoxy (Paegel et al. 2003). Par exemple, une nanolectrophorse sur

    gel par canaux sur la surface d'une plaquette de silicium (Emrich et al. 2002) a t

    dveloppe.

    Lobjectif le plus important est l'intgration d'une srie dtapes de squenage lies (par

    exemple, l'amplification par PCR, la purification du produit, et le squenage) dans un lab-on-

    a-chip (Blazej et al. 2006; Forster et al. 2008.).

    Lavantage de cette approche est lapplication du squenage classique ayant prouv sa

    robustesse et son efficacit pour des squences de plus de 1000 bases. Cependant, le

    squenage par microlectrophorse peut s'avrer critique pour la poursuite de la tendance

    la rduction des cots.

    2.2.5. Le squenage par nanopore

    Une nouvelle approche de squenage, initialement propos dans les annes 1980, consiste

    dans le passage dun seul brin dADN travers un nanopore (Deamer et Akeson 2000) (figure

    4).

  • Introduction gnrale

    24

    Figure 4 : Image dun nanopore reproduite avec laccord dOxford Nanopore Technologies.

    Un nanopore est une protine membranaire : l'-hmolysine (Kasianowicz et al. 1996), la

    MspA (Mycobacterium smegmatis porin A) (Derrington et al. 2010) ou une protine

    synthtique (Fologea et al. 2005). Il est modifi chimiquement par fixation covalente dune

    cyclodextrine sur sa surface intrieure. Cette modification constitue un site de liaison pour les

    bases de l'ADN simple-brin et permet une mesure prcise de son passage travers le

    nanopore.

    Deux mthodes sont en cours de dveloppement, une mthode exonuclase (Hornblower et al.

    2007) et une mthode de polymrisation (Lieberman et al. 2010). Les quatre nuclotides

    obstruent le nanopore de manire spcifique. La variation de la conductance travers le

    nanopore peut alors tre mesure pour en dduire la squence d'ADN.

    Le squenage par nanopore prsente un grand potentiel dans le squenage rapide et rentable

    de mlanges dADN par lintermdiaire de prparations dchantillons relativement simple.

    Cependant, le dveloppement technologique de cette mthode sera ncessaire pour garantir

    l'exactitude de lanalyse de grandes squences dADN partir d'un mlange complexe

    d'ADN.

    2.3. Le squenage de nouvelle gnration NGS

  • Introduction gnrale

    25

    De nouvelles mthodes sont en cours de dveloppement. Il s'agit notamment du squenage

    par microscopie lectronique transmission (TEM) (Thomas et al. 2008.; Tanaka et Kawai

    2009) et du squenage optique (Xiao et Kwok. 2008; Zhou et al. 2008).

    Dans la mthode de squenage TEM, de longs fragments d'ADN sont disposs sur les grilles

    des puces ayant incorpors diffrents nuclotides contenant un nombre diffrents de protons.

    Le diffrentiel de charge est dtect et analys.

    Dans le squenage optique, de grands fragments d'ADN sont disposs sur des lames de verre.

    Des tapes enzymatiques permettent la cration de trou de 20 50 pb dans l'ADN ou l'ADN

    peut tre galement tendu en raison de son lasticit. Les trous peuvent tre combls par une

    ADN polymrase et des nuclotides marqus par fluorescence qui sont ensuite analyss par

    microscopie.

    3. Les mthodes danalyse de lADN par spectromtrie de masse

    Au cours de la dernire dcennie, la spectromtrie de masse s'est impose pour lanalyse du

    domaine mergeant de la protomique mais elle est galement utilise dans le domaine de la

    gnomique.

    Les acides nucliques, sont des biopolymres polaires et sont analyss notamment par une

    source ESI (Electrospray Ionization) ou par une source MALDI (Matrix-Assisted

    Desorption/Ionisation). Ces deux techniques dionisation/dsorption permettent danalyser

    des molcules de quelques dizaines de femtomoles quelques picomoles. Les

    oligonuclotides sont plus difficiles analyser que les protines. Tout dabord, ils ont

    tendance former des adduits cationiques avec les ions sodium ou potassium prsents dans

    lchantillon, formant des liaisons ioniques avec les groupements phosphodiesters. De plus,

    ils ont tendance se fragmenter facilement en perdant les bases nucliques. La stabilit des

    oligonuclotides est plus importante par ionisation MALDI que par ionisation ESI. Enfin, les

    oligonuclotides peuvent tre analyss en mode positif et ngatif mais, en mode ngatif, le

    pouvoir rsolutif et la sensibilit sont bien meilleurs surtout par ESI.

    3.1. La spectromtrie de masse ESI-IT et MALDI-TOF

    3.1.1. La spectromtrie de masse ESI-IT

  • Introduction gnrale

    26

    La source ESI est gnralement couple un analyseur pige ionique (ou trappe) (IT : Ion

    Trap) (figure 5).

    Figure 5 : Schma de principe dun Esquire

    TM ESI-ITMS

    n reproduit et modifi de Bruker Daltonics

    .

    3.1.1.1. La source ESI

    La source ESI a t dveloppe par Fenn (Yamashita et Fenn 1984; Fenn et al. 1989). Elle

    permet danalyser des macromolcules telles que les polymres et les biopolymres mais

    aussi des petites molcules polaires. Elle est la plus rpandue car elle est trs sensible et

    quelle peut-tre couple la chromatographie liquide ou llectrophorse capillaire

    permettant ainsi ltude de mlanges complexes.

    3.1.1.1.1. Le principe

    Lors de lionisation/dsorption par ESI, une diffrence de potentiel de 3 6 kV entre le

    capillaire et la contre-lectrode, spars de 0,3 2 cm, gnre un champ lectrique. Ce champ

    est appliqu, pression atmosphrique, sur une solution nbulise partir dun tube capillaire

    faible dbit (1 100 L/min). Il engendre une accumulation de charges la surface du

    liquide lextrmit du capillaire, produisant ainsi un brouillard (ou spray) (Yamashita et

    Fenn 1984; Smith et al. 1990; Loo et al. 1989; Ikonomou et al. 1990).

    Lorsque la tension lectrique est faible les gouttelettes semblent sphriques mais lorsque la

    force exerce est suprieure la tension superficielle, la surface se rompt pour former un cne

    de taylor et un spray de gouttelettes. Fortement charges, elles sont constitues notamment de

  • Introduction gnrale

    27

    lanalyte et de llectrolyte de la solution introduite dans le capillaire et des ions en excs. La

    charge de ces ions dpend du potentiel appliqu au capillaire par rapport la contre-lectrode

    (ions positifs correspond une diffrence de potentiel positif) et des proprits des

    solvants.

    Lvaporation du solvant de chaque gouttelette provoque leur rtrcissement et augmente leur

    densit de charge jusqu leur explosion coulombienne conduisant la dsorption des ions

    (Kebarle et Tang 1993). Ces ions solvats possdent un grand nombre de charges, dpendant

    des sites ionisables de la molcule qui permettent les changes de protons ou la formation

    dions cationiques ou anioniques.

    Le flux dions produit dans llectrospray doit tre compens par un courant dlectrons au

    niveau du capillaire (Kebarle et Tang 1993). Llectrospray est donc un processus

    lectrochimique qui produit un courant doxydation ou de rduction lextrmit du capillaire

    permettant ainsi de fixer la quantit dions forms. Le courant ionique total atteint

    gnralement environ 1 A.

    3.1.1.1.2. Les facteurs influenant lionisation/dsorption ESI

    Llectrospray est une source dions courant constant (Van Berkel et Zhou. 1995). Le

    courant est donc partag par tous les constituants de la solution engendrant ainsi une

    diminution du signal de lanalyte. Par consquent, la solution doit tre dessale afin de

    permettre une meilleure ionisation.

    Le flux et la concentration dions doivent tre suffisants afin dassurer un courant ionique

    constant. Si le flux nest pas suffisant, il faudra produire plus dions par oxydation (en mode

    positif) ou par rduction (en mode ngatif). Sil est trop important, le signal diminue car le

    courant est constant et il devient difficile de maintenir un bon spray dans ce cas.

    Le courant d lanalyte varie linairement avec sa concentration jusqu se rapprocher de

    celui du courant constant. Comme le courant reste constant, le courant de lanalyte rentre en

    comptition avec celui des autres ions pour le partage de ce mme courant cause du facteur

    cintique de chaque espce. Le courant des autres ions va donc dcrotre quand la

    concentration de lanalyte augmente.

  • Introduction gnrale

    28

    De plus, sil y a comptition entre deux espces, celle qui est la plus hydrophobe permet une

    meilleure dsorption. Il peut en rsulter une disparition dune des deux espces du spectre de

    masse mais en diminuant la concentration elle pourra tre de nouveau dtectable.

    Ce mme phnomne de comptition entre deux espces est observ en maintenant la

    concentration mais un trs faible flux (nanospray).

    3.1.1.1.3. Les ions multichargs

    Lionisation/dsorption par ESI de grosses molcules possdant des sites ionisables produit

    des ions multichargs (une charge pour environs 500 Da). La formation de ces ions de rapport

    m/z faible permet damliorer la sensibilit et ainsi analyser des masses molculaires trs

    importantes allant au-del des limites en masse (m/z avec z=5) de linstrument.

    Les spectres de masse ESI de grosses molcules correspondent gnralement une

    distribution de pics conscutifs caractrisant des espces molculaires multicharges par

    protonation (M+zH)Z+

    ou dprotonation ( M-zH)Z+

    de rapport m/z. Les rapports m/z de deux

    ions dune mme molcule, multicharge mais qui diffrent par un tat de charge, permettent

    de dterminer la masse de la molcule. Des algorithmes permettent la dconvolution du

    spectre de masse en transformant les pics des ions qui correspondent aux molcules

    multicharges en formes molculaires monocharges afin den dterminer la masse

    molculaire.

    De plus, seuls les mlanges simples peuvent tre directement analyss cause des nombreux

    ions multichargs qui se superposent et rendent le spectre de masse ininterprtable. Seuls les

    instruments trs hautes rsolutions permettent de lever les ambiguts. Les mlanges plus

    complexes sont analyss par couplage avec la chromatographie liquide afin de sparer les

    diffrentes molcules.

    3.1.1.2. Lanalyseur pige ionique

    Il existe trois types danalyseur pige ionique (ou trappe) : le pige ionique classique (ou

    3D), le pige ionique linaire (ou 2D) et le pige ionique quadrologarithmique transforme

    de Fourrier (FT) lectrostatique (ou orbitrap).

  • Introduction gnrale

    29

    3.1.1.2.1. Le pige ionique classique

    3.1.1.2.1.1. Le principe

    Le pige ionique classique, 3D, est le plus ancien et le plus rpandue. Il est constitu dune

    lectrode circulaire ferme aux extrmits par deux calottes sphriques (Stafford et al. 1984)

    (figure 5). La superposition de tensions continue et alternative (RF) permet de crer un champ

    quadripolaire trois dimensions o les ions sont pigs sur des trajectoires complexes (3 D).

    Tous les ions prsents simultanment dans le pige ionique, sont ensuite jects en fonction

    de leur masse par augmentation de lamplitude de la tension RF. Ljection rsonante des ions

    se fait par application sur les calottes de la frquence de lion. Lamplitude du mouvement de

    lion augmente donc jusqu absorber une quantit dnergie suffisante pour tre ject du

    pige ionique. Lors de lenregistrement du spectre de masse, les ions sont toujours jects

    une frquence rsonante qui correspond un champ particulier. Pour une faible gamme de

    rapport m/z, ils sont jects au champ quadripolaire qui correspond en gnrale la moiti de

    la frquence de la tension RF tandis que pour une gamme de rapport m/z plus leve, ils sont

    jects au champ hexapolaire qui correspond une frquence djection plus faible.

    Deux approches mathmatiques complmentaires sont proposes pour expliquer le

    fonctionnement du pige ionique. Lapproche base sur la recherche des solutions de

    lquation de Mathieu qui conduit aux quations suivantes (valables si =2

    :

    az

    qz

    Une autre approche mathmatique base sur les mthodes de Floquet et de Fourrier dcrit le

    mouvement des ions laide dun terme e (avec =+i) pour trouver les conditions dune

    trajectoire stable. Les conditions =0 et compris entre 0 et 1 ( nombre non entier pour

    maintenir les ions dans le pige ionique) doivent tre remplies simultanment suivant r et z. Si

    =1, cest ljection quadripolaire.

    3.1.1.2.1.2. La source ESI et le pige ionique 3D

  • Introduction gnrale

    30

    Lutilisation dune source ESI et de ljection rsonante permet danalyser des ions de

    rapports m/z maximum de 6000 Th pour un EsquireTM

    de Bruker et dtudier les

    fragmentations en phase gazeuse des ions par expriences MSn

    squentielles.

    Pour que les ions restent stocks dans le pige ionique, ils doivent tre ramens au centre du

    pige ionique malgr les rpulsions coulombiennes au sein du nuage dions. Si les ions sont

    trop loigns du centre, la rencontre de rsonance non linaire apparait et conduit ljection

    non contrle des ions. Le gaz, dhlium est introduit dans le pige ionique pour engendrer de

    multiples collisions avec les ions afin de les ramener au centre du pige ionique par une

    relaxation cintique.

    La prsence dhlium dans le pige ionique permet galement dexister un ion donn en lui

    appliquant sa frquence propre au niveau des calottes. Lamplitude des ions augmentent sans

    modifier leur frquence permettant ainsi daugmenter leur nergie cintique. Les ions

    acquirent donc de lnergie interne afin de favoriser le processus CID (Collison Induced

    Dissociation).

    En les expulsant slectivement, lanalyse MS/MS dun ion de rapport m/z par processus

    conscutifs choisis est ralise. Des ions prcurseurs peuvent tre slectionns. La

    spectromtrie de masse en tandem est donc ralise par squences temporelles et pas dans

    lespace comme pour lanalyseur temps de vol ou multiple quadriple.

    3.1.1.2.2. Les autres piges ioniques

    Le pige ionique linaire ou 2D est constitu de 4 barres analogues celle dun quadriple,

    ferm par des lectrodes dentre et de sortie permettant de repousser les ions vers lintrieur

    du quadriple afin de diminuer les rpulsions coulombiennes (Douglas et al. 2005). Il possde

    les mmes caractristiques que le pige ionique classique avec quelques modifications des

    tensions dentre et de sortie afin dviter les effets de champs aux limites (fringe fields).

    Lorbitrap est compos dune lectrode externe en forme de tonneau qui est spare par un

    espace troit en deux parties gales (Makarov. 2000). Llectrode centrale a une forme de

    fuseau. Les ions sont injects dans le pige ionique au niveau dune des extrmits par un

    champ quadrologarithmique. Ce champ conduit la rotation des ions autour du fuseau avec

    un mouvement axial daller et retour formant ainsi une spirale. Pour une gamme de rapport

  • Introduction gnrale

    31

    m/z leve, la spirale est constitue dun grand rayon et dune faible amplitude tandis que

    pour une gamme de rapport m/z faible, la spirale possde un plus faible rayon et une

    amplitude plus grande. Les ions de rapport m/z faible ont donc une frquence plus grande que

    ceux de rapport m/z plus levs.

    Le signal est analys au niveau du signal transitoire. Le signal transitoire doit durer le plus de

    temps possible afin dobtenir une meilleure rsolution. Le pouvoir rsolutif, aprs transforme

    de fourrier, peut tre suprieur 100000 Rs. Ce pige ionique, peu sensible aux effets de

    charge de lespace permet danalyser un grand nombre dions.

    3.1.2. La spectromtrie de masse MALDI-TOF

    La source MALDI est une dsorption-ionisation laser assiste par matrice (Karas et al. 1985;

    Karas et al. 1987; Karas et Hillenkamp 1988; Karas et Bahr. 1990). Historiquement, elle est

    principalement associe un analyseur temps de vol (TOF) car il ncessite une source

    dionisation pulse.

    Cette technique de dsorption et dionisation douce permet lanalyse des biomolcules

    (oligonuclotides, peptides, protines et oligosaccharides) de haute masse molculaire (MDa)

    (Tanaka et al. 1988). Facile mettre en uvre, elle prsente une certaine tolrance aux sels et

    aux tampons utiliss en biologie molculaire. Elle est donc adapte ltude de biomolcules

    comme lADN et aux mlanges.

    Le spectromtrie de masse MALDI-TOF se compose: dune source MALDI produisant les

    ions en phase gazeuse, dun analyseur temps de vol sparant les ions en fonction de leur

    rapport m/z, dun dtecteur convertissant un signal ionique en signal lectrique et du

    traitement du signal pour obtenir un spectre de masse des ions en fonction du rapport m/z

    (figure 6).

    Figure 6 : Schma de principe de la spectromtrie de masse MALDI-TOF.

  • Introduction gnrale

    32

    3.1.2.1. La source MALDI

    Le principe de lionisation/dsorption MALDI repose sur le mlange en solution de lanalyte

    et de la matrice. La matrice, molcule organique de faible masse molculaire, absorbe la

    longueur donde du laser utilis. Le mlange est dpos sur une cible mtallique sur laquelle

    le mlange sche afin de co-cristalliser (figure 7).

    Figure 7 : Schma de principe de la source MALDI (Livadaris 2002).

    La cible est ensuite place dans la source MALDI, sous vide (10-6

    10-7

    torr). La matrice et

    lanalyte sont irradis par un court impact (environ 5 ns) dun faisceau laser impulsion afin

    de les dsorber de la surface de la cible et de les jecter en phase gazeuse. Il se forme alors, en

    phase gazeuse, des agrgats de molcules de matrice et danalyte appel panache au sein

    duquel se forment les ions. Lanalyte est donc ionis, sous forme protone ou dprotone ou

    de cations alcalins. Il se forme majoritairement des ions monochargs.

    3.1.2.1.1. La matrice

    La matrice est un lment essentiel car elle intervient dans le processus de formation des ions

    en phase gazeuse. Elle absorbe la longueur donde du laser par excitation lectronique

    laide dun rayonnement avec un laser ultraviolet dimpulsion ou par excitation vibrationnelle

    par utilisation dun laser infrarouge. Le choix de la matrice approprie est fonction de

    lanalyte tudier car les interactions matrice-analyte jouent un rle dans le processus

    dionisation et de dsorption.

  • Introduction gnrale

    33

    Le choix de la matrice repose sur diffrents critres empiriques. Elle doit absorber la

    longueur donde du laser, tre chimiquement inerte et ne doit pas sublimer dans les conditions

    de vide pouss. La prparation du mlange matrice-analyte est aussi trs importante afin

    dobtenir une bonne cristallisation. Lanalyte doit tre dilu dans une grande quantit de

    matrice (rapport molaire de matrice/analyte de 103 10

    5) afin que les interactions entre les

    molcules danalyte soient rduites, facilitant ainsi leur transfert en phase gazeuse (Horneffer

    et al. 2006). Elle doit possder une fonction acide permettant le transfert de proton dans

    ltape dionisation.

    La matrice peut jouer un rle plus ou moins important dans la fragmentation des ions

    mtastables mode PSD (Post Source Decay) (Karas et al. 2000). Il existe des matrices

    dites froides induisant facilement des fragmentations faible fluence du laser et des matrices

    dites chaudes induisant peu de fragmentation (Karas et al. 1995; Luo et al. 2002).

    Le choix de la matrice la mieux adapte lanalyte tudi est crucial. Elles peuvent tre

    solides, solides ioniques ou liquides. Les matrices solides sont les plus utilises. Ce sont des

    composs simples de petite taille portant un chromophore UV et qui possdent le plus souvent

    des groupements aromatiques. Cependant, elles engendrent une mauvaise reproductibilit du

    spectre de masse entre deux impacts du laser conscutifs d la cristallisation du dpt. Il est

    donc trs important de choisir la mthode de prparation de lchantillon la mieux adapte. De

    plus, les dpts ont une trs courte dure de vie. Les matrices solides ioniques sont constitues

    dune matrice solide et dune base organique comme la pyridine (Armstrong et al. 2001; Li &

    Gross 2004; Tholey & Heinzle 2006). Les solutions de matrice sont donc plus homognes que

    celles des matrices solides, permettant ainsi une meilleure reproductibilit des spectres de

    masse obtenus entre deux impacts du laser sur le mme dpt. Les matrices liquides montrent

    galement une bonne reproductibilit des spectres de masse obtenus entrent deux impact de

    laser conscutifs. Cependant, elles nabsorbent pas ou peu dans lultraviolet et le visible, elles

    sont donc utilises avec un laser absorbant des longueurs dondes infrieures 300 nm.

    Les matrices utilises pour lanalyse des oligonuclotides ne le sont gnralement pas pour

    lanalyse des peptides et protines et des polymres de synthse (tableau 1).

  • Introduction gnrale

    34

    Matrices Abrviations

    Acide-3 hydroxypicolinique HPA

    2,4,6 trihydroxyactophnone THAP

    Acide anthranilique AA

    Acide picolinique PA

    Acide nicotinique NA

    -cyano-4-hydroxycinnamoate de mthyle CNMeAcide 2,5-dihydroxybenzoque DHB

    Acide quinaldique QA

    3,4-diaminobenzophenone DABP

    Acide 5-methoxysalicylique MSA

    6-aza-2-thiothymine ATT

    3-Hydroxycoumarin 3-HC

    Acide -cyano-4-hydroxycinnamique HCCA

    Tableau 1 : Quelques matrices utilises en MALDI-UV pour lanalyse des oligonuclotides (Wu &

    McLuckey 2004; Tang et al. 1993; Krause et al. 1996; Zhang et al. 2006; Song 2003; Fu et al. 2006;

    Distler & Allison 2001).

    Pour lanalyse des oligonuclotides, les matrices 3-HPA et THAP sont les plus utilises. Les

    acides nucliques, tant riches en groupements phosphodiester, favorisent la formation

    dadduits de mtaux alcalins (Na+, K

    + par exemple) perturbant la mesure de la masse de

    loligonuclotide. Pour parer ce phnomne, les solutions de matrice contiennent

    gnralement un additif (par exemple le citrate dammonium) afin damliorer la dtection

    des ions. Lion ammonium permet dune part, de dessaler lanalyte et dautre part, de

    rgnrer les formes protones dans lagrgat.

    3.1.2.1.2. La prparation de lchantillon

    La prparation de lchantillon est donc une tape cruciale lors de lanalyse par MALDI-TOF

    MS. Elle dpend de la nature de lanalyte, de la sensibilit requise et du type dinformation

    recherch. Le choix de la matrice, des solvants et du type de dpt, doivent donc tre

    optimiss pour chaque prparation dchantillon. Diffrentes mthodes de prparation existent

    selon la matrice et lanalyte : la mthode de la goutte sche, la mthode de la couche mince

    et la mthode du dpt en sandwich.

    Lors de la mthode de la goutte sche, la matrice est solubilise le plus souvent dans

    lactonitrile. La solution de matrice est ensuite mlange lchantillon et une goutte de

    cette prparation est dpose sur la surface de la cible mtallique. Le mlange est soit ralis

  • Introduction gnrale

    35

    au pralable (pre-mix), soit effectu sur la cible elle-mme. La cristallisation obtenue par

    schage de la goutte temprature ambiante peut-tre acclre par chauffage, ventilation

    force ou aspiration sous vide. Cette mthode est la plus simple mettre en uvre et fournit

    de bons rsultats pour de nombreux types dchantillons, en particulier pour lanalyse des

    oligonuclotides, peptides et protines. Le principal inconvnient de cette mthode de dpt

    est le phnomne de sgrgation. La distribution irrgulire des cristaux la priphrie de la

    goutte, effet Marangoni (Amado et al. 1997) conduit une grande variabilit des ions dtects

    sur le dpt. Lacclration du schage sous vide permet de rduire leffet de sgrgation en

    rduisant la taille et en augmentant lhomognit des cristaux.

    Lors de la mthode de la couche mince, la matrice est solubilise dans un solvant volatil

    (actone ou mthanol) (Vorm et al. 1994). Une goutte de solution de matrice est dpose sur

    la cible et lvaporation rapide du solvant produit une couche mince et homogne de cristaux.

    Puis, lchantillon est dpos sur cette prparation, permettant ainsi un dpt de faible

    dimension. Les cristaux de matrice de la premire couche servent ainsi de site de nuclation

    pour lchantillon dpos ensuite. Ce type de dpt peut tre lav afin dliminer les

    contaminants (sels, dtergents..). Un solvant aqueux est ajout sur le dpt et rapidement r-

    aspir laide dune pipette. Cette mthode permet dobtenir des cristaux plus petits et plus

    homognes que ceux de la mthode de la goutte sche (Dai et al. 1996; Onnerfjord et al.

    1999). Cette homognit permet une meilleure reproductibilit (sensibilit, rapport signal sur

    bruit, rsolution) des analyses. Cependant, la couche mince de matrice et dchantillons est

    rapidement dtruite aprs quelques tirs du laser. La reproductibilit des dpts dchantillons

    est rendu difficile par lutilisation de solvants volatiles.

    Lors de la mthode du dpt en sandwich, une premire couche de matrice est dpose selon

    la mthode de la couche mince ( Li et al. 1996) . Une goutte danalyte est dpose sur la

    couche mince et enfin une goutte de solution de matrice est dpose sur la deuxime couche.

    Le dpt est alors sch temprature ambiante. Un lavage du dpt peut galement tre

    effectu avec ce type de mthode. Lanalyte se retrouve dispos entre deux couches de

    matrice.

    3.1.2.1.3. Le laser

  • Introduction gnrale

    36

    Le laser le plus rpandu est un laser azote mettant 337 nm. Les autres lasers les plus

    courants sont les lasers Nd :YAG (1060mm, frquence triplet, 353 nm) et les lasers

    infrarouges comme celui dioxyde de carbone 10,6 m ( Zenobi & Knochenmuss 1998).

    Comme les matrices absorbent gnralement moins bien dans linfrarouge, la puissance du

    laser IR applique lanalyte doit tre plus importante que pour celle dun laser UV. Les

    spectres de masse obtenus par un laser IR ou UV sont globalement similaires. Le laser IR

    montre juste une plus grande tendance former des ions multichargs et des adduits.

    Limpact du laser sur lanalyte ntant que de quelques nanosecondes, le phnomne de

    dsorption/ionisation dpend donc de la fluence du laser (J/cm2) (Zenobi & Knochenmuss

    1998; Dreisewerd et al. 1995).

    3.1.2.1.4. Les modles dionisation

    Le mcanisme de formation des ions issus dune source MALDI est compos de deux tapes :

    la dsorption et lionisation. Tout dabord, labsorption de photons du laser par le mlange co-

    critallis de matrice et danalyte entrane la dsorption. Il se forme alors un panache par

    dcompression du solide vers la phase gazeuse. Puis, les molcules danalyte et la matrice

    sionisent. Lionisation MALDI reste encore un phnomne mal connu aujourdhui car il ne

    peut sexpliquer par un phnomne unique. Un grand nombre de paramtres exprimentaux

    influencent la formation des ions tels que la longueur donde du laser, les conditions de

    prparation des chantillons (et la cible), la nature de lanalyte, le mlange de matriceanalyte

    et le mode de dtection des ions (positif ou ngatif).

    Trois modles dcrivent le processus MALDI. Le premier modle est celui du contrle

    thermodynamique de Zenobi et Knochenmuss (Zenobi & Knochenmuss 1998; Breuker et al.

    2003; Knochenmuss et al. 2000.; Knochenmuss 2002; Knochenmuss 2003; Knochenmuss &

    Zenobi 2003). Lionisation est compose de deux vnements distincts : lionisation primaire

    et secondaire o se droulent diffrentes ractions ion-molcule. Les processus en phase

    gazeuse ont lieu un quilibre thermodynamique au sein du panache aprs un dlai de

    plusieurs centaines de nanosecondes dexpansion de celui-ci.

    Le second modle, est celui propos par Karas, du Lucky Survivor Ions (Karas et al. 2000;

    Karas et al. 2003; Karas & Krger 2003; Krger & Karas 2002; Glckmann et al. 2001). Il est

  • Introduction gnrale

    37

    le premier considrer les agrgats comme des prcurseurs des ions forms en MALDI. Les

    espces sont des survivants de processus de neutralisation par capture dlectrons.

    Le troisime modle, est celui propos par le groupe Tabet, des espces agrgats

    prcurseurs, proche de celui de Karas mais qui prsente une analogie avec les processus

    dionisation ESI (Fournier et al. 2002; Fournier et al. 2003; Livadaris et al. 2000). Ce modle

    considre des ractions de dsolvatation par perte de matrice neutre ou charge.

    Lensemble de ces modles, surtout les deux derniers, impliquent un processus de production

    dagrgats qui dsorbent de la surface au moins pendant les premires 6 nanosecondes de la

    fluence du laser. La taille de ses agrgats est variable mais elle peut grossir ou se former dans

    le panache aprs limpact laser. Les ions issus de ces agrgats apparaissent donc des temps

    et des endroits diffrents de la source. Il en rsulte une perte du pouvoir rsolutif de

    linstrument. Les ions nont pas exactement la mme nergie cintique (dpend de leur

    position dans la source) et peuvent tre dcals dans le temps car ils sont mis des temps

    diffrents partir de la surface. Lnergie interne des ions ainsi libre dpend de la taille des

    agrgats. Plus la taille des agrgats est grande plus lnergie sera relaxe. Si cette nergie

    interne est suffisante, elle peut tre la cause de fragmentation. Comme il sagit de distribution

    de lnergie des ions, les ions riches en nergie vont conduire des fragmentations promptes

    dans la source tandis que les ions de plus faible nergie se dcomposent dans la rgion de

    libre champ du tube de vol.

    3.1.2.2. Lanalyseur temps de vol

    La source MALDI est le plus gnralement couple un analyseur temps de vol. Cependant,

    elle peut tre galement couple un pige ionique (Jonscher & Yates 1997), un analyseur

    rsonnance ionique cyclotronique transforme de Fourier ( Li et al. 1994) ou un analyseur

    secteur magntique (Bordoli et al. 1994). Il existe aussi des instruments hybrides :

    quadriple/TOF, pige ionique/TOF ou TOF/TOF.

    Le principe de lanalyseur temps de vol (TOF Time-of-Flight) a t dcrit par Stephens en

    1946 et largement tudi par la suite par Cotter (Stephens 1946; Cotter 1989; Cotter 1992;

    Cotter 1999).

    Lanalyseur temps de vol mesure la dure de transfert des ions aprs le tir du laser pour

    arriver au dtecteur au travers de la rgion libre de champ. Le rapport m/z est donc

  • Introduction gnrale

    38

    directement dduit de la dure de vol de lion. Lutilisation dune impulsion laser permet

    lmission dions trs localiss dans lespace et le temps. Le couplage du MALDI avec

    lanalyseur de temps de vol est donc ida