laboratoire de génétique moléculaire humaine

45
Laboratoire de Génétique Moléculaire Humaine Equipe de l'EA2493, UFR de médecine Paris Ile de France Ouest et laboratoire SESEP Méthodes d'analyse de l'ADN Applications médicales et médico-légales Etienne MORNET Sommaire Introduction La détection et l'analyse de l'ADN chez l'Homme L'hybridation moléculaire I) La réaction de polymérisation en chaine ou PCR Introduction Principe La réaction Limites Exemples d'applications PCR quantitative II) La méthode de Southern Principe Techniques de marquage Applications III) Le séquençage o Introduction o Principe o Applications IV) Les polymorphismes de l'ADN Polymorphismes de restriction Séquences microsatellites SNP CNV V) Applications médicales des polymorphismes de l'ADN Diagnostic indirect Diagnostic des aneuploidies VI) Applications médico- légales des polymorphismes de

Upload: hocine

Post on 01-Jul-2015

119 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Laboratoire de Génétique Moléculaire Humaine

Laboratoire de Génétique Moléculaire Humaine  

 Equipe de l'EA2493, UFR de médecine Paris Ile de France

Ouest

et laboratoire SESEP

 

     

 

Méthodes d'analyse de l'ADN

Applications médicales et médico-légales

Etienne MORNET

Sommaire

Introduction

La détection et l'analyse de l'ADN chez l'Homme

L'hybridation moléculaire

I) La réaction de polymérisation en chaine ou PCR

Introduction Principe La réaction Limites Exemples d'applications PCR quantitative

II) La méthode de Southern

Principe Techniques de marquage Applications

 

III) Le séquençage

o Introductiono Principeo Applications

IV) Les polymorphismes de l'ADN

Polymorphismes de restriction Séquences microsatellites SNP CNV

V) Applications médicales des polymorphismes de l'ADN

Diagnostic indirect Diagnostic des aneuploidies

VI) Applications médico-légales des polymorphismes de l'ADN

o Tests d'identitéo Tests de paternitéo ADN mitochondrial

VII) Le clonage bactérien

Page 2: Laboratoire de Génétique Moléculaire Humaine

: les images peuvent parfois apparaitre de mauvaise qualité. Si c'est le cas, les agrandir, soit à l'aide de l'outil loupe, soit à l'aide de l'outil zoom (en bas à droite de la fenêtre sous I.E).

INTRODUCTION

1) LA DETECTION ET L'ANALYSE DE L'ADN CHEZ L'HOMME

L’ADN génomique humain représente de l’ordre de 3,3 milliards de paires de bases. Détecter une variation de séquence de l’ordre du nucléotide ou de quelques nucléotides parmi ces milliards de nucléotides a donc nécessité l’élaboration d’outils permettant de s’affranchir du « bruit de fond » généré par le reste du génome. Trois types d’approches ont été (et sont encore) utilisées pour détecter et/ou analyser une petite partie du génome :

L’isolement de cette partie du génome du reste du génome : c’est le clonage bactérien inventé en 1972Le repérage de cette partie du génome en « l’allumant » à l'aide d'une sonde : c’est la méthode de Southern (1975)La multiplication de cette partie du génome de façon telle que le reste du génome devienne quantitativement négligeable : c’est la PCR (1985)Une fois isolée ou multipliée, cette partie du génome peut être analysée par divers procédés qui seront évoqués dans ce cours : séquençage, ASO, restriction enzymatique etc...

2) L’HYBRIDATION MOLÉCULAIRE

Toutes les méthodes de biologie moléculaire reposent au départ sur le principe de l’hybridation moléculaire. Il s’agit de la propriété que présente une molécule d’ADN monobrin de s’associer spontanément et de façon spécifique et réversible à une autre molécule monobrin si celle-ci lui est complémentaire. L’hybridation moléculaire est permise par les liaisons hydrogènes que peuvent établir les bases puriques et pyrimidiques constituant

L’hybridation moléculaire est : : Sous certaines conditions expérimentales (stringence), une séquence d’ADN monobrin ne peut s’apparier qu’à la séquence qui lui est

complémentaire dans le génome. : l’expérimentateur peut, en jouant sur les conditions expérimentales (essentiellement la température du milieu réactionnel) réaliser ou au

contraire supprimer (dissociation) l’hybridation de deux molécules d’ADN.

Conditions expérimentales de température, de PH et de force ionique permettant l’hybridation moléculaire. La stringence est proportionnelle à la température et à l’inverse de la concentration en cations monovalents (Na+ par exemple). Des conditions très stringentes (T° élevée, concentration en Na+ faible) rendent l’hybridation moléculaire plus difficile mais permettent une hybridation spécifique tandis que des conditions peu stringentes (T° plus faible, concentration en Na+ plus élevée) permettent une hybridation moins spécifique.

Page 3: Laboratoire de Génétique Moléculaire Humaine

Le paramètre déterminant dans la spécificité et la réversibilité de l’hybridation moléculaire est le Tm ou température de fusion (melting temperature). C’est la température à laquelle la moitié de l’ADN est sous forme monobrin et l’autre moitié sous forme double brin. Le passage d’une forme à l’autre est brutal du fait du caractère coopératif de la réaction, que ce soit dans un sens ou dans l’autre. Ce passage se visualise très bien si on mesure la DO à 260 nm (UV) car l’ADN simple brin absorbe plus les UV que l’ADN double brin.

Le Tm dépend de nombreux facteurs tels que la longueur du fragment d’ADN considéré, sa richesse en cytosines et guanines et la concentration en ion Na du milieu réactionnel. En pratique, l’expérimentateur peut créer ou supprimer l’hybridation moléculaire en choisissant une température du milieu réactionnel inférieure, égale ou supérieure au Tm.

 

Prenons l’exemple d’un oligonucléotide d’une taille de 20 nucléotides et d’une séquence plasmidique monobrin de 3 kb contenant quelque part la séquence complémentaire de cet oligonucléotide.

Si la température du milieu réactionnel est supérieure au Tm, l’ADN plasmidique et l’oligonucléotide ne s’hybrideront pas. Ils resteront sous forme monobrin.Si la température est égale (en pratique légèrement inférieure) au Tm, il y aura hybridation spécifique, c’est à dire à l’endroit de la séquence cible qui est complémentaire de l’oligonucléotide.Si la température est très inférieure au Tm, il y aura hybridation sur la séquence complémentaire mais aussi hybridation non spécifique, c’est à dire à des endroits de la séquence cible qui ne sont pas parfaitement complémentaires de l’oligonucléotide. Cette situation est parfois intéressante, par exemple dans le cas d'expériences de mutagenèse dirigée.

Pour un oligonucléotide de taille inférieure à 14 nucléotides, le calcul du Tm est :

Tm= (wA+xT) x 2 + (yG+zC) x 4

où w, x, y et z sont le nombre de nucléotides A, T, G et C respectivement.

Pour un fragment plus long, le calcul du Tm est:

Page 4: Laboratoire de Génétique Moléculaire Humaine

Tm = 81,5 + 16,6(log10[Na+]) + 0,41[(G+C)/N] - (600/N)

où N est le nombre total de nucléotides et [Na+] la concentration en sodium du milieu d'hybridation.

Sommaire

I) LA PCR (POLYMERASE CHAIN REACTION)

1) IntroductionLa PCR est une méthode permettant la multiplication d’une courte séquence d’ADN (jusqu’à 2 ou 3 Kb en routine) appelée séquence cible, à partir d’une infime quantité d’ADN génomique. Elle est même possible à partir de l’ADN génomique issu d’une cellule unique, ce qui rend possible le diagnostic pré-implantatoire. Elle est réalisée dans un tube à essai en quelques heures. Publiée en 1985 par R. Saiki, elle a révolutionné le diagnostic moléculaire des maladies génétiques comme bien d’autres domaines.

Le taux de multiplication (ou taux d’amplification) est tel que la réaction revient à rendre négligeable le reste du génome qui n’a pas été amplifié car le produit de PCR contient presque exclusivement des millions d’exemplaires de la séquence cible. Il est donc facilement analysable par exemple sur un gel d’électrophorèse en fluorescence UV sans avoir à rechercher spécifiquement la séquence cible par hybridation moléculaire comme c’était le cas auparavant (technique de Southern). La PCR est utilisée dans la très vaste majorité des diagnostics moléculaires.

La séquence cible est multipliée par synthèses successives à l’aide d’amorces oligonucléotidiques et d’une ADN polymerase thermostable. Chaque synthèse ou cycle de PCR est constituée de 3 étapes constituées de trois plateaux de température différents : dénaturation (autour de 95°C), hybridation des amorces (entre 50 et 60°C) et polymérisation (autour de 72°C). Chaque cycle dure quelques minutes. La séquence cible étant doublée à chaque cycle, le taux d’amplification (théorique) est de 2n, si bien qu’après une trentaine de cycles de PCR, le nombre de copies de la séquence cible est plusieurs dizaines de

Page 5: Laboratoire de Génétique Moléculaire Humaine

millions de fois supérieur à n’importe qu’elle autre séquence du génome. Cette sur-représentation la rend facilement analysable et manipulable.

La PCR est une technique incomparablement plus rapide que d'autres techniques telles que la méthode de Southern ou le clonage. Il faut deux ou trois heures pour réaliser une PCR.

Schéma détaillé. Cliquez sur l'image pour l'agrandir

Le milieu réactionnel doit contenir :

l’ADN contenant la séquence à amplifier ; il peut s’agir de l’ADN génomique d’un patient pour lequel on cherche à réaliser le diagnostic moléculaire d’une maladie génétique, d’ADN plasmidique contenant une séquence d’intérêt etc...les deux amorces olignonucléotidiques monobrins complémentaires chacune d’une des extrêmités du fragment à amplifier.des déoxynucléotides libres dATP, dCTP, dGTP, dTTP qui sont incorporables pour former le brin d’ADN néosynthétisé.l’enzyme permettant la synthèse d’un néobrin à partir des amorces ; il s’agit d’une ADN polymérase thermostable, par exemple la Taq DNA polymerase issue du micro-organisme Thermus Aquaticus.du MgCl2 et une solution donnant au milieu réactionnel un PH et une concentration saline optimale pour le fonctionnement de l’enzyme

Le tube contenant le milieu réactionnel est placé dans un appareil appelé « thermocycleur », sorte de plaque chauffante programmable en temps et en température et disposant de délais de montée et de descente en température extrêmement courts. Il délivre à chaque instant au milieu réactionnel une

Page 6: Laboratoire de Génétique Moléculaire Humaine

température donnée permettant la réalisation de l’une des trois étapes du cycle de PCR : dénaturation, hybridation ou synthèse.

Une représentation animée (en Anglais) de la PCR est disponible à l’adresse suivante :

http://www.dnalc.org/resources/BiologyAnimationLibrary.htm

4) Les limites de la technique

a) La PCR suppose la synthèse chimique de deux oligonucléotides utilisés pour l’amorçage de la réaction. Il faut donc que la séquence nucléotidique du fragment à analyser soit connue au niveau de ces régions d’amorçage. Il est néanmoins possible de contourner le problème en clonant le fragment dont la séquence est totalement inconnue dans un vecteur (plasmide, bactériophage ...) afin d’utiliser la séquence (connue) du vecteur pour amorcer la réaction de PCR. L'avantage de cette méthode par rapport à la multiplication par clonage est sa simplicité et sa rapidité.

b) La taille du fragment à amplifier ne peut pas dépasser quelques kilobases. Au-delà, il se produit des phénomènes qui empêchent la réaction de se faire normalement : interruptions prématurées dues à la formation de structures secondaires, réappariement des fragments néosynthétisés entre eux etc...

c) Le taux d’amplification est théoriquement de 2 n mais en pratique le rendement de la réaction n’est jamais de 100%. Si on considère que la réaction peut

x (1+R)n où R est le rendement,

et si on admet un rendement de 80% (ce qui est généralement observé), alors on a :

Page 7: Laboratoire de Génétique Moléculaire Humaine

Pour n = 30 cycles, on obtient un taux d'amplification de 1,8 30, soit env. 45 x 106.

Dans 100 ng d’ADN génomique humain, on a env. 0,03 pg d’ADN d’une séquence cible de 1 kb (soit [100 . 103 / 3 109] x 1000). Cette quantité n’est pas détectable ni sur gel ni par des procédés classiques de marquage. Une amplification par PCR permettra d’obtenir 0,03 x 45 x 106 pg soit 1,3 microgrammes parfaitement détectables par exemple sur un gel d’électrophorèse visualisé en bromure d’éthidium.

d) Au-delà d'un certain nombre de cycles, le taux d'amplification baisse progressivement pour tendre vers 1 (figure). Ceci est dû à une diminution de la concentration des déoxynucléotides et des oligonucléotides et à l'augmentation de la concentration du produit de PCR qui tendent à s'hybrider entre eux..

5) Exemples d'applications

Les applications de la PCR sont très nombreuses et la plupart des méthodes de biologie moléculaire reposent au départ sur la PCR.

a) Détection d’OGMPour rechercher la présence d’un transgène (par exemple le gène de résistance à un herbicide) chez un organisme, on peut utiliser des amorces de PCR (oligonucléotides synthétiques) spécifiques de la séquence de ce transgène. Si le transgène n’est pas présent dans l’organisme testé, les amorces ne s’hybrideront pas sur l’ADN extrait de cet organisme et il n’y aura pas de produit d’amplification. Au contraire, si le transgène est présent, il sera détectable par l’obtention d’un produit d’amplification.

cliquez sur les images

Une autre application simple : la recherche de la mutation F508del dans la mucoviscidose

La mucoviscidose est l’une des maladies héréditaires récessives autosomiques les plus fréquentes en Europe avec une incidence moyenne de l’ordre de 1/3 100 (un nouveau-né pour 3 100 naissances). La maladie est due à l’absence ou la déficience fonctionnelle d’un canal chlore nommé CFTR (Cystic Fibrosis Transmembrane Regulator). Ce canal chlore, situé à la surface apicale des cellules tapissant les épithéliums a pour rôle de faire sortir l’ion chlorure de la cellule épithéliale et donc de permettre l’équilibre ionique entre ces épithéliums et le milieu extérieur. Le CFTR est présent dans les cellules épithéliales glandulaires des canaux pancréatiques, biliaires, des cryptes intestinales, de l’arbre trachéo-bronchique, des tubules rénaux, de l’appareil génital et des glandes sudoripares. Au niveau des glandes sudoripares, l’orientation des flux d’ions est inversée, ce qui explique la concentration élevée de Cl- dans la sueur. La mesure de cette concentration en Cl- dans la sueur est d'ailleurs un outil diagnostique de la mucoviscidose. Les manifestations cliniques sévères de la maladie sont essentiellement pulmonaires et pancréatiques. La maladie cause un épaississement des sécrétions exocrines conduisant à l’obstruction des canaux et à une prédisposition aux infections. Les poumons sont peu à peu dégradés provoquant une insuffisance respiratoire, principale cause de mortalité. D’autre part, ces sécrétions exocrines au niveau du pancréas conduisent à des troubles de la digestion (malnutrition). Le gène impliqué dans la mucoviscidose, appellé CF (Cystic Fibrosis) ou CFTR code pour la protéine CFTR. Il est constitué de 27 exons et 70% des porteurs du gène muté portent la même mutation, une délétion de trois paires de bases dans l’exon 10, ce qui conduit à la perte d’un acide aminé Phénylalanine. A côté de cette mutation fréquente nommée F508del (ou anciennement F508), il existe plus de 1000 autres mutations pathogènes toutes assez rares, parfois retrouvées dans une seule famille dans le monde (mutations “privées”). Il existe également un grand nombre de séquences alléliques polymorphes sans conséquences pathologiques. Puisque la mucoviscidose est une maladie à transmission récessive autosomique, seuls les porteurs de deux allèles pathogènes identiques (homozygotes) ou différents (hétérozygotes composites) du gène seront atteints.

Page 8: Laboratoire de Génétique Moléculaire Humaine

Le diagnostic moléculaire de la mucoviscidose est rendu difficile par la taille du gène (180 000 paires de bases dont 6500 de séquence codante), le nombre important d’exons et le nombre important de mutations. En effet, nous avons vu que la PCR permet d’amplifier des fragments d’ADN de petites tailles (quelques kilobases) ; il est donc nécessaire d’amplifier séparément chaque exon avant de l’analyser. La mutation F508del étant la plus fréquente des mutations, celle-ci peut être recherchée en première intention.

Diagnostic moléculaire par recherche de la mutation F508del:L’ADN du patient est extrait à partir d’un prélèvement de sang veineux ou de cellules trophoblastiques ou amniotiques dans le cas du diagnostic prénatal. La séquence du gène CFTR étant connue, il est possible de synthétiser deux amorces oligonucléotidiques de part et d’autre de la région de l’exon 10 où se trouve potentiellement la mutation F508del. Une réaction de PCR permet l’amplification de cette région, que celle-ci soit normale (absence de la mutation deltaF508) ou mutée (présence de la mutation). La distinction entre les trois génotypes possibles (N/N, F508del/N ou F508del/F508del) peut être obtenue par électrophorèse sur gel de polyacrylamide et visualisation des produits de PCR aux U.V.

Principe du test (cliquez sur l'image de gauche) et résultat (cliquez sur l'image de droite)

c) PCR - restriction : exemple de la drépanocytose

La drépanocytose (ou anémie falciforme) est une maladie héréditaire récessive autosomique rare sauf dans certaines régions, notamment l’Afrique équatoriale, certaines régions de l’Inde et le pourtour Méditéranéen. La maladie est un syndrome hémolytique dû à un défaut de la chaine ß de l’hémoglobine. Elle se caractérise par une tendance des globules rouges à prendre une forme anormale en faucille lorsque la pression d’oxygène est basse. La destruction des globules rouges conduit à des anémies, des jaunisses, et des infarctus de différents tissus (osseux, pulmonaire ...). La drépanocytose est due à une mutation ponctuelle au niveau du sixième codon du gène codant pour la chaine ß de l’hémoglobine ; il s’agit d’une substitution A->T changeant un acide aminé Glutamate (GAG) en Valine (GTG). Cette mutation conduit à la suppression d’un site de l’enzyme de restriction Bsu I (voir figure ci-dessous). Il est donc possible de détecter la présence ou l’absence de la mutation par l’utilisation de cette enzyme. En pratique, la région contenant ce site de restriction est amplifiée par PCR à partir de l‘ADN génomique du patient à tester. Le produit de PCR est ensuite mis en présence de l’enzyme Bsu I. Le produit de digestion est finalement déposé sur un gel d’électrophorèse afin de séparer les fragments selon leurs tailles. Dans le cas où la mutation est présente (allèle ßS), le site de restriction est supprimé et le fragment d’ADN est donc plus long.

cliquer sur l'image

Page 9: Laboratoire de Génétique Moléculaire Humaine

Un second site de restriction Bsu I, constant, sert de contrôle de digestion : l'absence du fragment constant de 100 pbou la présence d'un fragment de taille inattendue signifie que l’enzyme n’a pas fonctionné ou a fonctionné incomplètement, ce qui évidemment peut fausser le résultat du diagnostic.

Hybridation allele-specifique (ASO) : exemple de la mutation G542X dans la mucoviscidose

Il existe dans l’exon 11 du gène CF une mutation relativement fréquente due à une substitution nucléotidique G->T et conduisant à un arrêt de traduction

La technique ASO (pour Allele Specific Oligonucleotide) consiste à détecter la présence ou l’absence d’une mutation ponctuelle en réalisant l’hybridation moléculaire entre la séquence à tester et deux sondes, spécifiques l’une de l’allèle normal et l’autre de l’allèle muté. Si l’oligosonde est sufisamment courte (20 nucléotides en général), elle ne pourra s’hybrider à la séquence du patient à tester que si celle-ci lui est parfaitement complémentaire. Ainsi, l’oligosonde normale s’hybridera sur l’allèle normal mais pas sur l’allèle muté et l’oligosonde mutée s’hybridera sur l’allèle muté mais pas sur l’allèle normal. L’hybridation par chacune des deux sondes permet donc de déterminer sans ambiguité le génotype du patient au locus de cette mutation. Ces oligosondes sont marquées avec un traceur radioactif (P32) ou chimioluminescent (digoxygénine) afin de rendre repérable l’hybridation moléculaire par autoradiographie (voir les techniques de marquage de l'ADN).En pratique, l’ADN du patient est amplifié par PCR au niveau de la région d’intérêt (exon 11 du gène CF); le produit de PCR est dénaturé afin d’être rendu monobrin, puis déposé en tâche (dot) sur une membrane de nylon. Après une étape dite de préhybridation au cours de laquelle la membrane contenant l’ADN est mise dans les conditions de température, de PH et de salinité nécessaires à l’hybridation, celle-ci est réalisée en mettant en contact l’ADN et l’une des oligosondes. Lorsqu’une molécule d’ADN sonde va rencontrer une molécule d’ADN cible (produit de PCR), la complémentarité des séquences va permettre la réassociation des deux molécules simple brin en une molécule double brin. Après une étape de lavages destinés à éliminer les molécules de sondes marquées qui ne se sont pas hybridées, la membrane est soumise à une autoradiographie qui va permettre la visualisation des taches où a eu lieu

Page 10: Laboratoire de Génétique Moléculaire Humaine

e) Génotypage par PCR en temps réel

Outre la possibilité de faire de la PCR quantitative, la PCR en temps réel permet de déterminer de façon simple le génotype au locus de n'importe quelle substitution nucléotidique connue (voir plus loin l'exemple de la drépanocytose).

6) Le problème des délétions hétérozygotesLes délétions de tailles importantes à l'état hétérozygote ne sont pas facilement détectables par PCR. En effet, de telles délétions peuvent conduire à l'absence de produit de PCR sur l'allèle muté et la présence du produit de PCR sur l'allèle normal (figure ci-dessous).

cliquez sur l'image pour l'agrandir

La détection de délétions hétérozygotes suppose donc que la PCR soit réalisée dans des conditions dites quantitatives, c'est à dire dans lesquelles le nombre de copies amplifiées est proportionnel au nombre initial de copies. Mais au-delà d'un certain nombre de cycles, le taux d'amplification baisse progressivement jusqu'à un plateau (figure ci-dessous). Ceci est dû à l'épuisement progressif des réactifs (déoxynucléotides libres, oligonucléotides, enzyme) et à la concentration de plus en plus importante des produits de PCR qui tendent à s'hybrider entre eux. La PCR quantitative suppose donc de limiter le nombre de cycles de façon à ne pas atteindre le plateau de la courbe où le nombre de copies obtenues ne dépend plus du nombre initial de copies. Une alternative intéressante pour détecter les délétions de tailles importantes est la méthode de Southern.

Page 11: Laboratoire de Génétique Moléculaire Humaine

7) La PCR quantitative

De très nombreuses applications dans le domaine du diagnostic génétique et la détection de mutations sont aujourd'hui réalisées grâce à la PCR en conditions quantitatives. Pour n'en citer que trois on peut détecter une aneuploïdie (trisomie 21 par exemple), détecter une grande délétion dans un gène, ou encore quantifier l'expression d'un gène, c'est-à-dire mesurer la quantité d'ARNm produit par le gène. Deux approches sont possibles:

Réaliser un nombre limitant de cycles de PCR de façon à se situer -au dernier cycle- dans la partie exponentielle de la courbe d'amplification. C'est souvent la méthode utilisée pour détecter des aneuploidies ou des délétions. Le cas des grandes délétions est traité ci-dessous, celui du diagnostic prénatal de la trisomie 21 au chapitre V. Cette méthode est parfois appelée PCR semi-quantitative car elle ne permet pas de quantifier précisément un nombre de copies initial d'ADN; cependant c'est une méthode très efficace pour détecter un excès (duplication, trisomie) ou un défaut (délétion, monosomie) de matériel génétique. Réaliser une PCR en temps réel dans laquelle la production du produit de PCR est suivie au cours du temps par son émission de fluorescence. Cette dernière méthode permet de quantifier précisément le nombre de copies initial d'ADN.

a) Recherche de délétions par QMPSF (Quantitative Multiplex PCR of Short Fragments)

Le principe du test est d'amplifier par PCR différents exons du gène à tester dans un même tube à essai (PCR "multiplexe"). La PCR est réalisée en conditions quantitatives, c'est-à-dire que le nombre de cycles est limitant. Chaque exon est amplifié à l'aide d'un couple d'oligonucléotides dont un est marqué par un fluorochrome, de façon à détecter le produit de PCR par fluorescence sur un séquenceur automatique. Les tailles des produits de PCR sont différentes d'un exon à l'autre de façon à pouvoir les identifier. On réalise simultanément la PCR de l'ADN du patient à tester et de l'ADN d'un individu témoin dont on sait qu'il ne porte pas de délétion. La superposition des signaux de fluorescence du témoin et du patient permet de détecter des grandes délétions à l'état hétérozygote. L'exmple ci-dessous montre la recherche de délétion par QMPSF dans le gène ALPL responsable d'une maladie osseuse rare, l'hypophosphatasie, transmise sur le mode récessif autosomique. Six exons (1 [promoteur], 3, 5, 7, 9 et 12) ont été amplifiés dans le même tube. Le signal bleu correspond au témoin, le signal vert correspond à la personne testée (parent ou enfant atteint). On peut voir qu'il ségrège dans cette famille une délétion des exons 3 à 5 retrouvée à l'état hétérozygote chez chaque parent (signal vert deux fois moins intense) et à l'état homozygote chez l'enfant atteint (absence de signal vert).

Page 12: Laboratoire de Génétique Moléculaire Humaine

b) PCR en temps réel

Il existe de nombreuses méthodes de PCR en temps réel. Une méthode fréquemment utilisée est basée sur l'hybridation de sondes porteuses des deux molécules, un fluorochrome en 5' et un extincteur en 3' (sondes "TaqMan"). Le rôle de l'extincteur (ou quencher en anglais) est d'empêcher le fluorochrome d'émettre de la fluorescence lorsqu'il est exité (il y a transfert d'énergie du reporter vers le quencher). Mais pour que cette extinction ait lieu, il faut que l'extincteur et le fluorochrome soient très proches l'un de l'autre, ce qui est le cas sur la sonde, dont la taille est en général d'une quinzaine de nucléotides. Au cours de la PCR la Taq polymérase dégrade la sonde grâce à son activité exonucléasique, libérant le fluorochrome et l'extincteur dans le milieu. Le fluorochrome n'est plus "éteint" par l'extincteur et peut émettre de la fluorescence. La méthode est donc très précise car la fluorescence émise est strictement proportionnelle au nombre de copies synthétisées au cours de la PCR Cette fluorescence est mesurée grâce à des appareils dédiés qui mesurent la fluorescence émise par le fluorochrome au cours du temps.

Page 13: Laboratoire de Génétique Moléculaire Humaine

La quantité d'ADN obtenue après PCR permet donc de déduire de façon précise la quantité d'ADN intitiale. On voit sur la figure ci-dessous 4 profils d'amplification en temps réel obtenus avec des quantités variables d'ADN initial, du plus concentré (courbe de gauche) au moins concentré (courbe de

 

Page 14: Laboratoire de Génétique Moléculaire Humaine

c) Génotypage par PCR en temps réel: exemple de la drépanocytose

Le principe est de construire deux sondes TaqMan marquées avec deux fluorochromes différents, complémentaires respectivement de l'allèle normal et de l'allèle muté, et de réaliser une PCR en présence de ces deux sondes. On va donc détecter deux signaux différents correspondant aux produits de PCR de l'allèle normal et de l'allèle muté, visibles par deux courbes d'amplification distinctes. L'intérêt de cette méthode est sa simplicité et sa rapidité, notamment grâce à l'absence d'analyse post-PCR (pas d'électrophorèse).

L'exemple ci-dessous montre le diagnostic moléculaire de la drépanocytose (mutation betaS) à l'aide de cette technique. L'allèle normal betaA est reconnu par une sonde marquée avec le fluorochrome FAM (représenté ici en brun) tandis que l'allèle muté betaS est reconnu par une sonde marquée avec le fluorochrome VIC (repésenté ici en jaune).

Page 15: Laboratoire de Génétique Moléculaire Humaine

Génotype homozygote sain betaA/betaA

 

 

Génotype hétérozygote betaA/betaS

Page 16: Laboratoire de Génétique Moléculaire Humaine

 

 

Génotype homozygote muté betaS/betaS

 

Sommaire

II) LA METHODE DE SOUTHERN

C’est en 1975 que E.M. SOUTHERN proposa une méthode permettant de détecter et de visualiser des fragments d’ADN de toute portion précise du

L’ADN génomique est clivé par une enzyme de restriction qui produit un grand nombre de fragments de restriction (de l’ordre de 106 mais ce chiffre varie selon l'enzyme de restriction utilisée). Le produit de la digestion est ensuite migré sur un gel d’électrophorèse en agarose afin de séparer les fragments de

Page 17: Laboratoire de Génétique Moléculaire Humaine

restriction en fonction de leur taille.

cliquez sur l'image pour l'agrandir

Afin de visualiser le (ou les) fragment(s) d’intérêt, il est nécessaire de réaliser l’hybridation moléculaire entre ces fragments et une sonde moléculaire qui leur est complémentaire. Les conditions nécessaires à cette hybridation moléculaire étant incompatibles avec le support en agarose, SOUTHERN eut l’idée de réaliser une réplique du gel en transférant l’ADN sur un support solide consitué par une membrane de nitrocellulose avant l’hybridation. Ce support est aujourd’hui remplacé par une membrane de nylon. Précédant l’étape de transfert de l’ADN sur une membrane, l’ADN est rendu monobrin à l’aide d’un agent dénaturant (soude NaOH) de façon à ce qu’il puisse ensuite s’hybrider avec la sonde. Le transfert est obtenu par capillarité en déposant le gel d’agarose recouvert de la membrane sur un système qui assure son hydratation. Un courant liquidien ascendant créé à l’aide d’une couche de papier absorbant et d’un poids va permettre le déplacement de l’ADN du gel vers la membrane. A la fin de l’opération qui dure quelques heures, la membrane contient l’ensemble des fragments d’ADN qui étaient contenus dans le gel et aux même positions que dans celui-ci : il s’agit donc d’une réplique exacte du gel d’électrophorèse.

L’ADN génomique transféré est ensuite fixé de façon irréversible sur la membrane par cuisson à 80°C (nitrocellulose) ou irradiation aux UV (nylon). Après une étape dite de préhybridation au cours de laquelle la membrane contenant l’ADN est mise dans les conditions de température, de PH et de salinité nécessaires à l’hybridation, celle-ci est réalisée en mettant en contact l’ADN génomique et la sonde moléculaire marquée à l’aide d’un traceur radioactif ou chimioluminescent. Cette étape d’hybridation est réalisée en milieu liquide et sous agitation. Lorsqu’une molécule d’ADN sonde va rencontrer une molécule d’ADN cible (fragment d’intérêt), la complémentarité des séquences va permettre la réassociation des deux molécules simple brin en une molécule double brin. Après une étape de lavage destinés à éliminer les molécules de sondes marquées qui ne se sont pas hybridées, la membrane est soumise à une autoradiographie qui va permettre la visualisation des fragments d’intérêt.

Page 18: Laboratoire de Génétique Moléculaire Humaine

---cliquer sur les images pour les agrandir

2) Techniques de marquage de l’ADN

les agents de marquageLes agents de marquage ont longtemps été des radioisotopes du phosphore ( 32P) (pour la méthode de Souhtern par exemple) ou du soufre (35S) (pour le séquençage de l’ADN). Ils permettent une détection facile des produits marqués grâce à l’autoradiographie qui consiste à imprégner un film photographique par le rayonnement radioactif. En raison de leur toxicité et des problèmes de gestion des déchets qu’ils génèrent, ils sont maintenant de plus en plus souvent remplacés par d’autres systèmes de marquages dits « froids » car non émetteurs de rayonnements radioactifs :

les marquages à l’aide de fluorochromes : ce sont des molécules cycliques capables d’émettre un rayonnement si elles sont excitées par une source (par exemple un faisceau laser). La longueur d’onde d’émission est spécifique du fluorochrome et est détectable par un système d’analyse (séquenceur

les marquages colorimétriques : il s’agit de réactions enzymatiques entre un substrat branché sur le nucléotide et une enzyme. Le produit de la réaction est coloré et donc détectable.

les marquage par chimioluminescence : il s’agit alors de détecter l’émission de photons émis par des molécules luminescentes qui réagissent sur une molécule branchée (digoxygénine par exemple). Le signal est détecté par autoradiographie.

b- Les différents types de marquageL'agent da marquage utilisé dans ces exemples est le 32P

Le marquage d’oligonucléotides Il est nécessaire dans des méthodes telles que l’hybridation allèle-spécifique (ASO) ou le criblage de banques d’ADNc ou génomiques.Le marquage se fait à l’extrêmité 5’ à l’aide d’une phosphorylation. Si le nucléotide est phosphorylé à cette extrêmité , on le déphosphoryle auparavant à l’aide d’une phosphatase alcaline. On fait ensuite agir la T4 polynucléotide kinase qui va phosphoryler spécifiquement l’extrêmité 5’ de l’oligonucléotide ; le marquage est obtenu en ajoutant dans le milieu de réaction un déoxynucléotide marqué au 32P en position gamma.

Page 19: Laboratoire de Génétique Moléculaire Humaine

: la déphosphorylation peut être également obtenue par la polynucleotide kinase en présence d’ADP en excès.

Le marquage d’ADN double brin par cassure-déplacement ou « nick-translation »

La cassure-déplacement ou nick-translation est une méthode de marquage par la création aléatoire de cassures (nicks) à l’aide d’une DNAse puis réparation de ces cassures à l’aide d’une polymérase en présence de nucléotides marqués. La DNAse utilisée est la DNAse I de E.Coli et la polymérase utilisée est l’ADN polymérase I de E.coli. Cette dernière a deux activités :

une activité 5’->3’ exonuclease qui va agrandir les trous obtenus par la DNAse Iune activité 5’->3’ polymérase qui va reboucher les trous en présence de nucléotides marqués.

L’élimination des nuléotides en 5’ par l’activité exonuclease et leur remplacement en 3’ par l’activité polymérase conduit à un déplacement de la cassure le long de l’ADN d’où le terme de nick-translation.

cliquez sur l'image pour l'agrandir

Le marquage d’ADN double brin par multi-amorçage ou « random priming »

L’ADN à marquer est dénaturé puis hybridé à des oligonucléotides très courts (en général des hexanucléotides) dont les séquences sont variables et aléatoires. Ces amorces vont donc s’hybrider au hasard sur la séquence cible. Le nombre de séquences possibles détermine la fréquence d’hybridation sur l’ADN cible. On fait ensuite agir une ADN polymérase en présence de déoxynucléotides dont l’un au moins est marqué.

Page 20: Laboratoire de Génétique Moléculaire Humaine

Cliquer sur l'image

3) Applications de la méthode de Southern

La méthode de SOUTHERN est longue, coûteuse et limitée dans ses possibilités de détecter des mutations. Elle a donc été progressivement remplacée par la PCR. Elle reste néanmoins nécessaire dans certains cas particuliers où la PCR s’avère inefficace, notamment dans les maladies à mutations dynamiques pour lesquelles l’amplification de triplets est trop importante (syndrome de l’X fragile, dystrophie myotonique de Steinert). Elle est aussi utilisée pour rechercher des délétions de tailles importantes (de 100 paires de bases à plusieurs kilobases).

Exemple de la détection d'une délétion

Reprenons le cas du patient hétérozygote pour une délétion de 320 paires de bases présenté précédemment. Il existe nécessairement dans cette région des sites de restriction d'enzymes utilisables pour fractionner l'ADN génomique (par exemple ici Eco RI). Si l'on dispose d'une sonde moléculaire complémentaire de cette région, il est alors possible de détecter cette délétion par la méthode de Southern (figure ci-dessous).

Cliquez sur l'image pour l'agrandir

Exemple d'une mutation dynamique : dystrophie myotonique de Steinert

Exemple d'une délétion : déficit en 21-hydroxylase

4) Analyse de l’expression des gènes : la technique du Northern blotCette technique est directement dérivée de la méthode de Southern et a été appelée pour cette raison Northern blot. L’ARN total extrait d’un tissu ou les ARN messagers préparés à partir d’ARN total dont déposés sur un gel d’agarose et séparés selon leur taille par électrophorèse. Les ARN étant des entités discrètes et de tailles réduites, il n’est pas nécessaire de les fractionner. Le gel d’agarose est ensuite traité de la même façon que dans la méthode de Southern ; les ARN sont hybridés avec une sonde moléculaire, par exemple l’ADNc du gène responsable d’une maladie génétique. Il est possible de cette façon, de quantifier l’expression du gène ou de mettre en évidence des mutations d’épissage ou d’autres anomalies de maturation.

Sommaire

Page 21: Laboratoire de Génétique Moléculaire Humaine

III) LE SÉQUENCAGE DE L’ADN

1) Introduction

Le séquençage de l’ADN consiste à déterminer l’ordre des nucléotides sur la molécule d’ADN. C’est le niveau de résolution le plus élevé pour rechercher la présence de mutations ponctuelles dans un gène. La méthode utilisée aujourd’hui, proposée par F. Sanger en 1977 (prix Nobel de chimie en 1980), repose sur l’utilisation de nucléotides particuliers appelés didéoxynucléotides, qui bloquent la synthèse d’ADN par les ADN polymérases après leur incorporation. Ce bloquage est dû à l'impossibilité qu'ont ces nucléotides de former une liaison phosphodiester avec un autre nucléotide en raison de l'absence du groupement hydroxyle sur le carbone 3'. Depuis 1977, la méthode a considérablement évolué grâce à la mise au point de séquenceurs automatiques et de marquages des nucléotides à l’aide de fluorochromes. Elle est devenue aujourd’hui une technique rapide et fiable utilisée fréquemment dans le diagnostic des maladies héréditaires. Elle reste néanmoins coûteuse et souvent réservée à des gènes constitués d’exons en nombre limités et de petites tailles.

Le fragment d’ADN à séquencer (il peut s’agir par exemple d’un exon du gène d’intérêt) est obtenu par PCR puis mis en présence d’un milieu réactionnel

l’amorce (oligonucléotide) à partir de laquelle la synthèse du néobrin sera réalisée par une ADN polymerase, les 4 déoxynucléotides (dA,dT,dC,dG), les 4 didéoxynucléotides (ddA,ddT,ddC,ddG) marqués chacun par un fluorochrome distinct une ADN polymérase (en général la Taq DNA polymerase).

L’ensemble est soumis à une succession de cycles de polymérisation aucours desquels l’ADN polymérase peut, au niveau de chaque nucléotide de l’ADN matrice, incorporer un déoxynucléotide ou un didéoxynucléotide. Dans le cas où elle incorpore un déoxynucléotide, la synthèse peut continuer, dans le cas contraire elle s’arrête. Ce choix étant aléatoire, chaque base de l’ADN matrice aura statistiquement vu un certain nombre de fois l’incorporation d’un didéoxynucléotide, si bien que le milieu réactionnel contient l’ensemble des molécules néosynthétisées possibles. Ces molécules sont ensuite dénaturées puis migrées dans un gel d’électrophorèse afin d’être séparées selon leur taille. On peut ainsi reconstituer la séquence en analysant la nature du fluorochrome terminant chacun de ces fragments néosynthétisés, du plus petit (premier nucléotide de la matrice) au plus grand (dernier nucléotide de la

cliquez sur l'image pour l'agrandir

Cette analyse est réalisée à l’aide d’un séquenceur automatique : cet appareil est pourvu d’une source laser ou infra-rouge qui excite les fluorochromes portés par les didéoxynucléotides après que les fragments aient migrés sur le gel d’électrophorèse. Cette excitation provoque une émission de lumière à une longueur d’onde dépendant de la nature du fluorochrome.

Une présentation animée (en Anglais) du séquençage de l’ADN est disponible à l’adresse suivante :

Page 22: Laboratoire de Génétique Moléculaire Humaine

http://www.dnalc.org/resources/BiologyAnimationLibrary.htm

3) ApplicationsLes applications du séquençage de l’ADN dans le diagnostic moléculaire des maladies héréditaires sont multiples : dans toute maladie où la mutation est déjà identifiée dans la famille, le séquençage est un moyen simple de faire le diagnostic moléculaire chez les apparentés à risque ou chez le fœtus lors d’une grossesse ultérieure.

La figure ci-dessous donne un exemple de séquençage de l’ADN chez un patient porteur d’une mutation du gène de l’hypophosphatasie (maladie héréditaire récessive autosomique rare) à l’état hétérozygote.

 

Sommaire

IV) LES POLYMORPHISMES DE L’ADN

Il existe d’un individu à l’autre dans les populations humaines des variations de séquence de l’ADN qui ne se traduisent par aucune conséquence pathologique au niveau du phénotype. Ces variations sont appelées polymorphismes. Elles peuvent être dues à des variations de la séquence codante conduisant à une variation au niveau du phénotype (groupes sanguins, couleur des yeux, des cheveux, de la peau) ou ne conduisant à aucune modification du produit du gène (par exemple, une substitution nucléotidique affectant la troisième base d’un codon peut ne pas modifier l’acide aminé) ; enfin, elles peuvent survenir au niveau de la séquence non codante de l’ADN (régions intergéniques et introns). Ces polymorphismes de l’ADN présentent un grand intérêt en génétique humaine où leur étude trouve des applications dans les domaines fondamental (cartographie du génome) et appliqué (empreintes génétiques, diagnostic indirect).Il existe plusieurs catégories de polymorphismes de l’ADN, nous en verrons ici quatre :

1) Les polymorphismes de restriction

La variation de la séquence nucléotidique conduit à la présence facultative d’un site de restriction. Ces polymorphismes sont donc par essence bialléliques. Il existe donc dans la population trois génotypes possibles au locus d’un polymorphisme de restriction.

Page 23: Laboratoire de Génétique Moléculaire Humaine

cliquez sur l'image pour l'agrandir

 

La détermination du génotype au locus d’un polymorphisme de restriction est obtenue par PCR-restriction selon le même principe que ce qui a été vu pour détection de la mutation ßs responsable de la drépanocytose : PCR de la région du génome contenant le site de restriction facultatif suivie d’une digestion

enzymatique par l’enzyme de restriction puis d’une électrophorèse des produits de digestion. Les polymorphismes de restriction sont très nombreux dans le

2) Séquences microsatellites Les séquences microsatellites sont des séquences d’ADN constituées de motifs di, tri ou tétranucléotidiques répétés. Par exemple : (CA)n, (CTT)n, (GTCT)n etc... où n représente le nombre de répétitions de ce motif qui est variable d’un individu à l’autre dans la population. Il s’agit donc ici aussi d’un polymorphisme de la séquence d’ADN où les différents allèles au locus considéré correspondent aux différents nombres de répétitions possibles. Contrairement aux polymorphismes de restriction qui sont nécessairement biallèliques, les microsatellites sont le plus souvent multialléliques. Leur détection est obtenue par PCR du locus contenant la séquence répétée suivie d’une électrophorèse du produit de PCR qui permet de distinguer les allèles en fonction de leur taille.

Exemple d’une séquence microsatellite de type (CA)n à 4 allèles

cliquez sur l'image pour l'agrandir

Comme les polymorphismes de restriction, les séquences microsatellites sont très nombreuses dans le génome.

Multiallélisme et hétérozygotieNous verrons plus loin qu'un polymorphisme est d'autant plus intéressant pour les applications médicales et médico-légales qu'il est trouvé à l'état hétérozygote dans la population générale. Les polymorphismes multialléliques sont donc plus intéressants que les polymorphismes bialléliques car leur taux d’hétérozygotie est souvent très supérieur à celui des loci bialléliques. Le taux d’hétérozygotie d’un locus est la fréquence des individus hétérozygotes à ce locus dans une population donnée.Prenons un locus A biallélique (allèles A1 et A2). Il existe dans la population 3 génotypes possibles : A1A1, A1A2, A2A2. La fréquence des hétérozygotes est 2 x f(A1) x f(A2) et sa valeur maximale est 2 x 0,5 x 0,5 = 0,50.

Prenons maintenant un locus multiallélique B à n allèles (allèles B1, B2, ... Bn) :

Page 24: Laboratoire de Génétique Moléculaire Humaine

On voit sur la figure ci-dessus que:

Nombre de génotypes homozygotes = nNombre de génotypes hétérozygotes = n (n – 1) / 2Ensemble des génotypes possibles = n (n+1) / 2Si n = 8 allèles (situation commune pour une séquence microsatellite), on aura 28 génotypes hétérozygotes pour seulement 8 génotypes homozygotes. On attend donc un taux d’hétérozygotie élevé dont la valeur dépend des fréquences allèliques dans la population. Sa valeur maximale est 1-(8 x 0,125 x 0,125) = 0,875.

3) SNP (Single Nucleotide Polymorphisms)

Ils sont dûs à des substitutions nucléotidiques. Les polymorphismes de restriction sont des SNP particuliers dans la mesure où ils sont détectables par l’utilisation d’enzymes de restriction. Les autres SNPs sont aujourd’hui largement utilisés depuis que leur détection est possible, par exemple par extension d’amorce ou par PCR en temps réel.

La technique de l’extension d’amorce : elle repose sur l’utilisation de didéoxynucléotides marqués par des fluorochromes (voir le chapitre « séquençage de »). Chaque base du didesoxynucléotide est marquée par un fluorochrome qui lui est propre si bien que la nature du signal émis est spécifique de la

base. Après PCR et hybridation du produit de PCR avec un oligonucléotide spécifique de la séquence flanquant en 5’ le polymorphisme à détecter, une ADN polymérase va incorporer le didéoxynucléotide complémentaire du nucléotide potentiellement muté. La nature du signal émis par ce flurochrome indique donc la nature du nucléotide (normal ou muté) au site s’intérêt.

Page 25: Laboratoire de Génétique Moléculaire Humaine

cliquez sur l'image pour l'agrandir

 

La PCR en temps réel (voir chapitre PCR: génotypage par PCR en temps réel).

4) CNV (Copy Number Variations)

Il s'agit de la variation du nombre de copies de segments d'ADN de grande taille, pouvant ou non contenir un ou plusieurs gènes. Ce type de polymorphisme, identifié récemment (2005), est détectable par des méthodes récentes utilisant les puces. Pour l'instant les CNV sont peu utilisés dans les applications diagnostiques, mais leur implication dans certaines pathologies, notamment multifactorielles, les rend de plus en plus intéressants et donc de plus en plus étudiés. Comme les séquence microsatellites, les CNV sont souvent multialléliques, chaque allèle étant représenté par un nombre de copies du segment d'ADN.

Sommaire

V) APPLICATIONS MEDICALES DES POLYMORPHISMES DE L'ADN

1) Diagnostic indirect d'une maladie héréditaire : exemple de la mucoviscidose

Il existe des maladies génétiques pour lesquelles il n’est pas possible de rechercher directement des mutations dans le gène responsable, car ce gène a été localisé dans le génome mais pas identifié (cloné) ; il existe aussi des cas où le gène est identifié mais où aucune mutation n’a pu être trouvée chez un patient atteint de la maladie héréditaire ; c’est le cas parfois dans la mucoviscidose. Cela peut être dû au fait que la mutation est « cachée » dans un intron ou dans une séquence régulant l’expression du gène. Il devient alors impossible de réaliser le diagnostic moléculaire dans la famille par les moyens classiques du diagnostic direct (recherche chez le sujet testé de la présence ou de l’absence de la mutation découverte chez le sujet atteint). Il est alors nécessaire de réaliser le diagnostic de façon indirecte.

Le diagnostic indirect repose sur l’utilisation de l’information génétique apportée par un polymorphisme situé au voisinage du gène (polymorphisme extragénique) ou dans le gène lui-même (polymorphisme intragénique) et non plus par la mutation du gène elle-même, ce qui revient à rassembler l’ensemble des mutations possibles sous un seul allèle (allèle muté). Cette méthode s’applique donc également à la recherche de délétions, de gros réarrangements ou de maladies à triplets. La clé du diagnostic indirect est la liaison génétique qui doit exister entre la mutation du gène et le polymorphisme que l’on appelle alors marqueur moléculaire. La liaison génétique doit être étroite de façon à ce que la recombinaison par crossing-over entre la mutation et son marqueur soit statistiquement improbable; le nombre d’allèles du marqueur doit être important de façon à ce que les allèles mutés soient distinguables des allèles normaux dans la famille à tester.

Deux contraintes essentielles découlent de cette méthode :

la nécessité de disposer dans la famille d’un premier enfant atteint qui va permettre d’identifier les allèles mutésl’absence de certitude sur le résultat du diagnostic : même si la plupart des marqueurs utilisés aujourd’hui sont très liés au gène, voire intragéniques, il demeure toujours un faible risque d’erreur lié à la recombinaison. Le résultat d’un diagnostic indirect est donc toujours probabiliste.

Exemple du diagnostic indirect de la mucoviscidose à l’aide du marqueur KM19

On cherche à connaitre le génotype de l’enfant à naitre dans cette famille où il existe un premier enfant atteint de mucoviscidose.

Page 26: Laboratoire de Génétique Moléculaire Humaine

Pour cela, on extrait l’ADN des parents, de l’enfant atteint et du foetus. On réalise une PCR du locus KM19 qui contient le site de restriction facultatif Pst I et les produits de PCR sont mis en présence de l’enzyme de restriction Pst I ; les produits de digestion sont ensuite déposés sur un gel d’électrophorèse afin d’être analysés.

Dans cette famille, l’allèle muté m est associé à l’allèle K2 (présence du site de restriction) du marqueur puisque l’enfant atteint est homozygote K2 / K2. Chaque parent porte donc un allèle normal N associé à K1 et un allèle muté m associé à K2. Par conséquent, en l’absence de recombinaison par crossing-over entre la mutation et le marqueur, le foetus est ici homozygote sain N / N puisque porteur de deux allèles K1.

Noter que l’association allèle au locus CF – allèle au locus KM19 est aléatoire d’une famille à l’autre, ce qui nécessite l’existence d’un premier enfant dans la famille car c’est celui-ci qui va permettre de déterminer les allèles du locus KM19 associés aux allèles mutés du locus CF.

Les associations allèle au locus CF – allèle au locus KM19 se faisant au hasard dans la population, il existe des familles dans lesquelles le marqueur peut se trouver à l’état homozygote chez un (voire deux) parent(s). Dans ce cas, le diagnostic n’est plus possible car le parent homozygote au locus KM19 transmettra à tous ses descendants le même allèle, qu’il soit associé ou non à l’allèle muté au locus CF.

2) Diagnostic moléculaire de la trisomie 21 par PCR quantitative

Il est possible de sélectionner des marqueurs microsatellites du chromosome 21 particulièrement informatifs, c'est à dire capables de poser le diagnostic de trisomie 21. Par exemple, le locus D21S11 contient une séquence répétée tétranucléotidique complexe du type TCTA ou TCTG qui existe sous 14 formes alléliques différentes dans les populations caucasiennes. La trisomie peut être mise en évidence par la présence chez le sujet testé de trois allèles distincts ou par la présence de deux allèles distincts dont l'un est deux fois plus représenté que l'autre. Ce dernier cas de figure suppose bien sûr que la PCR ait été réalisée dans des conditions quantitatives de façon à ce que le dosage génique soit possible. Le seul cas où le diagnostic n'est pas possible est celui où le

Page 27: Laboratoire de Génétique Moléculaire Humaine

foetus porte 3 chromosomes avec le même allèle du marqueur qui est dit alors non informatif. Il est alors nécessaire de recourir à d'autres marqueurs microsatellites situés sur le même chromosome. Le polymorphisme de ces marqueurs est tel qu'il est rare que plusieurs marqueurs ne soient pas informatifs dans une même famille. Comme nous l'avons vu plus haut l'informativité du marqueur microsatellite dépend essentiellement de son taux d'hétérozygotie; pour qu'un foetus porte au moins deux allèles distincts, il faut que ségrègent au moins deux allèles distincts chez ses parents.

Le diagnostic repose sur l'amplification par PCR des marqueurs microsatellites suivie d'une électrophorèse permettant de distinguer les allèles par leur taille, c'est à dire par le nombre de répétitions qu'ils contiennent:

- Si l'analyse permet de distinguer 3 allèles différant par leurs tailles respectives, le diagnostic moléculaire de la trisomie est qualitativement attesté.

- Si l'analyse ne permet de distinguer qu'un seul allèle, le diagnostic est impossible puisque le résultat serait le même dans le cas d'un foetus non trisomique, homozygote pour l'allèle du marqueur étudié; le marqueur étudié n'est pas informatif et il convient d'entreprendre l'étude d'un autre marqueur .

- Si l'analyse fait apparaître la présence de deux allèles distincts, la distinction d'un foetus trisomique porteur de deux allèles distincts et d'un foetus non trisomique également porteur de deux allèles distincts repose sur le dosage du nombre de copies de chacun de ces allèles. Il est donc nécessaire de réaliser

 quantitative ”.

Cette figure montre, en fonction du nombre de cycles de PCR, les différents résultats possibles lors de la PCR d'une séquence microsatellite du chromosome 21 chez un patient porteur d'une trisomie 21 pour lequel un allèle est en double exemplaire, l'autre en un seul exemplaire.

Si le nombre de cycles de PCR est insuffisant (ici inférieur à 25 cycles), le signal est inexistant. Si le nombre de cycles est compris entre 26 et 31, le signal correspondant à l'allèle deux fois représenté sera 2 fois plus intense que le signal correspondant à l'autre allèle, le diagnostic est possible. Enfin si le nombre de cycles est supérieur à 32, les deux pics auront la même intensité et le diagnostic est impossible.

Page 28: Laboratoire de Génétique Moléculaire Humaine

Les figures ci-dessous montrent deux exemples du diagnostic de trisomie 21 en PCR quantitative. Sur la figure de gauche, deux chromosomes maternels différents ont été transmis à l'enfant trisomique, chacun porteur d'un allèle distinct. Le père apporte un troisième chromosome porteur d'un allèle différent des deux allèles maternels. Dans ce cas, le diagnsotic de trisomie 21 est possible sans avoir recours à la PCR quantitative. Sur la figure de droite, la mère a transmis deux exmplaires du même chromosome porteur de l'allèle (TCTN)26. Le père apporte un allèle différent, (TCTN)31b. Par conséquent, le diagnostic de la trisomie repose sur la différence de signal fluorescent émise par chacun des deux allèles: l'allèle (TCTN)26 d'origine maternelle est deux fois plus intense que l'allèle (TCTN)31b d'origine paternelle.

----------------------------------------

Sommaire

VI) APPLICATIONS MÉDICO-LÉGALES DES POLYMORPHISMES DE L'ADN

Les tests d’identité ou de paternité utilisent l’information apportée par les microsatellites qui, comme nous l’avons vu, présentent de nombreux allèles dans la population et sont donc variables d’un individu à l’autre. De plus, les microsatellites sont très nombreux et distribués de façon régulière dans le génome, si bien que la probabilité de trouver deux individus portant sur l’ensemble de ces loci les mêmes génotypes est quasi-nulle, ce qui revient à dire que l’ensemble des génotypes d’un individu est unique et constitue sa “ signature ” individuelle ou sa “ carte d’identité ” génétique.Le test d’identité consiste à calculer la probabilité que deux prélèvements distincts (par exemple une tâche de sang trouvée sur les lieux d’un crime et le prélèvement de sang d’un suspect) soient issus d’un même individu en comparant les allèles qu’ils portent au niveau de différents marqueurs microsatellites. Cette comparaison peut se faire facilement par une simple électrophorèse de l’ADN après amplification par PCR du locus microsatellite. Le test de paternité consiste à calculer la probabilité que l’enfant et le père présumé portent un allèle en commun par le fait du hasard et non par filiation. Dans les deux cas, le calcul repose sur les fréquences des différents allèles du marqueur microsatellite dans la population. L’utilisation combinée de plusieurs marqueurs permet d’obtenir des risques d’erreurs très faibles (de l’ordre de 10-6 à 10-9). Ce risque d’erreur est nul lorsqu’il y a exclusion d’identité ou de paternité.

2) Tests d’identité

On considèrera un locus microsatellite A avec n allèles possibles A1, A2, ...An de fréquences dans la population testée f(A1), f(A2), ....f(An), et deux individus non apparentés de cette population, X et Y. Si l’on suppose que l’individu X a le génotype Ai / Aj, la probabilité que l’individu Y ait le même génotype que X est :

P(Ai / Aj) = 2 x f(Ai) x f(Aj)

Dans le cas où i = j, c’est à dire si X est homozygote Ai / Ai, cette probabilité devient :

P(Ai / Ai) = f(Ai)2

Page 29: Laboratoire de Génétique Moléculaire Humaine

Cette probabilité est donc la probabilité que X et Y partagent par hasard le même génotype au locus A.

Le raisonnement ci-dessus peut être également fait pour un second locus B, un troisième locus C etc... Supposons que X et Y aient le génotype : A1/A3 ; B2/B6 ; C4/C4 ; La probabilité que les individus X et Y partagent le même génotype par hasard aux loci A,B et C s’écrit :

P = [2 x f(A1) x f(A3) ] x [2 x f(B2) x f(B6)] x f(C4)2

Chacun de ces termes étant inférieur à 1 (et même à 0,5), leur produit tend vers 0 au fur et à mesure que le nombre de termes augmente, c’est à dire que le nombre de loci étudiés augmente. Ce qui revient à dire que plus on va étudier de loci, plus la probabilité que X et Y partagent le même génotype par hasard (probabilité d’exclusion) tend vers 0. Par conséquent, la probabilité que X et Y soient un même individu (probabilité de non exclusion) tend vers 1.

: si X est une tache de sang prélevée sur les lieux d’un crime et Y un suspect, on peut calculer la probabilité que X et Y partagent le même génotype par hasard. Si la tache de sang appartient au suspect, cette probabilité va tendre vers 0 lorsque de nombreux loci auront été étudiés (non exclusion). Si la tache n’appartient pas au suspect, on finira par trouver deux génotypes distincts chez X et chez Y (exclusion).

Remarque importante Les calculs ci-dessus supposent un certain nombre de contraintes qui ne sont pas toujours vérifiées. En particulier, il ne doit y avoir aucune relation d’apparentement entre le suspect et le coupable, si ce dernier est différent du suspect. En fait, cette contrainte est rarement vérifiée puisqu’il est toujours possible de supposer que deux individus ont hérité par ascendance (même très éloignée) d’un même allèle. Ainsi, deux personnes d’un même village qui ne se connaissent pas de lien de parenté peuvent en fait avoir en commun par ascendance un certain nombre d’allèles. Et évidemment, deux personnes apparentées, cousins, frères-soeurs etc... ont un grand nombre d’allèles en commun. Si par exemple le vrai coupable est le frère du suspect, celui-ci va posséder un profil génétique proche du coupable et le calcul tendra vers la non exclusion. La prise en compte d’apparentements possibles conduit à un calcul de la probabilité d’exclusion plus complexe. Ce calcul ne sera pas développé ici.

3) tests de paternité

On considèrera encore le locus microsatellite A avec n allèles possibles A1, A2, ...An de fréquences dans la population testée f(A1), f(A2), ....f(An), et trois individus, l’enfant X de génotype Ai/Aj, la mère Y de génotype Ai/Ak et le père présumé Z de génotype Aj/Am.

La probabilité que le père présumé Z ait l’allèle Aj par hasard (et non par filiation), c’est à dire la probabilité d’exclusion, dépend de la fréquence de cet allèle dans la population.On va calculer la probabilité que Z porte Aj par hasard dans son génotype, que ce soit à l'état hétérozygote ou à l'état homozygote:Proba de porter un allèle Aj = f(Aj)Proba de ne pas porter un allèle Aj = [1-f(Aj)]

Page 30: Laboratoire de Génétique Moléculaire Humaine

Proba d’être homozygote non Aj ou hétérozytgote sans Aj = [1-f(Aj)]2 Proba que Z porte Aj par hasard :P = 1 – [1-f(Aj)]2 = 2 x f(Aj) – f(Aj)2 Pour plusieurs loci A, B C etc...où le père présumé possède chaque fois un allèle en commun avec l’enfant, on aura P = proba que Z porte Aj, Bi et Ck par

P = [2 x f(Aj) – f(Aj)2]x [2 x f(Bi) – f(Bi)2] x [2 x f(Ck) –f(Ci)2]

On voit qu’ici aussi, cette probabilité tend vers 0 quand le nombre de loci étudiés augmente .

Remarques importantes : ici aussi, ce calcul ne prend pas en compte certaines contraintes, en particulier il ne tient pas compte de l’apparentement possible entre le père présumé et le père biologique si celui-ci est différent du premier.

Exemple de test de paternité (cliquez sur l'image pour l'agrandir)

4) L'ADN mitochondrial

En raison de ses caractéristiques particulières, l'ADN mitochondrial est très utilisé dans le cadre des empreintes génétiques. Il s'agit d'une molécule circulaire de 16,5 kilobases environ possédant deux régions hypervariables appelées HV1 et HV2, donc polymorphes dans la population. Ce polymorphisme est constitué de variations de séquences de types SNP détectées par séquençage de ces régions (Figure).

Carte de l'ADN mitochondrial humain. Les régions hypervariables HV1 et HV2 sont situées dans la région non fonctionnelle D-loop (Displacement-loop).

Page 31: Laboratoire de Génétique Moléculaire Humaine

Comparé à l'ADN nucléaire, l'ADN mitochondrial a des propriétés qui le rendent particulièrement intéressant pour la réalisation d'empreintes génétiques

Il est multi-copies. Une cellule contient seulement deux copies du génome haploide mais contient un grand nombre de mitochondries. Sa détection est donc plus aisée sur des prélèvements pauvres en nombre de cellules.Grâce à la coque mitochondriale particulièrement solide, l'ADN mitochondrial est très résistant, notamment au temps et aux conditions climatiques (humidité, chaleur) qui dégradent l'ADN nucléaire. Il possède des « point chauds » de mutations qui le rendent particulièrement polymorphe. Il obéit à une hérédité maternelle, ce qui permet l'identification d'apparentés maternels même très éloignés (voir plus loin l'exemple de Louis XVII ).

L'ADN mitochondrial a également des inconvénients :

Il est moins informatif (donc moins discriminant) que l'ADN nucléaire Il ne permet pas de distinguer des apparentés maternels

La comparaison des mitotypes (équivalent du génotype de l'ADN nucléaire) est réalisée par séquençage des régions HVR 1 et 2 de l'ADN mitochondrial. L'exemple ci-dessus montre que le prélèvement de l'individu I-3 et le prélèvement de l'individu X ont le même mitotype. On peut calculer la probabilité que X et I-3 partagent le même mitotype s'ils ne sont pas apparentés (probabilité d'exclusion) selon le même principe que pour l'ADN nucléaire, c'est à dire en se basant sur les fréquences des différents mitotypes dans la population générale. Cependant, ce type de calcul présente l'inconvénient majeur de ne pas tenir compte de l'existence du probable déséquilibre de liaison entre les différents loci de la séquence. En effet, la probabilité de trouver l'allèle a et l'allèle b sur un mitotype n'est pas le produit des fréquences des fréquences alléliques de a et b. Pour éviter d'avoir à calculer la fréquence théorique d'un mitotype, celui-ci est directement comparé à une banque de données composée de plusieurs milliers de mitotypes. La fréquence à laquelle est retrouvée le mitotype dans cette banque de données est la probabilité d'exclusion.

Page 32: Laboratoire de Génétique Moléculaire Humaine

Louis XVII, Naundorff et l'urne de la basilique Saint-Denis

Louis XVI et Marie-Antoinette ont eu 4 enfants : Marie-Thérèse Charlotte (1778-1851), future duchesse d'Angoulême, Louis-Joseph Xavier (1781-1789), Louis XVII (1785-1795) et Sophie-Hélène Béatrice (1786). Lorsque Louis XVI puis Marie-Antoinette sont guillotinés en 1793, l'héritier du trône Louis XVII est emprisonné au temple où il meure de tuberculose deux ans plus tard. Cependant une légende tenace veut que Louis XVII ait été substitué en secret avec un autre enfant de façon à le mettre à l'abri. L'enfant mort au temple est-il Louis XVII ? Lors de son décès, le médecin-légiste préleva en cachette son coeur qui fut plus tard conservé dans une urne à la basilique Saint-Denis. C'est à partir d'un prélèvement de ce coeur qu'une analyse moléculaire a montré que l'enfant était bien apparenté à Marie-Antoinette. Les chercheurs ont en effet prouvé que le mitotype retrouvé sur ce prélèvement était un mitotype caractéristique de la lignée de Habsburg, établi deux ans auparavant.

Arbre généalogique de la lignée des Habsburg. En vert sont représentés tous les apparentés par les femmes de Marie-Antoinette. Deux études ont été menées successivement, l'une en 1996, l'autre en 2000. En 1996, le mitotype maternel de la famille de Louis XVII a été obtenu par l'analyse des échantillons de cheveux de deux sœurs de Marie-Antoinette, Johanna-Gabriela et Maria-Josepha (tirés de deux médaillons d'un collier de leur mère), et de deux apparentés maternels encore en vie, Anna de Roumanie et son frère André de Bourbon Parme. Enfin, des échantillons de cheveux de Marie-Antoinette elle-même ont été obtenus. Ils venaient d'une collection privée et d'un document du Prince Henri de Bourbon. Les chercheurs ont montré que le mitotype obtenu à partir des échantillons de cheveux de Marie-Antoinette correspondait à celui trouvé dans les cheveux des deux tantes de Louis XVII. La comparaison de la région hypervariable HV2 des trois sœurs Johanna-Gabriela, Maria-Josepha et Marie-Antoinette avec celles des parents maternels en vie présente toutefois deux différences qui peuvent s'expliquer par le fait qu'au cours des neuf générations qui séparent les trois sœurs de la reine Anna et de son frère, deux mutations sont intervenues du fait de la fréquence de mutation élevée dans cette région. Une fois établi le mitotype des Habsburg, il ne restait plus qu'à le comparer à celui retrouvé sur le prélèvement de coeur de l'enfant, ce qui fut fait en 2000 ; la comparaison montra qu'il s'agissait bien du même mitotype.

Page 33: Laboratoire de Génétique Moléculaire Humaine

Par ailleurs, la légende de cette substitution conduisit de nombreux imposteurs à se prétendre Louis XVII, le plus fameux (et le plus crédible) étant le Prussien Naundorff. Lors de l'étude de 1996, il fut possible de montrer que le mitotype de Naundorff obtenu à partir d'un fragment osseux prélevé lors d'une exhumation en 1950 ne pouvait pas correspondre à celui des Habsburg, ce qui excluait que Naundorff put être Louis XVII.

Sommaire

VII) LE CLONAGE BACTÉRIEN

Le principe du clonage bactérien est d’isoler à des fins d’amplification et/ou de manipulation un fragment d’ADN en l’insérant dans un vecteur capable de se multiplier dans les bactéries. Les vecteurs utilisés dans le clonage bactérien peuvent être des plasmides, des bactériophages ou des cosmides. L’insertion dans le vecteur est réalisée à l’aide d’enzymes de restriction qui permettent la linéarisation du vecteur (le site de restriction doit être unique dans le vecteur). Le fragment d’ADN à cloner peut être alors inséré- si ses extrémités sont cohésives et compatibles avec les extrémités du vecteur linéarisé. En pratique le fragment à cloner est lui-même issu d’une digestion enzymatique par la même enzyme de restriction que celle qui a linéarisé le vecteur (figure ci-dessous).- si l'enzyme de restriction utilisée pour linéariser le vecteur et pour digérer l'ADN à cloner a généré des extrêmités franches. Dans ce cas, l'enzyme utilisée peut être différente pour le vecteur et pour l'ADN à cloner.

Page 34: Laboratoire de Génétique Moléculaire Humaine

cliquez sur l'image pour l'agrandir

Les liaisons phosphodiester entre le fragment à cloner (appelé insert) et le vecteur sont créées à l’aide d’une enzyme particulière, la ligase (réaction de ligation). On utilise généralement la T4 DNA ligase issue du bactériophage T4. Le mélange de ligation est ensuite mis en présence de bactéries de façon à ce que le vecteur avec éventuellement l’insert pénètre dans la bactérie pour s’y multiplier : c’est la transformation bactérienne.

cliquez sur l'image pour l'agrandir

2) La sélection

La ligation puis ensuite la transformation bactérienne ne sont pas efficaces à 100%, c’est à dire que des vecteurs peuvent ne pas posséder d’insert après ligation et des bactéries peuvent ne pas avoir reçu de vecteurs après transformation. Il faut donc pouvoir distinguer ces différentes espèces.

cliquez sur l'image pour l'agrandir

Cette distinction, appelée sélection, va être obtenue à l’aide de gènes particuliers apportés par le vecteur. Dans l’exemple ci-dessous, le vecteur possède un gène de résistance à un antibiotique, l’ampicilline, qui va permettre de distinguer les bactéries qui ont reçu le vecteur (devenues résistantes à l’ampicilline) des bactéries qui n’ont pas reçu le vecteur et qui sont naturellement sensibles à cet antibiotique. Par ailleurs, le site d’insertion de l’insert est situé à l’intérieur du gène de la ß-galactosidase. L’insertion va donc couper ce gène qui ne fonctionnera plus.

Page 35: Laboratoire de Génétique Moléculaire Humaine

cliquez sur l'image pour l'agrandir

Il est donc possible de distinguer les vecteurs qui ont inséré un fragment d’ADN de ceux qui n’ont rien inséré mais se sont re-circularisés à l’aide de la ligase, simplement en testant le fonctionnement de la ß-galactosidase. Ceci est réalisé en additionnant le milieu de culture des bactéries d’un substrat de l’enzyme qui, lorsque celle-ci fonctionne, est transformé en un produit qui colore les colonies bactériennes en bleu.

3) Applications

Les applications du clonage bactérien sont très variées, bien que cette méthode ait été remplacée par la PCR pour certaines d'entre elles. Par exemple on peut utiliser le clonage bactérien pour préparer une sonde moléculaire dans la méthode de Southern, pour produire certaines protéines (médicaments, polymérases) ou encore pour rechercher un gène dans le génome (clonage positionnel).

Sommaire

Page 36: Laboratoire de Génétique Moléculaire Humaine