Le Diagnostic Génétique Outils et Applications
Pascale Richard
UF Cardiogénétique et Myogénétique
Le contexte du diagnostic moléculaire
Les outils
L’étape clinique • Examiner attentivement
• histoire du patient
• Interroger sur ses antécédents
Définir un phénotype
• L’électromyogramme (EMG)
• L’imagerie musculaire (IRM)
• Le bilan cardiorespiratoire
Les examens
paracliniques
Les examens
biologiques
• La biopsie musculaire
• Constantes biologiques
L’analyse moléculaire
Anomalies de l’ADN
Mutations génomiques: anomalies du nombre des chromosomes
Mutations chromosomiques: réarrangement chromosomique
Mutations géniques: mutation d’une ou plusieurs bases
Sur un même Chromosome
Entre Chromosomes différents
cellule somatique ou germinale
Caryotype
Cytogénétique
Génétique Moléculaire
Maladies génétiques
Maladie récessive
Maladie dominante
Maladie multigénique
Maladie monogénique
Plusieurs gènes mutés
1 gène muté
Gène A
Gène B
Gène C
Gène D
Gène E
ou
Gène K
Gène J
Gène L
Gène P
Gène M
et
génétiquement hétérogènes
GENE
MUTE
Maladie 1
Maladie 2
Maladie 3
L’outil diagnostique est choisi en fonction du type de mutation
Le gène et ses altérations
• Mutations de type substitutions
o EXONIQUES
• Faux sens
• Non sens
o INTRONIQUES
• Sans effet : polymorphismes
• Effet sur l’épissage
• Mutations de type Insertions/délétions
o De petite taille
• Décalant le cadre de lecture
• Ne décalant pas le cadre de lecture
o De grande taille
• D’un ou plusieurs exons
• Du gène entier
100 000 mutations décrites
Identifier la mutation(s)
Séquençage complet du/des gène(s)
1. Exon par exon 2. A partir du cDNA
Recherche de mutation ciblée
1. Mutations récurrentes (SMA, or repeat expansions;
Myotonic dystrophy, OPMD …)
Analyses spécialisées
1. Deletions/duplications d’exons 2. FISH – pour grandes délétions 3. DNA combing & painting
Eg. FSHD
Analyse de liaison: Puces SNPs Dépends de la structure de la famille et du diagnostic de apparentés • Permet d’exclure des gènes • Permet de trouver de nouveau gènes
Long et cher
Limitations Danger des mutations de novo
Pour des gènes spécifiques
Pour des maladies specifiques
Différentes approches
Matériel Biologique ADN Prélèvement sanguin, Cellules Buccales (écouvillon) Cellules amniotiques * Séquençage standard d’un ou plusieurs gènes * Southern Blot
ARNm: Biopsie musculaire, foie, ….. peau (fibroblastes) * Séquençage du cDNA d’un ou plusieurs gènes * Analyse des conséquences d’épissage
Démarche diagnostique 1. Extraction des Acides Nucléiques (ADN / ARN)
2. Amplification des séquences géniques d’intérêt
• Cibler les régions • Augmenter la quantité d’ADN de ces régions
3. Détection d’une anomalie
4. Identification de l’anomalie
Analyse de l’ADN Détection d’anomalies: HRMA
Maladies dominantes: Anomalies Hétérozygotes
• Permet d’analyser de nombreux patients simultanément • Analyse fragment / fragment • Bien adapté a la détection des mutations privées dans les maladies dominantes • Les variants non pathogènes Interfèrent • N’identifie pas la mutation • Cout faible, rapide
Analyse de l’ADN Identification d’anomalies: séquençage
• Adapté aussi bien aux maladies dominantes qu’aux maladies récessives • Distinction immédiate lors de l’analyse des mutations vs polymorphismes • Analyse fragment par fragment et gène par gène
Séquence Normale
Patient
COL6A3
c.6220G>T
p.Gly2074Cys
Ne détecte pas les recombinaisons
Affectant un ou plusieurs exons du gène
Voire le gène entier
Recherche de grands remaniements
La PCR quantitative repose sur l’exploitation
de la cinétique de la PCR qui comprend
o Une phase exponentielle, modélisable
o Une phase en plateau
Ct‘s
Log copy number
Ct
va
lue
s
0 1 2 3 4 5 6 7
Certaines pathologies sont dues a des mutations particulières
qui ne sont pas détectées par le séquençage après amplification:
• Perte de la totalité d’un des deux allèles du gène (recombinaison)
• Perte de 1 ou plusieurs exons sur un allèle
• Duplication partielle ou totale d’un allèle
Amplification simultanée de plusieurs séquences cibles en condition quantitative
QMPSF et MLPA
Analyse de liaison Puces SNPs
• Permet de génotyper de nombreuses variations polymorphes en même temps
• Différentes puces (CHIPS) avec un nombre variable de SNPs
• Enrichissement en SNPs exoniques o Etudes d’association
o Copy number variations
~2.5 million (fixed)
up to 500K (custom)
Une révolution technologique Next generation Sequencing (NGS)
• Aujourd’hui
• Les gènes sont séquencés individuellement et selon une approche séquentielle qui dépends de la clinique
• Le séquençage d’un gène se fait par amplification de chaque exon (500 bp) individuellement
o Long et fastidieux
o Non exhaustif
o Cher en personnels
• Bientôt
o Tout le génome d’un individu
pourra être séquencé en 1 fois
o L’exome (toutes les séquences
codantes) de plusieurs patients
peuvent être séquencés
ensemble (60Mb)
o Plusieurs genes ciblés pour de
nombreux patients peuvent être
séquencés en 1 fois (20Gb)
Séquençage a haut débit de grandes quantités de séquences
• Séquençage simultané de grandes quantités de séquences :
Séquençage haut débit NGS: Next generation sequencing
• 3500 Mb (3,5 milliards de
paires de nucléotides) - haploide
• 27000 à 30000 gènes
• 30 megabases (Mb) • 180 000 exons
• 1% du génome
• 1Kb à 100Kb • 1 à 100 exons • (max 360 exons)
Génome Exome Gène
° Sélectionner les séquences d’intêret
° Les amplifier
° Les séquencer
NGS Amplification multiplex de gènes d’intérêt
0
50
100
150
200
250
300
Exo
n 1
a >
c.2
10
Exo
n2
Exo
n 4
Exo
n 6
Exo
n 8
Exo
n 1
0
Exo
n 1
b>
21
5E
xon
3E
xon
5 m
issi
ng
Exo
n 7
Exo
n 9
Exo
n 1
1E
xon
12
Exo
n 1
a >
c.2
10
Exo
n2
Exo
n 4
Exo
n 6
Exo
n 8
Exo
n 1
0
Sample
Forward reads
Reverse reads
Total
LMNA
NGS Capture des séquences de gènes d’intêret
Choose probes according to
the genes that you want to capture
Fragment your patient(s) DNA(s)
and Tag it(them)
Mix the probes with the patients dans
and purify the targetted sequences
Amplify all the
captured
sequences together
Sequence all the
Amplified
DNA
Bioinformatique Nouvel outil et nouveau métier pour les généticiens moléculaires
• Appliquer les critères de qualité o MQ: Score de qualité de l’alignement (MQ>20)
o QUAL: Score de qualité de détection du variant (QUAL>20)
o DPused: Robustesse de détection du variant (DP>30)
o GQ: score de qualité de l’attribution du génotype (GQ>20)
• Eliminer les régions non ciblées (untargeted) o Intergéniques, Downstream and upstream, 5’UTR et 3’UTR
o Génes non capturés (miRNA, ….)
o Introns ??
• Trier les variants restants en fonction de leur fréquence allèlique o Enlever SNVs de fréquence 0.01 >> 0.99
• Eliminer sous réserve o Variants homozygotes : Attention Chromosome X
o Variants Synonymes : Attention aux sites cryptiques d’épissage
• Interpréter en fonction des scores «in silico»
Validation et tri des variants
Exemples de représentation des résultats
p.Ala1834Thr
Mutation ponctuelle Hétérozygote
Mutation de type Indel
Mutation de type CNVs
Variants faux sens Comment interpréter le rôle pathogène
Cette interprétation n’est pas toujours possible 1. Faux positif: faux diagnostic, faux conseil génétique, faux traitement 2. Empêche d’avancer dans la réflexion de recherche du diagnostic
• Une mutation qui ne change pas l’acide aminé n’est pas toujours un polymorphisme • Un codon stop n’est pas toujours pathogène • des variations faux sens sont souvent des polymorphismes
Le problème n’est pas de trouver des mutations mais de leur attribuer un rôle pathogène en relation avec la maladie
Critères de pathogénicité d’un variant 1. Modification de l’acide aminé (analyses in silico) 2. Région protéique impliquée 3. Région conservée dans l’évolution des espèces 4. Coségrégation familiale si possible 5. Absence dans les bases de données de populations contrôles
Outils
HiSeq 2000
Life Science
Illumina
Roche 454
pyrosequencing
platforms GS FLX: 720 MB
GS Junior: 35MB
PGM: 10 MB to 1 GB
MySeq: 120 MB –7.5 GB
HiSeq: 600 GB
Avantages et limites
• Obtention de la séquence de nombreux gènes simultanément
o Analyse exhaustive des gènes impliqués dans un phénotype
o Diagnostic plus complet et plus rapide
o Cout moindre que l’analyse gène à gène
• Analyse Bioinformatique
• Interprétation des variants identifiés / faux positifs
• Manipulation délicate sans automatisation
• Cout élevé (1000/1500 euros par patient) mais relatif
o Non adapté à l’analyse de mutations ciblées (apparentés, ) o Non adapté à un diagnostic d’urgence (DPN…) o Essential de corréler les variants identifiées avec la clinique, les examens paracliniques
Conclusion
• Le premier outil essentiel est la correcte définition du phénotype
• Collaboration étroite entre praticiens de disciplines complémentaires
• L’analyse génétique est en pleine évolution technologique
• Le diagnostic moléculaire apporte un diagnostic de certitude et est indispensable au conseil génétique, la prise en charge et la thérapeutique éventuelle