polymorphismes carte & liaison gÉnÉtiques laurent villard inserm unité 491 faculté de...
Post on 03-Apr-2015
106 Views
Preview:
TRANSCRIPT
POLYMORPHISMESPOLYMORPHISMESCARTE & LIAISON GÉNÉTIQUESCARTE & LIAISON GÉNÉTIQUES
Laurent VILLARDInserm Unité 491
Faculté de Médecine de La Timone
http://www.team3-u491.net
M1Génétique des Mammifères2006 - LUMINY
1
22POLYMORPHISMESPOLYMORPHISMES
A quelle condition peut-on étudier la transmission des caractères héréditaires ?
La transmission des caractères ne peut être étudiée que si ceux-ci sont POLYMORPHES.
L'ADN humain est polymorphe
Il existe environ 3.500.000 différences entre deux invidivus pris au hasard (0,1% de leur génome)
!
33POLYMORPHISMESPOLYMORPHISMES
Ces variations dans la séquence d'ADN n'ont pas de conséquence pathologiques.
Les polymorphismes sont le résultat de "mutations".
Mutation : changement permanent et transmissible dans le matériel génétique
Ceci implique que "mutation" n'est pas synonyme de "pathologie"
44POLYMORPHISMESPOLYMORPHISMES
Ces variations de séquence peuvent avoir lieu
dans les gènes hors des gènes
avec une conséquence sans conséquence
groupe sanguincouleur des yeux
sans conséquence
synonymes
55POLYMORPHISMESPOLYMORPHISMES
RFLP Restriction Fragment Length Polymorphism
MICROSATELLITES
SNPSingle Nucleotide Polymorphisms
66LES TYPES DE POLYMORPHISMESLES TYPES DE POLYMORPHISMES
Restriction Fragment Length Polymorphism
Suite à la découverte des enzymes de restriction (1973), une technique d’hybridation de sondes marquées va être développée (Southern blot, 1975) pour repérer un fragment de restriction particulier dans un mélange complexe d’ADN.
En 1980, on découvre que certains fragments de restriction n’ont pas la même taille chez tous les individus…
Pourquoi ?
77LES RFLPLES RFLP
Restriction Fragment Length Polymorphism
Site de coupure EcoRI GAATTCCTTAAG
Pas de coupure en cas GACTTCde modification du site CTGAAG
(il s’agit souvent du polymorphisme d’un seul nucléotide)
88LES RFLPLES RFLP
1 2 3 4éle
ctr
op
horè
se
Taille
des f
rag
men
ts d
e r
estr
icti
on
+
-
99LES RFLPLES RFLP
1 2 3 4éle
ctr
op
horè
se
+
-
Taille
des f
rag
men
ts d
e r
estr
icti
on
1010LES RFLPLES RFLP
ADN
PCR
DigestionEnzymatique
Électrophorèse
Site de restriction
Site variable
Amorce PCR
1,2 : Homozygotes
3 : Heterozygote
*
*
1 2 3
1111LES RFLPLES RFLP
Découverts en 1989, ce type de marqueurs polymorphe va petit à petit remplacer les RFLP.
Il s'agit de séquences d'ADN constituées de motifs répétés avec 2, 3 ou 4 nucléotides :
nnnnnnCACACACACACACACACACACACACAnnnnnnnn
nnnnnnGTTGTTGTTGTTGTTGTTGTTGTTGTTnnnnnnnn
nnnnnnATGGATGGATGGATGGATGGATGGATGGnnnnn
nb variable de répétitions
1212LES MICROSATELLITESLES MICROSATELLITES
nb variable de répétitions
nb variable de répétitions
Les microsatellites sont des marqueurs multi-alléliques
Allèle 1
…nnnnnnnnCACACACACACACACACAnnnnnnnnnnnn……nnnnnnnnCACACACACACACACACAnnnnnnnnnnnn…
Allèle 2
…nnnnnnnnnCACACACACACACACACACACACACAnnnnnnn……nnnnnnnnnCACACACACACACACACACACACACAnnnnnnn…
Allèle 3
…nnnnnnnnnnCACACACACACACACACACACAnnnnnnnn……nnnnnnnnnnCACACACACACACACACACACAnnnnnnnn…
9 répétitions (CA)
13 répétitions (CA)
11 répétitions (CA)
1313LES MICROSATELLITESLES MICROSATELLITES
Chromosome
(CA)n variable (locus polymorphe)
Fragments d’ADN amplifiés
ÉlectrophorèseGrands
Petits
1 2 3 4 5
CACACACACACA
6 allèles détectés
1414LES MICROSATELLITESLES MICROSATELLITES
Les marqueurs multi-alléliques sont plus intéressants pour les applications médicales ou légales que les marqueurs bi-alléliques.
Pourquoi ?
1515LES MICROSATELLITESLES MICROSATELLITES
Le pourcentage d'hétérozygotie dans la population générale sera plus important que celui des marqueurs bi-alléliques.
Locus bi-allélique : A1, A2 (n = 2)
3 génotypes possibles : A1A1, A1A2, A2A2
Fréquence des hétérozygotes = 1 - (n x f(A1) x f(A2))= 1 - (2 x 0,5 x 0,5) = 0,5
50% d'hétérozygotes au maximum
1616LES MICROSATELLITESLES MICROSATELLITES
Locus multi-allélique : A1, A2, A3, A4….. An (n allèles)
Nombre de génotypes homozygotes = n
Nombre de génotypes possibles = n x (n+1) / 2
Pour un marqueur à 8 allèles = 8 x (8+1) / 2 = 36 génotypes(avec seulement 8 génotypes homozygotes)
Fréquence des hétérozygotes = 1 - (8 x 0,125 x 0,125)= 0,875
87,5% d'hétérozygotes au maximum
1717LES MICROSATELLITESLES MICROSATELLITES
Single Nucleotide Polymorphisms
Allèle A
…AGCATAGCAGCAATCAGCGCAGCAGTCTCTCTTCGCAAGCA……TCGTATCGTCGTTAGTCGCGTCGTCAGAGAGAAGCGTTCGT…
Allèle B
…AGCATAGCAGCAATCAGCACAGCAGTCTCTCTTCGCAAGCA……TCGTATCGTCGTTAGTCGTGTCGTCAGAGAGAAGCGTTCGT…
1818LES SNPLES SNP
La base de données des SNP : dbSNP
Contenu au 29-09-2005
Espèce Nombre de SNP distincts
Homo sapiens 10 430 753
Canis familiaris 3 310 003
Gallus gallus 3 296 472
Mus musculus 1 833 763
Pan troglodytes 1 542 718
1919LES SNPLES SNP
Si un SNP modifie un site de restriction, il génère un RFLP.
Déterminer les allèles présents à un locus = GÉNOTYPER
Combien de génotypes possibles pour :
Un RFLP ?
Un microsatellite à n allèles ?
Un SNP ?
!
2020LES SNPLES SNP
Si un SNP modifie un site de restriction, il génère un RFLP.
Déterminer les allèles présents à un locus = GÉNOTYPER
Combien de génotypes possibles pour :
Un RFLP ? 3 (AA , AB , BB)
Un microsatellite à n allèles ? n x (n+1) / 2
Un SNP ? 3 (AA , AB , BB)
!
2020LES SNPLES SNP
Il existe deux types principaux de cartes :
- les cartes génétiquesles cartes génétiques
les distances sont exprimées en centimorgan (cM)
- les cartes physiquesles cartes physiques
les distances sont exprimées en paires de bases (pb)kilobases (kb) = 1000 pbMégabases (Mb) = 1000 kb
2121CARTOGRAPHIECARTOGRAPHIE
Elle est basée sur l’observation de la transmission des caractères héréditaires.
Les distances génétiques sont le reflet de la fréquence de recombinaison.
Pendant la méïose, les « crossing-over » provoquent l’échange de matériel génétique entre chromosomes homologues.
Plus deux gènes (deux marqueurs) sont proches, moins ils ont de chances d’être séparés par un crossing-over et plus la distance génétique entre eux sera petite.
A B C
A B
C
2222CARTOGRAPHIE GÉNÉTIQUECARTOGRAPHIE GÉNÉTIQUE
Lorsque deux marqueurs sont suffisamment proches pour n’être séparés qu’une fois sur 100, on fixe la distance génétique qui les sépare à 1 centimorgan (1 cM).
Il s’agit d’une mesure équivalente à 1% de recombinaison.
Si deux marqueurs ne sont pas « liés » (i.e. s’ils sont situés sur deux chromosomes différents) ils seront séparés (en moyenne) une fois sur deux. La fréquence de recombinaison maximale est donc de 50% (0,5).
2323CARTOGRAPHIE GÉNÉTIQUECARTOGRAPHIE GÉNÉTIQUE
L’étude des familles humaines permet de déterminer le
mode de transmission des caractères héréditaires
(pas forcément des maladies mais aussi de n’importe quel
segment d’ADN polymorphe).
2424CARTOGRAPHIE GÉNÉTIQUECARTOGRAPHIE GÉNÉTIQUE
2525CARTOGRAPHIE GÉNÉTIQUECARTOGRAPHIE GÉNÉTIQUE
Ces études permettent de déterminer les fréquences de
recombinaison entre ces caractères et donc de construire
une CARTE GÉNÉTIQUE sur laquelle ces caractères seront
positionnés les uns par rapport aux autres.
Pour être informatives, ces études doivent étudier beaucoup
de méïoses, donc de grandes familles.
Les SNPs ou microsatellites étant polymorphes, leur ségrégation peut être observée dans des familles :
p1 p2 m1 m2
8
4
2
7
5
3
8
10
8
7
8
10
2
4
5
10
2626CARTOGRAPHIE GÉNÉTIQUECARTOGRAPHIE GÉNÉTIQUE
L'établissement et l’utilisation d'une carte génétique L'établissement et l’utilisation d'une carte génétique
permettentpermettent :
1. D'établir des points d'ancrage pour la carte physique
2. D'identifier la région (et le gène) responsable d'une
maladie monogénique donnée
3. D'étudier certaines particularités de la méiose, telle que
la variation de fréquence des recombinaisons :
en fonction du sexe
en fonction de la région du génome
2727CARTOGRAPHIE GÉNÉTIQUECARTOGRAPHIE GÉNÉTIQUE
1987 - Première version (CRI, familles du CEPH)403 marqueurs (RFLP), résolution 10 cM
1992 - Seconde version (Généthon, familles du CEPH)814 marqueurs (microsatellites), résolution 4,4 cM
1992 - Troisième version (NIH, CEPH)1676 marqueurs (microsatellites + RFLP), résolution 3 cM
1994 - Quatrième version (Généthon)2066 marqueurs (microsatellites), résolution 2,9 cM
1996 - Cinquième version (Généthon)5264 marqueurs (microsatellites), résolution 1,6 cM
2828CARTOGRAPHIE GÉNÉTIQUECARTOGRAPHIE GÉNÉTIQUE
Les cartes disponibles ont principalement été construites en utilisant 40 grandes familles, collectées par le Centre d’Etude du Polymorphisme Humain (CEPH, Paris).
3- observation des recombinaisons entre les marqueurs proches afin de confirmer leur ordre
2- calcul des fréquences de recombinaison entre les marqueurs
1- génotypage de tous les individus pour déterminer les allèles présents au marqueur étudié chez ces individus.
2929CARTOGRAPHIE GÉNÉTIQUECARTOGRAPHIE GÉNÉTIQUE
3030CARTOGRAPHIE GÉNÉTIQUECARTOGRAPHIE GÉNÉTIQUE
Carte génétique basse résolution du chromosome 1
Nomenclature des marqueurs :
D pour DNAN numéro du chromosomeS pour SequenceXXX numéro d’ordre
Pour le chromosome 1
D1S243D1S163 etc…
Pour le chromosome X
DXS441DXS1116 etc…
3131CARTOGRAPHIE GÉNÉTIQUECARTOGRAPHIE GÉNÉTIQUE
LOD (Logarithm of the odds) SCORE (Z)
C’est une valeur déterminée dans le cadre d’une
ANALYSE DE LIAISON GENETIQUE
Il s'agit d'une mesure statistique. C'est le logarithme du rapport des probabilités entre l'hypothèse proposée (liaison génétique) et l'hypothèse contraire (pas de liaison).
Z = log10 LR LR = liaison / non liaison
!
3232ANALYSE DE LIAISON GÉNÉTIQUEANALYSE DE LIAISON GÉNÉTIQUE
Si le lod score est supérieur à 3 (c'est-à-dire que la liaison
est mille fois plus probable que la non-liaison) on tranche,
en général, dans le cas des maladies monogéniques
autosomiques, en faveur de la liaison génétique.
3333ANALYSE DE LIAISON GÉNÉTIQUEANALYSE DE LIAISON GÉNÉTIQUE
Les valeurs inférieures à -2 (100 chances pour 1 contre la liaison génétique) excluent une la liaison génétique.
Une valeur de lod score égale ou supérieure à 2 est acceptée comme étant significative pour le chromosome X.
0-2 +3
Non liaison LiaisonAjouter des familles…
Z
3434ANALYSE DE LIAISON GÉNÉTIQUEANALYSE DE LIAISON GÉNÉTIQUE
I
II
III
A1/A2 A3/A4
A1/A3 A5/A6
A3/A6 A3/A6 A3/A5 A3/A5A1/A6 A1/A6
Recombinant
A1/A5
3535ANALYSE DE LIAISON GÉNÉTIQUEANALYSE DE LIAISON GÉNÉTIQUE
Exemple : test de la liaison entre une pathologie et un marqueur microsatellite
1- Il faut fixer une fraction de recombinaison
= 5% signifie que le gène responsable et le marqueur
considéré resteront liés dans 95 % des méioses observées.
Une recombinaison sera observée dans 5% des méioses.
Cette valeur s’appelle (théta).
varie entre 0 (identité de position) et 0,5 (non liaison).
Si on suppose que le gène responsable et le marqueur sont
au même endroit, elle sera égale à 0.
Sinon, on fixe une fraction de recombinaison : par exemple
5%
3636ANALYSE DE LIAISON GÉNÉTIQUEANALYSE DE LIAISON GÉNÉTIQUE
2- Calcul de la probabilité de liaison
Probabilité de liaison (non recombinaison) entre gène et marqueur
Fraction de recombinaison de 5% = 0,95
Probabilité de liaison « au hasard » = 50% = 0,5
Rapport des probabilités (LR) avec les deux hypothèses = 0.95/0.5 = 1,9
donc un lod score Z = log10(LR) = 0,279 (pour un individu)
3737ANALYSE DE LIAISON GÉNÉTIQUEANALYSE DE LIAISON GÉNÉTIQUE
Probabilité de non liaison (recombinaison) entre gène et marqueur
Fraction de recombinaison de 5% =0,05
probabilité de non liaison « au hasard » = 50% = 0,5
Rapport des probabilités de non liaison (LR) avec les deux hypothèses = 0.05/0.5 = 0,1
donc un lod score
Z = log10 (LR) = -1 (pour un individu)
3838ANALYSE DE LIAISON GÉNÉTIQUEANALYSE DE LIAISON GÉNÉTIQUE
3- Calcul de la probabilité de non liaison
Dans cette famille avec 7 enfants (7 meioses) dont 1 recombinant :
(6 x 0.279) + (1 x (-1)) = Z = 0.674 pour = 0,05 au marqueur A3
3939ANALYSE DE LIAISON GÉNÉTIQUEANALYSE DE LIAISON GÉNÉTIQUE
I
II
III
A1/A2 A3/A4
A1/A3 A5/A6
A3/A6 A3/A6 A3/A5 A3/A5A1/A6 A1/A6
Recombinant
A1/A5
En combinant plusieurs familles il devient possible d'établir
une éventuelle liaison entre le marqueur testé (connu, ici A)
et le gène non connu (responsable de la pathologie) mais qui
sera ainsi localisé si Z > 3.
Les individus recombinants font chuter le lod score =
beaucoup de gamètes recombinants indique que le gène et le
marqueur ont peu de chance d’être liés génétiquement…
(- l’infini à = 0)
4040ANALYSE DE LIAISON GÉNÉTIQUEANALYSE DE LIAISON GÉNÉTIQUE
4141ANALYSE DE LIAISON GÉNÉTIQUEANALYSE DE LIAISON GÉNÉTIQUE
Recombination fraction
Marker 0.00 0.01 0.05 0.10 0.20 0.30 0.40D7S484 -Infinity 2.47 2.68 2.39 1.60 0.83 0.24D7S2449 9.02 8.79 7.86 6.70 4.44 2.39 0.75D7S510 4.43 4.30 3.75 3.06 1.84 0.89 0.24D7S691 5.49 5.32 4.64 3.79 2.18 0.93 0.24D7S667 6.49 6.37 5.79 5.01 3.43 1.90 0.58D7S519 2.37 2.51 2.68 2.56 1.93 1.12 0.32D7S422 -Infinity 2.01 2.68 2.59 1.87 1.04 0.29D7S506 -Infinity 0.77 2.23 2.33 1.71 0.92 0.26D7S2552 -Infinity -0.71 0.86 1.30 1.21 0.72 0.20D7S494 -Infinity -0.58 1.83 2.33 2.00 1.19 0.36D7S502 -Infinity -0.75 1.12 1.61 1.51 0.94 0.28
Le projet HapMap vise à comparer la séquence du génome de
différents individus pour identifier les régions où des variations
génétiques sont partagées.
Le projet est financé par les organismes publics de 6 pays.
L'objectif est de mettre à disposition des chercheurs
l'information qui leur permettra de mettre en évidence des
liens entre variations génétiques et susceptibilité à certaines
maladies.
4242LE PROJET HAPMAPLE PROJET HAPMAP
Populations étudiées :
Idaban (Nigéria) 30 trios (2 parents / 1 enfant)
Tokyo (Japon) 45 individus sans lien de parenté
Beijing (Chine) 45 individus sans lien de parenté
Américains (USA)originaires d'Europe del'Ouest et du Nord 30 trios (2 parents / 1 enfant)
4343LE PROJET HAPMAPLE PROJET HAPMAP
Le projet HapMap veut identifier le maximum de SNP dans le génome humain et établir leurs cartes de répartition dans différentes populations.
Cartographie de la diversité génétique de l'espèce humaine.
Le projet HapMap identifie les haplotypes courants dans 4 populations.Il définit des SNP "marqueurs" qui identifient un haplotype.
Ex : susceptibilité à l'hypertension ?
Quels sont les SNPs hérités en commun chez tous les patients hypertendus ?Le(s) facteur(s) de susceptibilité doivent se trouver proche.
On ne génotypera pas les 10,000,000 de SNP chez chaque individu. On connaît des associations préférentielles de marqueurs proches qui constituent des "haplotypes" de SNP, d'où le nom HapMap.
4444LE PROJET HAPMAPLE PROJET HAPMAP
Les données du projet HapMap permettent des études d'association à grande échelle pour différentes pathologies :
canceraccidents vasculaires cérébrauxmaladies du coeurdiabètehypertension…
A terme
traitements adaptés au profil génétique des individus("pharmacogénomique")
"variants" génétique associés à la longévité, à la résistance aux maladies ?
développement de nouvelles thérapies ?
4545LE PROJET HAPMAPLE PROJET HAPMAP
top related