diderot paris maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites...

78
Maladies polygéniques/multifactorielles 26 novembre 2018 – 13h30-15h30 L3 Médecine – UE5 Génétique Médicale – Paris Diderot INSERM UMR-S-958 Génétique des diabètes Claire Vandiedonck Maitre de Conférences à Paris Diderot [email protected] Université Paris Diderot Faculté de Médecine Site Villemin 26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 1/78 Claire Vandiedonck - Université Paris Diderot

Upload: others

Post on 13-Oct-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Maladies polygéniques/multifactorielles

26 novembre 2018 – 13h30-15h30

L3 Médecine – UE5 Génétique Médicale – Paris Diderot

INSERM UMR-S-958Génétique des diabètes

Claire VandiedonckMaitre de Conférences à Paris Diderot

[email protected]

Université Paris DiderotFaculté de MédecineSite Villemin

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 1/78

Claire Vandiedonck - Université Paris Diderot

Page 2: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Plan du cours

1. Bases des maladies à hérédité multifactorielle

2. Diversité génétique humaine et déséquilibre de liaison

3. Méthode d’étude de l’hérédité multifactorielle:l’association allélique

4. Bilan des GWAS

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 2/78

Claire Vandiedonck - Université Paris Diderot

Page 3: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

1. Bases des maladies à hérédité multifactorielle

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 3/78

Claire Vandiedonck - Université Paris Diderot

Page 4: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

faux sens: remplacement d’un acide aminé par

un autre

non-sens: remplacement d’un acide aminé par

un codon stop => protéine tronquée

épissage: apparition ou disparition d’un site

donneur ou accepteur d’épissage

modification du cadre de lecture

délétion

expansion de triplets

Rappel: maladies monogéniques/mendéliennes

Mutations délétères (variants pathogènes) d’un seul gène

=> dysfonctionnement du gène

étude par:

• analyse de liaison paramétrique puis clonage positionnel

• et/ou Whole Exome Sequencing (WES) voire Whole Genome Sequencing (WGS)

3 modes de transmission mendélienne autosomique dominant 70%

autosomique récessif 25%

récessif lié au sexe 5 %

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 4/78

Claire Vandiedonck - Université Paris Diderot

Page 5: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Maladies multifactorielles = Maladies à hérédité complexe

Pas (très rarement) de mutations uniques délétères

De multiples facteurs de susceptibilité: combinaison de plusieurs gènes => maladies POLYGENIQUES

effets de l’environnement

interactions gène x environnement

G E

chorée de Huntington

varicellephénylcétonurie hypertension artérielle

Environnement

Génétique

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 5/78

Claire Vandiedonck - Université Paris Diderot

Page 6: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Pourquoi étudier la génétiquedes maladies à hérédité multifactorielle?

Importance des maladies à hérédité complexe en santé publique

prévalence = fréquence dans la population

• cancer• diabète, obésité• maladies cardiovasculaires et AVC• maladies neuropsychiatriques• autoimmunité et inflammation

chronicité

coût des traitements

Objectifs/Enjeux

biologie: comprendre et identifier les mécanismes pathogènes• voies et réseaux de gènes• hétérogénéité de ces maladies

recherche thérapeutique: développer de nouveaux traitements biomarqueurs:

• diagnostic précoce• évolution sévère• prédire la réponse aux traitements

MAIS PAS DE PREDICTION !médecine personnalisée= de précision

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 6/78

Claire Vandiedonck - Université Paris Diderot

Page 7: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Notion d’héritabilité

Attention! un trait familial n’est pas obligatoirement génétique (environnement commun)

Héritabilité:

proportion de la variance phénotypique totale due aux effets génétiques

Var(P) = Var(G) + Var(E) + 2 Cov(G, E)

Héritabilité H² = Var(G)/Var(P)

h2=0 pas d’effet génétiqueOU pas de variabilité génétique

h2=1 pas d’effet de l’environementOU pas de variabilité environementale

Disease H2

Alzheimer 79%

Bipolar depression 77%

Breast Cancer 53%

Crohn’s Disease 55%

Schizophrenia 81%

Type I diabetes 80%

Type II diabetes 42%

Exemples d’héritabilité

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 7/78

Claire Vandiedonck - Université Paris Diderot

Page 8: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Evaluation des composantes génétique et environnementale

Taux de concordance chez les jumeaux =nb de paires concordantes (les 2 sont atteints / nb total de paires)

si discordance chez MZ => existence de facteurs environnementaux

si concordance MZ > concordance DZ => existence de facteurs génétiques

MZ (%) DZ (%)

diabète de type 1 (T1D) 30-50 6

diabète de type 2 (T2D) 80 30

Infarctus myocarde 19 9

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 8/78

monozyogotes

dizygotes

concordance discordance

environnementgénétique

Claire Vandiedonck - Université Paris Diderot

Page 9: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Agents infectieux

Prédisposant

activation polyclonale des lymphocytes: infections chroniques

inflammation associée aux oreillons

réponse anti-virale aux enterovirus : virus cocksackie

tropisme pour les cellules beta du pancreas

mimétisme moléculaire

• protéine virale 2C avec GAD65

• protéine virale VP1 avec IA2

Protecteur

hypothèse de hygiène

modèle murin spontané de diabète= souris NOD (non-obese diabetic):

pathogènes préviennent le diabète => rôle du microbiote

virus

Exemple de facteurs environnementaux dans le DT1

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 9/78

Claire Vandiedonck - Université Paris Diderot

Page 10: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Déclenchant

nourriture: lait de vache, gluten

stress

gestation

produits chimiques: pesticides, médicaments

vaccinations?

Aggravant

déficit en vitamine D

tabagisme

Exemple de facteurs environnementaux dans le DT1

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 10/78

Claire Vandiedonck - Université Paris Diderot

Page 11: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Evaluation de la composante génétique

Etudes d’excès de cas familiaux -> risque relatif familialComparaison des risques de récurrence des apparentés versus la

proportion de cas dans la population générale

ex: facteur λs (λ siblings) pour les apparents au 1er degré

Risque apparenté au 1er degré

Risque population générale

λs

hypertension 20-30 10 2-3

schizophrénie 5-10 1 5-10

polyarthrite rhumatoïde 2-4 0.2-1 5-10

diabète type 1 6 0.4 15

sclérose en plaques 3-5 0.1 20

lupus érythémateux 2-5 0.2 20-40

spondylarthrite ankylos. 12-22 0.5 40

fente labiale 2-5 0.1 20-5026/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 11/78

Claire Vandiedonck - Université Paris Diderot

Page 12: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

PhénotypeSpécificité du phénotypeAge de début parfois tardif

GénotypeMultiplicité des gènesHétérogénéité génétiqueHétérogénéité alléliqueFréquence des allèles morbides

Relation génotype-phénotypeEffet modeste des variantsPleiotropie: effets multiples d’un même variant

=> Problème de puissance pour identifier les variants génétiques prédisposant aux maladies multifactorielles

Complexité de l’étude génotype-phénotypedans les maladies polygéniques

12

3

45

6

12

3

45

6

12

3

45

6

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 12/78

Claire Vandiedonck - Université Paris Diderot

Page 13: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

PatientsContrôles

Mutations Variantsrares

Variantscommuns

Maladiesmendéliennes

Maladies polygéniquesHypothèse CVCD

= common variantfor common disease

Freq(allèle)

1%

Mutation/variant pathogène ou polymorphisme?

Un continuum des maladies mendéliennes aux maladies polygéniques:

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 13/78

Claire Vandiedonck - Université Paris Diderot

Page 14: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Maladies monogéniques versus maladies multifactorielles

monogénique multifactorielle

autre dénomination mendélienne polygénique,à hérédité complexe

prévalence = freq dans la population rare moyenne à forte

agrégation familiale forte faible

nb de gènes causaux 1 * plusieurs

fréquence allèles causaux rare fréquent à rare

pénétrance = proba d’être atteint pour les porteurs des variants

forte faible

=> Méthodes d’analyse différentes

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 14/78

Claire Vandiedonck - Université Paris Diderot

Page 15: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

2. Diversité génétique humaineet déséquilibre de liaison

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 15/78

Claire Vandiedonck - Université Paris Diderot

Page 16: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Génome humain

Génome diploïde (2n)

46 chromosomes (2 x23)

22 paires d’autosomes: chr 1 à chr 22

1 paire de gonosomes = chromosomes sexuels X et Y

ou 2

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 16/78

Claire Vandiedonck - Université Paris Diderot

Page 17: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 17/78

polymorphisme = variant = variation héréditaire de l’ADN= cas des marqueurs génétiquesdiversité génétique: + de 80 millions de variants validés

locus = un endroit donné du génome (ex: marqueur M1)

allèle = chaque forme particulière que prend le polymorphisme d’un locus (ex: allèle A et allèle G au marqueur M1)

génotype: le génome humain est diploïde donc deux allèles par locus = génotype (ex: A/A, A/G ou G/G au marqueur M1)

haplotype: séquence d’allèles à des locus voisins situés sur un même chromosome (en phase = en cis)

(ex: haplotype maternel GTC pour M1-M2-M3)

Polymorphisme génétique

M1

M2

M3

A

T

GC

G

T

A G A A

GA

ATTENTIONNe pas confondre chromosomes homologues et brins + et – de la double hélice de l’ADN. Un allèle/génotype/haplotype peut être donné sur le brin + ou sur le brin –

eg un génotype A/C sur le brin + = génotype T/G sur le brin moins!

Claire Vandiedonck - Université Paris Diderot

Page 18: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Types de marqueurs polymorphes

ctgattagcctcacacacacacacacgctcagacgagt

ctgattagcctcacacacacacacacacacacacgctcagacgagt

ctgattagcctcacacacacacacacacacacacacacgctcagacgagt

electrophorèse

n=7

n=11

n=13

Microsatellites

motif de 2-4 bases répétés: ex (CA)n

multi-alléliques: très informatifs

1 tous les 30 kb

base de la 1ère carte de liaison génétique

parfois difficiles à typer

Variations structurales

• Copy Number Variant (CNV) ~20 000

génotypage possible par puces

• subsititutions de bloc

• inversions

Indels

petites insertions/délétion

SNPs: Single Nucleotide Polymorphisms

bi-alléliques…généralement!

typage automatisé par puce

très haute densité, les + nombreux

nouveaux SNPs détectables par séquençage

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 18/78

Claire Vandiedonck - Université Paris Diderot

Page 19: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Génoypages de marqueurs polymorphes

Par puces

• par hybridation de l’échantillon sur sondes• détection de la fluoresence selon les allèles• rapide• dépend du contenu: variants connus• SNPs, INDELS ou CNVs

Par séquençage

• Sanger ou Nouvelle Génération (NGS)• nouveaux variants détectés y compris rares• difficile pour les insertions/délétions et variations structurales• coûteux et analyse bioinformatique plus lourde• exhaustif• résolution = 1 base

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 19/78

Claire Vandiedonck - Université Paris Diderot

Page 20: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Equilibre de Hardy- Weinberg

Les fréquences alléliques et génotypiques demeurent constantes d’une génération à l’autre

Soit un marqueur polymorphe avec les allèles A et a fréquences alléliques à la génération n et n+1

f(a)=p f(A)=q p+q=1

fréquence génotypiques à la génération n et n+1:

f(aa) = p² f(aA) = 2pq f(AA) = q² p²+2pq+q²=1

Conditions population panmictique = mariages au hasard taille infinie absence de mutations et de sélection

Absence d’équilibre de HW (test de Chi² significatif) mauvaise qualité de génotypage sélection, consanguinité -> importance du choix de la population

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 20/78

Claire Vandiedonck - Université Paris Diderot

Page 21: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Projet 1000 Genomes (2008-2015)Séquençage de 1000 individus par technique haut-débit

www.1000genomes.org

2012: fin de la phase pilote, 1092 genomes

2015: fin du projet, 2504 genomes

Recenser les variants génétiques avec une MAF= Minor Allele Frequency >1%

avec séquençage génome entier 7.4 X

Identifier les variants avec une MAF à 0.1% dans les régions codantes

avec séquençage 65.7 X des exons

Explorer ces variations génétiques dans 26 populations d’origines géographiques variées:

Afrique sub-saharienne 661

Asie de l’Est 504

Europe 503

Sud-Américains 347

Asie du Sud 489

Total = 2504 individus

Projets 1K genomes

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 21/78

Claire Vandiedonck - Université Paris Diderot

Page 22: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Au total

88 millions de SNPs

la moitié de nouveaux SNPs

dont 24% d’Asie du Sud et 28% d’Afrique

3.6 millions d’indels

60 000 variants structuraux

Genome typique

4.1 – 5 millions de sites polymorphes

99.9% de SNPs et petits indels

2100-2500 variants structuraux

160 CNV~20 millions de bases affectées (0.6% du génome)

la plupart sont rares~64 millions avec MAF <0.5%~12 millions avec MAF <5%

Diversité génétique humaine et projet 1K genomes

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 22/78

Claire Vandiedonck - Université Paris Diderot

Page 23: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Variants spécifiques de populations

3% des variants sont:

rares dans la population mondiale (MAF <0.5%)

fréquents dans une population (MAF>5%)

Globalement, plus de variabilité intra-population que inter-populations

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 23/78

Claire Vandiedonck - Université Paris Diderot

Page 24: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Détermination de la phase?

1. Analyse familiale 2. Génome haploïde 3. Méthodesprobabilistiquesdans les populations

A A

C C

A G

C T

A G

C T

Génotypes:

SNP1: A / G

SNP2: T / C

A G

T C

A G

C T

ou ?

Phase connue

Plus facile si :plusieurs marqueursmarqueurs informatifsplusieurs générations

directement dans des cellules haploïdes comme les gamètes:

NGS, facilité par long reads, sur chromosomes marqués ou séparés

reconstruction des phases les plus probables:

Algorithme EM(Expectation-Maximization)

Chaines de Markov cachées

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 24/78

Claire Vandiedonck - Université Paris Diderot

Page 25: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Haplotype et déséquilibre de liaison

dans une famille dans une population

Déséquilibre de Liaisonà la génération g

dans la population

Haplotypes parentaux et recombinants

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 25/78

Claire Vandiedonck - Université Paris Diderot

Page 26: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Le DL: une notion de génétique des populations multi-locus

Les 4 points clés du Déséquilibre de Liaison:

1. associations alléliques préférentielles entre deux locus différents

2. en présence de liaison: les locus sont génétiquement liés

(si les locus ne sont pas liés, on parle de déséquilibre gamétique)

3. détectées à la génération g

4. dans une population

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 26/78

Claire Vandiedonck - Université Paris Diderot

Page 27: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Le DL: une notion de génétique des populations centenaire !

further reading:

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 27/78

Claire Vandiedonck - Université Paris Diderot

Page 28: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Déséquilibre de liaison (DL) Soient 2 locus A et B liés = sur un même chromosome (note: si chromosomes différents = on parlera de déséquilibre gamétique):

locus A: allèles A et a de fréquence f(A) = p et f(a) = (1-p)

locus B: allèles B et b de fréquence f(B) = q et f(b) = (1-q)

fréquences mesurées dans une population de sujets non apparentés

A

B

a

b

Définition du Déséquilibre de liaison (DL)( = association allélique)

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 28/78

Claire Vandiedonck - Université Paris Diderot

Page 29: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Déséquilibre de liaison (DL) Soient 2 locus A et B liés = sur un même chromosome (note: si chromosomes différents = on parlera de déséquilibre gamétique):

locus A: allèles A et a de fréquence f(A) = p et f(a) = (1-p)

locus B: allèles B et b de fréquence f(B) = q et f(b) = (1-q)

fréquences mesurées dans une population de sujets non apparentés

A

B

a

b

A

B

A

b

a

B

a

b

Il existe 4 HAPLOTYPES possibles dans la population:

Définition du Déséquilibre de liaison (DL)( = association allélique)

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 29/78

Claire Vandiedonck - Université Paris Diderot

Page 30: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Déséquilibre de liaison (DL) Soient 2 locus A et B liés = sur un même chromosome (note: si chromosomes différents = on parlera de déséquilibre gamétique):

locus A: allèles A et a de fréquence f(A) = p et f(a) = (1-p)

locus B: allèles B et b de fréquence f(B) = q et f(b) = (1-q)

fréquences mesurées dans une population de sujets non apparentés

A

B

a

b

A

B

A

b

a

B

a

b

Fréquencesà l’équilibre:

p q

Il existe 4 HAPLOTYPES possibles dans la population:

p (1- q) (1-p) q (1-p) (1–q)

Définition du Déséquilibre de liaison (DL)( = association allélique)

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 30/78

Claire Vandiedonck - Université Paris Diderot

Page 31: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Déséquilibre de liaison (DL) Soient 2 locus A et B liés = sur un même chromosome (note: si chromosomes différents = on parlera de déséquilibre gamétique):

locus A: allèles A et a de fréquence f(A) = p et f(a) = (1-p)

locus B: allèles B et b de fréquence f(B) = q et f(b) = (1-q)

fréquences mesurées dans une population de sujets non apparentés

A

B

a

b

A

B

A

b

a

B

a

b

Fréquencesà l’équilibre:

p q

Il existe 4 HAPLOTYPES possibles dans la population:

p (1- q) (1-p) q (1-p) (1–q)

Il y a déséquilibre de liaison si les allèles des 2 locus ne sont pas associés indépendamment:

D = freq haplotypiques observées – freq à l’équilibre

2 mesures: D’ et r² D’ = 1 (DL complet) si 1 haplotype manquer² = 1 (DL parfait) si seuls deux haplotypes existent

Définition du Déséquilibre de liaison (DL)( = association allélique)

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 31/78

Claire Vandiedonck - Université Paris Diderot

Page 32: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Exemple graphique

Equilibre de liaison Désequilibre de liaison

freq (A) = p = 0.6 et freq (a) = 1-p = 0.4freq (B) = q = 0.8 et freq (b) = 1-q = 0.2

freq (AB) = 0.6 x 0.8 = 0.48 ≠ freq (AB) ≅ 0.6 x 0.717 ≅ 0.43 => DAB ≅ 0.43 – 0.48 = -0.05 -> les allèles A et B sont moins souvent associés que ne le voudrait le hasard, cad qu’à l’équilibre

De même , on trouve DaB ≅ 0.05, DAb ≅ 0.05 -> associations en excèset Dab ≅ -0.05 -> associations en défaut

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 32/78

Claire Vandiedonck - Université Paris Diderot

Page 33: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

A B

Chromosomeancestral

Evolution du DL

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 33/78

Claire Vandiedonck - Université Paris Diderot

Page 34: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

A B

Chromosomeancestral

A B

A b

a B

Mutations

Evolution du DL

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 34/78

Claire Vandiedonck - Université Paris Diderot

Page 35: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

A B

Chromosomeancestral

A B

A b

a B

Mutations

A B

A b

a B

Recombinaison

Evolution du DL

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 35/78

Claire Vandiedonck - Université Paris Diderot

Page 36: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

A B

Chromosomeancestral

A B

A b

a B

Mutations

A B

A b

a B

Recombinaison

A B

A b

a B

a b

Dissipation du DL

Evolution du DL

=> La recombinaison est le principal facteur diminuant le DL

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 36/78

Claire Vandiedonck - Université Paris Diderot

Page 37: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

A B

Chromosomeancestral

A B

A b

a B

Mutations

A B

A b

a B

Recombinaison

A B

A b

a B

a b

Dissipation du DL

a b

Evolution du DL

=> La recombinaison est le principal facteur diminuant le DL

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 37/78

Claire Vandiedonck - Université Paris Diderot

Page 38: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

A B

Chromosomeancestral

A B

A b

a B

Mutations

A B

A b

a B

Recombinaison

A B

A b

a B

a b

Dissipation du DL

a b C

Evolution du DL

=> La recombinaison est le principal facteur diminuant le DL

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 38/78

Claire Vandiedonck - Université Paris Diderot

Page 39: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Evolution du DL

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 39/78

A B

Chromosomeancestral

A B

A b

a B

Mutations

A B

A b

a B

Recombinaison

A B

A b

a B

a b

Dissipation du DL

a b c

=> La recombinaison est le principal facteur diminuant le DL

a b C

Claire Vandiedonck - Université Paris Diderot

Page 40: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Evolution du DL

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 40/78

A B

Chromosomeancestral

A B

A b

a B

Mutations

A B

A b

a B

Recombinaison

A B

A b

a B

a b

Dissipation du DL

A B

A b

a B C

a b c

C

C

=> La recombinaison est le principal facteur diminuant le DL

a b C

Claire Vandiedonck - Université Paris Diderot

Page 41: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Evolution du DL

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 41/78

A B

Chromosomeancestral

A B

A b

a B

Mutations

A B

A b

a B

Recombinaison

A B

A b

a B

a b

Dissipation du DL

DLa c > DLa b=> La recombinaison est le principal facteur diminuant le DL

A B

A b

a B C

a b c

C

C

a b C

Claire Vandiedonck - Université Paris Diderot

Page 42: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Evolution du DL

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 42/78

A B

Chromosomeancestral

A B

A b

a B

Mutations

A B

A b

a B

Recombinaison

A B

A b

a B

a b

Dissipation du DL

DLa c > DLa b

=> mais le DL n’est pas 100% corrélé à la distance physique!=> La recombinaison est le principal facteur diminuant le DL

A B

A b

a B C

a b c

C

C

a b C

Claire Vandiedonck - Université Paris Diderot

Page 43: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Evolution du DL

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 43/78

A B

Chromosomeancestral

A B

A b

a B

Mutations

A B

A b

a B

Recombinaison

A B

A b

a B

a b

Dissipation du DL

DLa c > DLa b

Facteurs démographiques: croissance de la population: DL ↘ (en augmentant le nb de recombinaisons) dérive génétiquemélange et migration de populations

Sélection naturelle effet auto-stop epistasie

=> mais le DL n’est pas 100% corrélé à la distance physique!=> La recombinaison est le principal facteur diminuant le DL

A B

A b

a B C

a b c

C

C

a b C

Claire Vandiedonck - Université Paris Diderot

Page 44: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

intérêts:1. SNP étiquette = "tagging SNP " -> réduction de la liste des SNPs génotypés

2. imputation des génotypes des variants fréquents et rares à partir de SNPs en DL dans un panel de référence (ex: 1Kgenome ou UK10K)

Les SNPs en r² > 0.8 sont redondants

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 44/78

Claire Vandiedonck - Université Paris Diderot

Page 45: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

3. Méthode d’étude de l’hérédité multifactorielle: l’association allélique

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 45/78

Claire Vandiedonck - Université Paris Diderot

Page 46: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Etudes de liaison

bien adaptées pour variants rares à effets forts => peu adaptées pour maladies multifactorielles= étude de la co-ségrégation des marqueurs avec la maladie d’une génération à l’autre dans des familles = étude des méioses

Liaison => Locuséchantillons = familles

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 46/78

Claire Vandiedonck - Université Paris Diderot

Page 47: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Etudes d’association

bien adaptées pour variants frequents à effets faibles = bien adaptées pour maladies multifactorielles= recherche de marqueurs en DL avec le variant causal de la maladie

Association => Allèle

échantillons = cas et contrôles issus d’une population

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 47/78

Claire Vandiedonck - Université Paris Diderot

Page 48: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Etude d’association génétique = cartographie par DL

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 48/78

Principe association de l’allèle morbideau locus de la maladie avec les allèles des marqueurs voisins (génétiquement liés)

=> l’association détectée est indirecte

Variant causal non génotypéVariant génotypé

DL

Claire Vandiedonck - Université Paris Diderot

Page 49: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Etude d’association génétique

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 49/78

Contrôles Cas

Allèle 2 Allèle 2

Allèle 1 Allèle 1

Comparaison des fréquences alléliques entre cas et contrôles avec des contrôles intra-familiaux avec des contrôles pris dans la population générale

Ici: allèle 2 = allèle mineur = associé à la pathologie

Claire Vandiedonck - Université Paris Diderot

Page 50: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Comparaison des fréquences alléliques entre patients et contrôles pour un marqueur donné

non porteur de l’allèle à risque

porteur de l’allèle à risque

Cas Contrôles

test du Chi² à 1ddl sur les observations des comptes des différents allèles

Etude d’association cas / contrôles

cas contrôlesallèle 1 A B

allèle 2 C D

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 50/78

Claire Vandiedonck - Université Paris Diderot

Page 51: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Odds Ratio = rapport des côtes de chaque allèle entre cas et contrôles

l’OR est généralement donné pour l’allèle mineur

estimation de l’Odds Ratio et de son IC à 95%

IC 95% = exp [ ln(OR) ± 1.96 [var(lnOR)1/2]

avec var(lnOR) = (1/a1) + (1/a2) + (1/b1) + (1/b2)

Estimation des Odds Ratios

cas contrôlesallèle 1 A B

allèle 2 C D

𝑂𝑅 𝑝𝑜𝑢𝑟 𝑙′𝑎𝑙𝑙è𝑙𝑒 𝑛°1 =(𝑁𝑏 𝐴𝑙𝑙𝑒𝑙𝑒 1

𝑐𝑎𝑠𝑐𝑜𝑛𝑡𝑟ô𝑙𝑒𝑠

)

(𝑁𝑏 𝐴𝑙𝑙𝑒𝑙𝑒 2𝑐𝑎𝑠

𝑐𝑜𝑛𝑡𝑟ô𝑙𝑒𝑠)=(𝐴/𝐵)

(𝐶/𝐷)=𝐴𝑥𝐷

𝐶𝑥𝐵

OR > 1 => allele 1 sur-repésenté prédispose = allèle de risque OR < 1 => allele 1 sous-représenté = allèle protecteur

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 51/78

Claire Vandiedonck - Université Paris Diderot

Page 52: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

L’allèle associé du marqueur est l’allèle causal (allèle fonctionnel)

allèle causal --> Maladie

L’allèle associé est en déséquilibre de liaison (DL) avec l’allèle causal

Ou c’est un faux positif !

allèle associé ----- allèle causal --> MaladieDL

Interprétation de l’association

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 52/78

Claire Vandiedonck - Université Paris Diderot

Page 53: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Etude d’association pangénomique (GWAS)

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 53/78

manhattan plot:

-log10(p-value) en function des positions génomiques des SNPs

Zoom sur une région associée

GWAS = Genome-Wide Association StudyPuces de génotypage avec 500 K à 5x106 SNPs

L’association est testée pour chaque SNP

p<5x10-8

norme

internationale

utilisée

Le seuil de décision est corrigé pour les tests multiples par correction de Bonferroni

sur la base de 106 marqueurs

Claire Vandiedonck - Université Paris Diderot

Page 54: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

OR=1.2

OR=1.3

OR=1.5

OR=2

Puissance requiert de grands échantillons

=> Nécessité de regroupements au sein de grandsconsortiums

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 54/78

Claire Vandiedonck - Université Paris Diderot

Page 55: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

2 000 cases for 7 diseases : Bipolar disorder, coronary artery disease, Crohn’s disease, hypertension, rheumatoid arthritis, type I and type II diabetes

3000 controls

Genotyped for the 500 K Affymetrix GeneChip

Le Wellcome Trust Case Control Consortium

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 55/78

Claire Vandiedonck - Université Paris Diderot

Page 56: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

14000 Patients et 3000 contrôles

Nombreux SNPs associés mais leurs effets sont modestes (OR < 1.5)

Le Wellcome Trust Case Control Consortium

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 56/78

Claire Vandiedonck - Université Paris Diderot

Page 57: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Problèmes inhérents aux GWAS

Les populations de cas et contrôles doivent être homogènes

La stratification des populations conduit à des faux positifs =variants de population non associés à la maladie!

Cases Controls

allele1 1 10

allele2 10 100

=> OR=1

Cases Controls

allele1 101 20

allele2 20 101

=> OR=25.2

Cases Controls

allele1 100 10

allele2 10 1

=> OR=1

cases controls

020

4060

8010

0 allele1allele2

cases controls

020

4060

8010

0 allele1allele2

cases controls

020

4060

8010

012

0

Population 1Populations

1+2

Population 2

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 57/78

Claire Vandiedonck - Université Paris Diderot

Page 58: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Analyse en composante principale (ACP)

Évaluation de la stratification de la population

-> choix des sujets appartenant

aux même populations

-> utilisation des vecteurs de

l’ACP comme covariables dans

l’analyse d’association

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 58/78

Claire Vandiedonck - Université Paris Diderot

Page 59: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Calcul de puissance

Le phénotype étudié doit être homogène et spécifique

La population contrôle Variations de fréquences alléliques avec l’origine géographique ou ethnique sont modestes mais comparables à l’amplitude des effets recherchés=> ACP pour détecter les ‘outliers’

Allèles en équilibre de Hardy-Weinberg chez les contrôles

Prise en compte des multiples tests effectués!!!problème des faux-positifs à cause du grand nombre de testscorrection de Bonferroni: seuil fixé à p=5x10-8

FONDAMENTAL: Reproduire les résultats dans une cohorte indépendante

Précautions à prendre pour un GWAS

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 59/78

Claire Vandiedonck - Université Paris Diderot

Page 60: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Réplication des associations indispensable

Essentielle pour confirmer qu’une information est réelle

= même SNP et même allèle de risque

≠ autre allèle dans le même gène

Importance d’utiliser des échantillons de réplication indépendants

crédibilité augmentée si investigateurs multiples

dans le même groupe ethnique initialement

ensuite dans un groupe ethnique différent

idéal mais pas obligatoire car l’allèle peut être population-spécifiqueex: PTPN22*Arg620Trp

associé aux maladies autoimmunes (OR ~1.5-2)

allèle absent dans populations asiatiques

Forest plot

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 60/78

Claire Vandiedonck - Université Paris Diderot

Page 61: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Inconvénient du DL pour la cartographie fine

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 61/78

Marqueur

génétiqueLocus

de maladie

Principe association de l’allèle morbideau locus de la maladie avec les allèles des marqueurs voisins (génétiquement liés)

=> l’association détectée est indirecte, due au DL!

2 objectifs contradictoires liaison d’une région chromosomique:

atout d’un DL fort localisation fine:

inconvénient d’un DL fort

Variant causal non génotypéVariant génotypé

DL

Claire Vandiedonck - Université Paris Diderot

Page 62: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Comment affiner l’association?

Réduire l’étendue du déséquilibre de liaison augmenter la taille des échantillons

=> plus de recombinaisons

tester l’association dans une autre population

fréquences alléliques différentes

haplotypes plus ou moins étendus selon les populations

Densifier les variants dans la région associée par imputation à partir d’un panel de référence

par séquençage en particulier chez les patients

Recourir à des phénotypesintermédiaires

si possible quantitatifs

(ex: âge de début de la maladie, titres d’anticorps,

taux de lipides, expression des gènes…)26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 62/78

génotype trait complexe

Claire Vandiedonck - Université Paris Diderot

Page 63: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Identifier ensuite le variant causal de chaque region associée

Edwards, Am J Hum Genet 201326/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 63/78

Claire Vandiedonck - Université Paris Diderot

Page 64: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Approches intégratives pour identifier le variant causal

Hasin, Genome Biol 2017

Claussnitzer M, N Eng J 2015Smemo S, Nature 2014

Exemple: variant au locus FTO associé au Diabète de type 2

-> rôle du variant sur deux gènes distaux

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 64/78

Claire Vandiedonck - Université Paris Diderot

Page 65: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

4. Bilan des GWAS

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 65/78

Claire Vandiedonck - Université Paris Diderot

Page 66: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Published Genome-Wide Associations through 07/2012Published GWA at p≤5X10-8 for 18 trait categories

NHGRI GWA Catalogwww.genome.gov/GWAStudieswww.ebi.ac.uk/fgpt/gwas/

Bilan des GWAS

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 66/78

Claire Vandiedonck - Université Paris Diderot

Page 67: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Bilan des GWAS

Plus de 1200 variants associés à 165 traits complexes

Effets le plus souvent très modestes: OR ~ 1.2

Variants causaux rarement identifiés: absence de validation fonctionnelle

Manolio, Nat Rev Gen 2013

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 67/78

Claire Vandiedonck - Université Paris Diderot

Page 68: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Effets modestes des variants associés par GWAS

Ex: polyarthrite rhumatoïde

GWAS

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 68/78

Claire Vandiedonck - Université Paris Diderot

Page 69: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Forte association ne signifie pas forte prédiction individuelle

Exemple: HLA-B*27 dans la spondylarthrite ankylosante

fort OR =40

présent chez 80-90% des patients mais aussi chez 7% des témoins

3-4% des B27+ de la population générale développent une SPA

20.1%

75.5%

Fraction attribuable du risque

Résiduelle

B27

GWAS 4.3%

Cortes A et al. Nat Genet 2013

encore 75% non expliquée dans la SPA !!!

Héritabilité manquante

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 69/78

Claire Vandiedonck - Université Paris Diderot

Page 70: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Bilan des GWAS:on continue avec des échantillons de + en + grands!

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 70/78

Claire Vandiedonck - Université Paris Diderot

Page 71: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Génétique des traits complexes : l’hérédité manquante

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 71/78

microbiote

interaction G x Gheterogénéité

interactions G x Eépigenetique

variants struturelsvariants rares

Claire Vandiedonck - Université Paris Diderot

Page 72: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Prudence des interprétations des « séquençages privés »

Attention, on ne peut pas

prédire au niveau individuel le

risque de développer ces maladies

sur la base des associations

rapportées, lesquelles sont

populationnelles

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 72/78

Claire Vandiedonck - Université Paris Diderot

Page 73: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Quelques succès des GWAS !

Visscher PM et al, AJHG 2017, 101, 5-22

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 73/78

Claire Vandiedonck - Université Paris Diderot

Page 74: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Quelques succès des GWAS !

psoriasis associé à l’IL23R => signalisation de la production d’IL17

=> succès du traitement des formes sévères par les anticorps anti-IL17

Langley RG et al, NEJM, 2014

Mease PJ. et al., NEJM 2014

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 74/78

Claire Vandiedonck - Université Paris Diderot

Page 75: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Quelques succès des GWAS !

Comprendre l’inefficacité de certains traitements

allèle G du SNP rs1800693 de TNFRSF1A (récepteur du TNF) associé à la sclérose

en plaques conduit à une forme soluble du récepteur avec un effet antagoniste

au TNF similaire au traitement anti-TNF

traitement anti-TNF inefficace dans la sclérose en plaqueGregory AP, Nature, 2012

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 75/78

Claire Vandiedonck - Université Paris Diderot

Page 76: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Quelques succès des GWAS !

Mieux ajuster les traitements = médecine personnalisée

CYP2C19 = enzyme impliquée dans le métabolisme du clopidogrel = anti-

aggrégant plaquettaire

allèle rs4244285*2 de CYP2C19 associé à un risque accru d’accident

cardiovasculaire= mauvaise métabolisation du clopidogrel

=> administration du clopidogrel en fonction du génotype pour le SNP

rs4244285 chez les patients atteints de syndrome coronarien aigü

Scott, Clin Pharmacol Ther 2011

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 76/78

Claire Vandiedonck - Université Paris Diderot

Page 77: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Polygenic Risk Score (PRS)

Donnerait une prédiction du risque individuel de déveloper le phenotype

PRS = somme des risques des meilleurs allèles de risque des GWAS pondérés par l’amplitude des effets individuels sur le phenotype

PRSj = Σ [βi,discovery * SNPij]

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 77/78

Claire Vandiedonck - Université Paris Diderot

Page 78: Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions

Utilité du PRS en médecine personnalisée

bénéfice avéré du traitement par les statines en prevention du risqué d’infarctus du myocarde

Top percentiles= equivalents à un risque monogénique

Monogénique Polygénique

prévalence 1:200 1:20

risque 3.2 3.6

mode de détection

LDL élevés actuellement non diagnostiqués

intervention réduction desLDL+ contrôle des facteurs de risque

habitudes de vie+ statines

Exemple de l’infarctus du myocarde chez les sujets jeunes:

26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 78/78

Claire Vandiedonck - Université Paris Diderot