redondance fonctionnelle ou pourquoi des gènes dupliqués chez les angiospermes ?

33
REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Upload: salome-lasserre

Post on 03-Apr-2015

121 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

REDONDANCE FONCTIONNELLE

ouPourquoi des gènes dupliqués

chez les Angiospermes ?

Page 2: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Comment expliquer l ’observation de mutants “knock-out” ne présentant pas de phénotype ou seulement un phénotype « léger » ?

Page 3: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Plan

I - Mécanismes responsables des duplications

II - Rôle des gènes dupliqués dans la « robustesse » envers les mutations nulles (exemple de la levure)

III - Quelques exemples choisis de redondance

Page 4: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Mécanismes responsables des duplications

Page 5: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

ΜΕΚΚc (ancestral ΜΕΚΚ4 gene)

ΜΕΚΚaΜΕΚΚb

gene transposition/translocation

chimeric disease resistance protein-ΜΕΚΚ1 gene

Athilatransposoninsertion

C.D.HEC GD FA BAncestral

BrassicaceaeMEKK

Arabidopsis ancestral β gene

HEC GD FA B C.D.J E K LC.D.HEC GD FA B F

Brassicagene triplication

ΜΕΚΚa ΜΕΚΚa ΜΕΚΚa

cluster

Short- range duplication

MEKK1

MEKK4

Athilatransposon

MEKK3 MEKK2

Arabidopsis thaliana

Page 6: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

MAP2K

AtMPK3AtMPK6

LmMAP2KLmaMAP2KLPKLiMAP2K77

68

LdMAP2K

100

OsMEK1ZmMEK1AtMKK6NtMEK1

100

99AtMKK1AtMKK2MsPRKLeMEK1NtSIPKK100

5579

100

96

DdMEK1NtNPK2

AtMKK3100

100

97

100

100

CeJKK1CeZC449.3

CeK08A8.1DmHEPHsJNKK2

HsMKK7MmMKK7100

100100

DmMKK4HsMKK4MmMPK2

XlMPK2100100

DmMKK3HsMAPKK3MmMKK3XlMEK3HsMPK6MmMPK6

100

100

43100

100

100

97

94

87

98

85

77

100

96

100

AtMKK10

ZmMAPKK1MsSIMKKNtMEK2AtMKK5AtMKK4100

6099

AtMKK8AtMKK7

AtMKK9100

100

100

92

75

Intronless

II

III

IV

V

Page 7: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Polyploïdie

- La plupart des Angiospermes et 5% des Gymnospermes sont polyploïdes. En général doublement somatique du génome ou non réduction des cellules mères des spores

- Le nombre chromosomique le plus élevé des Angiospermes seraitcelui de Sedum suaveolens (2n = 640), mais 2n = 1260 chez la Fougère Ophioglossum pycnostichum

- La polyploïdisation se poursuit dans le genre Arabidopsis, avec A. suecica (2n=26) qui est un allo-tétraploïde entre A. thaliana et l ’ancêtre d’A. arenosa (2n = 4x = 32)

- Pour les espèces cultivées : 2n = 42 chez le blé tendre, 20 chez le maïs, 52 chez le coton, 48 chez la pomme de terre, 38 chez la vigne

Page 8: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

DA1

e

i

b

c

f

ka

jb

a

g

h

DB1

DC1

DA2

DB2

DC2

kb

c

I

c

c

c

cp

ja

f

lb

la

lc

ld

le

c

g

na

m

m

nc

naoaobnb

nc

oc

od

e

q

jb

jc

r

statb

tc

ta

tb

tc

q

lb

la

lc

ld

le

U1

U2

V1

V2

h

wa

a

wb

r

XA1

XA2

XB1

XB2

YA1

YB1

YA2

YB2

s

oaob

nb

kb

ocod

ka

p

bi

wb

wa

NOR NORRAQ RAQ

Centromere

Segment duplicated on the same chromosome

Segment duplicated on different chromosomes

ja

jc

II III IV V

p

c

o

n

j

m

s

c

q

V

a

RAQ

X

w

l

c

g

h

c

e

f

D

i

k

c

U

r

t

b

Y

NOR

ja

jb

jc

r

statb

tc

c

f

lb

la

c

p

m

naoaobnb

nc

oc

od

e

q

NOR

RAQ

i

ka

jb

g

h

DA2

DB2

DC2

kb

c

ja

jc

lc

ld

le

c

g

m

DA1

e

b

c

f

a

DB1

DC1

c

U1

V1

h

a

YA1

r

XA1

XB1

YB1

YA2

RAQ

tb

YB2

oaob

ta

tcocod na

nc

XA2

XB2

s

nb

wb

wa

q

lb

la

lc

ld

le

U2

V2

wa

wb

kb

ka

p

bi

NOR

Page 9: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

SUCCESSIVE CHROMOSOMALREARRANGEMENTS GENERATE

DUPLICATED SEGMENTS

2n = 4x = 16

2n = 10

Arabidopsis thaliana

WHOLE GENOME DUPLICATION(POLYPLOIDIZATION)

reestablishment of a disomic segregation

BRASSICACEAE ANCESTOR

2n = 2x = 8

fusions / fissions

ROSID II ANCESTORGENOME

POLYPLOIDIZATION

24-40 Mya

about 90/100 Mya

4-5 Mya

LOSS OF PARALOGUE GENES

ANGIOSPERM ANCESTORGENOME

POLYPLOIDIZATIONabout 135 Mya

Page 10: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Les origines d’Arabidopsis

1) Une duplication très ancienne (origine des Angiospermes), une ancienne (100 millions d’années) survenue dans l’ancêtre des Eudicotylédones

2) Une duplication « récente » (24-40 M d’années) du génome d’une Brassicaceae ancestrale :

- passage de 2n = 2x = 8 à 2n = 4x = 16 chromosomes

- perte de 70 % des gènes dupliqués

3) Remaniements chromosomiques (une soixantaine)

4) Fusions centriques (il y a 5 M d’années) réduisant le nombre de chromosomes de n = 8 à n = 5

5) Quelques duplications segmentaires (rDNA, bloc RAQ)

Page 11: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Blanc et al. 2003 (Genome Research)

- 71% du génome d’A. thaliana dans 45 segments dupliqués depuis 24 à

40 millions d’années (âge des Brassicaceae), avec 28 % de gènes

dupliqués, soit # 5800 gènes dupliqués.

- 26 % du génome d’ A. thaliana dans 63 segments dupliqués depuis

près de 100 millions d’années (âge des Rosidae), avec 13,5 % de gènes

dupliqués, soit # 1000 gènes dupliqués.

(Maere et al. 2005 proposent 771, 2765, 3947 gènes conservés)

En 100 Ma 86,5 % des gènes sont éliminés, et en 24-40 Ma 72% des gènes sont éliminés

Un maximum des éliminations de gènes se produisent tôt

Page 12: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Chez les Angiospermes, l’accumulation de paralogues, résulte de divers mécanismes allant d’évènements « locaux » (duplication en tandem) « dispersifs » (duplication à courte distance, insertion d ’un rétrotranscrit, duplication segmentaire) jusqu’à des évènements « de grande ampleur » (duplication chromosomique ou génomique)

Une vue simpliste du résultat de ces mécanismes est la présence de deux copies là où une seule suffisait. Quel est donc l’intérêt de la seconde copie ?

Page 13: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Rôle des gènes dupliqués dans la « robustesse » envers les

mutations nulles (exemple de la levure)

Page 14: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

50

1147 gènes dupliqués

1275 singletons

64,3

11,5

39,5

10,5 11,6 12,4

21,5

29

%

effet du knock-out

effetfaible

effetmodéré

effetfort

létal

50 % singletons - 76 % dupliqués 50 % singletons - 24 % dupliqués

La mutation KO d’un gène de levure en copie unique possède 2 fois plus de chances de présenter un phénotype marqué.

Gu et al., Nature 21 janvier 2003

Page 15: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Ka = distance (non synonyme) avec le gène le plus proche

Ka

Effet

effet faible

effet fort

0 - 0,1

0,94

0,06

0,4 - 0,5

0,72

0,28

> 0,7

0,63

0,37

séquencesdivergentes

séquencesproches

La fréquence décroît avecl’augmentation de Ka

R= -0,95 (P < 0,001)

La fréquence croît avecl’augmentation de Ka

R= 0,94 (P < 0,001)

Il existe une forte corrélation entre la fréquence de complémentationfonctionnelle et la similarité de séquence des deux gènes dupliqués

Relation entre la divergence des protéines (Ka) et l’effet des délétions sur la valeur adaptative

Page 16: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Niveau

d’expression

FORT

FAIBLE

total

72 a

26 b

98

50 a

12 b

62

125

108

233a, b : dans une colonne, les nombres suivis d’une lettre différente indiquent une différence significative au seuil 0,001

Nombre de paires de gènes dont la délétion affecte fortement le phénotype

247

146

393

Nbtotal

effet différent un létal effet similaire

Plus le gène est exprimé, plus sa délétion affecte la complémentation (dans 72 des 98 paires de gènes à effet différent, le plus fort effet sur la

complémentation provient de la délétion du gène le plus exprimé)

NB: chez un allotétraploïde, il n’est pas étonnant que les 2 gènes dupliqués ne s’expriment pas au même niveau, chacun provenant d’une espèce différente.

Page 17: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Chez la levure environ 60 % des gènes compensent les mutations nulles du fait de leur duplication, mais :- des conditions dans lesquelles les singletons ne sont plus compensés peuvent exister- tous les paralogues n’ont pas nécessairement été détectés

Chez A. thaliana, la fréquence des gènes dupliqués est très élevée :

- Il existe 35% de séquences uniques chez A. thaliana contre 55% chez C. elegans, 72% chez D. melanogaster et 71% chez S. cerevisiae

- Les familles de plus de 5 membres constituent 8% des gènes chez S. cerevisiae, 12% chez D. melanogaster, 24% chez C. elegans et plus de 37% chez A. thaliana

Ceci justifie l’importance particulière des gènes dupliqués chez les plantes supérieures, et suggère que la redondance fonctionnelle y soit particulièrement présente.

Page 18: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Divers évènements surviennent rapidement après le doublement du nombre de chromosomes (donc de gènes) :- extinction de gènes : la copie est éteinte par mutation ou par un mécanisme épigénétique. Chez le blé des gènes du groupe A, codant pour des protéines de l’albumen, sont rendus silencieux. L’accumulation de mutations peut produire un pseudogène ou un fantôme.- délétion de gènes- remaniements chromosomiques- subfonctionalisation, fonctions recouvrantes, conservation de la fonction ancestrale, néofonctionalisation

En termes d’interactions entre gènes, il est évident que de nouvelles interactions entre les génomes vont exister (dominance, épistasie). Qui plus est, on a pu noter l’intervention de conversion, de recombinaison inter loci, d’évolution concertée, d’échange chromosomique inter-génomique, d’invasion génomique, de rééquilibrage nucléo-cytoplasmique.

Page 19: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

La présence d’un second gène offre quelques avantages :

- maintien des 2 gènes quand l’accroissement du niveau de transcripts est avantageuse. Les deux cas existent : niveau d’expression corrélé positivement avec le nombre de copies, ou maintenu constant malgré le grand nombre de copies (« dosage-compensation effect »)

- la redondance donne un léger avantage sélectif (à certains moments, dans certaines conditions environnementales,…)

- les gènes dupliqués peuvent être maintenus car pléïotropes, ou parce que cela présente un avantage sélectif (protéines multifonctionnelles, ou éléments de multifonctionalité).

Plus généralement, les espèces polyploïdes présentent :- une très large gamme de gamètes (répartition centromères)- un fort niveau de variation génétique (origines multiples)- une forte hétérozygotie (parents différents)- une faible dépression inbred (présence de plusieurs génomes)

Page 20: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Quelques exemples choisis de redondance

Page 21: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Un exemple simple de redondance : les facteurs de transcription TGA2, 5 et 6

TGA6 (At3g12250)

TGA2 (At5g06950)TGA5 (At5g06960)

duplicationen tandem

bloc dupliqué récent

- les protéines TGA2, TGA5 et TGA6 sont partenaires de NPR1, Non-expressor of Pathogenesis-Related (PR) - le mutant npr1-1 et le triple mutant tga6-1 tga2-1 tga5-1, sont sensibles aux fortes concentrations en acide salicylique (SA)- induction de l’expression des gènes PR et résistance aux pathogènes des simples mutants nuls tga6-1, tga2-1 et tga5-1, et du double mutanttga2-1 tga5-1. Pas d’induction chez le triple mutant tga6-1 tga2-1 tga5-1dont la SAR (systemic acquired resistance) est abolie.

Page 22: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Un exemple de redondance maintenue très longtemps,le facteur de transcription LEAFY (LFY)

- développement floral- 2 paralogues LFYm et LFYf chez les conifères- 1 orthologue de LFYm chez les Angiospermes (et un pseudogène chez Nymphea)

théorie « mostly male »- LFYm et LFYf complémentent le mutant nul lfy d’A. thaliana

Angiospermes

Gymnospermesmonophylétiques

Gnétales

Conifères

Cycadales

Ginkgo

L’ancêtre commun le plus récent des Angiospermes et des Gymnospermes aurait au moins 300 millions d’années.NB : la fleur bisexuée n’a pas plus de 130 millions d’années.

Page 23: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Perception de l’éthylène

Deux familles de récepteurs : . I avec des résidus essentiels pour l’activité his kinase : ETR1, ERS1. II sans ces résidus : ETR2, EIN4, ERS2

- Pas de réponse à l’éthylène chez les simples mutants ponctuels etr1, etr2, ein4, ers1 et ers2. Ce sont des mutants dominants, insensibles à l’éthylène.

- On a recherché des suppresseurs de ces mutants, présentant un phénotype sauvage, que ce soit en présence d’air (allongement normal) ou d’éthylène (triple réponse : racine et hypocotyle courts et larges, courbure apicale exagérée) : etr1-5 (à 8), etr2-3 (et 4), ein4-4 (à 12), ers2-3, ers1-2. Mutants knock-out récessifs, réponse à l’éthylène, donc phénotype sauvage. Le knock-out de ces récepteurs n’entraîne pas une absence de réponse à l’éthylène, mais au contraire la triple réponse. Ilen va de même pour les double et triple mutants comme etr1-6 ein4-4, etr1-6 etr2-3, etr1-6 etr2-3 ein4-4.

Page 24: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

- Seul le quadruple mutant etr1-6 etr2-3 ein4-4 ers2-3 (par ailleurs stérileet nain) retrouve la triple réponse en présence d ’éthylène.

Le double mutant etr1-ers1, le seul qui présente une très forte réponse phénotypique (rosette miniature, fertilité réduite, morphologie florale), n’est pas totalement compensé par la surexpression des récepteurs du groupe II. La famille I présente un rôle différent (interaction avec le domaine régulateur de CTR1).

C2H4

ETR1ERS1ETR2EIN4ERS2

CTR1 réponse

There is a degree of functional redundancy between receptor isoformsHua and Meyerowitz (1998).

Page 25: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Un exemple de fonctions recouvrantes

Glabra 1 (GL1) et Werewolfe (WER) sont des facteurs de transcriptionde type MYB, et ne correspondent pas à des gènes dupliqués

bHLH GL3

GL2

WER GL1

GL2

Pas de poils racinaires Trichomes

TTGTTG WD40

Protéine à homéodomaine

WER et GL1 régulent GL2. La protéine Transparent Testa Glabra (TTG) accroît la production de trichomes à partir de l’épiderme foliaire, et inhibe la formation de poils racinaires à partir de l’épiderme racinaire.

Épidermeracinaire

Épidermefoliaire

WER, exprimé dans lescellules épidermiquesracinaires, réprime laproduction de poils racinaires dans certainesfiles de cellules

GL1, exprimé dans lescellules épidermiquesfoliaires, permet laproduction de trichomes

Page 26: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Les constructions séquence régulatrice WER-protéine GL1 et celle séquence régulatrice GL1-protéine WER permettent, respectivement dans les mutants wer et gl1, de restaurer un phénotype sauvage (i.e. trichomes, pas de poils racinaires). Les protéines GL1 et WER sont interchangeables, mais cette équivalence ne s’étend pas aux autres MYB-R2R3. Dans les deux cas les profils d’expression sont normaux. Ces résultats suggèrent que les différences d’expression observées entre WER et GL1 résultent de leurs séquences régulatrices.

A partir d’un gène MYB ancestral, les ancêtres des gènes WER et GL1 ont séparé leurs profils d’expression, de telle manière que chaque gène fils ne retienne qu’une partie de la fonction ancestrale : - spécification « épiderme foliaire » pour p-GL1- spécification « épiderme racinaire » pour p-WER

Page 27: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?
Page 28: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

AGL1 = SHP1AGL5 = SHP2

AGL11 = STK

Agamous

gènes de gymnospermes

AGL12, 7, 14

100

99

duplication récente 24-40 Ma

duplication ancienne 100 Ma

AGL1, AGL5, Agamous et AGL11 appartiennent au même groupe monophylétique de gènes homéotiques (MADS box). Ce groupe adivergé depuis la séparation des ancêtres des Angiospermes et des Gymnospermes, il y a environ 300 Millions d’années

Un exemple complexe de redondance

Page 29: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

AGAgamous

SHP1, 2Shaterproof

STKSeedstick

Détermination florale

Identité des étamines

Identité des ovules

Identité des carpelles

Déhiscence du fruit

Identité du funicule

Abscissionde la graine

mutants shp1

et shp2, pas de

phénotype

mutant ag, nicarpelles, ni

étamines,fonction C du modèle ABC

mutant stk : les graines ne se détachent pas(fonction D modèle ABCD)

Redondance AG-SHP pour le développement des carpelles, et redondance AG-STK-SHP pour l’identité « ovule »

AG, SHPs, STK qui dérivent d’un même gène ancestral(fonctions C et D), ont conservé des fonctions redondantes,tout en développant des fonctions nouvelles spécifiques

Page 30: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Dans le cas de la levure (S. cerevisiae), on observe l’existence d’un recouvrement fonctionnel dans certains cas, mais la conservation de gènes dupliqués a également eu comme conséquence le fait qu’une des 2 copies se spécialise dans une nouvelle fonction.

La présence d’une seconde copie du gène confère une résistance accrue envers les mutations nulles (i.e. une amélioration de la valeur adaptative).

Outre l’accroissement de complexité dans l’organisation et la structuredu génome, les conséquences fonctionnelles de la duplication sont diverses :- redondance fonctionnelle totale- redondance partielle, fonctions recouvrantes

Page 31: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

USE

IT

OR

LOOSE

IT

Y gene

Y gene

Y' gene

90% lost

10% conserved(457 genes)

duplication

83% functionalredundancy(conversion 13%)

17% neofunctionalization

P1 gene

P1 gene

P2 gene

duplication

P2 gene

P2 gene

P22 gene

duplication

ancientevent

(100 Mya)

recentevent

(24-40Mya)

87% lost

13% conserved(1000 genes)

27% functionalredundancy

73% neofunctionalization

72% lost

28% conserved(6000 genes)

43% functionalredundancy

57% neofunctionalization

YEAST

Arabidopsis

Page 32: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Chez la levure donc, 5000 gènes dupliqués font 10000, mais 90% des dupliqués perdus font 5500 gènes actuels.En fait 457 gènes dupliqués :

- La plupart de ces gènes dupliqués (321 paires) conservent la même fonction, et divergent peu, et 60 paires proviennent de conversion.

- 76 paires montrent une divergence forte des séquences protéiques (accelerated protein evolution) par comparaison avec K. waltii). Dans 95% des cas, une seule des 2 séquences évolue plus vite : 13 kinases, 8 protéines régulatrices……La protéine la plus divergente possède la nouvelle fonction,parfois très éloignée de l’ancienne : ainsi Sir3 (silencing des télomères,…) dérive de la fonction ancestrale de Orc1 (large sous unité du complexe de l’origine de réplication). La délétion du paralogue ancien est létale dans 18% des cas, jamais létale pour le paralogue dérivé. 32 séquences montrent une évolution accélérée des séquences nucléotidiques.

Page 33: REDONDANCE FONCTIONNELLE ou Pourquoi des gènes dupliqués chez les Angiospermes ?

Chez Arabidopsis, 7% des gènes dupliqués sont significativement plus souvent dupliqués que la moyenne (kinases) ou moins souvent dupliqués (DNA repair) :

- Ainsi, au lieu de 72% des gènes dupliqués récemment (24-40 Ma) éliminés, nous observons pour l’ensemble des kinases 33,3 % de gèneséliminés (17.9% pour les kinases qui ne sont ni de type raf ni de typerécepteur kinase, 10% pour les raf, 21,3% pour les RLKs).

- Les gènes dupliqués (polyploïdisation ou tandem) ont en moyenne :1) Une plus longue séquence, 2) plus de domaines protéïques, 3) plus de régions cis-régulatrices, que les singletons. Les gènes complexes seraient plus souvent dupliqués que les autres, car plus « faciles » àsubfonctionaliser.

- La polyploïdisation et plus généralement la duplication de gènes, peut-elle conduire à la duplication d’une voie de signalisation entière,à la duplication d’un complexe ou d’un module de signalisation ? La réponse est très probablement OUI.