redondance fonctionnelle ou pourquoi des gènes dupliqués chez les angiospermes ?
TRANSCRIPT
REDONDANCE FONCTIONNELLE
ouPourquoi des gènes dupliqués
chez les Angiospermes ?
Comment expliquer l ’observation de mutants “knock-out” ne présentant pas de phénotype ou seulement un phénotype « léger » ?
Plan
I - Mécanismes responsables des duplications
II - Rôle des gènes dupliqués dans la « robustesse » envers les mutations nulles (exemple de la levure)
III - Quelques exemples choisis de redondance
Mécanismes responsables des duplications
ΜΕΚΚc (ancestral ΜΕΚΚ4 gene)
ΜΕΚΚaΜΕΚΚb
gene transposition/translocation
chimeric disease resistance protein-ΜΕΚΚ1 gene
Athilatransposoninsertion
C.D.HEC GD FA BAncestral
BrassicaceaeMEKK
Arabidopsis ancestral β gene
HEC GD FA B C.D.J E K LC.D.HEC GD FA B F
Brassicagene triplication
ΜΕΚΚa ΜΕΚΚa ΜΕΚΚa
cluster
Short- range duplication
MEKK1
MEKK4
Athilatransposon
MEKK3 MEKK2
Arabidopsis thaliana
MAP2K
AtMPK3AtMPK6
LmMAP2KLmaMAP2KLPKLiMAP2K77
68
LdMAP2K
100
OsMEK1ZmMEK1AtMKK6NtMEK1
100
99AtMKK1AtMKK2MsPRKLeMEK1NtSIPKK100
5579
100
96
DdMEK1NtNPK2
AtMKK3100
100
97
100
100
CeJKK1CeZC449.3
CeK08A8.1DmHEPHsJNKK2
HsMKK7MmMKK7100
100100
DmMKK4HsMKK4MmMPK2
XlMPK2100100
DmMKK3HsMAPKK3MmMKK3XlMEK3HsMPK6MmMPK6
100
100
43100
100
100
97
94
87
98
85
77
100
96
100
AtMKK10
ZmMAPKK1MsSIMKKNtMEK2AtMKK5AtMKK4100
6099
AtMKK8AtMKK7
AtMKK9100
100
100
92
75
Intronless
II
III
IV
V
Polyploïdie
- La plupart des Angiospermes et 5% des Gymnospermes sont polyploïdes. En général doublement somatique du génome ou non réduction des cellules mères des spores
- Le nombre chromosomique le plus élevé des Angiospermes seraitcelui de Sedum suaveolens (2n = 640), mais 2n = 1260 chez la Fougère Ophioglossum pycnostichum
- La polyploïdisation se poursuit dans le genre Arabidopsis, avec A. suecica (2n=26) qui est un allo-tétraploïde entre A. thaliana et l ’ancêtre d’A. arenosa (2n = 4x = 32)
- Pour les espèces cultivées : 2n = 42 chez le blé tendre, 20 chez le maïs, 52 chez le coton, 48 chez la pomme de terre, 38 chez la vigne
DA1
e
i
b
c
f
ka
jb
a
g
h
DB1
DC1
DA2
DB2
DC2
kb
c
I
c
c
c
cp
ja
f
lb
la
lc
ld
le
c
g
na
m
m
nc
naoaobnb
nc
oc
od
e
q
jb
jc
r
statb
tc
ta
tb
tc
q
lb
la
lc
ld
le
U1
U2
V1
V2
h
wa
a
wb
r
XA1
XA2
XB1
XB2
YA1
YB1
YA2
YB2
s
oaob
nb
kb
ocod
ka
p
bi
wb
wa
NOR NORRAQ RAQ
Centromere
Segment duplicated on the same chromosome
Segment duplicated on different chromosomes
ja
jc
II III IV V
p
c
o
n
j
m
s
c
q
V
a
RAQ
X
w
l
c
g
h
c
e
f
D
i
k
c
U
r
t
b
Y
NOR
ja
jb
jc
r
statb
tc
c
f
lb
la
c
p
m
naoaobnb
nc
oc
od
e
q
NOR
RAQ
i
ka
jb
g
h
DA2
DB2
DC2
kb
c
ja
jc
lc
ld
le
c
g
m
DA1
e
b
c
f
a
DB1
DC1
c
U1
V1
h
a
YA1
r
XA1
XB1
YB1
YA2
RAQ
tb
YB2
oaob
ta
tcocod na
nc
XA2
XB2
s
nb
wb
wa
q
lb
la
lc
ld
le
U2
V2
wa
wb
kb
ka
p
bi
NOR
SUCCESSIVE CHROMOSOMALREARRANGEMENTS GENERATE
DUPLICATED SEGMENTS
2n = 4x = 16
2n = 10
Arabidopsis thaliana
WHOLE GENOME DUPLICATION(POLYPLOIDIZATION)
reestablishment of a disomic segregation
BRASSICACEAE ANCESTOR
2n = 2x = 8
fusions / fissions
ROSID II ANCESTORGENOME
POLYPLOIDIZATION
24-40 Mya
about 90/100 Mya
4-5 Mya
LOSS OF PARALOGUE GENES
ANGIOSPERM ANCESTORGENOME
POLYPLOIDIZATIONabout 135 Mya
Les origines d’Arabidopsis
1) Une duplication très ancienne (origine des Angiospermes), une ancienne (100 millions d’années) survenue dans l’ancêtre des Eudicotylédones
2) Une duplication « récente » (24-40 M d’années) du génome d’une Brassicaceae ancestrale :
- passage de 2n = 2x = 8 à 2n = 4x = 16 chromosomes
- perte de 70 % des gènes dupliqués
3) Remaniements chromosomiques (une soixantaine)
4) Fusions centriques (il y a 5 M d’années) réduisant le nombre de chromosomes de n = 8 à n = 5
5) Quelques duplications segmentaires (rDNA, bloc RAQ)
Blanc et al. 2003 (Genome Research)
- 71% du génome d’A. thaliana dans 45 segments dupliqués depuis 24 à
40 millions d’années (âge des Brassicaceae), avec 28 % de gènes
dupliqués, soit # 5800 gènes dupliqués.
- 26 % du génome d’ A. thaliana dans 63 segments dupliqués depuis
près de 100 millions d’années (âge des Rosidae), avec 13,5 % de gènes
dupliqués, soit # 1000 gènes dupliqués.
(Maere et al. 2005 proposent 771, 2765, 3947 gènes conservés)
En 100 Ma 86,5 % des gènes sont éliminés, et en 24-40 Ma 72% des gènes sont éliminés
Un maximum des éliminations de gènes se produisent tôt
Chez les Angiospermes, l’accumulation de paralogues, résulte de divers mécanismes allant d’évènements « locaux » (duplication en tandem) « dispersifs » (duplication à courte distance, insertion d ’un rétrotranscrit, duplication segmentaire) jusqu’à des évènements « de grande ampleur » (duplication chromosomique ou génomique)
Une vue simpliste du résultat de ces mécanismes est la présence de deux copies là où une seule suffisait. Quel est donc l’intérêt de la seconde copie ?
Rôle des gènes dupliqués dans la « robustesse » envers les
mutations nulles (exemple de la levure)
50
1147 gènes dupliqués
1275 singletons
64,3
11,5
39,5
10,5 11,6 12,4
21,5
29
%
effet du knock-out
effetfaible
effetmodéré
effetfort
létal
50 % singletons - 76 % dupliqués 50 % singletons - 24 % dupliqués
La mutation KO d’un gène de levure en copie unique possède 2 fois plus de chances de présenter un phénotype marqué.
Gu et al., Nature 21 janvier 2003
Ka = distance (non synonyme) avec le gène le plus proche
Ka
Effet
effet faible
effet fort
0 - 0,1
0,94
0,06
0,4 - 0,5
0,72
0,28
> 0,7
0,63
0,37
séquencesdivergentes
séquencesproches
La fréquence décroît avecl’augmentation de Ka
R= -0,95 (P < 0,001)
La fréquence croît avecl’augmentation de Ka
R= 0,94 (P < 0,001)
Il existe une forte corrélation entre la fréquence de complémentationfonctionnelle et la similarité de séquence des deux gènes dupliqués
Relation entre la divergence des protéines (Ka) et l’effet des délétions sur la valeur adaptative
Niveau
d’expression
FORT
FAIBLE
total
72 a
26 b
98
50 a
12 b
62
125
108
233a, b : dans une colonne, les nombres suivis d’une lettre différente indiquent une différence significative au seuil 0,001
Nombre de paires de gènes dont la délétion affecte fortement le phénotype
247
146
393
Nbtotal
effet différent un létal effet similaire
Plus le gène est exprimé, plus sa délétion affecte la complémentation (dans 72 des 98 paires de gènes à effet différent, le plus fort effet sur la
complémentation provient de la délétion du gène le plus exprimé)
NB: chez un allotétraploïde, il n’est pas étonnant que les 2 gènes dupliqués ne s’expriment pas au même niveau, chacun provenant d’une espèce différente.
Chez la levure environ 60 % des gènes compensent les mutations nulles du fait de leur duplication, mais :- des conditions dans lesquelles les singletons ne sont plus compensés peuvent exister- tous les paralogues n’ont pas nécessairement été détectés
Chez A. thaliana, la fréquence des gènes dupliqués est très élevée :
- Il existe 35% de séquences uniques chez A. thaliana contre 55% chez C. elegans, 72% chez D. melanogaster et 71% chez S. cerevisiae
- Les familles de plus de 5 membres constituent 8% des gènes chez S. cerevisiae, 12% chez D. melanogaster, 24% chez C. elegans et plus de 37% chez A. thaliana
Ceci justifie l’importance particulière des gènes dupliqués chez les plantes supérieures, et suggère que la redondance fonctionnelle y soit particulièrement présente.
Divers évènements surviennent rapidement après le doublement du nombre de chromosomes (donc de gènes) :- extinction de gènes : la copie est éteinte par mutation ou par un mécanisme épigénétique. Chez le blé des gènes du groupe A, codant pour des protéines de l’albumen, sont rendus silencieux. L’accumulation de mutations peut produire un pseudogène ou un fantôme.- délétion de gènes- remaniements chromosomiques- subfonctionalisation, fonctions recouvrantes, conservation de la fonction ancestrale, néofonctionalisation
En termes d’interactions entre gènes, il est évident que de nouvelles interactions entre les génomes vont exister (dominance, épistasie). Qui plus est, on a pu noter l’intervention de conversion, de recombinaison inter loci, d’évolution concertée, d’échange chromosomique inter-génomique, d’invasion génomique, de rééquilibrage nucléo-cytoplasmique.
La présence d’un second gène offre quelques avantages :
- maintien des 2 gènes quand l’accroissement du niveau de transcripts est avantageuse. Les deux cas existent : niveau d’expression corrélé positivement avec le nombre de copies, ou maintenu constant malgré le grand nombre de copies (« dosage-compensation effect »)
- la redondance donne un léger avantage sélectif (à certains moments, dans certaines conditions environnementales,…)
- les gènes dupliqués peuvent être maintenus car pléïotropes, ou parce que cela présente un avantage sélectif (protéines multifonctionnelles, ou éléments de multifonctionalité).
Plus généralement, les espèces polyploïdes présentent :- une très large gamme de gamètes (répartition centromères)- un fort niveau de variation génétique (origines multiples)- une forte hétérozygotie (parents différents)- une faible dépression inbred (présence de plusieurs génomes)
Quelques exemples choisis de redondance
Un exemple simple de redondance : les facteurs de transcription TGA2, 5 et 6
TGA6 (At3g12250)
TGA2 (At5g06950)TGA5 (At5g06960)
duplicationen tandem
bloc dupliqué récent
- les protéines TGA2, TGA5 et TGA6 sont partenaires de NPR1, Non-expressor of Pathogenesis-Related (PR) - le mutant npr1-1 et le triple mutant tga6-1 tga2-1 tga5-1, sont sensibles aux fortes concentrations en acide salicylique (SA)- induction de l’expression des gènes PR et résistance aux pathogènes des simples mutants nuls tga6-1, tga2-1 et tga5-1, et du double mutanttga2-1 tga5-1. Pas d’induction chez le triple mutant tga6-1 tga2-1 tga5-1dont la SAR (systemic acquired resistance) est abolie.
Un exemple de redondance maintenue très longtemps,le facteur de transcription LEAFY (LFY)
- développement floral- 2 paralogues LFYm et LFYf chez les conifères- 1 orthologue de LFYm chez les Angiospermes (et un pseudogène chez Nymphea)
théorie « mostly male »- LFYm et LFYf complémentent le mutant nul lfy d’A. thaliana
Angiospermes
Gymnospermesmonophylétiques
Gnétales
Conifères
Cycadales
Ginkgo
L’ancêtre commun le plus récent des Angiospermes et des Gymnospermes aurait au moins 300 millions d’années.NB : la fleur bisexuée n’a pas plus de 130 millions d’années.
Perception de l’éthylène
Deux familles de récepteurs : . I avec des résidus essentiels pour l’activité his kinase : ETR1, ERS1. II sans ces résidus : ETR2, EIN4, ERS2
- Pas de réponse à l’éthylène chez les simples mutants ponctuels etr1, etr2, ein4, ers1 et ers2. Ce sont des mutants dominants, insensibles à l’éthylène.
- On a recherché des suppresseurs de ces mutants, présentant un phénotype sauvage, que ce soit en présence d’air (allongement normal) ou d’éthylène (triple réponse : racine et hypocotyle courts et larges, courbure apicale exagérée) : etr1-5 (à 8), etr2-3 (et 4), ein4-4 (à 12), ers2-3, ers1-2. Mutants knock-out récessifs, réponse à l’éthylène, donc phénotype sauvage. Le knock-out de ces récepteurs n’entraîne pas une absence de réponse à l’éthylène, mais au contraire la triple réponse. Ilen va de même pour les double et triple mutants comme etr1-6 ein4-4, etr1-6 etr2-3, etr1-6 etr2-3 ein4-4.
- Seul le quadruple mutant etr1-6 etr2-3 ein4-4 ers2-3 (par ailleurs stérileet nain) retrouve la triple réponse en présence d ’éthylène.
Le double mutant etr1-ers1, le seul qui présente une très forte réponse phénotypique (rosette miniature, fertilité réduite, morphologie florale), n’est pas totalement compensé par la surexpression des récepteurs du groupe II. La famille I présente un rôle différent (interaction avec le domaine régulateur de CTR1).
C2H4
ETR1ERS1ETR2EIN4ERS2
CTR1 réponse
There is a degree of functional redundancy between receptor isoformsHua and Meyerowitz (1998).
Un exemple de fonctions recouvrantes
Glabra 1 (GL1) et Werewolfe (WER) sont des facteurs de transcriptionde type MYB, et ne correspondent pas à des gènes dupliqués
bHLH GL3
GL2
WER GL1
GL2
Pas de poils racinaires Trichomes
TTGTTG WD40
Protéine à homéodomaine
WER et GL1 régulent GL2. La protéine Transparent Testa Glabra (TTG) accroît la production de trichomes à partir de l’épiderme foliaire, et inhibe la formation de poils racinaires à partir de l’épiderme racinaire.
Épidermeracinaire
Épidermefoliaire
WER, exprimé dans lescellules épidermiquesracinaires, réprime laproduction de poils racinaires dans certainesfiles de cellules
GL1, exprimé dans lescellules épidermiquesfoliaires, permet laproduction de trichomes
Les constructions séquence régulatrice WER-protéine GL1 et celle séquence régulatrice GL1-protéine WER permettent, respectivement dans les mutants wer et gl1, de restaurer un phénotype sauvage (i.e. trichomes, pas de poils racinaires). Les protéines GL1 et WER sont interchangeables, mais cette équivalence ne s’étend pas aux autres MYB-R2R3. Dans les deux cas les profils d’expression sont normaux. Ces résultats suggèrent que les différences d’expression observées entre WER et GL1 résultent de leurs séquences régulatrices.
A partir d’un gène MYB ancestral, les ancêtres des gènes WER et GL1 ont séparé leurs profils d’expression, de telle manière que chaque gène fils ne retienne qu’une partie de la fonction ancestrale : - spécification « épiderme foliaire » pour p-GL1- spécification « épiderme racinaire » pour p-WER
AGL1 = SHP1AGL5 = SHP2
AGL11 = STK
Agamous
gènes de gymnospermes
AGL12, 7, 14
100
99
duplication récente 24-40 Ma
duplication ancienne 100 Ma
AGL1, AGL5, Agamous et AGL11 appartiennent au même groupe monophylétique de gènes homéotiques (MADS box). Ce groupe adivergé depuis la séparation des ancêtres des Angiospermes et des Gymnospermes, il y a environ 300 Millions d’années
Un exemple complexe de redondance
AGAgamous
SHP1, 2Shaterproof
STKSeedstick
Détermination florale
Identité des étamines
Identité des ovules
Identité des carpelles
Déhiscence du fruit
Identité du funicule
Abscissionde la graine
mutants shp1
et shp2, pas de
phénotype
mutant ag, nicarpelles, ni
étamines,fonction C du modèle ABC
mutant stk : les graines ne se détachent pas(fonction D modèle ABCD)
Redondance AG-SHP pour le développement des carpelles, et redondance AG-STK-SHP pour l’identité « ovule »
AG, SHPs, STK qui dérivent d’un même gène ancestral(fonctions C et D), ont conservé des fonctions redondantes,tout en développant des fonctions nouvelles spécifiques
Dans le cas de la levure (S. cerevisiae), on observe l’existence d’un recouvrement fonctionnel dans certains cas, mais la conservation de gènes dupliqués a également eu comme conséquence le fait qu’une des 2 copies se spécialise dans une nouvelle fonction.
La présence d’une seconde copie du gène confère une résistance accrue envers les mutations nulles (i.e. une amélioration de la valeur adaptative).
Outre l’accroissement de complexité dans l’organisation et la structuredu génome, les conséquences fonctionnelles de la duplication sont diverses :- redondance fonctionnelle totale- redondance partielle, fonctions recouvrantes
USE
IT
OR
LOOSE
IT
Y gene
Y gene
Y' gene
90% lost
10% conserved(457 genes)
duplication
83% functionalredundancy(conversion 13%)
17% neofunctionalization
P1 gene
P1 gene
P2 gene
duplication
P2 gene
P2 gene
P22 gene
duplication
ancientevent
(100 Mya)
recentevent
(24-40Mya)
87% lost
13% conserved(1000 genes)
27% functionalredundancy
73% neofunctionalization
72% lost
28% conserved(6000 genes)
43% functionalredundancy
57% neofunctionalization
YEAST
Arabidopsis
Chez la levure donc, 5000 gènes dupliqués font 10000, mais 90% des dupliqués perdus font 5500 gènes actuels.En fait 457 gènes dupliqués :
- La plupart de ces gènes dupliqués (321 paires) conservent la même fonction, et divergent peu, et 60 paires proviennent de conversion.
- 76 paires montrent une divergence forte des séquences protéiques (accelerated protein evolution) par comparaison avec K. waltii). Dans 95% des cas, une seule des 2 séquences évolue plus vite : 13 kinases, 8 protéines régulatrices……La protéine la plus divergente possède la nouvelle fonction,parfois très éloignée de l’ancienne : ainsi Sir3 (silencing des télomères,…) dérive de la fonction ancestrale de Orc1 (large sous unité du complexe de l’origine de réplication). La délétion du paralogue ancien est létale dans 18% des cas, jamais létale pour le paralogue dérivé. 32 séquences montrent une évolution accélérée des séquences nucléotidiques.
Chez Arabidopsis, 7% des gènes dupliqués sont significativement plus souvent dupliqués que la moyenne (kinases) ou moins souvent dupliqués (DNA repair) :
- Ainsi, au lieu de 72% des gènes dupliqués récemment (24-40 Ma) éliminés, nous observons pour l’ensemble des kinases 33,3 % de gèneséliminés (17.9% pour les kinases qui ne sont ni de type raf ni de typerécepteur kinase, 10% pour les raf, 21,3% pour les RLKs).
- Les gènes dupliqués (polyploïdisation ou tandem) ont en moyenne :1) Une plus longue séquence, 2) plus de domaines protéïques, 3) plus de régions cis-régulatrices, que les singletons. Les gènes complexes seraient plus souvent dupliqués que les autres, car plus « faciles » àsubfonctionaliser.
- La polyploïdisation et plus généralement la duplication de gènes, peut-elle conduire à la duplication d’une voie de signalisation entière,à la duplication d’un complexe ou d’un module de signalisation ? La réponse est très probablement OUI.