cours 4

16
Chapitre IV ANATOMIE MOLECULAIRE DES GENES DES EUCARYOTES I. Aperçu général de l’organisation des gènes des eucaryotes (cas du génome humain). Anatomie d'un gène codant pour une protéine Il n'existe pas de structure définie absolue. Un gène ne se limite pas à sa partie transcrite et encore moins à sa partie codante. D'autre part l'information est presque toujours morcelée. Tout cela fait qu'il est devenu difficile de donner une définition spatiale ou fonctionnelle très précise. Il n'en reste pas moins qu’un modèle est le plus fréquent. 31

Upload: ben-chir

Post on 09-Mar-2016

216 views

Category:

Documents


2 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Cours 4

Chapitre IV ANATOMIE MOLECULAIRE DES GENES DES EUCARYOTES

I. Aperçu général de l’organisation des gènes des eucaryotes (cas du génome humain).

Anatomie d'un gène codant pour une protéine

Il n'existe pas de structure définie absolue. Un gène ne se limite pas à sa partie transcrite et encore moins à sa partie codante. D'autre part l'information est presque toujours morcelée.Tout cela fait qu'il est devenu difficile de donner une définition spatiale ou fonctionnelle très précise. Il n'en reste pas moins qu’un modèle est le plus fréquent.

31

Page 2: Cours 4

On peut classer les gènes codant pour les protéines selon le nombre de leurs copies

• Les gènes uniques ou quasi uniques:

la très grande majorité des gènes appartient à cette classe. Leur structure correspond au modèle qui vient d'être décrit. La séquence CAAT est souvent absente. Certains gènes ont été dupliqués au cours de l'évolution. Les deux copies peuvent être complètement interchangeables, comme c'est le cas des gènes a de la globine.Dans d'autres cas les deux copies ont quelque peu divergé, donnant deux protéines aux propriétés proches mais différentes. L'expression de l'une ou l'autre de ces copies peut être fonction de du tissu ou du stade de développement.

Les familles de gènes: il s'agit là le plus souvent d'une extension du phénomène de duplication / divergence:Un gène peut avoir été plusieurs fois dupliqué tôt dans la phylogenèse, chaque copie ayant divergé indépendamment.Il en résulte toute une série de gènes codant pour des protéines grossièrement analogues. L'expression de chaque copie dépend du type ou de l'état cellulaire.

• Parmi les exemples les mieux connus, citons:• - la famille des gènes globine;• - la famille des gènes actine ;• - la famille des gènes myosine.

Les superfamilles :

Elles résultent d'un phénomène analogue mais s'étant produit bien plus tôt dans l'évolution. La divergence est telle que la relation entre les différents gènes est difficile à mettre en évidence. exemple la superfamille des gènes codant pour les récepteurs nucléaires des hormones.

• La superfamille des gènes de l'immunité, en est le plus bel exemple: les gènes des immunoglobulines, des récepteurs T, des protéines d'histocompatibilité de classe I , II et III dérivent de duplications en nombre variable d'un même motif ancestral.

Le nombre de motifs répétés est variable et la divergence a été considérable. En fait ce qui est conservé c'est la structure tertiaire de l'unité de base.

32

Page 3: Cours 4

Les gènes domestiques (house-keeping genes)

Certains gènes ne s'expriment que dans certains tissus, c'est la base de la différenciation. D'autres codent pour des protéines ubiquitaires, indispensables à la survie de chaque cellule, comme par exemple les gènes des enzymes de la glycolyse, de la respiration et des métabolismes intermédiaires. Ces gènes, appelés gènes domestiques (house-keeping), ont en commun une série de caractéristiques:

• un taux de transcription en général faible et continu. • l'absence de TATA box.• la présence dans la région 5' non codante de une ou plusieurs séquences GGGGCGGG

(GCbox) qui sont des sites potentiels de fixation pour les protéines de transcription.• une grande richesse en séquences CG hypo-méthylées. sont précédés par et

contiennent de très nombreuses répétitions du doublet CG, non méthylés. Ils sont rassemblés en îlots appelés HTF(Hpa Tiny Fragments), ainsi appelés car ils

contiennent de nombreux sites CG dont le clivage par l'enzyme de restriction HpaIl atteste de leur non-méthylation. Ce type d'îlots s'étend sur 500 à 2000 pb, et le génome humain en contient environ une vingtaine de mille.

les pseudogènes Lorsque l'on hybride du DNA génomique total avec une sonde marquée d'un gène par la technique de Southern, il est parfois possible de mettre en évidence des séquences qui ne s'hybrident qu'à faibles stringence. Le clonage de ces séquences, et l’analyse de leur séquence nucléotidique, montre le plus souvent une grande homologie de séquence avec le gène qui a servi de sonde. Ces séquences ne sont pas fonctionnelles, car elles ne sont ni transcrites ni traduites; ce sont des pseudogènes.

Deux types de pseudogènes: Pseudogène conventionnel:

correspond à des gènes dupliqués qui ont perdu leur fonctionnalité, soit au départ parce que la duplication n'était pas parfaite, soit au cours de l'évolution par apparition de mutations (perte d'ATG, de promoteur fonctionnel ou apparition de codon stop). Ce sont des pseudogènes avec introns.

33

Page 4: Cours 4

Pseusogène processé

On pense que les pseudogènes processés proviennent de la réintégration dans le génome d’un cDNA issu de la rétrotranscription d’un ARN issu de la transcription d’un gène normal. La réverse transcriptase nécessaire est apportée lors d’un infection par un rétrovirus. L’intégration du pseudogène se fait au hasard. Le pseudogène est donc dépourvu d’introns et surtout dépourvu de promoteur, ce qui le rend non fonctionnel.

Le génome mitochondrial.Les mitochondries possèdent un génome autonome mais très largement insuffisant pour coder pour toutes les protéines dont elles ont besoin. Ces protéines sont donc majoritairement importées du cytosol. Bien que ce génome soit court, il représente une quantité de DNA non négligeable puisque l'on en trouve plusieurs copies par mitochondrie, et qu'une cellule possède plusieurs milliers de mitochondries. Ce génome est circulaire, l'un des deux brins est appelé H (heavy) et l'autre L (Iight).Chez l'homme il a une longueur de 16 569 paires de bases.Il contient 37 gènes : Il code pour 13 chaînes polypeptidiques, 22 ARNt et les ARNr 12 S et 16 S des ribosomes qui leur sont propres.

34

Page 5: Cours 4

Le génome nucléaire.

Le noyau d'une cellule humaine contient plus de 99 p. 100 de l'ADN cellulaire. Le génome nucléaire est distribué en 22 types d'autosomes et 2 types de chromosomes sexuelsIls sont classés en groupes selon leur taille et, dans une certaine mesure, selon la position de leur centromère. Ils peuvent aisément être différenciés par les techniques de bandes chromosomiques. Différences entre les bandes chromosomiques sombres et claires et variation de la densité génique selon les régionsOn distingue les bandes G sombres des bandes claires obtenues avec la coloration de Giemsa standard. L'alternance de bandes claires et sombres reflète la compartimentation du génome humain en isochores. Les isochores définissent de grandes régions chromosomiques (supérieures à 300 kb environ) qui témoigneraient des variations régionales de la composition en bases,ou bien d'un espacement variable des sites d'attachement à la structure centrale.

La densité génique peut varier considérablement entre les régions chromosomiques et également entre les chromosomes. Les régions d'hétérochromatine, par exemple, sont essentiellement constituées d'ADN répétitif non codant; les centromères, comme de grandes régions du chromosome Y en particulier, sont dépourvus de gènes. La distribution des gènes le long de différents chromosomes a pu être obtenue en hybridant des fractions purifiées d'îlots CpG du génome aux chromosomes métaphasiques

Ainsi, il est apparu clairement que : • La densité génique est élevée dans les régions sub-télomériques.• Certains chromosomes (par exemple, 19 et 22) sont riches en gènes tandis que d'autres

(par exemple, 4 et 18) en sont pauvres.

Le contraste entre le complexe majeur d’histocompatibilité humain (HLA) et le gène de la dystrophine (OMO) illustre bien les différences qui existent entre les bandes G claires, riches en gènes et bandes sombres qui sont pauvres en gènes. Le complexe HLA est localisé dans une bande claire G, 6p21.3 : au moins 200 gènes ont été identifiés dans un espace de 4 Mb.Une région entière de 2,4 Mb d'ADN de la bande sombre G, Xp21, semble au contraire contenir uniquement le gène de la dystrophine

• Diversité fonctionnelle des gènes humainsLa grande majorité des gènes humains déterminent des polypeptides Ils remplissent des fonctions nombreuses et variées; ces polypeptides comportent des protéines structurales (composants membranaires, protéines du cytosquelette, etc.), des protéines de transport, des hormones, des récepteurs, des enzymes, des protéines régulatrices, des molécules de signalisation, etc. Seule une petite minorité détermine des produits ARN matures :

de nombreux gènes impliqués dans les mécanismes de synthèse protéique (gènes ARNr, gènes ARNt, etc.)

de nombreux autres gènes ARN qui codent un groupe particulier de petits ARN nucléaires (ARNsn, pour small nuclear) et de petits ARN cytoplasmiques qui

35

Page 6: Cours 4

participent à l'épissage des ARN et jouent de nombreux autres rôles tel le transport intracellulaire.

Diversité de l'organisation interne

Une très petite minorité de gènes humains, généralement de très petits gènes, ne possède pas d'introns. Dans les gènes qui possèdent des introns, le contenu en exons en pourcentage de longueur du gène tend à être très faible dans les grands gènes. la taille moyenne d'un exon dans les gènes humains est d'environ 170 pb et, bien que de très grands exons soient connus, leur taille est comparativement indépendante de la taille des gènes. Ceci est du à l'immense variation de la taille des introns : les grands gènes tendent à avoir de très grands introns.La relation entre la longueur du gène et celle des introns n'est cependant pas si simplele gène du collagène humain de type 7 (COL7A1) est de taille intermédiaire (31 kb), mais il possède 118 exons (le plus grand nombre pour un gène caractérisé, et significativement plus que le gène géant de la dystrophine), et une taille moyenne d'introns de seulement 188 pb.

Gènes dans les gènes

36

Page 7: Cours 4

Gènes dans les gènes: l'intron 26 du gène de la neurofibromatose de type 1 (NF1) contient trois gènes internes contenant chacun deux exons.Noter que les trois gènes internes sont transcrits sur les brins opposés à celui qui est utilisé pour la transcription du gène NF1.

II . Famille Multigénique.

Les séquences d'ADN du génome diploïde nucléaire existent habituellement sous forme de deux copies alléliques (sur les chromosomes homologues paternel et maternel).Outre ce degré de répétition, approximativement 40 % du génome nucléaire humain est composé de groupes de séquences d'ADN non alléliques très analogues (familles de séquences d'ADN ou ADN répétitif). Parmi ces séquences répétitives différentes et extrêmement variées, on retrouve :

• des familles dont les membres comprennent des gènes fonctionnels (familles multigéniques)

• également de nombreux exemples de familles de séquences répétitives non géniques. Un grand degré d'homologie de séquence entre deux membres d'une famille de séquences d'ADN répétitif témoigne d'une origine commune au cours de l'évolution.

• les familles de séquences d'ADN présentent des variations considérables dans :– le nombre des différentes unités répétées des différents membres, – la taille de l'unité répétée, – la localisation chromosomique,– son mode de répétition– sa capacité d'expression.

Deux catégories de gènes homologues:• - orthologues: de deux espèces différentesLeur identité de séquence suggère qu’il s’agit de deux versions d’un même gène, ayant la même fonction dans deux espèces différentes. Le minimum d’identité pour être orthologue dépend du degré d’éloignement des espèces comparées

• - paralogues: au sein d’une même espèceL’ensemble de ces gènes constitue une famille de gènes. Les identités sont souvent concentrées dans des régions que l’on appelle des boites d’homologies. Les boites d’homologie codent souvent pour des domaines fonctionnels Des gènes paralogues peuvent avoir une même fonction (redondants) ou des fonctions partiellement différentes

37

Page 8: Cours 4

1. Structure et expression des gènes Globine

(voir planche).

Quelques exemples de délétions observées dans le domaine des gènes de l'-globine.

38

Page 9: Cours 4

L'hémoglobine Lepore est formée par une fusion des gènes d et b, la situation réciproque étant trouvée dans l'hémoglobine anti-Lepore. Dans l'hémoglobine Kenya il y a fusion des gènes Ag et b avec délétion de la séquence intermédiaire. La réciproque anti-Kenya n'a pas été observée.

Phylogénie des gènes globines humaines.

L'évolution du groupe de gènes b-globine de mammifères a comporté de fréquents événements de duplication génique, de conversion et de perte ou d'inactivation de gènes.

39

Page 10: Cours 4

III. ADN moyennement répété codant pour des protéïnes.

1. Cas des gènes Histones

Organisation de groupes de gènes d'histones

Exemples caractéristiques de groupes de gènes d'histones liés chez différentes espèces.

40

Page 11: Cours 4

Dans une espèce donnée, tous les groupes ne sont pas nécessairement identiques. Chez les humains, et peut-être chez d'autres espèces, certaines séquences sont des pseudogènes.

2. Gènes répétés des ARNt et des ARNr.

– A) Gènes ARNr 18s et 28s.

Organisation des gènes codant pour le RNA des ribosomes chez l'homme (gènes de classe 1)

41

Page 12: Cours 4

Les principaux ARNr humains sont synthétisés par clivage d'une unité de transcription commune de 13 kb qui appartient à une unité de répétition en tandem de 40 kb.Les petite flèches indiquant les lettre A à D correspondent aux positions des sites de clivage des précurseurs par les endonucléases. Le clivage du précurseur 41S en B engendre deux produits: 20S + 32S. Après clivage en D du précurseur 32S et excision du petit ARNr 5,8S, une liaison hydrogène se crée entre l'ARNr 5,8S et une région complémentaire de l'ARNr 28S. La séquence d'ARN d'environ 6 kb commençant au niveau des espaceurs externe et internes (ETS, ITS1 et ITS2, pour externat ou internat transcribed spacers) est dégradée dans le noyau.

VI. Cas de gènes formés par des répétitions en tandem de segments d’ADN

1. Structure des protéines et gènes de l’-foetoprotéine et de serumalbumine (voir planche).

2. Structure du gène Sgs4 chez Drosophila melanogaster

(a) La structure du gène Sgs 4 d'une souche de Drosophila, avec 19 répétitionsen tandem d'un motif de 21 pb. La séquence canonique du motif répété (b),ainsi que celle de plusieurs répétitions individuelles (c) sont représentées.

42