support de l'information génétique ; structure et …©o-gm-9...gm- support de...

16
GM- Support de l'information génétique ; structure et fonction du génome Mercredi 9 octobre ABECASSIS Anna L2 GM Pr Beroud 16 pages Support de l'information génétique ; structure et fonction du génome La génomique désigne tout ce qui concerne le génome. De la même manière, on peut utiliser le suffixe -omique pour désigner le tout concernant un sujet : - Transcriptomique (tous les transcrits) ; - Protéomique (toutes les protéines) ; - Métabolomique (tous les métabolismes) ; - Lipidomique (tout ce qui concerne les lipides)... etc A. Des gènes aux protéines L’information génétique est contenue dans l’ADN : il existe plusieurs molécules d’ADN dans une cellule humaine, elles sont localisées soit dans le noyau (chromosomes), soit dans les mitochondries (ADN circulaire). Dans les mitochondries, la molécule d’ADN circulaire est de de 16 568 pb et a été séquencée en 1981. Les molécules d’ADN nucléaire sont hyper compactées en chromosomes pendant la division cellulaire (métaphase). Sur le schéma ci dessous, on peut voir les différents degrés de compaction de la chromatine, on remarque que plus elle est compactée (moins elle est longue) et plus elle est large (c'est logique). 1/16 Plan A. Des gènes aux protéines I. Structure de l'ADN II. Structure des gènes III. Expression des gènes : transcription et traduction IV. Régulation de l'expression des gènes 1. Différents niveaux de régulation 2. Epigénétique 3. Empreinte génomique parentale B. Le projet génome humain 1. De la structure d'ADN à la séquence du génome humain en 50 ans 2. Informations issues du projet a)Structure b) Variabilité

Upload: ngodieu

Post on 30-Apr-2018

220 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

Mercredi 9 octobreABECASSIS Anna L2GMPr Beroud16 pages

Support de l'information génétique ; structure et fonction du génome

La génomique désigne tout ce qui concerne le génome. De la même manière, on peut utiliser le suffixe -omique pour désigner le tout concernant un sujet :- Transcriptomique (tous les transcrits) ;- Protéomique (toutes les protéines) ;- Métabolomique (tous les métabolismes) ;- Lipidomique (tout ce qui concerne les lipides)... etc

A. Des gènes aux protéines

L’information génétique est contenue dans l’ADN : il existe plusieurs molécules d’ADN dans une cellule humaine, elles sont localisées soit dans le noyau (chromosomes), soit dans les mitochondries (ADN circulaire).

Dans les mitochondries, la molécule d’ADN circulaire est de de 16 568 pb et a été séquencée en 1981.Les molécules d’ADN nucléaire sont hyper compactées en chromosomes pendant la division cellulaire (métaphase). Sur le schéma ci dessous, on peut voir les différents degrés de compaction de la chromatine, on remarque que plus elle est compactée (moins elle est longue) et plus elle est large (c'est logique).

1/16

Plan

A. Des gènes aux protéines I. Structure de l'ADN

II. Structure des gènesIII. Expression des gènes : transcription et traductionIV. Régulation de l'expression des gènes

1. Différents niveaux de régulation 2. Epigénétique 3. Empreinte génomique parentale

B. Le projet génome humain 1. De la structure d'ADN à la séquence du génome humain en 50 ans 2. Informations issues du projet a)Structure b) Variabilité

Page 2: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

Le génome nucléaire est fragmenté en 23 paires de chromosomes.Taille 310≃ 9 pbPartie codante 3x10≃ 7 pb (1%)25 000 à 30 000 gènes

La chromatine est constituée par un assemblage de l’ADN avec des protéines histones.8 histones sont nécessaires pour former un nucléosome.L’ADN s’enroule autour des nucléosomes en formant une structure en collier de perles (ᴓ11nm).

L'histone H1 permet l’association des nucléosomes entre eux, leur compaction en fibre de chromatine de 30 nm de diamètre. C'est l'unité de base de la chromatine.

On distingue l'hétérochromatine, dense et compactée (gènes inactifs et régions intergéniques) de l'euchromatine, décondensée, qui contient les gènes actifs.

2/16

Page 3: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

I. Structure de l'ADN

Le support de l'information génétique est l'ADN.Le 25 avril 1953 paraît dans 'Nature' "A Structure for Deoxyribose Nucleic Acid" grâce à Crick, Watson et Franklin.

L'ADN peut être :– copié au travers des générations cellulaires successives : réplication ;– traduit en protéines : transcription en ARN puis traduction en protéines ;– réparé en cas de besoin : réparation.

Le support des gènes : l’ADN

II. Structure des gènes

Un gène est défini comme l’unité d’hérédité.C'est une unité élémentaire d’ADN capable de se reproduire (réplication), susceptible de mutation et capable de transmettre un message héréditaire.Le gène permet la synthèse de 0, 1 ou plusieurs ARN et donc protéines.

Chez les eucaryotes les gènes sont morcelés:- exons et introns transcrits ;- séquences régulatrices non transcrites

3/16

Page 4: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

Noter le site d'initiation de la transcription et le codon d'initiation de la traduction sur l'exon 1

Le promoteur :

Localisé en 5' du premier exon c'est à dire en amont.Il est impliqué dans la transcription d'un gène en ARNm, il est reconnu par des facteurs de transcription, il est composé des éléments suivants :

– TATA box (TATA AAA) en -35 à -20– Initiator en +1– CAAT Box en -200 à -70– GC Box en -200 à – 70

A chaque région du promoteur correspond un facteur de transcription, par exemple pour la TATA box le facteur de transcription est TBP (Tata Binding Protein).

Le promoteur de l'IL2 :

4/16

Page 5: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

Les séquences régulatrices

* Enhancers : éléments de régulation positive localisés le plus souvent en amont des gènes.

* Silencers : éléments de régulation négative qui interagissent avec des répresseurs.

* Eléments mixtes enhancers/silencers : leur fonction dépend du ligand protéique ; la même protéine peut jouer le rôle de enhancer ou silencer selon le ligand. Éléments E box (CACGTC)liaison du dimère Max - Myc = enhancerliaison du dimère Max - Mad = silencer

5/16

Page 6: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

L'épissage des introns :

6/16

Page 7: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

Il est dit alternatif.Généralement un intron commence par GT ou GU et finit par AG.Un intron possède un site donneur d'épissage (en fin de l'exon 1 et début de l'intron) et un site accepteur d'épissage (en fin d'intron et début d'exon 2), ainsi qu'un point de branchement.L'élément clé du point de branchement est une adénine (A).

L'épissage est un mécanisme complexe, réalisé grâce au splicéosome qui existe uniquement chez les eucaryotes.La snRNP U1 reconnaît spécifiquement le signal du site donneur tandis que la snRNP U2 reconnaît le point de branchement : U1 et U2 se rapprochent et forment une boucle. Les 2 exons se rapprochent physiquement. Ensuite interviennent U4, U5, U6, et des réactions chimiques brisent les liens ; il s'agit de deux trans estérifications.

7/16

Page 8: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

8/16

Page 9: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

La queue poly A : Elle protège l'ARNm des dégradations. Elle est située en 3'.

Le signal de fin de transcription est également situé en 3'.

Les gènes ont une structure et une longueur variables.Exemple : le gène de la titine possède 363 exons et son ADNc 101 518 pdb le gène de Ubl4 possède 4 exons et son ADNc 2 382 pdbRappel : ADNc = copie de l'ARNm mature

Si on compare la structure des gènes entre les espèces :– la taille des exons est conservée– la taille des introns est variable

9/16

Page 10: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

III. Expression des gènes : transcription et traduction

Attention, un gène ne code pas forcément pour une protéine. Il existe des gènes :– uniques codant pour une protéine unique ;– uniques codant pour plusieurs protéines (grâce à l'épissage alternatif) ;– codant pour des ARN non traduits en protéines (ARN non codant) ;– dispersés codant pour plusieurs protéines (familles et superfamilles de gènes) :

soit en cluster, proches les unes des autres sur un même chromosome, soit sur différents chromosomes pour coder une protéine proche

– cas particuliers des gènes ribosomaux (ARNr) ;– gènes ne codant pour aucune protéine, ni aucun ARN : on parle de pseudogènes, gènes un jour

dupliqués et la pression de sélection force la cellule à maintenir au moins un double des 2 copies actif pour survivre.

La transcription :

C'est un processus dynamique continu, car il y a épissage pendant la transcription.La maturation nécessite en plus le capping et la polyadénylation.

* Le capping :Il se déroule en 3 étapes :

– une RNA triphosphatase hydrolyse le phosphate du triphosphate terminal de l'ARN laissant un ARN terminé par une terminaison diphosphate et un Pi

– une RNA guanyltransférase assure le transfert de GMP sur l'extrémité 5' diphosphate de l'ARN.– Une RNA méthyltransférase transfère le méthyl d'une S-adénosyl-méthionine sur le chapeau.

Concernant la transcription :- la séquence du gène est sur le brin sens,- l'ARN polymérase synthétise l'ARNm par complémentarité au brin antisens,- au final, l'ARNm comporte la séquence du gène.

La traduction :

Le passage de la molécule d'ARNm à la protéine fait intervenir le code génétique. En effet, la séquence nucléotidique dans l'ADN spécifie l'ordre des acides aminés (aa) dans la protéine.Codon : séquence de 3 bases correspondant à 1 aa.Le code génétique est dégénéré (redondant), non ambigu. AUG est un codon d'initiation de la traduction alors que TAA, TAG, et TGA sont des codons STOP.

10/16

Page 11: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

IV. Régulation de l'expression des gènes

Il existe 30 000 gènes mais 100 000 protéines différentes. On explique cela par les phénomènes de régulation de l'expression.

1. Différents niveaux de régulation

– Niveau chromatinien, ex:compaction de la chromatine ;– Niveau transcriptionnel, ex : effet des facteurs de transcription ;– Niveau post transcriptionnel, ex : modulation de la demi vie des messagers ;– Niveau traductionnel, ex : modification de facteurs d'initiation de la traduction ;– Niveau post traductionnel, ex : glycosylation, méthylation.

Ces niveaux de régulation interviennent au niveau de la séquence (contrairement à l'épigénétique).

2. Epigénétique

Ensemble des modifications de l'expression des gènes sans altération des séquences nucléotidiques, réversibles et transmissibles d'une génération à l'autre. Ces mécanismes régulent l'équilibre entre gènes actifs et inactifs.

Les principaux mécanismes sont :– Le code des histones (niveau chromatinien): en effet lors de modifications biochimiques des histones le

degré de compaction de la chromatine change. Or, on sait que seule la chromatine décondensée correspond à une activation de la transcription.

– La méthylation de l'ADN (niveau chromatinien) : elle est impliquée dans des phénomènes tels que la compaction de l'ADN, l'inactivation de l'expression des gènes, l'inactivation du chromosome X, et dans le phénomène d'empreinte génomique parentale.

– Action de certains ARN non codants

3. Empreinte génomique parentale

C'est la non équivalence d'expression de certains gènes selon l'origine parentale. En effet pour la majorité des gènes, la copie d'origine maternelle et la copie d'origine paternelle sont exprimés, mais pour certains gènes, seul l'allèle maternel/paternel est exprimé.

11/16

Page 12: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

B. Le projet génome humain

1. De la structure d'ADN à la séquence du génome humain en 50 ans

Le séquençage du génome humain a pour objectif de répondre aux questions suivantes :- Le génome humain est plus complexe que celui des procaryotes, quelle est sa composition?- Contient-il plus de gènes que celui des autres espèces?- Comment expliquer les différences de niveau d’évolution?- Plus une espèce est évoluée, plus elle a de gènes?- Identifier les gènes responsables des maladies génétiques- Placer les gènes sur les différents chromosomes

Le séquençage du génome humain est le plus grand projet scientifique mondial lancé en 88/89 et Human Genome Project démarre en 90.Capacités de séquençage :en 1975, 1 000 nucléotides/semainesen 1986, 10 000 / jouren 1998, 200 000/ jour

Cartographie– les cartes génétiques sont des cartes relatives où les distances sont exprimées en centimorgan (cM).

1 cM= 1% de recombinaison– les cartes physiques sont des cartes absolues, plus précises que les cartes relatives, où les distances sont

exprimées en pdb.Kilobases (kb)=1000pbMégabases (Mb)=1000kb

Chez l'homme, 1 cM= 1 Mb environ.

12/16

Page 13: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

2. Informations issues du projet HGP a)Structure b) Variabilité

Le génome humain est composé de 3 272 millions de nucléotides.Les régions riches en gènes sont les régions riches en nucléotides G et C.Les régions pauvres en gènes sont riches en A et T.Ces différentes régions peuvent être également visualisées comme des bandes claires ou sombres sur les chromosomes métaphasiques (banding).

– bandes G : riches en AT, pauvres en gènes– bandes R : riches en GC, riches en gènes

13/16

Page 14: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

Les chromosomes étant classés par taille, le chromosome 1 contient le plus grand nombre de gènes estimés soit environ 3000 alors que le chromosome Y en a le moins (231).

Le nombre total de gènes se situe entre 25 000 et 30 000.La taille moyenne d'un gène est de 3 000 bases et 9 exons, mais la taille varie beaucoup (gène de la dystrophine=2,4 millions bp)

99,9% de la séquence est identique entre deux personnes. Il existe donc 0,1% de différences soit 3,5 millions de différences par génome.Plus de 50% des gènes ont une fonction inconnue.

Le HGP a permis la création de bases de données de séquence et d'annotations, le séquençage de nombreux organismes (animaux et même Néanderthal).

Aujourd'hui nous sommes face à une nouvelle ère, celle de la médecine personnalisée. Alors que pour le HGP, on avait séquencé le génome humain pour 3 milliards de dollars on peut maintenant utiliser des séquenceurs à haut débit qui fonctionnent en une semaine pour 10 000 dollars (seulement...) mais l'analyse des données reste difficile.

Conclusion :

- Le génome humain est séquencé et séquençable. - « ère post génomique »- interaction des -omes (transcriptome, protéome, etc)- le génome permet de mieux comprendre la diversité des êtres vivants (non expliqué par le seul nombre des gènes)

- Médecine : bases génétiques des maladies causales (monofactorielles) ou à effet modificateur (prédisposition génétique)

14/16

Page 15: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

15/16

Page 16: Support de l'information génétique ; structure et …©o-gm-9...GM- Support de l'information génétique ; structure et fonction du génome Les séquences régulatrices * Enhancers:

GM- Support de l'information génétique ; structure et fonction du génome

16/16