interactions proteine-proteine : du producteur au consommateur christine brun, lgpd, marseille...

34
INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseil Réunion Satellite JOBIM, Lyon, Juillet 2005

Upload: asce-launay

Post on 03-Apr-2015

106 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

INTERACTIONS PROTEINE-PROTEINE :

DU PRODUCTEUR AU CONSOMMATEUR

Christine Brun, LGPD, Marseille

Réunion Satellite JOBIM, Lyon, Juillet 2005

Page 2: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

Une protéine n’agit jamais seule…

…mais interagit avec d’autres afin d’assurer sa fonction.

Page 3: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

LA DIVERSITE DES INTERACTIONS P-Pd'après Nooren & Thornton

• L’interaction a lieu entre homo- ou hétéro-oligomères

• L’association est isologue ou hétérologue : les surfaces de contact sont identiques (homo-oligomères)les surfaces de contact sont différentes (homo-/hétéro-oligomères)

chaînes identiques chaînes différentes

1- Diversité Structurale

Page 4: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

LA DIVERSITE DES INTERACTIONS P-Pd'après Nooren & Thornton

2- Diversité Fonctionnelle

• IPP obligatoire :

Les protéines ne sont pas stables indépendamment.Les protéines ne sont pas fonctionnelles indépendamment.

L'interaction est nécessaire à la stabilité et à la fonction.

Ex: gros complexes protéiques (ADN polymérase, ARN polymerase, ribosome…)

• IPP non-obligatoire :

Les protéines sont stables indépendamment.Les protéines sont fonctionnelles indépendamment.

L’interaction est responsable d’une action.

Ex: complexes antigène-anticorps, enzyme-inhibiteur, complexes de signalisation intracellulaire…

Page 5: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

LA DIVERSITE DES INTERACTIONS P-Pd'après Nooren & Thornton

3- Diversité Dynamique

• IPP permanente :

N'existe qu'au sein d'un complexe.

Les IPP obligatoires sont généralement permanentes.

• IPP transitoire :

S'associe et se dissocie in vivo.

Les IPP non-obligatoires peuvent être transitoires ou permanentes.

Page 6: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

LES GRANDS RESEAUX D'INTERACTIONS

Graphe non orienté, Nœud = protéine, Arête = interaction physique

Page 7: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

Comment identifier les interactions protéine-protéine à l'échelle du protéome entier?

Deux méthodes automatisées:

- le double-hybride dans la levure

- le TAP-tag (tandem affinity purification)

Page 8: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

DF

DA

Gène

LA MODULARITE DES FACTEURS DE TRANSCRIPTION,comme principe élémentaire du double hybride dans la levure

Facteur de transcription:Domaine de fixation à l'ADN DF

+ Domaine d'activation de la transcription DA, capable d'activer la machinerie

basale de transcription

Site de fixation pour le facteur de transcription

Facteur de transcription Facteur de transcription ARN messager

ARN messager

ARN messagerARN messager

ARN messager

ARN messager

ARN messagerARN messagerDF

DA

Page 9: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

DFAppât X

DAProie Y

Gène rapporteur

LE DOUBLE-HYBRIDE DANS LA LEVURE,le test

• La protéine appât (dont on veut identifier les interacteurs) est fusionnée au domaine de fixation à l'ADN DF d'un facteur de transcription.• Les protéines proies (interacteurs potentiels) sont fusionnées au domaine d'activation de la machinerie basale de transcription DA d'un facteur de transcription.

• Les protéines fusions sont exprimées dans des cellules de levure contenant un gène rapporteur dont l'expression est placée sous le contrôle du site de fixation pour le domaine de fixation à l'ADN DF.

Page 10: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

DFAppât X

DAProie Y

• Lorsque la protéine proie Y est capable d'interagir avec la protéine appât X, le domaine d'activation se retrouve à proximité du promoteur du gène rapporteur et la transcription a lieu.

Gène rapporteur

ARN rapporteurARN rapporteur

ARN rapporteurARN rapporteur

ARN rapporteur

ARN rapporteur

ARN rapporteurARN rapporteur

DAProie Y

LE DOUBLE-HYBRIDE DANS LA LEVURE,le test

Page 11: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

QUELLES INTERACTIONS SONT IDENTIFIEES PAR UN CRIBLE DOUBLE HYBRIDE ?

- Interactions permanentes

- Interactions transitoires dont les interactions enzyme-substrat (ex: 10 à 40 % des interactions kinase-substrat).

- Interactions qui n'existent pas physiologiquement Faux-positifs

DFAppât X

Gène rapporteur

ARN rapporteurARN rapporteur

ARN rapporteurARN rapporteur

ARN rapporteur

ARN rapporteur

ARN rapporteurARN rapporteur

L'appât auto-activateur(activation de la transcription en absence

d'interacteur)

DFAppât X

DAProie Y

DFAppât A

DFAppât B

DFAppât C

La proie collante(interagit avec un très grand nombre

d'appâts)

Page 12: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

QUELLES INTERACTIONS NE SONT PAS IDENTIFIEES PAR UN CRIBLE DOUBLE HYBRIDE ?

- Les interactions impliquant des protéines qui présentent des problèmes:

- structuraux (repliement)- stabilité- toxicité- mauvaise localisation (protéines membranaires)- modification post-traductionnelle

- Estimation: 80 à 90 % des interactions sensées exister, n'auraient pas été détectées Faux-négatifs

évolution des méthodes de double-hybrides pour palier à ces problèmes.

Page 13: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

PRINCIPAUX CRIBLES DOUBLE-HYBRIDE A GRANDE ECHELLE

Helicobacter pylori 1524 Rain et al.*

Saccharomyces cerevisiae 840 Uetz et al.*

4500 Ito et al.

Caenorhabditis elegans 4000 Li et al.

Drosophila melanogaster 2060 Formstecher et al.*

20500 Giot et al.*

1800 Stanyon et al.*

Page 14: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

COMPARAISON DES RESULTATS DES 3 CRIBLES DOUBLE-HYBRIDE DROSOPHILE

Giot et al.Science 2003

Formstecher et al.Genome Res 2005

Stanyon et al. Genome Biol 2004

951 interactions extraites de la littérature

(20/885=2.3%)(51/2787=1.8%)

(9/605=1.5%)• Peu de recouvrement entre expériences• Peu de recouvrement avec la littérature, mais des recouvrements du même ordre quelle que soit l'expérience• Meilleur recouvrement entre expériences et littérature qu'entre expériences

Page 15: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

192 63823Giot et al.

Science 2003Formstecher et al.Genome Res 2005

COMPARAISON DES RESULTATS DE 2 CRIBLES DOUBLE-HYBRIDE DROSOPHILE

SUR 30 APPATS IDENTIQUES

Le 'faible' recouvrement est dû aux méthodologies employées:- Giot et al. protéines entières- Formstecher et al. fragments de protéinesLes résultats des deux approches sont complémentaires.

Page 16: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

LES SCORES DE CONFIANCE

Probabilités basées sur des prédicteurs:

- # d'interacteurs/proie- orientation de l’interaction- probabilité d'interaction appât/proie comparée au hasard- # d’observations indépendantes de l’interaction- clustering local du réseau- région du gène clonée (5’ UTR, CDS, 3’ UTR)

ATTENTION Une interaction avec un score faible n'est pas

forcément un faux-positif!

Page 17: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

Tag Appât Y

anticorps anti-Tag

PRINCIPES DU TANDEM-AFFINITY PURIFICATION

Page 18: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

QUELLES INTERACTIONS SONT/NE SONT PAS IDENTIFIEES PAR LE TAP-TAG ?

- Interactions permanentes complexe

- Faux-positifs 20% (estimation)

- Complexes identifiés en conditions quasi physiologiques(cellules, animaux entiers)

-Variation de la composition des complexes (par exemple, en fonction d'un stimulus, de l'activation d'une voie…)

- Pas d'interactions transitoires- Pb: conformationgènes essentielstrès petites protéinesprotéines non solubles

Page 19: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

LE PROBLEME DE LA REPRESENTATION DES RESULTATS DE TAP-TAG DANS LES GRAPHES

Y2H interactions directes

Tap-TAG composition des complexes

Qui interagit avec qui?

Quelle représentation dans les graphes?

Matrix model Spoke model

Expériences Tap-TAG

Données de la littérature

Réalité

Page 20: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

L'INTEGRATION DES DONNEES POUR 'VALIDER' LES INTERACTIONS ISSUES DES EXPERIENCES A GRANDE

ECHELLE

Une interaction a plus de chance d'exister lorsque:

- l'interaction a été identifiée par des méthodes expérimentales différentes- les protéines contiennent des domaines connus pour interagir- les deux protéines sont localisées dans le même compartiment cellulaire- leur expression est corrélée (correlation interactome-transcriptome)- leurs annotations fonctionnelles (Gene Ontology) sont corrélées- l'interaction est connue chez un autre organisme (notion d'interologue)

Ce que j'en pense:

Ces notions sont trop restrictives……et ne laissent pas la place à la nouveauté et à la possibilité de découvrir de nouveaux phénomènes.

Page 21: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

DES SOLUTIONS ALTERNATIVES

1- Les jeux de données:

- Des jeux de données d'interactions mixant des interactions d'origines différentes: littérature, expériences à petite et à grande échelles- Multiplicité des jeux de données, de 'stringences' différentes- Adaptation des jeux de données à la question biologique posée(analyse globale jeux de données de haute confiance, analyse locale jeux de données le plus large possible)

2- Les méthodes d'analyses:

- Validées statistiquement - Résistantes au bruit

Ce sont celles que nous avons adoptées!

3- La représentation dans les graphes

- Poids des arêtes- Adaptation des méthodes d'analyses

Page 22: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

Sommets =

protéines

LES RESEAUX D'INTERACTIONS

Arêtes = interactions physiques

ANALYSER LES RESEAUX D’INTERACTIONS =

APPORTER DE L’INFORMATION SUR LA FONCTION CELLULAIRE DES GENES/PROTEINES

Page 23: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

PRINCIPE: …ne pas comparer les protéines elles-mêmes……mais leurs groupes d’interacteurs respectifs…

HYPOTHESE: plus les protéines possèdent d’interacteurs communs,

plus elles doivent être fonctionnellement reliées.

A B

D

C

Page 24: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

UNE TRADUCTION MATHEMATIQUE POSSIBLE DE L'HYPOTHESE:

LA DISTANCE DE CZEKANOWSKI-DICE

| XY | + | XY |

| X \ (XY) | + | Y \ (XY) | D(X, Y) =

YX

e c a

fghd

b

8 + 3

2 + 3 =

Page 25: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

X

Y

ZT

PRODISTIN(Protein Distance based on Interactions),

une méthode de classification fonctionnelle des protéines

• Disposer d’une liste d'interactions entre protéines

• Construire un arbre de classification à partir des distances

X Y Z T

X - 0.4 0.5 0.7

Y - 0.6 0.6

Z - 0.8

T -

Tableau de distances

• Calculer la distance entre les protéines

X

Y

ZT

• Identifier des classes fonctionnelles de protéines d’après:- les annotations fonctionnelles pour les protéines - la topologie des sous-arbres

Principales étapes de la méthode

Page 26: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

UN ARBRE PRODISTIN DE 602 PROTEINES DE LEVURE

Quelle est la signification biologique du regroupement des protéines dans

l’arbre ?

2139 protéines2946 interactions

Page 27: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

UTILISATION DES ANNOTATIONS FONCTIONNELLES POUR IDENTIFIER DES CLASSES DANS L’ARBRE

Les classes PRODISTINUne classe contient au moins 3 protéines partageant la même annotation fonctionnelle.Ces protéines représentent au moins 50% des protéines de la classe.

Cycle cellulaire

Cycle cellulaire

Cycle cellulaire

Page 28: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

Arbre de classification fonctionnelle

de 602 protéines de

levure selon la fonction cellulaire

- 67% des protéines de l’arbre classées - 64 classes- 3-36 protéines- 30/44 fonctions cellulaires

Page 29: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

CLASSE 'DNA METABOLISM' ET 'CELL CYCLE'

Complexe pré-réplication

Complexe protéine kinase

Réplication télomère

Cible le CPR sur l'origine

Contrôle du cycle celulaire

Structure chromatine

??Duplication spindle pole body

PRODISTIN - regroupe les protéines impliquées dans les mêmes complexes protéiques, voies ou processus biologiques- permet d’inférer une fonction cellulaire pour des protéines de fonction inconnue (42/93)

Page 30: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

PREDICTIONS DE FONCTION CELLULAIRE

93 protéines de fonction inconnue

42 dans des classes PRODISTIN

une fonction cellulaire est prédite

2 prédictions nouvelles (5%)

40 prédites par d'autres méthodes bioinfo ou

récemment caractérisées expérimentalement

+

27 en accord (64%)

13 différentes (30%)

Page 31: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

EVALUATION STATISTIQUE DE LA QUALITE DES CLASSES ET DES PREDICTIONS FONCTIONNELLES

(1)- Le regroupement des protéines dans les classes est-il significatif? Est-il différent d'un regroupement au hasard? Test sur des réseaux au hasard de topologie identique – ‘Reshuffling’ 15 classes au lieu de 64 Significatif - Quelle est la qualité des prédictions fonctionnelles? On suppose que toutes les protéines membres d'une même classe assurent la fonction cellulaire de la classe; comparaison de ces prédictions avec les fonctions cellulaires connues. Taux de succès = # de fonctions correctement prédites/ # de prédictions 67 %

- Quelle est la qualité topologique des classes? Index de robustesse des classes. Vérifie l'adéquation de la représentation en arbre avec les valeurs de distances 0 < 0.96 < 1

Page 32: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

- Comment la méthode PRODISTIN réagit-elle à la présence de 'bruit' dans les données d'interactions? Test sur des réseaux de topologies différentes – ‘Rewiring’ Quel est le taux de succès pour les prédictions?

0

100

200

300

400

500

600

0 10 20 30 40 50

% rewiring

# p

rote

ins

pre

dic

ted

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

pre

dic

tio

n r

ate

EVALUATION STATISTIQUE DE LA QUALITE DES CLASSES ET DES PREDICTIONS FONCTIONNELLES (2)

Page 33: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

• PRODISTIN, une méthode de classification fonctionnelle des protéines à partir du réseau d’interactions protéine-protéine, validée statistiquement

• Extrait de l’information fonctionnelle à partir d’un réseau complexe en donnant une vision intégrée des fonctions

• Regroupe les protéines impliquées dans les mêmes fonctions cellulaires

• Prédiction de fonction cellulaire pour les protéines de fonction inconnue (67% de taux de succès)

• Un nouvel outil complémentaire à l’analyse de séquence pour la prédiction de fonction, permettant une nouvelle approche de la fonction des gènes/protéines au niveau cellulaire

• Prodistin Web Server: http://gin.univ-mrs.fr/webdistin

LA METHODE PRODISTIN : CONCLUSIONS

Brun et al., 2003, Genome Biology, 5:R6Baudot et al., 2004, Genome Biology, 5:R76

Page 34: INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

Anaïs BAUDOTBernard JACQChristine BRUN

David MARTINPierre MOUREN

LGPD, IBDM, Marseille

IML, Marseille

Alain Guénoche

IRD, Montpellier

François Chevenet

Hybrigenics, Paris

Jérôme Wojcik

Laurent Daviet