dilemme du prisonnier

7
Définition Le dilemme du prisonnier est un exemple célèbre de la théorie des jeux caractérisant les situations où deux joueurs auraient intérêt à coopérer, mais où les incitations à trahir l'autre sont si fortes que la coopération n'est jamais sélectionnée par un joueur rationnel lorsque le jeu n'est joué qu'une fois. Il illustre ainsi que les concepts d'équilibre de la théorie des jeux ne conduisent pas nécessairement à des allocations qui seraient pourtant préférées par tous les joueurs. Sous sa forme répétée, c'est-à-dire lorsque le jeu est joué plusieurs fois de suite, il sert d'illustration au folk theorem (en) voulant que toutes les issues du jeu peuvent être des équilibres d'un jeu répété un assez grand nombre de fois. Du fait de la grande généralité de la situation décrite, le dilemme du prisonnier a été appliqué, sous une forme formelle ou plus discursive, dans un grand nombre de domaines, comme l'économie, la biologie, la politique internationale ou la psychologie. Il fait partie des jeux couramment employés en économie expérimentale pour tester l'existence de comportements obéissant à la rationalité économique et la capacité des individus à identifier l'équilibre de Nash d'un jeu. Principe La forme habituelle de ce dilemme est celle de deux prisonniers (complices d'un délit) retenus dans des cellules séparées et qui ne peuvent communiquer.

Upload: soukaina-tadlaoui

Post on 13-Aug-2015

13 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Dilemme Du Prisonnier

Définition

Le dilemme du prisonnier est un exemple célèbre de la théorie des jeux caractérisant les situations où deux joueurs auraient intérêt à coopérer, mais où les incitations à trahir l'autre sont si fortes que la coopération n'est jamais sélectionnée par un joueur rationnel lorsque le jeu n'est joué qu'une fois. Il illustre ainsi que les concepts d'équilibre de la théorie des jeux ne conduisent pas nécessairement à des allocations qui seraient pourtant préférées par tous les joueurs.

Sous sa forme répétée, c'est-à-dire lorsque le jeu est joué plusieurs fois de suite, il sert d'illustration au folk theorem (en) voulant que toutes les issues du jeu peuvent être des équilibres d'un jeu répété un assez grand nombre de fois.

Du fait de la grande généralité de la situation décrite, le dilemme du prisonnier a été appliqué, sous une forme formelle ou plus discursive, dans un grand nombre de domaines, comme l'économie, la biologie, la politique internationale ou la psychologie.

Il fait partie des jeux couramment employés en économie expérimentale pour tester l'existence de comportements obéissant à la rationalité économique et la capacité des individus à identifier l'équilibre de Nash d'un jeu.

Principe

La forme habituelle de ce dilemme est celle de deux prisonniers (complices d'un délit) retenus dans des cellules séparées et qui ne peuvent communiquer.

si un des deux prisonniers dénonce l'autre, il est remis en liberté alors que le second obtient la peine maximale (10 ans) ;

si les deux se dénoncent entre eux, ils seront condamnés à une peine plus légère (5 ans) ;

si les deux refusent de dénoncer, la peine sera minimale (6 mois), faute d'éléments au dossier.

Ce problème modélise bien les questions de politique tarifaire : le concurrent qui baisse ses prix gagne des parts de marché et peut ainsi augmenter ses ventes et accroître éventuellement son bénéfice… mais si son concurrent principal en fait autant, les deux peuvent y perdre.

L'équilibre de Nash pour ce type de jeu ne conduit pas à un optimum de Pareto (c'est-à-dire un état dans lequel on ne peut pas améliorer le bien-être d’un individu sans détériorer celui d’un autre). À l'équilibre, chacun des prisonniers choisit de faire défaut même s'ils gagnaient à coopérer. Malheureusement pour

Page 2: Dilemme Du Prisonnier

les prisonniers, chacun est incité à tricher après avoir fait la promesse de coopérer. C'est le cœur du dilemme.

Ceci est cependant sensiblement différent d'une situation de marché libre où les deux agents économiques « prisonniers » peuvent coopérer pour atteindre un optimum de Pareto (parce que l'optimum vu par les producteurs ne va pas toujours dans l'intérêt du consommateur, les lois antitrust de tous les pays interdisent, officiellement du moins, les ententes entre producteurs concurrents).

Dans un jeu du dilemme du prisonnier répété, chaque joueur a l'opportunité de « punir » l'autre joueur pour sa précédente non-coopération. La coopération peut donc survenir dans cette configuration. L'incitation à tricher est inférieure à la menace de punition, ce qui introduit la possibilité de coopérer.

Le dilemme du prisonnier est utilisé par les économistes, les mathématiciens, les psychologues, les biologistes et les spécialistes de science politique. Le paradigme correspondant est également mentionné en philosophie et dans le domaine des sciences cognitives.

Formulation

La première expérience du dilemme du prisonnier a été réalisée en 1950 par Melvin Dresher et Merill Flood, qui travaillaient alors pour la RAND Corporation. Par la suite, Albert W. Tucker la présenta sous la forme d'une histoire :

Deux suspects sont arrêtés par la police. Mais les agents n'ont pas assez de preuves pour les inculper, donc ils les interrogent séparément en leur faisant la même offre. « Si tu dénonces ton complice et qu'il ne te dénonce pas, tu seras remis en liberté et l'autre écopera de 10 ans de prison. Si tu le dénonces et lui aussi, vous écoperez tous les deux de 5 ans de prison. Si personne ne se dénonce, vous aurez tous deux 6 mois de prison. »

On résume souvent les utilités de chacun dans ce tableau :

1 \ 2 Se tait Dénonce

Se tait (-1/2;-1/2) (-10;0)

Dénonce

(0;-10) (-5;-5)

Chacun des prisonniers réfléchit de son côté en considérant les deux cas possibles de réaction de son complice.

Page 3: Dilemme Du Prisonnier

« Dans le cas où il me dénoncerait : o Si je me tais, je ferai 10 ans de prison ;o Mais si je le dénonce, je ne ferai que 5 ans. »

« Dans le cas où il ne me dénoncerait pas : o Si je me tais, je ferai 6 mois de prison ;o Mais si je le dénonce, je serai libre. »

« Quel que soit son choix, j'ai donc intérêt à le dénoncer. »

Si chacun des complices fait ce raisonnement, les deux vont probablement choisir de se dénoncer mutuellement, ce choix étant le plus empreint de rationalité. Conformément à l'énoncé, ils écoperont dès lors de 5 ans de prison chacun. Or, s'ils étaient tous deux restés silencieux, ils n'auraient écopé que de 6 mois chacun. Ainsi, lorsque chacun poursuit son intérêt individuel, le résultat obtenu n'est pas optimal au sens de Vilfredo Pareto.

Ce jeu est à somme non nulle, c'est-à-dire que la somme des gains pour les participants n'est pas toujours la même : il soulève une question de coopération.

Pour qu'il y ait dilemme, la tentation T (je le dénonce, il se tait) doit payer plus que la coopération R (on se tait tous les deux), qui doit rapporter plus que la punition pour égoïsme P (je le dénonce, il me dénonce), qui doit être plus valorisante que la duperie S (je me tais, il me dénonce). Ceci est formalisé par :

T > R > P > S (ici : 0 > -0,5 > -5 > -10)

Exemples

Psychologie

Le dilemme du prisonnier se rencontre fréquemment dans les relations de couple. Prenons ainsi l'exemple d'un couple marié en état de conflit, chacun des partenaires ayant eu une aventure extra-conjugale à l'insu de l'autre. Chacun des deux voudrait pouvoir avouer sa faute et se réconcilier (coopération). Cependant, chacun des deux craint le mépris de l'autre s'il est le seul à avoir fauté, et préfère l'état de conflit

Politique internationale

Soit deux pays A et B. Les pays A et B peuvent choisir de maintenir ou non une armée. Si tous deux ont une armée (de force à peu près équivalente), la guerre est moins "tentante", car très coûteuse (situation de la guerre froide). Les dépenses militaires sont alors une perte nette pour les deux pays. Si un seul a une armée, il peut évidemment conquérir sans coup férir l'autre, ce qui est pire.

Page 4: Dilemme Du Prisonnier

Enfin, si aucun n'a d'armée, la paix règne et les pays n'ont pas de dépenses militaires. La situation de coopération permettant à chacun de ne pas avoir d'armée est évidemment préférable à la situation où les deux pays entretiennent une armée, mais elle est instable : chacun des deux pays a une forte incitation à se doter unilatéralement d'une armée pour envahir l'autre.

Récapitulation

Caracteristiques du jeu

Joueurs 2 prisonniers Espace de strategie Cellule de prison Sequence de decision simultanée Gains des joueurs :

liberté 6mois 5ans 10 ans

L’information a la disposition des joueurs :

si un des deux prisonniers dénonce l'autre, il est remis en liberté alors que le second obtient la peine maximale (10 ans) ;

si les deux se dénoncent entre eux, ils seront condamnés à une peine plus légère (5 ans) ;

si les deux refusent de dénoncer, la peine sera minimale (6 mois), faute d'éléments au dossier.

Typologie de jeu :

Jeu non cooperatif :

Les 2 joueurs sont intérrogés separement, sans qu ils puissent communiquer entre eux et s engagent a prendre une decision 

Jeu avec une decision simultannée

Les 2 joueurs prennent la decision en meme temps

Jeu statique

Les 2 joueurs prennent une seule decision

Jeu a information imparfaite

Page 5: Dilemme Du Prisonnier

Aucun des joueurs ne connait la decision prise de autre

Jeu a information complete

Les regles de jeu sont connues et maitrisés par les 2 joueurs