ei1 m1 ies - thÈorie des jeux pour líeihebergement.u-psud.fr/manant/sites/default/files/cours ies...

36
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs EI1 M1 IES - ThÈorie des jeux pour líEI Matthieu Manant - Nicolas SouliÈ UniversitÈ Paris-Saclay 2015/2016

Upload: dangdat

Post on 13-Sep-2018

216 views

Category:

Documents


1 download

TRANSCRIPT

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

EI1 M1 IES - ThÈorie des jeux pour líEI

Matthieu Manant - Nicolas SouliÈ

UniversitÈ Paris-Saclay

2015/2016

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Introduction ‡ la thÈorie des jeux (1/2)

Importance de la stratÈgie et illustration du principe de la thÈoriedes jeux qui cherche ‡ formuler des stratÈgies

Les idÈes audacieuses sont comme les piËces quíon dÈplacesur un Èchiquier : on risque de les perdre mais elles peuventaussi Ítre líamorce díune stratÈgie gagnante. Goethe(1749-1832).Líessence de la stratÈgie est le choix díaccomplir ses

activitÈs díune maniËre di§Èrente de celle de ses concurrents.Porter (1947-), Èconomiste.

Quíest-ce que la thÈorie des jeux ?ouvrages fondateurs : Theory of Games and Economic Behavior, vonNeuman et Morgenstern [1944]dÈveloppements importants avec les travaux de Nash [1950]pourquoi thÈorie des jeux ? ! rÈfÈrence aux jeux simples que laTDJ rÈsout : Èchecs, pierre/papier/ciseaux, etc.! par extension : toutes les situations avec plusieurs joueurs et des

rËgles. ex. football, jeux de cartes, diplomatie, nÈgociation, etc.

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Introduction ‡ la thÈorie des jeux (2/2)

Quand utiliser la thÈorie des jeux ?

outil mathÈmatique pour formaliser et analyser les stratÈgies ouchoix díagents en interaction

quelle stratÈgie optimale pour un agent si son choix a un impact surceux des autres ?formaliser des situations complexes ‡ analyser

nombreux champs díapplication : Èconomie, sciences politiques,Èthologie (Ètude des comportements animaux), psychologie,stratÈgie militaire

du grec stratos ageÓn, i.e. conduire une armÈe : art de diriger etcoordonner des actions pour atteindre un objectifen Èconomie : situations avec peu de Örmes en interaction, aide ‡ ladÈcision sur les choix de prix, de quantitÈ ‡ produire,díinvestissements en R&D ou de publicitÈ, etc.

! objectif du cours : description de stratÈgies dans des cadres biendÈÖnis

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

DÈÖnition díun jeu (1/3)

Souvent, 3 ÈlÈments pour dÈÖnir un jeu

les joueurs : souvent des Örmesles stratÈgies : chaque joueur peut prendre des dÈcisions parmi unensemble de stratÈgies possibles

les paiements ou gains : une combinaison ou proÖl de stratÈgiesdonnÈe aboutit ‡ un paiement

! thÈorie des jeux non-coopÈratifs

i.e. pas de coordination des joueurs sur les stratÈgies ‡ choisir

6= jeux coopÈratifs, non-abordÈ ici : analyse des choix de coalition,díalliÈs

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

DÈÖnition díun jeu (2/3)

CaractÈrisation díun jeu (souvent)

dÈcisions individuelles sans concertation avec jeux ìstatiqueî (ici)6= jeux dynamiques qui tiennent compte du temps

joueurs rationnels(1) choix de stratÈgie pour maximiser le paiement(2) anticipation des choix des autres joueurs

information complËte : pour chaque joueur, connaissance de sesstratÈgies et de celles des autres joueurs, de ses paiements et deceux des autres joueurs

ex. Bonnie et Clyde savet que tous les deux peuvent avouer ou nier

information imparfaite : pour chaque joueur, pas de connaissancede líhistoire des dÈcisions des autres joueurs au moment de prendreune dÈcision

! incertitude sur les consÈquences de ses dÈcisions

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

DÈÖnition díun jeu (3/3)

! dÈtermination díune stratÈgie optimale basÈe sur líimpact de sastratÈgie sur les stratÈgies des autres joueurs! description díun jeu

soit sous forme normale ou stratÈgique : souvent pour les jeuxsimultanÈs

soit sous forme extensive ou tabulaire : souvent pour les jeuxsÈquentiels

! dÈtermination des stratÈgies

stratÈgies pures : choix díune action simple parmi un ensembledíactions possibles

stratÈgies mixtes : choix díune probabilitÈ associÈe ‡ chaque action

! ici : analyse des stratÈgies pures

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Forme normale (1/8)

Quand utiliser une forme normale ?

dÈcrit souvent un jeu simultanÈ, i.e. dÈcisions simultanÈes des joueurs

ex. dilemme du prisonnier - proposÈ par A.W. Tucker en 1950

2 joueurs aprËs un vol de banque interpellÈs par la police et mis dans2 cellules sans communiquer

líun avoue et líautre nie : libÈration pour lui / 10 ans pour lecompliceles deux avouent : 5 ans pour les deuxles deux nient : 1 an pour les deux (faute de preuve, oncondamne...)

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Forme normale (2/8)

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Forme normale (3/8)

Quelle stratÈgie optimale pour les deux joueurs ?

quel choix pour Bonnie si Clyde nie

nier ! 1 an de prisonavouer ! 0 annÈe

quel choix si Clyde avoue

nier ! 10 ans de prisonavouer ! 5 ans de prison

Bonnie prÈfËre avouer que Clyde avoue ou nie

! rÈsultat simple... mais nombreuses applications en Èconomie, Ècologie,politique internationale, etc.! modÈlisation díune campagne publicitaire co˚teuse

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Forme normale (4/8)

Dilemme Pepsi / Coca-Cola : publicitÈ comparative ou non ?loi du 18/01/1992 du code de la consommation (L.121-8/14)

conditions díapplication trËs restrictives : objectivitÈ, impartialitÈ,produits identiques, dÈmontrabilitÈ, etc.

paiements du jeu : I campagne publicitaire positive pour le produit(+5), nÈgative pour le concurrent (-5), I co˚t de campagne (-1)

Figure: Matrice de paiement du dilemme du prisonnier

Autre application : choix díun prix - baisser les prix pour gagner desparts de marchÈ... sauf si le concurrent baisse aussi son prix...

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Forme normale (5/8)

Chicken Game entre Jim et Buzz

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Forme normale (6/8)

DeÖnition

Un jeu sous forme normale est dÈcrit de la faÁon suivante :

1 un ensemble I # f1, ...,Ng de N joueurs.2 chaque joueur i = f1, ...,Ng peut choisir une stratÈgie parmi unensemble de stratÈgies Si #

!s1i , ..., s

mki

", o˘ mk est le nombre de

stratÈgies accessibles du joueur i et sji , j = f1, ...,mkg, chaquestratÈgie particuliËre accessible du joueur i .

3 s # fs1, ..., sN g, proÖl particulier de stratÈgies, i.e. une liste destratÈgies de tous les joueurs (8i si 2 Si )

4 Chaque joueur i , i = f1, ...,Ng, reÁoit un paiement pi (s) - un rÈel- qui dÈpend du proÖl de stratÈgies s.

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Forme normale (7/8)

Remarques

di§Èrence entre ensemble de stratÈgies et proÖl de stratÈgies

ensemble Si des stratÈgies accessibles au joueur iproÖt de stratÈgies s , liste des stratÈgies e§ectivement choisies partous les joueurs.

nombre Öni mk de stratÈgies accessibles dans líensemble Si pourchaque joueur : pas toujours vrai, par exemple dans le cas de choixde prix

importance de líordre des stratÈgies pour le proÖl de stratÈgies

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Forme normale (8/8)

Application au dilemme du prisonnier1 Ensemble de N = 2 joueurs : I # fBonnie, Clydeg.2 Ensembles de stratÈgies

SBonnie = fnier, avouergSClyde = fnier, avouerg

! stratÈgies des joueurs : fnier, nierg, fnier, avouerg,favouer, nierg et favouer, avouerg avec stratÈgie de Bonnie enpremier stratÈgie de Clyde en second

3 Paiements associÈs ‡ chaque proÖl

pBonnie (fnier, nierg) = (1 pClyde (fnier, nierg) = (1pBonnie (fnier, avouerg) = (10 pClyde (fnier, avouerg) = 0pBonnie (favouer, nierg) = 0 pClyde (favouer, nierg) = (10pBonnie (favouer, avouerg) = (5 pClyde (favouer, avouerg) = (5

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Quíest-ce quíun Èquilibre ? (1/2)

Quels stratÈgies pour un jeu ?

dans le dilemme du prisonnier : les joueurs vont choisir díavouer oude nier ?

si Bonnie nie, Clyde avoue : 0 annÈe plutÙt quíun 1 an ! mais siBonnie anticipe ce choix, elle avoue : 5 ans plutÙt que 10 ans ...

! rÈsultats non-coopÈratif avec 5 ans pour les deux plutÙt que 1 an! dilemme des prisonniers

mÈthodes pour anticiper les choix des joueurs ! introduction duconcept díÈquilibre

! dans líidÈal, sÈlectionner un seul proÖl parmi les proÖls de stratÈgie,i.e. pas díhÈsitation pour les joueurs sur la stratÈgie ‡ adopter

! Èquilibre unique du jeuex. pas díÈquilibre unique pour dilemme du prisonnier : ÈquilibrecoopÈratif o˘ les deux joueurs nient et líÈquilibre non-coopÈratif o˘les deux joueurs avouent.

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Quíest-ce quíun Èquilibre ? (2/2)

Notation

ensemble des stratÈgies des autres joueurs que le joueur i :

s(i # fs1, ..., si(1, si+1, ..., sN g

! rÈÈcriture díun proÖl de stratÈgie sous une autre forme

S = fs1, ..., si(1, si , si+1, ..., sN g= fsi , s(ig .

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Equilibre en stratÈgie dominante (1/4)

Concept díÈquilibre dit en stratÈgie dominante

critËre qui indique ‡ chaque joueur comment Èliminer certainesstratÈgies

DeÖnition

Une stratÈgie s)i díun joueur i 2 I est dite dominante si, quelles quesoient les stratÈgies des autres joueurs, choisir la stratÈgie s)i maximise lepaiement du joueur i . Formellement, pour tous choix de stratÈgies s(ides joueurs autres que i , on a :

pi (s)i , s(i ) > pi (si , s(i )

! stratÈgie telle que le paiement est plus important que pour touteautre stratÈgie! matrice rÈduite de paiements par Èlimination itÈrÈe

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Equilibre en stratÈgie dominante (2/4)

Application au dilemme du prisonnier

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Equilibre en stratÈgie dominante (2/4)

Application au dilemme du prisonnier

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Equilibre de Nash (1/4)

... mais pas toujours díÈquilibre en stratÈgie dominante : ex. de laBataille des sexes - jeu de coordination ou jeu des standards

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Equilibre de Nash (2/4)

! concept díÈquilibre de Nashintroduit en 1951 par le mathÈmaticien et prix Nobel J. Nash :preuve de líexistence díun concept díÈquilibreconcept díÈquilibre souvent utilisÈ en Èconomie : concept utilisÈ parCournot dËs 1838

DeÖnition

Un proÖl de stratÈgies s) #!s)1 , s

)2 , ..., s

)N

"est dit Èquilibre de Nash

(EN) si aucun joueur nía intÈrÍt ‡ dÈvier unilatÈralement de sa stratÈgie,i.e. si tous les autres joueurs ne choisissent pas une stratÈgie di§Èrente dela stratÈgie de Nash. Formellement, pour tous choix de stratÈgies s(i desjoueurs autres que i , on a :

pi#s)i , s

)(i$> pi

#si , s

)(i$.

Application ‡ deux joueurs : proÖl%s)Bonnie, s

)Clyde

&E.N. si pour les

deux joueurs et pour tout choix quelconque#sBonnie, sClyde

$on a

pBonnie%s)Bonnie, s

)Clyde

&> pBonnie

%sBonnie, s

)Clyde

&

pClyde%s)Bonnie, s

)Clyde

&> pClyde

#s)Bonnie, sClyde

$.

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Equilibre de Nash (3/4)

Pourquoi est-ce un Èquilibre ?

parce que la stratÈgie de chaque joueur est une meilleure rÈponseaux meilleures rÈponses des autres joueurs

! permet díobtenir le proÖt maximal Ètant donnÈes les stratÈgies desautres joueurs

Equilibre de Nash en pratique

pour un proÖl de stratÈgies donnÈes, chaque joueur a-t-il intÈrÍt ounon ‡ dÈvier unilatÈralement, i.e. si le choix díune autre stratÈgie luipermet díobtenir un paiement plus important

NB dÈviation unilatÈrale = chaque joueur suppose que tous lesautres joueurs ne choisissent pas díautre stratÈgie

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Equilibre de Nash (4/4)

Application ‡ la Bataille des sexes (opÈra, opÈra) EN

ni Bonnie, ni Clyde níont intÈrÍt ‡ dÈvier unilatÈralement

pas díintÈrÍt pour Bonnie ‡ choisir base-ball : si Clyde ìcontinueî dechoisir opÈra, paiement 3 (stratÈgie opÈra) plutÙt que paiement 0(stratÈgie base-ball).pas díintÈrÍt pour Clyde ‡ choisir base-ball : si Bonnie ìcontinueî dechoisir opÈra, paiement 1 (stratÈgie opÈra) plutÙt que paiement 0(stratÈgie base-ball).

! 2 E.N. (opÈra, opÈra) et (base-ball, base-ball)! faible pouvoir prÈdictif díun jeu avec plusieurs E.N. : les deux joueurspeuvent anticiper deux choix di§Èrents pour líautre joueur! analyse plus complexe pour connaÓtre líissue du jeu (cf. par exemplejeu rÈpÈtÈs)

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Non-existence díun EN (en stratÈgies pures)

Exemples díun jeu modiÖÈ sans EN

! variante de la Bataille des sexes : Bataille des sexes aprËs 10 ans devie commune

faible satisfaction de Clyde avec Bonnie : prÈfÈrence pour les sortiesseul... mais pas pour Bonnie (rÙles peuvent Ítre inversÈs...)jeu sans EN : intÈrÍt pour chacun ‡ dÈvier unilatÈralement des 4proÖls de stratÈgies

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Forme extensive (1/5)

Jeu sous forme extensiveforme normale : jeu simultanÈ sans information sur les stratÈgiesdes autres joueursforme extensive : jeu o˘ les joueurs jouent ‡ des momentsdi§Èrents et plus díune fois

jeu sÈquentiel avec timing

DeÖnition

Jeu sous forme extensive :

1 Un ensemble I # f1, ...,Ng de N joueurs.2 Un arbre de jeu avec un noeud de dÈcision initial, díautres noeuds dedÈcision et des branches liant les noeuds de dÈcision.entre eux.

3 Chaque noeud de dÈcision est associÈ ‡ la dÈcision díun joueur quichoisit une action parmi les actions possibles reprÈsentÈes par lesbranches aval.

4 Les paiements de chaque joueur sont indiquÈs aux noeuds terminaux.

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Forme extensive (2/5)

Forme extensive ou en arbre de dÈcisionforme adaptÈe aux jeux sÈquentiels (joueur 1 puis joueur 2, etc.)permet de reprÈsenter les ensembles díinformation des joueursex. Trust Game : Mise ‡ prix pour la tÍte de Tuco qui doit Ítrependu haut et court : 5000$. Blondin propose un marchÈ que Tucopeut accepter ou refuser : síil le ìcaptureî, Blondin coupera la cordeet partagera la rÈcompense. Et si Blondin Èvite la corde ? ...

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Forme extensive (3/5)

Jeu du Terroriste et du Pilote : un Terroristeannonce quíil fera exploser une bombe síils ne

vont pas Paris contre líavis des autorits franÁaisesqui ordonnent au Pilote díattrir Paris.

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Forme extensive (4/5)

jeu ‡ information stratÈgique : choix du Terroriste dÈpend du choixdu pilote

núud I : SPilote = fParis, Marseilleg)núud IIa : STerroriste = fBombe, Pas Bombegnoeud IIb : STerroriste = fBombe, Pas Bombeg

plusieurs dÈcisions pour un individu dans un jeu! dÈÖnition particuliËre de la notion de stratÈgie intÈgrant les dÈcisions

‡ chaque noeud de dÈcision

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Forme extensive (5/5)

DeÖnition

Une stratÈgie pour le joueur i , notÈe si , est une liste complËte díactionsdu joueur, le joueur ayant ‡ choisir une action aux noeuds de dÈcision leconcernant.

Quelles stratÈgies pour le terroriste et le pilote ?

pour le Terroriste : dÈcision selon sa position dans le jeu, i.e. selonla dÈcision du pilote

(PB ,B) : PB choix au noeud IIa et B choix au noeud IIb! 4 stratÈgies : (B ,B) , (B ,PB) , (PB ,B) et (PB ,PB)

pour le Pilote : 2 stratÈgies Par et Mar! 8 proÖls de stratÈgies : (Par , (B,B)), (Par , (B,PB)),

(Par , (PB,B)), (Par , (PB,PB)), (Mar , (B,B)), (Mar , (B,PB)),(Mar , (PB,B)) et (Mar , (PB,PB)).

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Ra¢nement de líEN (1/6)

Forme normale plus simple pour les EN

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Ra¢nement de líEN (2/6)

! 3 EN : (Mar , (B,PB)), (Mar , (PB,PB)) et (Par , (PB,B))

multiplicitÈ des Èquilibres complique líinterprÈtation des EN

! ra¢nement de líÈquilibre de Nash

si choix du Pilote de voler vers Marseille ! choix du Terroriste de nepas faire exploser la Bombe

! une fois que le Pilote choisit, pas díautre choix pour le Terroriste quede ne pas faire exploser la BombelíEN ne rend pas compte de la possibilitÈ pour le Pilote decomprendre que le Terroriste choisit de ne pas faire exploser laBombe síil choisit de voler vers Marseilleen thÈorie des jeux, menace non-crÈdible du Terroriste

formaliser líexclusion des EN non-raisonnables : intÈgrer líimpact dudu joueur qui dÈcide en premier sur les choix du du joueur qui dÈcideen second ! notion de sous-jeu.

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Ra¢nement de líEN (3/6)

DeÖnition

Un sous-jeu est líensemble formÈ par un núud de dÈcision issu du jeuoriginal (núud initial) et par tous les núuds qui suivent directement cenúud. On parle de sous-jeu propre si le jeu obtenu est di§Èrent du jeuoriginal.

!jeu du Terroriste et du Pilote dÈcomposÈ en 3 sous-jeux

le jeu lui-mÍme et les deux sous-jeux propres issus de deux núudsinitiaux IIa et IIb

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Ra¢nement de líEN (4/6)

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Ra¢nement de líEN (5/6)

On introduit ensuite le ra¢nement du concept díEN suivant (Selten,1965) :

DeÖnition

Un rÈsultat du jeu est un Èquilibre parfait en sous-jeu (EPSJ) síilcorrespond ‡ un EN pour chaque sous-jeu du jeu original.

! EPSJ : suite de dÈcisions pour chaque joueur ‡ chaque sous-jeu

ici, (Mar , (PB,PB)) est líunique EPSJ du jeu.

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Ra¢nement de líEN (6/6)

Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs

Jeux rÈpÈtÈs (1/6)

Jeu unique ìone-shotî rÈpÈtÈ

mÍme jeu rÈpÈtÈ sur plusieurs pÈriodes

‡ une pÈriode donnÈe, information sur les choix aux pÈriodesprÈcÈdentes (histoire du jeu)

Èmergence díÈquilibres coopÈratifs