the orie des jeux

Upload: samirnet

Post on 04-Jun-2018

222 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/13/2019 The Orie Des Jeux

    1/162

    Introduction la Thorie des JeuxSebastien Konieczny

    [email protected]

    CRIL-CNRS

    Universite dArtois - Lens

    Introductiona la Theorie des Jeux p.1/77

  • 8/13/2019 The Orie Des Jeux

    2/162

    Thorie des Jeux

    DfinitionLa theorie des jeux permet une analyse formelle des problemesposes par linteraction strategique dun groupe dagents rationnels pour-suivant des buts qui leur sont propres.

    Introductiona la Theorie des Jeux p.2/77

  • 8/13/2019 The Orie Des Jeux

    3/162

    Thorie des Jeux

    DfinitionLa theorie des jeux permet une analyse formelle des problemesposes par linteraction strategique dun groupe dagents rationnels pour-suivant des buts qui leur sont propres.

    groupe

    interaction

    stratgique

    rationnels

    Introductiona la Theorie des Jeux p.2/77

  • 8/13/2019 The Orie Des Jeux

    4/162

    Thorie des Jeux

    DfinitionLa theorie des jeux permet une analyse formelle des problemesposes par linteraction strategique dun groupe dagents rationnels pour-suivant des buts qui leur sont propres.

    groupe

    interaction

    stratgique

    rationnels

    Normatif vs Descriptif

    Introductiona la Theorie des Jeux p.2/77

  • 8/13/2019 The Orie Des Jeux

    5/162

    A quoi sert la thorie des jeux ?

    Jeux de socit (checs, dames, go, ...), Jeux de cartes (bridge, poker, ...)

    Dois-je travailler ou faire semblant ? Est-ce que jcoute de la musique ce soir ?

    Enchres, vote

    Comportement animal

    Stratgies militaires/conomiques

    Partages de ressource (marchandage)

    Est-ce quune entreprise doit exploiter ses salaris ?

    Est-ce quune entreprise doit entrer sur un march ou pas ? Faut-il contrler les dclarations dimpots sur le revenu ?

    ...

    Introductiona la Theorie des Jeux p.3/77

  • 8/13/2019 The Orie Des Jeux

    6/162

    Un peu dhistoire...

    Cournot (1838), Borel (1921)

    Zermelo (1913) Von Neumann (1928)

    Theory of Games and Economic Behaviour, Von Neumann etMorgenstern (1944)

    Nash (1950) Selten (1965), Harsanyi (1967)

    Introductiona la Theorie des Jeux p.4/77

  • 8/13/2019 The Orie Des Jeux

    7/162

    Bibliographie

    M. Yildizoglu. Introduction a la theorie des jeux. Dunod. 2003.

    D. Kreps. Theorie des jeux et modelisationeconomique. Dunod. 1990. D. Luce, H. Raiffa. Games and Decision. Wiley. 1957.

    P. K. Dutta. Strategies and Games. MIT Press. 1999.

    D. Fudenberg, J. Tirole. Game Theory. MIT Press. 1991.

    J. Von Neumann, O. Morgenstern. Theory of Game and Economic Be-havior. Princeton University Press. 1944.

    Introductiona la Theorie des Jeux p.5/77

  • 8/13/2019 The Orie Des Jeux

    8/162

    Terminologie - Une petite taxonomie...

    Jeux somme nulle (strictement comptitifs) / Jeux somme non-nulle

    Jeux information complte / Jeux information incomplte Jeux information parfaite / Jeux information imparfaite

    Jeux coopratifs / Jeux non-coopratifs

    Jeux 2 joueurs / Jeux njoueurs

    Introductiona la Theorie des Jeux p.6/77

  • 8/13/2019 The Orie Des Jeux

    9/162

    Plan du cours

    Introduction - Formalisation dun jeu - Jeu sous forme normale - Jeusous forme extensive - Stratgie

    Concepts de solution - Stratgies dominantes

    Equilibre de Nash - Critre de Pareto - Niveau de scurit - Stratgiesmixtes

    Rsolution par chainage arrire - Menaces crdibles - Equilibresparfaits en sous-jeux

    Jeux somme nulle

    Jeux rpts - Dilemme itr du prisonnier

    Jeux information incomplte

    Jeux coopratifs - Marchandage

    Introductiona la Theorie des Jeux p.7/77

  • 8/13/2019 The Orie Des Jeux

    10/162

    Formalisation dun Jeu

    Quest-ce quun jeu ?

    Qui?Joueurs Quoi?Coups (actions/choix) - Stratgies

    Quand?Droulement du jeu

    Combien?Que rapporte chaque issue aux diffrents joueurs ?Autres informations importantes:

    Information

    Rptition

    Introductiona la Theorie des Jeux p.8/77

  • 8/13/2019 The Orie Des Jeux

    11/162

    Jeux sous forme stratgique - Exemple

    Joueur 2

    Joueur 1u v

    x 4,2 3,1y 2,5 9,0

    Introductiona la Theorie des Jeux p.9/77

  • 8/13/2019 The Orie Des Jeux

    12/162

    Utilit

    Une hypothse de base de la thorie des jeux est de considrer que lesagents sont rationnels, cest--dire quils tentent darriver la situation

    lameilleurepour eux. On appelleUtilitela mesure de chaque situation aux yeux de lagent.

    LUtilitenest ni une mesure du gain matriel, montaire, etc. mais unemesuresubjectivedu contentement de lagent.

    Introductiona la Theorie des Jeux p.10/77

  • 8/13/2019 The Orie Des Jeux

    13/162

    Utilit

    Une hypothse de base de la thorie des jeux est de considrer que lesagents sont rationnels, cest--dire quils tentent darriver la situation

    lameilleurepour eux. On appelleUtilitela mesure de chaque situation aux yeux de lagent.

    LUtilitenest ni une mesure du gain matriel, montaire, etc. mais unemesuresubjectivedu contentement de lagent.

    Utiliser une fonction dutilit pour dfinir les prfrences de lagent nesuppose pas que lagent utilise cette fonction, mais quil raisonne con-formment un ensemble de conditions de rationalit. Von Neuman etMorgenstern (1944), Savage (1954).

    Introductiona la Theorie des Jeux p.10/77

  • 8/13/2019 The Orie Des Jeux

    14/162

    Jeux sous forme stratgique

    Un jeu sous forme stratgique est dfini par :

    un ensembleN ={1, . . . , n}de joueurs pour chaque joueuriun ensemble de stratgiesSi ={s1, . . . , sni}

    pour chaque joueur iune fonction de valuation i : S1 . . . Sn IR,qui chaque ensemble de stratgies associe les gains du joueuri.

    Notations :

    On noterasun profil de stratgies{s1, . . . , sn}oi si Si.

    On notesile profilsdes stratgies autres que celles du joueur i:si ={s1, . . . , si1, si+1, . . . , sn}.

    On noteSlespace des stratgies, ie : S=ni=1Si

    Introductiona la Theorie des Jeux p.11/77

  • 8/13/2019 The Orie Des Jeux

    15/162

    Jeux sous forme extensive - Exemple

    1

    2 2

    (4,2) (3,1) (2,5) (9,0)

    x y

    s t u v

    Introductiona la Theorie des Jeux p.12/77

  • 8/13/2019 The Orie Des Jeux

    16/162

    Jeux sous forme extensive

    Un jeu sous forme extensive est dfini par :

    un ensembleN ={1, . . . , n}de joueurs un arbre fini compos de :

    un ensemble de noeuds{A , B , C , . . .}reprsentant les coups

    un ensemble de branches{x , y , z , . . .}reprsentant les alternatives

    chaque coup une fonction de nommage qui indique chaque noeud quel est le

    joueur qui doit jouer

    une fonction de valuation qui associe chaque noeud terminal un

    vecteur de nombres reprsentant les gains de chacun des joueurs une partition des noeuds en un ensemble densembles dinformations

    reprsentant les croyances (imparfaites) des joueurs

    Introductiona la Theorie des Jeux p.13/77

  • 8/13/2019 The Orie Des Jeux

    17/162

    Jeux sous forme extensive - Ensemble dinformations

    Joueur 1

    A

    Joueur 2B C

    (4,2) (3,1) (2,5) (9,0)

    x y

    s t u v

    Introductiona la Theorie des Jeux p.14/77

  • 8/13/2019 The Orie Des Jeux

    18/162

    Jeux sous forme extensive - Ensemble dinformations

    A

    B C

    (4,2) (3,1) (2,5) (9,0)

    x y

    s t u v

    Introductiona la Theorie des Jeux p.14/77

  • 8/13/2019 The Orie Des Jeux

    19/162

    Jeux sous forme extensive - Ensemble dinformations

    A

    B C

    (4,2) (3,1) (2,5) (9,0)

    x y

    u vu v

    Introductiona la Theorie des Jeux p.14/77

  • 8/13/2019 The Orie Des Jeux

    20/162

    Jeux sous forme extensive - Ensemble dinformations

    A

    B C

    (4,2) (3,1) (2,5) (9,0)

    x y

    u vu v

    Ensembles dinformation : {A}et{B, C}

    Coups simultans Incertitude (croyances)

    Introductiona la Theorie des Jeux p.14/77

  • 8/13/2019 The Orie Des Jeux

    21/162

    Relation entre formes stratgique et extensive

    A chaque jeu sous forme extensive correspond un jeu sous formestratgique dans lequel les joueurs choisissent simultanment les

    stratgies quils mettront en oeuvre. En revanche, un jeu sous forme stratgique peut correspondre

    plusieurs jeux sous forme extensive diffrents.

    Introductiona la Theorie des Jeux p.15/77

  • 8/13/2019 The Orie Des Jeux

    22/162

    Relation entre formes stratgique et extensive

    A chaque jeu sous forme extensive correspond un jeu sous formestratgique dans lequel les joueurs choisissent simultanment les

    stratgies quils mettront en oeuvre. En revanche, un jeu sous forme stratgique peut correspondre

    plusieurs jeux sous forme extensive diffrents.

    Unestratgieest la spcification complte du comportement dunjoueur dans nimporte quelle situation (dans un jeu sous formeextensive cela signifie donc pour chaque ensemble dinformation ocest ce joueur de jouer).

    Algorithme

    Introductiona la Theorie des Jeux p.15/77

  • 8/13/2019 The Orie Des Jeux

    23/162

    Stratgie

    Une strategie pure du joueur i est un plan daction qui prescrit uneaction de ce joueur pour chaque fois quil est susceptible de jouer. On

    note par Si lensemble des stratgies pures du joueur iet par si unestratgie pure de ce joueur.

    Introductiona la Theorie des Jeux p.16/77

  • 8/13/2019 The Orie Des Jeux

    24/162

    Relation entre formes stratgique et extensive

    Forme stratgique :

    Joueur 2

    Joueur 1u v

    x 4,2 3,1y 2,5 9,0

    Introductiona la Theorie des Jeux p.17/77

  • 8/13/2019 The Orie Des Jeux

    25/162

    Relation entre formes stratgique et extensive

    Forme stratgique :

    Joueur 2

    Joueur 1u v

    x 4,2 3,1y 2,5 9,0

    Forme extensive :

    A

    B C

    (4,2) (3,1) (2,5) (9,0)

    x y

    u v u v

    Introductiona la Theorie des Jeux p.18/77

  • 8/13/2019 The Orie Des Jeux

    26/162

    Relation entre formes stratgique et extensive

    Forme stratgique :

    Joueur 2

    Joueur 1s1 s2 s3 s4

    x 4,2 4,2 3,1 3,1y 2,5 9,0 2,5 9,0

    Forme extensive :

    A

    B C

    (4,2) (3,1) (2,5) (9,0)

    x y

    u v u v

    s1: u si x, u si y s2: u si x, v si y

    s3: v si x, u si y s4: v si x, v si y

    Introductiona la Theorie des Jeux p.19/77

  • 8/13/2019 The Orie Des Jeux

    27/162

    Elimination de stratgies domines

    Joueur 2

    Joueur 1u v

    x 4,2 3,1y 2,5 9,0

    Introductiona la Theorie des Jeux p.20/77

  • 8/13/2019 The Orie Des Jeux

    28/162

    Elimination de stratgies domines

    Joueur 2

    Joueur 1u v

    x 4,2 3,1y 2,5 9,0

    Introductiona la Theorie des Jeux p.20/77

  • 8/13/2019 The Orie Des Jeux

    29/162

    Elimination de stratgies domines

    Joueur 2

    Joueur 1u v

    x 4,2 3,1y 2,5 9,0

    Introductiona la Theorie des Jeux p.20/77

  • 8/13/2019 The Orie Des Jeux

    30/162

    Elimination de stratgies domines

    Joueur 2

    Joueur 1u v

    x 4,2 3,1y 2,5 9,0

    Une stratgiesiest (strictement) domine pour le joueur isi il existeune stratgiesi telle que pour tous les profilssi

    i(si

    , si)> i(si, si)

    Introductiona la Theorie des Jeux p.20/77

  • 8/13/2019 The Orie Des Jeux

    31/162

    Elimination de stratgies domines

    Joueur 2

    Joueur 1u v

    x 4,2 3,1y 2,5 9,0

    Une stratgiesiest faiblement domine pour le joueurisi il existe unestratgie si telle que pour tous les profils si

    i(si

    , si) i(si, si)

    Introductiona la Theorie des Jeux p.20/77

  • 8/13/2019 The Orie Des Jeux

    32/162

    Elimination de stratgies domines

    Joueur 2

    Joueur 1

    u v wx 3,6 7,1 4,8y 5,1 8,2 6,1

    z 6,0 6,2 3,2

    Introductiona la Theorie des Jeux p.21/77

  • 8/13/2019 The Orie Des Jeux

    33/162

    Elimination de stratgies domines

    Joueur 2

    Joueur 1

    u v wx 3,6 7,1 4,8y 5,1 8,2 6,1

    z 6,0 6,2 3,2

    Introductiona la Theorie des Jeux p.21/77

  • 8/13/2019 The Orie Des Jeux

    34/162

    Elimination de stratgies domines

    Joueur 2

    Joueur 1

    u v wx 3,6 7,1 4,8y 5,1 8,2 6,1

    z 6,0 6,2 3,2

    Introductiona la Theorie des Jeux p.21/77

  • 8/13/2019 The Orie Des Jeux

    35/162

    Elimination de stratgies domines

    Joueur 2

    Joueur 1

    u v wx 3,6 7,1 4,8y 5,1 8,2 6,1

    z 6,0 6,2 3,2

    Introductiona la Theorie des Jeux p.21/77

  • 8/13/2019 The Orie Des Jeux

    36/162

    Elimination de stratgies domines

    Joueur 2

    Joueur 1

    u v wx 3,6 7,1 4,8y 5,1 8,2 6,1

    z 6,0 6,2 3,3

    Introductiona la Theorie des Jeux p.21/77

  • 8/13/2019 The Orie Des Jeux

    37/162

    Elimination de stratgies domines

    Un jeu est dit rsolvable par limination itrative des stratgiesdomines, si on obtient un unique profil en liminant successivement

    des stratgies (strictement) domines. Les profils obtenus aprs limination itrative des stratgies

    (strictement) domines (EISD) ne dpendent pas de lordre choisi pourllimination des stratgies.

    Par contre, on peut obtenir des profils diffrents lorsque lon choisit desordres diffrents pour llimination itrative de stratgies faiblementdomines (EISfD).

    Les rsultats obtenus par EISD sont donc plus robustes que ceux

    obtenus par EISfD. Problme majeur de cette mthode: tous les jeux ne sont pas rsolvable

    par EISD !

    Introductiona la Theorie des Jeux p.22/77

  • 8/13/2019 The Orie Des Jeux

    38/162

    Equilibre de Nash

    Joueur 2

    Joueur 1

    u v wx 3,0 0,2 0,3y 2,0 1,1 2,0

    z 0,3 0,2 3,0

    Introductiona la Theorie des Jeux p.23/77

  • 8/13/2019 The Orie Des Jeux

    39/162

    Equilibre de Nash

    Joueur 2

    Joueur 1

    u v wx 3,0 0,2 0,3y 2,0 1,1 2,0z 0,3 0,2 3,0

    Introductiona la Theorie des Jeux p.23/77

  • 8/13/2019 The Orie Des Jeux

    40/162

    Equilibre de Nash

    Joueur 2

    Joueur 1

    u v wx 3,0 0,2 0,3y 2,0 1,1 2,0z 0,3 0,2 3,0

    Introductiona la Theorie des Jeux p.23/77

  • 8/13/2019 The Orie Des Jeux

    41/162

    Equilibre de Nash

    Joueur 2

    Joueur 1

    u v wx 3,0 0,2 0,3y 2,0 1,1 2,0z 0,3 0,2 3,0

    Introductiona la Theorie des Jeux p.23/77

  • 8/13/2019 The Orie Des Jeux

    42/162

    Equilibre de Nash

    Joueur 2

    Joueur 1

    u v wx 3,0 0,2 0,3y 2,0 1,1 2,0z 0,3 0,2 3,0

    Introductiona la Theorie des Jeux p.23/77

  • 8/13/2019 The Orie Des Jeux

    43/162

    Equilibre de Nash

    Joueur 2

    Joueur 1

    u v wx 3,0 0,2 0,3y 2,0 1,1 2,0z 0,3 0,2 3,0

    Introductiona la Theorie des Jeux p.23/77

  • 8/13/2019 The Orie Des Jeux

    44/162

    Equilibre de Nash

    Joueur 2

    Joueur 1

    u v wx 3,0 0,2 0,3y 2,0 1,1 2,0z 0,3 0,2 3,0

    Introductiona la Theorie des Jeux p.23/77

  • 8/13/2019 The Orie Des Jeux

    45/162

    Equilibre de Nash

    Joueur 2

    Joueur 1

    u v wx 3,0 0,2 0,3y 2,0 1,1 2,0z 0,3 0,2 3,0

    La notion dequilibre de Nashest une situation telle quaucun joueurna intrt dvier (seul) de la situation obtenue.

    Un equilibre de Nashest un profil de stratgies s

    ={s

    1, . . . , s

    n}telque pour tout joueuri, pour toute stratgies Si:

    i(s

    1, s

    i)i(s, si)

    Introductiona la Theorie des Jeux p.23/77

  • 8/13/2019 The Orie Des Jeux

    46/162

    Equilibre de Nash et fonction de meilleure rponse

    La fonction de meilleure rponse du joueuriest la fonctionBiquiassocie chaque combinaison de stratgies des autres joueurs siles

    stratgies du joueuriqui maximise son utilit:

    Bi(si) ={siSit.q. i(si, si) i(s

    i, si)pour touts

    i Si}

    Introductiona la Theorie des Jeux p.24/77

  • 8/13/2019 The Orie Des Jeux

    47/162

    Equilibre de Nash et fonction de meilleure rponse

    La fonction de meilleure rponse du joueuriest la fonctionBiquiassocie chaque combinaison de stratgies des autres joueurs siles

    stratgies du joueuriqui maximise son utilit:

    Bi(si) ={siSit.q. i(si, si) i(s

    i, si)pour touts

    i Si}

    Un quilibre de Nash est un profils tel que la stratgie du joueur iestune meilleure rponse:

    si Bi(s

    i)pour touti N

    Introductiona la Theorie des Jeux p.24/77

    E ilib d N h P i

  • 8/13/2019 The Orie Des Jeux

    48/162

    Equilibre de Nash: Proprits

    Un profil (unique) obtenu par limination itrative de stratgies(strictement) domines (EISD) est un quilibre de Nash (et cest le seul

    quilibre du jeu).

    Introductiona la Theorie des Jeux p.25/77

    E ilib d N h P it

  • 8/13/2019 The Orie Des Jeux

    49/162

    Equilibre de Nash: Proprits

    Un profil (unique) obtenu par limination itrative de stratgies(strictement) domines (EISD) est un quilibre de Nash (et cest le seul

    quilibre du jeu). Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,

    mais il peut aussi nen avoir aucun !

    Introductiona la Theorie des Jeux p.25/77

    E ilib d N h P it

  • 8/13/2019 The Orie Des Jeux

    50/162

    Equilibre de Nash: Proprits

    Un profil (unique) obtenu par limination itrative de stratgies(strictement) domines (EISD) est un quilibre de Nash (et cest le seul

    quilibre du jeu). Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,

    mais il peut aussi nen avoir aucun !

    Question: comment choisir un quilibre particulier lorsquil y en a

    plusieurs ?

    Introductiona la Theorie des Jeux p.25/77

    E ilib d N h P it

  • 8/13/2019 The Orie Des Jeux

    51/162

    Equilibre de Nash: Proprits

    Un profil (unique) obtenu par limination itrative de stratgies(strictement) domines (EISD) est un quilibre de Nash (et cest le seul

    quilibre du jeu). Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,

    mais il peut aussi nen avoir aucun !

    Question: comment choisir un quilibre particulier lorsquil y en a

    plusieurs ? Deux quilibres de Nashs = (si , s

    i)et s = (si , s

    i)sontinterchangeablessi pour touti (si , s

    i)et(s

    i , s

    i)sont aussi desquilibres de Nash.

    Introductiona la Theorie des Jeux p.25/77

    Eq ilibre de Nash: Proprits

  • 8/13/2019 The Orie Des Jeux

    52/162

    Equilibre de Nash: Proprits

    Un profil (unique) obtenu par limination itrative de stratgies(strictement) domines (EISD) est un quilibre de Nash (et cest le seul

    quilibre du jeu). Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,

    mais il peut aussi nen avoir aucun !

    Question: comment choisir un quilibre particulier lorsquil y en a

    plusieurs ? Deux quilibres de Nashs = (si , s

    i)et s = (si , s

    i)sontinterchangeablessi pour touti (si , s

    i)et(s

    i , s

    i)sont aussi desquilibres de Nash.

    Deux quilibres de Nashs ets sontquivalentssi ils donnent la mmeutilit tous les joueurs, i.e. pour touti N i(s) =i(s).

    Introductiona la Theorie des Jeux p.25/77

    Critre de Pareto

  • 8/13/2019 The Orie Des Jeux

    53/162

    Critre de Pareto

    Joueur 2

    Joueur 1u v

    x 4,4 3,1y 2,3 7,5

    Introductiona la Theorie des Jeux p.26/77

    Critre de Pareto

  • 8/13/2019 The Orie Des Jeux

    54/162

    Critre de Pareto

    Joueur 2

    Joueur 1u v

    x 4,4 3,1y 2,3 7,5

    Un profils domineun profils au sens de Paretosi il est au moins aussibon pour tous les joueurs et sisest strictement meilleur pour au moinslun dentre eux, i.e. pour tout si set si s

    on a si si et il existe

    sj set s

    j s

    tel quesj > s

    j .

    Introductiona la Theorie des Jeux p.26/77

    Critre de Pareto

  • 8/13/2019 The Orie Des Jeux

    55/162

    Critre de Pareto

    Joueur 2

    Joueur 1u v

    x 4,4 3,1y 2,3 7,5

    Un profils domineun profils au sens de Paretosi il est au moins aussibon pour tous les joueurs et sisest strictement meilleur pour au moinslun dentre eux, i.e. pour tout si set si s

    on a si si et il existe

    sj set s

    j s

    tel quesj > s

    j .

    Un profil s domine strictement un profil s au sens de Pareto si seststrictement meilleur pour tous les joueurs, i.e. pour tout si set si s

    on asi > si.

    Introductiona la Theorie des Jeux p.26/77

    Critre de Pareto vs niveau de scurit

  • 8/13/2019 The Orie Des Jeux

    56/162

    Critre de Pareto vs niveau de scurit

    Joueur 2

    Joueur 1u v

    x 9,9 0,8y 8,0 7,7

    Introductiona la Theorie des Jeux p.27/77

    Critre de Pareto vs niveau de scurit

  • 8/13/2019 The Orie Des Jeux

    57/162

    Critre de Pareto vs niveau de scurit

    Joueur 2

    Joueur 1u v

    x 9,9 0,8y 8,0 7,7

    On dfinit leniveau de securite dune strategiesipour le joueur icomme le gain minimum que peut apporter cette stratgie quel que soitle choix des autres joueurs, soit

    minsi i(si, si)

    On dfinit leniveau de securite dun joueuricomme le niveau de scu-rit maximal des stratgies dei.

    Introductiona la Theorie des Jeux p.27/77

    Points focaux

  • 8/13/2019 The Orie Des Jeux

    58/162

    Points focaux

    Le problme pos par la multiplicit dquilibres de Nash est unproblme de coordination.

    Pour certains jeux, certains quilibres semblent plus vidents quedautres aux joueurs. Cela est du certaines conventions sociales. Cesquilibres de Nash obtenus partir de ces conventions sont appelspoints focaux.

    Introductiona la Theorie des Jeux p.28/77

    La guerre des sexes

  • 8/13/2019 The Orie Des Jeux

    59/162

    La guerre des sexes

    Joueur 2

    Joueur 1f c

    f 2,1 0,0c 0,0 1,2

    Introductiona la Theorie des Jeux p.29/77

    La guerre des sexes

  • 8/13/2019 The Orie Des Jeux

    60/162

    La guerre des sexes

    Joueur 2

    Joueur 1f c

    f 2,1 0,0c 0,0 1,2

    Sur cet exemple le niveau de scurit des deux joueurs est 0.

    Introductiona la Theorie des Jeux p.29/77

    La guerre des sexes

  • 8/13/2019 The Orie Des Jeux

    61/162

    g

    Joueur 2

    Joueur 1f c

    f 2,1 0,0c 0,0 1,2

    Sur cet exemple le niveau de scurit des deux joueurs est 0.

    Supposons que le joueur 1 joue alatoirementfetcavec uneprobabilit de1/2

    1(, f) = 1/2 2 + 1/2 0 = 1

    1(, c) = 1/2 0 + 1/2 1 = 1/2

    Introductiona la Theorie des Jeux p.29/77

  • 8/13/2019 The Orie Des Jeux

    62/162

    Stratgies pures - Stratgies mixtes

  • 8/13/2019 The Orie Des Jeux

    63/162

    g p g

    Les stratgies que nous avons dfinies et utilises pour le moment sontdesstrategies pures, cest--dire les options qui se prsentent aux

    joueurs. Unestrategie mixteiest une distribution de probabilit sur

    lensemble des stratgies pures.

    Lensemble des stratgies mixtes dun joueur ise notei.

    Lensemble des stratgies pures utilises (i.e. dont la probabilit nestpas nulle) par une stratgie mixte iest appel lesupportde lastratgie mixte.

    Notonspi(sk)la probabilit associe skpari, lutilit dun profil de

    stratgies mixtesest dfinie par :

    i() =XsS

    (nY

    j=1

    pj(sj))i(s)

    Introductiona la Theorie des Jeux p.30/77

    Stratgie

  • 8/13/2019 The Orie Des Jeux

    64/162

    g

    Une strategie pure du joueur i est un plan daction qui prescrit uneaction de ce joueur pour chaque fois quil est susceptible de jouer. Onnote par Si lensemble des stratgies pures du joueur iet par si unestratgie pure de ce joueur.

    Introductiona la Theorie des Jeux p.31/77

    Stratgie

  • 8/13/2019 The Orie Des Jeux

    65/162

    g

    Une strategie pure du joueur i est un plan daction qui prescrit uneaction de ce joueur pour chaque fois quil est susceptible de jouer. Onnote par Si lensemble des stratgies pures du joueur iet par si unestratgie pure de ce joueur.

    Unestrategie mixtedu joueur iest une distribution de probabilits pidfinie sur lensemble des stratgies pures du joueur i. On note ilensemble des stratgies mixtes du joueur i et par i une stratgiemixte de ce joueur.

    Introductiona la Theorie des Jeux p.31/77

    Stratgie

  • 8/13/2019 The Orie Des Jeux

    66/162

    Une strategie pure du joueur i est un plan daction qui prescrit uneaction de ce joueur pour chaque fois quil est susceptible de jouer. Onnote par Si lensemble des stratgies pures du joueur iet par si unestratgie pure de ce joueur.

    Unestrategie mixtedu joueur iest une distribution de probabilits pidfinie sur lensemble des stratgies pures du joueur i. On note ilensemble des stratgies mixtes du joueur i et par i une stratgiemixte de ce joueur.

    Une strategie localedu joueur ien un ensemble dinformation Aestune distribution de probabilits sur lensemble des actions disponiblesen cet ensemble dinformation. On noteiAlensemble des stratgieslocales du joueuripour lensemble dinformationAetiAune stratgie

    locale de ce joueur en A. Unestrategie comportementaledu joueuriest un vecteur de strat-

    gies locales de ce joueur, contenant une stratgie locale par ensembledinformation de ce joueur. On noteilensemble des stratgies com-

    portementales du joueuri, etiune stratgie comportementale de cejoueur.

    Introductiona la Theorie des Jeux p.31/77

    Equilibres de Nash en stratgies mixtes

  • 8/13/2019 The Orie Des Jeux

    67/162

    DfinitionUn quilibre de Nash en stratgies mixtes est un profil de stratgiesmixtes tel que pour toutiet touti i

    i(

    i,

    i)i(i,

    i)

    Introductiona la Theorie des Jeux p.32/77

    Equilibres de Nash en stratgies mixtes

  • 8/13/2019 The Orie Des Jeux

    68/162

    DfinitionUn quilibre de Nash en stratgies mixtes est un profil de stratgiesmixtes tel que pour toutiet touti i

    i(

    i,

    i)i(i,

    i)

    Thorme. est un quilibre de Nash si et seulement si pour tout iet toutsi Si

    i(i, i) i(si, i)

    Introductiona la Theorie des Jeux p.32/77

    Equilibres de Nash en stratgies mixtes

  • 8/13/2019 The Orie Des Jeux

    69/162

    DfinitionUn quilibre de Nash en stratgies mixtes est un profil de stratgiesmixtes tel que pour toutiet touti i

    i(

    i,

    i)i(i,

    i)

    Thorme. est un quilibre de Nash si et seulement si pour tout iet toutsi Si

    i(i, i) i(si, i)

    Thorme.[Nash, 1950]Tout jeu sous forme strategique a un equilibre deNash en strategies mixtes.

    Introductiona la Theorie des Jeux p.32/77

    La guerre des sexes

  • 8/13/2019 The Orie Des Jeux

    70/162

    Joueur 2

    Joueur 1

    f c

    f 2,1 0,0 xc 0,0 1,2 1 x

    Soitxla probabilit avec laquelle le joueur 1 joue f, pour quelx

    maximise-t-il son niveau de scurit ?

    Introductiona la Theorie des Jeux p.33/77

    La guerre des sexes

  • 8/13/2019 The Orie Des Jeux

    71/162

    Joueur 2

    Joueur 1

    f c

    f 2,1 0,0 xc 0,0 1,2 1 x

    Soitxla probabilit avec laquelle le joueur 1 joue f, pour quelx

    maximise-t-il son niveau de scurit ?1(, f) = x 2 + (1 x) 0 = 2x

    1(, c) = x 0 + (1 x) 1 = 1 x

    Introductiona la Theorie des Jeux p.33/77

    La guerre des sexes

  • 8/13/2019 The Orie Des Jeux

    72/162

    Joueur 2

    Joueur 1

    f c

    f 2,1 0,0 xc 0,0 1,2 1 x

    Soitxla probabilit avec laquelle le joueur 1 joue f, pour quelx

    maximise-t-il son niveau de scurit ?1(, f) = x 2 + (1 x) 0 = 2x

    1(, c) = x 0 + (1 x) 1 = 1 x

    maxx

    min(2x, 1 x) = 1/3

    Introductiona la Theorie des Jeux p.33/77

    La guerre des sexes

  • 8/13/2019 The Orie Des Jeux

    73/162

    Joueur 2

    Joueur 1

    f c

    f 2,1 0,0 xc 0,0 1,2 1 x

    Soitxla probabilit avec laquelle le joueur 1 joue f, pour quelxmaximise-t-il son niveau de scurit ?

    1(, f) = x 2 + (1 x) 0 = 2x

    1(, c) = x 0 + (1 x) 1 = 1 x

    maxx

    min(2x, 1 x) = 1/3

    Le niveau de scurit du joueur 1 est donc de2/3.

    Introductiona la Theorie des Jeux p.33/77

    La guerre des sexes

  • 8/13/2019 The Orie Des Jeux

    74/162

    Joueur 2

    Joueur 1

    f c

    f 2,1 0,0 xc 0,0 1,2 1 x

    Soitxla probabilit avec laquelle le joueur 1 joue f, pour quelxmaximise-t-il son niveau de scurit ?

    1(, f) = x 2 + (1 x) 0 = 2x

    1(, c) = x 0 + (1 x) 1 = 1 x

    maxx

    min(2x, 1 x) = 1/3

    Le niveau de scurit du joueur 1 est donc de2/3.

    Que se passe-t-il si le joueur 2 est averti que le joueur 1 va jouer cettestratgie ?Introductiona la Theorie des Jeux p.33/77

    Reprsentation graphique du jeu

  • 8/13/2019 The Orie Des Jeux

    75/162

    0

    1

    2

    1/3 2/3 1

    1

    x

    2x

    Introductiona la Theorie des Jeux p.34/77

    Reprsentation graphique du jeu

  • 8/13/2019 The Orie Des Jeux

    76/162

    0

    1

    2

    1/3 2/3 1

    1

    x

    1 x

    Introductiona la Theorie des Jeux p.34/77

    Reprsentation graphique du jeu

  • 8/13/2019 The Orie Des Jeux

    77/162

    0

    1

    2

    1/3 2/3 1

    1

    x

    2x

    1 x

    Introductiona la Theorie des Jeux p.34/77

    La guerre des sexes

  • 8/13/2019 The Orie Des Jeux

    78/162

    Joueur 2

    Joueur 1

    y 1 y

    f cf 2,1 0,0c 0,0 1,2

    Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure

    rponse du joueur 1 ?

    Introductiona la Theorie des Jeux p.35/77

    La guerre des sexes

  • 8/13/2019 The Orie Des Jeux

    79/162

    Joueur 2

    Joueur 1

    y 1 y

    f cf 2,1 0,0c 0,0 1,2

    Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure

    rponse du joueur 1 ?1(f, ) = y 2 + (1 y) 0 = 2y1(c, ) = y 0 + (1 y) 1 = 1 y

    Introductiona la Theorie des Jeux p.35/77

    La guerre des sexes

  • 8/13/2019 The Orie Des Jeux

    80/162

    Joueur 2

    Joueur 1

    y 1 y

    f cf 2,1 0,0c 0,0 1,2

    Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure

    rponse du joueur 1 ?1(f, ) = y 2 + (1 y) 0 = 2y1(c, ) = y 0 + (1 y) 1 = 1 y

    Donc:

    Si2y >1 y(y >1/3), la meilleure rponse du joueur 1 est de jouer f Si2y

  • 8/13/2019 The Orie Des Jeux

    81/162

    Joueur 2

    Joueur 1

    y 1 y

    f cf 2,1 0,0 xc 0,0 1,2 1 x

    Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure

    rponse du joueur 2 ?

    Introductiona la Theorie des Jeux p.36/77

    La guerre des sexes

  • 8/13/2019 The Orie Des Jeux

    82/162

    Joueur 2

    Joueur 1

    y 1 y

    f cf 2,1 0,0 xc 0,0 1,2 1 x

    Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure

    rponse du joueur 2 ?2(, f) = x 1 + (1 x) 0 = x

    2(, c) = x 0 + (1 x) 2 = 2(1 x)

    Introductiona la Theorie des Jeux p.36/77

  • 8/13/2019 The Orie Des Jeux

    83/162

    La guerre des sexes

  • 8/13/2019 The Orie Des Jeux

    84/162

    Joueur 2

    Joueur 1

    y 1 y

    f cf 2,1 0,0 xc 0,0 1,2 1 x

    Les gains des deux joueurs avec un profil en stratgie mixte sont donc:

    1() = x y 2 +x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 1

    = 3xy x y+ 1

    2() = x y 1 +x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 2

    = 3xy 2x 2y+ 2

    Introductiona la Theorie des Jeux p.37/77

    La guerre des sexes

  • 8/13/2019 The Orie Des Jeux

    85/162

    Joueur 2

    Joueur 1

    1/3 2/3

    f cf 2,1 0,0 2/3c 0,0 1,2 1/3

    Les gains des deux joueurs avec un profil en stratgie mixte sont donc:

    1() = 3xy x y+ 12() = 3xy 2x 2y+ 2

    Le profil = (, )est donc un quili-bre de Nash en stratgie mixte.

    Introductiona la Theorie des Jeux p.37/77

    La guerre des sexes

  • 8/13/2019 The Orie Des Jeux

    86/162

    Joueur 2

    Joueur 1

    1/3 2/3

    f cf 2,1 0,0 2/3c 0,0 1,2 1/3

    Les gains des deux joueurs avec un profil en stratgie mixte sont donc:

    1() = 3xy x y+ 12() = 3xy 2x 2y+ 2

    Le profil = (, )est donc un quili-bre de Nash en stratgie mixte.

    Les gains des deux joueurs avec

    sont :1() = 3.2/3.1/3 2/3 1/3 + 1= 2/3

    2() = 3.2/3.1/3 2.2/3 2.1/3 + 2

    = 2/3

    Introductiona la Theorie des Jeux p.37/77

    Reprsentation graphique du jeu

  • 8/13/2019 The Orie Des Jeux

    87/162

    1/3 2/3 1

    1/3

    2/3

    1

    0

    y

    x

    joueur1

    Introductiona la Theorie des Jeux p.38/77

    Reprsentation graphique du jeu

  • 8/13/2019 The Orie Des Jeux

    88/162

    1/3 2/3 1

    1/3

    2/3

    1

    0

    y

    x

    joueur1

    joueur2

    Introductiona la Theorie des Jeux p.38/77

    Reprsentation graphique du jeuy

  • 8/13/2019 The Orie Des Jeux

    89/162

    1/3 2/3 1

    1/3

    2/3

    1

    0x

    joueur1

    joueur2

    Introductiona la Theorie des Jeux p.38/77

    Coopration - Itration - Corrlation

  • 8/13/2019 The Orie Des Jeux

    90/162

    Joueur 2

    Joueur 1f c

    f 2,1 0,0c 0,0 1,2

    Que se passe-t-il si les 2 joueurs peuvent communiquer avant dejouer ?

    Introductiona la Theorie des Jeux p.39/77

    Coopration - Itration - Corrlation

  • 8/13/2019 The Orie Des Jeux

    91/162

    Joueur 2

    Joueur 1f c

    f 2,1 0,0c 0,0 1,2

    Que se passe-t-il si les 2 joueurs peuvent communiquer avant dejouer ?1 =2 = 1/2 2 + 1/2 1 = 3/2

    Introductiona la Theorie des Jeux p.39/77

    Coopration - Itration - Corrlation

  • 8/13/2019 The Orie Des Jeux

    92/162

    Joueur 2

    Joueur 1f c

    f 2,1 0,0c 0,0 1,2

    Que se passe-t-il si les 2 joueurs peuvent communiquer avant dejouer ?1 =2 = 1/2 2 + 1/2 1 = 3/2

    Lorsque tous les joueurs peuvent observer un mme vnement

    alatoire, ils peuvent alors saccorder sur desquilibres corrls Une stratgie corrle est une distribution de probabilits sur les

    profils possibles.

    Introductiona la Theorie des Jeux p.39/77

    Coopration - Itration - Corrlation

  • 8/13/2019 The Orie Des Jeux

    93/162

    Joueur 2

    Joueur 1f c

    f 2,1 0,0c 0,0 1,2

    Que se passe-t-il si les 2 joueurs peuvent communiquer avant dejouer ?1 =2 = 1/2 2 + 1/2 1 = 3/2

    Lorsque tous les joueurs peuvent observer un mme vnement

    alatoire, ils peuvent alors saccorder sur desquilibres corrls Une stratgie corrle est une distribution de probabilits sur les

    profils possibles.

    Que se passe-t-il si la partie est joue plusieurs fois ?

    Introductiona la Theorie des Jeux p.39/77

    Itration: Le dilemme des prisonniers...

  • 8/13/2019 The Orie Des Jeux

    94/162

    Deux personnes arrtes ensemble en possession darmes feu sontsouponns dun dlit fait en commun. Les policiers les sparent et disent chacun :

    Si un des deux avoue et que lautre navoue rien, le premier est libr,et le second emprisonn (5 ans);

    Si les deux avouent, les deux iront en prison (4 ans);

    Si aucun des deux navoue, les deux seront seront librs assez vite (2ans).

    Vous tes un des deux prisonniers, que faites-vous ?

    Introductiona la Theorie des Jeux p.40/77

    [DIP] Le dilemme des prisonniers

  • 8/13/2019 The Orie Des Jeux

    95/162

    Joueur 2

    Joueur 1C D

    C 3,3 0,5D 5,0 1,1

    Introductiona la Theorie des Jeux p.41/77

    [DIP] Le dilemme itr...

  • 8/13/2019 The Orie Des Jeux

    96/162

    Vous navez pas vraiment les mmes gots que votre voisin en matire demusique. Il lui arrive souvent dcouter sa musique fond. De mme ilvous arrive (en reprsailles) de mettre votre musique un volume plus queraisonnable. Ce qui a pour consquences que le lendemain il recommence nouveau. En dehors de ces priodes agites, vous apprciez les priodes oaucun de vous ne gne lautre.Supposons que lon pondre votre satisfaction :

    Vous avez une satisfaction de 5 couter votre musique un volumeimportant.

    La satisfaction est de 0lorsque votre voisin met sa musique fond.

    Une soire calme, sans musique vous apporte une satisfaction de 3.

    Le fait dcouter simultanment votre musique mle celle du voisin,donne une satisfaction de 1.

    Vous savez ce que votre voisin a eu comme comportement les joursprcdents, que faites-vous aujourdhui?Introductiona la Theorie des Jeux p.42/77

    [DIP] Le dilemme . . .

  • 8/13/2019 The Orie Des Jeux

    97/162

    Introduction par FLOODet DRESHER la RAND Corp. en 1952

    Jeu somme non-nulle

    2 joueurs jouent simultanment 2 choix de jeux :

    COOPERER, i.e. tre gentil, on notera C TRAHIR, i.e. tre mchant, on notera D

    Les gains des joueurs, notsS,P,Ret T, sont fonction de leur choixde jeu avec :

    S < P < R < T(0)

    Introductiona la Theorie des Jeux p.43/77

    [DIP] Le dilemme itr . . .

  • 8/13/2019 The Orie Des Jeux

    98/162

    Les joueurs se rencontrent plusieurs fois

    chaque itration les joueurs ont connaissance des coups prcdents

    Ils ne connaissent pas le terme du jeu Le gain dun joueur est le cumul de ses gains dans chaque rencontre

    Pour favoriser la coopration on ajoute la contrainte :

    S+T

  • 8/13/2019 The Orie Des Jeux

    99/162

    Dilemme... S < P < R < T

    ...itr S+T

  • 8/13/2019 The Orie Des Jeux

    100/162

    Deux pays doivent-ils lever des taxes douanires sur les produitsimports de lautre pays.

    Deux entreprises concurrentes doivent-elles essayer de sentendrepour se partag un march ou se faire concurrence ?

    Deux espces vivant sur un mme territoire doivent-elles cohabiter ouse disputer la nourriture disponible ?

    Introductiona la Theorie des Jeux p.46/77

    [DIP] Les stratgies

  • 8/13/2019 The Orie Des Jeux

    101/162

    Quelques exemples :

    gentille

    mchante

    per_CCD

    rancunire

    lunatique

    majoritaire_gentille

    majoritaire_mchante

    donnant_donnant

    Introductiona la Theorie des Jeux p.47/77

  • 8/13/2019 The Orie Des Jeux

    102/162

    [DIP] Quelle est la meilleurestratgie ?

  • 8/13/2019 The Orie Des Jeux

    103/162

    qui batte toutes les autres :

    Introductiona la Theorie des Jeux p.49/77

    [DIP] Quelle est la meilleurestratgie ?

  • 8/13/2019 The Orie Des Jeux

    104/162

    qui batte toutes les autres :mchante, car gnralisation du dilemme non itr

    Introductiona la Theorie des Jeux p.49/77

    [DIP] Quelle est la meilleurestratgie ?

  • 8/13/2019 The Orie Des Jeux

    105/162

    qui batte toutes les autres :mchante, car gnralisation du dilemme non itr

    qui fasse le meilleur score possible face toutes les autres :

    Introductiona la Theorie des Jeux p.49/77

  • 8/13/2019 The Orie Des Jeux

    106/162

    [DIP] Quelle est la meilleurestratgie ?

  • 8/13/2019 The Orie Des Jeux

    107/162

    qui batte toutes les autres :mchante, car gnralisation du dilemme non itr

    qui fasse le meilleur score possible face toutes les autres :aucune, car meilleure contre mchanteet contre rancunireest impossible

    Problme de dfinition du critre dvaluation des stratgies

    Introductiona la Theorie des Jeux p.49/77

    [DIP] Quelle est la meilleurestratgie ?

  • 8/13/2019 The Orie Des Jeux

    108/162

    Sur des confrontations de 100 parties :

    Le gain maximal est de 500 points

    Le gain minimal est de 0 pointCest ce quobtiennent MCHANTEet GENTILLElune contre lautre.

    Introductiona la Theorie des Jeux p.50/77

    [DIP] Quelle est la meilleurestratgie ?

  • 8/13/2019 The Orie Des Jeux

    109/162

    Sur des confrontations de 100 parties :

    Le gain maximal est de 500 points

    Le gain minimal est de 0 pointCest ce quobtiennent MCHANTEet GENTILLElune contre lautre.Mais...

    2 gentilles entre elles obtiennent chacune 300 points

    2 mchantes entre elles obtiennent chacune 100 points

    Chaque stratgie est bonne (au sens du meilleur score) face certaineset mauvaises face dautres car elle ne sait pas qui elle a affaire.

    Introductiona la Theorie des Jeux p.50/77

    [DIP] Les tournois

  • 8/13/2019 The Orie Des Jeux

    110/162

    Plusieurs stratgies se rencontrent 2 2, comme pour un tournoi sportif

    Le gain dune stratgie est le cumul de ses scores face chaqueadversaire

    Toutes les parties ont la mme longueur (mme nombre ditrations),mais les stratgies ne la connaissent pas et ne peuvent pas le savoir

    Introductiona la Theorie des Jeux p.51/77

    [DIP] Exemples (tournoi)

  • 8/13/2019 The Orie Des Jeux

    111/162

    gentille mchante per_CCD rancunire

    gentille 30 50 36 30

    mchante 0 10 3 9per_CCD 21 38 24 33

    rancunire 30 14 13 30

    Score 81 112 76 102

    Classement

    8>>>>>:

    1 mchante2 rancunire

    3 gentille4 per_CCD

    Introductiona la Theorie des Jeux p.52/77

  • 8/13/2019 The Orie Des Jeux

    112/162

    [DIP] Un tournoi

    gentille rancunire majoritaire mchante

  • 8/13/2019 The Orie Des Jeux

    113/162

    gentille

    mchante

    lunatique donnant_donnant

    rancunire

    per_DDC

    per_CCD majoritaire_gentille

    majoritaire_mchante

    mfiante

    sondeur donnant_donnant_dur

    Scores :

    donnant_donnant : 42

    majoritaire_gentille : 19rancunire : 4sondeur : 1lunatique : 0

    mchante : 0

    Introductiona la Theorie des Jeux p.54/77

  • 8/13/2019 The Orie Des Jeux

    114/162

    [DIP] donnant-donnant : une bonne stratgie

    Au premier coup je coopre (C) ensuite si mon adversaire a coopr (C) au

  • 8/13/2019 The Orie Des Jeux

    115/162

    Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) aucoup prcdent, je coopre (C), sil a trahi (D), je trahis (D).

    donnant-donnant ne gagne jamais contre personne !

    Introductiona la Theorie des Jeux p.55/77

    [DIP] donnant-donnant : une bonne stratgie

    Au premier coup je coopre (C) ensuite si mon adversaire a coopr (C) au

  • 8/13/2019 The Orie Des Jeux

    116/162

    Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) aucoup prcdent, je coopre (C), sil a trahi (D), je trahis (D).

    donnant-donnant ne gagne jamais contre personne ! Au mieux elle fait le mme score.

    Introductiona la Theorie des Jeux p.55/77

    [DIP] donnant-donnant : une bonne stratgie

    Au premier coup je coopre (C) ensuite si mon adversaire a coopr (C) au

  • 8/13/2019 The Orie Des Jeux

    117/162

    Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) aucoup prcdent, je coopre (C), sil a trahi (D), je trahis (D).

    donnant-donnant ne gagne jamais contre personne ! Au mieux elle fait le mme score.

    Mais, au pire elle ne perd que 5 points quel que soit ladversaire et lalongueur de la partie !

    Introductiona la Theorie des Jeux p.55/77

    [DIP] volution cologique

    Simulation de lvolution naturelle :

  • 8/13/2019 The Orie Des Jeux

    118/162

    Simulation de l volution naturelle :

    Chaque stratgie est reprsente par une population deNentits On effectue un tournoi entre toutes les entits

    Les entits de faibles stratgies (au sens du classement dans letournoi) sont dfavorises, celles stratgie forte sont favorises

    La favorisation est ralise par une redistribution proportionnelle de lapopulation

    Ce cycle est rpt jusqu stabilisation de la population

    Introductiona la Theorie des Jeux p.56/77

    [DIP] Exemples (volution)

    400

  • 8/13/2019 The Orie Des Jeux

    119/162

    0

    50

    100

    150

    200

    250

    300

    350

    0 2 4 6 8 10 12 14 16 18 20

    spitefulall_call_d

    per_ccd

    Introductiona la Theorie des Jeux p.57/77

    [DIP] Une morale trs morale...

    Critres de qualit pour une stratgie (en volution) : [Axelrod,81]

  • 8/13/2019 The Orie Des Jeux

    120/162

    C s q a p s a g ( ) [ , ]

    Gentillesse

    Ractivit Pardon

    Simplicit

    Introductiona la Theorie des Jeux p.58/77

    [DIP] Une morale trs morale...

    Critres de qualit pour une stratgie (en volution) : [Axelrod,81]

  • 8/13/2019 The Orie Des Jeux

    121/162

    q p g ( ) [ , ]

    Gentillesse

    Ractivit Pardon

    Simplicit

    Les bonnes stratgies au dilemme le sont aussi dans les variantes du

    dilemme (asynchrone, avec renoncement, bruits, . . . )

    Introductiona la Theorie des Jeux p.58/77

    [DIP] Une morale trs morale...

    Critres de qualit pour une stratgie (en volution) : [Axelrod,81]

  • 8/13/2019 The Orie Des Jeux

    122/162

    q p g ( ) [ ]

    Gentillesse

    Ractivit Pardon

    Simplicit

    Les bonnes stratgies au dilemme le sont aussi dans les variantes du

    dilemme (asynchrone, avec renoncement, bruits, . . . )Pour plus de dtails sur le dilemme itr des prisonniers :

    http://www.lifl.fr/IPD

    Introductiona la Theorie des Jeux p.58/77

  • 8/13/2019 The Orie Des Jeux

    123/162

    Jeux rpts

    Soit un jeuG={S, {i}i=1,...,n}, oSest lensemble (fini) des profils

  • 8/13/2019 The Orie Des Jeux

    124/162

    de stratgies etiest la fonction dutilit du joueur i.

    On note(G, T)le jeu rpt obtenu en jouant Tfois le jeu de base G.

    Lorsque le jeu est rpt un nombre infini de fois, on note(G, )le jeucorrespondant.

    On peut galement distinguer les jeux rpts un nombre fini, mais

    indfini de fois: chaque tour, il y a une probabilit 1 qque le jeusarrte.

    Introductiona la Theorie des Jeux p.59/77

    Jeux rpts

    Soit un jeuG={S, {i}i=1,...,n}, oSest lensemble (fini) des profils

  • 8/13/2019 The Orie Des Jeux

    125/162

    de stratgies etiest la fonction dutilit du joueur i.

    On note(G, T)le jeu rpt obtenu en jouant Tfois le jeu de base G.

    Lorsque le jeu est rpt un nombre infini de fois, on note(G, )le jeucorrespondant.

    On peut galement distinguer les jeux rpts un nombre fini, mais

    indfini de fois: chaque tour, il y a une probabilit 1 qque le jeusarrte.

    Facteur dactualisation : Lorsquun jeu est rpt, il se peut que lesgains obtenus litration courantetsoient plus/moins importants auxyeux de lagent que les gains litration suivante t+1. Pour modlisercela on peut utiliser un facteur dactualisation.

    t =t+1

    Le facteur dactualisation=t/t+1reprsente donc lattrait du joueurpour les gains actuels. Introduction a la Theorie des Jeux p.59/77

  • 8/13/2019 The Orie Des Jeux

    126/162

  • 8/13/2019 The Orie Des Jeux

    127/162

    Jeux rpts: Thorme Folk

    Lutilit dun joueur dans un jeu rpt est donc:

  • 8/13/2019 The Orie Des Jeux

    128/162

    i(G, T) = Tt=0

    ti(t)

    Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeude base, on utilise la moyenne des gains du joueur: i(G, T)/T

    Siti(t) =, alorsi(G, ) = 11

    Introductiona la Theorie des Jeux p.60/77

    Jeux rpts: Thorme Folk

    Lutilit dun joueur dans un jeu rpt est donc:

  • 8/13/2019 The Orie Des Jeux

    129/162

    i(G, T) = Tt=0

    ti(t)

    Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeude base, on utilise la moyenne des gains du joueur: i(G, T)/T

    Siti(t) =, alorsi(G, ) = 11

    Thorme Folk: Soit un jeu rpt(G, )avec un facteurdactualisationsuffisamment proche de 1 et = (1, . . . , 2)unvecteur de gains ralisable de ce jeu, alors il existe un quilibre deNash du jeu rpt qui donnecomme vecteur de gains.

    Introductiona la Theorie des Jeux p.60/77

    Jeux rpts: Thorme Folk

    Lutilit dun joueur dans un jeu rpt est donc:

  • 8/13/2019 The Orie Des Jeux

    130/162

    i(G, T) = Tt=0

    ti(t)

    Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeude base, on utilise la moyenne des gains du joueur: i(G, T)/T

    Siti(t) =, alorsi(G, ) = 11

    Thorme Folk: Soit un jeu rpt(G, )avec un facteurdactualisationsuffisamment proche de 1 et = (1, . . . , 2)unvecteur de gains ralisable de ce jeu, alors il existe un quilibre deNash du jeu rpt qui donnecomme vecteur de gains.

    Lquilibre de Nash en question est un quilibre de Nash parfait ensous-jeux (voir plus loin). Notion de menace crdible.

    Introductiona la Theorie des Jeux p.60/77

    Jeux rpts: Thorme Folk

    Lutilit dun joueur dans un jeu rpt est donc:

  • 8/13/2019 The Orie Des Jeux

    131/162

    i(G, T) = Tt=0

    ti(t)

    Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeude base, on utilise la moyenne des gains du joueur: i(G, T)/T

    Siti(t) =, alorsi(G, ) = 11

    Thorme Folk: Soit un jeu rpt(G, )avec un facteurdactualisationsuffisamment proche de 1 et = (1, . . . , 2)unvecteur de gains ralisable de ce jeu, alors il existe un quilibre deNash du jeu rpt qui donnecomme vecteur de gains.

    Lquilibre de Nash en question est un quilibre de Nash parfait ensous-jeux (voir plus loin). Notion de menace crdible.

    Ce rsultat signifie que lensemble des quilibres de Nash dun jeurpt est immense: quasiment toute squence (finie) de jeu correspond un quilibre de Nash.

    Introductiona la Theorie des Jeux p.60/77

    Jeux deux joueurs Somme nulle

    Rle central le plus simple

  • 8/13/2019 The Orie Des Jeux

    132/162

    le plus simple pas de notion de majorit pas de coalition

    Introductiona la Theorie des Jeux p.61/77

  • 8/13/2019 The Orie Des Jeux

    133/162

    Jeux deux joueurs Somme nulle

    Rle central le plus simple

  • 8/13/2019 The Orie Des Jeux

    134/162

    le plus simple pas de notion de majorit pas de coalition

    Strictement Comptitif Les joueurs ont des prfrences strictement opposes

    Pour tout profil de stratgiess, on a1(s) +2(s) = 0

    Introductiona la Theorie des Jeux p.61/77

    Jeux deux joueurs Somme nulle

    Rle central le plus simple

  • 8/13/2019 The Orie Des Jeux

    135/162

    le plus simple pas de notion de majorit pas de coalition

    Strictement Comptitif Les joueurs ont des prfrences strictement opposes

    Pour tout profil de stratgiess, on a1

    (s) +2

    (s) = 0 Exemples :

    Jeux de plateau (echecs, dames,. . .) Guerre

    . . .

    Introductiona la Theorie des Jeux p.61/77

  • 8/13/2019 The Orie Des Jeux

    136/162

    Jeux deux joueurs somme nulle - Exemple

    Joueur 2

  • 8/13/2019 The Orie Des Jeux

    137/162

    Joueur 1

    y1 y2 y3 y4

    x1 18 3 0 2x2 0 3 8 20x3 5 4 5 5

    x4 9 3 0 20

    Introductiona la Theorie des Jeux p.62/77

    Jeux deux joueurs somme nulle - Exemple

    Joueur 2

  • 8/13/2019 The Orie Des Jeux

    138/162

    Joueur 1

    y1 y2 y3 y4

    x1 18 3 0 2x2 0 3 8 20x3 5 4 5 5

    x4 9 3 0 20 Le joueur 1 tente de maximiser son niveau de scurit

    vx = maxi(minj(xi, yj))

    Le joueur 2 tente de minimiser le niveau de scurit du joueur 1 vy = minj(maxi(xi, yj))

    Introductiona la Theorie des Jeux p.62/77

    Jeux deux joueurs somme nulle - Exemple

    Joueur 2

  • 8/13/2019 The Orie Des Jeux

    139/162

    Joueur 1

    y1 y2 y3 y4

    x1 18 3 0 2x2 0 3 8 20x3 5 4 5 5

    x4 9 3 0 20 Le joueur 1 tente de maximiser son niveau de scurit

    vx = maxi(minj(xi, yj))

    Le joueur 2 tente de minimiser le niveau de scurit du joueur 1 vy = minj(maxi(xi, yj))

    Si vx = vy = v, alors tout couple de stratgies (xi, yi), xi garantissantv au joueur 1 et yi garantissant v au joueur 2 forment un quilibre de

    Nash et sont des stratgies respectivement maximin et minimax pourles joueurs 1 et 2. Introduction a la Theorie des Jeux p.62/77

    Jeux sous forme extensive

    13

    1

    2

    3 (3,2,9)z

    w x x w

  • 8/13/2019 The Orie Des Jeux

    140/162

    (3,2,9)

    (3,0,0) 2 (1,0,3) (3,2,2) (2,3,1) (5,5,5)

    (4,2,4) (2,3,1)

    x y u y y u

    w u

    Introductiona la Theorie des Jeux p.63/77

    Jeux sous forme extensive

    13

    1

    2

    3 (3,2,9)z

    w x x w

  • 8/13/2019 The Orie Des Jeux

    141/162

    ( , , )

    (3,0,0) 2 (1,0,3) (3,2,2) (2,3,1) (5,5,5)

    (4,2,4) (2,3,1)

    x y u y y u

    w u

    Rcurrence rebours (backward induction)

    On commence par chercher les choix optimaux la dernirepriode (noeuds terminaux).

    On remonte larbre de noeud en noeud, en cherchant chaquenoeud le choix optimal, une fois quon a pris en compte les choix

    optimaux pour chaque noeud fils.Introductiona la Theorie des Jeux p.63/77

    Jeux sous forme extensive

    Tout jeu (fini) sous forme extensive a information parfaite a un

    equilibre de Nash en strategies pures (equilibre obtenable par

    ` b ) (Z l (1953) K h (1953))

  • 8/13/2019 The Orie Des Jeux

    142/162

    recurrence a rebours).(Zermelo (1953), Kuhn (1953))

    Introductiona la Theorie des Jeux p.64/77

    Forme extensive - Sous-jeu

    1

  • 8/13/2019 The Orie Des Jeux

    143/162

    (2,2)2

    (3,1)1

    (2,-2) (-2,2) (-2,2) (2,-2)

    x y

    u v

    r s2

    w zw

    z

    Introductiona la Theorie des Jeux p.65/77

    Forme extensive - Sous-jeu

    1

  • 8/13/2019 The Orie Des Jeux

    144/162

    (2,2)2

    (3,1)1

    (0,0)

    x y

    u v

    Introductiona la Theorie des Jeux p.65/77

    Forme extensive - Sous-jeu

    1

  • 8/13/2019 The Orie Des Jeux

    145/162

    (2,2)2

    (3,1)1

    (0,0)

    x y

    u v

    Un sous-jeudun jeu sous forme extensive est un jeu compos dun noeud(qui est un ensemble dinformation singleton), de tous les noeuds successeursde ce noeud, de tous les arcs reliant ces noeuds, et des utilits associes tous les noeuds terminaux successeurs.

    Introductiona la Theorie des Jeux p.65/77

  • 8/13/2019 The Orie Des Jeux

    146/162

    Forme extensive - Menaces non crdibles

    1 Joueur 2

  • 8/13/2019 The Orie Des Jeux

    147/162

    (2,2)2

    (3,1) (0,0)

    x y

    u v Joueur 1u v

    x 2,2 2,2y 3,1 0,0

    lquilibre de Nash xv nest pas crdible car il repose sur la menacenon-crdible du joueur 2 de jouerv.

    Introductiona la Theorie des Jeux p.66/77

    Equilibre parfait en sous-jeux

    Un quilibre de Nash dun jeu sous forme extensive est un equilibreparfait en sous-jeuxsi toute restriction du profil de stratgies un sous-jeu est un quilibre de Nash pour ce sous-jeu

  • 8/13/2019 The Orie Des Jeux

    148/162

    jeu est un quilibre de Nash pour ce sous jeu.

    Introductiona la Theorie des Jeux p.67/77

    Equilibre parfait en sous-jeux

    Un quilibre de Nash dun jeu sous forme extensive est un equilibreparfait en sous-jeuxsi toute restriction du profil de stratgies un sous-jeu est un quilibre de Nash pour ce sous-jeu

  • 8/13/2019 The Orie Des Jeux

    149/162

    jeu est un quilibre de Nash pour ce sous jeu.

    Pour les jeux informations parfaites, la notion dquilibre parfait ensous-jeux concide avec la notion de rcurrence rebours.

    Introductiona la Theorie des Jeux p.67/77

    Promesse non crdible

    (2,-1)1

    Exploiter 2

  • 8/13/2019 The Orie Des Jeux

    150/162

    1

    (1,1)2

    (0,0)

    Daccord pour travailler

    Pas daccord pour travailler

    Ne pas exploiter 2

    Introductiona la Theorie des Jeux p.68/77

    Promesse non crdible

    (2,-1)1

    Exploiter 2

  • 8/13/2019 The Orie Des Jeux

    151/162

    1

    (1,1)2

    (0,0)

    Daccord pour travailler

    Pas daccord pour travailler

    Ne pas exploiter 2

    Rputation

    Introductiona la Theorie des Jeux p.68/77

    Le mille-pattes - Limites de la rcurrence rebours

    1 2 1 1 2 1 2(100 100)

  • 8/13/2019 The Orie Des Jeux

    152/162

    . . . (100,100)

    (1,1) (0,3) (2,2) (98,98) (97,100) (99,99) (98,101)

    RD rd RD RD rd RD rd

    Introductiona la Theorie des Jeux p.69/77

    Limites de la rcurrence rebours

    Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si

    le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut

  • 8/13/2019 The Orie Des Jeux

    153/162

    accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.

    Introductiona la Theorie des Jeux p.70/77

    Limites de la rcurrence rebours

    Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si

    le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut

  • 8/13/2019 The Orie Des Jeux

    154/162

    accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.

    Ecrire ce jeu sous forme extensive en ne considrant que les partages(5,5) et (8.5,1.5) pour 1 et le partage (0.5,0.5) pour 2.

    Introductiona la Theorie des Jeux p.70/77

    Jeux coopratifs 2 joueurs

    Dans les jeux coopratifs on autorise la communication et les accordsentre joueurs avant la partie.

    Tous les messages formuls par un joueur sont transmis sans

  • 8/13/2019 The Orie Des Jeux

    155/162

    g p j

    modification lautre joueur. Tous les accords entre joueurs seront respects. Lvaluation des situations par un joueur nest pas perturbe par les

    ngociations prliminaires.

    Guerre des sexes

    Introductiona la Theorie des Jeux p.71/77

    Jeu de marchandage - Ensemble de ngociation

    L ensemble de negociation dun jeu de marchandage est lensemble desissues :

    ralisables

  • 8/13/2019 The Orie Des Jeux

    156/162

    appartenant lespace de marchandage efficientes

    telles quaucune autre issue ne donne plus un joueur et autant lautre (non pareto-domine)

    individuellement rationnelles chaque joueur gagne au moins autant que le gain quil est sur

    dobtenir si il ny a pas daccord.

    Introductiona la Theorie des Jeux p.72/77

    Jeu de Marchandage - Solution de Nash

    Invariance a lechelle dutiliteSi[R1, (u1, v

    1)]et[R2, (u

    2, v

    2)]sont deux versions du mme jeu demarchandage, ie si ils ne diffrent que sur les units et lorigine desf ti d tilit l l d l ti F ([R ( )]) t

  • 8/13/2019 The Orie Des Jeux

    157/162

    fonctions dutilits, alors les deux solutionsF([R1, (u1

    , v1

    )])etF([R2, (u

    2, v

    2)])doivent tre les mmes au changement dchelle prs.

    Pareto optimaliteLa solution du jeu de marchandage(u0, v0)doit satisfaire les propritssuivantes :

    u0u etv0 v

    (u0, v0)est un point deR

    il ny a pas de (u, v)dansR(diffrent de(u0, v0)) tel queu u0etvv0.

    Introductiona la Theorie des Jeux p.73/77

    Jeu de Marchandage - Solution de Nash

    Independance des alternatives non disponiblesSoient deux jeux de marchandage avec le mme point de status quo ettels que les issues du premier sont incluses dans les issues du second.

  • 8/13/2019 The Orie Des Jeux

    158/162

    Si la solution du second jeu est ralisable dans le premier jeu, alors cedoit tre aussi la solution du premier jeu : SiR1R2etF([R2, (u, v)])R1, alors

    F([R1, (u, v)]) =F([R2, (u

    , v)])

    SymetrieSi un jeu de marchandage a les proprits suivantes : u =v

    (u, v)Rimplique(v, u) R

    (u0, v0) =F([R, (u

    , v

    )])Alors

    u0 =v0

    Introductiona la Theorie des Jeux p.74/77

    Jeu de Marchandage - Solution de Nash

    Soit un jeu de marchandage[R, (u, v)], procdons comme suit :

    Changeons lorigine des utilits des joueurs pour que le point(u, v)soit transform en (0 0) Soit [R (0 0)] le jeu correspondant

  • 8/13/2019 The Orie Des Jeux

    159/162

    soit transform en(0, 0). Soit[R , (0, 0)]le jeu correspondant.

    Dans R trouver (lunique) point (u0, v

    0)(u

    0 > 0et v

    0 > 0) tel que u

    0v

    0

    est le maximum de tous les produits uv avec (u, v)dans R (u > 0 etv >0).

    Le point (u0, v0) est la solution de Nash du jeu [R, (0, 0)]. La solution deNash de[R, (u, v)]est obtenu en inversant la transformation dutilit.

    Introductiona la Theorie des Jeux p.75/77

    Jeu de Marchandage - Solution de Nash

    Soit un jeu de marchandage[R, (u, v)], procdons comme suit :

    Changeons lorigine des utilits des joueurs pour que le point(u, v)soit transform en (0 0) Soit [R (0 0)] le jeu correspondant

  • 8/13/2019 The Orie Des Jeux

    160/162

    soit transform en(0, 0). Soit[R , (0, 0)]le jeu correspondant.

    Dans R trouver (lunique) point (u0, v

    0)(u

    0 > 0et v

    0 > 0) tel que u

    0v

    0

    est le maximum de tous les produits uv avec (u, v)dans R (u > 0 etv >0).

    Le point (u0, v0) est la solution de Nash du jeu [R, (0, 0)]. La solution deNash de[R, (u, v)]est obtenu en inversant la transformation dutilit.

    Thorme. Lunique solution qui verifie les 4 proprietes desirees est la

    solution de Nash.(Nash (1950))

    Introductiona la Theorie des Jeux p.75/77

    Jeux contre la nature

    Si on considre un jeu deux joueurs dont un des deux joueurs est lanature, on fait de la dcision dans le risque ou dans lincertain.

    En ce sens la thorie de la dcision peut tre vue comme un cas partic-

  • 8/13/2019 The Orie Des Jeux

    161/162

    ulier de la thorie des jeux.

    Introductiona la Theorie des Jeux p.76/77

    Conclusion

    Jeux coopratifs

    Jeux information incomplte

    Rationalit limite

  • 8/13/2019 The Orie Des Jeux

    162/162

    Introductiona la Theorie des Jeux p.77/77