théorie des jeux et ses applications - irsamc.ups-tlse.fr · quelques définitions de la théorie...
TRANSCRIPT
Théorie des Jeux
Et ses Applications De la Guerre Froide au Poker
Clément Sire
Laboratoire de Physique Théorique
CNRS & Université Paul Sabatier
www.lpt.ups-tlse.fr
Quelques Définitions de la
Théorie des Jeux
Branche des mathématiques étudiant des
modèles de conflit, coopération, prise de
décisions…
« Ensemble d'outils pour analyser les
situations dans lesquelles ce qu'il est
optimal de faire pour un agent (personne
physique, entreprise, animal, trader...)
dépend des anticipations qu'il forme sur
ce qu'un ou plusieurs autres agents vont
faire » (Wikipédia).
Quelques Définitions de la
Théorie des Jeux
L'objectif de la théorie des jeux est de
modéliser ces situations, de déterminer
une stratégie optimale (compétitive ou
collaborative !) pour chacun des agents,
de prédire l’issue du jeu et de trouver
comment aboutir à l'équilibre à une
situation « optimale ».
Un Peu d’Histoire
Antoine Augustin Cournot (1801-1877) publie
en 1838 ses Recherches sur les principes
mathématiques de la théorie des richesses
Application à l’économie
Notion d’équilibre d’un jeu entre deux agents
Première théorie de l’offre et la demande
Notions de monopole, oligopole…
Implications philosophiques
(déterminisme physique, liberté, hasard…)
Un Peu d’Histoire
Émile Borel (1871-1956) publie en 1938 ses
Applications aux jeux de hasard
Théorème du MiniMax (jeux à somme nulle)
Liens avec les « vrais » jeux (bridge, « la
relance »…)
Importance de la théorie des probabilités
Un Peu d’Histoire
John von Neumann (1903-1957) et Oskar
Morgenster (1902-1977) publient en 1944
leur Theory of games and economic behavior
Résolution générale des jeux à somme nulle
(théorème du point fixe)
Exemples d’applications à la décision
économique et politique
Quelques contributions de J. Von Neumann : Axiomatisation des mathématiques ; logique mathématique
Axiomatisation de la mécanique quantique
Théorie de l’information
Architecture des ordinateurs
Manhattan project
…
Un Peu d’Histoire
John Nash (1928-) généralise ces travaux aux
jeux à somme non nulle et inaugure (1994) la
liste des théoriciens des jeux ayant obtenu le
« Prix Nobel d’économie » : T. Schelling et R. Baumann (2005), L. Hurwicz et al. (2007)…
Un homme d'exception (A beautiful mind – 2001)
Quelques concepts/notions clés
Quantifier « objectivement » des questions a priori
subjectives
Rationalité (ou non) des agents
Coopération (coalition) ou compétition (antagonisme)
Intérêt individuel vs collectif
Information connue partielle ou complète ; mémoire
Jeux simultanés, séquentiels, répétés, finis…
Jeux à somme nulle ou non nulle
Équilibres de Nash (aucun agent n’a intérêt à dévier
unilatéralement de sa stratégie)
…
Quelques domaines d’applications
Économie et finance
Relations internationales
Sciences politiques
Organisation sociale
Sociologie
Biologie évolutive et comportementale
Philosophie
…
L’apport du physicien
Expérience de la modélisation de
phénomènes naturelles (identification des
ingrédients essentiels)
Retours théorie/expérience (nécessité du
caractère robuste et prédictif d’un modèle)
Recours systématique aux simulations
numériques (design/test/solution du modèle)
Éventail de techniques mathématiques issues
de la physique statistique et non linéaire
La “Science” du Poker
Émile Borel résout un jeu à deux joueurs (1938) : « La Relance »
Les joueurs A et B mettent 1 $ au pot et reçoivent chacun une « main » aléatoire cA et cB2[0,1]
Borel démontre la meilleure stratégie de A et B
A commence
A relance R$ si cA>rA
B suit R$
si cB>rB
La meilleure main gagne
(R+1)$
B se couche
si cB<rB
A gagne 1$
A se couche
si cA<rA B gagne 1$
La “Science” du Poker
John von Neumann (1944) modifie les règles de « La Relance » pour inclure le bluff
Les joueurs A et B mettent 1 $ au pot et reçoivent chacun une « main » aléatoire cA et cB2[0,1]
La meilleure A-stratégie implique de… bluffer aléatoirement avec les mains très faibles
A commence
A relance de R$
si cA>rA ou si cA<sA
B se couche
si cB<rB A gagne 1$
B suit de R$
if cB>rB
La meilleure main gagne
(R+1)$
A « check »
si sA<cA<rA
La meilleure main gagne 1$
WSOP 2009: 57 tournois (200 – 6500 joueurs)
Main event: 6494 joueurs; 10000$ buy-in ; prix du gagnant: 8.5 M$
Fraction de joueurs F(X) moins riches qu’un
joueur donné ayant X fois la fortune moyenne
Modélisation des championnats de base-ball
Système isolé ; absence de match nul ; aspects
psychologiques mineurs ; grande base de données
Fraction de victoires vs le rang final durant deux ères
identifiées par le modèle (1900-1960; 1961-2012)
Distribution du nombre de victoires répétées
Modélisation des championnats
de football
Nombre de points et fraction de victoires (domicile &
extérieur) et de matchs nuls dans les ligues majeures
européennes vs le rang final (UK et Allemagne)
Un jeu « en or » (MiniMax)
Les histoires possibles du jeu forment un arbre de 2n coups joués, avec un score final : Sn2{xk, k=1,…,22n} ; xk nombres aléatoires entre 0 et 1
A veut maximiser le score Sn et B veut le minimiser
5 1
max min 0.618...2
choix de choix den A nB kxS
2n
Le « polymère joueur »
Jeu en arbre (inspiré d’un modèle de polymère en milieu désordonné) avec accumulation de scores locaux (les ai valent 0 ou 1 avec probabilité {1-p, p})
A veut maximiser le score et B veut le minimiser (importance de la « profondeur d’analyse »)
chemini
ik
x a
Et maintenant, jouons !
Le « dilemme du prisonnier » (Merrill Flood et Melvin Dresher – 1950)
Placez-vous par 2 et attribuez-vous chacun un nom
(An et Bn)
Vous et votre « ami » avez été arrêtés pour un crime et la
police vous interroge séparément
À chacun d’entre vous, le même « marché » est proposé :
Aucun de vous ne dénonce l’autre : 1 an de prison ferme
pour les deux
L’un des deux dénonce l’autre : il repart libre (immunité)
et l’autre écope de 5 ans de prison
Chacun dénonce l’autre : les deux écopent de 3 ans
fermes
À vous de jouer (sans communiquer) !
De la théorie à l’expérience… Le dilemme du prisonnier a fait l’objet d’un très grand nombre d’études
expérimentales, tant en économie qu’en psychologie sociale :
• Certaines études ont montré que les femmes coopèrent davantage que les
hommes.
• Chez des enfants âgés de 6 à 11 ans, on a observé un taux de coopération
(c’est-à-dire un pourcentage de sujets optant pour la coopération) qui augmente
avec l’âge, un résultat suggérant, en conformité avec certains principes de la
psychologie de l’enfant, un apprentissage progressif des normes sociales de
coopération.
• Les étudiants en économie sont moins coopératifs que les autres !
• Les étudiants anglo-saxons coopèrent moins que les autres.
• Les traits de personnalité influencent le comportement face au jeu.
• Les autistes ne se comportent pas différemment des sujets « normaux », mais
ont une perception très différente du jeu.
• La communication entre les joueurs renforce la coopération.
• La coopération est plus forte lorsque les sujets se connaissent et partagent un
esprit de groupe.
• L’introduction d’un mécanisme de sanction peut renforcer la coopération, même
si elle a parfois des effets pervers en introduisant une suspicion entre les
joueurs qui peut inhiber certains comportements coopératifs.
• La pression sociale (pression par les pairs) est un mécanisme incitatif à la
coopération particulièrement puissant.
Et maintenant, jouons !
Le « concours de beauté » (John Maynard Keynes – 1936 et Hervé Moulin – 1986)
Écrivez chacun un nombre entier entre 0 et 1000,
en secret et sans communiquer entre vous
Nous calculerons la moyenne m de vos réponses
Le gagnant est celui dont la réponse s’approchera
le plus des ¾ de la moyenne m
Le gagnant recevra un prix mirifique !
À vous de jouer !
Merci de votre attention…
Et de votre participation !
Présentation téléchargeable (avec d’autres)
sur ma page sur le site du LPT Toulouse
Quelques liens
• http://fr.wikipedia.org/wiki/Th%C3%A9orie_des_jeux
• http://fr.wikipedia.org/wiki/Th%C3%A9orie_des_jeux_en_relations_i
nternationales
• http://www.math.ens.fr/culturemath/materiaux/Eber/prisonnier.htm
• http://fr.wikipedia.org/wiki/Concours_de_beaut%C3%A9_de_Keynes
• http://www.lpt.ups-tlse.fr/spip.php?article239 (avec notamment un
texte de vulgarisation en français)
• http://fr.wikipedia.org/wiki/Programme_d%27%C3%A9checs
• http://fr.wikipedia.org/wiki/Th%C3%A9orie_des_jeux_combinatoires