“La théorie des jeux est un jeu d’enfant.” –Hoca Camide
De nombreuses interactions sociales impliquant des conflits d’intérêts peuvent être modélisées comme de simples jeux à deux où chaque personne, ou joueur, choisit entre une stratégie prosociale ou de coopération et une stratégie individualiste ou défaillante. Ici, nous jetons un coup d’œil à deux des jeux les plus célèbres.
Sommaire
Le dilemme du prisonnier
Le Le dilemme du prisonnier (PD) est sûrement le plus célèbre de tous les jeux interpersonnels étudiés en sciences sociales (Poundstone, 1993). Il est généralement représenté par l’histoire des deux prisonniers qui sont interrogés séparément par un procureur de district qui leur propose un marché par lequel ils bénéficient individuellement de se raconter l’un l’autre tout en bénéficiant collectivement du silence.
À savoir, chaque suspect est informé que s’il avoue et trahit l’autre, alors que l’autre ne le fait pas, il sera libéré. Si les deux avouent, il y aura une peine de huit ans. Si, toutefois, aucun des suspects n’avoue, ils recevront chacun une peine de quatre ans. Enfin, un suspect qui refuse d’avouer alors que l’autre le fait, se retrouve avec une peine de prison de dix ans.
Dans ce jeu, le refus d’avouer équivaut à un acte de coopération avec l’autre joueur, et un aveu équivaut à un acte de défection.
Le dilemme du prisonnier
Source : J. Krueger
Le PD peut être représenté plus simplement avec l’utilisation de récompenses monétaires comme indiqué dans la matrice 1. Appelons le joueur de ligne Rowan et le joueur de colonne Colin. Leurs gains sont respectivement affichés à gauche et à droite de la virgule dans chaque cellule. Chaque joueur reçoit 4 $ en dotation dans cette version « en donner » du PD.
Si Rowan coopère en mettant ses 4 $ dans un pot, il reçoit 8 $ si Colin fait de même, mais se retrouve avec 0 $ si Colin fait défaut. Si Rowan fait défaut en gardant l’argent, il reçoit 10 $ si Colin coopère, mais ne gagne ou ne perd rien si Colin fait également défaut (4 $). Pour Colin, les mêmes résultats s’appliquent.
Par notation commune (Rapoport, 1967), le résultat de la coopération mutuelle est appelé R (ici 8 $), la coopération unilatérale S (0 $), la défection unilatérale T (10 $) et la défection mutuelle P (4 $).
La PD est définie par les inégalités de T > R > P > S et on suppose généralement que 2R > (T + S), ce qui signifie que 2R est à dominante de gain; la coopération mutuelle produit le plus grand bénéfice collectif pour les deux acteurs. Cependant, notez que chaque joueur gagne individuellement plus de défection, peu importe ce que fait l’autre joueur. La défection est donc considérée comme un stratégie dominante.
Il satisfait le principe de la certitude. Si la défection bat la coopération si l’autre joueur coopère, et si la défection bat également la coopération si l’autre joueur fait défaut, alors un joueur devrait faire défection même sans savoir ce que l’autre joueur a décidé de faire. Cependant, si les deux joueurs font défaut, ils s’en sortent individuellement et collectivement moins bien que si les deux coopèrent, et c’est là le dilemme.
Une façon différente d’aborder le dilemme consiste à considérer les intérêts primaires et secondaires des joueurs. Pour chacun, l’intérêt principal est d’avoir un partenaire coopératif, car cela donnerait l’un des deux gains les plus élevés (10 $ ou 8 $). L’intérêt secondaire est de choisir la défection comme sa propre stratégie, car cela donnera la deuxième paire de gains la plus élevée (10 $ ou 4 $). De la même manière, on peut observer que la coopération profite plus à l’autre joueur que la défection ne profite à soi-même.
Jeu de Poulet
Le jeu de poulet (CG) est un jeu de moindre renommée, et il est parfois confondu avec le PD. Les deux jeux sont rarement considérés en comparaison directe, une omission que cet essai est censé corriger. Le CG est marqué par les inégalités de T > R > S > P. Avec un changement des deux gains inférieurs, nous observons des changements importants. Bien que 2R reste la solution à dominante de gain, 2P n’est plus la équilibre de Nash c’était dans le PD. Dans un équilibre de Nash, aucun des joueurs n’a d’incitation individuelle ou unilatérale à changer de stratégie. Les gains indiqués dans la matrice 2 le montrent clairement.
Jeu de poulet
Source : J. Krueger
Dans le CG, il est préférable de coopérer avec un transfuge connu, ce qui transforme les résultats de la coopération-défection et de la défection-coopération en équilibres de Nash. Le problème est que, puisque le jeu exige des choix individuels sans connaissance préalable du choix de l’autre, un joueur ne peut pas savoir si la coopération le protège d’une défection mutuelle ou si la défection rapportera le gain T convoité en raison de la coopération de l’autre, et c’est le dilemme.
En termes d’intérêts, nous voyons que l’intérêt principal de chaque joueur est, encore une fois, la présence d’un partenaire coopérant (rendant soit 10 $ ou 8 $). L’intérêt secondaire, et stratégiquement décisif, est de jouer la stratégie que l’autre ne joue pas : défection contre un coopérateur (10$) mais coopération avec un transfuge (4$).
Puisqu’il n’y a pas de stratégie dominante, la théorie des jeux stipule qu’un joueur rationnel coopère avec une probabilité supérieure à 0. Le calcul de cette probabilité est simple, bien qu’il puisse nécessiter l’utilisation d’un tableur. Plus précisément, p = (P – S) / (P + T – R – P) = 0,5. L’effet de l’utilisation de p est qu’aucun joueur n’a la possibilité d’exploiter l’autre car la valeur attendue de la coopération est la même que la valeur attendue de la défection.
Une comparaison entre les jeux
Selon la théorie, il devrait y avoir plus de coopération dans le CG, où p > 0, que dans le PD, où p = 0. Pourtant, nous savons que de nombreuses personnes coopèrent dans le PD, et leur volonté de le faire est prédite par un indice de « facilité » simple, que Rapoport a défini comme k = (R – S) / (T – P). Cet index ouvre une fenêtre sur la psychologie sous-jacente.
À mesure que T – P (le dénominateur) devient plus petit, la défection réduit la cupidité dans l’un ou l’autre jeu, l’indice devient plus grand et la coopération plus attrayante. Au fur et à mesure que P – S devient plus petit, il y a moins de peur de la défection des autres, et à nouveau la coopération devient plus attrayante.
Dans les jeux affichés dans les matrices, k = .4 pour le PD et 1.0 pour le CG. Autrement dit, l’ordre des gains peut être suffisant pour augmenter directement la coopération dans le CG par rapport au PD, et pas seulement le déplacement de la probabilité rationnelle de coopération de 0 dans le PD à 0,5 dans le CG.
La confusion de p et k est grande. Si nous considérons tous les jeux CG où T = $10 et P = $0 et faisons varier R et S tout en maintenant les inégalités définissant le jeu, nous trouvons une corrélation entre k et p de r = 0,826. Pour savoir si les différences dans la probabilité rationnelle de coopération par elles-mêmes augmentent la coopération, nous devons maintenir l’attractivité du jeu k constante.
Ici, nous pouvons le faire en trouvant un CG avec k = 4 de sorte que le PD et le CG partagent le même niveau de «facilité», tout en ne différant que par p, la probabilité théorique des jeux de coopération rationnelle.
Nous pouvons obtenir un tel CG en sélectionnant un gain T pour défection unilatérale de 24 $. En d’autres termes, nous devons augmenter considérablement l’attrait de la cupidité dans le CG pour rendre le jeu aussi peu attrayant pour les coopérateurs que le PD. Dans ce jeu CG modifié, p = .2. Nous pouvons maintenant demander si la coopération est réduite de la coopération vue dans le jeu CG montré dans la matrice 2 et si elle est réduite aux niveaux vus dans le PD montré dans la matrice 1. Si c’est le cas, alors la probabilité de coopération théorique du jeu a un effet indépendant de l’attractivité générale du jeu, c’est-à-dire sa capacité à induire la cupidité ou la peur.
Il s’agit d’une étude qui – autant que je sache – doit encore être menée. Dans le monde extérieur au laboratoire, un défi critique pour les gens (c’est-à-dire les joueurs) est de déterminer dans quel type de jeu, PD, CG ou autre, ils se trouvent. Les chercheurs qui les étudient sont confrontés au même défi.
Hélas, les jeux sont généralement étudiés isolément, comme si nous savions déjà que nous étions tous d’accord sur le jeu auquel nous jouons. Par conséquent, les comparaisons directes entre les jeux sont instructives. De telles comparaisons peuvent être instructives sur les motivations des joueurs. On pourrait s’attendre à ce que quelqu’un qui préfère jouer un PD soit plus susceptible de faire défaut, révélant ainsi la cupidité, et quelqu’un qui préfère jouer un CD est plus susceptible de coopérer, révélant ainsi la peur d’une défection mutuelle.
Dans quels jeux es-tu ?