Qu'est-ce que le dilemme du prisonnier?
Le dilemme du détenu est un paradoxe dans l'analyse des décisions dans lequel deux individus agissant dans leur propre intérêt ne produisent pas le résultat optimal. Le dilemme typique du prisonnier est mis en place de telle manière que les deux parties choisissent de se protéger aux dépens de l'autre participant. En conséquence, les deux participants se retrouvent dans un état pire que s'ils avaient coopéré l'un avec l'autre dans le processus de prise de décision. Le dilemme du prisonnier est l'un des concepts les plus connus de la théorie des jeux modernes.
Points clés à retenir
- Le dilemme d'un prisonnier est une situation où les décideurs individuels sont toujours incités à choisir d'une manière qui crée un résultat moins qu'optimal pour les individus en tant que groupe. Les dilemmes du prisonnier se produisent dans de nombreux aspects de l'économie. Les gens ont développé de nombreuses méthodes pour surmonter les dilemmes des détenus afin de choisir de meilleurs résultats collectifs malgré des incitations individuelles apparemment défavorables.
Le dilemme du prisonnier
Comprendre le dilemme du prisonnier
Le dilemme du détenu présente une situation dans laquelle deux parties, séparées et incapables de communiquer, doivent chacune choisir entre coopérer ou non. La récompense la plus élevée pour chaque partie se produit lorsque les deux parties choisissent de coopérer.
Le dilemme du prisonnier classique est le suivant: deux membres d'un gang de voleurs de banque, Dave et Henry, ont été arrêtés et sont interrogés dans des pièces séparées. Les autorités n'ont pas d'autres témoins et ne peuvent prouver les charges retenues contre elles que si elles peuvent convaincre au moins l'un des voleurs de trahir son complice et de témoigner du crime. Chaque voleur de banque est confronté au choix de coopérer avec son complice et de garder le silence ou de se retirer du gang et de témoigner pour les poursuites. S'ils coopèrent et se taisent tous les deux, les autorités ne pourront les condamner que pour une moindre accusation de flânage, ce qui signifiera un an de prison chacun (1 an pour Dave + 1 an pour Henry = 2 ans de prison totale). temps). Si l'un témoigne et que l'autre ne le fait pas, alors celui qui témoigne sera libéré et l'autre aura trois ans (0 ans pour celui qui fait défaut + 3 pour celui condamné = 3 ans au total). Cependant, si les deux témoignent l'un contre l'autre, chacun écopera de deux ans de prison pour avoir été en partie responsable du vol (2 ans pour Dave + 2 ans pour Henry = 4 ans de prison totale).
Dans ce cas, chaque voleur est toujours incité à faire défaut, quel que soit le choix de l'autre. Du point de vue de Dave, si Henry reste silencieux, alors Dave peut soit coopérer avec Henry et purger une peine d'un an de prison, soit faire défaut et se libérer. De toute évidence, il serait préférable de trahir Henry et le reste du gang dans ce cas. D'un autre côté, si Henry fait défaut et témoigne contre Dave, alors le choix de Dave devient soit de garder le silence et de faire trois ans ou de parler et de faire deux ans de prison. Encore une fois, évidemment, il préférerait faire les deux années sur trois.
Dans les deux cas, que Henry coopère avec Dave ou fasse défaut à l'accusation, Dave sera mieux s'il fait lui-même défaut et témoigne. Maintenant, puisque Henry est confronté au même ensemble de choix, il sera également préférable de faire également défection. Le paradoxe du dilemme du prisonnier est le suivant: les deux voleurs peuvent minimiser la durée totale de la peine d'emprisonnement que les deux ne feront que s'ils coopèrent tous les deux (2 ans au total), mais les incitations auxquelles ils sont confrontés séparément les conduiront toujours chacun de faire défection et finir par faire le temps de prison total maximum entre les deux (4 ans au total).
Exemples du dilemme du prisonnier
L'économie regorge d'exemples de dilemmes de détenus qui peuvent avoir des effets bénéfiques ou néfastes pour l'économie et la société dans son ensemble. Le fil conducteur est les situations où les incitations auxquelles est confronté chaque décideur individuel qui choisit les inciteraient à se comporter de manière à les aggraver collectivement, tout en évitant individuellement les choix qui les rendraient collectivement mieux si tout le monde le pouvait. certains choisissent en quelque sorte en coopération.
Un tel exemple est la tragédie des biens communs. Il peut être dans l'intérêt collectif de chacun de conserver et de réinvestir dans la propagation d'une ressource naturelle commune afin de pouvoir continuer à la consommer, mais chaque individu est toujours incité à consommer le plus possible le plus rapidement possible, ce qui puis épuise la ressource. Trouver un moyen de coopérer améliorerait clairement tout le monde ici.
D'un autre côté, le comportement des cartels peut également être considéré comme un dilemme du prisonnier. Tous les membres d'un cartel peuvent s'enrichir collectivement en limitant la production pour maintenir le prix que chacun reçoit suffisamment élevé pour capter les rentes économiques des consommateurs, mais chaque membre du cartel a individuellement une incitation à tromper le cartel et augmenter la production pour également capturer les loyers les autres membres du cartel. En ce qui concerne le bien-être de la société dans laquelle l'entente opère, c'est un exemple de la façon dont le dilemme d'un prisonnier qui décompose l'entente peut parfois réellement améliorer la société dans son ensemble.
Échapper au dilemme du prisonnier
Au fil du temps, les gens ont trouvé diverses solutions aux dilemmes des détenus afin de surmonter les incitations individuelles en faveur du bien commun.
Premièrement, dans le monde réel, la plupart des interactions économiques et humaines se répètent plus d'une fois. Un vrai dilemme de prisonnier n'est généralement joué qu'une seule fois, sinon il est classé comme un dilemme de prisonnier itéré. Dans le dilemme itératif d'un prisonnier, les joueurs peuvent choisir des stratégies qui récompensent la coopération ou punissent la défection au fil du temps. En interagissant à plusieurs reprises avec les mêmes personnes, nous pouvons même délibérément passer du dilemme d'un détenu unique à un dilemme répété d'un détenu.
Deuxièmement, les gens ont développé des stratégies institutionnelles formelles pour modifier les incitations auxquelles les décideurs individuels sont confrontés. L'action collective pour imposer un comportement coopératif par la réputation, les règles, les lois, la prise de décision démocratique ou autre collective, et la punition sociale explicite pour les défections transforme de nombreux dilemmes de prisonnier vers les résultats coopératifs plus collectivement bénéfiques.
Enfin, certaines personnes et certains groupes de personnes ont développé au fil du temps des biais psychologiques et comportementaux tels qu'une confiance accrue les uns envers les autres, une orientation future à long terme dans les interactions répétées et des inclinations vers une réciprocité positive du comportement coopératif ou une réciprocité négative des comportements défectueux. Ces tendances peuvent évoluer à travers une sorte de sélection naturelle au sein d'une société au fil du temps, ou une sélection de groupe à travers différentes sociétés concurrentes. En effet, ils conduisent des groupes d'individus à choisir «de manière irrationnelle» les résultats qui sont en fait les plus bénéfiques pour tous ensemble.
Ensemble, ces trois facteurs (les dilemmes répétés du prisonnier, les institutions formelles qui brisent les dilemmes du prisonnier et les biais comportementaux qui sapent le choix individuel «rationnel» dans les dilemmes du prisonnier) aident à résoudre les nombreux dilemmes du prisonnier auxquels nous serions tous confrontés autrement.
