Qu'est-ce que l'induction en amont?
L'induction en arrière dans la théorie des jeux est un processus itératif de raisonnement en arrière dans le temps, à partir de la fin d'un problème ou d'une situation, pour résoudre une forme étendue finie et des jeux séquentiels, et inférer une séquence d'actions optimales.
Induction en arrière expliquée
L'induction en arrière a été utilisée pour résoudre des jeux depuis que John von Neumann et Oskar Morgenstern ont établi la théorie des jeux comme sujet académique lorsqu'ils ont publié leur livre, Theory of Games and Economic Behavior en 1944.
À chaque étape du jeu, l'induction en arrière détermine la stratégie optimale du joueur qui effectue le dernier mouvement du jeu. Ensuite, l'action optimale de l'avant-dernier joueur en mouvement est déterminée, en prenant l'action du dernier joueur comme donnée. Ce processus se poursuit en arrière jusqu'à ce que la meilleure action pour chaque moment ait été déterminée. En effet, on détermine l'équilibre de Nash de chaque sous-jeu du jeu original.
Cependant, les résultats déduits de l'induction vers l'arrière ne permettent souvent pas de prédire le jeu humain réel. Des études expérimentales ont montré que le comportement «rationnel» (comme prédit par la théorie des jeux) est rarement présenté dans la vie réelle. Les joueurs irrationnels peuvent en fait finir par obtenir des gains plus élevés que prévu par l'induction en amont, comme illustré dans le jeu des mille-pattes.
Dans le jeu de mille-pattes, deux joueurs ont alternativement une chance de prendre une plus grande part d'un pot d'argent croissant, ou de passer le pot à l'autre joueur. Les gains sont arrangés de telle sorte que si le pot est passé à son adversaire et que l'adversaire prend le pot au tour suivant, on reçoit un peu moins que si on avait pris le pot lors de ce tour. Le jeu se termine dès qu'un joueur prend la cachette, ce joueur obtenant la plus grande portion et l'autre joueur obtenant la plus petite portion.
Exemple d'induction en arrière
Par exemple, supposons que le joueur A joue en premier et doit décider s'il doit «prendre» ou «passer» la cachette, qui s'élève actuellement à 2 $. S'il prend, alors A et B gagnent 1 $ chacun, mais si A réussit, la décision de prendre ou de passer doit maintenant être prise par la joueuse B. Si B prend, elle obtient 3 $ (c.-à-d. La réserve précédente de 2 $ + 1 $) et A obtient 0 $. Mais si B réussit, A doit maintenant décider de prendre ou de passer, et ainsi de suite. Si les deux joueurs choisissent toujours de passer, ils reçoivent chacun un gain de 100 $ à la fin de la partie.
Le but du jeu est que si A et B coopèrent et continuent à passer jusqu'à la fin de la partie, ils obtiennent le paiement maximum de 100 $ chacun. Mais s'ils se méfient de l'autre joueur et s'attendent à ce qu'ils «prennent» à la première occasion, l'équilibre de Nash prédit que les joueurs prendront la réclamation la plus basse possible (1 $ dans ce cas).
L'équilibre de Nash de ce jeu, où aucun joueur n'est incité à s'écarter de sa stratégie choisie après avoir considéré le choix d'un adversaire, suggère que le premier joueur prendrait le pot au tout premier tour de la partie. Cependant, en réalité, relativement peu de joueurs le font. En conséquence, ils obtiennent un gain plus élevé que le gain prévu par l'analyse des équilibres.
Résolution de jeux séquentiels à l'aide d'une induction vers l'arrière
Voici un jeu séquentiel simple entre deux joueurs. Les étiquettes avec le joueur 1 et le joueur 2 sont les ensembles d'informations pour les joueurs un ou deux, respectivement. Les nombres entre parenthèses au bas de l'arbre sont les gains à chaque point respectif. Le jeu est également séquentiel, donc le joueur 1 prend la première décision (gauche ou droite) et le joueur 2 prend sa décision après le joueur 1 (haut ou bas).
Figure 1
L'induction en arrière, comme toute théorie de jeu, utilise les hypothèses de rationalité et de maximisation, ce qui signifie que le joueur 2 maximisera son gain dans n'importe quelle situation donnée. Dans chaque ensemble d'informations, nous avons deux choix, quatre en tout. En éliminant les choix que le joueur 2 ne choisira pas, nous pouvons affiner notre arbre. De cette façon, nous mettrons en gras les lignes qui maximisent le gain du joueur à l'ensemble d'informations donné.
Figure 2
Après cette réduction, le joueur 1 peut maximiser ses gains maintenant que les choix du joueur 2 sont connus. Le résultat est un équilibre trouvé par induction vers l'arrière du joueur 1 choisissant "à droite" et du joueur 2 choisissant "vers le haut". Voici la solution au jeu avec le chemin d'équilibre en gras.
figure 3
Par exemple, on pourrait facilement mettre en place un jeu similaire à celui ci-dessus en utilisant des entreprises comme joueurs. Ce jeu peut inclure des scénarios de sortie de produit. Si la société 1 voulait lancer un produit, que pourrait faire la société 2 en réponse? La société 2 lancera-t-elle un produit concurrent similaire? En prévoyant les ventes de ce nouveau produit dans différents scénarios, nous pouvons mettre en place un jeu pour prédire comment les événements pourraient se dérouler. Voici un exemple de la façon dont on pourrait modéliser un tel jeu.
Figure 4
