... un nombre fini n de périodes
Pour résoudre ce problème, on utilise l'induction à rebours.
Définition :
La méthode de l'induction à rebours implique que l'on se place à la dernière période du jeu, que l'on identifie les stratégies des joueurs à cette période, puis que l'on remonte le temps jusqu'à la première période du jeu.
Au dernier tour (jeu à un coup), l'équilibre de Nash du jeu du dilemme du prisonnier est (D, D) : les joueurs ont intérêt à ne pas coopérer et à avouer.
A l'avant dernier-tour, le joueur pourrait envisager d'envoyer un signal à l'autre joueur (en coopérant) lui indiquant qu'il est prêt à coopérer.
En coopérant à l'avant-dernier tour, le joueur développerait ainsi une réputation de joueur « coopérant ».
Cependant, anticipant le comportement de l'autre joueur au dernier tour du jeu (défection), les joueurs ne gagnent rien à essayer de coopérer à l'avant-dernier tour.
L'équilibre de Nash du jeu répété à l'avant dernier-tour est donc (D, D).
On continue le raisonnement en remontant le jeu de période en période jusqu'au premier tour du jeu...
Dans un dilemme des prisonniers répété dont le nombre fini de tours est connu à l'avance, l'équilibre de Nash consiste à avouer à chaque tour.
Remarque :
Cette solution implique cependant que la méthode de l'induction à rebours soit cohérente.
Ce que le paradoxe de l'examen surprise remet en cause.