Jeu sous forme normale

Un article de Wikipédia, l'encyclopédie libre.

En théorie des jeux, un jeu sous forme normale est la spécification de l'espace des stratégies et des fonctions de paiement de chaque joueur à toutes les étapes possibles du jeu.

Sommaire

[modifier] Définition mathmétique

[modifier] Définitions préliminaires

La forme normale est employée pour décrire des jeux à nombre de coups, de joueurs et de stratégies finis.

Soit donc un ensemble fini P de joueurs indexés par {1, 2, ..., m}. Chaque joueur k peut employer un nombre fini de stratégies pures choisies dans l'ensemble  S_k = \{1, 2, \ldots, n_k\}.

Un profil de stratégies est alors le m-uplet :

 \vec{\sigma} = (\sigma_1, \sigma_2, \ldots,\sigma_m)\in (S_1\times
S_2 \times \ldots \times S_n)

On note Σ l'ensemble des profils de stratégies.

Une fonction de paiements est une fonction F :

 F: \Sigma \rightarrow \mathbb{R}.

Elle s'interprête comme le gain, éventuellement mesuré en termes d'utilité, pour chaque joueur et pour tout résultat du jeu.

[modifier] Jeu sous forme normale

La forme normale d'un jeu est alors la donnée de

 (P, \mathbf{S}, \mathbf{F})

avec les définitions du paragraphe précédent.

[modifier] Jeux infinis

Les définitions données ci-dessus sont également valables pour les jeux comportant un nombre infini de joueur ou de stratégies possibles. Toutefois, leur étude demande des outils d'analyse fonctionnelle qui ne sont pas requis en théorie des jeux finis.

[modifier] Stratégies mixtes en forme normale

Il est possible d'intégrer la possibilité de stratégies mixtes dans un jeu en forme normale. On suppose alors que chaque joueur associe à une probabilité Prk à chaque élément de Sk :

\operatorname{Pr}_k={\operatorname{Pr}_k(1),  \operatorname{Pr}_k(2), \ldots, \operatorname{Pr}_k(n_k)}.

Un profil de stratégies mixtes est alors la donnée des 
\operatorname{Pr}_k, k \in {1,2,\ldots,m}.

L'espace σ des profils de stratégies est alors un espace probabilisé tel que :

 \operatorname{Pr}(\vec{\sigma} = (\sigma_1, \sigma_2, \ldots,\sigma_m))=\operatorname{Pr}_1(\sigma_1) \times\operatorname{Pr}_2(\sigma_2) \times \cdots \times \operatorname{Pr}_m(\sigma_m) .

La fonction de paiements est alors une variable aléatoire sur (Sigma,\operatorname{Pr}). On en considère alors l'espérance selon \operatorname{Pr}.

[modifier] Matrice des gains

Icône de détail Article détaillé : matrice des gains.

[modifier] Définition

Quand il n'y a que deux joueurs et un nombre suffisamment restreint de stratégies, il est possible de donner la forme normale d'un jeu sous la forme d'un tableau à m lignes et n colonnes, où m et n sont le nombre de stratégies à la disposition du joueur représenté respectivement en ligne et en colonne. Les cases du tableau sont alors remplis avec un doublet donnant les paiement pour chaque joueur si le résultat du jeu est la paire de stratégies correspondant à la ligne et à la colonne de la case considérée.

[modifier] Exemple

Considérons le jeu connu sous le nom de dilemme du prisonnier. Les deux joueurs sont deux criminels, entendus en même temps, séparément l'un de l'autre et sans possibilité de communiquer à propos d'un crime commis en commun. Chaque prisonnier peut soit nier le crime (C, pour coopérer), soit plaider coupable et servir de témoin à charge contre son complice (D, pour dévier). Le résultat de chaque stratégie en nombre d'années de prison est comme suit :

(C) (D)
(c) 1,1 20,0
(d) 0,20 10,10

Le premier prisonnier (Ligne) peut donc choisir de coopérer ou de dévier. De même, le deuxième prisonnier (Colonne) peut choisir entre coopérer et dévier. Si les deux coopèrent, ils écopent d'un an de prison chacun. S'ils dévient tous les deux, ils écopent de dix ans chacun. Si Ligne coopère et que Colonne dévie, Colonne est libéré, et Ligne prend vingt ans de prison. Inversement, si Ligne dévie et Colonne coopère, Ligne est libre et Colonne en prend pour vingt ans.