Théorie des jeux stratégiques et critères de décision

LA THEORIE DES JEUX STRATEGIQUES ET LES CRITERES DE DECISION Une décision comporte deux composantes : des éléments objectifs et des éléments subjectifs. Une stratégie à plus ou moins long terme repose sur des éléments objectifs, ce qui suppose l’existence de critères : la productivité, la rentabilité, la qualité, la flexibilité et le juste-àtemps, le respect des normes, la prise en compte des aspects sociaux (niveau des salaires, taux d’absentéisme, …). Tous ces critères objectifs peuvent être mesurés par des indicateurs (ratios) rassemblés dans un tableau de bord. Cependant une stratégie suppose une prise de risque et par conséquent une conception de l’avenir par le décideur. Par ailleurs un décideur aura un tempérament acceptant plus ou moins le risque, cherchant à limiter celui-ci et, selon les décideurs, le choix ne sera pas le même alors qu’ils se réfèrent à une même classe des indicateurs. Cette dichotomie conduit à deux approches spécifiques : - La recherche de la stratégie optimale sur la base d’un critère objectif qui relève de la théorie des jeux stratégiques - En ayant recours à des critères subjectifs de décision, la théorie de la décision proposera suivant le tempérament des joueurs, des décisions différentes I – La théorie des jeux stratégiques I –1 Présentation générale La théorie des jeux se propose d'étudier des situations (appelées « jeux ») où des individus (les « joueurs ») prennent des décisions, chacun étant conscient que le résultat de son propre choix (ses « gains ») dépend de celui des autres. C'est pourquoi on dit parfois de la théorie des jeux qu'elle est une « théorie de la décision en interaction ». Les décisions ayant pour but un gain maximum : elles relèvent d'un comportement rationnel. La théorie des jeux s'intéresse à des modèles d'un type particulier, les « jeux », qui sont constitués de trois éléments : les joueurs, leurs ensembles de stratégies (un par joueur) et les règles du jeu (qui portent notamment sur les gains et l'information de chacun). Un jeu est, au sens de la théorie des jeux, un modèle, dont les principaux ingrédients sont des individus (« joueurs ») qui prennent des décisions simultanément, en choisissant un élément d'un ensemble dont les caractéristiques font partie des hypothèses du modèle, et des règles, qui précisent notamment l'issue résultant des diverses décisions (simultanées) possibles, une issue étant généralement caractérisée par les gains qu'elle procure aux joueurs et l'information dont dispose chacun. Les éléments de l'ensemble dans lequel les individus font leurs choix sont appelés « stratégies ». Page 1 sur 7 I –2 Traduction d’un jeu sous forme de programme linéaire Pour déterminer, la stratégie des joueurs, un jeu est généralement traduit en programme linéaire qui sera ensuite résolu par la méthode du simplexe. On va illustrer cette traduction et cette résolution par l’exemple suivant. Deux entreprises concurrentes A et B proposent sur le marché trois types de produits P1, P2 et P3 au même prix. La matrice des gains de A est la suivante : P1 P2 P3 Entreprise A P1 0 3 -1 P2 1 1 -2 P3 2 -1 1 Les deux entreprises se posent la question de la stratégie de fabrication et de mise sur le marché de chaque produit pour maximiser son gain (maximiser le chiffre d’affaire) ou minimiser sa perte (limiter la baisse du chiffre d’affaire). Pour chaque entreprise, il faut déterminer la fréquence de fabrication et de mise sur le marché de chacun de ce produit pour atteindre cet objectif. La matrice des écarts de gains est : B A Soient, pour l’entreprise A, P1 P2 P3 P1 2 5 1 P2 3 3 0 P3 4 1 3 p , q et r les fréquences respectives de fabrication et de mise sur le marché des produits P1, P2, P3 avec Soient, pour l’entreprise B, s , t et u le marché des produits P1, P2, P3 avec On a donc la matrice suivante : p  q  r 1 les fréquences respectives de fabrication et de mise sur s  t  u 1 B A P1 P2 P3 s t u P1 p 2 5 1 P2 q 3 3 0 P3 r 4 1 3 Si l’entreprise B fabrique et met sur le marché le produit P1, le gain de l’entreprise A sera : 2 p  3q  4r Page 2 sur 7 Si l’entreprise B fabrique et met sur le marché le produit P2, le gain de l’entreprise A sera : 5 p  3q  1r Si l’entreprise B fabrique et met sur le marché le produit P2, le gain de l’entreprise A sera : p  0q  3r Il existe un triplet gm ( p, q, r ) tel que le gain de A soit minimum ; on désigne ce minimum par et on a le système suivant :  2 p  3q  4r  gm  5 p  3q  r  gm  p  3r  gm  q p r x  y  z  En divisant par gm et posant gm , gm , gm , on a le système suivant : 2 x  3 y  4 z  1  5 x  3 y  z  1  x  3z  1  L’objectif A est de s’éloigner le plus possible de gm pour maximiser son gain g ou encore 1 de minimiser gm . En conséquence la stratégie de A s’exprime par le programme linéaire suivant : 1  x yz gm 2 x  3 y  4 z  1  5x  3 y  z  1 s/c   x  3z  1  Min et des contraintes de non négativité Le programme dual associé exprime le programme linéaire de la stratégie de B qui cherche à minimiser sa perte h et donc de maximiser 1 h d’où le programme suivant : 1  abc h 2a  5b  c  1  3a  3b  1 s/c  et des contraintes de non négativité 4a  b  3c  1  Max Page 3 sur 7 La résolution du dual par la méthode du simplexe permet d’obtenir : La résolution du dual permet d’obtenir Les fréquences de jeu pour t  c.h  a0 , b  B sont donc de : 1 2 3 , c , h 7 7 7 s  a.h  0 , t  b.h  1 3 et 2 3 Les variables d’écart du dernier tableau du simplexe permet de déduire que : 1 1 , d’où p  x.g  7 3 y  0 , d’où q  y.g  0 3 2 z  , d’où r  z.g  7 3 x Conclusion : L’entreprise A doit fabriquer et mettre sur le marché 1 jour sur 3 le produit P1, aucun produit P2 et 2 jour sur 3 le produit P3 pour obtenir un gain maximum de 3 7 L’entreprise B doit fabriquer et mettre sur le marché aucun produit P1, 1 jour sur 3 le produit P2 et 2 jour sur 3 le produit P3 pour limiter sa perte à 3 7 I –3 Particulier de la matrice des gains a) Notions de point selle et de domination Notion de point selle : Un point selle est un point d’équilibre. Dans la matrice de gain d’un joueur, il correspond l'élément aij qui est à la fois minimum de la ligne i et maximum de la colonne j . La valeur du jeu est donc dans ce cas la valeur de cet élément. Une matrice peut posséder plusieurs points selles mais ils sont forcément égaux. Exemple : Considérons la matrice de gains du joueur A suivante : Joueur B Joueur A Le point selle est B1 B2 B3 A1 5 1 3 A2 3 2 4 A3 -3 0 1 2 . Le gain maximum de A est 2 et B limite sa perte au minimum de . 2 . Page 4 sur 7 Notion de domination : Certaines tactiques ne sont pas utiles car elles sont moins bonnes quelque soit le jeu de l’adversaire. Dans une matrice de gains, on dit qu’une ligne i domine une ligne k si : aij  akj j  aij  akj pour au moins j Dans une matrice de gains, on dit qu’une colonne j domine une colonne l si : aij  ail i  aij  ail pour au moins i Cette notion permet de réduire la matrice des gains : en effet les lignes et les colonnes dominées doivent être supprimées. En général avant de traduire un jeu en programme linéaire, il faut d’abord réduire si possible sa matrice de gains. Exemple :Considérons la matrice de gains du joueur A suivante : Joueur B Joueur A B1 B2 B3 B4 A1 2 0 1 4 A2 1 2 5 3 A3 4 1 3 2 Les tactiques B3 et B4 sont dominées par la tactiques B2 : on les supprime et la se matrice se réduit à : Joueur B Joueur A B1 B2 A1 2 0 A2 1 2 A3 4 1 La tactique A1 est dominée par la tactiques A3 : on la supprime et la matrice se réduit à : Joueur B Joueur A B1 B2 A2 1 2 A3 4 1 On ensuite écrire le programme linéaire correspondant et le résoudre. Page 5 sur 7 b) Recommandation Lorsque l’on a établi la matrice des gains, pour déterminer la stratégie de chaque joueur, il faut procéder comme suit : 1°/ Rechercher un point scelle : s’il existe alors on en déduit la stratégie et les gains des joueurs. 2°/ S’il n’existe pas de point scelle, il faut chercher à réduire la matrice des gains avant de la traduire en programme linéaire II – Les critères de décision Ce sont des critères qui permettent à un décideur de se prononcer connaissant certaines hypothèses ou situations, les décisions prises entraînant des conséquences en terme de gains (profits) ou de pertes. Placé dans une situation où plusieurs décisions sont possibles, le décideur utilisera tel ou tel critère suivant sa perception de la situation. La difficulté d’application de la théorie de la décision réside dans la détermination des hypothèses retenues et des gains résultant des différentes décisions. II-1 – Critère de Von Neumann ou Wald Ce critère consiste à prendre le maximum de sécurité dans la prise de décision. Par conséquent, on détermine le minimum de chaque décision et on se satisfait du maximum du minimum Exemple : Une entreprise étudie la possibilité d’implanter une de ses surcursales dans cinq zones Z1, Z2, Z3, Z4 et Z5 en fonction de cinq hypothèses H1, H2, H3, H4 et H5. La matrice suivante présente le profit mensuel exprimé en millions de francs. H1 H2 H3 H4 H5 Z1 55 25 10 10 8 Z2 10 15 7 10 5 Z3 40 20 26 24 25 Z4 20 10 30 25 20 Z5 30 17 20 22 15 Quelle zone sera choisie ? II-2 – Critère de Savage ou des regrets On détermine d’abord la matrice des regrets ou des manques à gagner. Pour chaque hypothèse, on repère le meilleur résultat auquel est associé aucun regret ; pour les autres, on calcule le regret par différence entre ce meilleur résultat pour une hypothèse et le résultat obtenu pour chaque décision. Puis on recherche pour chaque décision le regret le plus élevé et on retient la décision qui correspond au minimum des regrets maximum. Cas de l’exemple précédent Page 6 sur 7 II-3 – Critère du Maximax Pour ce critère, on retient la décision qui correspond au profit maximum quelque soit le risque à attaché à cette décision Cas de l’exemple précédent II-4 – Critère de Satisfaction Il consiste à prendre la décision qui correspond au maximum de la satisfaction minimale. On détermine d’abord la matrice de satisfaction. Pour chaque hypothèse, le plus mauvais résultat correspond à une satisfaction nulle; pour les autres résultats, la satisfaction est calculée par différence avec le plus mauvais résultat. Cas de l’exemple précédent II-5 – Critère de Hurwicz Pour chacune des décisions, on relève les valeurs extrêmes : soient M i meilleur résultat et mi le plus mauvais. La décision prise est celle qui maximise l’expression : E   M i  (1   )mi Où  est un coefficient qui traduit l’optimisme du décideur : 0    1 Si   0 , on a E  mi , pessimisme intégral Si   1 , on a E  M i , optimisme total Il est évident que la valeur attribuée à  exprime plus une tendance du tempérament du décideur qu’une vérité mathématique quantifiée de manière scientifique. On considère trois valeurs pour  :   0, 25 plutôt pessimiste,   0,5 indifférent et   0, 75 plutôt optimiste Cas de l’exemple précédent II-6 – Critère de Laplace Ce critère repose sur l’hypothèse implicite que si les probabilités de réalisation des différentes hypothèses sont inconnues, on peut considérer qu’elles sont équiprobables. La décision prise par le décideur est celle qui assure la plus grande moyenne arithmétiques des résultats possibles Cas de l’exemple précédent II-7 – Critère de Bernouilli Pour appliquer ce critère, il faut connaître les probabilités de réalisation des différentes hypothèses. La décision retenue est celle qui correspond à la plus grande espérance mathématique H1 H2 H3 H4 H5 Probabilité 0,30 0,30 0,10 0,20 0,10 Cas de l’exemple précédent Page 7 sur 7

Théorie des jeux stratégiques et critères de décision

Products

Support

Théorie des jeux stratégiques et critères de décision

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib