Uploaded by Ngouo Josias

Chap1 1920

advertisement
LA THEORIE DES JEUX STRATEGIQUES ET LES CRITERES DE
DECISION
Une décision comporte deux composantes : des éléments objectifs et des éléments subjectifs.
Une stratégie à plus ou moins long terme repose sur des éléments objectifs, ce qui suppose
l’existence de critères : la productivité, la rentabilité, la qualité, la flexibilité et le juste-àtemps, le respect des normes, la prise en compte des aspects sociaux (niveau des salaires, taux
d’absentéisme, …). Tous ces critères objectifs peuvent être mesurés par des indicateurs
(ratios) rassemblés dans un tableau de bord. Cependant une stratégie suppose une prise de
risque et par conséquent une conception de l’avenir par le décideur. Par ailleurs un décideur
aura un tempérament acceptant plus ou moins le risque, cherchant à limiter celui-ci et, selon
les décideurs, le choix ne sera pas le même alors qu’ils se réfèrent à une même classe des
indicateurs.
Cette dichotomie conduit à deux approches spécifiques :
-
La recherche de la stratégie optimale sur la base d’un critère objectif qui relève de la
théorie des jeux stratégiques
-
En ayant recours à des critères subjectifs de décision, la théorie de la décision
proposera suivant le tempérament des joueurs, des décisions différentes
I – La théorie des jeux stratégiques
I –1 Présentation générale
La théorie des jeux se propose d'étudier des situations (appelées « jeux ») où des individus
(les « joueurs ») prennent des décisions, chacun étant conscient que le résultat de son propre
choix (ses « gains ») dépend de celui des autres. C'est pourquoi on dit parfois de la théorie des
jeux qu'elle est une « théorie de la décision en interaction ». Les décisions ayant pour but un
gain maximum : elles relèvent d'un comportement rationnel.
La théorie des jeux s'intéresse à des modèles d'un type particulier, les « jeux », qui sont
constitués de trois éléments : les joueurs, leurs ensembles de stratégies (un par joueur) et les
règles du jeu (qui portent notamment sur les gains et l'information de chacun).
Un jeu est, au sens de la théorie des jeux, un modèle, dont les principaux ingrédients sont
des individus (« joueurs ») qui prennent des décisions simultanément, en choisissant un
élément d'un ensemble dont les caractéristiques font partie des hypothèses du modèle, et
des règles, qui précisent notamment l'issue résultant des diverses décisions (simultanées)
possibles, une issue étant généralement caractérisée par les gains qu'elle procure aux
joueurs et l'information dont dispose chacun.
Les éléments de l'ensemble dans lequel les individus font leurs choix sont appelés
« stratégies ».
Page 1 sur 7
I –2 Traduction d’un jeu sous forme de programme linéaire
Pour déterminer, la stratégie des joueurs, un jeu est généralement traduit en programme
linéaire qui sera ensuite résolu par la méthode du simplexe. On va illustrer cette traduction et
cette résolution par l’exemple suivant.
Deux entreprises concurrentes A et B proposent sur le marché trois types de produits P1, P2 et
P3 au même prix. La matrice des gains de A est la suivante :
P1
P2
P3
Entreprise A
P1
0
3
-1
P2
1
1
-2
P3
2
-1
1
Les deux entreprises se posent la question de la stratégie de fabrication et de mise sur le
marché de chaque produit pour maximiser son gain (maximiser le chiffre d’affaire) ou
minimiser sa perte (limiter la baisse du chiffre d’affaire).
Pour chaque entreprise, il faut déterminer la fréquence de fabrication et de mise sur le marché
de chacun de ce produit pour atteindre cet objectif.
La matrice des écarts de gains est :
B
A
Soient, pour l’entreprise A,
P1
P2
P3
P1
2
5
1
P2
3
3
0
P3
4
1
3
p , q et r
les fréquences respectives de fabrication et de mise
sur le marché des produits P1, P2, P3 avec
Soient, pour l’entreprise B, s ,
t et u
le marché des produits P1, P2, P3 avec
On a donc la matrice suivante :
p  q  r 1
les fréquences respectives de fabrication et de mise sur
s  t  u 1
B
A
P1
P2
P3
s
t
u
P1
p
2
5
1
P2
q
3
3
0
P3
r
4
1
3
Si l’entreprise B fabrique et met sur le marché le produit P1, le gain de l’entreprise A sera :
2 p  3q  4r
Page 2 sur 7
Si l’entreprise B fabrique et met sur le marché le produit P2, le gain de l’entreprise A sera :
5 p  3q  1r
Si l’entreprise B fabrique et met sur le marché le produit P2, le gain de l’entreprise A sera :
p  0q  3r
Il existe un triplet
gm
( p, q, r )
tel que le gain de A soit minimum ; on désigne ce minimum par
et on a le système suivant :
 2 p  3q  4r  gm

5 p  3q  r  gm
 p  3r  gm

q
p
r
x

y

z

En divisant par gm et posant
gm ,
gm ,
gm , on a le système suivant :
2 x  3 y  4 z  1

5 x  3 y  z  1
 x  3z  1

L’objectif A est de s’éloigner le plus possible de gm pour maximiser son gain g ou encore
1
de minimiser
gm . En conséquence la stratégie de A s’exprime par le programme linéaire
suivant :
1
 x yz
gm
2 x  3 y  4 z  1

5x  3 y  z  1
s/c 
 x  3z  1

Min
et des contraintes de non négativité
Le programme dual associé exprime le programme linéaire de la stratégie de B qui cherche à
minimiser sa perte
h
et donc de maximiser
1
h
d’où le programme suivant :
1
 abc
h
2a  5b  c  1

3a  3b  1
s/c 
et des contraintes de non négativité
4a  b  3c  1

Max
Page 3 sur 7
La résolution du dual par la méthode du simplexe permet d’obtenir :
La résolution du dual permet d’obtenir
Les fréquences de jeu pour
t  c.h 
a0 , b 
B sont donc de :
1
2
3
, c , h
7
7
7
s  a.h  0
,
t  b.h 
1
3
et
2
3
Les variables d’écart du dernier tableau du simplexe permet de déduire que :
1
1
, d’où p  x.g 
7
3
y  0 , d’où q  y.g  0
3
2
z  , d’où r  z.g 
7
3
x
Conclusion :
L’entreprise A doit fabriquer et mettre sur le marché 1 jour sur 3 le produit P1, aucun produit
P2 et 2 jour sur 3 le produit P3 pour obtenir un gain maximum de
3
7
L’entreprise B doit fabriquer et mettre sur le marché aucun produit P1, 1 jour sur 3 le produit
P2 et 2 jour sur 3 le produit P3 pour limiter sa perte à
3
7
I –3 Particulier de la matrice des gains
a) Notions de point selle et de domination
Notion de point selle :
Un point selle est un point d’équilibre. Dans la matrice de gain d’un joueur, il correspond
l'élément aij qui est à la fois minimum de la ligne i et maximum de la colonne j . La valeur
du jeu est donc dans ce cas la valeur de cet élément. Une matrice peut posséder plusieurs
points selles mais ils sont forcément égaux.
Exemple : Considérons la matrice de gains du joueur A suivante :
Joueur B
Joueur A
Le point selle est
B1
B2
B3
A1
5
1
3
A2
3
2
4
A3
-3
0
1
2 . Le gain maximum de A est 2
et B limite sa perte au minimum de . 2 .
Page 4 sur 7
Notion de domination :
Certaines tactiques ne sont pas utiles car elles sont moins bonnes quelque soit le jeu de
l’adversaire.
Dans une matrice de gains, on dit qu’une ligne
i
domine une ligne
k si :
aij  akj j

aij  akj pour au moins j
Dans une matrice de gains, on dit qu’une colonne
j
domine une colonne
l si :
aij  ail i

aij  ail pour au moins i
Cette notion permet de réduire la matrice des gains : en effet les lignes et les colonnes
dominées doivent être supprimées. En général avant de traduire un jeu en programme linéaire,
il faut d’abord réduire si possible sa matrice de gains.
Exemple :Considérons la matrice de gains du joueur A suivante :
Joueur B
Joueur A
B1
B2
B3
B4
A1
2
0
1
4
A2
1
2
5
3
A3
4
1
3
2
Les tactiques B3 et B4 sont dominées par la tactiques B2 : on les supprime et la se matrice se
réduit à :
Joueur B
Joueur A
B1
B2
A1
2
0
A2
1
2
A3
4
1
La tactique A1 est dominée par la tactiques A3 : on la supprime et la matrice se réduit à :
Joueur B
Joueur A
B1
B2
A2
1
2
A3
4
1
On ensuite écrire le programme linéaire correspondant et le résoudre.
Page 5 sur 7
b) Recommandation
Lorsque l’on a établi la matrice des gains, pour déterminer la stratégie de chaque joueur, il
faut procéder comme suit :
1°/ Rechercher un point scelle : s’il existe alors on en déduit la stratégie et les gains
des joueurs.
2°/ S’il n’existe pas de point scelle, il faut chercher à réduire la matrice des gains avant
de la traduire en programme linéaire
II – Les critères de décision
Ce sont des critères qui permettent à un décideur de se prononcer connaissant certaines
hypothèses ou situations, les décisions prises entraînant des conséquences en terme de gains
(profits) ou de pertes. Placé dans une situation où plusieurs décisions sont possibles, le
décideur utilisera tel ou tel critère suivant sa perception de la situation. La difficulté
d’application de la théorie de la décision réside dans la détermination des hypothèses retenues
et des gains résultant des différentes décisions.
II-1 – Critère de Von Neumann ou Wald
Ce critère consiste à prendre le maximum de sécurité dans la prise de décision. Par
conséquent, on détermine le minimum de chaque décision et on se satisfait du maximum du
minimum
Exemple :
Une entreprise étudie la possibilité d’implanter une de ses surcursales dans cinq zones Z1, Z2,
Z3, Z4 et Z5 en fonction de cinq hypothèses H1, H2, H3, H4 et H5. La matrice suivante
présente le profit mensuel exprimé en millions de francs.
H1
H2
H3
H4
H5
Z1
55
25
10
10
8
Z2
10
15
7
10
5
Z3
40
20
26
24
25
Z4
20
10
30
25
20
Z5
30
17
20
22
15
Quelle zone sera choisie ?
II-2 – Critère de Savage ou des regrets
On détermine d’abord la matrice des regrets ou des manques à gagner. Pour chaque
hypothèse, on repère le meilleur résultat auquel est associé aucun regret ; pour les autres, on
calcule le regret par différence entre ce meilleur résultat pour une hypothèse et le résultat
obtenu pour chaque décision. Puis on recherche pour chaque décision le regret le plus élevé et
on retient la décision qui correspond au minimum des regrets maximum.
Cas de l’exemple précédent
Page 6 sur 7
II-3 – Critère du Maximax
Pour ce critère, on retient la décision qui correspond au profit maximum quelque soit le risque
à attaché à cette décision
Cas de l’exemple précédent
II-4 – Critère de Satisfaction
Il consiste à prendre la décision qui correspond au maximum de la satisfaction minimale.
On détermine d’abord la matrice de satisfaction. Pour chaque hypothèse, le plus mauvais
résultat correspond à une satisfaction nulle; pour les autres résultats, la satisfaction est
calculée par différence avec le plus mauvais résultat.
Cas de l’exemple précédent
II-5 – Critère de Hurwicz
Pour chacune des décisions, on relève les valeurs extrêmes : soient M i meilleur résultat et mi
le plus mauvais. La décision prise est celle qui maximise l’expression :
E   M i  (1   )mi
Où  est un coefficient qui traduit l’optimisme du décideur : 0    1
Si   0 , on a E  mi , pessimisme intégral
Si   1 , on a E  M i , optimisme total
Il est évident que la valeur attribuée à  exprime plus une tendance du tempérament du
décideur qu’une vérité mathématique quantifiée de manière scientifique. On considère trois
valeurs pour  :   0, 25 plutôt pessimiste,   0,5 indifférent et   0, 75 plutôt optimiste
Cas de l’exemple précédent
II-6 – Critère de Laplace
Ce critère repose sur l’hypothèse implicite que si les probabilités de réalisation des différentes
hypothèses sont inconnues, on peut considérer qu’elles sont équiprobables. La décision prise
par le décideur est celle qui assure la plus grande moyenne arithmétiques des résultats
possibles
Cas de l’exemple précédent
II-7 – Critère de Bernouilli
Pour appliquer ce critère, il faut connaître les probabilités de réalisation des différentes
hypothèses. La décision retenue est celle qui correspond à la plus grande espérance
mathématique
H1
H2
H3
H4
H5
Probabilité
0,30
0,30
0,10
0,20
0,10
Cas de l’exemple précédent
Page 7 sur 7
Download