Uploaded by rafa.zyc

Game Theory PPT

advertisement
Teorı́a de Juegos
Teorı́a de Juegos
Mario Bravo
Universidad de Santiago de Chile
1/46
Teorı́a de Juegos
Teorı́a de Juegos
Aspectos Básicos
Contenidos
Introducción
Racionalidad y Utilidad
Jugadores, Estrategias (acciones), pagos
Juegos en forma estratégica
Equilibrio de Nash
Eliminación de Estrategias Dominadas
Juegos Finitos de 2 Jugadores
Ejemplos:
El Dilema del Prisionero
La Tragedia de Los Comunes
Batalla de los Sexos
Doves and Hawks...
2/46
Teorı́a de Juegos
Teorı́a de Juegos
Aspectos Básicos
Contexto
1
Optimización: Un agente toma la decisión
max f (x)
x∈X
2
Juegos: al menos dos agentes
max f (x, y)
x∈X
;
max g(y, x)
y∈Y
Diferencia Crucial: Qué hacer cuando hay varios agentes? Varias
respuestas dependiendo del contexto:
Teorı́a de juegos: competición/cooperación
Diseño de mecanismos
Evolución de especies
...
3/46
Teorı́a de Juegos
Teorı́a de Juegos
Aspectos Básicos
Descripción rápida de un Juego
1
Un conjunto de jugadores
2
Una situación inicial
3
Reglas y acciones (estrategias o ”movidas”) de cada jugador
4
Todas las situaciones finales posibles
5
Preferencias de los jugadores respecto de todas las situaciones finales
Ejemplos:
Ajedrez
Dos personas negociando cómo dividir un pastel
RSP (cachipún...)
4/46
Teorı́a de Juegos
Teorı́a de Juegos
Aspectos Básicos
Modelando un Juego
Un juego se modela especificando:
El conjunto de jugadores
Las estrategias o acciones
Las preferencias dadas por todo “perfil de estrategias” (la utilidad)
Estrategia de un jugador: Qué elegir cuando me toca jugar?
5/46
Teorı́a de Juegos
Teorı́a de Juegos
Hipótesis generales
Hipótesis básicas de la teorı́a de juegos
Los jugadores son:
1
Egoı́stas
2
Racionales
“Egoı́smo” significa que a los jugadores sólo les preocupan sus
propias preferencias en los resultados de un juego.
Esto NO es un asunto ético, si no una hipótesis matemática.
Las preferencias de un jugador pueden depender de los otros
resultados e incluir elementos como la “envidia” o el “altruismo”.
La Racionalidad es un asunto bastante más complicado....
6/46
Teorı́a de Juegos
Teorı́a de Juegos
Hipótesis generales
Preferencias
Definición
Sea X un conjunto. Una relación de preferencia en X es una relación
binaria tal que para todo x, y, z ∈ X:
1) x x – Reflexividad
2) se tiene, o bien x y, o bien y x (o ambas) – Completitud
3) x y & y z implica x z – Transitividad
Racionalidad (I): Cada jugador puede proveer una relación de preferencia
sobre los resultados del juego.
7/46
Teorı́a de Juegos
Teorı́a de Juegos
Hipótesis generales
Funciones de utilidad
Definición
Sea una relación de preferencia en X. Una función de utilidad (o
utilidad, o pago) que representa a es una función u : X → R tal que
x y ⇐⇒ u(x) ≥ u(y).
Racionalidad (II): Cada jugador tiene una función de utilidad que
representa sus preferencias.
Una función de utilidad podrı́a no existir (pero, existe bajo hipótesis
“simples”).
Si X es finito, existe.
Naturalmente, no es única.
8/46
Teorı́a de Juegos
Teorı́a de Juegos
Hipótesis generales
Por qué funciones de utilidad ?
La utilidad (o pago) también representa intensidad en la preferencia.
Sirve para incorporar aspectos aleatorios a una decisión:
Ejemplo: Un juego simple de suerte
Jugarı́a usted este juego conmigo?
Lanzamos una moneda al aire. Si el resultado es CARA le pago 10
Soles, si el resultado es SELLO, usted me paga 20 Soles.
Pago Esperado = 12 · 10 + 12 · (−20) = −5
y qué tal con esta variante?
Lanzamos una moneda al aire. Si el resultado es CARA le pago 100
Soles, un caso contrario usted me paga 90.
Pago Esperado = 12 · 100 + 12 · (−90) = 5
En ambos juegos usted prefiere CARA a SELLO: Se necesita calcular
valores esperados...
9/46
Teorı́a de Juegos
Teorı́a de Juegos
Hipótesis generales
Probabilidad y teorı́a de la decisión
Racionalidad (III): Los jugadores son capaces de calcular valores
esperados y usar reglas básicas de probabilidades...
Racionalidad (IV): Cuando es posible, cada jugador usa reglas de la teorı́a
de la decisión: Los jugadores son maximizadores de utilidad (o
minimizadores de costo).
10/46
Teorı́a de Juegos
Teorı́a de Juegos
Hipótesis generales
Resumen (hasta ahora)
1
2
Los jugadores son capaces de ordenar de manera consistente los
resultados de un juego
Los jugadores disponen de una función de utilidad coherente con el
orden anterior
3
Los jugadores calculan valores esperados para incorporar eventos
aleatorios en sus decisiones
4
Los jugadores usan la teorı́a de la decisión, cuando es posible
11/46
Teorı́a de Juegos
Teorı́a de Juegos
Hipótesis generales
Racionalidad (V):
Información completa.
Conocimiento común (Common knowledge)
Es decir:
Cada jugador conoce las estrategias y las utilidades (funciones de
pago) de los oponentes.
No solamente un jugador sabe que los otros son racionales, también
que ellos saben que él sabe y que él sabe que ellos saben que él
sabe....etc...
12/46
Teorı́a de Juegos
Teorı́a de Juegos
Primeras consecuencias
Eliminación de estrategias estrı́ctamente dominadas
Una consecuencia básica de lo anterior es lo siguiente:
Un jugador no elige una estrategia a si tiene disponible una estrategia b
que entrega una utilidad estrı́camente mayor, independiente de lo que
hacen los demás.
13/46
Teorı́a de Juegos
Teorı́a de Juegos
Primeras consecuencias
2/3 del promedio...
Escoja un número n entre 0 y 100 (ambos inclusive)
Quien esté más cerca de 2/3 del promedio de los números elegidos
por todos los jugadores, se lleva el premio
14/46
Teorı́a de Juegos
Teorı́a de Juegos
Juegos en forma estratégica
Juegos en forma estratégica
Definición
Un Juego no-cooperativo de 2 jugadores en forma estratégica está dado
por
Conjuntos de estrategias (o acciones): X (jugador 1) and Y
(jugador 2)
Funciones de pago:
U1 : X × Y → R
(jugador 1)
y
U2 : X × Y → R
(jugador 2)
Los jugadores eligen simultáneamente sus acciones (”movidas”) o
estrategias
15/46
Teorı́a de Juegos
Teorı́a de Juegos
Juegos en forma estratégica
Juegos en forma estratégica (o forma normal)
Extensión natural a N jugadores:
Conjunto de jugadores i ∈ {1, . . . , N }
Conjunto de estrategias Xi para cada i = 1, . . . , N
Perfil de estrategias (x1 , . . . , xn ) con xi ∈ Xi para cada
i = 1, . . . , N
QN
Conjunto de perfiles de estrategia X = i=1 Xi
Funciones de pago Ui : X → R para cada i = 1, . . . , N
16/46
Teorı́a de Juegos
Teorı́a de Juegos
Equilibrio de Nash
Figure: Brasil v/s Alemania, Semifinal, Brasil 2014 (Stony Brook, NY)
17/46
Teorı́a de Juegos
Teorı́a de Juegos
Equilibrio de Nash
Figure: La bilbiografı́a de la tesis de Doctorado de Nash (26 páginas).
“The reward of inventing a new field is having a slim bibliography”
18/46
Teorı́a de Juegos
Teorı́a de Juegos
Equilibrio de Nash
Equilibrio de Nash
Definición
Un equilibrio de Nash ( en estrategias puras) para un juego de 2
jugadores en forma normal es (x̄, ȳ) ∈ X × Y , donde:
U1 (x̄, ȳ) ≥ U1 (x, ȳ) para todo x ∈ X
U2 (x̄, ȳ) ≥ U2 (x̄, y) para todo y ∈ Y
19/46
Teorı́a de Juegos
Teorı́a de Juegos
Equilibrio de Nash
Equilibrio de Nash
Extensión a N -jugadores:
un perfil de estrategias x̄ = (x̄1 , . . . , x̄n ) tal que para cada jugador
i = 1, . . . , N se tiene
Ui (x̄) ≥ Ui (xi , x̄−i ) para todo xi ∈ Xi
donde (xi , x̄−i )es el perfil de estrategias.
(xi , x̄−i ) = (x̄1 , x̄2 , . . . , x̄i−1 , xi , x̄i+1 , . . . , x̄n )
En palabras: ningún jugador i tiene incentivo a desviarse unilateralmente
a algún xi 6= x̄i .
En nuestro juego “2/3 del promedio”, (0, . . . , 0) es el único equilibrio
(puro)!
20/46
Teorı́a de Juegos
Teorı́a de Juegos
Equilibrio de Nash
Equilibrios de Nash y estrategias dominadas
En un juego de 2 jugadores (X, Y, U1 , U2 )
Supongamos que x̄ ∈ X es una estrategia dominante estricta para el
jugador 1, es decir, para todo x ∈ X :
U1 (x̄, y) > U1 (x, y) para todo y ∈ Y .
Luego, si ȳ maximiza la función U2 (x̄, ·), entonces (x̄, ȳ) es un equilibrio
de Nash.
21/46
Teorı́a de Juegos
Teorı́a de Juegos
Juegos finitos de 2 jugadores
Juegos finitos de 2 jugadores
Usualmente, al jugador 1 se le llama jugador fila, y tiene n
estrategias.
El jugador 2, llamado jugador columna, tiene m strategies
Las funciones de pago se pueden representar por dos matrices
(A, B) de n × m.






(a11 , b11 ) . . .
...
...
(ai1 , bi1 ) . . .
...
...
(an1 , bn1 ) . . .
(a1j , b1j )
...
(aij , bij )
...
(anj , bnj )
...
...
...
...
...
(a1m , b1m )
...
(aim , bim )
...
(anm , bnm )



.


Conjunto de estrategias: X = {1, . . . , n}, Y = {1, . . . , m}
Simultáneamente, el J1 elige i ∈ X y el jugador 2 elige j ∈ Y .
Los pagos para J1 y J2 son aij y bij , respectivamente.
22/46
Teorı́a de Juegos
Teorı́a de Juegos
Juegos finitos de 2 jugadores
Ejemplos
2 jugadores, 2 estrategias cada uno:
(8, 8) (2, 7)
(7, 2) (0, 4)
Pago de J1:
8
7
2
0
La segunda fila está estrı́ctamente dominada por la primera, luego el J1
debe jugar TOP.
Qué escoge el segundo jugador?
23/46
Teorı́a de Juegos
Teorı́a de Juegos
Juegos finitos de 2 jugadores
Ejemplos

(8, 8)
 (7, 2)
(5, 3)
(2, 7)
(0, 4)
(3, 9)

(4, 10)
(3, 0) 
(10, 4)
J1 puede eliminar . . .
Sabiendo esto, J2 puede eliminar . . .
Sabiendo esto, J1 puede eliminar . . .
El resultado?
24/46
Teorı́a de Juegos
Teorı́a de Juegos
Juegos finitos de 2 jugadores
Dilema del Prisionero
Probablemente, el ejemplo más famoso de todos.
Dos prisioneros enfrentan un juicio
Si los dos se quedan en silencio, sólo reciben una condena de 1 año
por ofensa menor (debido a la falta de pruebas).
Si uno de ellos confiesa, queda libre por ayudar a la investigación y
el otro recibe una pena de 6 años.
Si ambos confiesan, reciben una pena de 5 años de prisión.
(-1, -1)
(0, -6)
(-6, 0)
(-5, -5)
El único resultado racional es (D, D) que no es solamente un equilibrio
de Nash, si no que se obtiene eliminando estrategias estrı́ctamente
dominadas!
25/46
Teorı́a de Juegos
Teorı́a de Juegos
Juegos finitos de 2 jugadores
Dilema del Prisionero
Un padre le dice a sus dos hijos: Te gustarı́a que te diera 1 Sol a ti, o que
le diera 10 Soles a tu hermano?
(10, 10)
(11, 0)
(0, 11)
(1, 1)
La misma estructura que el Dilema del Prisionero.
26/46
Teorı́a de Juegos
Teorı́a de Juegos
Juegos finitos de 2 jugadores
Tragedia de lo Comunes
Este juego es una versión de 2 jugadores de la famosa “Tragedy of the
Commons”
(a, a) (b, c)
(c, b) (d, d)
con c > a > d > b.
Cuando dos jugadores explotan un recurso común: Es una estrategia
estrı́ctamente dominante tratar de explotar lo más posible, pero como los
recursos son escasos, la situación es peor para todos.
27/46
Teorı́a de Juegos
Teorı́a de Juegos
Juegos finitos de 2 jugadores
Batalla de los Sexos (un poco pasado de moda...)
Dónde ir, al fútbol o a la ópera?
(3, 2)
(0, 0)
(1, 1)
(2, 3)
Cúales son los equilibrios de este juego?
28/46
Teorı́a de Juegos
Teorı́a de Juegos
Ejemplos simples
Utilidad más alta puede no ser mejor...
Comparar los dos juegos:
(10, 10)
(15, 3)
(8, 8)
(7, 2)
(3, 15)
(5, 5)
(2, 7)
(0, 4)
Cualquier resultado en el juego de arriba es mejor, pero el de abajo es
más conveniente para jugar...
29/46
Teorı́a de Juegos
Teorı́a de Juegos
Ejemplos simples
Más estrategias?

(10, 10)
(5, 3)
(1, 1)
 (0, 11)
(0, 4)
(3, 5)
(1, 1)

(11, 0) (4, 0)
(10, 10) (3, 5) 
(5, 3)
(1, 1)
Menos posibilidades puede ser mejor...
30/46
Teorı́a de Juegos
Teorı́a de Juegos
Ejemplos simples
Hawks and Doves
Dos aves en una pelea pueden comportarse como un halcón (Hawk) o
como una paloma (Dove)
Si ambas son agresivas, se hieren gravemente y obtienen -100
unidades cada una
Si ambas son gentiles obtienen una unidad cada una
Si un halcón se encuentra con una paloma, el halcón gana 10 y la
paloma nada
(-100, -100)
(0, 10)
(10, 0)
(1, 1)
Dos equilibrios de Nash
31/46
Teorı́a de Juegos
Teorı́a de Juegos
Ejemplos simples
Chicken game
Dos conductores enfrentan una intesección no señalizada. Si ambos
deciden cruzar, el choque es inevitable. Si uno cruza y el otro espera, el
primero obtiene una utilidad mejor que el segundo. Si ambos esperan,
podrı́an estar ahı́ para siempre...
(−100, −100)
(1, 2)
(2, 1)
(0, 0)
Dos Nash otra vez
32/46
Teorı́a de Juegos
Teorı́a de Juegos
Ejemplos simples
Piedra-Papel-Tijera
Juego popular de la infancia...


(0, 0) (1, -1) (-1, 1)
 (-1, 1) (0, 0) (1, -1) 
(1, -1) (-1, 1) (0, 0)
No existe equilibrio (?)... (en estrategias puras)
Definición
Un juego de 2 jugadores se dice a suma-cero si aij + bij = 0 para todo
(i, j) ∈ X × Y .
33/46
Teorı́a de Juegos
Teorı́a de Juegos
Existencia de Equilibrios
Contenidos
Extensión mixta de un juego finito
Teorema de existencia de Nash
Mejor respuesta
Ejemplos de juegos de N jugadores
34/46
Teorı́a de Juegos
Teorı́a de Juegos
Estrategias mixtas
Existencia
Como hemos visto, un equilibrio de Nash (en estrategias puras) podrı́a no
existir
(4, 0) (3, 1)
(3, 5) (5, 0)
Si usamos una estrategia pura todo el tiempo, nuestro oponente puede
sacar ventaja
Tiene sentido aleatorizar las decisiones.
Las probabilidades en cuestión deben escogerse estratégicamente!
35/46
Teorı́a de Juegos
Teorı́a de Juegos
Estrategias mixtas
Simplex y estrategias mixtas
Definición
Sea S un conjunto finito de acciones (o estrategias) con d = |S|
elementos (estrategias puras). El conjunto de estrategias mixtas sobre el
conjunto S es el simplex d-dimensional
P
∆(S) = {(xa )a∈S ∈ Rd : xa ≥ 0, a∈S xa = 1}.
Naturalmente, un vector x = (xa )a∈S ∈ ∆(S) define una distribución de
probabilidades sobre S con xa = P(jugar la estrategia pura a).
36/46
Teorı́a de Juegos
Teorı́a de Juegos
Estrategias mixtas
Extensión mixta de un juego finito de 2 jugadores
Consideremos un juego de dos jugadores donde S1 = {1, . . . , n},
S2 = {1, . . . , m}, con matrices de pago (A, B).
En la extensión mixta del juego, el J1 elige una distribución de
probabilidad x ∈ ∆(S1 ) y el J2 una distribución de probabilidad
y ∈ ∆(S2 ).
Luego, por independencia de variables aleatorias, la probabilidad de
observar el perfil (i, j) ∈ S1 × S2 es xi · yj .
37/46
Teorı́a de Juegos
Teorı́a de Juegos
Estrategias mixtas
Extensión mixta de un juego finito de 2 jugadores
Es decir, el pago esperado está dado por:
Pn Pm
Jugador 1: U1 (x, y) = i=1 j=1 Aij xi yj = xT Ay
Pn Pm
Jugador 2: U2 (x, y) = i=1 j=1 Bij xi yj = xT By
Notar que ahora hemos definido las funciones de pago (abusando de la
notación) como
Ui : ∆(S1 ) × ∆(S2 ) → R
38/46
Teorı́a de Juegos
Teorı́a de Juegos
Estrategias mixtas
Extensión mixta de un juego finito de N jugadores
Consideremos un juego de N jugadores con conjunto de acciones
puras Si y pagos Ui (a1 , . . . , an ).
En la extensión mixta cada jugador i elige una distribución de
probabilidad xi ∈ ∆Si , es decir, xiai ≥ 0 para todo ai ∈ Si y
P
i
ai ∈Si xai = 1.
Qn
Sea S = i=1 Si el conjunto de perfiles de estrategias puras. Dada
la independencia,
la probabilidad de observar (a1 , . . . , an ) ∈ S es el
Qn
producto i=1 xiai
39/46
Teorı́a de Juegos
Teorı́a de Juegos
Estrategias mixtas
Extensión mixta de un juego finito de N jugadores
Los pagos esperados son:
Ui (x1 , . . . , xn )
=
X
Ui (a1 , . . . , an )
(a1 ,...,an )∈S
ui (ai , x−i )
=
X
aj ∈Sj ,j6=i
Ui (a1 , . . . , an )
n
Y
xjaj
j=1
Y
=
X
xiai ui (ai , x−i )
ai ∈Ai
xjaj
j6=i
(Notemos que hemos abusado de la notación aquı́)
40/46
Teorı́a de Juegos
Teorı́a de Juegos
Estrategias mixtas
Equilibrio de Nash
En un juego finitio, un (EN) en estrategias mixtas es un perfil
x̄ = (x̄1 , . . . , x̄n ) ∈ ∆(S1 ) × · · · ∆(SN )
tal que para cada jugador i = 1, . . . , N se tiene
Ui (x̄) ≥ Ui (xi , x̄−i ) para todo xi ∈ ∆(Si )
donde (xi , x̄−i ) es el perfil de estrategias.
(xi , x̄−i ) = (x̄1 , x̄2 , . . . , x̄i−1 , xi , x̄i+1 , . . . , x̄n )
En palabras: ningún jugador i tiene incentivo a desviarse unilateralmente
a algún xi 6= x̄i .
41/46
Teorı́a de Juegos
Teorı́a de Juegos
Estrategias mixtas
Existencia
Teorema (Nash, 1950)
Todo juego finito tiene un equilibrio de Nash en estrategias mixtas.
42/46
Teorı́a de Juegos
Teorı́a de Juegos
Estrategias mixtas
48
MA THEMA TICS: J. F. NASH, JR.
PROC. N. A. S.
This follows from the arguments used in a forthcoming paper."' It is
proved by constructing an "abstract" mapping cylinder of X and transcribing into algebraic terms the proof of the analogous theorem on CWcomplexes.
* This note arose from consultations during the tenure of a John Simon Guggenheim
Memorial Fellowship by MacLane.
' Whitehead, J. H. C., "Combinatorial Homotopy I and II," Bull. A.M.S., 55,
214-245 and 453-496 (1949). We refer to these papers as CH I and CH II, respectively.
' By a complex we shall mean a connected CW complex, as defined in §5 of CH I.
We do not restrict ourselres to finite complexes. A fixed 0-cell e° e KO will be the base
point for all the homotopy groups in K.
4 MacLane, S., "Cohomology Theory in Abstract Groups III," Ann. Math., 50,
736-761 (1949), referred to as CT III.
' An (unpublished) result like Theorem 1 for the homotopy type was obtained prior
to these results by J. A. Zilber.
CT III uses in place of. equation (2.4) the stronger hypothesis that XB contains the
center of A, but all the relevant developments there apply under the weaker assumption
(2.4).
I Eilenberg, S., and MacLane, S., "Cohomology Theory in
Abstract Groups II,"
Ann. Math., 48, 326-341 (1947).
8 Eilenberg, S., and MacLane, S., "Determination of the Second Homology ... by
Means of Homotopy Invariants," these PROCEEDINGS, 32, 277-280 (1946).
9 Blakers, A. L., "Some Relations Between Homology and Homotopy Groups,"
Ann. Math., 49, 428-461 (1948), §12.
10 The hypothesis of Theorem C, requiring that v- (1) not be cyclic, can be readily
realized by suitable choice of the free group X, but this hypothesis is not needed here
(cf. 6).
11 Eilenberg, S., and MacLane, S., "Homology of Spaces with Operators II," Trans.
A.M.S., 65, 49-99 (1949); referred to as HSO II.
12 C(k) here is the C(K) of CH II. Note that K exists and is a CW complex by
(N) of p. 231 of CH I and that p-'K' - K", where p is the projection p:K -- K.
13 Whitehead, J. H. C., "Simple Homotopy Types." If W = 1, Theorem 5 follows
from (17:3) on p. 155 of S. Lefschetz, Algebraic Topology, (New York, 1942) and arguments in §6 of J. H. C. Whitehead, "On Simply Connected 4-Dimensional Polyhedra"
(Comm. Math. Helv., 22, 48-92 (1949)). However this proof cannot be generalized to
the case W # 1.
EQUILIBRIUM POINTS IN N-PERSON GAMES
By JOHN F. NASH, JR.*
PRINCETON UNIVERSITY
Communicated by S. Lefschetz, November 16, 1949
One may define a concept of an n-person game in which each player has
a finite set of pure strategies and in which a definite set of payments to the
n players corresponds to each n-tuple of pure strategies, one strategy
being taken for each player. For mixed strategies, which are probability
43/46
Teorı́a de Juegos
Teorı́a de Juegos
Estrategias mixtas
VOL. 36, 1950
MA THEMATICS: G. POL YA
49
distributions over the pure strategies, the pay-off functions are the expectations of the players, thus becoming polylinear forms in the probabilities
with which the various players play their various pure strategies.
Any n-tuple of strategies, one for each player, may be regarded as a
point in the product space obtained by multiplying the- n strategy spaces
of the players. One:-such n-tuple counters another if the strategy of each
player in the countering n-tuple yields the highest obtainable expectation
for its player against, the n - 1 strategies of the other players in the
countered n-tuple. A self-countering n-tuple is called an equilibrium point.
The correspondence of each n-tuple with its set of countering n-tuples
gives a one-to-many mapping of the product space into itself. From the
definition of countering we-see that the set of countering points of a point
is convex. By using the continuity of the pay-off functions we see that the
graph of the mapping is closed. The closedness is equivalent to saying:
if Pi, P2, ... and Qi, Q2, .... Qn, ... are sequences of points in the product
space where Q. -n Q, P n P and Q,, counters P,, then Q counters P.
Since the graph is closed and since the -image of each point under the
mapping is convex, we infer from Kakutani's theorem' that the mapping
has a fixed point (i.e., point contained in its image). Hence there is an
equilibrium point.
In the two-person zero-sum case the "main theorem"2 and the existence
of, an equilibrium point are equivalent. In this case any two equilibrium
points lead to the-same expectations for the players, but this need not occur
in general.
* The author is indebted to Dr. David Gale for suggesting the use of Kakutani's
theorem to simplify the proof and to the A. E. C. for financial support.
'Kakutani, S., Duke Math. J., 8, 457-459 (1941).
2 Von Neumann, J., and Morgenstern, O., The Theory of Games and Economic Behaviour, Chap. 3, Princeton University Press, Princeton, 1947.
REMARK ON WEYL'S NOTE "INEQUALITIES BETWEEN THE
TWO KINDS OF EIGENVALUES OF A LINEAR
TRANSFORMATION" *
By GEORGE POLYA
DEPARTMENT OF MATHEMATICS, STANFORD UNIVERSITY
Communicated by H. Weyl, November 25, 1949
In the note quoted above H. Weyl proved a Theorem involving a function so(X) and concerning the eigenvalues aj of a linear transformation A
and those, Ki, of A*A. If the Kj and xi = IaiI2 are arranged in descending
order,
44/46
Teorı́a de Juegos
Teorı́a de Juegos
Estrategias mixtas
En el caso de 2 jugadores
El pago esperado del J1 cuando juega i ∈ S1 contra la estrategia
mixta y ∈ ∆(S2 ) del J2 es
Pm
u1 (i, y) = j=1 Aij yj
y luego
U1 (x, y) =
Pn
i=1
xi u1 (i, y)
El pago esperado del J2 cuando juega j ∈ S2 contra la estrategia
mixta x ∈ ∆(S1 ) del J1 es
Pn
u2 (j, x) = i=1 Bij xi
y luego
U2 (x, y) =
Pm
j=1
yj u2 (j, x)
45/46
Teorı́a de Juegos
Teorı́a de Juegos
Mejor respuesta
Mejor respuesta
Recordemos que, esencialmente, un (EN) es tal que cada jugador
maximiza su propio pago, dada la estrategia de los oponentes
J1:
max
x∈∆(S1 )
J2:
max
y∈∆(S2 )
Pn
i=1
Pm
j=1
xi u1 (i, y) ⇒ BR1 (y) = Argmax
x∈∆(S1 )
yj u2 (j, x) ⇒ BR2 (x) = Argmax
y∈∆(S2 )
Pn
i=1
xi u1 (i, y)
Pm
j=1
yj u2 (j, x)
BR1 (y) es el conjunto de los x’s que maximizan U1 (·, y) para un
y ∈ ∆(S2 ) fijo.
BR2 (x) es el conjunto de los y’s que maximizan U2 (x, ·) para un
x ∈ ∆(S1 ) filo.
Luego, Un equilibrio de Nash en estrategias mixtas es un perfil
(x̄, ȳ) ∈ ∆(S1 ) × ∆(S2 ) tal que
x̄ ∈ BR1 (ȳ)
ȳ ∈ BR2 (x̄)
46/46
Download