Uploaded by FELIPE ANDRÉS VEGA

Clase 13

advertisement
Teoría de Juegos
Clase 13: Juegos Repetidos II
Profesora: Sofía Correa
Primavera 2023
1 / 16
Dilema del Prisionero Repetido
Jugador 2
Jugador 1
T
NT
T
(1, 1)
(−l, 1 + g)
NT
(1 + g, −l)
(0, 0)
2 / 16
Dilema del Prisionero Repetido
Jugador 2
Jugador 1
T
NT
T
(1, 1)
(−l, 1 + g)
NT
(1 + g, −l)
(0, 0)
Supongamos que este juego se juega T veces. Hay incentivos a cooperar?
Qué pasa el último periodo?
2 / 16
Dilema del Prisionero Repetido
Jugador 2
Jugador 1
T
NT
T
(1, 1)
(−l, 1 + g)
NT
(1 + g, −l)
(0, 0)
Supongamos que este juego se juega T veces. Hay incentivos a cooperar?
Qué pasa el último periodo? Sabemos que se juega (N T, N T ).
2 / 16
Dilema del Prisionero Repetido
Jugador 2
Jugador 1
T
NT
T
(1, 1)
(−l, 1 + g)
NT
(1 + g, −l)
(0, 0)
Supongamos que este juego se juega T veces. Hay incentivos a cooperar?
Qué pasa el último periodo? Sabemos que se juega (N T, N T ).
Cuando el juego es finito, no hay incentivos a cooperar.
2 / 16
Esto se conoce como End Game Effect. Ejemplos:
▶ Presidentes al final de su mandato, cuando no pueden ser reelegidos.
▶ Trabajadores antes de retirarse no tienen incentivos a comportarse bien.
3 / 16
Juegos Infinitamente Repetidos (T = ∞)
▶ Supongamos ahora que el dilema del prisionero se repite infinitamente
▶ Al principio de cada periodo t ≥ 1, los jugadores observan la historia completa de
jugadas:
ht−1 = (a1 , ..., at )
donde at = (ati )i∈I , y luego escogen su jugada.
▶ Los pagos están dados por:
U i (a1 , a2 , ..., at ) =
∞
X
δ t−1 ui (at )
t=1
4 / 16
Juegos Infinitamente Repetidos (T = ∞)
Cada periodo el juego es el mismo:
Jugador 2
Jugador 1
T
NT
T
(1, 1)
(−l, 1 + g)
NT
(1 + g, −l)
(0, 0)
5 / 16
Juegos Infinitamente Repetidos (T = ∞)
Cada periodo el juego es el mismo:
Jugador 2
Jugador 1
T
NT
T
(1, 1)
(−l, 1 + g)
NT
(1 + g, −l)
(0, 0)
Cuál es el espacio de estrategias posibles?
Hay sólo dos acciones, pero los jugadores observan la historia completa del juego y
pueden condicionar sus acciones en jugadas pasadas.
5 / 16
Juegos Infinitamente Repetidos (T = ∞)
Cada periodo el juego es el mismo:
Jugador 2
Jugador 1
T
NT
T
(1, 1)
(−l, 1 + g)
NT
(1 + g, −l)
(0, 0)
Cuál es el espacio de estrategias posibles?
Hay sólo dos acciones, pero los jugadores observan la historia completa del juego y
pueden condicionar sus acciones en jugadas pasadas.
Hay infinitos conjuntos de información!
5 / 16
Juegos Infinitamente Repetidos (T = ∞)
Cada periodo el juego es el mismo:
Jugador 2
Jugador 1
T
NT
T
(1, 1)
(−l, 1 + g)
NT
(1 + g, −l)
(0, 0)
6 / 16
Juegos Infinitamente Repetidos (T = ∞)
Cada periodo el juego es el mismo:
Jugador 2
Jugador 1
T
NT
T
(1, 1)
(−l, 1 + g)
NT
(1 + g, −l)
(0, 0)
Consideremos primero la estrategia σit (ht−1 ) = N T para todo t, i ∈ {1, 2}.
Es (σ1 , σ2 ) un EPS?
6 / 16
Juegos Infinitamente Repetidos (T = ∞)
Verificamos que se juega un EN en cada etapa.
7 / 16
Juegos Infinitamente Repetidos (T = ∞)
Verificamos que se juega un EN en cada etapa.
Si ambos siguen la estrategia, el pago es
P∞
t=1
δ t−1 · 0
7 / 16
Juegos Infinitamente Repetidos (T = ∞)
Verificamos que se juega un EN en cada etapa.
Si ambos siguen la estrategia, el pago es
P∞
t=1
δ t−1 · 0
Si un jugador se desvía a jugar T por un periodo, el pago es −l +
∞
X
t=1
δ
t−1
· 0 ≥ −l +
∞
X
P∞
t=2
δ t−1 · 0
δ t−1 · 0
t=2
Y podemos chequearlo para todo t. Por lo que es un EPS.
7 / 16
Juegos Infinitamente Repetidos (T = ∞)
Ahora consideremos σit (ht−1 ) = T para todo t, i ∈ {1, 2}.
Es (σ1 , σ2 ) un EPS?
Siempre conviene desviarse a jugar N T :
∞
X
δ t−1 · 1 <
t=1
∞
X
δ t−1 · (1 + g)
t=1
Por lo que jugar T siempre no es un EPS.
8 / 16
Juegos Infinitamente Repetidos (T = ∞)
Ahora consideremos σit (ht−1 ) = T para todo t, i ∈ {1, 2}.
Es (σ1 , σ2 ) un EPS?
Siempre conviene desviarse a jugar N T :
∞
X
δ t−1 · 1 <
t=1
∞
X
δ t−1 · (1 + g)
t=1
Por lo que jugar T siempre no es un EPS.
Cómo logramos que haya cooperación?
8 / 16
Estrategia Gatillo
Consideremos una estrategia de la siguiente forma:
Comenzamos cooperando (jugando T ), y continuamos cooperando hasta que el otro deje
de hacerlo. Si el otro deja de cooperar (juega N T ), entonces yo también dejo de cooperar
y nunca más vuelvo a hacerlo.
9 / 16
Estrategia Gatillo
Consideremos una estrategia de la siguiente forma:
Comenzamos cooperando (jugando T ), y continuamos cooperando hasta que el otro deje
de hacerlo. Si el otro deja de cooperar (juega N T ), entonces yo también dejo de cooperar
y nunca más vuelvo a hacerlo.
Formalmente:

 T
T
σiG (ht−1 ) =

NT
si t = 1
si t ≥ 2 y as = (T, T ) ∀s ≤ t − 1
t ≥ 2 y as ̸= (T, T ) ∃s ≤ t − 1
9 / 16
Estrategia Gatillo
Consideremos una estrategia de la siguiente forma:
Comenzamos cooperando (jugando T ), y continuamos cooperando hasta que el otro deje
de hacerlo. Si el otro deja de cooperar (juega N T ), entonces yo también dejo de cooperar
y nunca más vuelvo a hacerlo.
Formalmente:

 T
T
σiG (ht−1 ) =

NT
si t = 1
si t ≥ 2 y as = (T, T ) ∀s ≤ t − 1
t ≥ 2 y as ̸= (T, T ) ∃s ≤ t − 1
Es un EPS que sostiene cooperación?
9 / 16
Estrategia Gatillo
Es un EPS que sostiene cooperación?
10 / 16
Estrategia Gatillo
Es un EPS que sostiene cooperación?
Como todos los subjuegos son iguales, es suficiente mostrar que la estrategia es un EN
en un subjuego.
En t = 1: Es rentable desviarse a jugar N T ?
10 / 16
Estrategia Gatillo
Es un EPS que sostiene cooperación?
Como todos los subjuegos son iguales, es suficiente mostrar que la estrategia es un EN
en un subjuego.
En t = 1: Es rentable desviarse a jugar N T ? Dependerá de los valores de los parámetros.
1+g +
| {z }
Pago hoy
∞
X
δ t−1 · 0
t=2
≤
∞
X
δ t−1 · 1
t=1
| {z }
Pago de continuación
10 / 16
Estrategia Gatillo
Es un EPS que sostiene cooperación?
Como todos los subjuegos son iguales, es suficiente mostrar que la estrategia es un EN
en un subjuego.
En t = 1: Es rentable desviarse a jugar N T ? Dependerá de los valores de los parámetros.
1+g +
| {z }
Pago hoy
∞
X
t=2
δ t−1 · 0
≤
∞
X
δ t−1 · 1
t=1
| {z }
Pago de continuación
g
≤ δ
1+g
10 / 16
Estrategia Gatillo
Es un EPS que sostiene cooperación?
Como todos los subjuegos son iguales, es suficiente mostrar que la estrategia es un EN
en un subjuego.
En t = 1: Es rentable desviarse a jugar N T ? Dependerá de los valores de los parámetros.
1+g +
| {z }
Pago hoy
∞
X
t=2
δ t−1 · 0
≤
∞
X
δ t−1 · 1
t=1
| {z }
Pago de continuación
g
≤ δ
1+g
δ tiene que ser lo suficientemente grande, el futuro tiene que ser relevante
10 / 16
Estrategia Gatillo
Y es óptimo jugar N T una vez que el otro jugador se ha desviado?
11 / 16
Estrategia Gatillo
Y es óptimo jugar N T una vez que el otro jugador se ha desviado?
Si, porque es el EN.
Si δ ≥
g
1+g
las estrategias de gatillo son un EPS que sostiene la cooperación en equilibrio.
11 / 16
Otra estrategia: Estrategia de Castigo
Consideremos otra estrategia:
Comenzamos cooperando (jugando T ), y continuamos cooperando hasta que el otro deje
de hacerlo. Si el otro deja de cooperar (juega N T ), entonces yo dejo de cooperar por un
periodo, pero luego retomamos la relación de cooperación.
12 / 16
Otra estrategia: Estrategia de Castigo
Consideremos otra estrategia:
Comenzamos cooperando (jugando T ), y continuamos cooperando hasta que el otro deje
de hacerlo. Si el otro deja de cooperar (juega N T ), entonces yo dejo de cooperar por un
periodo, pero luego retomamos la relación de cooperación.
El castigo ahora no es para siempre, dura sólo un periodo.
12 / 16
Otra estrategia: Estrategia de Castigo
Consideremos otra estrategia:
Comenzamos cooperando (jugando T ), y continuamos cooperando hasta que el otro deje
de hacerlo. Si el otro deja de cooperar (juega N T ), entonces yo dejo de cooperar por un
periodo, pero luego retomamos la relación de cooperación.
El castigo ahora no es para siempre, dura sólo un periodo.
Es un EPS que sostiene cooperación?
12 / 16
Otra estrategia: Estrategia de Castigo
Consideremos otra estrategia:
Comenzamos cooperando (jugando T ), y continuamos cooperando hasta que el otro deje
de hacerlo. Si el otro deja de cooperar (juega N T ), entonces yo dejo de cooperar por un
periodo, pero luego retomamos la relación de cooperación.
El castigo ahora no es para siempre, dura sólo un periodo.
Es un EPS que sostiene cooperación?
1+g+δ·0+
∞
X
t=3
δ t−1 · 0
≤
∞
X
δ t−1 · 1
t=1
12 / 16
Otra estrategia: Estrategia de Castigo
Consideremos otra estrategia:
Comenzamos cooperando (jugando T ), y continuamos cooperando hasta que el otro deje
de hacerlo. Si el otro deja de cooperar (juega N T ), entonces yo dejo de cooperar por un
periodo, pero luego retomamos la relación de cooperación.
El castigo ahora no es para siempre, dura sólo un periodo.
Es un EPS que sostiene cooperación?
1+g+δ·0+
∞
X
δ t−1 · 0
t=3
≤
∞
X
δ t−1 · 1
t=1
g
≤ δ
12 / 16
Teorema del Pueblo
Sea aN un EN, y sea a∗ tal que ui (a∗ ) > ui (aN ) para todo i.
Entonces, existe δ < 1 tal que para todo δ ≥ δ, el juego infinitamente repetido con
descuento δ tiene un EPS en que se juega a∗ en cada subjuego.
13 / 16
Colusión en Bertrand
Veamos un caso en que firmas pueden sostener cooperación.
▶ n firmas compiten fijando precios
▶ Costo marginal c ≥ 0
▶ Demada Q(p) = 1 si p ≤ v, 0 en caso contrario
▶ Suponemos v > c (socialmente, es eficiente producir)
14 / 16
Colusión en Bertrand
Veamos un caso en que firmas pueden sostener cooperación.
▶ n firmas compiten fijando precios
▶ Costo marginal c ≥ 0
▶ Demada Q(p) = 1 si p ≤ v, 0 en caso contrario
▶ Suponemos v > c (socialmente, es eficiente producir)
Cuál es el EN del juego estático?
14 / 16
Colusión en Bertrand
Veamos un caso en que firmas pueden sostener cooperación.
▶ n firmas compiten fijando precios
▶ Costo marginal c ≥ 0
▶ Demada Q(p) = 1 si p ≤ v, 0 en caso contrario
▶ Suponemos v > c (socialmente, es eficiente producir)
Cuál es el EN del juego estático? p∗i = c
14 / 16
Colusión en Bertrand
Supongamos ahora que el juego se repite.
15 / 16
Colusión en Bertrand
Supongamos ahora que el juego se repite.
Las firmas pueden jugar la siguiente estrategia:
Partimos jugando p∗i = v. Luego, jugamos tal que si en el pasado todas las firmas fijaron
precio v, seguimos cobrando v. De lo contrario cobro c.
15 / 16
Colusión en Bertrand
Supongamos ahora que el juego se repite.
Las firmas pueden jugar la siguiente estrategia:
Partimos jugando p∗i = v. Luego, jugamos tal que si en el pasado todas las firmas fijaron
precio v, seguimos cobrando v. De lo contrario cobro c.
Es un EPS? Verificamos que está en el interés de cada firma seguir esta estrategia.
15 / 16
Colusión en Bertrand
Firma i:
v−c
δ v−c
+
n
1−δ n
≥
v−ϵ−c
16 / 16
Colusión en Bertrand
Firma i:
v−c
δ v−c
+
n
1−δ n
≥
v−ϵ−c
δ
≥
1−
1
n
16 / 16
Colusión en Bertrand
Firma i:
v−c
δ v−c
+
n
1−δ n
≥
v−ϵ−c
δ
≥
1−
1
n
Es más fácil sostener colusión cuando hay pocas firmas (n chico) y les preocupa el futuro
(δ grande)
16 / 16
Related documents
Download