Prévia do material em texto
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO DEPARTAMENTO DE ECONOMIA MICROECONOMIA III 2010.1 Professores: Antônio Marcos Hoelz Ambrózio e Sheila Najberg Monitor: Carlos Fernando Miranda Gabarito da 4a Lista de exercícios: Jogos Repetidos 1) Não há valores de y, c e w maiores que zero tais que seja possível obter um ENPS onde o trabalhador irá se esforçar. Isso é facilmente visível fazendo a indução retroativa do jogo em árvore: será visto que o único resultado de ENPS será a firma não pagar o trabalhador (quer este se esforce ou não) e o trabalhador, antecipando isso, não se esforçar. Sabemos que no segundo período iria ocorrer o resultado de ENPS do jogo simples, onde os jogadores iriam jogar não esforçar e não pagar. No primeiro período então, antecipando que o resultado do segundo período não será afetado por decisões em t=1, os jogadores buscam maximizar seus ganhos de um período, e novamente as escolhas são não se esforçar e não pagar. Assim, vemos que uma estratégia em que o trabalhador se compromete a esforçar e a firma a pagar no primeiro período não é sustentável como ENPS, pois não é ENPS no jogo estágio. Logo, a resposta não se altera com a modificação. c) Dado a taxa de desconto = ¾, as condições para que a firma e o trabalhador cooperem são: Trabalhador: (w-2)/(1-) 0 (a firma obs a escolha do trabalhador antes de decidir pagar ou não). Ou seja: w 2 Firma: (10-w)/(1-) 10 w 7,5 Assim, é possível obter um ENPS cooperativo se w estiver no intervalo [2 , 7.5]. Sim. O problema advinha do fato de que, no jogo repetido uma única vez, era preferível não pagar o salário uma vez que a firma observou o comportamento do trabalhador. Em um jogo repetido indefinidamente, construir uma reputação de boa pagadora pode ser bom para a firma. Se os trabalhadores têm confiança na empresa, será melhor se esforçar e ganhar w-c (w maior ou igual a c) do que não ganhar nada. Por outro lado, para a firma, é melhor ganhar (y-w)/(1-) do que 10 em um momento e depois não ganhar nada. Os trabalhadores podem observar o comportamento da firma e adotar a estratégia de não se esforçar se algum de seus companheiros não tiver recebido salário em algum momento no passado. A ameaça é crível e faz com que a firma se comporte honestamente. 2) a) S1= {(X1;X2,X3,X4,X5,X6,X7,X8,X9,X10), onde Xi= A1,A2 ou A3} S2= {(Y1;Y2,Y3,Y4,Y5,Y6,Y7,Y8,Y9,Y10), onde Yi= B1,B2 ou B3} b) Sim. Considerem a seguinte estratégia. Jogador1: Jogar A1 no 1o período. No 2o, se observar A1B1, joga A2. Se observar qualquer resultado diferente de A1B1, joga A3 Jogador2: Jogar B1 no 1o período. No 2o, se observar A1B1, joga B2. Se observar qualquer resultado diferente de A1B1, joga B3. Esse resultado é um ENPS? Atentem para o que está escrito na página 86 do Gibbons, final do 1o parágrafo: Se um jogo estático de informação completa possui mais de um equilíbrio de Nash, então pode haver resultados de subjogos do jogo repetido um número finito de vezes no qual, exceto no último período, o resultado não é um equilíbrio de Nash. O ponto crucial é que ameaças críveis ou promessas sobre o comportamento futuro podem influenciar o comportamento presente. No nosso caso a estratégia apresentada constitui um ENPS. Em primeiro lugar, em t=2 é fácil verificar que dado a estratégia de cada jogador, o outro estará dando sua melhor resposta (para cada resultado em t=1, alcança-se um EN em t=2, sendo que o melhor EN é alcançado quando o resultado em t=1 é A1B1). Finalmente, dado a resposta esperada em t=2, os jogadores não tem incentivo em desviar de suas estratégias em t=1: o jogador 1 se segue a estratégia, recebe 10 + 5 = 15; caso desvie, jogaria A3, ganhando 13 em t=1 mas apenas 1 em t=2 (total de 14). Raciocínio análogo vale para o jogador 2. Podemos ainda verificar isso trazendo os payoffs dos jogadores para o primeiro período. Vamos somar à cada célula o resultado que ocorrá na 2a rodada caso cada célula seja jogada no 1o período. No caso das estratégias descritas acima, teríamos: 15; 15 3;13 1;14 13;3 6;6 1;1 14;1 1;1 2;2 Por esse esquema , vemos que A1 B1 pode ser atingido no 1o período como resposta ótima dos jogadores e assim o par de estratégias escolhido será um ENPS. c) Sim. Nesse caso, jogar i2 no primeiro período e i3 no 2o período, independente do que ocorreu no 1o período é ENPS. Pela matriz, temos: 11; 11 3;13 1;14 13;3 6;6 1;1 14;1 1;1 2;2 Vemos claramente que A2 B2 é um EN do jogo repetido no qual a soma dos payoffs posterioes são trazidos para o 1o período, constituindo assim ENPS. De fato, sempre é possível sustentar como resultado de ENPS uma repetição do(s) EN(s) a cada rodada. 3) a) Para cooperarem, valor de presente de cooperar deve ser maior do que o de desviar. 60/1-≥X + 30.60/1-Y + 12. X 75 Y 84 Intuição: Para não haver incentivo ao desvio, deve haver um teto superior para os ganhos de desvio no curto prazo. Ainda, esse teto deve ser necessariamente menor para o jogador 1, uma vez que é este jogador que na fase punitiva (NC,NC) obtem o maior pay-off: 30 > 12. b) Deverão ser menores. Uma vez que a punição seria aplicada em apenas um período, a perda futura associada ao desvio é menor – para não ocorrer desvio, o ganho de curto prazo deve ser menor também. c) Ficarão mais altos. Mais paciência equivale a uma taxa de juros menor, ou seja, as pessoas estão pouco dispostas a trocar renda futura por renda presente. Logo o ganho de curto prazo associado ao desvio pode ser maior. 4) Como existe apenas um EN no jogo de 1 período, o único ENPS deste jogo de 2 períodos será a repetição deste EN todas as rodadas, ou seja, pi.t = c. Para que ninguém tenha incentivo a desviar, na fase cooperativa, devemos ter: (½)m + (½)m + 2(½)m + 3(½)m + ... > m + .0 + 2.0 + … (1/1- )(½)m > m => 1- < ½ => > ½ Na fase punitiva, para qualquer 0 < < 1, os jogadores querem seguir suas estratégias, pois se um jogador espera que o outro escolha p=c, sua melhor resposta é também fazer p=c, uma vez que é o EN do jogo estático. c) (1/n)m + (1/n)m + 2(1/n)m + 3(1/n)m + ... > m + . + 2.0 + … (1/1- )(1/n)m > m => 1- < 1/n => > 1/n Como = 4/5=> número máximo de firmas= 5 d) Neste caso, a firma que trair pode ter o lucro do mercado inteiro por 2 períodos. Portanto, a condição necessária para a colusão seria: (½)m + (½)m + 2(½)m + 3(½)m + ... > m + .m + 2.0 + … (1/1- )(½)m > (1 + ).m => 2.(1 - 2) < 1 => > (1/2)0,5 > (1/2). A colusão ótima é alcançável para > (1/2)0,5, condição mais restritiva do que no item b , onde > ½. e) Devemos mostrar que tanto a firma 1 quanto a firma 2 não tem incentivo a desviar: Firma 1: (3/4)m + (1/4)(3/4)m + (1/4)2(3/4)m +... > m + (1/4).0 + (1/4)2.0 + … (4/3)(3/4)m > m c.q.d Firma 2: (1/4)m + (3/4)(1/4)m + (3/4)2(1/4)m +... > m + (3/4).0 + (3/4)2.0 + … (4)(1/4)m > m 5) Devemos analisar se cada jogador, dada a estratégia do outro, está dando a sua melhor resposta, nas circunstâncias que são alcançadas quando estas estratégias são jogadas. i) O jogador 2 claramente não tem incentivo a desviar, pois 5 é o maior ganho possível em cada repetição do jogo. Já o jogador 1 obtêm o payoff de 5+5q+5q2+5q3+5q4+... e caso faça um desvio em uma rodada seu payoff será 6 (a partir de um desvio(s2), considerando que 2 jogará sempre t2, o melhor para 1 é continuar a jogar s2) Portanto, o jogador 1 não irá desviar se 5/(1-q) 6 => q 1/6. Então para q1/6 temos Equilíbrio de Nash Obs: Entretanto, a ameaça feita pelo jogador 2, de jogar sua estratégia dominada até o infinito, não seria crível, pois o melhor que ele faria, mesmo com o desvio do jogador 1, seria continuar jogando t1. Ou seja, estas estratégias apesar de EN para q 1/6, nãoconstituem ENPS. ii) TEORIA: ao longo desse item, iremos fazer uso da chamada “Propriedade do Desvio em uma Única Etapa”, que diz, essencialmente, que para verificar se uma seqüência de estratégias é ENPS, basta verificar se cada jogador, em cada circunstância em que é chamado a jogar, prefere seguir com sua estratégia a desviar apenas naquela etapa e depois voltar a seguir a estratégia dali em diante. Essa propriedade vale para todo jogo de informação perfeita com horizonte finito, e é válido para certas classes de jogos com horizonte infinito também, dentre os quais se inclui os jogos repetidos com desconto (onde o payoff no longuíssimo prazo, ou seja, num futuro muito distante, são pouco relevantes, uma vez que a taxa de desconto satisfaz 0 < q < 1) OBS: se, ao invés de verificar se uma seqüência de estratégias é ENPS, desejamos apenas verificar se ela é ou não EN, então não devemos usar a propriedade do desvio único nesse caso – quando uma estratégia não é ENPS, então desviar uma única vez não necessariamente é o melhor dentre os desvios possíveis. Voltando ao exercício: Estratégia do jogador 1 t=1 jogar s1 qualquer t jogar s1 se (s1,t1) ou (s2,t2) em t-1 jogar s2 se (s1,t2) ou (s2,t1) em t-1 Estratégia do jogador 2 t=1 jogar t1 qualquer t jogar t1 se (s1,t1) ou (s2,t2) em t-1 jogar t2 se (s1,t2) ou (s2,t1) em t-1 Para facilitar, vamos dividir as estratégias em dois estados: estado cooperação se (s1,t1) ou (s2,t2) em t-1 => jogador 1 escolhe s1 jogador 2 escolhe t1 estado punição se (s1,t2) ou (s2,t1) em t-1 => jogador 1 escolhe s2 jogador 2 escolhe t2 Se, ao iniciar um período o estado é de cooperação e o resultado do jogo naquele instante for (s1,t1) então continuaremos em um estado de cooperação ao iniciar o período seguinte. Se, ao iniciar um período o estado é de punição e o resultado do jogo naquele instante for (s2,t2) então passaremos para um estado de cooperação ao iniciar o período seguinte. Assim, o jogador 1 deve jogar s1 no estado de cooperação e jogar s2 no estado de punição. A caracterização de um estado para um período t fica definida pelo estado no período anterior e pelo resultado no jogo para um período t. Precisamos avaliar 4 possibilidades: s1 é a melhor resposta do jog. 1 se ao iniciar um período o estado é de cooperação s2 é a melhor resposta do jog. 1 se ao iniciar um período o estado é de punição t1 é a melhor resposta do jog. 2 se ao iniciar um período o estado é de cooperação t2 é a melhor resposta do jog. 2 se ao iniciar um período o estado é de punição Vamos fixar a estratégia do jogador 2 e verificar se 1 tem interesse em se desviar Estado cooperação Manter a estratégia assegura => 5/(1-q) Desviar uma única vez => 6 +q.0+5q2+5q3+5q4+5q5+5q6 = 6 + 5q2/(1-q ) Manter estratégia é melhor que desviar uma única vez se =>5/(1-q) 6 + 5q2/(1-q) => q 1/5=> EN Note que estamos usando o princípio do desvio em uma única etapa que diz que se a estratégia for de fato ENPS então desviar uma única vez é de fato o “melhor” desvio. Mas para fixar conceitos, vamos comparar o que se ganha seguindo a estratégia e o que se ganha desviando sempre: Desviar sempre (s2) => 6 +q.0+6q2+0q3+6q4+0q5+6q6 = 6/(1-q2 ) +0.q/(1-q2 ) Manter estratégia é melhor que jogar sempre s2 se =>5/(1-q ) 6/(1-q2 ) +0.q/(1-q2) => q 1/5: mesma condição acima => EN Estado punição Manter a estratégia assegura => 0 + 5q+5q2+5q3+5q4+5q5=5q/(1-q) Desviar uma única vez => -1 +q.0+5q2+5q3+5q4+5q5+5q6 = -1 + 5q/(1-q) Manter estratégia é melhor que desviar 1 única vez => q 0 Vamos fixar a estratégia do jogador 1 e verificar se 2 tem interesse em se desviar Estado cooperação Manter a estratégia assegura => 5/(1-q) Desviar uma única vez => -2 -q.3+5q2+5q3+5q4+5q5+5q6 = -2- 2q + 5q2/(1-q ) Manter estratégia é melhor que desviar uma única vez se q 0 => EN Estado punição Manter a estratégia assegura => -3 + 5q+5q2+5q3+5q4+5q5=5q/(1-q) Desviar 1 única vez => -1 -q.3+5q2+5q3+5q4+5q5+5q6 = -1 –3q + 5q2/(1-q) Manter estratégia é melhor que desviar 1 única vez => q 1/4 Note que nesse caso os jogadores não desviam em nenhuma circunstância desde que a taxa de desconto seja maior que as taxas de desconto que garantem que os jogadores queiram seguir suas estratégias, ou seja, se q 1/4 temos de fato um ENPS. 6) 2. (a) To support cooperation, δ must be such that 2/(1 − δ ) ≥ 4 + δ /(1 − δ ). Solving for δ , we see that cooperation requires δ ≥ 2/3. (b) To support cooperation by player 1, it must be that δ ≥ 1/2. To support cooperation by player 2, it must be that δ ≥ 3/5. Thus, we need δ ≥ 3/5. (c) Cooperation by player 1 requires δ ≥ 4/5. Player 2 has no incentive to deviate in the short run. Thus, it must be that δ ≥ 4/5. 5. Alternating between (C, C) and (C, D) requires that neither player has the incentive to deviate. Clearly, however, player 1 can guarantee himself at least 2 per period, yet he would get less than this starting in period 2 if the players alternated as described. Thus, alternating between (C,C) and (C,D) cannot be supported. On the other hand, alternating between (C,C) and (C,D) can be supported. Note first that, using the stage Nash punishment, player 2 has no incentive to deviate in odd or even periods. Player 1 has no incentive to deviate in even periods, when (D, D) is supposed to be played. Furthermore, player 1 prefers not to deviate in an even period if 8(a) Player 2t plays a best response to player 1’s action in the stage game. (b) Consider the following example. There is a subgame perfect equilib- rium, using stage Nash punishment, in which, in equilibrium, player 1 plays T and player 2t plays D. (c) Consider, for example, the prisoners’ dilemma. If only one player is a long-run player, then the only subgame perfect equilibrium repeated game will involves each player defecting in each period. However, from the text we know that cooperation can be supported when both are long-run players. 7)