Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Econometria Aula 19 Marta AreosaMarta Areosa marta@econ.puc-rio.br Regressões com variáveis instrumentais Três ameaças à validade interna de um estudo são: 2 Regressões com variáveis instrumentais Três ameaças à validade interna de um estudo são: • Viés de variável omitida de uma variável que é correlacionada com X, mas é não observável e não pode ser incluída na regressão; 3 Regressões com variáveis instrumentais Três ameaças à validade interna de um estudo são: • Viés de variável omitida de uma variável que é correlacionada com X, mas é não observável e não pode ser incluída na regressão; 4 • Viés da causalidade simultânea (X causa Y, Y causa X); Regressões com variáveis instrumentais Três ameaças à validade interna de um estudo são: • Viés de variável omitida de uma variável que é correlacionada com X, mas é não observável e não pode ser incluída na regressão; 5 • Viés da causalidade simultânea (X causa Y, Y causa X); • Viés por erro nas variáveis (X é medido com erro) Regressões com variáveis instrumentais Três ameaças à validade interna de um estudo são: • Viés de variável omitida de uma variável que é correlacionada com X, mas é não observável e não pode ser incluída na regressão; 6 • Viés da causalidade simultânea (X causa Y, Y causa X); • Viés por erro nas variáveis (X é medido com erro) Todos estes casos geram o mesmo tipo de problema: cov(u,X) ≠ 0 Lembrar: cov(u,X) ≠ 0 ⇒ E(u|X) ≠ constante (0,em particular) Um regressor e um instrumento • Regressão com variáveis instrumentais (VI) pode eliminar o viés (devido ao fato de E(u|X) ≠ 0) Yi = β0 + β1Xi + ui 7 Yi = β0 + β1Xi + ui • Regressão com VI quebra X em duas partes: a parte que pode estar correlacionada com u, e a parte que não está. Isolando a parte que não está correlacionada com u, podemos estimar β1 sem viés. Um regressor e um instrumento Yi = β0 + β1Xi + ui • Isto é feito usando uma variável instrumental, Zi, que não está correlacionada com ui. 8 correlacionada com ui. Um regressor e um instrumento Yi = β0 + β1Xi + ui • Isto é feito usando uma variável instrumental, Zi, que não está correlacionada com ui. 9 correlacionada com ui. • A variável instrumental captura os movimentos em Xi que são não correlacionados com ui, e os usa para estimar β1. Terminologia: endogeneidade e exogeneidade Variável endógena é correlacionada com u Variável exógena é não correlacionada com u 10 Terminologia: endogeneidade e exogeneidade Variável endógena é correlacionada com u Variável exógena é não correlacionada com u Nota histórica: “Endógena” significa que a variável é 11 determinada dentro do sistema ou seja, que a variável é determinada em conjunto com Y. Assim a estimação é sujeita ao viés de causalidade simultânea. Porém, esta definição é muito restrita já que VI pode ser usada para resolver também problemas de viés de variável omitida e erros-em-variáveis, e não somente viés de simultaneidade. Condições para uma variável instrumental válida Yi = β0 + β1Xi + ui Para que uma variável instrumental (um “instrumento”) Z seja válida, tem que satisfazer duas condições: 12 Condições para uma variável instrumental válida Yi = β0 + β1Xi + ui Para que uma variável instrumental (um “instrumento”) Z seja válida, tem que satisfazer duas condições: 13 1. Relevância do Instrumento: corr(Zi,Xi) ≠ 0 Condições para uma variável instrumental válida Yi = β0 + β1Xi + ui Para que uma variável instrumental (um “instrumento”) Z seja válida, tem que satisfazer duas condições: 14 1. Relevância do Instrumento: corr(Zi,Xi) ≠ 0 2. Exogeneidade: corr(Zi,ui) = 0 Condições para uma variável instrumental válida Yi = β0 + β1Xi + ui Para que uma variável instrumental (um “instrumento”) Z seja válida, tem que satisfazer duas condições: 15 1. Relevância do Instrumento: corr(Zi,Xi) ≠ 0 2. Exogeneidade: corr(Zi,ui) = 0 Suponha por agora que você tem este Zi (discutiremos em breve como achar tal variável instrumental). Condições para uma variável instrumental válida Yi = β0 + β1Xi + ui Para que uma variável instrumental (um “instrumento”) Z seja válida, tem que satisfazer duas condições: 16 1. Relevância do Instrumento: corr(Zi,Xi) ≠ 0 2. Exogeneidade: corr(Zi,ui) = 0 Suponha por agora que você tem este Zi (discutiremos em breve como achar tal variável instrumental). Como podemos usar Zi para estimar β1? Estimador de VI, um X e um Z Explicação 1: Mínimos Quadrados em Dois Estágios (MQDE) Temos dois estágios ou duas regressões: 17 Estimador de VI, um X e um Z Explicação 1: Mínimos Quadrados em Dois Estágios (MQDE) Temos dois estágios ou duas regressões: (1) Primeira isola a parte de X que é não correlacionada com u: regredimos X em Z usando MQO 18 regredimos X em Z usando MQO Xi = pi0 + pi1Zi + vi (1) Estimador de VI, um X e um Z Explicação 1: Mínimos Quadrados em Dois Estágios (MQDE) Temos dois estágios ou duas regressões: (1) Primeira isola a parte de X que é não correlacionada com u: regredimos X em Z usando MQO 19 regredimos X em Z usando MQO Xi = pi0 + pi1Zi + vi (1) • Como Zi é não correlacionada com ui, pi0 + pi1Zi será não correlacionada com ui. Não sabemos pi0 ou pi1 mas iremos estimar. Então… Estimador de VI, um X e um Z Explicação 1: Mínimos Quadrados em Dois Estágios (MQDE) Temos dois estágios ou duas regressões: (1) Primeira isola a parte de X que é não correlacionada com u: regredimos X em Z usando MQO 20 regredimos X em Z usando MQO Xi = pi0 + pi1Zi + vi (1) • Como Zi é não correlacionada com ui, pi0 + pi1Zi será não correlacionada com ui. Não sabemos pi0 ou pi1 mas iremos estimar. Então… • Calculamos o valor predito de Xi, que será ˆ iX onde ˆ iX = 0ˆ + 1ˆ Zi, i = 1,…,n. Mínimos Quadrados em Dois Estágios (2) Substituímos Xi por ˆ iX na regressão de interesse. regredimos Y em ˆ iX usando MQO: Yi = β0 + β1 ˆ iX + ui (2) 21 Mínimos Quadrados em Dois Estágios (2) Substituímos Xi por ˆ iX na regressão de interesse: regredimos Y em ˆ iX usando MQO: Yi = β0 + β1 ˆ iX + ui (2) • Se n é grande, ˆX ≈≈≈≈ pi + pi Z e, portanto, ˆX é não- 22 • Se n é grande, ˆ iX ≈≈≈≈ pi0 + pi1Zi e, portanto, ˆ iX é não- correlacionado com ui. Assim, o primeiro pressuposto de MQO se cumpre. Mínimos Quadrados em Dois Estágios (2) Substituímos Xi por ˆ iX na regressão de interesse: regredimos Y em ˆ iX usando MQO: Yi = β0 + β1 ˆ iX + ui (2) 23 • Se n é grande, ˆ iX ≈≈≈≈ pi0 + pi1Zi e, portanto, ˆ iX é não- correlacionado com ui. Assim, o primeiro pressuposto de MQO se cumpre. • Dessa forma β1 pode ser estimado por MQO usando a regressão (2) Mínimos Quadrados em Dois Estágios (2) Substituímos Xi por ˆ iX na regressão de interesse: regredimos Y em ˆ iX usando MQO: Yi = β0 + β1 ˆ iX + ui (2) • Se n é grande, ˆ iX ≈≈≈≈ pi0 + pi1Zi e, portanto, ˆ iX é não- correlacionado com u . Assim, o primeiro pressuposto de 24 correlacionado com ui. Assim, o primeiro pressuposto de MQO se cumpre. • Dessa forma β1 pode ser estimado por MQO usando a regressão (2) • Este estimador é chamado de MQDE ou Two Stage Least Squares (TSLS), 1ˆTSLSβ . Mínimos Quadrados em Dois Estágios Suponha que temos um instrumento válido, Zi. 25 Mínimos Quadrados em Dois Estágios Suponha que temos um instrumento válido, Zi. Estágio 1: Fazer uma regressão de Xi em Zi. Obter o valor predito de ˆ iX 26 i Mínimos Quadrados em Dois Estágios Suponha que temos um instrumento válido, Zi. Estágio 1: Fazer uma regressão de Xi em Zi. Obter o valor predito de ˆ iX 27 i Estágio 2: Fazer uma regressão de Yi em ˆ iX ; o coeficiente em ˆ iX é o estimador de MQDE, 1ˆTSLSβ . 1 ˆTSLSβ é um estimador consistente de β1. Estimador de VI, um X e um Z Explicação 2: um pouco de algebra… Yi = β0 + β1Xi + ui 28 Estimador de VI, um X e um Z Explicação 2: um pouco de algebra… Yi = β0 + β1Xi + ui logo, cov(Yi, Zi) = cov(β0 + β1Xi + ui, Zi) 29 Estimador de VI, um X e um Z Explicação 2: um pouco de algebra… Yi = β0 + β1Xi + ui logo, cov(Yi, Zi) = cov(β0 + β1Xi + ui, Zi) = cov(β , Z ) + cov(β X , Z ) + cov(u , Z ) 30 = cov(β0, Zi) + cov(β1Xi, Zi) + cov(ui, Zi) Estimador de VI, um X e um Z Explicação 2: um pouco de algebra… Yi = β0 + β1Xi + ui logo, cov(Yi, Zi) = cov(β0 + β1Xi + ui, Zi) = cov(β , Z ) + cov(β X , Z ) + cov(u , Z ) 31 = cov(β0, Zi) + cov(β1Xi, Zi) + cov(ui, Zi) = 0 + cov(β1Xi, Zi) + 0 Estimador de VI, um X e um Z Explicação 2: um pouco de algebra… Yi = β0 + β1Xi + ui logo, cov(Yi, Zi) = cov(β0 + β1Xi + ui, Zi) = cov(β , Z ) + cov(β X , Z ) + cov(u , Z ) 32 = cov(β0, Zi) + cov(β1Xi, Zi) + cov(ui, Zi) = 0 + cov(β1Xi, Zi) + 0 = β1cov(Xi, Zi) Estimador de VI, um X e um Z Explicação 2: um pouco de algebra… Yi = β0 + β1Xi + ui logo, cov(Yi, Zi) = cov(β0 + β1Xi + ui, Zi) = cov(β , Z ) + cov(β X , Z ) + cov(u , Z ) 33 = cov(β0, Zi) + cov(β1Xi, Zi) + cov(ui, Zi) = 0 + cov(β1Xi, Zi) + 0 = β1cov(Xi, Zi) onde cov(ui, Zi) = 0 (exogeneidade do instrumento); logo Estimador de VI, um X e um Z Explicação 2: um pouco de algebra… Yi = β0 + β1Xi + ui logo, cov(Yi, Zi) = cov(β0 + β1Xi + ui, Zi) = cov(β , Z ) + cov(β X , Z ) + cov(u , Z ) 34 = cov(β0, Zi) + cov(β1Xi, Zi) + cov(ui, Zi) = 0 + cov(β1Xi, Zi) + 0 = β1cov(Xi, Zi) onde cov(ui, Zi) = 0 (exogeneidade do instrumento); logo β1 = cov( , ) cov( , ) i i i i Y Z X Z Estimador de VI, um X e um Z β1 = cov( , ) cov( , ) i i i i Y Z X Z 35 Estimador de VI, um X e um Z β1 = cov( , ) cov( , ) i i i i Y Z X Z O estimador de VI substitui as covariâncias populacionais pelas amostrais: 36 amostrais: Estimador de VI, um X e um Z β1 = cov( , ) cov( , ) i i i i Y Z X Z O estimador de VI substitui as covariâncias populacionais pelas amostrais: 37 amostrais: 1 ˆTSLSβ = YZ XZ s s , Estimador de VI, um X e um Z β1 = cov( , ) cov( , ) i i i i Y Z X Z O estimador de VI substitui as covariâncias populacionais pelas amostrais: 38 amostrais: 1 ˆTSLSβ = YZ XZ s s , sYZ e sXZ são as covariâncias amostrais. Este é o mesmo estimador de MQDE – somente uma maneira alternativa de derivá-lo. Consistência do estimador de MQDE 1 ˆTSLSβ = YZ XZ s s As covariâncias amostrais são estimadores consistentes das populacionais: s p → cov(Y,Z) and s p → cov(X,Z). Logo, ( )( ) ( )( )∑ ∑ = = −− −− = n i ii n i ii zzxx zzyy 1 1 39 populacionais: sYZ → cov(Y,Z) and sXZ → cov(X,Z). Logo, Consistência do estimador de MQDE 1 ˆTSLSβ = YZ XZ s s As covariâncias amostrais são estimadores consistentes das populacionais: s p → cov(Y,Z) and s p → cov(X,Z). Logo, ( )( ) ( )( )∑ ∑ = = −− −− = n i ii n i ii zzxx zzyy 1 1 40 populacionais: sYZ → cov(Y,Z) and sXZ → cov(X,Z). Logo, 1 ˆTSLSβ = YZ XZ s s p → cov( , ) cov( , ) Y Z X Z = β1 Consistência do estimador de MQDE 1 ˆTSLSβ = YZ XZ s s As covariâncias amostrais são estimadores consistentes das populacionais: s p → cov(Y,Z) and s p → cov(X,Z). Logo, ( )( ) ( )( )∑ ∑ = = −− −− = n i ii n i ii zzxx zzyy 1 1 41 populacionais: sYZ → cov(Y,Z) and sXZ → cov(X,Z). Logo, 1 ˆTSLSβ = YZ XZ s s p → cov( , ) cov( , ) Y Z X Z = β1 • A condição de relevância de VI assegura que, cov(X,Z) ≠ 0, ou seja que não estamos dividindo por zero. Podemos escrever Se assumirmos que n é grande, temos XX µ≈ , e 1n − ≈ 1. Logo, e, ( ) ( )[ ]( ) ( )( ) ( )( ) ( )( )∑ ∑ ∑ ∑ = = = = −− −− += −− −−+− = n i ii n i ii n i ii n i iiiSLS zzxx zzuu zzxx zzuuxx 1 1 1 1 1 12 1 ˆ βββ ( )( ) ( )zxsnzzxxn ,cov11 ≈ −=−−∑ Agora podemos calcular Var( ):1 ˆβ ( )zxs ZX ,cov, ≈ 1n n − ≈ 1. Logo, e, portanto, ( )( ) ( )zxs n n zzxx zx n i iin ,cov 1 ,1 1 ≈ − =−−∑ = ( ) ( ) ( )( ) ( )( ) − → − +≈ ∑ = 21 1 1 1 2 1 ,cov var , ,cov ˆ zxn zzuN zx zzu iid n i iinSLS βββ 42 ( )( ) ( ) ( ) 48476 0 111 : = === ∑∑∑ −−−=−− n i i n i ii n i ii zzuzzuzzuuOBS Distribução do estimador de MQDE Supondo E[u 2 | z] = σ 2 = Var(u), conseguimos provar que Como estimar a variância? → 2 , 2 2 1 2 1 , zxx dSLS n N ρσ σββ) 43 Como estimar a variância? Utilizando o estimador onde Cuidado: se referem ao primeiro estágio! 2 , 2 zxxRSQT σ ) ∑ = − = n i iu n 1 2 ˆ 2 1 σ ) 2 ,zxx ReSQT Exemplo 1: Oferta e demanda por manteiga Regressões com VI foram originalmente desenvolvidas para estimar as elasticidades de demanda por produtos agrícolas. Por exemplo, manteiga: ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 44 ln( iQ ) = β0 + β1ln( iP ) + ui Exemplo 1: Oferta e demanda por manteiga Regressões com VI foram originalmente desenvolvidas para estimar as elasticidades de demanda por produtos agrícolas. Por exemplo, manteiga: ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 45 ln( iQ ) = β0 + β1ln( iP ) + ui • β1 = elasticidade preço de manteiga (especificação log-log) Exemplo 1: Oferta e demanda por manteiga Regressões com VI foram originalmente desenvolvidas para estimar as elasticidades de demanda por produtos agrícolas. Por exemplo, manteiga: ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 46 ln( iQ ) = β0 + β1ln( iP ) + ui • β1 = elasticidade preço de manteiga (especificação log-log) • Dados: observações de preço e quantidade de manteiga em diferentes anos. Exemplo 1: Oferta e demanda por manteiga Regressões com VI foram originalmente desenvolvidas para estimar as elasticidades de demanda por produtos agrícolas. Por exemplo, manteiga: ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 47 ln( iQ ) = β0 + β1ln( iP ) + ui • β1 = elasticidade preço de manteiga (especificação log-log) • Dados: observações de preço e quantidade de manteiga em diferentes anos. • Se fizermos uma estimação de MQO de ln( butteriQ ) em ln( butteriP ) teremos viés de causalidade simultânea (por que?) Viés de simultaneidade numa estimação de MQO de ln( butteriQ ) em ln( butteriP ) surge por que preço e quantidade são determinados pela interação entre demanda e oferta 48 Viés de simultaneidade numa estimação de MQO de ln( butteriQ ) em ln( butteriP ) surge por que preço e quantidade são determinados pela interação entre demanda e oferta 49 Esta interação produz vários pontos de equilíbrio entre demanda e oferta … 50 Esta interação produz vários pontos de equilíbrio entre demanda e oferta … 51Podemos estimar a equação de demanda com estes pontos? Mas o que aconteceria se conseguíssemos que somente a oferta se deslocasse? 52 Mas o que aconteceria se conseguíssemos que somente a oferta se deslocasse? 53 Usando MQDE para estimar demanda • MQDE estima a curva de demanda isolando as variações de preço e quantidade que acontecem somente pelo deslocamento da oferta. 54 Usando MQDE para estimar demanda • MQDE estima a curva de demanda isolando as variações de preço e quantidade que acontecem somente pelo deslocamento da oferta. • Z é a variável de desloca a oferta sem afetar a demanda 55 • Z é a variável de desloca a oferta sem afetar a demanda diretamente. Usando MQDE para estimar demanda ln( butteriQ ) = β0 + β1ln( butteriP ) + ui Z = pluviosidade na região produtora. 56 Usando MQDE para estimar demanda ln( butteriQ ) = β0 + β1ln( butteriP ) + ui Z = pluviosidade na região produtora. Será que Z é um instrumento válido? 57 Será que Z é um instrumento válido? Usando MQDE para estimar demanda ln( butteriQ ) = β0 + β1ln( butteriP ) + ui Z = pluviosidade na região produtora. Será que Z é um instrumento válido? 58 Será que Z é um instrumento válido? (1) Exógeno? corr(chuvai , ui) = 0? Usando MQDE para estimar demanda ln( butteriQ ) = β0 + β1ln( butteriP ) + ui Z = pluviosidade na região produtora. Será que Z é um instrumento válido? 59 Será que Z é um instrumento válido? (1) Exógeno? corr(chuvai , ui) = 0? Plausível: se chuva não deveria afetar a demanda Usando MQDE para estimar demanda ln( butteriQ ) = β0 + β1ln( butteriP ) + ui Z = pluviosidade na região produtora. Será que Z é um instrumento válido? 60 Será que Z é um instrumento válido? (1) Exógeno? corr(chuvai , ui) = 0? Plausível: se chuva não deveria afetar a demanda (2) Relevante? corr(chuvai, ln( butteriP )) ≠ 0? Plausível: pouca chuva => pouco pasto => menos manteiga MQDE no exemplo de oferta e demanda ln( butteriQ ) = β0 + β1ln( butteriP ) + ui Zi = pluvi = pluviosidade na região produtora. 61 MQDE no exemplo de oferta e demanda ln( butteriQ ) = β0 + β1ln( butteriP ) + ui Zi = pluvi = pluviosidade na região produtora. Estágio 1: regredir ln( butteriP ) em pluviosidade, obter ^ ( )buttleriPln 62 Estágio 1: regredir ln( iP ) em pluviosidade, obter isola mudanças em log preço que surgem de variações de oferta ( )iPln ^( )buttleriPln MQDE no exemplo de oferta e demanda ln( butteriQ ) = β0 + β1ln( butteriP ) + ui Zi = pluvi = pluviosidade na região produtora. Estágio 1: regredir ln( butteriP ) em pluviosidade, obter ^ ( )buttleriPln 63 Estágio 1: regredir ln( iP ) em pluviosidade, obter isola mudanças em log preço que surgem de variações de oferta Estágio 2: regredir ln( butteriQ ) em O equivalente a usar as variações de oferta para identificar a curva de demanda. ( )iPln ^( )buttleriPln ^( )buttleriPln