Logo Passei Direto
Buscar

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Econometria
Aula 19
Marta AreosaMarta Areosa
marta@econ.puc-rio.br
Regressões com variáveis
instrumentais
Três ameaças à validade interna de um estudo são: 
 
2
Regressões com variáveis
instrumentais
Três ameaças à validade interna de um estudo são: 
• Viés de variável omitida de uma variável que é 
correlacionada com X, mas é não observável e não pode ser 
incluída na regressão; 
3
 
Regressões com variáveis
instrumentais
Três ameaças à validade interna de um estudo são: 
• Viés de variável omitida de uma variável que é 
correlacionada com X, mas é não observável e não pode ser 
incluída na regressão; 
4
• Viés da causalidade simultânea (X causa Y, Y causa X); 
 
Regressões com variáveis
instrumentais
Três ameaças à validade interna de um estudo são: 
• Viés de variável omitida de uma variável que é 
correlacionada com X, mas é não observável e não pode ser 
incluída na regressão; 
5
• Viés da causalidade simultânea (X causa Y, Y causa X); 
• Viés por erro nas variáveis (X é medido com erro) 
 
 
Regressões com variáveis
instrumentais
Três ameaças à validade interna de um estudo são: 
• Viés de variável omitida de uma variável que é correlacionada 
com X, mas é não observável e não pode ser incluída na 
regressão; 
6
• Viés da causalidade simultânea (X causa Y, Y causa X); 
• Viés por erro nas variáveis (X é medido com erro) 
 
Todos estes casos geram o mesmo tipo de problema: cov(u,X) ≠ 0 
Lembrar: cov(u,X) ≠ 0 ⇒ E(u|X) ≠ constante (0,em particular) 
 
Um regressor e um instrumento
• Regressão com variáveis instrumentais (VI) pode eliminar o 
viés (devido ao fato de E(u|X) ≠ 0) 
 
Yi = β0 + β1Xi + ui 
7
Yi = β0 + β1Xi + ui 
 
• Regressão com VI quebra X em duas partes: a parte que pode 
estar correlacionada com u, e a parte que não está. Isolando a 
parte que não está correlacionada com u, podemos estimar β1 
sem viés. 
 
Um regressor e um instrumento
Yi = β0 + β1Xi + ui 
 
• Isto é feito usando uma variável instrumental, Zi, que não está 
correlacionada com ui. 
8
correlacionada com ui. 
Um regressor e um instrumento
Yi = β0 + β1Xi + ui 
 
• Isto é feito usando uma variável instrumental, Zi, que não está 
correlacionada com ui. 
9
correlacionada com ui. 
 
• A variável instrumental captura os movimentos em Xi que são 
não correlacionados com ui, e os usa para estimar β1. 
 
Terminologia: endogeneidade e 
exogeneidade
Variável endógena é correlacionada com u 
Variável exógena é não correlacionada com u 
 
 
10
Terminologia: endogeneidade e 
exogeneidade
Variável endógena é correlacionada com u 
Variável exógena é não correlacionada com u 
 
Nota histórica: “Endógena” significa que a variável é 
11
determinada dentro do sistema ou seja, que a variável é 
determinada em conjunto com Y. Assim a estimação é sujeita 
ao viés de causalidade simultânea. Porém, esta definição é 
muito restrita já que VI pode ser usada para resolver também 
problemas de viés de variável omitida e erros-em-variáveis, e 
não somente viés de simultaneidade. 
 
Condições para uma variável
instrumental válida
Yi = β0 + β1Xi + ui 
 
Para que uma variável instrumental (um “instrumento”) Z seja 
válida, tem que satisfazer duas condições: 
 
12
 
Condições para uma variável
instrumental válida
Yi = β0 + β1Xi + ui 
 
Para que uma variável instrumental (um “instrumento”) Z seja 
válida, tem que satisfazer duas condições: 
 
13
 
1. Relevância do Instrumento: corr(Zi,Xi) ≠ 0 
 
Condições para uma variável
instrumental válida
Yi = β0 + β1Xi + ui 
 
Para que uma variável instrumental (um “instrumento”) Z seja 
válida, tem que satisfazer duas condições: 
 
14
 
1. Relevância do Instrumento: corr(Zi,Xi) ≠ 0 
2. Exogeneidade: corr(Zi,ui) = 0 
 
Condições para uma variável
instrumental válida
Yi = β0 + β1Xi + ui 
 
Para que uma variável instrumental (um “instrumento”) Z seja 
válida, tem que satisfazer duas condições: 
 
15
 
1. Relevância do Instrumento: corr(Zi,Xi) ≠ 0 
2. Exogeneidade: corr(Zi,ui) = 0 
 
Suponha por agora que você tem este Zi (discutiremos em breve 
como achar tal variável instrumental). 
Condições para uma variável
instrumental válida
Yi = β0 + β1Xi + ui 
 
Para que uma variável instrumental (um “instrumento”) Z seja 
válida, tem que satisfazer duas condições: 
 
16
 
1. Relevância do Instrumento: corr(Zi,Xi) ≠ 0 
2. Exogeneidade: corr(Zi,ui) = 0 
 
Suponha por agora que você tem este Zi (discutiremos em breve 
como achar tal variável instrumental). 
 
Como podemos usar Zi para estimar β1? 
 
Estimador de VI, um X e um Z
Explicação 1: Mínimos Quadrados em Dois Estágios (MQDE) 
Temos dois estágios ou duas regressões: 
 
17
Estimador de VI, um X e um Z
Explicação 1: Mínimos Quadrados em Dois Estágios (MQDE) 
Temos dois estágios ou duas regressões: 
 
(1) Primeira isola a parte de X que é não correlacionada com u: 
regredimos X em Z usando MQO 
18
regredimos X em Z usando MQO 
Xi = pi0 + pi1Zi + vi (1)
 
 
Estimador de VI, um X e um Z
Explicação 1: Mínimos Quadrados em Dois Estágios (MQDE) 
Temos dois estágios ou duas regressões: 
 
(1) Primeira isola a parte de X que é não correlacionada com u: 
regredimos X em Z usando MQO 
19
regredimos X em Z usando MQO 
Xi = pi0 + pi1Zi + vi (1)
 
• Como Zi é não correlacionada com ui, pi0 + pi1Zi será não 
correlacionada com ui. Não sabemos pi0 ou pi1 mas iremos 
estimar. Então… 
 
Estimador de VI, um X e um Z
Explicação 1: Mínimos Quadrados em Dois Estágios (MQDE) 
Temos dois estágios ou duas regressões: 
 
(1) Primeira isola a parte de X que é não correlacionada com u: 
regredimos X em Z usando MQO 
20
regredimos X em Z usando MQO 
Xi = pi0 + pi1Zi + vi (1)
 
• Como Zi é não correlacionada com ui, pi0 + pi1Zi será não 
correlacionada com ui. Não sabemos pi0 ou pi1 mas iremos 
estimar. Então… 
• Calculamos o valor predito de Xi, que será ˆ iX 
onde ˆ iX = 0ˆ + 1ˆ Zi, i = 1,…,n. 
 
Mínimos Quadrados em Dois Estágios
(2) Substituímos Xi por ˆ iX na regressão de interesse. 
regredimos Y em ˆ iX usando MQO: 
Yi = β0 + β1 ˆ iX + ui (2)
 
 
21
 
Mínimos Quadrados em Dois Estágios
(2) Substituímos Xi por ˆ iX na regressão de interesse: 
regredimos Y em ˆ iX usando MQO: 
Yi = β0 + β1 ˆ iX + ui (2)
 
• Se n é grande, ˆX ≈≈≈≈ pi + pi Z e, portanto, ˆX é não-
22
• Se n é grande, ˆ iX ≈≈≈≈ pi0 + pi1Zi e, portanto, ˆ iX é não-
correlacionado com ui. Assim, o primeiro pressuposto de 
MQO se cumpre. 
 
Mínimos Quadrados em Dois Estágios
(2) Substituímos Xi por ˆ iX na regressão de interesse: 
regredimos Y em ˆ iX usando MQO: 
Yi = β0 + β1 ˆ iX + ui (2)
 
 
23
 
• Se n é grande, ˆ iX ≈≈≈≈ pi0 + pi1Zi e, portanto, ˆ iX é não-
correlacionado com ui. Assim, o primeiro pressuposto de 
MQO se cumpre. 
 
• Dessa forma β1 pode ser estimado por MQO usando a 
regressão (2) 
 
Mínimos Quadrados em Dois Estágios
(2) Substituímos Xi por ˆ iX na regressão de interesse: 
regredimos Y em ˆ iX usando MQO: 
Yi = β0 + β1 ˆ iX + ui (2) 
 
• Se n é grande, ˆ iX ≈≈≈≈ pi0 + pi1Zi e, portanto, ˆ iX é não-
correlacionado com u . Assim, o primeiro pressuposto de 
24
correlacionado com ui. Assim, o primeiro pressuposto de 
MQO se cumpre. 
 
• Dessa forma β1 pode ser estimado por MQO usando a 
regressão (2) 
 
• Este estimador é chamado de MQDE ou Two Stage Least 
Squares (TSLS), 1ˆTSLSβ . 
 
Mínimos Quadrados em Dois Estágios
Suponha
que temos um instrumento válido, Zi. 
 
 
25
Mínimos Quadrados em Dois Estágios
Suponha que temos um instrumento válido, Zi. 
 
Estágio 1: Fazer uma regressão de Xi em Zi. 
Obter o valor predito de ˆ iX 
26
i
 
 
Mínimos Quadrados em Dois Estágios
Suponha que temos um instrumento válido, Zi. 
 
Estágio 1: Fazer uma regressão de Xi em Zi. 
Obter o valor predito de ˆ iX 
27
i
 
Estágio 2: Fazer uma regressão de Yi em ˆ iX ; o coeficiente em ˆ iX 
é o estimador de MQDE, 1ˆTSLSβ . 
 
1
ˆTSLSβ é um estimador consistente de β1. 
 
Estimador de VI, um X e um Z
Explicação 2: um pouco de algebra… 
 
Yi = β0 + β1Xi + ui 
 
28
Estimador de VI, um X e um Z
Explicação 2: um pouco de algebra… 
 
Yi = β0 + β1Xi + ui 
logo, 
 cov(Yi, Zi) = cov(β0 + β1Xi + ui, Zi) 
 
29
 
Estimador de VI, um X e um Z
Explicação 2: um pouco de algebra… 
 
Yi = β0 + β1Xi + ui 
logo, 
 cov(Yi, Zi) = cov(β0 + β1Xi + ui, Zi) 
= cov(β , Z ) + cov(β X , Z ) + cov(u , Z ) 
30
= cov(β0, Zi) + cov(β1Xi, Zi) + cov(ui, Zi) 
 
Estimador de VI, um X e um Z
Explicação 2: um pouco de algebra… 
 
Yi = β0 + β1Xi + ui 
logo, 
 cov(Yi, Zi) = cov(β0 + β1Xi + ui, Zi) 
= cov(β , Z ) + cov(β X , Z ) + cov(u , Z ) 
31
= cov(β0, Zi) + cov(β1Xi, Zi) + cov(ui, Zi) 
= 0 + cov(β1Xi, Zi) + 0 
 
Estimador de VI, um X e um Z
Explicação 2: um pouco de algebra… 
 
Yi = β0 + β1Xi + ui 
logo, 
 cov(Yi, Zi) = cov(β0 + β1Xi + ui, Zi) 
= cov(β , Z ) + cov(β X , Z ) + cov(u , Z ) 
32
= cov(β0, Zi) + cov(β1Xi, Zi) + cov(ui, Zi) 
= 0 + cov(β1Xi, Zi) + 0 
= β1cov(Xi, Zi) 
 
 
Estimador de VI, um X e um Z
Explicação 2: um pouco de algebra… 
 
Yi = β0 + β1Xi + ui 
logo, 
 cov(Yi, Zi) = cov(β0 + β1Xi + ui, Zi) 
= cov(β , Z ) + cov(β X , Z ) + cov(u , Z ) 
33
= cov(β0, Zi) + cov(β1Xi, Zi) + cov(ui, Zi) 
= 0 + cov(β1Xi, Zi) + 0 
= β1cov(Xi, Zi) 
 
onde cov(ui, Zi) = 0 (exogeneidade do instrumento); logo 
 
 
 
Estimador de VI, um X e um Z
Explicação 2: um pouco de algebra… 
 
Yi = β0 + β1Xi + ui 
logo, 
 cov(Yi, Zi) = cov(β0 + β1Xi + ui, Zi) 
= cov(β , Z ) + cov(β X , Z ) + cov(u , Z ) 
34
= cov(β0, Zi) + cov(β1Xi, Zi) + cov(ui, Zi) 
= 0 + cov(β1Xi, Zi) + 0 
= β1cov(Xi, Zi) 
 
onde cov(ui, Zi) = 0 (exogeneidade do instrumento); logo 
 
 β1 = cov( , )
cov( , )
i i
i i
Y Z
X Z
 
 
Estimador de VI, um X e um Z
β1 = cov( , )
cov( , )
i i
i i
Y Z
X Z
 
 
 
35
Estimador de VI, um X e um Z
β1 = cov( , )
cov( , )
i i
i i
Y Z
X Z
 
 
O estimador de VI substitui as covariâncias populacionais pelas 
amostrais: 
36
amostrais: 
 
 
Estimador de VI, um X e um Z
β1 = cov( , )
cov( , )
i i
i i
Y Z
X Z
 
 
O estimador de VI substitui as covariâncias populacionais pelas 
amostrais: 
37
amostrais: 
 
1
ˆTSLSβ = YZ
XZ
s
s
, 
 
 
Estimador de VI, um X e um Z
β1 = cov( , )
cov( , )
i i
i i
Y Z
X Z
 
 
O estimador de VI substitui as covariâncias populacionais pelas 
amostrais: 
38
amostrais: 
 
1
ˆTSLSβ = YZ
XZ
s
s
, 
 
sYZ e sXZ são as covariâncias amostrais. Este é o mesmo 
estimador de MQDE – somente uma maneira alternativa de 
derivá-lo. 
 
Consistência do estimador de MQDE 
1
ˆTSLSβ = YZ
XZ
s
s
 
 
As covariâncias amostrais são estimadores consistentes das 
populacionais: s 
p
→ cov(Y,Z) and s 
p
→ cov(X,Z). Logo, 
( )( )
( )( )∑
∑
=
=
−−
−−
=
n
i ii
n
i ii
zzxx
zzyy
1
1
39
populacionais: sYZ → cov(Y,Z) and sXZ → cov(X,Z). Logo, 
 
 
Consistência do estimador de MQDE 
1
ˆTSLSβ = YZ
XZ
s
s
 
 
As covariâncias amostrais são estimadores consistentes das 
populacionais: s 
p
→ cov(Y,Z) and s 
p
→ cov(X,Z). Logo, 
( )( )
( )( )∑
∑
=
=
−−
−−
=
n
i ii
n
i ii
zzxx
zzyy
1
1
40
populacionais: sYZ → cov(Y,Z) and sXZ → cov(X,Z). Logo, 
 
1
ˆTSLSβ = YZ
XZ
s
s
 
p
→ 
cov( , )
cov( , )
Y Z
X Z
 = β1 
 
 
Consistência do estimador de MQDE 
1
ˆTSLSβ = YZ
XZ
s
s
 
 
As covariâncias amostrais são estimadores consistentes das 
populacionais: s 
p
→ cov(Y,Z) and s 
p
→ cov(X,Z). Logo, 
( )( )
( )( )∑
∑
=
=
−−
−−
=
n
i ii
n
i ii
zzxx
zzyy
1
1
41
populacionais: sYZ → cov(Y,Z) and sXZ → cov(X,Z). Logo, 
 
1
ˆTSLSβ = YZ
XZ
s
s
 
p
→ 
cov( , )
cov( , )
Y Z
X Z
 = β1 
 
• A condição de relevância de VI assegura que, cov(X,Z) ≠ 0, 
ou seja que não estamos dividindo por zero. 
 
Podemos escrever 
 
 
 
 Se assumirmos que n é grande, temos XX µ≈ , e 
1n −
 ≈ 1. Logo, e, 
( ) ( )[ ]( )
( )( )
( )( )
( )( )∑
∑
∑
∑
=
=
=
=
−−
−−
+=
−−
−−+−
=
n
i ii
n
i ii
n
i ii
n
i iiiSLS
zzxx
zzuu
zzxx
zzuuxx
1
1
1
1
1 12
1
ˆ βββ
( )( ) ( )zxsnzzxxn ,cov11 ≈ −=−−∑
Agora podemos calcular Var( ):1
ˆβ
( )zxs ZX ,cov, ≈
1n
n
−
 ≈ 1. Logo, e, 
portanto, 
( )( ) ( )zxs
n
n
zzxx zx
n
i iin
,cov
1
,1
1
≈




 −
=−−∑
=
( )
( )
( )( )
( )( ) 





−
→
−
+≈
∑
=
21
1
1
1
2
1
,cov
var
,
,cov
ˆ
zxn
zzuN
zx
zzu
iid
n
i iinSLS βββ
42
( )( ) ( ) ( )
48476 0
111
:
=
===
∑∑∑ −−−=−−
n
i i
n
i ii
n
i ii
zzuzzuzzuuOBS
Distribução do estimador de MQDE 
Supondo E[u
2
 | z] = σ
2
 = Var(u), conseguimos provar que 
 
 
 
 
Como estimar a variância? 








→ 2
,
2
2
1
2
1 ,
zxx
dSLS
n
N
ρσ
σββ)
43
Como estimar a variância? 
 
Utilizando o estimador 
 
 
onde 
 
Cuidado: se referem ao primeiro estágio! 
2
,
2
zxxRSQT
σ
)
∑
=
−
=
n
i
iu
n 1
2
ˆ
2
1
σ
)
2
,zxx ReSQT
Exemplo 1: Oferta e demanda por
manteiga
Regressões com VI foram originalmente desenvolvidas para 
estimar as elasticidades de demanda por produtos agrícolas. Por 
exemplo, manteiga: 
 
ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 
44
ln( iQ ) = β0 + β1ln( iP ) + ui 
 
 
Exemplo 1: Oferta e demanda por
manteiga
Regressões com VI foram originalmente desenvolvidas para 
estimar as elasticidades de demanda por produtos agrícolas. Por 
exemplo, manteiga: 
 
ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 
45
ln( iQ ) = β0 + β1ln( iP ) + ui 
 
• β1 = elasticidade preço de manteiga (especificação log-log) 
 
 
Exemplo 1: Oferta e demanda por
manteiga
Regressões com VI foram originalmente desenvolvidas para 
estimar as elasticidades de demanda por produtos agrícolas. Por 
exemplo, manteiga: 
 
ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 
46
ln( iQ ) = β0 + β1ln( iP ) + ui 
 
• β1 = elasticidade preço de manteiga (especificação log-log) 
 
• Dados: observações de preço e quantidade de manteiga em 
diferentes anos. 
 
Exemplo 1: Oferta e demanda por
manteiga
Regressões com VI foram originalmente desenvolvidas para 
estimar as elasticidades de demanda por produtos
agrícolas. Por 
exemplo, manteiga: 
 
ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 
47
ln( iQ ) = β0 + β1ln( iP ) + ui 
 
• β1 = elasticidade preço de manteiga (especificação log-log) 
 
• Dados: observações de preço e quantidade de manteiga em 
diferentes anos. 
• Se fizermos uma estimação de MQO de ln( butteriQ ) em 
ln( butteriP ) teremos viés de causalidade simultânea (por que?) 
 
Viés de simultaneidade numa estimação de MQO de ln( butteriQ ) 
em ln( butteriP ) surge por que preço e quantidade são determinados 
pela interação entre demanda e oferta 
 
48
Viés de simultaneidade numa estimação de MQO de ln( butteriQ ) 
em ln( butteriP ) surge por que preço e quantidade são determinados 
pela interação entre demanda e oferta 
 
49
Esta interação produz vários pontos de equilíbrio entre demanda 
e oferta … 
 
50
Esta interação produz vários pontos de equilíbrio entre demanda 
e oferta … 
 
51Podemos estimar a equação de demanda com estes pontos? 
 
Mas o que aconteceria se conseguíssemos que somente a oferta se 
deslocasse? 
52
Mas o que aconteceria se conseguíssemos que somente a oferta se 
deslocasse? 
53
Usando MQDE para estimar demanda
• MQDE estima a curva de demanda isolando as variações de 
preço e quantidade que acontecem somente pelo 
deslocamento da oferta. 
 
 
54
Usando MQDE para estimar demanda
• MQDE estima a curva de demanda isolando as variações de 
preço e quantidade que acontecem somente pelo 
deslocamento da oferta. 
 
• Z é a variável de desloca a oferta sem afetar a demanda 
55
• Z é a variável de desloca a oferta sem afetar a demanda 
diretamente. 
 
Usando MQDE para estimar demanda
ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 
 
Z = pluviosidade na região produtora. 
 
 
56
Usando MQDE para estimar demanda
ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 
 
Z = pluviosidade na região produtora. 
 
Será que Z é um instrumento válido? 
57
Será que Z é um instrumento válido? 
 
 
Usando MQDE para estimar demanda
ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 
 
Z = pluviosidade na região produtora. 
 
Será que Z é um instrumento válido? 
58
Será que Z é um instrumento válido? 
 
(1) Exógeno? corr(chuvai , ui) = 0? 
 
Usando MQDE para estimar demanda
ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 
 
Z = pluviosidade na região produtora. 
 
Será que Z é um instrumento válido? 
59
Será que Z é um instrumento válido? 
 
(1) Exógeno? corr(chuvai , ui) = 0? 
Plausível: se chuva não deveria afetar a demanda 
 
 
Usando MQDE para estimar demanda
ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 
 
Z = pluviosidade na região produtora. 
 
Será que Z é um instrumento válido? 
60
Será que Z é um instrumento válido? 
 
(1) Exógeno? corr(chuvai , ui) = 0? 
Plausível: se chuva não deveria afetar a demanda 
 
(2) Relevante? corr(chuvai, ln( butteriP )) ≠ 0? 
Plausível: pouca chuva => pouco pasto => menos 
manteiga 
 
MQDE no exemplo de oferta e 
demanda
ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 
 
Zi = pluvi = pluviosidade na região produtora. 
 
61
MQDE no exemplo de oferta e 
demanda
ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 
 
Zi = pluvi = pluviosidade na região produtora. 
 
Estágio 1: regredir ln( butteriP ) em pluviosidade, obter ^ ( )buttleriPln
62
Estágio 1: regredir ln( iP ) em pluviosidade, obter 
 
 isola mudanças em log preço que surgem de 
variações de oferta 
 
( )iPln
^( )buttleriPln
MQDE no exemplo de oferta e 
demanda
ln( butteriQ ) = β0 + β1ln( butteriP ) + ui 
 
Zi = pluvi = pluviosidade na região produtora. 
 
Estágio 1: regredir ln( butteriP ) em pluviosidade, obter ^ ( )buttleriPln
63
Estágio 1: regredir ln( iP ) em pluviosidade, obter 
 
 isola mudanças em log preço que surgem de 
variações de oferta 
 
Estágio 2: regredir ln( butteriQ ) em 
O equivalente a usar as variações de oferta para identificar 
a curva de demanda. 
 
( )iPln
^( )buttleriPln
^( )buttleriPln

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?