Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Econometria
Aula 20
Marta AreosaMarta Areosa
marta@econ.puc-rio.br
Problema: Identificação
• Quando temos um sistema de equações em que as variáveis
estão relacionadas, dizemos que temos um modelo de
equações simultâneas (MES).
• Nesse caso, nem sempre conseguimos estimar corretamente
2
• Nesse caso, nem sempre conseguimos estimar corretamente
todos os coeficientes das equações.
• Dizemos que ocorre um problema de identificação.
Problema: Identificação
• Seja o seguinte sistema
• Econometricamente, temos apenas uma equação...
iii
iii
vyy
uyy
++=
++=
1102
2101
γγ
ββ
3
• Econometricamente, temos apenas uma equação...
• Não há motivo para obtermos
{ { 321
iw
iii
iii
vyy
uyy
1
2
11
0
1
2101
11
10
γγγ
γ
ββ
αα
−+−=
++=
ii wue ˆˆˆ
ˆ;ˆˆ 1100 ≠≠≠ αβαβ
Problema: Identificação
• Precisamos de variáveis que sejam determinadas fora do
sistema para nos ajudar a identificar cada curva
separadamente.
• Considere o sistema
iii uyy ++= 2101 ββ
4
• Nesse caso
iiii
iii
vxyy
uyy
+++=
++=
21102
2101
γγγ
ββ
( )
( ) ( )iiii
iiiii
vuxy
vxuyy
+++++=
+++++=
12211010
2210102
γγβγβγγ
γββγγ
Problema: Identificação
• Ou seja
434214342143421
iw
ii
ii
vu
xy
−
+
+
−
+
−
+
=
11
1
11
2
11
010
2 111
10
βγ
γ
βγ
γ
βγ
βγγ
αα
5
• Chamamos esta equação de forma reduzida.
• Se tivermos , ou seja ,
poderemos utilizar x como instrumento.
• Obtendo , podemos estimar
( ) 0,cov =ii wx ( ) 0,cov =ii ux
iy2ˆ iii uyy ++= 2101 ˆββ
Problema: Identificação
• Vimos que podemos obter os parâmetros de uma das
equações utilizando variáveis instrumentais. E quanto a
outra equação?
• Parece que podemos fazer a mesma coisa obtendo
6
• Parece que podemos fazer a mesma coisa obtendo
• Mas, intuitivamente, o procedimento parece estranho.
Estamos identificando deslocamentos em y1 através de x,
que é uma variável que desloca a curva de y2!
01
1
01
21
01
010
1 111 γβ
β
γβ
γβ
γβ
γββ
−
+
+
−
+
−
+
=
ii
ii
uv
xy
Problema: Identificação
• De fato, este procedimento não pode ser feito... Se
tentássemos estimar
não iríamos conseguir. Existe colinearidade perfeita entre
iiii vxyy +++= 21102 ˆ γγγ
7
não iríamos conseguir. Existe colinearidade perfeita entre
os regressores!
• Dizemos que esta equação não é identificada.
Problema: Identificação
• Seja o seguinte sistema
• Podemos estimar a forma reduzida deste sistema como
iiii
iiii
vxyy
uxyy
+++=
+++=
221102
122101
γγγ
βββ
8
• Podemos estimar a forma reduzida deste sistema como
• Para ter sentido, a matriz acima deve ser inversível.
+
+
−
=
−
i
i
i
i
i
i
v
u
x
x
y
y
2
1
2
2
0
0
1
1
1
2
1
0
0
1
1
γ
β
γ
β
γ
β
Problema: Identificação
• Devemos ter os erros não-correlacionados com os
regressores para estimar as formas reduzidas sem viés
+++=
+++=
221102
221101
ααα
pipipi
iiii
iiii
exxy
wxxy
9
onde
−
=
−
=
−
=
+++=
−
−−
2
2
1
1
1
11
21
1
1
1
0
0
1
1
1
0
0
221102
0
0
1
1
1
1
;
1
1
γ
β
γ
β
αα
pipi
γ
β
γ
β
γ
β
α
pi
ααα
i
i
i
i
iiii
v
u
e
w
exxy
Problema: Identificação
• Não podermos ter multicolinearidade perfeita entre
para estimarmos
ii
ii
xey
xey
22
11
ˆ
ˆ
iiii
vxyy
uxyy
+++=
+++= 122101
ˆ
ˆ
γγγ
βββ
10
• Como, o caso em questão,
esta condição nos diz que
iii
iii
xxy
xxy
221102
221101
ˆˆˆˆ
ˆˆˆˆ
ααα
pipipi
++=
++=
iiii vxyy +++= 221102 ˆ γγγ
( ) { }1,1,0ˆ;0ˆ 2112 −∉≠≠ xxcorreleαpi
Problema: Identificação
• Caso geral:
[ ] [ ]
[ ]
T
niii
T
niii
ii
uuUyyY
UDYCXBY
;; 11 LL ==
+++=
11
• A forma reduzida se torna
[ ] nxnnxknxnxnTkii DCBAxxX ;;;; 11 L=
)(;111 DIAUACXABAY ii −=++= −−−
Problema: Identificação
• Para haver identificação nas equações:
o A matriz A deve ser inversível.
o Para estimarmos as formas reduzidas sem viés, U não
pode ser correlacionado com X;
o Não pode haver multicolinearidade perfeita entre
12
o Não pode haver multicolinearidade perfeita entre
para estimarmos
ii UYDCXBY +++= ˆ
CXeCXDABDAYD i
11
ˆ
−− +=
Problema: Erro de Medida
• Vamos supor que algumas variáveis são obtidas com erro.
Devemos coniderar dois casos:
o O erro ocorre na variável dependente e
o O erro ocorre em um regressor.
13
• No primeiro caso, o parâmetro de interesse (y*) tem erro.
Ou seja, gostaríamos de regredir
O que corresponde a ter
iii eyy +=
*
( )iiii euxy +++= 110 γγ
iii uxy ++= 110
* γγ
Problema: Erro de Medida
• Se ei não é correlacionado com xi, temos que os
estimadores de MQO são não-viesados e consistentes.
• O único problema é que
14
• Portanto, os estimadores de MQO terão variâncias maiores.
• Se ei é correlacionado com xi, temos que os estimadores de
MQO serão viesados e inconsistentes.
)var()var()var()var( iiiii ueueu >+=+
Problema: Erro de Medida
• No segundo caso, o regressor de interesse (x*) tem erro
• Ou seja
iii exx +=
*
( )
iii uxy
*
10 ββ ++=
15
• Se ei for não-correlacionado com ui, teremos
• Mas os estimadores serão viesados? Serão consistentes?
( )iii eux 110 βββ −++=
)var()var()var()var( 211 iiiii ueueu >+=− ββ
Problema: Erro de Medida
• Escrevendo
temos que
*
iii xxe −=
( ) ( ) ( )
( ) ( )
*
,cov,covvar0 iiiiii xxeeee −==<
16
• Além das hipóteses e ,
vamos considerar dois casos:
o
o
( ) ( )*,cov,cov iiii xexe −=
( ) ( ) ( ) 0,covvar,cov * == iiiii xeeexe
( ) ( ) ( )iiiii exeexe var,cov0,cov * −==
( ) 0,cov * =ii xu ( ) 0,cov =ii eu
Problema: Erro de Medida
• Sob a hipótese
tem-se
),cov(),cov(),cov(
*
11 iiiiiii exuxeux
β
ββ
−+=
−=−
( ) ( ) ( ) 0,covvar,cov * == iiiii xeeexe
17
• Ou seja, os estimadores são viesados e inconsistentes!
( )
)var(
),cov(),cov(),cov(
1
var
1
00
*
i
e
iiiiii
e
exueux
i
β
β
−=
−+=
===
434214342143421
Problema: Erro de Medida
• Sob esta hipótese,
• Definindo , temos
( )
43421
0
**
,cov2)var()var()var(
=
++= iiiii exexx
( )
( )
( )
( )
ii
pn
n
i iin
x
wx
xx
wxx
var
,cov
ˆ
121
1
1
11 +→
−
−
+=
∑
∑
= βββ
iii euw 1β−=
18
• Ou seja,
• Temos um viés (assintótico) de atenuação.
• Num modelo com k regressores, esta expressão é muito
mais complexa...
( ) ( )ipni in xxx var11 2111 −∑ =
( )
( )
444 3444 21
1,0
*
*
1*111 )var()var(
)var(
)var()var(
)var(
ˆlim
∈
+
=
+
−=
ii
i
ii
i
ex
x
ex
ep ββββ
Problema: Erro de Medida
• Sob a hipótese
tem-se
),cov(),cov(),cov( 11 −=− iiiiiii exuxeux γγ
( ) ( ) 0,cov0,cov * <= iiii xeexe
19
• Ou seja, os estimadores são não viesados e consistentes!
0
),cov(),cov(),cov(
0
1
00
*
=
−+=
===
434214342143421 iiiiii
exueux γ
Problema: Variáveis não-observáveis
• Algumas variáveis não são passíveis de serem medidas.
Dizemos que elas são não-observáveis. Ex: Aptidão de uma
pessoa, comprometimento com o trabalho, etc.
• Nesse caso utilizamos uma variável “proxy”. Isto é
20
• Nesse caso utilizamos uma variável “proxy”. Isto é
olhamos para uma variável observável que se relacione
com a variável desejada.
• Ou seja gostaríamos de estimar
mas, observamos
ivxx ++= 310
*
3 δδ
iiiii uxxxy ++++=
*
3322110 ββββ
Problema: Variáveis não-observáveis
• Ou seja, estamos estimando
• Se
( )
{ { {
( )133132211030
*
3322110
3210
vuxxx
uxxxy
iii
iiii
βδβββδββ
ββββ
γγγγ
++++++=
++++=
43421
21
• Se
o vi não for correlacionado com x1i ou x2i,
o ui não for correlacionado com x3i
teremos que
Os estimadores e serão viesados e inconsistentes.
( ) 1330300
2211
;
;;
δβγδββγ
βγβγ
=+=
==
30 ˆˆ γγ
Problema: Variáveis não-observáveis
• Se vi for correlacionado com x1i ou x2i teremos que
Nesse caso, todos os estimadores serão viesados e
ivxxxx ++++= 3322110
*
3 δδδδ
22
Nesse caso, todos os estimadores serão viesados e
inconsistentes.
( ) ( ) ( )
( )13313
22321131030
*
3322110
vux
xx
uxxxy
ii
ii
iiii
βδβ
δββδββδββ
ββββ
+++
+++++=
++++=
Problema: Má Especificação
• Ocorre quando o modelo especificado não explica de modo
apropriado a relação da variável dependente com as variáveis
explicativas
• Isso pode ocorrer quando:
23
• Isso pode ocorrer quando:
o Omitimos variáveis;
o Não consideramos a forma funcional correta;
� As variáveis estão em nível, quando deveriam estar em
log;
� As relações entre variáveis não são consideradas
Problema: Má Especificação
• Variáveis omitidas:
O modelo verdadeiro é
y= β0 + β1x1 + β2x2 + β3x3 + u
24
y= β0 + β1x1 + β2x2 + β3x3 + u
e estimamos
y= β0 + β1x1 + β2x2 +v
Ou seja:
v= β3x3 + u
Problema: Má Especificação
Se β3≠0 e cov(v, β1x1 + β2x2) ≠0, teremos E[v |X] ≠0
Consequência: os estimadores serão viesados
25
Se x3 = (x2)2 a situação é pior, pois, ainda que.β2 fosse não-
viesado, não seria possível estimar o efeito de x2 em y, dado por
β2 + 2β3
Se x3 = x1x2 (ou outra forma de relação entre as variáveis), os
coeficientes, além de viesados, não terão a interpretação correta
Problema: Má Especificação
• Forma funcional incorreta:
Com a ajuda do teste F, é podemos especificar um modelo
que englobe várias possíveis especificações para obter qual
é a correta
26
é a correta
y= β0 + β1x1 + β2x2 + β3x3
+ β4ln(x1)+ β5ln(x2) + β6ln(x3)
+ β7(x1)2+ β8(x2)2 + β9(x3)2 + u
Dificuldade: Os graus de liberdade aumentam muito e,
portanto, esta abordagem requer um grande número de
observações
Problema: Má Especificação
• Como detectar a má especifição?
• Utilizando o teste de RESET
1) Estima-se a regressão
y= β0 + β1x1 + β2x2 + β3x3 + u
2) Calcula-se o valor predito de y
27
2) Calcula-se o valor predito de y
3) Estima-se a regressão
y= β0 + β1x1 + β2x2 + β3x3 + β4z2 + β5 z3 + v
Idéia: os termos z2 e z3 captam não linearidades do modelo
Para testar H: β4=0, β5=0 utiliza-se a distribuição F2,n-k-3.
3322110
ˆˆˆˆ xxxz ββββ +++=
Problema: Má Especificação
• Como escolher entre dois modelos não-aninhados?
• Podemos utilizar o R2-ajustado ou...
1) Estimar as regressões
y= β0 + β1x1 + β2x2 + β3x3 + u
y= β0 + β1ln(x1)+ β2 ln(x2) + β3 ln(x3) + u
28
y= β0 + β1ln(x1)+ β2 ln(x2) + β3 ln(x3) + u
2) Calcula-se o valor predito de y
3) Estima-se a regressão
y= β0 + β1x1 + β2x2 + β3x3 + β4z + v
Idéia: β4 não deve ser significativo se o primeiro modelo é
verdadeiro
( ) ( ) ( )3322110 lnˆlnˆlnˆˆ xxxz ββββ +++=
Problema: Má Especificação
• A rejeição de um modelo não implica que o outro seja
verdadeiro;
• Se vários modelos forem “aceitos”, pode-se utilizar o R2-
ajustado para selecionar entre os modelos;
29
ajustado para selecionar entre os modelos;
• Se vários modelos forem rejeitados, uma análise crítica
mais profunda será necessária. (O que pode estar
interferindo na estimação? Problemas nos dados?
Causalidade simultânea? Outro fator?)