Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Econometria Aula 20 Marta AreosaMarta Areosa marta@econ.puc-rio.br Problema: Identificação • Quando temos um sistema de equações em que as variáveis estão relacionadas, dizemos que temos um modelo de equações simultâneas (MES). • Nesse caso, nem sempre conseguimos estimar corretamente 2 • Nesse caso, nem sempre conseguimos estimar corretamente todos os coeficientes das equações. • Dizemos que ocorre um problema de identificação. Problema: Identificação • Seja o seguinte sistema • Econometricamente, temos apenas uma equação... iii iii vyy uyy ++= ++= 1102 2101 γγ ββ 3 • Econometricamente, temos apenas uma equação... • Não há motivo para obtermos { { 321 iw iii iii vyy uyy 1 2 11 0 1 2101 11 10 γγγ γ ββ αα −+−= ++= ii wue ˆˆˆ ˆ;ˆˆ 1100 ≠≠≠ αβαβ Problema: Identificação • Precisamos de variáveis que sejam determinadas fora do sistema para nos ajudar a identificar cada curva separadamente. • Considere o sistema iii uyy ++= 2101 ββ 4 • Nesse caso iiii iii vxyy uyy +++= ++= 21102 2101 γγγ ββ ( ) ( ) ( )iiii iiiii vuxy vxuyy +++++= +++++= 12211010 2210102 γγβγβγγ γββγγ Problema: Identificação • Ou seja 434214342143421 iw ii ii vu xy − + + − + − + = 11 1 11 2 11 010 2 111 10 βγ γ βγ γ βγ βγγ αα 5 • Chamamos esta equação de forma reduzida. • Se tivermos , ou seja , poderemos utilizar x como instrumento. • Obtendo , podemos estimar ( ) 0,cov =ii wx ( ) 0,cov =ii ux iy2ˆ iii uyy ++= 2101 ˆββ Problema: Identificação • Vimos que podemos obter os parâmetros de uma das equações utilizando variáveis instrumentais. E quanto a outra equação? • Parece que podemos fazer a mesma coisa obtendo 6 • Parece que podemos fazer a mesma coisa obtendo • Mas, intuitivamente, o procedimento parece estranho. Estamos identificando deslocamentos em y1 através de x, que é uma variável que desloca a curva de y2! 01 1 01 21 01 010 1 111 γβ β γβ γβ γβ γββ − + + − + − + = ii ii uv xy Problema: Identificação • De fato, este procedimento não pode ser feito... Se tentássemos estimar não iríamos conseguir. Existe colinearidade perfeita entre iiii vxyy +++= 21102 ˆ γγγ 7 não iríamos conseguir. Existe colinearidade perfeita entre os regressores! • Dizemos que esta equação não é identificada. Problema: Identificação • Seja o seguinte sistema • Podemos estimar a forma reduzida deste sistema como iiii iiii vxyy uxyy +++= +++= 221102 122101 γγγ βββ 8 • Podemos estimar a forma reduzida deste sistema como • Para ter sentido, a matriz acima deve ser inversível. + + − = − i i i i i i v u x x y y 2 1 2 2 0 0 1 1 1 2 1 0 0 1 1 γ β γ β γ β Problema: Identificação • Devemos ter os erros não-correlacionados com os regressores para estimar as formas reduzidas sem viés +++= +++= 221102 221101 ααα pipipi iiii iiii exxy wxxy 9 onde − = − = − = +++= − −− 2 2 1 1 1 11 21 1 1 1 0 0 1 1 1 0 0 221102 0 0 1 1 1 1 ; 1 1 γ β γ β αα pipi γ β γ β γ β α pi ααα i i i i iiii v u e w exxy Problema: Identificação • Não podermos ter multicolinearidade perfeita entre para estimarmos ii ii xey xey 22 11 ˆ ˆ iiii vxyy uxyy +++= +++= 122101 ˆ ˆ γγγ βββ 10 • Como, o caso em questão, esta condição nos diz que iii iii xxy xxy 221102 221101 ˆˆˆˆ ˆˆˆˆ ααα pipipi ++= ++= iiii vxyy +++= 221102 ˆ γγγ ( ) { }1,1,0ˆ;0ˆ 2112 −∉≠≠ xxcorreleαpi Problema: Identificação • Caso geral: [ ] [ ] [ ] T niii T niii ii uuUyyY UDYCXBY ;; 11 LL == +++= 11 • A forma reduzida se torna [ ] nxnnxknxnxnTkii DCBAxxX ;;;; 11 L= )(;111 DIAUACXABAY ii −=++= −−− Problema: Identificação • Para haver identificação nas equações: o A matriz A deve ser inversível. o Para estimarmos as formas reduzidas sem viés, U não pode ser correlacionado com X; o Não pode haver multicolinearidade perfeita entre 12 o Não pode haver multicolinearidade perfeita entre para estimarmos ii UYDCXBY +++= ˆ CXeCXDABDAYD i 11 ˆ −− += Problema: Erro de Medida • Vamos supor que algumas variáveis são obtidas com erro. Devemos coniderar dois casos: o O erro ocorre na variável dependente e o O erro ocorre em um regressor. 13 • No primeiro caso, o parâmetro de interesse (y*) tem erro. Ou seja, gostaríamos de regredir O que corresponde a ter iii eyy += * ( )iiii euxy +++= 110 γγ iii uxy ++= 110 * γγ Problema: Erro de Medida • Se ei não é correlacionado com xi, temos que os estimadores de MQO são não-viesados e consistentes. • O único problema é que 14 • Portanto, os estimadores de MQO terão variâncias maiores. • Se ei é correlacionado com xi, temos que os estimadores de MQO serão viesados e inconsistentes. )var()var()var()var( iiiii ueueu >+=+ Problema: Erro de Medida • No segundo caso, o regressor de interesse (x*) tem erro • Ou seja iii exx += * ( ) iii uxy * 10 ββ ++= 15 • Se ei for não-correlacionado com ui, teremos • Mas os estimadores serão viesados? Serão consistentes? ( )iii eux 110 βββ −++= )var()var()var()var( 211 iiiii ueueu >+=− ββ Problema: Erro de Medida • Escrevendo temos que * iii xxe −= ( ) ( ) ( ) ( ) ( ) * ,cov,covvar0 iiiiii xxeeee −==< 16 • Além das hipóteses e , vamos considerar dois casos: o o ( ) ( )*,cov,cov iiii xexe −= ( ) ( ) ( ) 0,covvar,cov * == iiiii xeeexe ( ) ( ) ( )iiiii exeexe var,cov0,cov * −== ( ) 0,cov * =ii xu ( ) 0,cov =ii eu Problema: Erro de Medida • Sob a hipótese tem-se ),cov(),cov(),cov( * 11 iiiiiii exuxeux β ββ −+= −=− ( ) ( ) ( ) 0,covvar,cov * == iiiii xeeexe 17 • Ou seja, os estimadores são viesados e inconsistentes! ( ) )var( ),cov(),cov(),cov( 1 var 1 00 * i e iiiiii e exueux i β β −= −+= === 434214342143421 Problema: Erro de Medida • Sob esta hipótese, • Definindo , temos ( ) 43421 0 ** ,cov2)var()var()var( = ++= iiiii exexx ( ) ( ) ( ) ( ) ii pn n i iin x wx xx wxx var ,cov ˆ 121 1 1 11 +→ − − += ∑ ∑ = βββ iii euw 1β−= 18 • Ou seja, • Temos um viés (assintótico) de atenuação. • Num modelo com k regressores, esta expressão é muito mais complexa... ( ) ( )ipni in xxx var11 2111 −∑ = ( ) ( ) 444 3444 21 1,0 * * 1*111 )var()var( )var( )var()var( )var( ˆlim ∈ + = + −= ii i ii i ex x ex ep ββββ Problema: Erro de Medida • Sob a hipótese tem-se ),cov(),cov(),cov( 11 −=− iiiiiii exuxeux γγ ( ) ( ) 0,cov0,cov * <= iiii xeexe 19 • Ou seja, os estimadores são não viesados e consistentes! 0 ),cov(),cov(),cov( 0 1 00 * = −+= === 434214342143421 iiiiii exueux γ Problema: Variáveis não-observáveis • Algumas variáveis não são passíveis de serem medidas. Dizemos que elas são não-observáveis. Ex: Aptidão de uma pessoa, comprometimento com o trabalho, etc. • Nesse caso utilizamos uma variável “proxy”. Isto é 20 • Nesse caso utilizamos uma variável “proxy”. Isto é olhamos para uma variável observável que se relacione com a variável desejada. • Ou seja gostaríamos de estimar mas, observamos ivxx ++= 310 * 3 δδ iiiii uxxxy ++++= * 3322110 ββββ Problema: Variáveis não-observáveis • Ou seja, estamos estimando • Se ( ) { { { ( )133132211030 * 3322110 3210 vuxxx uxxxy iii iiii βδβββδββ ββββ γγγγ ++++++= ++++= 43421 21 • Se o vi não for correlacionado com x1i ou x2i, o ui não for correlacionado com x3i teremos que Os estimadores e serão viesados e inconsistentes. ( ) 1330300 2211 ; ;; δβγδββγ βγβγ =+= == 30 ˆˆ γγ Problema: Variáveis não-observáveis • Se vi for correlacionado com x1i ou x2i teremos que Nesse caso, todos os estimadores serão viesados e ivxxxx ++++= 3322110 * 3 δδδδ 22 Nesse caso, todos os estimadores serão viesados e inconsistentes. ( ) ( ) ( ) ( )13313 22321131030 * 3322110 vux xx uxxxy ii ii iiii βδβ δββδββδββ ββββ +++ +++++= ++++= Problema: Má Especificação • Ocorre quando o modelo especificado não explica de modo apropriado a relação da variável dependente com as variáveis explicativas • Isso pode ocorrer quando: 23 • Isso pode ocorrer quando: o Omitimos variáveis; o Não consideramos a forma funcional correta; � As variáveis estão em nível, quando deveriam estar em log; � As relações entre variáveis não são consideradas Problema: Má Especificação • Variáveis omitidas: O modelo verdadeiro é y= β0 + β1x1 + β2x2 + β3x3 + u 24 y= β0 + β1x1 + β2x2 + β3x3 + u e estimamos y= β0 + β1x1 + β2x2 +v Ou seja: v= β3x3 + u Problema: Má Especificação Se β3≠0 e cov(v, β1x1 + β2x2) ≠0, teremos E[v |X] ≠0 Consequência: os estimadores serão viesados 25 Se x3 = (x2)2 a situação é pior, pois, ainda que.β2 fosse não- viesado, não seria possível estimar o efeito de x2 em y, dado por β2 + 2β3 Se x3 = x1x2 (ou outra forma de relação entre as variáveis), os coeficientes, além de viesados, não terão a interpretação correta Problema: Má Especificação • Forma funcional incorreta: Com a ajuda do teste F, é podemos especificar um modelo que englobe várias possíveis especificações para obter qual é a correta 26 é a correta y= β0 + β1x1 + β2x2 + β3x3 + β4ln(x1)+ β5ln(x2) + β6ln(x3) + β7(x1)2+ β8(x2)2 + β9(x3)2 + u Dificuldade: Os graus de liberdade aumentam muito e, portanto, esta abordagem requer um grande número de observações Problema: Má Especificação • Como detectar a má especifição? • Utilizando o teste de RESET 1) Estima-se a regressão y= β0 + β1x1 + β2x2 + β3x3 + u 2) Calcula-se o valor predito de y 27 2) Calcula-se o valor predito de y 3) Estima-se a regressão y= β0 + β1x1 + β2x2 + β3x3 + β4z2 + β5 z3 + v Idéia: os termos z2 e z3 captam não linearidades do modelo Para testar H: β4=0, β5=0 utiliza-se a distribuição F2,n-k-3. 3322110 ˆˆˆˆ xxxz ββββ +++= Problema: Má Especificação • Como escolher entre dois modelos não-aninhados? • Podemos utilizar o R2-ajustado ou... 1) Estimar as regressões y= β0 + β1x1 + β2x2 + β3x3 + u y= β0 + β1ln(x1)+ β2 ln(x2) + β3 ln(x3) + u 28 y= β0 + β1ln(x1)+ β2 ln(x2) + β3 ln(x3) + u 2) Calcula-se o valor predito de y 3) Estima-se a regressão y= β0 + β1x1 + β2x2 + β3x3 + β4z + v Idéia: β4 não deve ser significativo se o primeiro modelo é verdadeiro ( ) ( ) ( )3322110 lnˆlnˆlnˆˆ xxxz ββββ +++= Problema: Má Especificação • A rejeição de um modelo não implica que o outro seja verdadeiro; • Se vários modelos forem “aceitos”, pode-se utilizar o R2- ajustado para selecionar entre os modelos; 29 ajustado para selecionar entre os modelos; • Se vários modelos forem rejeitados, uma análise crítica mais profunda será necessária. (O que pode estar interferindo na estimação? Problemas nos dados? Causalidade simultânea? Outro fator?)