Prévia do material em texto
Econometria Aula 12 Marta AreosaMarta Areosa marta@econ.puc-rio.br A Distribuição Amostral do Estimador de MQO Já vimos que... onde é aproximadamente constante (para grandes amostras) e ( ) VXXT n 11ˆ −+=ββ ( ) [ ]XXEXX TT n ≈ 1 XuV iii= 48476 2 (para grandes amostras) e sendo e [ ]TiiV VVE=Σ ( ) ( )Vnd TCL n i XuV iik ii i n n i iikn n i iin n i in T n N uX uX u uX uX u uXV iii Σ = == →∑ ∑ ∑ ∑ = = = = = 1 1 , ,11 1 , 1 1 ,1 1 1 1 1 ,0 48476 MM [ ]Tikii XXX ,,11 L= A Distribuição Amostral do Estimador de MQO Ou seja: onde sendo ( )βββ ΣnN 1,~ˆ [ ] ( )XXQXXEQ T nXestimado T X 1ˆ = →= ( )( )∑n )) ( ) ( ) 11 −− Σ=Σ XVX QQβ 3 e Conceitualmente, não há nada de novo! Queremos, agora, testar hipóteses... [ ] ( )( ) 11 ˆ 1 −− = −− =Σ →=Σ ∑= kn VV kn XuXu VVE Tn i T iiii Vestimado T iiV )) [ ]nnT XuXuV )L) 11= Inferência: resumo • Quando temos mais de um regressor, a variância dos estimadores de MQO ( ) é expressa como uma matriz (matriz de variâncias e covariâncias) • Para calcular esta matriz, utiliza-se o mesmo procedimento βˆ 4 • Para calcular esta matriz, utiliza-se o mesmo procedimento usado na regressão simples: expressar uma parte como uma (matriz) constante e utilizar o TCL (Teorema Central do Limite). • Para fazer teste de hipótese sobre um único coeficiente: procedimento padrão Inferência: resumo • Para fazer teste de hipótese sobre uma combinação linear dos coeficientes: procedimento padrão, utilizando também as covariâncias. Alternativamente, pode-se redefinir o regressores. • Para fazer teste sobre um conjunto de hipóteses: utilizar a 5 • Para fazer teste sobre um conjunto de hipóteses: utilizar a estatística F • Sob a hipótese de homocedasticidade: variância mais simples. Cuidado: se a hipótese não é válida, a inferência não é válida. Solução: utilize a matriz robusta. Acrescentando uma hipótese A distribuição foi obtida para grandes amostras. O que fazer se este pressuposto não for válido? A distribuição para pequenas amostras fica MUITO complicada. Para simplificar, devemos fazer outra hipótese: 6 Esta hipótese é mais forte que a hipótese de hocedasticidade. Agora, impomos uma forma funcional para a distribuição dos erros. Esta hipótese define o Modelo Linear Clássico. ( )INu u2,0~ σ Acrescentando uma hipótese Como explicar esta hipótese? O termo de erro, u, é a soma de muitos fatores diferentes não observados que afetam Y. Portanto, pelo TCL, ele deveria estar próximo de uma normal. Esta hipótese é realista? Para muitos casos, NÃO. Exemplo: suponha que Y só assuma valores inteiros (1, 2, 3,...) ou 7 Exemplo: suponha que Y só assuma valores inteiros (1, 2, 3,...) ou que Y esteja limitado a um intervalo. Nesses casos, não é factível supor que a parte não explicada de Y tenha distribuição normal. Mas como fica a inferência sob a hipótese de normalidade dos erros? . Distribuição Normal Homocedástica y f(y|x) 8 . . x1 x2 E(y|x) = β0 + β1x Distribuição Normal Normalidade dos Estimadores • A normalidade de u implica que a distribuição amostral dos estimadores de MQO também será normal: ( ))ˆ(,~ˆ jjj VarN βββ 9 • Que pode ser padronizado, como mostramos antes, para: ( ))(,~ jjj VarN βββ )1,0(~)ˆ(dp/)ˆ( Njjj βββ − Variância Continua valendo que Agora, não faz sentido supor que Porém, já vimos que sob homocedasticidade a variância é ( ) [ ]XXEXX TT n ≈ 1 ( ) 12 −=Σ σ ( ) ( )uXXX T n T n 111ˆ −+=ββ [ ]= 10 dada por onde Portanto, ( ) 1211 −=Σ Xunn Qσβ ( ) ( ) 11 211 21211 1 ˆ1 1 ˆ1 ˆ ˆ ˆ − = − = − −− = −− ==Σ ∑∑ XX kn u XX nkn u n Q T n i iT n i i Xunn σβ [ ]XXEQ TX = Testando Hipóteses para um único coeficiente • H0: • H1: • Que estatística utilizar? Esta é a estatística mostrada quando se roda uma regressão ( )j jj SE t β ββ ˆ ˆ 0,− = 0, 0, ˆ ˆ jj jj ββ ββ ≠ = 11 Esta é a estatística mostrada quando se roda uma regressão (calculada pelo software) • De onde está vindo? Da diagonal principal da matriz ( )jSE βˆ βΣˆ1n Testando Hipóteses para um único coeficiente • Porém t ~ tn-k-1 (distribuição t de Student com n-k-1 graus de liberdade). ( ) p pp t W Z W NZ ~ ~ 1,0~ 1 ⇒ χ 12 • Por que isso ocorre? Intuição: e Lembrar: A distribuição t se parece muito com uma normal, mas tem caudas mais pesadas. ( ) 12 2 ~1 −− −− kn u uskn χ σ ( )INu u ,0~ 2σ Testando Combinações Lineares de Parâmetros • Muitas vezes queremos testar hipóteses sobre UMA relação que envolva mais de um parâmetro. • Exemplo: queremos testar H0: β1=β2 contra H1: β1<β2 13 • O que devemos fazer? Como na aula passada, devemos reescrever esta relação como uma variável interesse (no exemplo acima, testar H0: β1- β2=0) e calcular o desvio-padrão desta variável (levando em consideração as covariâncias). • Alternativamente, podemos redefinir nossa regressão. • O que muda? A distribuição utilizada: tn-k-1. Testando Combinações Lineares de Parâmetros: Exemplo • Queremos saber se o retorno salarial de quem se forma na graduação é menor de quem faz um mestrado. Log(salário) = β0 + β1Grad + β2Mest + β3Exper + u 14 • Estatística: ( ) 1~2ˆ1ˆ 2 ˆ 1 ˆ −− − − = kntEP t ββ ββ ( ) 122221 2)]ˆ(EP[)]ˆ(EP[2ˆ1ˆEP s−+=− ββββ Alternativamente… • Definimos um novo parâmetro: θ1 = β1 - β2 • Queremos, então, testar: H0: θ1=0 contra H1: θ1<0 15 Podemos re-escrever β1 = θ1 + β2 Substituindo na equação original temos que: Log(salário) = β0 + (θ1 + β2)Grad + β2Mest + β3Exper + u Log(salário) = β0 + θ1 Grad + β2 (Mest+Grad) + β3Exper + u Testes de Hipóteses Conjuntas • Uma hipótese conjunta especifica o valor para dois ou mais coeficientes, ou seja, impõe restrições em dois ou mais coeficientes. • Podemos expressar este conjunto de restrições sobre os coeficientes na forma de 16 coeficientes na forma de • Em geral, a hipótese conjunta envolve q restrições. • Como testar este conjunto de hipóteses? rR =β Testes de Hipóteses Conjuntas H0: β1 = 0 e β2 = 0 vs. H1: β1 ≠ 0 ou β2 ≠ 0 ou ambos • No exemplo acima, temos duas retrições (q = 2): β1 = 0 e β2 = 17 • No exemplo acima, temos duas retrições (q = 2): β1 = 0 e β2 = 0. Podemos expressá-las como { { rR = 0 0 0100 0010 3 2 1 0 β β β β β 44 344 21 Teste F em Amostras Finitas • Na aula passada demos um exemplo do teste F em amostras grandes. Agora iremosderivar o teste F em amostras finitas. • Como calcular a estatística? 18 • Que distribuição utilizar? A distribuição Fq,n-k-1. ( ) ( )[ ] ( ) 2 111 ˆˆ u TTT q s rRRXXRrR F −− = − − ββ Teste F em Amostras Finitas • Porém podemos calcular esta estatística de outro modo... Começaremos com um exemplo que nos ajudará na intuição. • Temos um modelo para explicar crime nas cidades dado por: 19 Crime_pc= β0 + β1 Policiais_pc + β2 Renda_pc + β3 Educ + β4 Desig + u • Queremos saber se a escolaridade das pessoas e o nível de desigualdade explicam a taxa de criminalidade. (Ou seja, queremos testar se β3 = 0 e β4 = 0). Teste F com erros homocedásticos • Quando os erros são homocedásticos, temos uma fórmula simples para calcular a estatística F (somente válida para erros homocedásticos): 20 Teste F com erros homocedásticos • Quando os erros são homocedásticos, temos uma fórmula simples para calcular a estatística F (somente válida para erros homocedásticos): • Estimamos duas regressões, uma baixo a hipótese nula (a 21 • Estimamos duas regressões, uma baixo a hipótese nula (a regressão “restrita”) e outra baixo a hipótese alternativa (a regressão “irrestrita”). Teste F com erros homocedásticos • Quando os erros são homocedásticos, temos uma fórmula simples para calcular a estatística F (somente válida para erros homocedásticos): • Estimamos duas regressões, uma sob a hipótese nula (a 22 regressão “restrita”) e outra sob a hipótese alternativa (a regressão “irrestrita”). • Comparamos o ajuste das regressões, se o modelo “irrestrito” tem um ajuste suficientemente melhor, rejeitamos a hipótese nula. Como medimos suficientemente melhor? Regressões “restritas” e “irrestritas” Examplo: coeficientes de educação e desigualdade são zero? Regressão populacional irrestrita (sob H1): Crime_pc= β0 + β1 Policiais_pc + β2 Renda_pc + β3 Educ 23 Crime_pc= β0 + β1 Policiais_pc + β2 Renda_pc + β3 Educ + β4 Desig + u Regressão populacional restrita (sob H0): Crime_pc= β0 + β1 Policiais_pc + β2 Renda_pc + u Teste F com erros homocedásticos )1/( /)( 1, −− − = −− knirSQR qirSQRrSQRF knq 24 • Onde SQRr é a soma dos quadrados dos resíduos no modelo restrito e SQRir é a quadrados dos resíduos no modelo irrestrito. • q é o número de restrições • k é o número de regressores no modelo irrestrito. • Estatística mede o aumento relativo em SRQ quando passamos do modelo irrestrito para o modelo restrito. Testando a Hipótese com Teste F • Vamos comparar o valor calculado da estatística F com o valor crítico c, levando em consideração os graus de liberdade (q, n-k-1). • Para valores grandes de F, rejeitamos a hipótese nula. 25 • Ou seja, concluímos que os coeficientes são conjuntamente significativos ao nível de 5% (por exemplo). Fórmula com R2 )1/()1( /)( 2 22 1, −−− − = −− knR qRR F ir rir knq 26 Fórmula com R2 • Por que podemos fazer a tranformação e usar esta fórmula? )1/()1( /)( 2 22 1, −−− − = −− knR qRR F ir rir knq 27 Lembremos que STQ=SRQ+SQE (Soma resíduos total=soma resíduos quadráticos + soma quadrática explicada) Fórmula com R2 • Por que podemos fazer a tranformação e usar esta fórmula? )1/()1( /)( 2 22 1, −−− − = −− knR qRR F ir rir knq 28 Lembremos que STQ=SRQ+SQE (Soma resíduos total=soma resíduos quadráticos + soma quadrática explicada) • A fórmula homocedástica de F rejeita quando adicionamos variáveis e o R2 aumenta o “suficiente”– ou seja, quando adicionamos variáveis e o ajuste da regressão aumenta o “suficiente”. Exemplo Regressão restrita: Nota = 644.7 –0.671 Psup, 2 restrictedR = 0.4149 (1.0) (0.032) 29 Exemplo Regressão restrita: Nota = 644.7 –0.671 Psup, 2 restrictedR = 0.4149 (1.0) (0.032) Regressão irrestrita: Nota = 649.6 – 0.29Tamanho + 3.87Gastopa – 0.656Psup (15.5) (0.48) (1.59) (0.032) 30 (15.5) (0.48) (1.59) (0.032) 2 unrestrictedR = 0.4366, kir = 3, q = 2 Exemplo Regressão restrita: Nota = 644.7 –0.671 Psup, 2 restrictedR = 0.4149 (1.0) (0.032) Regressão irrestrita: Nota = 649.6 – 0.29Tamanho + 3.87Gastopa – 0.656Psup (15.5) (0.48) (1.59) (0.032) 31 (15.5) (0.48) (1.59) (0.032) 2 unrestrictedR = 0.4366, kir = 3, q = 2 então F = 2 2 2 ( ) / (1 ) /( 1) unrestricted restricted unrestricted unrestricted R R q R n k − − − − Exemplo Regressão restrita: Nota = 644.7 –0.671 Psup, 2restrictedR = 0.4149 (1.0) (0.032) Regressão irrestrita: Nota = 649.6 – 0.29Tamanho + 3.87Gastopa – 0.656Psup (15.5) (0.48) (1.59) (0.032) 32 (15.5) (0.48) (1.59) (0.032) 2 unrestrictedR = 0.4366, kir = 3, q = 2 então F = 2 2 2 ( ) / (1 ) /( 1) unrestricted restricted unrestricted unrestricted R R q R n k − − − − = (.4366 .4149) / 2 (1 .4366) /(420 3 1) − − − − = 8.01 Regressão residual • Considere a seguinte regressão: Yi = β0 + β1X1i + β2X2i +...+βkXki + ui 33 • Uma aplicação importante é a regressão residual-- uma forma alternativa de obter o coeficiente β1. Obs: Poderíamos ter escolhido qualquer outro coeficiente (bastava, para isso, reordenar os regressores) Regressão residual • Dissemos que β1 corresponde ao efeito de X1 em Y, depois que “controlamos” ou “limpamos” os outros efeitos. • Considere a seguinte regressão: 34 X1i = γ0 + γ2X2i +...+ γkXki + ri • O resíduo desta regressão (r) é a parte de X1 que não é correlacionada com os outros regressores ou, dito de outra forma, r é X1 depois que os efeitos dos outros regressores foram levados em consideração. Regressão residual : estimando β 1 • Podemos recuperar o estimador de β1 fazendo uma regressão de Y no resíduo (r): ( ) iii vXXX vrY 10 ... +−−−−+= ++= γγγαα αα 35 Nesse caso: ( )∑ ∑ = = == n i i n i ii r Yr 1 2 1 11 ˆ ˆ ˆ ˆ αβ ( ) { { ik u kikii kikii vXXX vXXX 1121211100 1220110 ... ... 210 +−−−+−= +−−−−+= 32132143421 ββββ αγαγααγα γγγαα Regressão residual : variância de β 1 Sob a hipótese de homocesdaticidade, sabemos que ( ) ( ) ( )211 2 1 2 2 1 1ˆ ˆ RSQTr Var n i i − == ∑ = σσβ 36 onde e correspondem, respectivamente, ao R2 e à Soma dos Quadrados Totais da regressão de X1 nos outros regressores. 2 1R 1SQT ∑ = −− = n i iukn 1 22 ˆ 1 1 σˆ