Logo Passei Direto
Buscar
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

Econometria
Aula 12
Marta AreosaMarta Areosa
marta@econ.puc-rio.br
A Distribuição Amostral do Estimador
de MQO
Já vimos que... 
 
 
onde é aproximadamente constante 
(para grandes amostras) e 
( ) VXXT
n
11ˆ −+=ββ
( ) [ ]XXEXX TT
n
≈
1
XuV iii= 48476
2
(para grandes amostras) e 
 
 
 
 
 
 
sendo e [ ]TiiV VVE=Σ
( ) ( )Vnd
TCL
n
i
XuV
iik
ii
i
n
n
i iikn
n
i iin
n
i in
T
n
N
uX
uX
u
uX
uX
u
uXV
iii
Σ












=














== →∑
∑
∑
∑
=
=
=
=
=
1
1
,
,11
1 ,
1
1 ,1
1
1
1
1
,0
48476
MM
[ ]Tikii XXX ,,11 L=
A Distribuição Amostral do Estimador
de MQO
Ou seja: 
 onde 
 
sendo 
 
( )βββ ΣnN 1,~ˆ
[ ] ( )XXQXXEQ T
nXestimado
T
X
1ˆ
= →=
( )( )∑n ))
( ) ( ) 11 −− Σ=Σ XVX QQβ
3
 
 
 
e 
 
Conceitualmente, não há nada de novo! 
Queremos, agora, testar hipóteses... 
[ ] ( )( )
11
ˆ 1
−−
=
−−
=Σ →=Σ ∑=
kn
VV
kn
XuXu
VVE
Tn
i
T
iiii
Vestimado
T
iiV
))
[ ]nnT XuXuV )L) 11=
Inferência: resumo
• Quando temos mais de um regressor, a variância dos 
estimadores de MQO ( ) é expressa como uma matriz 
(matriz de variâncias e covariâncias) 
 
• Para calcular esta matriz, utiliza-se o mesmo procedimento 
βˆ
4
• Para calcular esta matriz, utiliza-se o mesmo procedimento 
usado na regressão simples: expressar uma parte como 
uma (matriz) constante e utilizar o TCL (Teorema Central 
do Limite). 
 
• Para fazer teste de hipótese sobre um único coeficiente: 
procedimento padrão 
Inferência: resumo
• Para fazer teste de hipótese sobre uma combinação linear 
dos coeficientes: procedimento padrão, utilizando também 
as covariâncias. Alternativamente, pode-se redefinir o 
regressores. 
 
• Para fazer teste sobre um conjunto de hipóteses: utilizar a 
5
• Para fazer teste sobre um conjunto de hipóteses: utilizar a 
estatística F 
 
• Sob a hipótese de homocedasticidade: variância mais 
simples. Cuidado: se a hipótese não é válida, a inferência 
não é válida. Solução: utilize a matriz robusta. 
 
Acrescentando uma hipótese
A distribuição foi obtida para grandes amostras. O que fazer se 
este pressuposto não for válido? 
 
A distribuição para pequenas amostras fica MUITO 
complicada. Para simplificar, devemos fazer outra hipótese: 
 
6
 
 
 
Esta hipótese é mais forte que a hipótese de hocedasticidade. 
Agora, impomos uma forma funcional para a distribuição dos 
erros. 
 
Esta hipótese define o Modelo Linear Clássico. 
( )INu u2,0~ σ
Acrescentando uma hipótese
Como explicar esta hipótese? O termo de erro, u, é a soma de muitos 
fatores diferentes não observados que afetam Y. Portanto, pelo TCL, 
ele deveria estar próximo de uma normal. 
 
Esta hipótese é realista? Para muitos casos, NÃO. 
Exemplo: suponha que Y só assuma valores inteiros (1, 2, 3,...) ou 
7
Exemplo: suponha que Y só assuma valores inteiros (1, 2, 3,...) ou 
que Y esteja limitado a um intervalo. 
 
Nesses casos, não é factível supor que a parte não explicada de Y 
tenha distribuição normal. 
 
Mas como fica a inferência sob a hipótese de normalidade dos erros? 
.
Distribuição Normal Homocedástica
y
f(y|x)
8
.
.
x1 x2
E(y|x) = β0 + β1x
Distribuição
Normal
Normalidade dos Estimadores
 
• A normalidade de u implica que a distribuição amostral dos 
estimadores de MQO também será normal: 
 
 
( ))ˆ(,~ˆ jjj VarN βββ
9
 
 
• Que pode ser padronizado, como mostramos antes, para: 
 
 
 
 
 
 
( ))(,~ jjj VarN βββ
)1,0(~)ˆ(dp/)ˆ( Njjj βββ −
Variância
Continua valendo que 
 
Agora, não faz sentido supor que 
 
Porém, já vimos que sob homocedasticidade a variância é 
( ) [ ]XXEXX TT
n
≈
1
( ) 12 −=Σ σ
( ) ( )uXXX T
n
T
n
111ˆ −+=ββ
[ ]=
10
dada por onde 
 
Portanto, 
( ) 1211 −=Σ Xunn Qσβ
( ) ( ) 11 211 21211
1
ˆ1
1
ˆ1
ˆ
ˆ
ˆ
−
=
−
=
−








−−
=













−−
==Σ ∑∑ XX
kn
u
XX
nkn
u
n
Q T
n
i iT
n
i i
Xunn σβ
[ ]XXEQ TX =
Testando Hipóteses para um único
coeficiente
• H0: 
• H1: 
• Que estatística utilizar? 
 
Esta é a estatística mostrada quando se roda uma regressão 
( )j
jj
SE
t β
ββ
ˆ
ˆ
0,−
=
0,
0,
ˆ
ˆ
jj
jj
ββ
ββ
≠
=
11
Esta é a estatística mostrada quando se roda uma regressão 
(calculada pelo software) 
 
• De onde está vindo? 
Da diagonal principal da matriz 
( )jSE βˆ
βΣˆ1n
Testando Hipóteses para um único
coeficiente
• Porém t ~ tn-k-1 (distribuição t de Student com n-k-1 graus de 
liberdade). 
 
 
 
( )
p
pp
t
W
Z
W
NZ
~
~
1,0~
1
⇒



χ
12
 
• Por que isso ocorre? Intuição: 
 
 e 
 
Lembrar: A distribuição t se parece muito com uma normal, mas 
tem caudas mais pesadas. 
( ) 12
2
~1
−−
−− kn
u
uskn χ
σ
( )INu
u
,0~
2σ
Testando Combinações Lineares de 
Parâmetros
 
• Muitas vezes queremos testar hipóteses sobre UMA relação que 
envolva mais de um parâmetro. 
• Exemplo: queremos testar H0: β1=β2 contra H1: β1<β2 
 
13
 
• O que devemos fazer? Como na aula passada, devemos reescrever esta 
relação como uma variável interesse (no exemplo acima, testar H0: β1-
β2=0) e calcular o desvio-padrão desta variável (levando em 
consideração as covariâncias). 
• Alternativamente, podemos redefinir nossa regressão. 
 
• O que muda? A distribuição utilizada: tn-k-1. 
 
Testando Combinações Lineares de 
Parâmetros: Exemplo
• Queremos saber se o retorno salarial de quem se forma na 
graduação é menor de quem faz um mestrado. 
 
Log(salário) = β0 + β1Grad + β2Mest + β3Exper + u 
14
 
• Estatística: 
 
( ) 1~2ˆ1ˆ
2
ˆ
1
ˆ
−−
−
−
= kntEP
t ββ
ββ
( ) 122221 2)]ˆ(EP[)]ˆ(EP[2ˆ1ˆEP s−+=− ββββ
Alternativamente…
• Definimos um novo parâmetro: 
 
θ1 = β1 - β2 
 
• Queremos, então, testar: H0: θ1=0 contra H1: θ1<0 
15
Podemos re-escrever β1 = θ1 + β2 
 
Substituindo na equação original temos que: 
 
Log(salário) = β0 + (θ1 + β2)Grad + β2Mest + β3Exper + u 
 
Log(salário) = β0 + θ1 Grad + β2 (Mest+Grad) + β3Exper + u 
Testes de Hipóteses Conjuntas
• Uma hipótese conjunta especifica o valor para dois ou mais 
coeficientes, ou seja, impõe restrições em dois ou mais 
coeficientes. 
 
• Podemos expressar este conjunto de restrições sobre os 
coeficientes na forma de 
16
coeficientes na forma de 
 
 
 
• Em geral, a hipótese conjunta envolve q restrições. 
 
• Como testar este conjunto de hipóteses? 
 
rR =β
Testes de Hipóteses Conjuntas
 
H0: β1 = 0 e β2 = 0 
vs. H1: β1 ≠ 0 ou β2 ≠ 0 ou ambos 
 
 
• No exemplo acima, temos duas retrições (q = 2): β1 = 0 e β2 = 
17
• No exemplo acima, temos duas retrições (q = 2): β1 = 0 e β2 = 
0. Podemos expressá-las como 
{
{
rR






=


















0
0
0100
0010
3
2
1
0
β
β
β
β
β
44 344 21
Teste F em Amostras Finitas
 
• Na aula passada demos um exemplo do teste F em amostras 
grandes. Agora iremosderivar o teste F em amostras finitas. 
 
• Como calcular a estatística? 
18
 
 
 
 
 
• Que distribuição utilizar? A distribuição Fq,n-k-1. 
( ) ( )[ ] ( )
2
111 ˆˆ
u
TTT
q
s
rRRXXRrR
F
−−
=
−
− ββ
Teste F em Amostras Finitas
 
• Porém podemos calcular esta estatística de outro modo... 
Começaremos com um exemplo que nos ajudará na intuição. 
 
• Temos um modelo para explicar crime nas cidades dado por: 
19
 
Crime_pc= β0 + β1 Policiais_pc + β2 Renda_pc + β3 Educ 
+ β4 Desig + u 
 
• Queremos saber se a escolaridade das pessoas e o nível de 
desigualdade explicam a taxa de criminalidade. (Ou seja, 
queremos testar se β3 = 0 e β4 = 0). 
Teste F com erros homocedásticos
• Quando os erros são homocedásticos, temos uma fórmula 
simples para calcular a estatística F (somente válida para erros 
homocedásticos): 
 
 
 
20
 
 
 
 
 
 
 
 
Teste F com erros homocedásticos
• Quando os erros são homocedásticos, temos uma fórmula 
simples para calcular a estatística F (somente válida para erros 
homocedásticos): 
 
• Estimamos duas regressões, uma baixo a hipótese nula (a 
21
• Estimamos duas regressões, uma baixo a hipótese nula (a 
regressão “restrita”) e outra baixo a hipótese alternativa (a 
regressão “irrestrita”). 
 
 
 
 
 
 
 
Teste F com erros homocedásticos
• Quando os erros são homocedásticos, temos uma fórmula 
simples para calcular a estatística F (somente válida para erros 
homocedásticos): 
 
• Estimamos duas regressões, uma sob a hipótese nula (a 
22
regressão “restrita”) e outra sob a hipótese alternativa (a 
regressão “irrestrita”). 
 
• Comparamos o ajuste das regressões, se o modelo “irrestrito” 
tem um ajuste suficientemente melhor, rejeitamos a hipótese 
nula. Como medimos suficientemente melhor? 
 
 
 
Regressões “restritas” e “irrestritas” 
Examplo: coeficientes de educação e desigualdade são zero? 
 
Regressão populacional irrestrita (sob H1): 
 
Crime_pc= β0 + β1 Policiais_pc + β2 Renda_pc + β3 Educ 
23
Crime_pc= β0 + β1 Policiais_pc + β2 Renda_pc + β3 Educ 
+ β4 Desig + u 
 
Regressão populacional restrita (sob H0): 
 
Crime_pc= β0 + β1 Policiais_pc + β2 Renda_pc + u 
 
Teste F com erros homocedásticos
 
 
 
 
 
)1/(
/)(
1,
−−
−
=
−− knirSQR
qirSQRrSQRF knq
24
• Onde SQRr é a soma dos quadrados dos resíduos no modelo 
restrito e SQRir é a quadrados dos resíduos no modelo irrestrito. 
• q é o número de restrições 
• k é o número de regressores no modelo irrestrito. 
• Estatística mede o aumento relativo em SRQ quando passamos 
do modelo irrestrito para o modelo restrito. 
 
 
Testando a Hipótese com Teste F
• Vamos comparar o valor calculado da estatística F com o valor 
crítico c, levando em consideração os graus de liberdade (q, n-k-1). 
 
• Para valores grandes de F, rejeitamos a hipótese nula. 
 
25
 
• Ou seja, concluímos que os coeficientes são conjuntamente 
significativos ao nível de 5% (por exemplo). 
 
Fórmula com R2
 
 
 
 
 
)1/()1(
/)(
2
22
1,
−−−
−
=
−− knR
qRR
F
ir
rir
knq
26
 
 
 
 
 
 
 
 
 
Fórmula com R2
 
 
 
 
• Por que podemos fazer a tranformação e usar esta fórmula? 
)1/()1(
/)(
2
22
1,
−−−
−
=
−− knR
qRR
F
ir
rir
knq
27
Lembremos que STQ=SRQ+SQE (Soma resíduos total=soma 
resíduos quadráticos + soma quadrática explicada) 
 
 
 
 
 
 
 
Fórmula com R2
 
 
 
 
• Por que podemos fazer a tranformação e usar esta fórmula? 
)1/()1(
/)(
2
22
1,
−−−
−
=
−− knR
qRR
F
ir
rir
knq
28
Lembremos que STQ=SRQ+SQE (Soma resíduos total=soma 
resíduos quadráticos + soma quadrática explicada) 
 
• A fórmula homocedástica de F rejeita quando adicionamos 
variáveis e o R2 aumenta o “suficiente”– ou seja, quando 
adicionamos variáveis e o ajuste da regressão aumenta o 
“suficiente”. 
 
 
Exemplo
Regressão restrita: 
Nota = 644.7 –0.671 Psup, 2
restrictedR = 0.4149 
 (1.0) (0.032) 
 
29
Exemplo
Regressão restrita: 
Nota = 644.7 –0.671 Psup, 2
restrictedR = 0.4149 
 (1.0) (0.032) 
Regressão irrestrita: 
Nota = 649.6 – 0.29Tamanho + 3.87Gastopa – 0.656Psup 
 (15.5) (0.48) (1.59) (0.032) 
30
 (15.5) (0.48) (1.59) (0.032) 
 
2
unrestrictedR = 0.4366, kir = 3, q = 2 
 
 
Exemplo
Regressão restrita: 
Nota = 644.7 –0.671 Psup, 2
restrictedR = 0.4149 
 (1.0) (0.032) 
Regressão irrestrita: 
Nota = 649.6 – 0.29Tamanho + 3.87Gastopa – 0.656Psup 
 (15.5) (0.48) (1.59) (0.032) 
31
 (15.5) (0.48) (1.59) (0.032) 
 
2
unrestrictedR = 0.4366, kir = 3, q = 2 
 
então F = 
2 2
2
( ) /
(1 ) /( 1)
unrestricted restricted
unrestricted unrestricted
R R q
R n k
−
− − −
 
 
Exemplo
Regressão restrita: 
Nota = 644.7 –0.671 Psup, 2restrictedR = 0.4149 
 (1.0) (0.032) 
Regressão irrestrita: 
Nota = 649.6 – 0.29Tamanho + 3.87Gastopa – 0.656Psup 
 (15.5) (0.48) (1.59) (0.032) 
32
 (15.5) (0.48) (1.59) (0.032) 
 
2
unrestrictedR = 0.4366, kir = 3, q = 2 
 
então F = 
2 2
2
( ) /
(1 ) /( 1)
unrestricted restricted
unrestricted unrestricted
R R q
R n k
−
− − −
 
 = 
(.4366 .4149) / 2
(1 .4366) /(420 3 1)
−
− − −
 = 8.01 
Regressão residual
 
• Considere a seguinte regressão: 
 
Yi = β0 + β1X1i + β2X2i +...+βkXki + ui 
 
33
 
• Uma aplicação importante é a regressão residual-- uma forma 
alternativa de obter o coeficiente β1. 
 
Obs: Poderíamos ter escolhido qualquer outro coeficiente 
(bastava, para isso, reordenar os regressores) 
Regressão residual
• Dissemos que β1 corresponde ao efeito de X1 em Y, depois que 
“controlamos” ou “limpamos” os outros efeitos. 
 
• Considere a seguinte regressão: 
 
34
 
X1i = γ0 + γ2X2i +...+ γkXki + ri 
 
• O resíduo desta regressão (r) é a parte de X1 que não é 
correlacionada com os outros regressores ou, dito de outra 
forma, r é X1 depois que os efeitos dos outros regressores 
foram levados em consideração. 
 
Regressão residual : estimando β
1
 
• Podemos recuperar o estimador de β1 fazendo uma regressão 
de Y no resíduo (r): 
 
 ( )
iii
vXXX
vrY 10
... +−−−−+=
++=
γγγαα
αα
35
 
 
 
 
 
Nesse caso: 
 
( )∑
∑
=
=
==
n
i i
n
i ii
r
Yr
1
2
1
11
ˆ
ˆ
ˆ
ˆ αβ
( )
{ {
ik u
kikii
kikii
vXXX
vXXX
1121211100
1220110
...
...
210
+−−−+−=
+−−−−+=
32132143421
ββββ
αγαγααγα
γγγαα
Regressão residual : variância de β
1
Sob a hipótese de homocesdaticidade, sabemos que 
 
 
 
 
 
( ) ( ) ( )211
2
1
2
2
1 1ˆ
ˆ
RSQTr
Var
n
i i
−
==
∑
=
σσβ
36
 
 
onde e correspondem, respectivamente, ao R2 e à 
Soma dos Quadrados Totais da regressão de X1 nos outros 
regressores. 
 
2
1R 1SQT
∑
=
−−
=
n
i
iukn 1
22
ˆ
1
1
σˆ