Prévia do material em texto
Econometria
Aula 12
Marta AreosaMarta Areosa
marta@econ.puc-rio.br
A Distribuição Amostral do Estimador
de MQO
Já vimos que...
onde é aproximadamente constante
(para grandes amostras) e
( ) VXXT
n
11ˆ −+=ββ
( ) [ ]XXEXX TT
n
≈
1
XuV iii= 48476
2
(para grandes amostras) e
sendo e [ ]TiiV VVE=Σ
( ) ( )Vnd
TCL
n
i
XuV
iik
ii
i
n
n
i iikn
n
i iin
n
i in
T
n
N
uX
uX
u
uX
uX
u
uXV
iii
Σ
=
== →∑
∑
∑
∑
=
=
=
=
=
1
1
,
,11
1 ,
1
1 ,1
1
1
1
1
,0
48476
MM
[ ]Tikii XXX ,,11 L=
A Distribuição Amostral do Estimador
de MQO
Ou seja:
onde
sendo
( )βββ ΣnN 1,~ˆ
[ ] ( )XXQXXEQ T
nXestimado
T
X
1ˆ
= →=
( )( )∑n ))
( ) ( ) 11 −− Σ=Σ XVX QQβ
3
e
Conceitualmente, não há nada de novo!
Queremos, agora, testar hipóteses...
[ ] ( )( )
11
ˆ 1
−−
=
−−
=Σ →=Σ ∑=
kn
VV
kn
XuXu
VVE
Tn
i
T
iiii
Vestimado
T
iiV
))
[ ]nnT XuXuV )L) 11=
Inferência: resumo
• Quando temos mais de um regressor, a variância dos
estimadores de MQO ( ) é expressa como uma matriz
(matriz de variâncias e covariâncias)
• Para calcular esta matriz, utiliza-se o mesmo procedimento
βˆ
4
• Para calcular esta matriz, utiliza-se o mesmo procedimento
usado na regressão simples: expressar uma parte como
uma (matriz) constante e utilizar o TCL (Teorema Central
do Limite).
• Para fazer teste de hipótese sobre um único coeficiente:
procedimento padrão
Inferência: resumo
• Para fazer teste de hipótese sobre uma combinação linear
dos coeficientes: procedimento padrão, utilizando também
as covariâncias. Alternativamente, pode-se redefinir o
regressores.
• Para fazer teste sobre um conjunto de hipóteses: utilizar a
5
• Para fazer teste sobre um conjunto de hipóteses: utilizar a
estatística F
• Sob a hipótese de homocedasticidade: variância mais
simples. Cuidado: se a hipótese não é válida, a inferência
não é válida. Solução: utilize a matriz robusta.
Acrescentando uma hipótese
A distribuição foi obtida para grandes amostras. O que fazer se
este pressuposto não for válido?
A distribuição para pequenas amostras fica MUITO
complicada. Para simplificar, devemos fazer outra hipótese:
6
Esta hipótese é mais forte que a hipótese de hocedasticidade.
Agora, impomos uma forma funcional para a distribuição dos
erros.
Esta hipótese define o Modelo Linear Clássico.
( )INu u2,0~ σ
Acrescentando uma hipótese
Como explicar esta hipótese? O termo de erro, u, é a soma de muitos
fatores diferentes não observados que afetam Y. Portanto, pelo TCL,
ele deveria estar próximo de uma normal.
Esta hipótese é realista? Para muitos casos, NÃO.
Exemplo: suponha que Y só assuma valores inteiros (1, 2, 3,...) ou
7
Exemplo: suponha que Y só assuma valores inteiros (1, 2, 3,...) ou
que Y esteja limitado a um intervalo.
Nesses casos, não é factível supor que a parte não explicada de Y
tenha distribuição normal.
Mas como fica a inferência sob a hipótese de normalidade dos erros?
.
Distribuição Normal Homocedástica
y
f(y|x)
8
.
.
x1 x2
E(y|x) = β0 + β1x
Distribuição
Normal
Normalidade dos Estimadores
• A normalidade de u implica que a distribuição amostral dos
estimadores de MQO também será normal:
( ))ˆ(,~ˆ jjj VarN βββ
9
• Que pode ser padronizado, como mostramos antes, para:
( ))(,~ jjj VarN βββ
)1,0(~)ˆ(dp/)ˆ( Njjj βββ −
Variância
Continua valendo que
Agora, não faz sentido supor que
Porém, já vimos que sob homocedasticidade a variância é
( ) [ ]XXEXX TT
n
≈
1
( ) 12 −=Σ σ
( ) ( )uXXX T
n
T
n
111ˆ −+=ββ
[ ]=
10
dada por onde
Portanto,
( ) 1211 −=Σ Xunn Qσβ
( ) ( ) 11 211 21211
1
ˆ1
1
ˆ1
ˆ
ˆ
ˆ
−
=
−
=
−
−−
=
−−
==Σ ∑∑ XX
kn
u
XX
nkn
u
n
Q T
n
i iT
n
i i
Xunn σβ
[ ]XXEQ TX =
Testando Hipóteses para um único
coeficiente
• H0:
• H1:
• Que estatística utilizar?
Esta é a estatística mostrada quando se roda uma regressão
( )j
jj
SE
t β
ββ
ˆ
ˆ
0,−
=
0,
0,
ˆ
ˆ
jj
jj
ββ
ββ
≠
=
11
Esta é a estatística mostrada quando se roda uma regressão
(calculada pelo software)
• De onde está vindo?
Da diagonal principal da matriz
( )jSE βˆ
βΣˆ1n
Testando Hipóteses para um único
coeficiente
• Porém t ~ tn-k-1 (distribuição t de Student com n-k-1 graus de
liberdade).
( )
p
pp
t
W
Z
W
NZ
~
~
1,0~
1
⇒
χ
12
• Por que isso ocorre? Intuição:
e
Lembrar: A distribuição t se parece muito com uma normal, mas
tem caudas mais pesadas.
( ) 12
2
~1
−−
−− kn
u
uskn χ
σ
( )INu
u
,0~
2σ
Testando Combinações Lineares de
Parâmetros
• Muitas vezes queremos testar hipóteses sobre UMA relação que
envolva mais de um parâmetro.
• Exemplo: queremos testar H0: β1=β2 contra H1: β1<β2
13
• O que devemos fazer? Como na aula passada, devemos reescrever esta
relação como uma variável interesse (no exemplo acima, testar H0: β1-
β2=0) e calcular o desvio-padrão desta variável (levando em
consideração as covariâncias).
• Alternativamente, podemos redefinir nossa regressão.
• O que muda? A distribuição utilizada: tn-k-1.
Testando Combinações Lineares de
Parâmetros: Exemplo
• Queremos saber se o retorno salarial de quem se forma na
graduação é menor de quem faz um mestrado.
Log(salário) = β0 + β1Grad + β2Mest + β3Exper + u
14
• Estatística:
( ) 1~2ˆ1ˆ
2
ˆ
1
ˆ
−−
−
−
= kntEP
t ββ
ββ
( ) 122221 2)]ˆ(EP[)]ˆ(EP[2ˆ1ˆEP s−+=− ββββ
Alternativamente…
• Definimos um novo parâmetro:
θ1 = β1 - β2
• Queremos, então, testar: H0: θ1=0 contra H1: θ1<0
15
Podemos re-escrever β1 = θ1 + β2
Substituindo na equação original temos que:
Log(salário) = β0 + (θ1 + β2)Grad + β2Mest + β3Exper + u
Log(salário) = β0 + θ1 Grad + β2 (Mest+Grad) + β3Exper + u
Testes de Hipóteses Conjuntas
• Uma hipótese conjunta especifica o valor para dois ou mais
coeficientes, ou seja, impõe restrições em dois ou mais
coeficientes.
• Podemos expressar este conjunto de restrições sobre os
coeficientes na forma de
16
coeficientes na forma de
• Em geral, a hipótese conjunta envolve q restrições.
• Como testar este conjunto de hipóteses?
rR =β
Testes de Hipóteses Conjuntas
H0: β1 = 0 e β2 = 0
vs. H1: β1 ≠ 0 ou β2 ≠ 0 ou ambos
• No exemplo acima, temos duas retrições (q = 2): β1 = 0 e β2 =
17
• No exemplo acima, temos duas retrições (q = 2): β1 = 0 e β2 =
0. Podemos expressá-las como
{
{
rR
=
0
0
0100
0010
3
2
1
0
β
β
β
β
β
44 344 21
Teste F em Amostras Finitas
• Na aula passada demos um exemplo do teste F em amostras
grandes. Agora iremosderivar o teste F em amostras finitas.
• Como calcular a estatística?
18
• Que distribuição utilizar? A distribuição Fq,n-k-1.
( ) ( )[ ] ( )
2
111 ˆˆ
u
TTT
q
s
rRRXXRrR
F
−−
=
−
− ββ
Teste F em Amostras Finitas
• Porém podemos calcular esta estatística de outro modo...
Começaremos com um exemplo que nos ajudará na intuição.
• Temos um modelo para explicar crime nas cidades dado por:
19
Crime_pc= β0 + β1 Policiais_pc + β2 Renda_pc + β3 Educ
+ β4 Desig + u
• Queremos saber se a escolaridade das pessoas e o nível de
desigualdade explicam a taxa de criminalidade. (Ou seja,
queremos testar se β3 = 0 e β4 = 0).
Teste F com erros homocedásticos
• Quando os erros são homocedásticos, temos uma fórmula
simples para calcular a estatística F (somente válida para erros
homocedásticos):
20
Teste F com erros homocedásticos
• Quando os erros são homocedásticos, temos uma fórmula
simples para calcular a estatística F (somente válida para erros
homocedásticos):
• Estimamos duas regressões, uma baixo a hipótese nula (a
21
• Estimamos duas regressões, uma baixo a hipótese nula (a
regressão “restrita”) e outra baixo a hipótese alternativa (a
regressão “irrestrita”).
Teste F com erros homocedásticos
• Quando os erros são homocedásticos, temos uma fórmula
simples para calcular a estatística F (somente válida para erros
homocedásticos):
• Estimamos duas regressões, uma sob a hipótese nula (a
22
regressão “restrita”) e outra sob a hipótese alternativa (a
regressão “irrestrita”).
• Comparamos o ajuste das regressões, se o modelo “irrestrito”
tem um ajuste suficientemente melhor, rejeitamos a hipótese
nula. Como medimos suficientemente melhor?
Regressões “restritas” e “irrestritas”
Examplo: coeficientes de educação e desigualdade são zero?
Regressão populacional irrestrita (sob H1):
Crime_pc= β0 + β1 Policiais_pc + β2 Renda_pc + β3 Educ
23
Crime_pc= β0 + β1 Policiais_pc + β2 Renda_pc + β3 Educ
+ β4 Desig + u
Regressão populacional restrita (sob H0):
Crime_pc= β0 + β1 Policiais_pc + β2 Renda_pc + u
Teste F com erros homocedásticos
)1/(
/)(
1,
−−
−
=
−− knirSQR
qirSQRrSQRF knq
24
• Onde SQRr é a soma dos quadrados dos resíduos no modelo
restrito e SQRir é a quadrados dos resíduos no modelo irrestrito.
• q é o número de restrições
• k é o número de regressores no modelo irrestrito.
• Estatística mede o aumento relativo em SRQ quando passamos
do modelo irrestrito para o modelo restrito.
Testando a Hipótese com Teste F
• Vamos comparar o valor calculado da estatística F com o valor
crítico c, levando em consideração os graus de liberdade (q, n-k-1).
• Para valores grandes de F, rejeitamos a hipótese nula.
25
• Ou seja, concluímos que os coeficientes são conjuntamente
significativos ao nível de 5% (por exemplo).
Fórmula com R2
)1/()1(
/)(
2
22
1,
−−−
−
=
−− knR
qRR
F
ir
rir
knq
26
Fórmula com R2
• Por que podemos fazer a tranformação e usar esta fórmula?
)1/()1(
/)(
2
22
1,
−−−
−
=
−− knR
qRR
F
ir
rir
knq
27
Lembremos que STQ=SRQ+SQE (Soma resíduos total=soma
resíduos quadráticos + soma quadrática explicada)
Fórmula com R2
• Por que podemos fazer a tranformação e usar esta fórmula?
)1/()1(
/)(
2
22
1,
−−−
−
=
−− knR
qRR
F
ir
rir
knq
28
Lembremos que STQ=SRQ+SQE (Soma resíduos total=soma
resíduos quadráticos + soma quadrática explicada)
• A fórmula homocedástica de F rejeita quando adicionamos
variáveis e o R2 aumenta o “suficiente”– ou seja, quando
adicionamos variáveis e o ajuste da regressão aumenta o
“suficiente”.
Exemplo
Regressão restrita:
Nota = 644.7 –0.671 Psup, 2
restrictedR = 0.4149
(1.0) (0.032)
29
Exemplo
Regressão restrita:
Nota = 644.7 –0.671 Psup, 2
restrictedR = 0.4149
(1.0) (0.032)
Regressão irrestrita:
Nota = 649.6 – 0.29Tamanho + 3.87Gastopa – 0.656Psup
(15.5) (0.48) (1.59) (0.032)
30
(15.5) (0.48) (1.59) (0.032)
2
unrestrictedR = 0.4366, kir = 3, q = 2
Exemplo
Regressão restrita:
Nota = 644.7 –0.671 Psup, 2
restrictedR = 0.4149
(1.0) (0.032)
Regressão irrestrita:
Nota = 649.6 – 0.29Tamanho + 3.87Gastopa – 0.656Psup
(15.5) (0.48) (1.59) (0.032)
31
(15.5) (0.48) (1.59) (0.032)
2
unrestrictedR = 0.4366, kir = 3, q = 2
então F =
2 2
2
( ) /
(1 ) /( 1)
unrestricted restricted
unrestricted unrestricted
R R q
R n k
−
− − −
Exemplo
Regressão restrita:
Nota = 644.7 –0.671 Psup, 2restrictedR = 0.4149
(1.0) (0.032)
Regressão irrestrita:
Nota = 649.6 – 0.29Tamanho + 3.87Gastopa – 0.656Psup
(15.5) (0.48) (1.59) (0.032)
32
(15.5) (0.48) (1.59) (0.032)
2
unrestrictedR = 0.4366, kir = 3, q = 2
então F =
2 2
2
( ) /
(1 ) /( 1)
unrestricted restricted
unrestricted unrestricted
R R q
R n k
−
− − −
=
(.4366 .4149) / 2
(1 .4366) /(420 3 1)
−
− − −
= 8.01
Regressão residual
• Considere a seguinte regressão:
Yi = β0 + β1X1i + β2X2i +...+βkXki + ui
33
• Uma aplicação importante é a regressão residual-- uma forma
alternativa de obter o coeficiente β1.
Obs: Poderíamos ter escolhido qualquer outro coeficiente
(bastava, para isso, reordenar os regressores)
Regressão residual
• Dissemos que β1 corresponde ao efeito de X1 em Y, depois que
“controlamos” ou “limpamos” os outros efeitos.
• Considere a seguinte regressão:
34
X1i = γ0 + γ2X2i +...+ γkXki + ri
• O resíduo desta regressão (r) é a parte de X1 que não é
correlacionada com os outros regressores ou, dito de outra
forma, r é X1 depois que os efeitos dos outros regressores
foram levados em consideração.
Regressão residual : estimando β
1
• Podemos recuperar o estimador de β1 fazendo uma regressão
de Y no resíduo (r):
( )
iii
vXXX
vrY 10
... +−−−−+=
++=
γγγαα
αα
35
Nesse caso:
( )∑
∑
=
=
==
n
i i
n
i ii
r
Yr
1
2
1
11
ˆ
ˆ
ˆ
ˆ αβ
( )
{ {
ik u
kikii
kikii
vXXX
vXXX
1121211100
1220110
...
...
210
+−−−+−=
+−−−−+=
32132143421
ββββ
αγαγααγα
γγγαα
Regressão residual : variância de β
1
Sob a hipótese de homocesdaticidade, sabemos que
( ) ( ) ( )211
2
1
2
2
1 1ˆ
ˆ
RSQTr
Var
n
i i
−
==
∑
=
σσβ
36
onde e correspondem, respectivamente, ao R2 e à
Soma dos Quadrados Totais da regressão de X1 nos outros
regressores.
2
1R 1SQT
∑
=
−−
=
n
i
iukn 1
22
ˆ
1
1
σˆ