Logo Passei Direto
Buscar

Aulas_19_a_23

User badge image

Enviado por Thalita Do em

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Aula 20 - Modelos ARIMA cont hob.pdf
Análise e Previsão de Séries Temporais – Prof. Henrique Hippert 
 
Bacharelado em Estatística – 2011.3 
Disciplina: Análise e Previsão de Séries Temporais I 
Professor: Henrique S. Hippert 
 
Aula 20 – Modelos ARIMA (cont.) 
 
 
 
1. Forma geral dos modelos ARIMA 
 
(i) Modelo ARIMA básico 
 
Como vimos na aula passada, um processo AR(p) não-estacionário, que tenha uma 
raiz unitária, 
tt azB =)(ϕ 
tt
p
p azBB =−−− )...1( 1 φφ 
 
pode ter seu polinômio característico fatorado da forma 
ttp azBBGBGBG =−−−−
−
−
−− )]1)(1)...(1)(1[( 111211 
 
onde os Gi são as (p-1) raízes não-unitárias. O monômio (1-B), de raiz unitária, irá produzir a 
diferenciação da série : este monômio pode ser visto como um filtro instável (representado 
por ∇) que substitui a série zt original pela série wt de diferenças entre valores consecutivos: 
1)1( −−=−=∇= ttttt zzzBzw 
 
A série diferenciada wt pode então ser modelada por um filtro AR(p-1): 
tt
p
p awBBB =−−−−
−
−
)...1( 1121 φφφ 
 
Se usarmos o operador de diferença ∇, podemos re-escrever o modelo como: 
tt
p
p azBBB =∇−−−− −− )...1( 11221 φφφ (1) 
 
O modelo original AR(p) instável é agora visto como um AR(p-1) estável, aplicado à uma 
série diferenciada wt. 
Podemos considerar o modelo em (1) como o resultado da passagem da série original 
através de dois filtros lineares. Primeiro, por um filtro instável ∇, que provoca a diferenciação 
da série, gerando uma nova série estacionária wt; depois, a passagem desta série wt por um 
filtro estável AR(p-1), gerando um ruído branco at: 
zt → [∇] → wt → [Ф(B)] → at 
 
Podemos também interpretar o filtro na forma invertida. Usando o operador de soma infinita, 
que é o inverso do de diferenciação, obtemos um modelo integrado, que transforma o ruído 
branco estacionário at numa série não estacionária zt: 
zt ← [S] ← wt ← [Ф(B) -1] ← at 
 
O modelo em (1) é chamado de ARI (autoregressive integrated). A idéia de integração 
de séries pode ser estendida, e obtemos então os modelos ARIMA (autoregressive integrated 
moving average), que não são mais que modelos ARMA onde a parte AR tem uma das raízes 
unitárias: 
Análise e Previsão de Séries Temporais – Prof. Henrique Hippert 
 
t
q
qt
p
p aBBzBBB )...1()1)(...1( 11 θθφφ −−−=−−−− 
 
Se o processo original tiver mais de uma raiz unitária, o operador de diferenciação deverá ser 
aplicado mais de uma vez. Se usamos o operador de diferenciação ∇d, o modelo ARIMA em 
geral pode ser escrito como: 
tqt
d
p aBzB )()( Θ=∇Φ (2) 
 
Este modelo é denotado como ARIMA(p,d,q), onde p e q são as ordens dos polinômios AR e 
MA, respectivamente, e d é o grau de diferenciação. Escrevendo os polinômios por extenso, 
obtemos: 
t
q
qt
dp
p aBBzBBB )...1()1)(...1( 11 θθφφ −−−=−−−− (3) 
 
É fácil de ver, em (2), que modelos ser bastante complexos podem teoricamente ser criados. 
Na prática, raramente usaremos modelos de ordens p, d ou q maior do que 2, devido à 
dificuldade de identificação. 
 
 
 
2. Alguns modelos ARIMA mais comuns. 
 
 
 Como exemplo, escreveremos a seguir alguns dos modelos ARIMA mais comumente 
usados, na forma de equações de diferenças. 
 
 
2.1. Modelo ARIMA(0,1,0) : Passeio aleatório (random walk) 
 
O modelo mais simples é aquele onde a série diferenciada é um ruído branco: 
tt az =∇ 
tt azB =− )1( 
ttt azz += −1 
 
Ou seja, o valor a cada instante é igual ao valor do instante anterior, acrescido de um 
choque aleatório. Este modelo recebe o nome de passeio aleatório (random walk) : a cada 
instante, a variável se desloca aleatoriamente para cima ou para baixo no gráfico, de uma 
distância determinada pelo choque at. Este processo é evidentemente não-estacionário, como 
podemos comprovar calculando a variância: 
ttt azz += −1 
tttt aazz ++= −− )( 12 
ttttt aaazz +++= −−− 123 )( 
∑
=
−
+=
t
k
ktt azz
1
0 






+= ∑
=
−
t
k
ktt azz
1
0 var)var()var( 
Análise e Previsão de Séries Temporais – Prof. Henrique Hippert 
 
2
1
2)var( a
t
k
at tz σσ ==∑
=
 
 
A variância de zt cresce em função de t, o que torna o processo não-estacionário. 
Este processo tem sido usado para modelar variáveis financeiras; há quem argumente, 
por exemplo, que os retornos das bolsas de valores seguem um passeio aleatório (cf Malkiel: 
A Random Walk Down Wall Street); na prática, isto equivale a dizer que os retornos são 
imprevisíveis. A Figura 1 mostra uma realização deste tipo de processo. 
 
 
Figura 1 – Exemplo de série gerada por passeio aleatório 
 
 
 
2.2. Modelo ARIMA(1,1,0) = ARI(1,1) 
 
tt azB =∇− )1( 1φ 
tt azBB =−− )1)(1( 1φ 
tt azBBB =+−− ]1[ 211 φφ 
tt azBB =++− ])1(1[ 211 φφ 
tttt azzz =++− −− 2111)1( φφ 
tttt azzz +−+= −− 2111)1( φφ 
 
2.3. Modelo ARIMA(2,1,0) = ARIMA(2,1) 
 
tt azBB =∇−− )1( 221 φφ 
tt azBBB =−−− )1)(1( 221 φφ 
tt azBBBBB =++−−− ]1[ 3221221 φφφφ 
tt azBBB =+−++− ])()1(1[ 322211 φφφφ 
ttttt azzzz =+−++− −−− 3222111 )()1( φφφφ 
ttttt azzzz +−−−+= −−− 3222111 )()1( φφφφ 
 
 
Análise e Previsão de Séries Temporais – Prof. Henrique Hippert 
 
2.4. Modelo ARIMA(0,1,1)=IMA(1,1) 
 
 )(1 1 tt aBz θ−=∇ 
 )1( 11 −−=− ttt aazB θ 
 111 −− −=− tttt aazz θ 
 111 −− −+= tttt aazz θ 
 111 −− −+= tttt aazz θ 
 
2.5. Modelo ARIMA(1,1,1) 
 
tt aBzB )1()1( 11 θδφ −+=∇− 
tt aBzBB )1()1)(1( 11 θδφ −+=−− 
tt aBzBBB )1(]1[ 1211 θδφφ −+=+−− 
tt aBzBB )1(])1(1[ 1211 θδφφ −+=++− 
112111)1( −−− −+=++− ttttt aazzz θδφφ 
112111)1( −−− −+−++= ttttt aazzz θφφδ 
Aula 20b - Modelagem com modelos ARIMA ho.pdf
Análise e Previsão de Séries Temporais – Prof. Henrique Hippert 
 
Bacharelado em Estatística – 2011.3 
Disciplina: Análise e Previsão de Séries Temporais I 
Professor: Henrique S. Hippert 
 
Aula 20b – Modelagem com modelos ARIMA 
 
 
1. Introdução 
 
O método de Box e Jenkins se baseia na idéia de que uma processo em estudo 
(correlatado) pode ser descrito como gerado pela aplicação de filtros a um processo de ruído 
branco (descorrelatado) 
at → [ψ(B)] →wt→ [S] → zt 
 
Na análise de séries temporais, percorremos o caminho inverso: partimos de uma série 
temporal zt (isto é, de uma realização única de um processo não-estacionário), e tentamos 
chegar a um ruído branco, pela aplicação sucessiva de dois filtros, um não-estacionário (que 
faz a diferenciação da série) e um estacionário (um ARMA): 
zt → [∇] → wt → [ )(
)(
B
B
Φ
Θ ] → at 
 
Na prática, o problema da modelagem é: (i) identificar a ordem d do operador de 
diferenciação (em outras palavras, decidir quantas vezes é preciso diferenciar a série para 
estabilizá-la); (ii) identificar as ordens p e q do modelo ARMA para a série estacionária; e (iii) 
estimar os parâmetros do modelo. Esta modelagem é um processo iterativo – diferenciamos a 
série, identificamos um modelo provisório, testamos seus erros; se necessário, substituímos o 
modelo e reiniciamos o processo. 
 
 
2. Etapas da modelagem Box & Jenkins 
 
Basicamente, são três as etapas deste processo: 
 
(a) Dada uma série zt, verifique se ela é estacionária;
se for, modele com ARMA (item c); se 
não for, tente torná-la estacionária (item b) 
 
Para verificar a estacionariedade da série, faça primeiro uma inspeção visual, usando 
gráficos de linha. Experimente dividir a série em duas partes, e comparar as médias e 
variâncias de cada parte. Calcule a FAC. Uma FAC cujos valores decaem demasiado 
lentamente, como na Figura 1, é típica de séries não-estacionárias. [Note que estes 
valores de AC neste gráfico na verdade não têm nenhum sentido; a AC só é definida 
em séries estacionárias (Aula 10). Contudo, este falso correlograma pelo menos serve 
para indicar que a série não é estacionária]. 
Análise e Previsão de Séries Temporais – Prof. Henrique Hippert 
 
 
Figura 1 – Correlograma típico de um processo não-estacionário 
 
(b) Tente tornar a série estacionária, usando diferenciações (Aula 19) ou transformações 
(Aula 23). Se conseguir uma série estacionária, modele-a com ARMA (item c) 
 
A diferenciação é o recurso principal para tornar estacionária uma série, dentro do 
método de Box e Jenkins. Lembre-se contudo de que a diferenciação estabiliza apenas 
processos que tenham raízes unitárias; há processos não-estacionários que não podem 
ser estabilizados por diferenciação. Nestes casos, tente outra classe de modelos 
(modelos estruturais, por exemplo). 
As transformações (Aula 23) são úteis principalmente para estabilizar a variância do 
processo original, ou para tornar gaussiana sua distribuição. 
 
(c) Identifique um modelo ARMA para a série estacionária, e estime seus parâmetros. 
 
A FAC e a FACP são as ferramentas básicas para a identificação do tipo (AR, MA ou 
ARMA) de modelo, e de sua ordem, dentro da metodologia proposta originalmente 
por Box e Jenkins. Modificações a este método já foram propostas por diversos 
autores, que criaram outras ferramentas baseadas em AC (FACE, FACI), mas 
nenhuma delas foi amplamente adotada. 
A estimação dos parâmetros é bastante simples se o modelo for AR; neste caso, o 
modelo é simplesmente uma regressão linear, e podemos usar o método dos MQO. A 
estimação de modelos MA ou ARMA contudo é mais complicada, uma vez que estes 
modelos não são lineares nos parâmetros. Neste caso, devem ser usados algoritmos 
iterativos de otimização. 
 
(d) Faça previsões com o modelo obtido, calcule os erros de previsão um-passo-à-frente. 
Analise os erros; se eles forem adequados, a modelagem está terminada; se não forem, 
volte a (c), e experimente com outro modelo. 
 
Depois de estimar os parâmetros do ARMA em (c), inserimos estes parâmetros na 
equação de previsão do modelo ARIMA correspondente, calculamos os erros de 
previsão e os analisamos. O ideal é que os erros tenham média nula e variância 
constante, sejam descorrelatados e de distribuição gaussiana. Se os erros atendem a 
estes requisitos, o modelo encontrado é adequado. Se não, devemos voltar ao item (c) 
e experimentar um novo modelo, talvez de ordem mais elevada (o que Box e Jenkins 
chamam de sobrefixação do modelo). 
 
Análise e Previsão de Séries Temporais – Prof. Henrique Hippert 
 
Este processo pode ser representado por meio do fluxograma abaixo: 
 
 
Aula 21 - Previs�o com modelos ARIMA ho.pdf
Análise e Previsão de Séries Temporais – Henrique S. Hippert 
Bacharelado em Estatística – 2012.1 
Disciplina: Análise e Previsão de Séries Temporais I 
Professor: Henrique S. Hippert 
 
 
Aula 21b – Previsão com modelos ARIMA 
 
 
1. Introdução 
 
Quando usamos modelos ARIMA, as previsões são dadas pelo valor esperado das 
futuras observações de uma série temporal, condicionado aos valores passados e ao valor 
presente da mesma série: 
,...],|[ˆ 1| −++ = ttttt zzzEz ττ 
 
Para simplificar a notação, representaremos este valor esperado por Et: 
][ˆ | ττ ++ = tttt zEz 
 
Isto significa que a previsão para a observação futura zt+τ será dada pelo valor esperado 
calculado com base em toda a informação disponível até o instante t. Do ponto de vista 
estatístico, esta previsão é ótima, no sentido de minimizar o erro de previsão τ passos à frente. 
 Para calcular a previsão para τ passos à frente, escrevemos a equação de diferenças 
que dá τ+tz como função dos valores passados de zt e dos choques at; depois calculamos o 
valor esperado de τ+tz . Para fazer isto, é preciso lembrar que: 
 
a) o valor esperado condicional das observações futuras é igual à previsão destes valores: 
tttt zzE |ˆ)( ττ ++ = τ= 1,2,3,... 
 
b) o valor esperado condicional dos choques futuros é nulo: 
0][ =+τtt aE τ = 1,2,3,... 
 
c) os valores esperados condicionais dos choques e das observações presentes e passadas são 
iguais aos valores observados: 
ττ −− = ttt aaE )( τ = 0,1,2,3,... 
ττ −− = ttt zzE )( τ = 0,1,2,3,... 
 
Calcularemos abaixo, como exemplo, as equações de previsão para os modelos mais 
simples, AR, MA e ARMA. 
 
 
2. Equações de previsão um-passo-à-frente para alguns modelos básicos 
 
 Mostramos abaixo como escrever as equações de previsão um-passo-à-frente, para 
alguns modelos básicos, na forma de equações de diferenças. 
 
 
 
Análise e Previsão de Séries Temporais – Henrique S. Hippert 
2.1. Modelo MA(1) 
tt aBz )1( 1θµ −+= 
11 −−+= ttt aaz θµ 
ttt aaz 111 θµ −+= ++ 
tttttttt aaaEzEz 1111|1 )()(ˆ θµθµ −=−+== +++ 
 
2.2. Modelo AR(1) 
tt azB +=− ξφ )1( 1 
ttt azz ++= −11φξ 
111 ++ ++= ttt azz φξ 
)()(ˆ 111|1 +++ ++== ttttttt azEzEz φξ 
)(ˆ 1|1 tttt zEz φξ +=+ 
ttt zz 1|1ˆ φξ +=+ 
 
2.3. Modelo ARMA(1,1) 
tt aBzB )1()1( 11 θξφ −+=− 
1111 −− −−+= tttt aazz θφξ 
tttt aazz 1111 θφξ −−+= ++ 
)()(ˆ 1111|1 tttttttt aazEzEz θφξ −−+== +++ 
tttt azz 11|1ˆ θφξ −+=+ 
 
2.4. Modelo ARIMA(0,1,1)=IMA(1,1) 
 )(1 1 tt aBz θ−=∇ 
 )1( 11 −−=− ttt aazB θ 
 111 −− −=− tttt aazz θ 
 111 −− −+= tttt aazz θ 
 111 tttt aazz θ−+= ++ 
tttt azz 1|1 ˆ θ−=+ 
 
2.5. Modelo ARIMA(1,1,1) 
tt aBzB )1()1( 11 θδφ −+=∇− 
tt aBzBB )1()1)(1( 11 θδφ −+=−− 
tt aBzBB )1(])1(1[ 1211 θδφφ −+=++− 
112111)1( −−− −+=++− ttttt aazzz θδφφ 
112111)1( −−− −+−++= ttttt aazzz θφφδ 
ttttt aazzz 111111 )1( θφφδ −++++= +−+ 
)()()()()1(ˆ 11111|1 tttttttttt aEaEzEzEz θφφδ −++++= +−+ 
ttttt azzz 1111|1 )1(ˆ θφφδ −+++= −+ 
Análise e Previsão de Séries Temporais – Henrique S. Hippert 
3. Como usar as equações de previsão 
 
Na seção anterior, vimos as equações de previsão para alguns modelos, onde as 
previsões para o valor futuro ttz |1ˆ + são calculadas em função dos valores passados de at e de zt. 
Para usar estas equações, precisamos de saber: 
a) como calcular a série de valores passados dos choques aleatórios at; 
b) como atribuir valores iniciais, tanto para a série de at quanto para a de zt. 
 
 
3.1. Cálculo da série de choques aleatórios at 
 
 Até agora, temos tratado os choques aleatórios at como uma variável aleatória i.i.d., 
cuja origem não discutimos. Nos exercícios de geração de séries simuladas (Trabalho 6), esta 
série foi gerada por meio de uma série de simulações de uma variável N(0,1), e a seguir 
calculamos zt pela aplicação de um filtro linear do tipo AR ou MA: 
at → [Ф(B)] → wt ou at → [Θ(B)] → wt 
 
Agora, suponha que temos o problema inverso: conhecemos uma série zt, e precisamos de 
calcular os valores de at para usá-los nas equações de previsão. Se a série zt é não estacionária,
iremos primeiro diferenciá-la, e depois modelá-la por um ARMA, da forma: 
zt → [∇] → wt → [Ф(B)/Θ(B)] → at 
 
Nos modelos ARIMA, a série at tem uma interpretação simples: ela é formada pela 
série de erros de previsão um-passo-à-frente de zt. Para verificar isto, tomemos por exemplo 
um modelo ARMA(p,q), e escrevamos as equações de do valor observado no instante t e do 
valor previsto para este instante: 
t
q
qt
p
p aBBzBB )...1()...1( 11 θθξφφ −−−+=−−− 
qtqttptptt aaazzz −−−− −−−+=−−− θθξφφ ...... 1111 
qtqttptptt aaazzz −−−− −−−++++= θθξφφ ...... 1111 (1) 
 
No instante t-1, o único destes valores que não estaria disponível é at. Portanto, a previsão um 
passo à frente é dada por 
qtqtptpttt aazzz −−−−− −−−+++= θθξφφ ......ˆ 11111| (2) 
 
subtraindo (2) de (1), vemos que o erro de previsão um-passo-à-frente é dado por 
tttttt azze =−= −− 1|1| ˆ (3) 
 
Num ARMA(p,q), por isso, o valor do choque at num instante qualquer t é igual ao 
erro da previsão para aquele instante, feita no instante anterior. Isto significa que o valor de zt 
é na verdade previsto em função dos erros passados de previsão (lembre-se que, em qualquer 
modelo ARMA, zt pode ser escrito como uma combinação linear de choques at). Algo 
semelhante ao que ocorria nos métodos de amortecimento exponencial simples, e será 
discutido na Seção 4, abaixo. 
 
Análise e Previsão de Séries Temporais – Henrique S. Hippert 
3.2. Atribuição de valores iniciais para at e zt 
 
 Para iniciar o cálculo das previsões, precisaremos de valores iniciais para as séries de 
at ou de zt, dependendo do modelo. 
Tomaremos como exemplo um modelo ARMA(1,1). A partir de (2), 
qtqtptpttt aazzz −−−−− −−−+++= θθξφφ ......ˆ 11111| 
 
escrevemos o modelo como: 
11111|ˆ −−− −+= tttt azz θφξ 
 
Para fazer a primeira previsão, iremos precisar dos valores de a0 e z0: 
01010|1ˆ azz θφξ −+= 
 
 O efeito dos valores iniciais se perde rapidamente, à medida que as previsões vão 
sendo corrigidas pelos erros de previsão. Por isso, a escolha destes valores iniciais não é 
crítica, se a série for razoavelmente longa (e os modelos ARIMA não devem, de qualquer 
forma, serem usados com séries curtas). O método mais simples é fazer: 
- para valores iniciais de at: uma vez que os choques foram supostos gaussianos N(0,σa2), 
podemos usar valores iniciais extraídos aleatoriamente de uma distribuição normal de 
média nula. A variância σa2 pode ser estimada a partir da série de observações de zt; é 
mais fácil, porém, é simplesmente extrair os valores iniciais de at de uma distribuição 
normal padronizada. 
- para valores iniciais de zt: a série será gaussiana, pois é uma função linear de variáveis 
gaussianas. Os valores iniciais podem ser extraídos aleatoriamente de uma distribuição 
gaussiana, cuja média e variância podem ser estimadas a partir da série observada. 
 
 
3.3. Variância do erro de previsão um-passo-à-frente 
 
Calculando as variâncias condicionais de ambos os membros de (3), condicionais às 
observações até o instante t-1, obtemos 
)()( 11|1 ttttt aVareVar −−− = 
22
ae σσ = 
 
Esta variância pode ser usada para calcular intervalos de confiança para a previsão. 
Considerando que a zt tem distribuição normal, cujo valor esperado é o valor previsto, e cuja 
variância é a do erro de previsão, podemos escrever a distribuição condicional de zt como: 
),ˆ( 21|1| atttt zNz σ−− ≈ 
 
A partir daí, podemos calcular ICs para o nível de confiança desejado. 
 
 
4. Relação entre modelos ARIMA e os métodos de amortecimento exponencial 
 
 Como dito em na seção 3.1, as previsões de um ARIMA podem ser escritas em função 
dos erros de previsão anteriores, da mesma forma como acontece nos métodos de 
amortecimento exponencial simples. 
Análise e Previsão de Séries Temporais – Henrique S. Hippert 
 Isto é particularmente evidente no caso do modelo ARIMA(0,1,1)=IMA(1,1), que 
podem ser escrito 
 )(1 1 tt aBz θ−=∇ 
 )1( 11 −−=− ttt aazB θ 
 111 −− −=− tttt aazz θ 
 111 −− −+= tttt aazz θ (4) 
 111 tttt aazz θ−+= ++ 
tttt azz 1|1 ˆ θ−=+ (5) 
 
De (4), vemos que a previsão um passo à frente feita no instante t-1 é dada por: 
 
ˆ 1111| −−− −= tttt azz θ (6) 
 
Subtraindo (6) de (4), obtemos zt em função da previsão anterior: 
 
ˆ 1| tttt azz =− − 
 
ˆ 1| tttt azz += − 
 
inserindo este valor de zt em (5) 
tttttt aazz θ−+= −+ ]ˆ[ ˆ 1||1 
ttttt azz ) 1(ˆ ˆ 1||1 θ−+= −+ 
ttttt azz λ+= −+ 1||1 ˆ ˆ 
 
 ou 
)ˆ(ˆ ˆ 1|1||1 −−+ −+= ttttttt zzzz λ (7) 
 
onde λ=1-θ. Isto implica que a nova previsão um-passo-à-frente ttz |1ˆ + é igual a previsão um-
passo-à-frente anterior 1|ˆ −ttz , corrigida por uma fração do erro de previsão. Esta idéia é 
exatamente a mesma que já vimos no capítulo sobre amortecimento exponencial simples 
(Aula 03, seção 2.3.4), com uma notação era um pouco diferente: 
)ˆ(ˆˆ 1 TTTT ZZZZ −+=+ α (8) 
 
O método em (8) também podia ser escrito de forma um pouco diferente: 
TTT ZZZ ˆ)1(ˆ 1 αα −+=+ (9) 
 
Re-escrevendo o ARIMA(0,1,1) em (7), obtemos uma forma similar a (9): 
)ˆ(ˆ ˆ 1|1||1 −−+ −+= ttttttt zzzz λ 
1|1||1 ˆˆ ˆ −−+ −+= ttttttt zzzz λλ 
1||1 ˆ)1( ˆ −+ −+= ttttt zzz λλ 
 
Nesta forma, a nova previsão é uma média ponderada entre a previsão anterior e o último 
valor observado. 
 
Isto mostra que o método de amortecimento exponencial simples em (8) é idêntico ao 
ARIMA(0,1,1) em (7); isto é, não é mais do que um caso particular do ARIMA(p,d,q). Isto é 
Análise e Previsão de Séries Temporais – Henrique S. Hippert 
interessante, porque poderemos então usar a teoria por trás do ARIMA para construir 
intervalos de confiança para as previsões por amortecimento exponencial. Estes ICs serão 
calculados considerando que a zt tem distribuição normal, da mesma forma que na seção 3.3, 
acima. 
 
Aula 21a - Valor esperado condicional x n�o condicional.pdf
Análise e Previsão de Séries Temporais 2011 – Henrique S. Hippert 
 
Bacharelado em Estatística – 2011.3 
Disciplina: Análise e Previsão de Séries Temporais I 
Professor: Henrique S. Hippert 
 
 
Aula 21a – Valor esperado condicional × não-condicional 
 
 
A previsão de um ARIMA é dada pelo valor esperado condicionado as observações 
passadas. Para entender isto, suponha que estamos no instante t=0, e queremos fazer a 
previsão para o instante t=19 de um processo que sabemos ser dado por 
ttt azz += −18.0 
 
A melhor previsão que podemos fazer então, sem ter ainda nenhuma observação, é apenas a 
média do processo: 
0ˆ 0|19 == µz 
 
 
 
Suponha agora que estejamos no instante t=18, e o último valor observado seja bem alto: 
55,218 =z 
 
Como a série tem alta AC (ρ1=φ1=0.8), esperamos que o próximo valor também seja bem alto. 
Usando o conceito de esperado condicional, podemos estimá-lo como 
04.255.28.0ˆ 18|19 =×=z 
 
 
 
Análise e Previsão de Séries Temporais 2011 – Henrique
S. Hippert 
 
 
Este valor tem um erro menor do que 0|19zˆ ; isto era de se esperar, porque agora temos mais 
informação sobre que basear nossa previsão. 
 
 
Note o uso das duas formas de E(.): 
 
- E(.) incondicional, para calcular a média do processo (Aula 14): 
ttt azz ++= −11φξ 
)()( 11 −+= tt zEzE φξ 
ξφ =− )()1( 1 tzE 
11
)( φ
ξµ
−
== tzE 
 
- E(.) condicional, na equação de previsão (Aula 21): 
ttt azz ++= −11φξ 
ttt azz ++=+ 11 φξ 
)()( 111 ++ ++= ttttt azEzE φξ 
)(ˆ 1|1 tttt zEz φξ +=+ 
ttt zz 1|1ˆ φξ +=+ 
 
Note que, na primeira, 
)()( 1−= tt zEzE 
 
na segunda 
)()( 1 tttt zEzE ≠+ 
 
Aula 21b - Previs�o com modelos ARIMA ho.pdf
Análise e Previsão de Séries Temporais 2011 – Henrique S. Hippert 
Bacharelado em Estatística – 2011.3 
Disciplina: Análise e Previsão de Séries Temporais I 
Professor: Henrique S. Hippert 
 
 
Aula 21b – Previsão com modelos ARIMA 
 
 
1. Introdução 
 
Quando usamos modelos ARIMA, as previsões são dadas pelo valor esperado das 
futuras observações de uma série temporal, condicionado aos valores passados e ao valor 
presente da mesma série: 
,...],|[ˆ 1| −++ = ttttt zzzEz ττ 
 
Para simplificar a notação, representaremos este valor esperado por Et: 
][ˆ | ττ ++ = tttt zEz 
 
Isto significa que a previsão para a observação futura zt+τ será dada pelo valor esperado 
calculado com base em toda a informação disponível até o instante t. Do ponto de vista 
estatístico, esta previsão é ótima, no sentido de minimizar o erro de previsão τ passos à frente. 
 Para calcular a previsão para τ passos à frente, escrevemos a equação de diferenças 
que dá τ+tz como função dos valores passados de zt e dos choques at; depois calculamos o 
valor esperado de τ+tz . Para fazer isto, é preciso lembrar que: 
 
a) o valor esperado condicional das observações futuras é igual à previsão destes valores: 
tttt zzE |ˆ)( ττ ++ = τ= 1,2,3,... 
 
b) o valor esperado condicional dos choques futuros é nulo: 
0][ =+τtt aE τ = 1,2,3,... 
 
c) os valores esperados condicionais dos choques e das observações presentes e passadas são 
iguais aos valores observados: 
ττ −− = ttt aaE )( τ = 0,1,2,3,... 
ττ −− = ttt zzE )( τ = 0,1,2,3,... 
 
Calcularemos abaixo, como exemplo, as equações de previsão para os modelos mais 
simples, AR, MA e ARMA. 
 
 
2. Equações de previsão um-passo-à-frente para alguns modelos básicos 
 
 Mostramos abaixo como escrever as equações de previsão um-passo-à-frente, para 
alguns modelos básicos, na forma de equações de diferenças. 
 
 
 
Análise e Previsão de Séries Temporais 2011 – Henrique S. Hippert 
2.1. Modelo MA(1) 
tt aBz )1( 1θµ −+= 
11 −−+= ttt aaz θµ 
ttt aaz 111 θµ −+= ++ 
tttttttt aaaEzEz 1111|1 )()(ˆ θµθµ −=−+== +++ 
 
2.2. Modelo AR(1) 
tt azB +=− ξφ )1( 1 
ttt azz ++= −11φξ 
ttt azz ++=+ 11 φξ 
)()(ˆ 111|1 +++ ++== ttttttt azEzEz φξ 
)(ˆ 1|1 tttt zEz φξ +=+ 
ttt zz 1|1ˆ φξ +=+ 
 
2.3. Modelo ARMA(1,1) 
tt aBzB )1()1( 11 θξφ −+=− 
1111 −− −−+= tttt aazz θφξ 
tttt aazz 1111 θφξ −−+= ++ 
)()(ˆ 1111|1 tttttttt aazEzEz θφξ −−+== +++ 
tttt azz 11|1ˆ θφξ −+=+ 
 
2.4. Modelo ARIMA(0,1,1)=IMA(1,1) 
 )(1 1 tt aBz θ−=∇ 
 )1( 11 −−=− ttt aazB θ 
 111 −− −=− tttt aazz θ 
 111 −− −+= tttt aazz θ 
 111 tttt aazz θ−+= ++ 
tttt azz 1|1 ˆ θ−=+ 
 
2.5. Modelo ARIMA(1,1,1) 
tt aBzB )1()1( 11 θδφ −+=∇− 
tt aBzBB )1()1)(1( 11 θδφ −+=−− 
tt aBzBB )1(])1(1[ 111 θδφφ −+=++− 
112111)1( −−− −+=++− ttttt aazzz θδφφ 
112111)1( −−− −+−++= ttttt aazzz θφφδ 
ttttt aazzz 111111 )1( θφφδ −++++= +−+ 
)()()()()1(ˆ 11111|1 tttttttttt aEaEzEzEz θφφδ −++++= +−+ 
ttttt azzz 1111|1 )1(ˆ θφφδ −+++= −+ 
Análise e Previsão de Séries Temporais 2011 – Henrique S. Hippert 
3. Como usar as equações de previsão 
 
Na seção anterior, vimos as equações de previsão para alguns modelos, onde as 
previsões para o valor futuro ttz |1ˆ + são calculadas em função dos valores passados de at e de zt. 
Para usar estas equações, precisamos de saber: 
a) como calcular a série de valores passados dos choques aleatórios at; 
b) como atribuir valores iniciais, tanto para a série de at quanto para a de zt. 
 
 
3.1. Cálculo da série de choques aleatórios at 
 
 Até agora, temos tratado os choques aleatórios at como uma variável aleatória i.i.d., 
cuja origem não discutimos. Nos exercícios de geração de séries simuladas (Trabalho 6), esta 
série foi gerada por meio de uma série de simulações de uma variável N(0,1), e a seguir 
calculamos zt pela aplicação de um filtro linear do tipo AR ou MA: 
at → [Ф(B)] → wt ou at → [Θ(B)] → wt 
 
Agora, suponha que temos o problema inverso: conhecemos uma série zt, e precisamos de 
calcular os valores de at para usá-los nas equações de previsão. Se a série zt é não estacionária, 
iremos primeiro diferenciá-la, e depois modelá-la por um ARMA, da forma: 
zt → [∇] → wt → [Ф(B)/Θ(B)] → at 
 
Nos modelos ARIMA, a série at tem uma interpretação simples: ela é formada pela 
série de erros de previsão um-passo-à-frente de zt. Para verificar isto, tomemos por exemplo 
um modelo ARMA(p,q), e escrevamos as equações de do valor observado no instante t e do 
valor previsto para este instante: 
t
q
qt
p
p aBBzBB )...1()...1( 11 θθξφφ −−−+=−−− 
qtqttptptt aaazzz −−−− −−−+=−−− θθξφφ ...... 1111 
qtqttptptt aaazzz −−−− −−−++++= θθξφφ ...... 1111 (1) 
 
No instante t-1, o único destes valores que não estaria disponível é at. Portanto, a previsão um 
passo à frente é dada por 
qtqtptpttt aazzz −−−−− −−−+++= θθξφφ ......ˆ 11111| (2) 
 
subtraindo (2) de (1), vemos que o erro de previsão um-passo-à-frente é dado por 
tttttt azze =−= −− 1|1| ˆ (3) 
 
Num ARMA(p,q), por isso, o valor do choque at num instante qualquer t é igual ao 
erro da previsão para aquele instante, feita no instante anterior. Isto significa que o valor de zt 
é na verdade previsto em função dos erros passados de previsão (lembre-se que, em qualquer 
modelo ARMA, zt pode ser escrito como uma combinação linear de choques at). Algo 
semelhante ao que ocorria nos métodos de amortecimento exponencial simples, e será 
discutido na Seção 4, abaixo. 
 
Análise e Previsão de Séries Temporais 2011 – Henrique S. Hippert 
3.2. Atribuição de valores iniciais para at e zt 
 
 Para iniciar o cálculo das previsões, precisaremos de valores iniciais para as séries de 
at ou de zt, dependendo do modelo. 
Tomaremos como exemplo um modelo ARMA(1,1). A partir de (2), 
qtqtptpttt aazzz −−−−− −−−+++= θθξφφ ......ˆ 11111| 
 
escrevemos o modelo como: 
11111|ˆ −−− −+= tttt azz θφξ 
 
Para fazer a primeira previsão, iremos precisar dos valores de a0 e z0: 
01010|1ˆ azz θφξ −+= 
 
 O efeito dos valores iniciais se perde rapidamente, à medida que as previsões vão 
sendo corrigidas pelos erros de previsão. Por isso, a escolha destes valores iniciais não é 
crítica, se a série for razoavelmente longa (e os modelos ARIMA não devem, de qualquer 
forma, serem usados com séries curtas). O método mais simples é fazer: 
- para valores iniciais de at: uma vez que os choques foram supostos gaussianos N(0,σa2), 
podemos usar valores iniciais extraídos aleatoriamente
de uma distribuição normal de 
média nula. A variância σa2 pode ser estimada a partir da série de observações de zt; é 
mais fácil, porém, é simplesmente extrair os valores iniciais de at de uma distribuição 
normal padronizada. 
- para valores iniciais de zt: a série será gaussiana, pois é uma função linear de variáveis 
gaussianas. Os valores iniciais podem ser extraídos aleatoriamente de uma distribuição 
gaussiana, cuja média e variância podem ser estimadas a partir da série observada. 
 
 
3.3. Variância do erro de previsão um-passo-à-frente 
 
Calculando as variâncias condicionais de ambos os membros de (3), condicionais às 
observações até o instante t-1, obtemos 
)()( 11|1 ttttt aVareVar −−− = 
22
ae σσ = 
 
Esta variância pode ser usada para calcular intervalos de confiança para a previsão. 
Considerando que a zt tem distribuição normal, cujo valor esperado é o valor previsto, e cuja 
variância é a do erro de previsão, podemos escrever a distribuição condicional de zt como: 
),ˆ( 21|1| atttt zNz σ−− ≈ 
 
A partir daí, podemos calcular ICs para o nível de confiança desejado. 
 
 
4. Relação entre modelos ARIMA e os métodos de amortecimento exponencial 
 
 Como dito em na seção 3.1, as previsões de um ARIMA podem ser escritas em função 
dos erros de previsão anteriores, da mesma forma como acontece nos métodos de 
amortecimento exponencial simples. 
Análise e Previsão de Séries Temporais 2011 – Henrique S. Hippert 
 Isto é particularmente evidente no caso do modelo ARIMA(0,1,1)=IMA(1,1), que 
podem ser escrito 
 )(1 1 tt aBz θ−=∇ 
 )1( 11 −−=− ttt aazB θ 
 111 −− −=− tttt aazz θ 
 111 −− −+= tttt aazz θ (4) 
 111 tttt aazz θ−+= ++ 
tttt azz 1|1 ˆ θ−=+ (5) 
 
De (4), vemos que a previsão um passo à frente feita no instante t-1 é dada por: 
 
ˆ 1111| −−− −= tttt azz θ (6) 
 
Subtraindo (6) de (4), obtemos zt em função da previsão anterior: 
 
ˆ 1| tttt azz =− − 
 
ˆ 1| tttt azz += − 
 
inserindo este valor de zt em (5) 
tttttt aazz θ−+= −+ ]ˆ[ ˆ 1||1 
ttttt azz ) 1(ˆ ˆ 1||1 θ−+= −+ 
ttttt azz λ+= −+ 1||1 ˆ ˆ 
 
 ou 
)ˆ(ˆ ˆ 1|1||1 −−+ −+= ttttttt zzzz λ (7) 
 
onde λ=1-θ. Isto implica que a nova previsão um-passo-à-frente ttz |1ˆ + é igual a previsão um-
passo-à-frente anterior 1|ˆ −ttz , corrigida por uma fração do erro de previsão. Esta idéia é 
exatamente a mesma que já vimos no capítulo sobre amortecimento exponencial simples 
(Aula 03, seção 2.3.4), com uma notação era um pouco diferente: 
)ˆ(ˆˆ 1 TTTT ZZZZ −+=+ α (8) 
 
O método em (8) também podia ser escrito de forma um pouco diferente: 
TTT ZZZ ˆ)1(ˆ 1 αα −+=+ (9) 
 
Re-escrevendo o ARIMA(0,1,1) em (7), obtemos uma forma similar a (9): 
)ˆ(ˆ ˆ 1|1||1 −−+ −+= ttttttt zzzz λ 
1|1||1 ˆˆ ˆ −−+ −+= ttttttt zzzz λλ 
1||1 ˆ)1( ˆ −+ −+= ttttt zzz λλ 
 
Nesta forma, a nova previsão é uma média ponderada entre a previsão anterior e o último 
valor observado. 
 
Isto mostra que o método de amortecimento exponencial simples em (8) é idêntico ao 
ARIMA(0,1,1) em (7); isto é, não é mais do que um caso particular do ARIMA(p,d,q). Isto é 
Análise e Previsão de Séries Temporais 2011 – Henrique S. Hippert 
interessante, porque poderemos então usar a teoria por trás do ARIMA para construir 
intervalos de confiança para as previsões por amortecimento exponencial. Estes ICs serão 
calculados considerando que a zt tem distribuição normal, da mesma forma que na seção 3.3, 
acima. 
 
Aula 22a - Crit�rios para sele��o de modelos.pdf
Análise e Previsão de Séries Temporais – Prof.: Henrique S. Hippert 
 
Bacharelado em Estatística – 2012.1 
Disciplina: Análise e Previsão de Séries Temporais I 
Professor: Henrique S. Hippert 
 
Aula 22 – Critérios para seleção de modelos ARIMA 
 
 
1. Introdução 
 
Depois que o identificamos o modelo adequado e estimamos seus parâmetros, 
teoricamente estaríamos prontos para fazer as previsões. Na prática, contudo, o primeiro 
modelo escolhido nem sempre é o ideal, por várias razões: 
1) A FAC e a FACP ajudam na escolha entre modelos, mas não são infalíveis. Na 
prática, é frequentemente difícil decidir, por exemplo, se dois valores vistos na FAC 
estão decaindo exponencialmente - como num AR -, ou se são apenas dois valores 
isolados - como num MA(2). Em geral, procuramos fazer um elenco de modelos 
possíveis, testá-los e comparar os resultados 
2) A FAC e a FACP podem oferecer algum auxílio na escolha entre modelos puramente 
AR ou puramente MA. Contudo, quando se empregam modelo mistos ARMA, a FAC 
e a FACP não são muito úteis. Na prática, um procedimento usual é testar primeiro um 
modelo simples (AR ou MA), depois acrescentar termos para transformá-lo num 
ARMA, testá-lo, e comparar os resultados. 
3) Algum dos parâmetros estimados para o primeiro modelo pode se revelar não-
significante; isto quer dizer que teremos que re-escrever o modelo (talvez com sua 
ordem reduzida), omitindo aquele parâmetro, e testá-lo de novo. 
 
Por estas razões, precisaremos de arranjar técnicas ou critérios que nos ajudem a 
escolher entre diferentes modelos. Escolher simplesmente o modelo que leve ao menor erro 
geralmente não funciona: quase sempre, o modelo mais complexo terá o menor erro, mas não 
fará necessariamente as melhores previsões (isto é verdade especialmente para modelos não-
lineares, como veremos mais tarde; com um modelo não-linear suficientemente complexo, é 
possível reduzir o erro a zero, mas este modelo será inútil para previsões). 
 
 
2. Critérios heurísticos de seleção : sobrefixação e validação cruzada 
 
Uma primeira técnica para seleção se baseia no que Box e Jenkins chamam de 
sobrefixação: uma vez que um modelo tenha sido selecionado, o pesquisador deve estimar 
também alguns modelos de ordem superior, e verificar se seus parâmetros são significantes. 
Por exemplo, se o estudo da FAC e da FACP sugerem o uso de um modelo ARMA(0,1) para 
uma série dada, estimar também um ARMA(0,2), e talvez um ARMA(1,1); se algum dos 
parâmetros extras destes modelos for significante, isto pode indicar que o modelo inicial 
ARMA(0,1) talvez não seja adequado. 
Uma segunda técnica, de base mais empírica, sugere que os dados disponíveis sejam 
divididos em duas amostras independentes, uma para a estimação dos parâmetros, e outra para 
o teste; o modelo que tiver menor erro na amostra de teste será escolhido. Em geral, o modelo 
com menor erro na primeira amostra não será o mesmo que terá menor erro (melhores 
previsões) na segunda amostra. Este procedimento é chamado de validação cruzada (cross 
validation), e será visto mais tarde. 
Análise e Previsão de Séries Temporais – Prof.: Henrique S. Hippert 
 
Por fim, há alguns critérios baseados em teoria da informação, que sugerem que seja 
escolhido o modelo que tenha a menor variância dos erros e, ao mesmo tempo, o menor 
número de parâmetros. Veremos a seguir alguns destes critérios. 
 
 
3. Critérios baseados em teoria da informação 
 
Estes critérios para a seleção de modelos começaram a ser desenvolvidos
na década de 
1970. Basicamente, cada critério se baseia em uma função tanto a variância do erro ( 2aσ ) 
quanto o número de parâmetros; o melhor modelo será aquele que minimizar esta função. Um 
modelo que tenha variância pequena, mas for demasiado complexo (em termos do número de 
parâmetros), não minimizará a função; diremos então que a função está penalizando o modelo 
pelo excesso de parâmetros. 
 
 
3.1. AIC (Akaike information criterion) 
 
Este foi o primeiro dos critério baseados na teoria da informação. Na sua forma 
original, a função a ser minimizada é dada por: 
mLAIC 2)ln(2 +−= 
 
onde L é a verossimilhança (likelihood) do modelo. Como nem todos os programas de 
computador calculam L, uma estimativa do AIC pode ser obtida usando-se a aproximação 
dada por : 
)ˆln(.)]2ln(1[)ln(2 2aNNL σpi ++×≈− 
 
o que leva à 
mNNAIC a 2)ˆln()]2ln(1[ 2 +++×≈ σpi 
 
onde m é o número de parâmetros (p+q+1; deve-se incluir uma constante no modelo), e N é o 
tamanho da série. Como em geral os modelos são comparados sobre uma mesma série 
(mesmo N), a primeira parcela da expressão acima é constante, e o critério pode ser enunciado 
numa forma reduzida: 
mNAIC a 2)ˆln( 2 +≈ σ 
 
 
3.2. BIC (Bayesian information criterion) 
 
Shibata (1976) mostrou que o AIC tende a superestimar a ordem AR dos modelos, e 
sugeriu um critério baseado numa função um pouco mais complexa, de origem bayesiana: 












−
++





−−−=
m
mNm
N
m
mNNBIC a
z
a
1
ˆ
ˆ
ln)ln(1ln)()ˆln(
2
2
2 σ
σ
σ 
 
 
 
 
Análise e Previsão de Séries Temporais – Prof.: Henrique S. Hippert 
 
3.3. SBC (Schwartz Bayesian criterion) 
 
Sugerido por Schwartz (1978), simplifica a função usada no BIC, mas tenta evitar a 
superestimação da ordem do AR que ocorre no AIC: 
)ln()ˆln( 2 NmNSBC a += σ 
 
Se comparamos esta expressão com a do AIC, vemos a primeira parcela de ambas são funções 
idênticas da variância do erro, e as segundas parcelas são funções diferentes do número de 
parâmetros m. Como 
mNm 2)ln( > 
 
para N > 8, vemos que na prática o BIC impõe uma penalização mais forte sobre o número de 
parâmetros do que o AIC; portanto, o BIC irá provavelmente levar à seleção de modelos mais 
simples do que o AIC. 
 
 
4. Conclusão 
 
É preciso observar que estes testes podem auxiliar na seleção de um modelo, mas não 
é bom confiar cegamente nos seus resultados. Como estas quantidades são fáceis de calcular, 
a maioria dos programas calcula várias delas, e às vezes elas dão resultados contraditórios (o 
modelo escolhido segundo um critério é diferente do modelo escolhido segundo outro 
critério). Uma análise cuidadosa dos erros deve sempre ser feita, para verificar se o modelo se 
ajusta bem aos dados; isto será visto na próxima seção. 
 
 
Aula 22b - An�lise dos erros de previs�o ho.pdf
Análise e Previsão de Séries Temporais – Henrique Hippert 
Bacharelado em Estatística – 2012.1 
Disciplina: Análise e Previsão de Séries Temporais I 
Professor: Henrique S. Hippert 
 
 
 
Aula 22 – Análise dos erros de previsão 
 
 
1. Introdução 
 
Depois que escolhemos um modelo provisório, estimamos seus parâmetros e fazemos 
as previsões, o próximo passo, dentro do método de Box e Jenkins, é analisar os erros de 
previsão, para ver se o modelo é adequado, ou se deve ser mudado. Os erros devem: 
- ter média nula 
- ter variância constante 
- ser descorrelacionados 
- ter distribuição normal 
 
Nos modelos ARIMA isso é particularmente importante, porque, como foi visto, o 
erro de previsão um-passo-à-frente et é equivalente ao choque aleatório at que foi usado como 
entrada de um filtro linear. Na construção do modelo teórico (Aula 11b), admitimos que estes 
choques constituíam um ruído branco, isto é, variáveis aleatórias i.i.d.; agora que a série foi 
observada, precisaremos retornar ao princípio e verificar se estas suposições iniciais eram 
realmente válidas. Se forem, ótimo: o modelo está pronto para ser usado. Se não forem, 
provavelmente precisaremos começar tudo de novo, usando outro modelo, com outra 
especificação. 
 
 
2. Testes sobre a autocorrelação dos erros 
 
2.1. Comparação com ruído branco 
 
 O problema mais comumente encontrado é o dos autocorrelação dos erros, 
tanto entre instantes consecutivos, isto é 
corr(et|t-1,et-1|t-2) ≠ 0 
 
A primeira coisa a fazer é o gráfico da FAC dos erros, que irá sugerir se existe ou não 
autocorrelação. Para um ruído branco, pode-se mostrar que os coeficientes de autocorrelação 
amostral rk são normalmente distribuídos, com média e variância dados por: 
n
rE k
1)( −≈ e 
n
1
≈ρσ 
 
onde n é o tamanho da série. Portanto, valores de autocorrelação fora da faixa 
nn
21 ±− 
 
Análise e Previsão de Séries Temporais – Henrique Hippert 
servem como indicação de que os erros não estão se comportando como um ruído branco. 
(Uma vez que o termo 1/n praticamente se anula, para séries razoavelmente longas, vários 
autores preferem simplificar, e usar como referência o intervalo n/2± ). Há contudo alguns 
testes estatísticos para detectar autocorrelação na série de erros, que serão visto abaixo. 
 
 
2.2. Teste de Durbin-Watson 
 
O teste de autocorrelação dos erros mais frequentemente usado é o teste de Durbin-
Watson, que procura identificar a existência de autocorrelação de defasamento d=1. O teste é 
baseado na estatística: 
∑
∑
=
−
=
−−−
−
=
n
t
tt
n
t
tttt
e
ee
DW
1
2
1|
2
2
2|11| )(
 
 
O denominador dá uma estimativa da variância dos erros, que serve para padronizar o 
resultado. O importante é o numerador, que dá a soma dos quadrados das diferenças entre os 
erros em instantes sucessivos. Se os erros tem forte autocorrelação positiva, erros grandes 
positivos tenderão a ser seguidos de outros erros grandes positivos; erros grandes negativos 
tenderão a ser seguidos de erros grandes negativos. A diferença entre os erros consecutivos 
tenderá portanto a ser pequena, e o numerador tenderá para zero. Se houver forte 
autocorrelação negativa, erros grandes positivos tenderão a ser seguidos de erros grandes 
negativos, e vice-versa; a diferença entre erros consecutivos tenderá a ser grande, e o 
numerador será grande. 
Pode ser demonstrado que o valor de DW ficará entre 0 e 4. Estes valores extremos 
correspondem a séries com forte autocorrelação positiva (DW=0) e com forte autocorrelação 
negativa (DW=4); os valores intermediários, DW≈2, correspondem a séries sem 
autocorrelação. Existe um teste para a significância do valor amostral encontrado para DW. 
 
 
2.3. Testes portmanteau 
 
O fato de o teste DW identificar apenas a autocorrelação de defasamento d=1 não o 
torna demasiado restritivo, na prática, pois esta é a forma mais comum de autocorrelação, e 
porque séries que tem autocorrelações em defasamentos maiores geralmente também tem 
autocorrelação de defasamento d=1. No entanto, alguns outros testes tem sido desenvolvidos 
com base em vetores de autocorrelações para defasamentos maiores que 1. Estes testes são 
chamados de testes portmanteau, e visam testar a hipótese nula de que 
H0 : ρ1 = ρ2 = ... = ρh = 0 
 
O mais usado deles é provavelmente o teste de Box-Pierce, baseado na estatística 
∑
=
=
h
k
kNQ
1
2ρˆ 
 
Análise e Previsão de Séries Temporais – Henrique Hippert 
onde N é o tamanho da série, k é o defasamento, h é o maior defasamento considerado
(geralmente h=20). Se as autocorrelações ρ forem próximas de zero (em módulo), Q será 
pequeno; se forem altas (positivas ou negativas), Q será grande. 
 Esta estatística foi criada (por Box e Pierce, 1970) para testar os resíduos de um 
modelo de previsão. Se a série de resíduos for um ruído branco, Q terá uma distribuição qui-
quadrado com (h-m) graus de liberdade, onde m é o número de parâmetros do modelo. Para 
testar se uma série qualquer (não modelada) é um ruído branco, basta fazer m=0. 
 Um outro teste baseado na mesma idéia é o teste criado por Ljung e Box (1978). Estes 
autores sugeriram o uso da estatística 
∑
=
−
+=
h
k
k
kN
NNQ
1
2
*
ˆ)2( ρ 
 
que, segundo eles, estaria mais próxima da distribuição qui-quadrado do que a estatística Q. 
 Se o valor de Q ou de Q* estão na região de rejeição de um teste baseado na 
distribuição qui-quadrado (acima do percentil 95 desta distribuição), podemos concluir que a 
série de resíduos não é um ruído branco. Estes testes portmanteau, contudo, não são 
infalíveis; é perigoso aceitar ou rejeitar modelos com base apenas neles. 
 
 
Aula 23 - Transforma��es e ajustes ho.pdf
Análise e Previsão de Séries Temporais - Henrique S. Hippert 
Bacharelado em Estatística – 2011.3 
Disciplina: Análise e Previsão de Séries Temporais I 
Professor: Henrique S. Hippert 
 
Aula 23 – Transformações e ajustes 
 
 
1. Introdução 
 
Às vezes, é conveniente transformar a série original antes da modelagem – isto é, 
substituí-la por uma outra série, obtida por meio de uma função matemática da variável 
original. Isto é feito quando a série não atende aos pressupostos do modelo – na maioria das 
vezes, quando sua variância não é constante, ou quando sua distribuição é não-gaussiana, ou é 
demasiado assimétrica. Uma forma particular de transformação é a diferenciação, feita para 
eliminar a tendência de uma série, e permitir o ajuste de um modelo de nível constante; a 
diferenciação é o equivalente, na matemática discreta, da derivação na matemática contínua, 
e é parte da metodologia para modelagem com modelos ARIMA. 
Os ajustes são pré-tratamentos aplicados à série, que servem, por exemplo, para 
- corrigir irregularidades devidas ao calendário (os meses não tem todos o mesmo número 
de dias, e isto distorce as séries mensais); 
- descontar o efeito de feriados, férias, etc.; 
- descontar efeitos de inflação ou de crescimento populacional, etc. 
 
 
2. Transformações 
 
 O objetivo mais comum de uma transformação é tornar a variância constante; se 
pretende usar modelos ARIMA, também é necessário fazer com que a distribuição das 
observações seja gaussiana. O gráfico da Figura 1 mostra a série airline. Além de haver um 
tendência de crescimento evidente, há também um aumento progressivo da variância; não 
serviria para esta série, por exemplo, um modelo baseado em fatores sazonais constantes 
(como o usado na decomposição clássica, seção ..). 
 
série airline – dados originais 
 
A maneira mais comuns de se transformar uma série é tomar ou o logaritmo ou a raiz 
quadrada das observações. A Figura 2 mostra a série dos logaritmos da série airline; a Figura 
Análise e Previsão de Séries Temporais - Henrique S. Hippert 
3, as séries de raízes quadradas. Pode-se notar que a transformação logarítmica conseguiu 
resultado um pouco melhor; a série transformada pela raiz quadrada ainda mostra crescimento 
da variância, embora de forma menos evidente do que na série original. 
 
transformação logaritmica 
 transformação pela raiz quadrada 
 
Box e Cox (1964) propuseram uma família de transformações não-lineares, da qual 
tanto o logaritmo quanto a raiz quadrada são casos particulares: 



=−
≠−
=
0)ln(
0)(*
λ
λλ
mz
mz
z
t
t
t 1|| ≤λ , ℜ∈m 
 
Estas transformações costumam ser mostradas de formas um pouco diferentes por 
diversos autores. A constante m frequentemente é excluída; as transformações portanto se 
resumem a raízes (se λ≠0) e ao logaritmo (se λ=0). Para escolher valores para os dois 
parâmetros, λ e m (ou apenas para o λ) podemos experimentar um conjunto diversos valores 
escolhidos, transformar a série com cada um deles, e testar a normalidade das séries 
resultantes. O λ escolhido será aquele que leve a uma distribuição das observações mais 
próxima da normal (de acordo com um teste quiquadrado). Outra possibilidade é escolher o λ 
que maximize a verossimilhança da série transformada *tz . 
A modelagem e a previsão são depois feitas sobre a série transformada; é preciso pois 
fazer a transformação inversa sobre as previsões, de modo a obter previsões da variável 
original. Se as previsões da série transformada são expressas na forma de intervalos de 
confiança, estes podem ser também convertidos na variável original, bastando fazer as 
transformações inversas dos limites superior e inferior do intervalo. Isto vai em geral resultar 
em ICs assimétricos (os ICs serão simétricos na variável transformada, suposta gaussiana; na 
variável original, não-gaussiana, serão provavelmente assimétricos). No entanto, a 
confiabilidade destes intervalos é duvidosa, já que se baseiam na suposição de que a variância 
da série é constante ao longo do tempo; o que é verdade na série transformada, mas não na 
série original. 
As transformações são bastante úteis na análise de uma série, pois põem em evidência 
os padrões existentes. Na decomposição clássica, a transformação pode destacar a 
regularidade do padrão sazonal, como foi feito na série airline acima (contudo, a 
decomposição nestes caso também poderia ter sido feita usando um modelo multiplicativo, 
em que a variância depende do nível). 
No entanto, testes empíricos mostram que as transformações parecem não ser muito 
úteis para a previsão. Isto provavelmente ocorre porque a maioria dos modelos de previsão 
usados dão maior ênfase aos valores recentes da série; os valores mais antigos, que seriam 
mais afetados pela transformação, não são praticamente levados em conta no cálculo. 
Aula 19 - Modelos ARIMA ho.pdf
Análise e Previsão de Séries Temporais – Prof. Henrique Hippert 
Bacharelado em Estatística – 2012.1 
Disciplina: Análise e Previsão de Séries Temporais I 
Professor: Henrique S. Hippert 
 
Aula 19 – Modelos não-estacionários: ARIMA 
 
 
1. Introdução 
 
Até agora, temos vistos modelos que podem ser aplicados a séries estacionárias, i.e., 
àquelas em que se supõe que a média e a variância sejam constantes em todos os instantes. 
Estes modelos, contudo, podem parecer muito pouco úteis no mundo real; a maior parte das 
séries que encontramos são, de alguma forma, não-estacionárias. Em algumas delas, as 
médias variam continuamente (por exemplo, nas séries financeiras); em outras, é a variância 
que deixa de ser constante, geralmente crescendo à medida que a média cresce (a série é então 
dita heterocedástica, como no exemplo visto da série airline). 
 
Veremos a seguir os processos ARIMA, que podem ser usados para modelar alguns 
tipos de séries não-estacionárias. A idéia básica é relaxar as restrições que garantem a 
estacionariedade de modelos AR. Nestes modelos, como vimos, é necessário que as raízes da 
equação característica “estejam fora do círculo unitário”. Isto é, dado um modelo AR(p), 
ttp azB =Φ )( 
tt
p
p azBBB =−−−− )...1( 221 φφφ 
 
As raízes da equação característica 
0...1)( 221 =−−−−=Φ ppp BBBB φφφ 
 
devem obedecer a 
1|| >B 
 
Vejamos o que acontece quando estas restrições não são obedecidas. Suponha por 
exemplo o processo definido por
tttt azzz +−= −− 21 25.025.1 (1) 
 
cujas raízes são G1=1 e G2=4. Uma delas é unitária, o que torna o processo não-estacionário. 
A Figura 1 mostra uma realização deste processo, e deixa bem claro que nem a média nem a 
variância são constantes. Os modelos para processos com raiz unitária são denominados 
modelos ARIMA, e iremos estudá-los a seguir. 
Análise e Previsão de Séries Temporais – Prof. Henrique Hippert 
 
Figura 1 – Exemplo de processo com raiz unitária 
. 
 
Suponha agora o modelo definido por 
tttt azzz =+− −− 21 3
2
3
7
 ou 
tt azBB =





+− 2
3
2
3
71 (2) 
 
As raízes são B1= 0,5 e B2=3. Uma delas está dentro do circulo unitário. Este tipo de modelo 
gera um processo “explosivo”, como ilustrado na Figura 2. Este tipo de modelo não será 
estudado no restante do curso. 
 
Figura 2 – Exemplo de processo com raiz dentro do círculo unitário 
 
 
2. O operador de diferenciação de primeira ordem 
 
Os casos de não-estacionariedade estudados serão somente aqueles onde uma ou mais 
das raízes estão sobre o círculo (um ou mais das raízes são unitárias). Lembremos que um 
polinômio de grau p 
p
pp BBBB φφφ −−−−=Φ ...1)( 221 
 
pode ser escrito em função de suas p raízes G1, G2, ..., Gp, na forma: 
)1)(1)...(1)(1()( 1111211 BGBGBGBGB ppp −−−−− −−−−=Φ 
 
Análise e Previsão de Séries Temporais – Prof. Henrique Hippert 
Se uma destas raízes é unitária - por exemplo, Gp - o polinômio característico pode ser escrito 
da forma: 
)1)(1)...(1)(1()( 111211 BBGBGBGB pp −−−−=Φ −−−− 
 
Se usarmos este polinômio para construir um modelo AR, obtemos 
ttp azB =Φ )( 
ttp azBBGBGBG =−−−−
−
−
−− )1)(1)...(1)(1( 111211 (3) 
 
Fazendo 
tt zBw )1( −= (4) 
 
Obtemos uma série estacionária em wt, modelada por um AR(p-1): 
ttp awBGBGBG =−−−
−
−
−− )1)...(1)(1( 111211 
ttp awB =Φ − )(1 
 
O termo (1-B) em (4) é chamado de operador de diferenciação, e corresponde à diferencial 
no Cálculo de variáveis contínuas. Iremos representá-lo por ∇. Portanto 
B−=∇ 1 (5) 
 
Quando aplicado a uma série zt, o operador de diferenciação produz uma série wt que é 
a série de primeiras diferenças entre cada par de valores consecutivos de zt: 
1)1( −−=−=∇= ttttt zzzBzw 
 
Como exemplo, suponha a série zt cujos primeiros 10 valores são dados abaixo: 
zt: 55 56 48 46 56 46 59 60 53 58 
 
a série de primeiras diferenças será dada por 
15556122 =−=−= zzw 
85648233 −=−=−= zzw 
24846344 −=−=−= zzw 
 
(note que a primeira diferença, w1, não é definida; se zt tem n observações, haverá n-1 
diferenças). Para o trecho de série zt acima, obtemos: 
zt: 55 56 48 46 56 46 59 60 53 58 
wt: 1 -8 -2 10 -10 13 1 -7 5 
 
Se um processo não-estacionário tem uma raiz unitária, a série de suas primeiras diferenças 
será estacionária. Por exemplo, se reescrevermos o modelo em (1) em termos de suas raízes, 
obtemos: 
tttt awBzBzBB =





−=∇





−=−





−
4
11
4
11)1(
4
11 
 
Portanto, o processo original AR(2) em zt, não estacionário, é equivalente ao processo AR(1) 
estacionário em wt. A Figura 3 mostra uma realização deste processo (compare com a Figura 
1, para ver a diferença causada pela diferenciação da série). 
Análise e Previsão de Séries Temporais – Prof. Henrique Hippert 
 
Figura 3 – Exemplo de série diferenciada 
 
 
3. Generalização dos operadores de diferenciação 
 
 
(i) Operadores de diferenciação de defasamento k qualquer 
 
Em termos gerais, diferenciar uma série é substituir suas observações originais pelas 
diferenças encontradas entre pares de observações. Se estas observações são consecutivas, as 
diferenças são de primeira ordem, produzidas pelo operador definido em (5). Podemos 
contudo generalizar este operador, criando operadores de diferenciação de defasamento k 
qualquer, representados por ∇k: 
k
k B−=∇ 1 (6) 
 
Aplicado a uma série zt, este operador produz a série de diferenças entre valores defasados de 
k instantes de tempo; este operador será útil mais tarde, para a construção de modelos 
sazonais: 
kttt
k
tk zzzBz −−=−=∇ )1( 
 
(ii) Diferenciação de ordem d qualquer 
 
Os operadores de diferenciação podem ser aplicados duas ou mais de uma vezes 
consecutivas a uma série; isto é análogo à derivar uma função duas ou mais vezes. Diferenciar 
duas vezes uma série equivale a: 
t
t
ttt
ttt
tttt
tttt
ttt
zB
zBB
zBBzz
zzz
zzzz
zzzz
zzZ
2
2
2
21
211
11
2
)1(
)21(
)(2
2
)()(
)(
)(
−=
−−=
−−=
−−=
−−−=
∇−∇=−∇=
∇∇=∇∇=∇
−−
−−−
−−
 
portanto 
22 )1( B−=∇
 
Análise e Previsão de Séries Temporais – Prof. Henrique Hippert 
 generalizando, um operador de diferenciação de ordem d qualquer é dado por: 
dd B)1( −=∇
 (7) 
 
 
(iii) Operador de somatório infinito 
 
A operação inversa da diferenciação de uma série é sua integração, realizada pelo 
operador de somatório infinito, definido como 
11)1( −− ∇=−= BS (8) 
 
Invertendo o operador (1-B) em (4), verificamos que a série zt pode ser obtida pelo somatório 
infinito dos wt passados: 
tt zBw )1( −= 
tt zwB
=





−1
1
 
tt zwBB =+++ ...)1( 2 
tttt zwww =+++ −− ...21 
 
Usando a notação em ∇ e S: 
tt zw ∇= 
tt zw =∇−1 
tt zSw = 
 
Donde se vê que 
t
t
h
ht wBBwSw ...)1( 2 +++== ∑
−∞=
 
...)1( 2 +++= BBS 
 
Note que o somatório acima é infinito; teoricamente, não poderia ser usado aqui, para modelar 
séries finitas. Na prática, contudo, se a série for suficientemente longa, isto não trará 
problemas. 
 
 
(iv) Relação entre os operadores de diferença e somatório com o cálculo 
 
As operações de diferença e somatório são, é fácil ver, as equivalentes na matemática 
discreta das operações de derivação e integração, da matemática contínua. 
Como exemplo, tomemos o caso em que a diferença é uma constante: 
ξ=∇ tz 
ξ+=
−1tt zz 
ξξ ++=
−
)( 2tt zz 
tzzt ξ+= 0 
 
Isto vai corresponder ao caso de uma variável cuja derivada é constante: 
ξ='y → tyy ξ+= 0

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?