Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Análise e previsão de séries temporais. Prof.: Henrique Hippert
Bacharelado em Estatística – 2011.3
Disciplina: Análise e Previsão de Séries Temporais I
Professor: Henrique S. Hippert
Aula 11 –Processos estocásticos
1. Introdução
Processos estocásticos são processos que evoluem no tempo ou no espaço de acordo
com leis probabilísticas (estocástico = aleatório). Estudando estes processos, poderemos criar
modelos probabilísticos para séries temporais.
Formalmente, um processo estocástico (discreto) é uma família de variáveis aleatórias
Zt:
}{ tZZ = para t∈N (1)
Uma maneira de gerar um processo aleatório é repetir um experimento diversas vezes,
em condições idênticas, e a cada instante, observar o resultado Zt. Cada sequência de
observações constitui uma realização do processo. Se fizermos outra série de repetições,
obteremos outra realização, provavelmente com valores diferentes da primeira. Por exemplo,
suponha um experimento que consista em lançar um dado comum 10 vezes, e observar o
número mostrado. A série de 10 valores observados será uma realização; se fizermos outra
série de 10 lançamentos, obteremos outra realização. Como um dado tem 6 faces, poderemos
obter 610 = 60.466.176 realizações diferentes deste processo.
O problema, no estudo de processos estocásticos, será o de inferir as propriedades
estatísticas do processo (média, variância, etc.), a partir de algumas de suas realizações. Um
processo como em eq. (1) é caracterizado por uma distribuição de probabilidade conjunta
),...,( 1 NZZP . Se tivermos 100 realizações, poderemos estudar as propriedades do processo
“transversalmente”; isto é, se temos uma amostra de 100 realizações de Z1, podemos fazer
inferências sobre a média, variância, etc. de Z1. Igualmente, poderemos fazer inferências para
Z2, Z3 ou para qualquer instante t. Além disso, poderemos fazer inferências sobre a
distribuição conjunta de um grupo de variáveis.
Uma série temporal, contudo, pode ser vista como uma realização única de um
processo estocástico; portanto, como uma única série de observações de variáveis aleatórias,
dentre todas as séries de mesmo tamanho que poderiam ter sido geradas pelo mecanismo
probabilístico. Do ponto de vista estatístico, teremos uma amostra com apenas um elemento –
uma série de observações, dentre de todas as possíveis. Ao contrário do que acontece no
exemplo do lançamento de um dado, quando estudamos uma série temporal não podemos
voltar ao passado e observar outra realização do processo; precisamos de nos basear em uma
realização única, o que seria o mesmo que fazer inferência sobre uma população com base em
apenas um ponto amostral.
Para que possamos fazer alguma inferência sobre o mecanismo gerador de uma série
temporal, é claro que precisaremos impor uma restrição ao processo estocástico, caso
contrário o problema seria insolúvel. Esta restrição será a de estacionariedade.
Análise e previsão de séries temporais. Prof.: Henrique Hippert
2. Estacionariedade
Uma classe importante de modelos estocásticos é a dos processos estacionários,
aqueles que supõem que o processo esteja em equilíbrio, variando em torno de uma média
fixa, e mantendo constantes suas propriedades estatísticas.
Formalmente, dizemos que um processo é estritamente estacionário quando suas
propriedades não são afetadas pela mudança da origem do tempos, ou seja, quando a
distribuição conjunta das m observações feitas nos instantes t1, t2, ..., tm é idêntica à das m
observações feitas nos instantes t1+k, t2+k, ..., tm+k:
),...,,(),...,,(
2121 ktktktttt mm zzzfzzzf +++= ∀m
Portanto, para um processo estritamente estacionário, a distribuição conjunta de m
observações consecutivas é sempre a mesma, não sendo afetada pelo deslocamento destas
observações k instantes, para frente ou para trás, ao longo do eixo dos tempos. Fazendo m=0,
vemos que as observações a cada instante têm a mesma distribuição. Na prática, a suposição
de estacionariedade estrita é restritiva demais, e não é muito útil.
Existem outras definições de estacionariedade, menos restritivas. Um processo é
fracamente estacionário, ou estacionário de segunda ordem, se sua média e variância são
constantes, e sua função de autocovariância entre as variáveis zt e zt+k depende somente do
valor absoluto da diferença k entre os instantes, i.e.:
(i) µ== + )()( ktt ZEZE , ∀t
(ii) ∞<=− 222 ,)( σσµtZE , ∀t
(iii) ),(),( mktmtktt ZZZZ ++++ = γγ , ∀m
Note que esta definição impõe condições envolvendo apenas os momentos de primeira
e de segunda ordem. Se o processo for gaussiano, contudo, estas condições irão assegurar que
o processo seja estritamente estacionário (já que gaussianas que tenham os dois primeiros
momentos idênticos são inteiramente idênticas). Nas próximas aulas, veremos processos deste
tipo (modelos ARMA). Mais tarde, estudaremos modelos para várias formas de processos
não-estacionários (modelos ARIMA).
Portanto, para séries estritamente estacionárias (ou fracamente estacionárias, de
distribuição normal), a distribuição conjunta das variáveis Zt e Zt-k será função apenas do
defasamento k entre estas variáveis; portanto, quaisquer propriedades estatísticas, inclusive a
autocovariância, serão funções de k. Isto implica, entre outras coisas, que a autocovariância é
uma função par:
kk −= γγ
),cov(),cov( kttktt ZZZZ −+ =
3. Ruído branco
Um caso particular de processo estocástico é aquele em que os valores sucessivos são
descorrelacionados; este processo é chamado de ruído branco, uma denominação que veio da
Engenharia. Estas processos serão as peças fundamentais para a construção dos modelos
ARIMA (na seção seguinte), uma vez que estes modelos interpretam qualquer série dada
(autocorrelacionada) como função de um ruído branco (descorrelacionado).
Análise e previsão de séries temporais. Prof.: Henrique Hippert
Na Engenharia, um ruído é a parte de um sinal que não traz nenhuma informação útil,
e que poderia ser descartada sem prejudicar o sinal. O zumbido de fundo que ouvimos num
telefone, por exemplo, é um ruído. Uma série temporal descorrelacionada pode ser
considerada um ruído, porque também não traz nenhuma informação útil. Nos modelos
ARIMA (que veremos a seguir), a informação é trazida pela autocorrelação. Se os valores de
uma série tem forte autocorrelação, podemos usar os valores passados para fazer uma
previsão dos fatores futuros. Se a autocorrelação é positiva e os valores passados mais
recentes são altos, é bem provável que os próximos valores futuros também sejam altos; se os
valores passados são baixos, é bem provável que os valores futuros também sejam baixos. (Os
modelos ARIMA nada mais são que uma forma de aproveitar formalmente esta
autocorrelação para melhorar as previsões.) Se uma série é descorrelacionada, contudo, saber
que os valores passados foram altos ou baixos, portanto, não vai nos ajudar em nada nas
previsões, uma vez que valores futuros não tem relação com os passados - nestes casos, a
melhor previsão que podemos fazer é apenas a média da série, como fizemos nos métodos de
amortecimento. A série, portanto, pode ser considerada como um mero ruído, já que não traz
nenhuma informação sobre o futuro. (A série descorrelacionada é chamada de ruído branco
porque pode ser mostrado que ela é o resultado da soma de sinais todas as frequências, assim
como a luz branca é resultante da soma de luzes de todas as frequências).
3.1. Variância dos coeficientes de correlação amostral
Para um processo estacionário onde os choques sejam gaussianos, demonstra-se que :
)222(1)ˆ,ˆcov( 2ijkkkiijkjkiik
i
kijkijiijkkj
n
ρρρρρρρρρρρρρρργ +−+−−
∞
−∞=
−++++ +−−+== ∑
Para
séries longas (valores grandes de n), o estimador kρˆ terá distribuição aproximadamente
gaussiana, de média ρk e variância:
∑
∞
−∞=
−−−+ −+−+≅
i
ikkiikkiikkikiik
n
)224(1)ˆvar( 222 ρρρρρρρρρρρρ
Para processos nos quais a sequência de ρs é finita (isto é, ρk=0 para k>m), pode-se usar a
aproximação de Bartlett, dada por:
)2...221(1)ˆvar( 22221 mk
n
ρρρρ ++++++≅
Na prática, as autocorrelações kρ serão substituídas por seus estimadores amostrais kρˆ .
Para um processo ruído branco, onde os valores são descorrelatados,
0=kρ para k>0
n
k
1)ˆvar( ≅ρ
Este valor poderá ser usado como referência, para avaliar a significância das autocorrelações
estimadas para uma série dada.