CURSO DE ANÁLISE DE SÉRIES TEMPORAIS –...

Post on 22-Aug-2018

218 views 0 download

Transcript of CURSO DE ANÁLISE DE SÉRIES TEMPORAIS –...

1

FACE – Faculdade de Administração, Ciências Contábeis e Ciências Econômicas Curso de Ciências Econômicas Direção FACE Prof. Moisés Ferreira da Cunha Vice-Direção FACE Prof. Mauro Caetano de Souza Coordenação do Curso de Ciências Econômicas Prof.ª Priscila Casari NEPEC – Núcleo de Estudos e Pesquisas Econômicas Coordenação Sérgio Fornazier Meyrelles Filho Endereço Campus Samambaia, Prédio da FACE – Rodovia Goiânia/Nova Veneza, km. 0 – Caixa Postal 131, CEP 74001-970, Goiânia – GO. Tel. (62) 3521 – 1390 URL http://www.face.ufg.br/economia

CURSO DE ANÁLISE DE SÉRIES

TEMPORAIS – MODELO ARIMA

MATERIAL DE APOIO

Professor:

Sandro Eduardo Monsueto

NEPEC/FACE/UFG

Goiânia – Setembro/Outubro 2014

Versão 1.0

2

1. Introdução e conceitos básicos

Esta apostila serve de material de apoio para a realização do curso. Longe de ser

abrangente, tem como objetivo servir de guia ou de lembrete para a execução de

tarefas. Outros materiais, melhores e mais completos, podem ser facilmente

encontrados de forma gratuita na internet e em livros especializados no assunto. Para

realizar as estimações, iremos utilizar o pacote estatístico Gretl, disponível para baixar

gratuitamente no site gretl.sourceforge.net.

A primeira definição necessária para nossa análise é o conceito de série

temporal. Uma série temporal é uma sequência de dados no tempo com uma

determinada periodicidade. Alguns exemplos:

- PIB brasileiro trimestral.

- taxa de juros mensal.

- índice pluviométrico semanal.

- valor das ações da Petrobras minuto a minuto.

Ou seja, é o conjunto de informações sobre uma mesma variável ao longo de

vários períodos sequenciais. Ao longo deste curso, usaremos a seguinte notação

algébrica para representar os dados no tempo:

Yt: a observação no tempo t da variável Y. Yt-1: a observação um período atrás, ou com uma defasagem (lag) temporal. Yt+1: a observação um período a frente. Generalizando: Yt±j: a observação no período t±j Exemplo:

Mês Período Yt Yt-1 Yt+1

1991.01 Y1 3,6 3,9

1991.02 Y2 3,9 3,6 2,5

1991.03 Y3 2,5 3,9 1,9

1991.04 Y4 1,9 2,5 2,7

1991.05 Y5 2,7 1,9 2,4

1991.06 Y6 2,4 2,7 1,6

1991.07 Y7 1,6 2,4 1,6

1991.08 Y8 1,6 1,6 1,7

1991.09 Y9 1,7 1,6 2,5

1991.10 Y10 2,5 1,7 -

O restante do material está constituído de uma série de exemplos estimados com

dados reais ou fictícios e telas explicativas das funções do programa Gretl. Ao longo do

curso serão acrescentados novos exemplos.

3

2. Exemplos de Modelos Autoregressivos – AR(p) AR(1)

Modelo 1: ARMA, usando as observações 1995:01-2010:03 (T = 183)

Variável dependente: ipca

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,571725 0,11237 5,0879 <0,00001 ***

phi_1 0,788617 0,0471062 16,7413 <0,00001 ***

Média var. dependente 0,538361 D.P. var. dependente 0,519166

Média de inovações -0,006069 D.P. das inovações 0,326753

Log da verossimilhança -55,45739 Critério de Akaike 116,9148

Critério de Schwarz 126,5432 Critério Hannan-Quinn 120,8177

Real Imaginária Módulo Frequência

AR

Raiz 1 1,2680 0,0000 1,2680 0,0000

AR(2) Modelo 2: ARMA, usando as observações 1995:01-2010:03 (T = 183)

Variável dependente: ipca

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,569602 0,108703 5,2400 <0,00001 ***

phi_1 0,815008 0,0755062 10,7939 <0,00001 ***

phi_2 -0,0338969 0,0758055 -0,4472 0,65476

Média var. dependente 0,538361 D.P. var. dependente 0,519166

Média de inovações -0,005716 D.P. das inovações 0,326574

Log da verossimilhança -55,35740 Critério de Akaike 118,7148

Critério de Schwarz 131,5527 Critério Hannan-Quinn 123,9187

Real Imaginária Módulo Frequência

AR

Raiz 1 1,2969 0,0000 1,2969 0,0000

Raiz 2 22,7468 0,0000 22,7468 0,0000

AR(3) Modelo 3: ARMA, usando as observações 1995:01-2010:03 (T = 183)

Variável dependente: ipca

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,574432 0,115983 4,9527 <0,00001 ***

phi_1 0,819322 0,0755966 10,8381 <0,00001 ***

phi_2 -0,0819083 0,0988616 -0,8285 0,40738

phi_3 0,0579267 0,0767865 0,7544 0,45062

Média var. dependente 0,538361 D.P. var. dependente 0,519166

Média de inovações -0,006535 D.P. das inovações 0,326053

Log da verossimilhança -55,07385 Critério de Akaike 120,1477

Critério de Schwarz 136,1951 Critério Hannan-Quinn 126,6525

Real Imaginária Módulo Frequência

AR

Raiz 1 1,2395 0,0000 1,2395 0,0000

Raiz 2 0,0873 -3,7310 3,7320 -0,2463

Raiz 3 0,0873 3,7310 3,7320 0,2463

4

Exemplos de modelos AR(p) usando dados da Sefaz/GO:

ICMS – Taxa de crescimento

Modelo 4: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: d_l_ICMS

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00567966 0,00816623 0,6955 0,48674

phi_1 -0,400336 0,0797424 -5,0204 <0,00001 ***

Média var. dependente 0,005959 D.P. var. dependente 0,143210

Média de inovações 0,000328 D.P. das inovações 0,130597

Log da verossimilhança 80,70000 Critério de Akaike -155,4000

Critério de Schwarz -146,7744 Critério Hannan-Quinn -151,8950

Real Imaginária Módulo Frequência

AR

Raiz 1 -2,4979 0,0000 2,4979 0,5000

Modelo 5: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: d_l_ICMS

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00586463 0,00564463 1,0390 0,29882

phi_1 -0,542985 0,0815173 -6,6610 <0,00001 ***

phi_2 -0,354886 0,0815606 -4,3512 0,00001 ***

Média var. dependente 0,005959 D.P. var. dependente 0,143210

Média de inovações 0,000412 D.P. das inovações 0,121990

Log da verossimilhança 89,49711 Critério de Akaike -170,9942

Critério de Schwarz -159,4934 Critério Hannan-Quinn -166,3209

Real Imaginária Módulo Frequência

AR

Raiz 1 -0,7650 -1,4942 1,6786 -0,3253

Raiz 2 -0,7650 1,4942 1,6786 0,3253

5

3. Exemplos de Modelos de Média Móvel – MA(q) MA(1)

Modelo 1: ARMA, usando as observações 1995:01-2010:03 (T = 183)

Variável dependente: ipca

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,543279 0,0464909 11,6857 <0,00001 ***

theta_1 0,611094 0,0422925 14,4492 <0,00001 ***

Média var. dependente 0,538361 D.P. var. dependente 0,519166

Média de inovações -0,001839 D.P. das inovações 0,391161

Log da verossimilhança -88,12918 Critério de Akaike 182,2584

Critério de Schwarz 191,8868 Critério Hannan-Quinn 186,1612

Real Imaginária Módulo Frequência

MA

Raiz 1 -1,6364 0,0000 1,6364 0,5000

MA(2)

Modelo 2: ARMA, usando as observações 1995:01-2010:03 (T = 183)

Variável dependente: ipca

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,546989 0,0585125 9,3482 <0,00001 ***

theta_1 0,881548 0,0774425 11,3833 <0,00001 ***

theta_2 0,387895 0,0583002 6,6534 <0,00001 ***

Média var. dependente 0,538361 D.P. var. dependente 0,519166

Média de inovações -0,002213 D.P. das inovações 0,350163

Log da verossimilhança -68,05490 Critério de Akaike 144,1098

Critério de Schwarz 156,9477 Critério Hannan-Quinn 149,3136

Real Imaginária Módulo Frequência

MA

Raiz 1 -1,1363 -1,1344 1,6056 -0,3751

Raiz 2 -1,1363 1,1344 1,6056 0,3751

MA(3)

Modelo 3: ARMA, usando as observações 1995:01-2010:03 (T = 183)

Variável dependente: ipca

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,550957 0,0646414 8,5233 <0,00001 ***

theta_1 0,782521 0,0735914 10,6333 <0,00001 ***

theta_2 0,5313 0,0810619 6,5542 <0,00001 ***

theta_3 0,251944 0,0703504 3,5813 0,00034 ***

Média var. dependente 0,538361 D.P. var. dependente 0,519166

Média de inovações -0,003248 D.P. das inovações 0,342610

Log da verossimilhança -64,02861 Critério de Akaike 138,0572

Critério de Schwarz 154,1046 Critério Hannan-Quinn 144,5620

Real Imaginária Módulo Frequência

MA

Raiz 1 -1,6714 0,0000 1,6714 0,5000

Raiz 2 -0,2187 -1,5254 1,5410 -0,2727

Raiz 3 -0,2187 1,5254 1,5410 0,2727

6

Exemplos de modelos MA(q) usando dados da Sefaz/GO:

Modelo 4: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: d_l_ICMS

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00560753 0,00080953 6,9269 <0,00001 ***

theta_1 -0,924674 0,0416968 -22,1761 <0,00001 ***

Média var. dependente 0,005959 D.P. var. dependente 0,143210

Média de inovações -0,000695 D.P. das inovações 0,109008

Log da verossimilhança 103,4931 Critério de Akaike -200,9861

Critério de Schwarz -192,3605 Critério Hannan-Quinn -197,4812

Real Imaginária Módulo Frequência

MA

Raiz 1 1,0815 0,0000 1,0815 0,0000

Modelo 5: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: d_l_ICMS

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00570155 0,000691485 8,2454 <0,00001 ***

theta_1 -0,824861 0,0936196 -8,8108 <0,00001 ***

theta_2 -0,115467 0,0992711 -1,1632 0,24477

Média var. dependente 0,005959 D.P. var. dependente 0,143210

Média de inovações -0,002216 D.P. das inovações 0,108390

Log da verossimilhança 104,1715 Critério de Akaike -200,3431

Critério de Schwarz -188,8423 Critério Hannan-Quinn -195,6698

Real Imaginária Módulo Frequência

MA

Raiz 1 1,0562 0,0000 1,0562 0,0000

Raiz 2 -8,1999 0,0000 8,1999 0,5000

7

4. Exemplos de Modelos ARMA (1,1)

Os modelos ARMA (p,q) combinam memória de longo prazo com memória de curto

prazo:

Modelo 1: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: d_l_ICMS

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00569386 0,000702447 8,1057 <0,00001 ***

phi_1 0,102099 0,0982049 1,0397 0,29850

theta_1 -0,945348 0,046179 -20,4714 <0,00001 ***

Média var. dependente 0,005959 D.P. var. dependente 0,143210

Média de inovações -0,002089 D.P. das inovações 0,108501

Log da verossimilhança 104,0450 Critério de Akaike -200,0900

Critério de Schwarz -188,5892 Critério Hannan-Quinn -195,4167

Real Imaginária Módulo Frequência

AR

Raiz 1 9,7944 0,0000 9,7944 0,0000

MA

Raiz 1 1,0578 0,0000 1,0578 0,0000

Modelo 2: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: d_l_agropecuaria

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00140343 0,00101435 1,3836 0,16649

phi_1 0,681096 0,0674072 10,1042 <0,00001 ***

theta_1 -1 0,0236957 -42,2017 <0,00001 ***

Média var. dependente -0,000077 D.P. var. dependente 0,162097

Média de inovações -0,000652 D.P. das inovações 0,148405

Log da verossimilhança 62,41573 Critério de Akaike -116,8315

Critério de Schwarz -105,3307 Critério Hannan-Quinn -112,1582

Real Imaginária Módulo Frequência

AR

Raiz 1 1,4682 0,0000 1,4682 0,0000

MA

Raiz 1 1,0000 0,0000 1,0000 0,0000

8

5. Estimar modelos ARMA/ARIMA no Gretl

Para estimar um modelo da classe ARMA/ARIMA, siga até o menu Modelo, clique

na opção Série Temporal e em seguida na opção ARIMA, como mostra a Figura abaixo:

Após esses passos, a tela abaixo irá aparecer. Selecione a variável que será

utilizada para previsão e delimite as ordens AR(p) e MA(q). Lembre-se que o modelo

ARMA tradicional não possui regressores extras.

Selecione a variável e clique no botão lilás

Define a ordem AR(p) - longo prazo

Define a ordem MA(q) - curto prazo

9

6. O método Box-Jenkins de previsão

O objetivo do método é gerar um modelo com as seguintes características:

i. Estabilidade (módulo das raízes fora do círculo unitário)

ii. Resíduos na forma de Ruído Branco

a. Sem memória

b. Normalmente distribuído

c. Homocedástico

O MÉTODO BOX-JENKINS DE ESTIMAÇÃO DO MODELO ARIMA

10

7. O correlograma

Para gerar o correlograma de uma série temporal, clique sobre uma variável com

o botão direito do mouse e selecione a opção Correlograma:

O Resultado é exemplificado na Figura abaixo. Todas as autocorrelações que

ultrapassam o intervalo de confiança são estatisticamente diferente de zero, indicando

presença de algum tipo de memória na série.

A interpretação do correlograma segue o esperado para cada tipo de modelo

teórico. Seguindo Bueno (2011), temos:

Fonte: Bueno (2011)

Função de Autocorrelação Simples (FAC)

Função de Autocorrelação Parcial (FACP)

11

Correlograma esperado para um AR(1) FAC – decaimento exponencial

FACP – truncada na primeira defasagem

Correlograma esperado para um AR(2)

FAC – decaimento exponencial

FACP – truncada na segunda defasagem

Correlograma esperado para um MA(2)

FAC – truncada na segunda defasagem

FACP – decaimento exponencial

Correlograma esperado para um ARMA(2,1)

FAC – truncada na primeira e decaimento exponencial a partir da segunda defasagem

FACP – truncada na segunda e decaimento exponencial a partir da terceira defasagem

Contudo, lembre-se que na prática a identificação visual do modelo é

complicada, devendo o pesquisador utilizar o processo de tentativa e erro do

fluxograma apresentado anteriormente. Ou seja, a próxima etapa é verificar se o

modelo é estável para, em seguida, realizar o diagnóstico dos resíduos.

12

8. Estabilidade do modelo

Para verificar a estabilidade, basta observar se os módulos das raízes do modelo

são maiores do que 1, ou seja, se estão fora do círculo unitário. Se o modelo for não-

estável, volte à fase de identificação (correlograma) e escolha outra especificação. Se

obtiver estabilidade, prossiga para fase de diagnóstico dos resíduos.

Exemplo de modelo não-estável (raízes no círculo unitário).

Exemplo de modelo estável (raízes fora do círculo unitário).

O módulo da raiz MA(1) não está fora do círculo unitário

O módulo de cada raiz está fora do círculo unitário

13

9. Diagnóstico de resíduos

Este diagnóstico tem como objetivo verificar se os resíduos são ruído branco, ou

seja, sem memória, normalmente distribuídos e homocedásticos (variância constante).

Para testar a presença de memória, são usados dois testes: o Correlograma dos

Resíduos e a estatística Ljung-Box. Ambas são acessadas na tela de resultados do

modelo, no menu Gráficos, opção Correlograma dos resíduos, como mostra a figura:

Teste da memória dos resíduos (correlograma e Ljung-Box)

Basta clicar em OK para o Gretl gerar

o correlograma dos resíduos e o

teste de Ljung-Box.

Neste resultado, vemos que o

correlograma dos resíduos

apresenta correlações

(memórias) significativamente

diferente de zero (barras

rompendo o intervalo de

confiança)

É um indício de que o modelo

não está bem estimado.

14

Da mesma forma, o Ljung-Box

confirma a presença de memória

nos resíduos, como mostram os

baixo [p-valores] obtidos após a 5ª

defasagem.

Um bom modelo exibe um [p-

valor] alto para todas as

defasagens, evidenciando a não

rejeição da hipótese nula de

correlação igual a zero.

Abaixo, vemos um exemplo do que seria um resíduo de um bom modelo

estimado, sem memória tanto pelo correlograma como pelo teste Ljung-Box:

Teste de normalidade dos resíduos

Para testar a

normalidade dos

resíduos, na tela do

modelo estimado,

clique no menu Testes

e na opção

Normalidade dos

resíduos.

15

O GRETL exibe um histograma dos

resíduos e o resultado do teste de

Doornik-Hansen na parte superior

esquerda da tela. Um p-valor (entre

colchetes) alto revela a não rejeição da

hipótese nula de normalidade dos

resíduos.

Um p-valor muito baixo mostra a

necessidade de se estimar um novo

modelo.

Teste ARCH para heterocedasticidade

O teste ARCH tem como

objetivo verificar se os resíduos

do modelo apresentam

variância constante

(homocedasticidade).

Menu Testes, opção ARCH.

Um p-valor muito alto revela a

não rejeição da hipótese nula de

homocedasticidade.

Um p-valor muito baixo mostra

que os resíduos são

heterocedásticos e um novo

modelo deve ser estimado

10. Comparação entre modelos

Na prática, mais de um modelo pode ser usado para representar a evolução da

série analisada. O pesquisador deve selecionar ao menos dois “modelos candidatos”

para compará-los e escolher qual deles será usado para a previsão. Um modelo

16

candidato é um modelo que passou por todos os diagnósticos anteriores. A escolha está,

em geral, baseada no equilíbrio entre parcimônia (economia de coeficientes) e nível de

ajustamento. Desta forma, três critérios gerais são comumente empregados:

1. Critérios de Informação: o GRETL fornece três critérios de informação. Estão disponíveis automaticamente sempre que um modelo é estimado.

Deve-se buscar privilegiar o modelo que gerar os menores critérios de informação

2. Erro Médio e Erro Quadrado Médio: disponíveis no menu Análise, opção

Mostrar efetivo, ajustado, resíduos.

Quanto menores os erros médios, melhor é o nível de ajustamento do modelo e melhor tende a ser a qualidade da previsão

3. Significância dos coeficientes: em geral, busca-se eliminar os coeficientes de

memória que são não significativos, principalmente os últimos de cada ordem (AR ou MA).

Coeficiente significativo a 10% Coeficiente não significativo (p-valor muito alto)

17

11. Previsão Escolhido o modelo de análise, deve-se partir para a etapa de previsão. No GRETL

a previsão é bem simples. Suponha que desejamos prever o resultado de uma variável

k períodos a frente:

A previsão k períodos a

frente pode ser feita por

meio do menu Análise,

opção Previsões....

• Período para realizar a previsão

• Método de previsão (o mais usado

é a previsão automática)

• Opções para exibir o intervalo de

confiança da previsão

18

12. Séries não estacionárias Até aqui, estávamos supondo que as séries eram estacionárias, ou seja, que

mantinham constante suas características fundamentais. Contudo, a maior parte das

séries econômicas apresentam algum tipo de tendência, fazendo com que sua média se

altere ao longo do tempo.

De maneira geral, trabalhamos com dois tipos de tendência:

• Tendência Determinística: gira em torno de um eixo aproximadamente fixo no

tempo. Também conhecidas como séries TSP (Trend Stationary Process -

Processo de Tendência Estacionária).

• Tendência Estocástica: não gira em torno a um eixo fixo, mas sim um eixo que se

altera com o passar do tempo. É também denominada de DSP (Difference

Stationary Process – Processo Estacionário por Diferença) ou ainda processo com

Raiz Unitária.

Antes de realizar a estimação do modelo ARMA, é necessário eliminar ou tratar

a tendência da séria. Cada tipo de tendência tem um tratamento diferente. No caso de

uma série do tipo DSP (raiz unitária), o caminho natural é a diferenciação, ou seja,

transformando a variável em sua primeira diferença. Em geral, a primeira diferença de

uma série é estacionaria.

Taxa de desemprego (em nível) Taxa de desemprego em primeira diferença

Logarítmo da Arrecadação na Agropecuária (em nível)

Primeira difeença do logaritmo da arrecadação na agropecuária

3

4

5

6

7

8

9

10

1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

desem

pre

go

-1,5

-1

-0,5

0

0,5

1

1,5

2

2,5

1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

d_desem

pre

go

16

16,2

16,4

16,6

16,8

17

17,2

2004 2006 2008 2010 2012 2014

l_agro

pecuaria

-0,6

-0,5

-0,4

-0,3

-0,2

-0,1

0

0,1

0,2

0,3

0,4

2004 2006 2008 2010 2012 2014

d_l_

agro

pecuaria

19

Para a situação de tendência determinística (TSP) deve-se primeiro extrair o

componente determinístico por meio de um modelo de M.Q.O. e utilizar os resíduos

estimados para modelar um ARMA. Uma alternativa seria estimar um modelo ARMAX,

onde X representa um conjunto de variáveis explicativas exógenas. No nosso caso, X

seria a tendência temporal determinística. As próximas seções mostram como

operacionalizar estas três situações (DSP, TSP e ARIMAX) no Gretl.

13. Modelo ARIMA (p,d,q) O modelo ARIMA (p,d,q) é o indicado quando a série apresenta uma raiz unitária

ou tendência estocástica. Neste caso, podem ser tomados dois caminhos pelo Gretl. A

primeira opção é gerar a primeira diferença da variável e estimar um modelo ARMA (p,q)

sobre esta nova série estacionária.

Para gerar a primeira diferença de

uma série, selecione a variável e siga

até o menu Acrescentar, e depois na

opção Primeiras diferenças das

variáveis selecionadas.

Alternativamente, o pesquisador pode estimar diretamente um modelo ARIMA

(p,d,q) onde d é a quantidade de vezes que é preciso diferenciar a série original para se

obter algo estacionário. A estimação de um modelo ARIMA no Gretl segue os mesmos

passos de um modelo ARMA, com o adicional de que agora precisamos definir a ordem

de integração da série:

Define a ordem de integração da série

Após entrar pelo menu Modelos, opção Séries

Temporais, ARIMA, selecione as ordem p,d,q

20

Note que, em termos de modelo, é a mesma coisa estimar um modelo

ARIMA(p,d,q) diretamente sobre a série original e estimar um ARMA (p,q) sobre a

primeira diferença das séries. Vemos estas duas alternativas nos modelos 1 e 2

respectivamente:

Estimando um ARIMA (1,1,1) para a série de L_energia original Modelo 1: ARIMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: (1-L) l_ENERGIA

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00468105 0,00806734 0,5802 0,56175

phi_1 -0,22456 0,112379 -1,9982 0,04569 **

theta_1 -0,746504 0,0918233 -8,1298 <0,00001 ***

Média var. dependente 0,006812 D.P. var. dependente 0,618222

Média de inovações 0,003483 D.P. das inovações 0,434964

Log da verossimilhança -77,41286 Critério de Akaike 162,8257

Critério de Schwarz 174,3265 Critério Hannan-Quinn 167,4990

Real Imaginária Módulo Frequência

AR

Raiz 1 -4,4532 0,0000 4,4532 0,5000

MA

Raiz 1 1,3396 0,0000 1,3396 0,0000

Estimando um ARMA(1,1) para a primeira diferença da série de L_energia Modelo 2: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: d_l_ENERGIA

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00468105 0,00806734 0,5802 0,56175

phi_1 -0,22456 0,112379 -1,9982 0,04569 **

theta_1 -0,746504 0,0918233 -8,1298 <0,00001 ***

Média var. dependente 0,006812 D.P. var. dependente 0,618222

Média de inovações 0,003483 D.P. das inovações 0,434964

Log da verossimilhança -77,41286 Critério de Akaike 162,8257

Critério de Schwarz 174,3265 Critério Hannan-Quinn 167,4990

Real Imaginária Módulo Frequência

AR

Raiz 1 -4,4532 0,0000 4,4532 0,5000

MA

Raiz 1 1,3396 0,0000 1,3396 0,0000

A diferença entre eles está no resultado da previsão. Enquanto o Modelo 1 faz a

previsão da série original, o Modelo 2 tem como previsão a primeira diferença da série.

Desta forma, na maior parte dos casos, é mais interessante estimar diretamente um

modelo ARIMA.

21

Observações importantes:

i. O correlograma para identificação inicial das ordens AR(p) e MA(q)

devem ser feitas em cima da primeira diferença da série.

ii. Deve-se sempre verificar se a primeira diferença é de fato estacionária.

14. Séries com tendência determinística Para se estimar um modelo com tenência determinística, devemos primeiro

extrair o componente determinístico por meio de um modelo de Mínimos Quadrados

Ordinários. As etapas são:

1. Rodar um modelo de M.Q.O. com a tendência temporal como variável

dependente.

2. Extrair os resíduos deste modelo estimado.

3. Estimar um modelo ARMA(p,q) sobre os resíduos.

Para acrescentar uma tendência

temporal, clique no menu

Acrescentar e depois na opção

Tendência Temporal.

No menu Modelo, selecione a

opção Mínimos Quadrados

Ordinários. Acrescente a variável

time na lista de Regressores e

estime o modelo.

22

Depois de estimado o modelo, salve os resíduos por meio do menu Salvar, opção Resíduos. Isso irá gerar uma nova variável na base de dados.

Abaixo, seguem os resultados para o tratamento da tendência determinística da

arrecadação do setor de Energia (em logaritmos).

Extração da tendência determinística Modelo 12: MQO, usando as observações 2003:01-2013:12 (T = 132)

Variável dependente: l_ENERGIA

Coeficiente Erro Padrão razão-t p-valor

const 17,7131 0,0773861 228,8933 <0,00001 ***

time 0,0050459 0,00100969 4,9975 <0,00001 ***

Média var. dependente 18,04870 D.P. var. dependente 0,480775

Soma resíd. quadrados 25,40026 E.P. da regressão 0,442026

R-quadrado 0,161153 R-quadrado ajustado 0,154700

F(1, 130) 24,97460 P-valor(F) 1,84e-06

Log da verossimilhança -78,52907 Critério de Akaike 161,0581

Critério de Schwarz 166,8237 Critério Hannan-Quinn 163,4010

rô 0,021395 Durbin-Watson 1,956131

Arrecadação do setor de energia Resíduos do modelo de M.Q.O.

16

16,5

17

17,5

18

18,5

19

19,5

20

2004 2006 2008 2010 2012 2014

l_EN

ER

GIA

-2

-1,5

-1

-0,5

0

0,5

1

1,5

2004 2006 2008 2010 2012 2014

resíd

uo

Resíduos da regressão (= observados - ajustados l_ENERGIA)

23

Modelo ARMA (1,1) sobre os resíduos de M.Q.O. – após extrair a tendência determinística

Modelo 13: ARMA, usando as observações 2003:01-2013:12 (T = 132)

Variável dependente: uhat12

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00370065 0,0635819 0,0582 0,95359

phi_1 0,852921 0,0951371 8,9652 <0,00001 ***

theta_1 -0,744821 0,112997 -6,5915 <0,00001 ***

Média var. dependente -1,16e-15 D.P. var. dependente 0,440335

Média de inovações -0,001374 D.P. das inovações 0,429159

Log da verossimilhança -75,68339 Critério de Akaike 159,3668

Critério de Schwarz 170,8980 Critério Hannan-Quinn 164,0525

Real Imaginária Módulo Frequência

AR

Raiz 1 1,1724 0,0000 1,1724 0,0000

MA

Raiz 1 1,3426 0,0000 1,3426 0,0000

15. Modelo ARMAX para a tendência determinística Alternativamente, a tendência determinística pode ser modelada junto com o

modelo ARMA (p,q), utilizando a tendência temporal como variável exógena. Neste contexto, o modelo ARMA passa a ser conhecido como ARMAX, onde o X representa o conjunto de variáveis extra.

Modelo ARMAX (1,1) para L_energia – compare com o modelo 13 da seção anterior.

Modelo 14: ARMAX, usando as observações 2003:01-2013:12 (T = 132)

Variável dependente: l_ENERGIA

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 17,7187 0,123729 143,2058 <0,00001 ***

phi_1 0,852917 0,0951118 8,9675 <0,00001 ***

theta_1 -0,744809 0,112962 -6,5935 <0,00001 ***

time 0,00501748 0,00159592 3,1439 0,00167 ***

Média var. dependente 18,04870 D.P. var. dependente 0,480775

Média de inovações -0,001349 D.P. das inovações 0,429158

Log da verossimilhança -75,68323 Critério de Akaike 161,3665

Critério de Schwarz 175,7805 Critério Hannan-Quinn 167,2237

Real Imaginária Módulo Frequência

AR

Raiz 1 1,1724 0,0000 1,1724 0,0000

MA

Raiz 1 1,3426 0,0000 1,3426 0,0000

24

Para estimar um modelo ARMAX, basta acrescentar variáveis extra na lista de Regressores. No nosso caso, acrescentamos a variável time, que é a tendência temporal.

16. Teste de Dickey-Fuller Aumentado (ADF)

O teste ADF foi originalmente desenhado para captar a presença de raiz unitária

na série (DSP). Contudo, também pode ser empregado para detectar a ocorrência de

tendência determinística (TSP). O teste possui a seguinte hipótese nula:

Ho: Presença de Raiz Unitária

Ha: Sem Raiz Unitária

Pode-se comparar o valor da estatística calculada com a tabela de valores críticos

de Dickey-fuller ou utilizar diretamente o p-valor. Um p-valor elevado (geralmente acima de 0,10) aponta para a não rejeição de Ho e evidencia a presença de raiz unitária na série. Por exemplo, o quadro abaixo mostra as três versões do teste para a taxa de desemprego no Brasil. A esquerda, os p-valores elevados mostram que a série original apresenta uma raiz unitária, enquanto sua primeira diferença aparenta ser estacionária.

Teste para Desemprego em nível Teste para a primeira diferença do desemprego

Teste de Dickey-Fuller para desemprego

dimensão de amostragem 111

hipótese nula de raiz unitária: a = 1

teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + e

coeficiente de 1ª ordem para e: -0,029

valor estimado de (a - 1): 0,000551086

estatística de teste: tau_nc(1) = 0,0669027

p-valor 0,702

teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + e

coeficiente de 1ª ordem para e: 0,014

valor estimado de (a - 1): -0,0750893

estatística de teste: tau_c(1) = -1,9269

p-valor 0,319

com constante e tendência

modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + e

coeficiente de 1ª ordem para e: 0,038

valor estimado de (a - 1): -0,153099

estatística de teste: tau_ct(1) = -3,01459

p-valor 0,133

Teste de Dickey-Fuller para d_desemprego

dimensão de amostragem 110

hipótese nula de raiz unitária: a = 1

teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + e

coeficiente de 1ª ordem para e: -0,005

valor estimado de (a - 1): -1,02869

estatística de teste: tau_nc(1) = -10,7045

p-valor 1,639e-068

teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + e

coeficiente de 1ª ordem para e: -0,005

valor estimado de (a - 1): -1,03106

estatística de teste: tau_c(1) = -10,6734

p-valor 3,585e-015

com constante e tendência

modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + e

coeficiente de 1ª ordem para e: -0,006

valor estimado de (a - 1): -1,03417

estatística de teste: tau_ct(1) = -10,6509

p-valor 4,921e-014

25

Contudo, a ausência de raiz unitária não implica necessariamente em uma série estacionaria, uma vez que ainda pode estar presente a tendência determinística. Para identificação correta, deve-se aplicar o teste ADF em sua versão mais completa disponível no Gretl.

Para realizar o teste ADF, siga o esquema abaixo:

Selecione a variável, clique no menu Variável, e depois na opção Testes de raiz

unitária, teste de Dickey-Fuller aumentado.

• Determina a ordem máxima para o teste. O Gretl calcula automaticamente usando a fórmula

� = ��� �12 ∗ � �100��/��

Onde T é o número de observações da base de dados.

• Marcar essa opção para visualizar todo o resultado do teste.

26

O fluxograma abaixo pode ajudar a interpretar o resultado completo do teste ADF e identificar o tipo de tendência da série.

Abaixo, seguem alguns exemplos de aplicação do teste, seguindo a interpretação

deste fluxograma:

27

Teste ADF para L_agropecuaria Teste Aumentado de Dickey-Fuller para l_agropecuaria

incluindo 10 defasagens de (1-L)l_agropecuaria

(o máximo foi 12, critério estatística-t)

dimensão de amostragem 121

hipótese nula de raiz unitária: a = 1

teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: -0,036

diferenças defasadas: F(10, 110) = 5,480 [0,0000]

valor estimado de (a - 1): 0,000232479

estatística de teste: tau_nc(1) = 0,31619

p-valor assintótico 0,777

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:12-2013:12 (T = 121)

Variável dependente: d_l_agropecuaria

coeficiente erro padrão razão-t p-valor

----------------------------------------------------------------

l_agropecuaria_1 0,000232479 0,000735252 0,3162 0,7770

d_l_agropecuar~_1 -0,368625 0,0945622 -3,898 0,0002 ***

d_l_agropecuar~_2 -0,411156 0,0988597 -4,159 6,36e-05 ***

d_l_agropecuar~_3 -0,191574 0,0980168 -1,955 0,0532 *

d_l_agropecuar~_4 -0,279691 0,0916272 -3,052 0,0028 ***

d_l_agropecuar~_5 -0,377815 0,0883527 -4,276 4,07e-05 ***

d_l_agropecuar~_6 -0,289086 0,0865691 -3,339 0,0011 ***

d_l_agropecuar~_7 -0,466409 0,0905514 -5,151 1,15e-06 ***

d_l_agropecuar~_8 -0,391866 0,0980797 -3,995 0,0001 ***

d_l_agropecuar~_9 -0,169873 0,100041 -1,698 0,0923 *

d_l_agropecua~_10 -0,263887 0,0928801 -2,841 0,0054 ***

AIC: -131,382 BIC: -100,629 HQC: -118,892

teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: -0,029

diferenças defasadas: F(10, 109) = 3,331 [0,0008]

valor estimado de (a - 1): -0,127696

estatística de teste: tau_c(1) = -1,25345

p-valor assintótico 0,6533

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:12-2013:12 (T = 121)

Variável dependente: d_l_agropecuaria

coeficiente erro padrão razão-t p-valor

---------------------------------------------------------------

const 2,13351 1,69898 1,256 0,2119

l_agropecuaria_1 -0,127696 0,101876 -1,253 0,6533

d_l_agropecuar~_1 -0,256666 0,129785 -1,978 0,0505 *

d_l_agropecuar~_2 -0,306019 0,129352 -2,366 0,0198 **

d_l_agropecuar~_3 -0,100402 0,121772 -0,8245 0,4115

d_l_agropecuar~_4 -0,198588 0,111906 -1,775 0,0788 *

d_l_agropecuar~_5 -0,306871 0,104676 -2,932 0,0041 ***

d_l_agropecuar~_6 -0,229387 0,0985655 -2,327 0,0218 **

d_l_agropecuar~_7 -0,412725 0,0999217 -4,130 7,12e-05 ***

d_l_agropecuar~_8 -0,348893 0,103636 -3,367 0,0011 ***

d_l_agropecuar~_9 -0,138856 0,102791 -1,351 0,1795

d_l_agropecua~_10 -0,241807 0,0942914 -2,564 0,0117 **

AIC: -131,12 BIC: -97,5709 HQC: -117,495

com constante e tendência

modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: -0,026

diferenças defasadas: F(10, 108) = 3,298 [0,0009]

valor estimado de (a - 1): -0,204218

estatística de teste: tau_ct(1) = -1,69067

p-valor assintótico 0,7557

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:12-2013:12 (T = 121)

Variável dependente: d_l_agropecuaria

coeficiente erro padrão razão-t p-valor

---------------------------------------------------------------

const 3,37431 1,99834 1,689 0,0942 *

l_agropecuaria_1 -0,204218 0,120792 -1,691 0,7557

d_l_agropecuar~_1 -0,198983 0,138563 -1,436 0,1539

d_l_agropecuar~_2 -0,259038 0,135186 -1,916 0,0580 *

d_l_agropecuar~_3 -0,0581789 0,126769 -0,4589 0,6472

d_l_agropecuar~_4 -0,160038 0,116437 -1,374 0,1721

d_l_agropecuar~_5 -0,271180 0,108827 -2,492 0,0142 **

d_l_agropecuar~_6 -0,203823 0,100775 -2,023 0,0456 **

d_l_agropecuar~_7 -0,394122 0,100999 -3,902 0,0002 ***

d_l_agropecuar~_8 -0,338045 0,103868 -3,255 0,0015 ***

d_l_agropecuar~_9 -0,132927 0,102737 -1,294 0,1985

d_l_agropecua~_10 -0,236548 0,0942346 -2,510 0,0135 **

time 0,000492543 0,000419508 1,174 0,2429

AIC: -130,655 BIC: -94,3098 HQC: -115,894

Sem evidência de tendência determinística. Mas com p-valor auto para o teste de raiz unitária. Subir para a versão sem tendência.

Constante não significativa e p-valor alto para o teste de raiz unitária. Subir para a versão sem constante.

Evidência de raiz unitária

28

Teste ADF para L_deduções Teste Aumentado de Dickey-Fuller para l_deducoes

incluindo 9 defasagens de (1-L)l_deducoes

(o máximo foi 12, critério estatística-t)

dimensão de amostragem 122

hipótese nula de raiz unitária: a = 1

teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: 0,018

diferenças defasadas: F(9, 112) = 7,901 [0,0000]

valor estimado de (a - 1): 0,00223531

estatística de teste: tau_nc(1) = 1,92907

p-valor assintótico 0,9876

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:11-2013:12 (T = 122)

Variável dependente: d_l_deducoes

coeficiente erro padrão razão-t p-valor

----------------------------------------------------------------

l_deducoes_1 0,00223531 0,00115875 1,929 0,9876

d_l_deducoes_1 -0,690832 0,0933976 -7,397 2,74e-011 ***

d_l_deducoes_2 -0,490202 0,113904 -4,304 3,61e-05 ***

d_l_deducoes_3 -0,143804 0,122894 -1,170 0,2444

d_l_deducoes_4 -0,192615 0,123442 -1,560 0,1215

d_l_deducoes_5 -0,0733609 0,124632 -0,5886 0,5573

d_l_deducoes_6 -0,0598205 0,123578 -0,4841 0,6293

d_l_deducoes_7 0,0466701 0,122876 0,3798 0,7048

d_l_deducoes_8 0,0462044 0,113691 0,4064 0,6852

d_l_deducoes_9 0,153787 0,0931313 1,651 0,1015

AIC: -28,9695 BIC: -0,929251 HQC: -17,5804

teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: -0,012

diferenças defasadas: F(2, 125) = 32,965 [0,0000]

valor estimado de (a - 1): -0,0012576

estatística de teste: tau_c(1) = -0,0565259

p-valor assintótico 0,9522

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:04-2013:12 (T = 129)

Variável dependente: d_l_deducoes

coeficiente erro padrão razão-t p-valor

-----------------------------------------------------------------

const 0,0595967 0,416673 0,1430 0,8865

l_deducoes_1 -0,00125760 0,0222483 -0,05653 0,9522

d_l_deducoes_1 -0,674027 0,0837187 -8,051 5,50e-013 ***

d_l_deducoes_2 -0,403558 0,0824872 -4,892 3,00e-06 ***

AIC: -42,6647 BIC: -31,2255 HQC: -38,0168

com constante e tendência

modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: 0,017

diferenças defasadas: F(9, 110) = 4,740 [0,0000]

valor estimado de (a - 1): -0,169562

estatística de teste: tau_ct(1) = -2,29238

p-valor assintótico 0,4376

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:11-2013:12 (T = 122)

Variável dependente: d_l_deducoes

coeficiente erro padrão razão-t p-valor

---------------------------------------------------------------

const 2,92584 1,27459 2,296 0,0236 **

l_deducoes_1 -0,169562 0,0739674 -2,292 0,4376

d_l_deducoes_1 -0,573802 0,107125 -5,356 4,71e-07 ***

d_l_deducoes_2 -0,410086 0,120289 -3,409 0,0009 ***

d_l_deducoes_3 -0,0885861 0,126511 -0,7002 0,4853

d_l_deducoes_4 -0,144025 0,126401 -1,139 0,2570

d_l_deducoes_5 -0,0372025 0,126578 -0,2939 0,7694

d_l_deducoes_6 -0,0316024 0,124664 -0,2535 0,8004

d_l_deducoes_7 0,0707518 0,123450 0,5731 0,5677

d_l_deducoes_8 0,0647471 0,113449 0,5707 0,5694

d_l_deducoes_9 0,161771 0,0921629 1,755 0,0820 *

time 0,00409814 0,00164218 2,496 0,0141 **

AIC: -31,6994 BIC: 1,94888 HQC: -18,0325

Evidência de misto TSP/DSP

29

Teste ADF para L_Folha Teste Aumentado de Dickey-Fuller para l_Folha

incluindo 7 defasagens de (1-L)l_Folha

(o máximo foi 12, critério estatística-t)

dimensão de amostragem 124

hipótese nula de raiz unitária: a = 1

teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: -0,013

diferenças defasadas: F(7, 116) = 11,119 [0,0000]

valor estimado de (a - 1): 0,00132659

estatística de teste: tau_nc(1) = 0,636633

p-valor assintótico 0,8538

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:09-2013:12 (T = 124)

Variável dependente: d_l_Folha

coeficiente erro padrão razão-t p-valor

-------------------------------------------------------------

l_Folha_1 0,00132659 0,00208376 0,6366 0,8538

d_l_Folha_1 -0,793613 0,0914723 -8,676 2,94e-014 ***

d_l_Folha_2 -0,625926 0,112921 -5,543 1,89e-07 ***

d_l_Folha_3 -0,488779 0,121801 -4,013 0,0001 ***

d_l_Folha_4 -0,478322 0,121962 -3,922 0,0001 ***

d_l_Folha_5 -0,398513 0,121483 -3,280 0,0014 ***

d_l_Folha_6 -0,321879 0,112567 -2,859 0,0050 ***

d_l_Folha_7 -0,173662 0,0898867 -1,932 0,0558 *

AIC: 168,31 BIC: 190,873 HQC: 177,476

teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: -0,004

diferenças defasadas: F(2, 125) = 3,846 [0,0239]

valor estimado de (a - 1): -0,490125

estatística de teste: tau_c(1) = -4,22483

p-valor assintótico 0,0005936

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:04-2013:12 (T = 129)

Variável dependente: d_l_Folha

coeficiente erro padrão razão-t p-valor

------------------------------------------------------------

const 9,82062 2,32168 4,230 4,48e-05 ***

l_Folha_1 -0,490125 0,116011 -4,225 0,0006 ***

d_l_Folha_1 -0,306429 0,110517 -2,773 0,0064 ***

d_l_Folha_2 -0,144649 0,0878458 -1,647 0,1021

AIC: 167,034 BIC: 178,473 HQC: 171,682

com constante e tendência

modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: -0,002

diferenças defasadas: F(11, 106) = 0,668 [0,7658]

valor estimado de (a - 1): -1,582

estatística de teste: tau_ct(1) = -4,44467

p-valor assintótico 0,001802

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2004:01-2013:12 (T = 120)

Variável dependente: d_l_Folha

coeficiente erro padrão razão-t p-valor

-------------------------------------------------------------

const 30,9189 6,95904 4,443 2,19e-05 ***

l_Folha_1 -1,58200 0,355932 -4,445 0,0018 ***

d_l_Folha_1 0,605438 0,333554 1,815 0,0723 *

d_l_Folha_2 0,620036 0,313240 1,979 0,0504 *

d_l_Folha_3 0,611657 0,294133 2,080 0,0400 **

d_l_Folha_4 0,478752 0,275824 1,736 0,0855 *

d_l_Folha_5 0,421578 0,253303 1,664 0,0990 *

d_l_Folha_6 0,353092 0,228215 1,547 0,1248

d_l_Folha_7 0,339274 0,203769 1,665 0,0989 *

d_l_Folha_8 0,341226 0,178363 1,913 0,0584 *

d_l_Folha_9 0,277195 0,156155 1,775 0,0787 *

d_l_Folha_10 0,228383 0,129193 1,768 0,0800 *

d_l_Folha_11 0,164162 0,0929386 1,766 0,0802 *

time 0,0105217 0,00253157 4,156 6,58e-05 ***

AIC: 154,267 BIC: 193,291 HQC: 170,115

Sem evidência de raiz unitária e com tendência determinística significativa. Evidência de série TSP

30

17. Sazonalidade As séries econômicas, principalmente as brasileiras, podem estar sujeitos à

sazonalidade, gerada por fenômenos que tendem a ocorrer sempre na mesma época do ano, como safras agrícolas, férias e datas comemorativas. A sazonalidade é um componente de memória e pode ser modelada juntamente com uma estimativa ARMA/ARIMA. Alternativamente, o pesquisador pode estar interessado em retirar a sazonalidade da série e trabalhar com um processo livre deste componente.

Métodos para retirar a Sazonalidade Métodos para modelar a Sazonalidade

• Suavização por média móvel

• Suavização exponencial

• X-12-ARIMA

• ARMA degenerado

• SARMA(p,q)(P,Q)

• ARMAX com dummies periódicas

17. Suavização por média móvel

Salvar a série suavizada

Define a quantidade de meses usada na média móvel

31

18. Suavização exponencial

19. X-12-ARIMA Para obter uma série dessazonalizada com o método X-12-ARIMA, é necessário

instalar um pacote extra no Gretl. Para isso, siga os passos abaixo:

1. Na página principal do Gretl na internet, clique na opção “Gretl for Windows” na parte esquerda.

Determina o valor de α. Quanto maior este valor, maior o peso no presente.

Yt*=αYt-1 + (1-α)Y*t-1

32

2. Baixe o pacote X-12-ARIMA clicando na opção x12a.install.exe 3. Irá abrir uma página do sourceforge.net. Espere alguns segundos e o download será

iniciado.

4. Instale o programa baixado seguindo os passos do instalador. É necessário que o Gretl

não esteja aberto neste momento.

5. Depois de instalado o programa, o pacote X-12-ARIMA estará disponível no Gretl

sempre que o usuário abrir uma base de dados como série temporal mensal ou

trimestral.

6. O pacote X-12-ARIMA pode ser acessado no menu Variável ���� Análise X-12-ARIMA OBS: TEM QUE SELECIONAR A VARIÁVEL PRIMEIRO !!

33

7. Na figura abaixo, está a configuração básica para se criar uma série com ajuste sazonal. Neste exemplo, será criada a variável ipcm_d11, que é o IPCM dessazonalizado.

20. ARMA degenerado

• Define as ordens específicas de defasagens

34

Exemplo de um modelo ARIMA[(1,12), 1, 1] Modelo 5: ARIMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: (1-L) l_agropecuaria

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const -0,000919328 0,0154457 -0,0595 0,95254

phi_1 -0,179238 0,084197 -2,1288 0,03327 **

phi_12 0,36066 0,0891847 4,0440 0,00005 ***

Média var. dependente -0,000077 D.P. var. dependente 0,162097

Média de inovações 0,000271 D.P. das inovações 0,150173

Log da verossimilhança 61,60090 Critério de Akaike -115,2018

Critério de Schwarz -103,7010 Critério Hannan-Quinn -110,5285

Real Imaginária Módulo Frequência

AR

Raiz 1 -1,0696 0,0000 1,0696 0,5000

Raiz 2 1,1052 0,0000 1,1052 0,0000

Raiz 3 -0,0176 -1,0900 1,0901 -0,2526

Raiz 4 -0,0176 1,0900 1,0901 0,2526

Raiz 5 0,9516 -0,5585 1,1034 -0,0845

Raiz 6 0,9516 0,5585 1,1034 0,0845

Raiz 7 -0,5546 -0,9276 1,0808 -0,3358

Raiz 8 -0,5546 0,9276 1,0808 0,3358

Raiz 9 -0,9341 -0,5276 1,0728 -0,4182

Raiz 10 -0,9341 0,5276 1,0728 0,4182

Raiz 11 0,5367 -0,9581 1,0982 -0,1687

Raiz 12 0,5367 0,9581 1,0982 0,1687

21. SARMA(p,q)(P,Q)

• Define as ordens sazonais

35

Exemplo de um modelo SARIMA(1,1,1)(1,0) Modelo 1: ARIMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: (1-L) l_agropecuaria

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00126219 0,00109948 1,1480 0,25097

phi_1 0,605108 0,0757161 7,9918 <0,00001 ***

Phi_1 0,409892 0,090208 4,5439 <0,00001 ***

theta_1 -1,000000 0,0220068 -45,4405 <0,00001 ***

Média var. dependente -0,000077 D.P. var. dependente 0,162097

Média de inovações -0,000195 D.P. das inovações 0,137608

Log da verossimilhança 71,55078 Critério de Akaike -133,1016

Critério de Schwarz -118,7256 Critério Hannan-Quinn -127,2600

Real Imaginária Módulo Frequência

AR

Raiz 1 1,6526 0,0000 1,6526 0,0000

AR

(sazonal)

Raiz 1 2,4397 0,0000 2,4397 0,0000

MA

Raiz 1 1,0000 0,0000 1,0000 0,0000

22. ARMAX com dummies periódicas

Para acrescentar as binárias de períodos, clique no menu Acrescentar e na opção Dummies periódicas

Com isso, são criadas binárias para cada período. No exemplo, foram criadas 12 dummies, uma para cada mês do ano.

36

Para estimar o modelo, basta acrescentar as binárias na lista de Regressores. Lembre-se de sempre acrescentar um número a menos que a quantidade total de binárias. No exemplo, são 12 meses. Logo, devem ser incluídas no máximo 11 binárias no modelo.

Exemplo de um modelo ARMAX com dummies periódicas

Modelo 1: ARMAX, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: (1-L) l_agropecuaria

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,000610663 0,00324124 0,1884 0,85056

phi_1 0,345129 0,156311 2,2080 0,02725 **

theta_1 -0,79347 0,106849 -7,4261 <0,00001 ***

dm2 0,0285772 0,0379625 0,7528 0,45159

dm3 0,0176125 0,0445928 0,3950 0,69287

dm4 0,148899 0,0470598 3,1640 0,00156 ***

dm5 0,276885 0,0481692 5,7482 <0,00001 ***

dm6 0,178553 0,0486953 3,6667 0,00025 ***

dm7 0,25779 0,0488848 5,2734 <0,00001 ***

dm8 0,299158 0,0488054 6,1296 <0,00001 ***

dm9 0,265164 0,0484063 5,4779 <0,00001 ***

dm10 0,187742 0,0474609 3,9557 0,00008 ***

dm11 0,0240094 0,0452392 0,5307 0,59561

dm12 -0,123349 0,0391174 -3,1533 0,00161 ***

Média var. dependente -0,000077 D.P. var. dependente 0,162097

Média de inovações 0,001485 D.P. das inovações 0,114141

Log da verossimilhança 98,19136 Critério de Akaike -166,3827

Critério de Schwarz -123,2548 Critério Hannan-Quinn -148,8579

Real Imaginária Módulo Frequência

AR

Raiz 1 2,8975 0,0000 2,8975 0,0000

MA

Raiz 1 1,2603 0,0000 1,2603 0,0000