Estimac~ao de Modelos ARIMA/ARIMAX e Aplica˘c~ao em Infer...

128
UNIVERSIDADE DO RIO GRANDE DO NORTE FEDERAL Universidade Federal do Rio Grande do Norte Centro de Tecnologia Programa de P´ os-Gradua¸c˜ ao em Engenharia El´ etrica e de Computa¸ ao Estima¸ ao de Modelos ARIMA/ARIMAX e Aplica¸ ao em Inferˆ encia de Perdas de Propano Wany Leydiane Souza de Andrade Orientador: Prof. Dr. Luiz Affonso H. Guedes de Oliveira Natal, RN, julho de 2009

Transcript of Estimac~ao de Modelos ARIMA/ARIMAX e Aplica˘c~ao em Infer...

UNIVERSIDADE DO RIO GRANDE DO NORTEFEDERAL

Universidade Federal do Rio Grande do NorteCentro de Tecnologia

Programa de Pos-Graduacao em Engenharia Eletrica e deComputacao

Estimacao de Modelos ARIMA/ARIMAX eAplicacao em Inferencia de Perdas de

Propano

Wany Leydiane Souza de Andrade

Orientador: Prof. Dr. Luiz Affonso H. Guedes de Oliveira

Natal, RN, julho de 2009

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

UNIVERSIDADE DO RIO GRANDE DO NORTEFEDERAL

Universidade Federal do Rio Grande do NorteCentro de Tecnologia

Programa de Pos-Graduacao em Engenharia Eletrica e deComputacao

Estimacao de Modelos ARIMA/ARIMAX eAplicacao em Inferencia de Perdas de

Propano

Wany Leydiane Souza de Andrade

Orientador: Prof. Dr. Luiz Affonso H. Guedes de Oliveira

Dissertacao de Mestrado apresentada aoPrograma de Pos-Graduacao em EngenhariaEletrica e de Computacao da UFRN (area deconcentracao: Engenharia de Computacao)como parte dos requisitos para obtencao dotıtulo de Mestre em Ciencias.

Numero de ordem PPgEE: M237

Natal, RN, julho de 2009

Estimacao de Modelos ARIMA/ARIMAX eAplicacao em Inferencia de Perdas de

Propano

Wany Leydiane Souza de Andrade

Dissertacao de Mestrado aprovada em 16 de julho de 2009 pela banca examinadora com-posta pelos seguintes membros:

Prof. Dr. Luiz Affonso H. Guedes de Oliveira (orientador) . . . . . . DCA/UFRN

Prof. Dr. Fabio Meneghetti U. de Araujo (examinador interno) . DCA/UFRN

Prof. Dr. Jorge Dantas de Melo (examinador interno) . . . . . . . . . . . DCA/UFRN

Prof. Dr. Diego Rodrigo Cabral Silva (examinador externo) . . . . . . CEFET-RN

Dedicatoria

A minha famılia, responsavel peloalicerce da minha educacao, dedico

mais esta conquista.

Agradecimentos

A Deus.

Ao meu orientador, professor Luiz Affonso, sou enormemente grata pela orientacao.

Ao professor Fabio Meneghetti e ao engenheiro Jose Medeiros A. Junior, por disponibili-zarem o Estudo de Caso utilizado nesta dissertacao.

Aos colegas de laboratorio, pelas contribuicoes e sugestoes.

Aos demais amigos e familiares, pelo incentivo e compreensao durante esta jornada.

Ao CNPq, pelo apoio financeiro.

Resumo

Nesta dissertacao de mestrado realiza-se um estudo sobre series temporais, que contemuma descricao das principais tecnicas existentes para analise de series temporais lineares,detalhando-se mais profundamente os modelos ARIMA e ARIMAX. Os modelos ARIMAe ARIMAX destinam-se a modelagem de series temporais que podem ser representadaspor equacoes lineares, sejam elas estacionarias ou nao-estacionarias.

Dentro do processo de estimacao do modelo ARIMA/ARIMAX, usam-se varias tec-nicas combinadas, em diferentes partes desse processo, como: Criterio de Informacaode Akaike para a escolha das ordens e atrasos do modelo e o algoritmo Recursive LeastSquares para estimar os coeficientes do modelo.

O problema a ser abordado nesta dissertacao consiste em, de posse apenas de amostrasde uma serie temporal no domınio do tempo, e de uma entrada (ou varias) do sistemagerador dessa serie temporal, estimar um modelo que represente adequadamente essa serie,com o menor erro possıvel em relacao a serie real e a serie ajustada pelo modelo.

Os principais resultados desta dissertacao sao a implementacao e validacao de algorit-mos para determinacao de ordens, coeficientes e atrasos dos modelos ARIMA/ARIMAX.Outro resultado refere-se a estimacao do modelo e a realizacao de inferencias para a serietemporal do estudo de caso, a serie de Perdas de Propano no topo da coluna deetaniza-dora de uma Unidade de Processamento de Gas Natural. As estimacoes realizadas sobre asaıda da serie do estudo de caso funcionarao como um sensor de software capaz de indicara perda de propano nessa coluna em caso de ausencia de um sensor de hardware para talfinalidade.

Palavras-chave: Series Temporais, Tendencia, Sazonalidade, Modelos ARIMA, Mo-delos ARIMAX, Previsao de Series Temporais.

Abstract

In this master’s thesis, it’s made a study about time series, that has a description ofthe principal techniques to linear time series analysis, it’s shown with details the ARIMAand ARIMAX models. The ARIMA and ARIMAX models are destinated to modeling oftime series which can be represented for linear equations, independently if the time seriesis stationary or non-stationary.

In the process of ARIMA/ARIMAX models estimation, many techniques are usedtogether, in different parts of this process, like: Akaike’s Information Criteria (AIC) tochoose the orders and delays of the model and Recursive Least Squares (RLS) algorithmto estimate the model’s coefficients.

The problem to be approched in this master’s thesis is, having only samples of a timeserie in the time domain and one (or more) entries of the generator system of this serie,to estimate a model that properly represents this time serie, with the minor error possiblein relation to the real serie and the serie generated by the model.

The principal results of this dissertation are the implementation and validation of thealgorithms to determination of orders, coefficients and delays of the ARIMA/ARIMAXmodels. Another result refers to the model estimation and the inferences for the timeserie of the case study, the time serie of propane loss at the top of the column calleddeetanizadora, in a natural gas processing unit. The inferences made on the exit of theserie of case study will work as a software sensor able to indicate the propane loss in thiscolumn in the absence of a hardware sensor for this purpose.

Keywords: Time Series, Tendency, Seasonality, ARIMA Models, ARIMAX Models,Time Series Prevision.

xi

Conteudo

Lista de Figuras xv

Lista de Tabelas xix

Lista de Siglas xxi

1 Introducao 1

2 Processos Estocasticos e Series Temporais 5

2.1 Series Temporais Nao-estacionarias . . . . . . . . . . . . . . . . . . . . . . 7

2.2 Outras Transformacoes Previas para Series Temporais . . . . . . . . . . . . 8

2.3 Modelos para Series Temporais . . . . . . . . . . . . . . . . . . . . . . . . 9

2.4 Tendencias, Sazonalidades, Ciclos, Aleatoriedade e Outliers . . . . . . . . . 10

2.5 Modelos de Suavizacao Exponencial . . . . . . . . . . . . . . . . . . . . . . 14

2.5.1 Series Temporais Sem Tendencia e Sem Sazonalidade . . . . . . . . 14

2.5.1.1 Medias Moveis Simples . . . . . . . . . . . . . . . . . . . . 15

2.5.1.2 Suavizacao Exponencial Simples . . . . . . . . . . . . . . 15

2.5.2 Series Temporais Com Tendencia e Sem Sazonalidade . . . . . . . . 16

2.5.2.1 Suavizacao Exponencial de Holt . . . . . . . . . . . . . . . 16

2.5.3 Series Temporais Com Tendencia e Sazonalidade . . . . . . . . . . . 17

2.5.3.1 Suavizacao Exponencial Sazonal de Holt-Winters (para sa-zonalidade aditiva) . . . . . . . . . . . . . . . . . . . . . . 17

2.5.3.2 Suavizacao Exponencial Sazonal de Holt-Winters (para sa-zonalidade multiplicativa) . . . . . . . . . . . . . . . . . . 18

3 Modelos ARIMA e ARIMAX 21

3.1 Modelo ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.1.1 Caracterısticas do Modelo ARIMA . . . . . . . . . . . . . . . . . . 24

3.1.2 Modelos AR e ARI . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.1.3 Modelos MA e IMA . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.1.4 Modelo ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.2 Modelo ARIMAX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.2.1 ARIMAX e suas Subdivisoes . . . . . . . . . . . . . . . . . . . . . . 26

3.3 Modelo SARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.4 Modelo NARMAX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

4 Etapas da Modelagem para Modelo ARIMA/ARIMAX 31

4.1 Selecao do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

4.2 Estimacao das Ordens do Modelo . . . . . . . . . . . . . . . . . . . . . . . 31

4.2.1 Funcao de Autocorrelacao (FAC) e Funcao de Autocorrelacao Par-cial (FACP) Estimadas . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.2.2 Criterio de Informacao de Akaike (CIA) . . . . . . . . . . . . . . . 34

4.2.2.1 CIA para Modelos ARIMA e ARIMAX . . . . . . . . . . 34

4.2.2.2 CIA para Modelos AR . . . . . . . . . . . . . . . . . . . . 36

4.2.2.3 CIA para Modelos SARIMA . . . . . . . . . . . . . . . . . 36

4.2.2.4 Outras Equacoes para CIA . . . . . . . . . . . . . . . . . 37

4.2.2.5 Criterio de Informacao de Akaike Modificado . . . . . . . 37

4.2.3 Criterio de Informacao Bayesiano (CIB) . . . . . . . . . . . . . . . 39

4.3 Estimacao dos Coeficientes do Modelo . . . . . . . . . . . . . . . . . . . . 39

4.3.1 Metodo de Maxima Verossimilhanca . . . . . . . . . . . . . . . . . 39

4.3.2 RLS - Recursive Least Squares (Mınimos Quadrados Recursivos) . . 40

4.3.3 ELS - Extended Least Squares (Mınimos Quadrados Estendidos) . . 43

4.4 Diagnostico do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.4.1 Teste de Autocorrelacao Residual . . . . . . . . . . . . . . . . . . . 46

4.4.2 Teste de Autocorrelacao Cruzada . . . . . . . . . . . . . . . . . . . 47

4.4.3 Adicionando Novos Termos ao Modelo ARIMA/ARIMAX . . . . . 47

4.5 Previsoes com o Modelo ARIMA e ARIMAX . . . . . . . . . . . . . . . . . 48

4.5.1 Transformacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4.6 Etapas da Modelagem e Metodos Escolhidos para o Sistema . . . . . . . . 50

5 Testes e Resultados Preliminares 55

5.1 Problemas Tecnicos Enfrentados Durante a Fase de Implementacao do Sis-tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

5.1.1 Estouro de Pilha . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

5.2 Ambiente Computacional Desenvolvido . . . . . . . . . . . . . . . . . . . . 71

6 Estudo de Caso 77

7 Conclusoes 95

7.1 Contribuicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

7.2 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

Referencias 97

xv

Lista de Figuras

1.1 Serie Temporal fictıcia da taxa de variacao do dolar em dias. . . . . . . . . 2

2.1 Exemplo de um processo estocastico (um conjunto de variaveis aleatorias). 5

2.2 Uma variavel aleatoria com uma funcao densidade de probabilidade corres-pondente (para um valor de t fixado). . . . . . . . . . . . . . . . . . . . . . 6

2.3 Uma serie temporal em funcao do tempo (para um valor de ω fixado). . . . 6

2.4 Diagrama de subdivisoes do modelo ARIMAX. . . . . . . . . . . . . . . . . 10

3.1 O processo gerador da serie temporal juntamente com o sistema estimadorda serie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.2 Fluxograma : construcao de um modelo ARIMA/ARIMAX. . . . . . . . . 23

4.1 Componentes do RLS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4.2 Algoritmo RLS (WIKIPEDIA, 2005). . . . . . . . . . . . . . . . . . . . . . . 42

4.3 Algoritmo ELS (FERRARI, 2006). . . . . . . . . . . . . . . . . . . . . . . . 44

4.4 Fluxograma estendido: construcao de um modelo ARIMA/ARIMAX. . . . 51

5.1 Grafico contendo os valores originais da serie de teste que simula o com-portamento de um modelo ARIMA. . . . . . . . . . . . . . . . . . . . . . . 57

5.2 Ruıdos correspondentes a parte MA do modelo ARIMA estimados peloAlgoritmo ELS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

5.3 Grafico da Serie Real versus Serie gerada pelo modelo ARIMA. . . . . . . . 59

5.4 Grafico de convergencia do termo Zt−1 do modelo ARIMA. . . . . . . . . . 59

5.5 Grafico de convergencia do termo at−1 do modelo ARIMA. . . . . . . . . . 60

5.6 Autocorrelacoes Estimadas dos Resıduos do modelo ARIMA. . . . . . . . . 60

5.7 Valores previstos utilizando o modelo ARIMA e valores reais da Serie Tem-poral Fictıcia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

5.8 Grafico contendo os valores originais da serie de teste que simula o com-portamento de um modelo ARIMAX. . . . . . . . . . . . . . . . . . . . . . 62

5.9 Grafico contendo os valores da Entrada Exogena 1 do modelo ARIMAX. . 63

5.10 Grafico contendo os valores da Entrada Exogena 2 do modelo ARIMAX. . 63

5.11 Ruıdos correspondentes a parte MA do modelo ARIMAX estimados peloAlgoritmo ELS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

5.12 Grafico da Serie Real versus Serie gerada pelo modelo ARIMAX. . . . . . . 65

5.13 Grafico de convergencia do termo Zt−1 do modelo ARIMAX. . . . . . . . . 65

5.14 Grafico de convergencia do termo at−1 do modelo ARIMAX. . . . . . . . . 66

5.15 Grafico de convergencia do termo X1t do modelo ARIMAX. . . . . . . . . . 66

5.16 Grafico de convergencia do termo X1t−1 do modelo ARIMAX. . . . . . . . . 67

5.17 Grafico de convergencia do termo X2t do modelo ARIMAX. . . . . . . . . . 67

5.18 Grafico de convergencia do termo X2t−1 do modelo ARIMAX. . . . . . . . . 68

5.19 Autocorrelacoes Estimadas dos Resıduos do modelo ARIMAX. . . . . . . . 68

5.20 Valores estimados utilizando o modelo ARIMAX e valores reais da SerieTemporal Fictıcia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

5.21 Tela inicial do sistema de geracao de modelos ARIMA/ARIMAX. . . . . . 71

5.22 Detalhe da tela do sistema de geracao de modelos ARIMA/ARIMAX aposos arquivos carregados contendo as entradas exogenas. . . . . . . . . . . . 73

5.23 Tela do sistema de geracao de modelos apos a geracao de um modelo ARI-MAX. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

5.24 Detalhe da tela do sistema de geracao de modelos apos a geracao de ummodelo ARIMAX, mostrando a exibicao dos coeficientes do modelo gerado. 75

6.1 Colunas da planta de producao de GLP. . . . . . . . . . . . . . . . . . . . 78

6.2 Serie Temporal de Perdas de Propano (dada em 10−6∗Fracao Molar) . . . . 80

6.3 Entrada Exogena 1 - Vazao de Refluxo (dada em Kg.Mole/h) . . . . . . . 80

6.4 Entrada Exogena 2 - Temperatura (dada em graus Celsius) . . . . . . . . . 81

6.5 Grafico da Serie Real versus Serie gerada pelo modelo ARIX. . . . . . . . . 81

6.6 Grafico da Serie Real versus Serie gerada pelo modelo ARIMAX. . . . . . . 82

6.7 Serie Temporal de Perdas de Propano apos duas diferencas. . . . . . . . . . 82

6.8 Grafico da Serie Real diferenciada versus Serie gerada pelo modelo ARIMAX. 83

6.9 Ruıdos correspondentes a parte MA do modelo ARIMAX estimados peloAlgoritmo ELS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

6.10 Autocorrelacoes Estimadas dos Resıduos do modelo ARIMAX. . . . . . . . 85

6.11 Grafico de convergencia do termo Zt−1 do modelo ARIMAX. . . . . . . . . 86

6.12 Grafico de convergencia do termo at−1 do modelo ARIMAX. . . . . . . . . 86

6.13 Grafico de convergencia do termo at−2 do modelo ARIMAX. . . . . . . . . 87

6.14 Grafico de convergencia do termo at−3 do modelo ARIMAX. . . . . . . . . 87

6.15 Grafico de convergencia do termo at−4 do modelo ARIMAX. . . . . . . . . 88

6.16 Grafico de convergencia do termo at−5 do modelo ARIMAX. . . . . . . . . 88

6.17 Grafico de convergencia do termo at−6 do modelo ARIMAX. . . . . . . . . 89

6.18 Grafico de convergencia do termo X1t−5 do modelo ARIMAX. . . . . . . . . 89

6.19 Grafico de convergencia do termo X2t do modelo ARIMAX. . . . . . . . . . 90

6.20 Grafico de convergencia do termo X2t−1 do modelo ARIMAX. . . . . . . . . 90

6.21 Grafico de convergencia do termo X2t−2 do modelo ARIMAX. . . . . . . . . 91

6.22 Grafico de convergencia do termo X2t−3 do modelo ARIMAX. . . . . . . . . 91

6.23 Erros Relativos de Inferencia (em percentuais). . . . . . . . . . . . . . . . . 92

6.24 Erros Relativos Percentuais de Inferencias sobre um novo conjunto de dadosda serie temporal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

xix

Lista de Tabelas

4.1 Comportamento da FAC e FACP de varios modelos ARIMA. . . . . . . . . 34

5.1 Valores do CIA das combinacoes de ordens (p,q). . . . . . . . . . . . . . . 57

xxi

Lista de Siglas

AR Auto-RegressiveARA Alto do Rodrigues-AARI Auto-Regressive IntegratedARIMA Auto-Regressive Integrated with Moving AverageARIMAX Auto-Regressive Integrated with Moving Average and Exogenous

inputsARIX Auto-Regressive Integrated with Exogenous inputsARMA Auto-Regressive with Moving AverageARMAX Auto-Regressive with Moving Average and Exogenous inputsARX Auto-Regressive with Exogenous inputsCAM Canto do AmaroCIA Criterio de Informacao de AkaikeCIB Criterio de Informacao BayesianoELS Extended Least SquareEQM Erro Quadratico MedioFAC Funcao de AutocorrelacaoFACE Funcao de Autocorrelacao EstendidaFACP Funcao de Autocorrelacao ParcialFACV Funcao de AutocovarianciaFV Funcao de VerossimilhancaGLP Gas Liquefeito de PetroleoIDE Integrated Development EnvironmentIMA Integrated with Moving AverageIMAX Integrated with Moving Average and Exogenous inputsJDK Java Development KitJVM Java Virtual MachineLGN Lıquido de Gas NaturalLMS Least Mean SquareMA Moving AverageMAX Moving Average with Exogenous inputsNARMAX Non-linear Auto-Regressive with Moving Average and Exogenous

inputsPETROBRAS Petroleo Brasileiro S/ARLS Recursive Least SquareSARIMA Seasonal Auto-Regressive Integrated with Moving AverageSQE Soma dos Quadrados dos ErrosUPGN Unidade de Processamento de Gas Natural

1

1 Introducao

Uma serie temporal e uma sequencia de observacoes de uma colecao de variaveisquaisquer ordenadas ao longo do tempo. Embora seja mais comum a ordenacao dasseries ao longo de unidades de tempo, como por exemplo dias, meses ou anos, tambeme possıvel que a sua ordenacao seja construıda ao longo de outras unidades, como porexemplo volume, latitude, longitude, espaco, entre outros (MORETIN; TOLOI, 2004).

Em virtude da definicao anterior, percebe-se que em uma serie temporal a ordenacaoe crucial, e as observacoes vizinhas sao dependentes, como sera verificado mais adiante.

Como exemplos de series temporais de nosso cotidiano, temos: valores de temperaturasmedias (dadas por exemplo em graus centıgrados) diarias de uma capital brasileira; valoresde precipitacoes atmosfericas mensais de uma cidade; valores anuais do Produto InternoBruto de um paıs; valores dos precos diarios de acoes da empresa Petroleo Brasileiro S/A(PETROBRAS); etc.

A Figura 1.1 ilustra uma serie temporal fictıcia de observacoes da variavel taxa de va-riacao do valor do dolar, exibida em forma de um grafico. Os valores das taxas de variacaodo dolar sao representados em numeros reais e a serie e ordenada no domınio do tempo (aunidade de tempo utilizada e dia). A serie temporal fictıcia possui 78 amostras, ordenadasdo dia 18/08/2007 ao dia 03/11/2007. A exibicao da serie temporal em forma de graficospermite a verificacao visual, por especialistas, de caracterısticas importantes da serie, taiscomo estacionariedade, tendencia e sazonalidade, que serao descritos posteriormente nestadissertacao.

Neste trabalho, a analise das series temporais sera realizada no domınio do tempo, enao sera abordada a analise no domınio da frequencia. Quando se faz uma analise de umaserie temporal, pode-se estar interessado em varios objetivos diferentes, como (MORETIN;TOLOI, 2004):

• Descobrir o mecanismo que gerou a serie temporal;

• Descrever o comportamento da serie (se existe tendencia, sazonalidade, ciclos, out-liers, etc);

• Encontrar relacoes da serie com outras series temporais;

• Fazer previsao de valores futuros, e

• Fazer estimacao dos valores de saıda, apenas de posse dos valores de entrada.

Dada uma serie temporal Z, para representar um valor observado da serie temporalem um instante de tempo, utiliza-se Zt, onde t contem um instante de tempo representado

2 1 Introducao

Figura 1.1: Serie Temporal fictıcia da taxa de variacao do dolar em dias.

em uma unidade de tempo qualquer (podendo ser ano, mes, dia, horas de um dia, entreoutros) e Zt contem o valor da serie temporal no instante de tempo t. O valor de Zt podeser representado em unidades de medida diferentes, dependendo da variavel que a serietemporal representa, como por exemplo, graus celsius para representar temperaturas, reaispara representar valores de acoes de uma empresa, etc. Tendo-se como exemplo a serietemporal (Z) de temperatura media diaria de uma capital brasileira, e como instante detempo t o dia 01-03-2007, a temperatura media observada e representada em oC (grauscelsius):

Z01−03−2007 = 32oC

Uma serie temporal pode ser classificada em discreta ou contınua, e essa classificacaorefere-se aos valores que a serie temporal pode assumir, uma serie discreta armazena va-lores enumeraveis, como numero de cirurgias realizadas, enquanto que uma serie contınuapode assumir qualquer valor real, como a temperatura de uma cidade (MORETIN; TOLOI,2004).

Esta classificacao refere-se tambem as unidades de tempo nas quais as observacoes saocoletadas. Se t pertence a um conjunto finito e enumeravel, como por exemplo o conjuntodos dias do ano, a serie e discreta, se pertencer ao conjunto R (numeros reais) a seriesera contınua. Como exemplo do segundo caso, temos o conjunto de registro de mare emum porto. Este conjunto forma uma serie temporal contınua, porque existe o registro damare em todos os instantes (representado por um numero real) ao longo do intervalo deum dia, o espaco de tempo das observacoes e contınuo (MORETIN; TOLOI, 2004).

Ja as series temporais discretas podem ser sub-classificadas em (MORETIN; TOLOI,2004):

1 Introducao 3

• Inerentemente discreta: Sao series temporais cujas observacoes so existem no espacode tempo discreto, como a cada dia, a cada mes, etc. Como exemplo, tem-se aserie de ındices diarios da Bolsa de Valores de Sao Paulo, onde as observacoes saocoletadas a cada perıodo de um dia;

• Serie contınua discretizada: Sao series temporais contınuas que sao transformadasem series discretas, atraves de sua amostragem a perıodos de tempo fixos. Porexemplo, a serie de registro de mares pode ser discretizada pegando-se seu valoresa cada perıodo de uma hora;

• Serie de valores acumulados: Sao series temporais discretas que sao formadas acumu-lando-se valores em intervalo de tempo iguais. Por exemplo, a serie temporal deprecipitacao atmosferica anual de uma cidade e formada somando-se as observacoesde precipitacao atmosferica desta cidade durante um ano inteiro.

Porem uma serie Zt pode conter varios valores, bem como t nao necessariamenterepresenta o tempo, mas pode representar outra variavel (ou ate mesmo um conjuntodelas). Como exemplo, tem-se:

Zt = [Z1t , Z

2t , Z

3t ],

t = (tempo, latitude, longitude)

onde Zt e um vetor de dimensao rx1, e as tres componentes representam respectivamentea altura, a temperatura e a pressao, e t e um vetor de dimensao px1 contendo os valo-res: tempo, latitude, longitude. Segundo Moretin e Toloi (2004), diz-se que esta serie emultivariada (r = 3) e tambem multidimensional (p = 3).

A seguir, tem-se algumas caracterısticas que sao particulares aos dados de uma serietemporal (ANSUJ; ALMEIDA; SANTOS, 2005):

• Observacoes correlacionadas sao mais difıceis de analisar e requerem tecnicas espe-cıficas;

• Fatores complicadores como presenca de tendencias e variacao sazonal ou cıclicapodem ser difıceis de estimar ou remover;

• A selecao de modelos pode ser bastante complicada, e as ferramentas podem ser dedifıcil interpretacao;

• E mais difıcil de lidar com observacoes perdidas e dados discrepantes devido a na-tureza sequencial.

Assim, no contexto de series temporais, os principais objetivos desta dissertacao sao:

• O desenvolvimento de um ambiente computacional para a determinacao de seriestemporais monovariadas e monodimensionais, descritas por modelos do tipo Auto-Regressive Integrated with Moving Average (ARIMA) e Auto-Regressive Integratedwith Moving Average and Exogenous inputs (ARIMAX), incorporando as etapas de:

4 1 Introducao

– Escolha do tipo do modelo, que pode ser escolhido pelo usuario do ambiente;

– Determinacao das ordens e atrasos do modelo, utilizando-se o Criterio de In-formacao de Akaike (CIA);

– Determinacao dos coeficientes do modelo, utilizando os algoritmos RecursiveLeast Squares (RLS) e Extended Least Squares (ELS);

• Aplicacao desses algoritmos para obtencao de modelos ARIMA/ARIMAX adequa-dos a estimacao de valores de perdas de propano no topo da coluna deetanizadorade uma Unidade de Processamento de Gas Natural. Assim, o modelo obtido funci-onara como um sensor de software, que ira fazer a inferencia daquele valor apenasde posse dos valores de vazao de refluxo e temperatura na coluna deetanizadora.

O restante desta dissertacao esta organizada de acordo com os seguintes capıtulos:O Capıtulo 2 detalha processos estocasticos e series temporais, e suas principais carac-terısticas como estacionariedade, tendencia e sazonalidade, alem de dar uma visao geraldos modelos mais utilizados para modelar as series temporais. O Capıtulo 3 detalha osmodelos de interesse neste trabalho, que sao os modelos ARIMA e ARIMAX. O Capıtulo4 aborda as etapas envolvidas no processo de criacao do modelo ARIMA/ARIMAX parauma serie temporal. O Capıtulo 5 apresenta alguns testes realizados com series temporaisfictıcias e seus resultados previos, com o proposito de validacao dos algoritmos desenvolvi-dos. O Capıtulo 6 contem um estudo de caso que trata-se de uma serie temporal de perdasde propano em uma unidade de processamento de gas natural, sobre a qual sera utilizadoo ambiente computacional aqui desenvolvido para a realizacao de estimacoes de valoresde perda na referida unidade. E por fim, o Capıtulo 7 contem as principais conclusoes dotrabalho.

5

2 Processos Estocasticos e SeriesTemporais

Um processo estocastico e uma famılia Z = Z(t), t ∈ T, onde T e um conjuntoarbitrario, tal que, para cada t ∈ T , Z(t) e uma variavel aleatoria, e toda a famılia devariaveis aleatorias e definida num mesmo espaco de probabilidades (MORETIN; TOLOI,2004).

O conjunto T pode ser o conjunto dos inteiros Z, o conjunto dos reais R ou o quegeralmente e utilizado: o conjunto dos inteiros positivos Z+. Para um dado t, Z(t) e umavariavel aleatoria do tipo Real.

Como, para t ∈ T , Z(t) e uma variavel aleatoria definida sobre Ω, entao Z(t) e naverdade uma funcao de dois argumentos, Z(t, ω), onde t ∈ T , ω ∈ Ω, e Ω e o conjuntodos valores possıveis de probabilidade de um evento de uma variavel aleatoria (MORETIN;TOLOI, 2004).

Figura 2.1: Exemplo de um processo estocastico (um conjunto de variaveis aleatorias).

A Figura 2.1 ilustra um processo estocastico, que e constituıdo por um conjunto devariaveis aleatorias, onde fz(z) e a funcao de densidade de probabilidade da variavelaleatoria Z(t, ω), e t ∈ T . A funcao de densidade de probabilidade de uma variavel

6 2 Processos Estocasticos e Series Temporais

aleatoria e a derivada da funcao de distribuicao desta variavel aleatoria, ou seja:

fz(z) =dFz(z)

dz(2.1)

Figura 2.2: Uma variavel aleatoria com uma funcao densidade de probabilidade corres-pondente (para um valor de t fixado).

Figura 2.3: Uma serie temporal em funcao do tempo (para um valor de ω fixado).

A funcao de distribuicao Fz(z) e uma funcao cumulativa de uma variavel aleatoria, eesta funcao e construıda de acordo com a seguinte equacao:

Fz(z) = PZ ≤ z (2.2)

onde Z e uma variavel aleatoria, Z ≤ z e um evento (expresso em numero real) davariavel aleatoria Z, sendo que z (minusculo) pode variar de −∞ a +∞, e PZ ≤ z e a

2.1 Series Temporais Nao-estacionarias 7

probabilidade do evento Z ≤ z ocorrer. Para cada t ∈ T , temos uma variavel aleatoriaZ(t, ω) com uma funcao de densidade de probabilidade (fz(z)), como pode ser visto naFigura 2.2, enquanto que para cada ω ∈ Ω, obtem-se uma funcao de t que e uma trajetoriado processo, que tambem e conhecida por Serie Temporal, como pode ser visto na Figura2.3.

Um processo estocastico pode ser estacionario ou nao-estacionario. Uma definicaointuitiva de processo estacionario diz respeito ao processo que se desenvolve no tempo demodo que a escolha de uma origem dos tempos nao e importante, ou seja, as caracterısticasde Z(t+ τ), ∀ τ , sao as mesmas de Z(t) (MORETIN; TOLOI, 2004).

2.1 Series Temporais Nao-estacionarias

As series temporais podem ser analisadas de acordo com a sua estacionariedade. Umaserie temporal estacionaria e uma serie cujos dados ao longo do tempo se mantem ao redorde um valor medio (a media e constante). Enquanto uma serie temporal nao-estacionariae aquela cujos dados ao longo do tempo nao se mantem ao redor de um valor medio,mas ao inves disto apresentam uma tendencia (negativa ou positiva) e/ou apresentamsazonalidade ou ciclo (MORETIN; TOLOI, 2004).

Series Temporais que apresentam a caracterıstica de nao-estacionariedade necessitamde uma transformacao previa para torna-la uma serie estacionaria. Para isso e reali-zada uma operacao de diferenciacao na serie original. Pode-se diferenciar uma serie umavez, duas vezes, ou n vezes, porem na maioria dos casos apresentados na literatura, umadiferenciacao ja e suficiente para torna-la estacionaria, e em casos mais raros duas dife-renciacoes ja resolvem o problema, nao sendo necessario mais que duas diferenciacoes emseries temporais (MORETIN; TOLOI, 2004). Quando a serie for discreta no tempo, utiliza-sea operacao de diferenca para reobter a estacionariedade da serie.

Dada uma serie temporal Zt, com N valores, a serie resultante de uma diferenca Wt,com (N − 1) valores, sera igual a:

∆Zt = Wt = Zt − Zt−1

para t = 2...N , onde ∆ representa a operacao de diferenca.

A segunda diferenca de Zt sera igual a:

∆(∆Zt) = ∆Wt = Vt = Wt −Wt−1 , para t = 3, ..., N

Assim a serie temporal Wt contera um valor a menos que Zt, e Vt contera dois valoresa menos que Zt, porem os instantes de tempo t continuam os mesmos.

8 2 Processos Estocasticos e Series Temporais

2.2 Outras Transformacoes Previas para Series Tem-

porais

Alem da diferenciacao/diferenca, existem outras transformacoes que podem ser re-alizadas na Serie Temporal, de acordo com as caracterısticas da mesma, antes de seencontrar um modelo adequado para ela. Em algumas casos como em series temporaisfinanceiras, pode ser preciso realizar uma transformacao nao-linear com a finalidade detornar a variancia da serie constante, alem de posteriormente realizar a transformacao dediferenciacao/diferenca (MORETIN; TOLOI, 2004).

O fenomeno de nao-constancia na variancia e denominado de volatilidade na literaturade series temporais e pode ser tratado atraves de transformacoes nos dados (como porexemplo a aplicacao da funcao logarıtmica na serie), segundo Ehlers (2005).

Supondo uma serie, por exemplo, que possua uma variancia crescente, e indicado pelaliteratura que seja realizada uma transformacao logarıtmica na mesma, como:

Wt = log(Zt) (2.3)

para todo t.

E importante ter em mente que, uma vez que a serie temporal sofreu uma transforma-cao previa qualquer, o modelo encontrado para modelar a serie na verdade e um modeloda serie transformada e nao um modelo da serie original.

Segundo Moretin e Toloi (2004), alguns autores concluıram que transformacoes naomelhoram a qualidade da previsao. Outros verificaram que dados transformados tempouco efeito na melhoria da previsao. Ja outros mostram que as previsoes dos anti-logaritmos dos dados transformados sao estimadores viesados e portanto, deveriam serajustados.

As previsoes viesadas tem o sentido de que as previsoes realizadas em uma serie tem-poral que foi diferenciada ou sofreu outra transformacao, nao correspondem a previsoesreais daquela serie, pois correspondem a previsoes realizadas com base nos dados diferen-ciados ou transformados (dados diferentes da serie temporal original). Para tornar essasprevisoes validas (nao-viesadas) para a serie temporal original e necessario submeter asprevisoes a transformacoes inversas as que foram aplicadas na serie temporal original.Portanto, se a serie foi diferenciada, as previsoes serao integradas. Por exemplo, se a seriefoi transformada de acordo com a funcao logarıtmica, as previsoes serao transformadas deacordo com a funcao exponencial. Caso esta transformacao nao seja realizada, as previ-soes resultantes poderao ser viesadas, como descrito anteriormente, e assim poderao naocorresponder a realidade.

Apesar de nao melhorar a qualidade das previsoes, a transformacao de diferencia-cao/diferenca e util quando e preciso eliminar a tendencia existente na serie temporal.Por exemplo, em series temporais que possuem tendencia e sazonalidade, e preciso elimi-nar a tendencia antes de realizar algum tipo de teste de existencia de sazonalidade, sendoesta eliminacao realizada atraves da diferenciacao/diferenca. Caso a existencia de sazo-nalidade seja confirmada, a diferenciacao/diferenca realizada na serie temporal originalelimina o efeito da tendencia sobre ela e torna possıvel analisar a sua parte sazonal de

2.3 Modelos para Series Temporais 9

forma independente, podendo assim, por exemplo, estimar um modelo SARIMA para aserie temporal.

2.3 Modelos para Series Temporais

Existem diversos modelos que representam as series temporais, e esses modelos sedividem entre os modelos parametricos, onde a analise da serie se da no domınio do tempoe o modelo contem um numero finito de parametros, e os modelos nao-parametricos, queem geral a analise da serie se da no domınio da frequencia (MORETIN; TOLOI, 2004).

Neste trabalho serao utilizados apenas os modelos parametricos, pois a analise da seriesera realizada no domınio do tempo.

Entre os modelos parametricos mais utilizados temos:

Modelos de Erro ou Regress~ao: Modelo da forma Zt = f(t) + at, para t = 1, ..., N ,onde f(t) e chamado sinal e at e um ruıdo. Esta e uma forma geral para modelos deregressao, porem f(t) pode assumir formas diferentes, podendo ser: uma constante;uma funcao linear; um polinomio em t (de baixo grau); ou um polinomio harmonico(com combinacoes lineares de seno e cosseno).

Modelos Estruturais: que permitem uma variabilidade nas componentes tendencia, sa-zonalidade e nıvel do modelo.

Modelos n~ao-lineares: descreve series que nao podem ser descritas por modelos li-neares. Como exemplo de modelo nao-linear, tem-se o modelo Non-linear Auto-Regressive with Moving Average and Exogenous inputs (NARMAX).

Modelos ARIMA: modelos gerais capazes de representar processos lineares estacionarios,processos lineares nao-estacionarios homogeneos e processos de memoria longa. Eutilizado para series cujos valores atuais dependem apenas de seus valores passadose/ou valores passados de um ruıdo aleatorio, mais um ruıdo aleatorio no instanteatual (com media zero e variancia constante). Engloba os modelos Auto-Regressive(AR), Auto-Regressive Integrated (ARI), Moving Average (MA), Integrated with Mo-ving Average (IMA) e Auto-Regressive with Moving Average (ARMA).

Modelos ARIMAX: modelos similares aos modelos ARIMA, porem, adicionalmente, pos-suem entradas exogenas. Engloba os modelos Auto-Regressive with Exogenous in-puts (ARX), Auto-Regressive Integrated with Exogenous inputs (ARIX), MovingAverage with Exogenous inputs (MAX), Integrated with Moving Average and Exoge-nous inputs (IMAX) e Auto-Regressive with Moving Average and Exogenous inputs(ARMAX).

Modelos SARIMA: modelo Seasonal Auto-Regressive Integrated with Moving Average (SA-RIMA), corresponde a um modelo ARIMA mais uma componente sazonal.

Como podemos ver, varios modelos lineares derivam do modelo geral ARIMAX. Odiagrama da Figura 2.4 mostra as subdivisoes do modelo ARIMAX. Assim, o modeloARIX e um modelo ARIMAX sem a parte de media movel, o modelo IMAX e um modelo

10 2 Processos Estocasticos e Series Temporais

ARIMAX sem a parte auto-regressiva, o modelo ARMAX e um modelo ARIMAX semdiferenciacao/diferenca na serie e o modelo ARIMA e um modelo ARIMAX sem a parteexogena (nao possui entrada(s) exogena(s)).

Figura 2.4: Diagrama de subdivisoes do modelo ARIMAX.

Nesta dissertacao, estamos interessados em modelos do tipo ARIMA e ARIMAX.

2.4 Tendencias, Sazonalidades, Ciclos, Aleatoriedade

e Outliers

Uma serie Z1, ..., Zn pode ser escrita como uma funcao de quatro componentes indi-viduais: sazonalidade, tendencia, ciclo e aleatoriedade.

Z = f(S, T, C,E)

onde, em um perıodo t, S corresponde a componente sazonal; T a tendencia; C e acomponente de ciclo e E e a componente aleatoria (SILVA, 2004).

Uma serie com tendencia significa que ela nao possui os seus valores flutuando aoredor de um valor fixo, mas possui um aumento ou declınio gradual nestes valores (SILVA,2004).

2.4 Tendencias, Sazonalidades, Ciclos, Aleatoriedade e Outliers 11

Ja os ciclos, bem como a sazonalidade, sao alteracoes que acontecem nos valores daserie temporal de acordo com o tempo, e essas alteracoes se repetem a cada intervalo fixode tempo, que pode ser semestralmente, anualmente, etc (SILVA, 2004).

Assume-se que a componente aleatoria e supostamente um ruıdo branco, com mediazero e variancia constante (SILVA, 2004).

Existe uma certa chance de se confundir a definicao de sazonalidade com a de ciclo.Basicamente variacoes sazonais sao variacoes de aumento ou diminuicao ocorridas duranteo espaco de tempo, de um ano por exemplo, e que seguem algum evento, como as estacoesdo ano, ou perıodos de safra e entressafra de algum produto. Enquanto que o ciclos saorepeticoes de valores que acontecem em intervalos de tempo bem definidos, podendo serdefinido quando um ciclo se fecha e outro se inicia. Os ciclos podem ser diarios, anuais,sazonais, etc.

Outliers sao valores muito discordantes presentes em series temporais. A presenca deoutliers pode ter impactos negativos na analise de series temporais, como por exemplo,interferir na estimacao dos coeficientes dos parametros de modelos ARIMA/ARIMAX,fazendo-se com que valores incorretos sejam estimados (PALMA, 1998). Esta interferenciana estimacao dos coeficientes do modelo acontece porque nas series temporais as obser-vacoes vizinhas ou adjacentes sao correlacionadas, fazendo com que um valor discrepanteem um instante de tempo interfira no valor de varios valores subsequentes no modeloARIMA/ARIMAX estimado. Em series que contem outliers, a melhor abordagem a serutilizada para o problema em questao e tentar limitar a influencia desses outliers na mo-delagem das series temporais. Uma forma de limitar essa influencia, na fase de estimacaodos coeficientes do modelo, e atribuindo-se pesos pequenos as observacoes discordantes.Entretanto, os estudos sobre outliers em series temporais, incluindo estudos sobre metodosde deteccao e acomodacao, ainda sao escassos, principalmente devido a sua complexidade(PALMA, 1998).

Existem varios metodos para se estimar a tendencia presente nas series temporais.Entre eles temos (MORETIN; TOLOI, 2004):

1. Tendencia Polinomial: Encontra-se uma funcao (polinomial, exponencial, logıstica,etc) que se ajusta bem aos dados da serie temporal, e a partir dela encontra-se afuncao que representa a tendencia. Ex. Se a funcao polinomial Zt = B0 +B1.t+ atrepresenta uma dada serie temporal, e considerando-se que esta serie possui apenastendencia (e livre de sazonalidade), entao temos que: Zt = Tt+at. Logo, a tendenciae encontrada por: Tt = B0 +B1.t.

2. Suavizacao: Com este metodo, a tendencia no instante t e estimada utilizando-se2v+ 1 valores da serie temporal, sendo v valores anteriores a t, v valores posterioresa t, e o valor Zt. Esse metodo pode-se subdividir em:

(a) Medias moveis:

Tt =1

(2v + 1)

v∑j=−v

Zt+j (2.4)

12 2 Processos Estocasticos e Series Temporais

(b) Medianas:

Tt = mediana(Zt−v, Zt−v+1, ..., Zt+v) (2.5)

3. Diferencas: E realizada a diferenca da serie para eliminar a tendencia (nao paraestima-la). Porem para se eliminar a tendencia, o numero de diferencas deve serigual a m, onde m e o grau do polinomio que representa a tendencia. Por exemplo:Se Zt = B0 + B1.t + at (serie com tendencia) apos uma diferenca temos: ∆(Zt) =B1 + at − at−1 (serie sem tendencia).

Existem tambem varios testes para verificar se uma serie contem ou nao tendencia.E importante salientar que caso uma serie contenha tendencia e sazonalidade e precisoeliminar a sazonalidade antes de realizar o teste de existencia de tendencia, e o contra-rio tambem: e preciso eliminar a tendencia antes de realizar o teste de existencia desazonalidade (MORETIN; TOLOI, 2004).

Uma vez que ja foi definido o que e sazonalidade, e importante ressaltar algumas desuas caracterısticas. Suponha uma serie mensal cujos valores apresentam um comporta-mento parecido a cada perıodo de um ano. Provavelmente esta serie possui sazonalidade,com perıodo de um ano. Em series como esta, os valores de meses sucessivos (dentro deum mesmo ano) sao relacionadas; e os valores de anos sucessivos (para um mesmo mes)tambem sao relacionados.

No caso em que a componente sazonal nao variar muito de ano para ano, representa-sea serie temporal como: Zij = Tij + Sj + aij, para i = 1...numero de anos e j = 1, ..., 12,onde Sj e uma constante, existindo uma constante para cada mes do ano (MORETIN;TOLOI, 2004).

No caso em que a componente sazonal variar de ano para ano, representa-se a serietemporal como: Zij = Tij +Sij + aij, para i = 1...numero de anos e j = 1, ..., 12, onde Sije a componente sazonal do ano i e mes j (MORETIN; TOLOI, 2004).

Entre os metodos de estimacao de sazonalidade temos (MORETIN; TOLOI, 2004):

1. Metodo de Regressao: Que e adequado para series que apresentam sazonalidadedeterminıstica (ou seja, que pode ser prevista a partir de meses anteriores). Temosque:

Tt =m∑j=0

βj.tj (2.6)

St =11∑j=1

αj.Dtj (2.7)

Zt = Tt + St + at =m∑j=0

βj.tj + St =

11∑j=1

αj.Dtj + at (2.8)

onde m e a ordem do polinomio que representa a tendencia, N e o numero de

2.4 Tendencias, Sazonalidades, Ciclos, Aleatoriedade e Outliers 13

amostras da serie temporal, Dtj e o valor da matriz D na linha t e coluna j, sendoque a matriz D e construıda com as ordens N por 11, e o valor de D na posicao dalinha t e coluna j sera:

Dtj =

1 se perıodo t corresponde ao mes j;−1, se perıodo t corresponde ao mes 12;0, caso contrario.

DNx11 =

D11 D21 · · · D11,1

D12 D22 · · · D11,2...

...D1N D2N · · · D11,N

Em forma matricial, tem-se:

Z = Cβ +Dα+ a (2.9)

onde:

ZNx1 =

Z1...ZN

, CNx(m+1) =

1 1 · · · 11 2 · · · 2m

......

1 N · · · Nm

,

β(m+1)x1 =

β0

β1...βm

, α11x1 =

α1

α2...α11

, aNx1 =

a1

a2...aN

A Equacao 2.10 pode ser escrita tambem na forma descrita abaixo:

Z = Xγ + a (2.10)

onde:

X = [ C : D ] , γ =

β· · ·α

de modo que a matriz X sera formada pela matriz C concatenada com a matrizD. Logo, X tera N linhas por m + 12 colunas (correspondentes ao resultado de(m+1) colunas de C somadas a 11 colunas de D). Enquanto que γ (γ estimado) eencontrado por:

γ = [X ′X]−1.X ′Z (2.11)

2. Metodo de medias moveis: Que e adequado para series com sazonalidade estocastica(ou seja, que varia com o tempo). Temos que:

Zt = Tt + Sj + at (2.12)

onde j = 1, ..., 12

14 2 Processos Estocasticos e Series Temporais

St = Y .j − Y (2.13)

onde Y .j representa a media do mes j, para j = 1...12 (j representa os meses dejaneiro a dezembro, respectivamente), e e dada por:

Y =1

12

12∑j=1

Y .j (2.14)

Y .j =1

nj

nj∑i=1

Yij (2.15)

Yt = Zt − Tt (2.16)

onde Y e a serie temporal Z menos a tendencia estimada T . Yij e o valor da serietemporal (sem tendencia) observada no ano i, para i = 1, ..., p anos, e no mes j,para j = 1, ..., 12 meses e nj e a quantidade de amostras da serie no mes j.

2.5 Modelos de Suavizacao Exponencial

Estes modelos fazem parte da categoria de Modelos de Erro ou Regressao, citada an-teriormente. Modelos de Suavizacao tratam-se de um conjunto de modelos onde valoresde pico de uma serie temporal sao considerados ruıdos, e esses extremos devem ser su-avizados. Nesses modelos, essa serie suavizada contem os valores bases da serie, e essesvalores sao utilizados para predicao dos valores futuros (MORETIN; TOLOI, 2004).

Porem alem dos ruıdos, existem em algumas series temporais outras componentes im-portantes: a tendencia e a sazonalidade. Para a predicao dos valores futuros, e necessarioantes detectar se essas duas componentes estao presentes a serie, e em caso positivo, elasdevem ser removidas.

2.5.1 Series Temporais Sem Tendencia e Sem Sazonalidade

Um dos modelos dessa classe e o modelo para series localmente constantes, ou seja,que nao possuem tendencia nem sazonalidade. Esse modelo contem apenas um nıvel maisum ruıdo aleatorio (MORETIN; TOLOI, 2004):

Zt = µt + at (2.17)

para t = 1, ..., N .

2.5 Modelos de Suavizacao Exponencial 15

Dado este modelo, existem varias tecnicas de suavizacao da serie temporal, comomedia movel simples e suavizacao exponencial simples.

2.5.1.1 Medias Moveis Simples

Nesse procedimento e calculada uma media aritmetica com os ultimos s valores daserie, que vao de Zt−s+1 ate Zt, onde t e o instante cujo valor suavizado esta sendocalculado (MORETIN; TOLOI, 2004):

Suavizado(t) =(Zt + Zt−1 + ...+ Zt−s+1)

s(2.18)

Este valor e calculado para t = 1, ..., N (tamanho da serie). O conjunto de todos essesvalores e a serie temporal suavizada.

As vantagens deste metodo sao a simplicidade e a flexibilidade com o ajuste do para-metro s e sua caracterıstica de ser aplicavel a series com poucas observacoes.

Como desvantagens, tem-se: aplicacao limitada apenas para series estacionarias; ar-mazenamento de (s− 1) observacoes; dificuldade de escolher o melhor s.

A previsao de dados futuros e realizada a partir da seguinte equacao: Zt(h) =Suavizado(t), onde Zt(h) representa o valor da previsao da serie temporal Z no ins-tante de tempo t + h, sendo t o ultimo instante de tempo da serie temporal no qualtem-se o valor conhecido da serie. Por isso, diz-se que foi realizada uma previsao h passos(ou unidades de tempo) no futuro, contados a partir do instante de tempo base que e t(MORETIN; TOLOI, 2004).

Na tecnica de medias moveis simples, percebe-se que a predicao sera a mesma paratodos os valores de h: o valor suavizado no instante t. Logo, Zt(h) = Zt(h + 1) =Zt(h+ 2) = ... .

O comportamento deste metodo depende da escolha de s. Para series muito aleato-rias deve-se usar s igual ou proximo de N , para que seja calculada a media de todos osvalores da serie. Caso contrario, usa-se um valor proximo de 1 para s, para que apenas al-guns valores mais recentes sejam utilizados para prever valores futuros (MORETIN; TOLOI,2004).

2.5.1.2 Suavizacao Exponencial Simples

Este metodo corresponde a uma media ponderada, cujos pesos das observacoes maisnovas sao maiores que os pesos das observacoes mais antigas (MORETIN; TOLOI, 2004).

Neste metodo, temos a equacao:

Zt = α

t−1∑k=0

((1− α)kZt−k) + (1− α)tZ0 (2.19)

para t = 1, ..., N , onde Zt e o valor suavizado exponencialmente e α e a constante desuavizacao que deve estar entre 0 e 1. Quanto menor for α, as observacoes passadas terao

16 2 Processos Estocasticos e Series Temporais

maior peso e como consequencia, as previsoes sao mais estaveis as observacoes aleatorias.Por outro lado, quanto maior for α, as observacoes recentes terao maior peso (MORETIN;TOLOI, 2004).

Para realizar a predicao, temos que: Zt(h) = Zt, ∀h > 0.

Este metodo tem a vantagem da simplicidade, facil implementacao, flexibilidade gracasa constante de suavizacao e nao necessita armazenar muitas informacoes.

A desvantagem deste metodo reside na dificuldade em determinar o melhor valor daconstante de suavizacao.

2.5.2 Series Temporais Com Tendencia e Sem Sazonalidade

Um modelo para series temporais que apresentam tendencia mas nao possuem sazo-nalidade e descrito por:

Zt = µt + at + Tt (2.20)

para t = 1, ..., N , onde µt e o nıvel; Tt e a componente de tendencia e at e o ruıdo aleatoriocom media zero e variancia constante (MORETIN; TOLOI, 2004).

2.5.2.1 Suavizacao Exponencial de Holt

Este metodo de suavizacao para series com tendencia, possui duas constantes de su-avizacao, uma (A) que atua no nıvel do modelo, e outra (C) que atua na tendencia domesmo, ambas com valores entre 0 e 1. A equacao do valor suavizado e (MORETIN; TOLOI,2004):

Zt = AZt + (1− A)(Zt−1 + Tt−1) (2.21)

para t = 2, ..., N , onde:

Tt = C(Zt − Zt−1) + (1− C)Tt−1 (2.22)

para t = 2, ..., N , onde T e a componente de tendencia estimada. Os valores de Zt e Ttsao calculados para t ≥ 2. Para t ≥ 3, sao utilizadas as Equacoes 2.21 e 2.22, enquantoque para t = 2, sao utilizados os valores iniciais aproximados seguintes (MORETIN; TOLOI,2004):

T2 = Z2 − Z1 (2.23)

Z2 = Z2 (2.24)

As previsoes sao realizadas a partir da equacao:

Zt(h) = Zt + hTt (2.25)

2.5 Modelos de Suavizacao Exponencial 17

Para se determinar as duas constantes de suavizacao, deve-se escolher os valores Ae C tais que o erro quadratico medio (EQM) de previsao seja o menor possıvel. O erroquadratico medio de previsao e definido como a esperanca da diferenca entre o valor real eo valor previsto da serie elevada ao quadrado, como mostrado na Equacao 2.26 (MORETIN;TOLOI, 2004).

EQM(Zt(h)) = E(Zt+h − Zt(h))2 (2.26)

As vantagens deste metodo sao as mesmas do metodo de Suavizacao ExponencialSimples, alem de poder ser aplicado a series com tendencia.

A desvantagem deste metodo e a dificuldade na escolha das constantes de suavizacao.

2.5.3 Series Temporais Com Tendencia e Sazonalidade

Um modelo para series temporais que apresentam tendencia e sazonalidade e descritopor:

Zt = µtSt + at + Tt (2.27)

para t = 1, ..., N . Ou:

Zt = µt + at + Tt + St (2.28)

para t = 1, ..., N , onde µt e o nıvel, Tt e a componente de tendencia, St e a componente desazonalidade e at e o ruıdo aleatorio com media zero e variancia constante. O modelo 2.27considera a sazonalidade multiplicativa e a tendencia aditiva. O modelo 2.28 considera asazonalidade e a tendencia aditivas (MORETIN; TOLOI, 2004).

2.5.3.1 Suavizacao Exponencial Sazonal de Holt-Winters (para sazonalidadeaditiva)

Este metodo de suavizacao para series com tendencia e sazonalidade, possui tresconstantes de suavizacao, uma (A) que atua no nıvel do modelo, uma (C) que atua natendencia, e outra (D) que atua na sazonalidade, todas com valores entre 0 e 1. A equacaodo valor suavizado e dada por (MORETIN; TOLOI, 2004):

Zt = A(Zt − Ft−s) + (1− A)(Zt−1 + Tt−1) (2.29)

para t = (s + 1), ..., N . Onde s e chamado de perıodo e indica que o comportamento daserie temporal e semelhante a cada s instantes de tempo. Tem-se ainda:

Tt = C(Zt − Zt−1) + (1− C)Tt−1 (2.30)

para t = (s+ 1), ..., N .

Ft = D(Zt − Zt) + (1−D)Ft−s (2.31)

18 2 Processos Estocasticos e Series Temporais

para t = (s+ 1), ..., N .

A previsao e realizada a partir da seguinte equacao:

Zt(h) = Zt + hTt + Ft+h−s (2.32)

para h = 1, ..., s. E:

Zt(h) = Zt + hTt + Ft+h−2s (2.33)

para h = s+1, ..., 2s e assim sucessivamente para h = 2s+1, ..., 3s, para h = 3s+1, ..., 4s,etc.

Os valores iniciais sao:

Fj =Zj

(1s

∑sk=1 Zk)

(2.34)

para j = 1, ..., s.

Zs =1

s

s∑k=1

Zk (2.35)

Ts = 0 (2.36)

2.5.3.2 Suavizacao Exponencial Sazonal de Holt-Winters (para sazonalidademultiplicativa)

Este metodo de suavizacao para series com tendencia e sazonalidade, tambem possuitres constantes de suavizacao, uma (A) que atua no nıvel do modelo, uma (C) que atuana tendencia, e outra (D) que atua na sazonalidade, todas com valores entre 0 e 1. Aequacao do valor suavizado e dado por (MORETIN; TOLOI, 2004):

Zt = A

(Zt

Ft−s

)+ (1− A)(Zt−1 + Tt−1) (2.37)

para t = (s + 1), ..., N . Onde s e chamado de perıodo e indica que o comportamento daserie temporal e semelhante a cada s instantes de tempo. Tem-se ainda:

Tt = C(Zt − Zt−1) + (1− C)Tt−1 (2.38)

para t = (s+ 1), ..., N .

Ft = D

(Zt

Zt

)+ (1−D)Ft−s (2.39)

para t = (s+ 1), ..., N .

A previsao e realizada a partir da seguinte equacao:

Zt(h) = (Zt + hTt)Ft+h−s (2.40)

2.5 Modelos de Suavizacao Exponencial 19

para h = 1, ..., s. E:

Zt(h) = (Zt + hTt)Ft+h−2s (2.41)

para h = (s+1), ..., 2s e assim sucessivamente para h = 2s+1, ..., 3s, para h = 3s+1, ..., 4s,etc.

Os valores iniciais sao:

Fj =Zj

(1s

∑sk=1 Zk)

(2.42)

para j = 1, ..., s.

Zs =1

s

s∑k=1

Zk (2.43)

Ts = 0 (2.44)

As vantagens desses dois metodos sao as mesmas do metodo de suavizacao exponencialde Holt, adicionando-se a vantagem de ser aplicada a series com tendencia e sazonalidade(MORETIN; TOLOI, 2004).

A desvantagem e a dificuldade em escolher os melhores valores para as tres constantesde suavizacao, que podem ser escolhidas usando o EQM. Os valores que gerarem o menorEQM serao os escolhidos (MORETIN; TOLOI, 2004).

20 2 Processos Estocasticos e Series Temporais

21

3 Modelos ARIMA e ARIMAX

Existem diversas tecnicas e modelos para analise de series temporais, entre as maiscomumente usadas temos a analise de Fourier, analise de Wavelets, Modelos ARIMAXe suas subdivisoes, Modelos Estruturais para Series de Tempo e Redes Neurais. A es-colha de qual tecnica utilizar e o respectivo modelo vai depender do que se espera daanalise da serie (por exemplo, se o objetivo e realizar previsoes ou se e importante ter aocorrencia dos dados no domınio do tempo, entao algumas dessas tecnicas nao supriraoestas necessidades), da complexidade de cada tecnica e das caracterısticas que cada serieindividualmente possui (como possuir estacionariedade ou nao). Neste trabalho foramescolhidos os modelos ARIMA e ARIMAX porque sao menos complexos que outros comoo modelo NARMAX, por exemplo, alem de serem modelos muito difundidos e que saocapazes de resolver adequadamente muitos problemas, incluindo problemas com seriestemporais nao-estacionarias.

Assim, os modelos adotados neste trabalho sao utilizados para modelar a saıda de umprocesso linear. A saıda desse processo linear corresponde a uma serie temporal, enquantoque as entradas deste processo sao o ruıdo branco (com media zero e variancia constante)e uma ou mais entradas exogenas. Esse processo pode ser visto na Figura 3.1.

Figura 3.1: O processo gerador da serie temporal juntamente com o sistema estimador daserie.

Na Figura 3.1 tem-se uma representacao do processo gerador da serie temporal, apartir das entradas, bem como o sistema estimador de um modelo para representar talserie temporal.

22 3 Modelos ARIMA e ARIMAX

Os processos nos quais existe entrada exogena serao modelados atraves do modeloARIMAX, e os processos nos quais nao existe entrada exogena (ou ela nao e conhecida)serao modelados atraves do modelo ARIMA. E importante lembrar que quando a entradaexogena do sistema nao e conhecida, o processo de estimacao do modelo torna-se maiscomplexo, tendo como alimentacao para o sistema estimador do modelo apenas os valoresda serie temporal, e tendo que estimar os valores do ruıdo.

3.1 Modelo ARIMA

Um dos modelos lineares mais utilizados para analise de series temporais no domıniodo tempo e o modelo ARIMA(p,d,q). Modelos ARIMA sao modelos auto-regressivosintegrados de medias moveis. O nome e dado em virtude deste modelo conter uma partedo modelo AR e outra parte do modelo MA (ambos serao descritos nesta secao), e sea serie original for transformada por uma (ou mais) diferenciacao, entao a serie originalsera uma integracao da serie diferenciada. O modelo e representado da seguinte forma:ARIMA(p,d,q), onde p e a ordem da parte AR do modelo, q e a ordem da parte MA domodelo, e d e o numero de diferencas que foram realizadas nos dados ate que a serie setornasse estacionaria (se a serie original ja e estacionaria, entao d=0) (MORETIN; TOLOI,2004).

Os passos para a construcao do modelo que melhor se ajusta aos dados da serietemporal sao descritos no fluxograma da Figura 3.2.

Os quatro passos do fluxograma sao descritos a seguir:

Selecao : E realizada a selecao do melhor tipo do modelo a ser usado: AR (que e repre-sentado por ARIMA(p, 0, 0)), MA (que e representado por ARIMA(0, 0, q)), ARI(que e representado por ARIMA(p, d, 0)), IMA (que e representado por ARIMA(0,d, q)), ARMA (que e representado por ARIMA(p, 0, q)) ou ARIMA completo (quee representado por ARIMA(p, d, q)).

Estimacao da ordem : Estimar as ordens do modelo (ordem da diferenca necessaria,ordem da parte AR e a ordem da parte MA).

Estimacao dos Coeficientes : E realizada a estimacao dos coeficientes do modelo jaselecionado.

Diagnostico : E realizado um diagnostico do modelo, a fim de verificar se o modelo eadequado, ou seja, representa bem a serie temporal. Caso o modelo nao seja ade-quado, voltar ao passo de Selecao. Caso contrario, termina a execucao do algoritmoe o modelo esta pronto para ser usado para diversas finalidades, como por exemplo,previsao.

A fase mais crıtica deste processo e o passo de estimacao das ordens. Pessoas diferentespodem achar diferentes modelos para uma mesma serie temporal, entao se deseja criarum modelo para previsao, deve-se escolher o modelo cujo erro de previsao seja o menorpossıvel, e assim por diante, sempre escolhendo o modelo que oferece o melhor desempenhona funcao para a qual este foi criado (MORETIN; TOLOI, 2004). Todas estas etapas seraomelhor detalhadas no capıtulo 4.

3.1 Modelo ARIMA 23

Figura 3.2: Fluxograma : construcao de um modelo ARIMA/ARIMAX.

24 3 Modelos ARIMA e ARIMAX

Embora as etapas do fluxograma da Figura 3.2 tenham sido descritas como sendo paraa criacao de um modelo ARIMA, as mesmas tambem sao aplicadas a criacao do modeloARIMAX. Para a criacao do modelo ARIMAX, alem da estimacao das ordens e coeficien-tes contidos no modelo ARIMA, deve-se estimar tambem as ordens e os coeficientes dasentradas exogenas.

O modelo ARIMA e destinado para series temporais nao-estacionarias, mas que to-mando-se d diferencas da serie (com d finito), esta torna-se estacionaria. Esse tipo deserie e conhecida como serie nao-estacionaria homogenea (MORETIN; TOLOI, 2004).

Uma vez que a serie nao-estacionaria homogenea Zt foi diferenciada d vezes, ela setransformou em uma serie estacionaria Wt = ∆dZt, e podemos representa-la como ummodelo ARMA(p,q) da forma:

Wt = φ1Wt−1 + φ2Wt−2 + ...+ φpWt−p + at − θ1at−1 − ...− θqat−q (3.1)

onde p e a ordem da parte auto-regressiva e q e a ordem da parte de medias moveis domodelo (MORETIN; TOLOI, 2004).

Quando o parametro d > 0, supoe-se que µ, a media de Wt, e igual a zero e portantonao e necessario adicionar um termo constante a serie. Caso contrario, existem duaspossibilidades: ou retira-se a media da serie antes de sua modelagem, e coloca-a novamenteno final, ou deve-se adicionar um termo constante θ0 ao modelo, e este devera ser estimado,juntamente com os outros coeficientes do modelo (MORETIN; TOLOI, 2004).

3.1.1 Caracterısticas do Modelo ARIMA

A entrada at do modelo e supostamente um ruıdo branco. Uma entrada at e conside-rada um ruıdo branco se (MORETIN; TOLOI, 2004):

• Contem media zero;

• Contem variancia constante;

• Contem covariancia nula E[εt.εt−s] = E[εt−j.εt−j−s] = L = 0, para todo valor de s.

3.1.2 Modelos AR e ARI

O modelo AR e um modelo que possui apenas a parte auto-regressiva (Auto-Regressive)do modelo ARIMA mais geral. Um modelo auto-regressivo de ordem p e representadopor AR(p), ou equivalentemente ao modelo ARIMA(p,0,0), sendo p a ordem do modelo,e assume a forma:

Z = φ1Zt−1 + φ2Zt−2 + ...+ φpZt−p + at (3.2)

onde Zt = Zt − µ.

Ja o modelo ARI e um modelo que possui apenas a parte auto-regressiva (Auto-Regressive) do modelo ARIMA mais geral, e a serie precisou de d diferencas para setornar estacionaria. Um modelo auto-regressivo integrado de ordem p e representado por

3.1 Modelo ARIMA 25

ARI(p,d), ou equivalentemente ao modelo ARIMA(p,d,0), sendo p a ordem do modelo, eassume a forma:

Wt = φ1Wt−1 + φ2Wt−2 + ...+ φpWt−p + at (3.3)

onde Wt = ∆dZt (d diferencas de Zt).

Para ambos os modelos, temos que µ e a media da serie (se a serie for estacionaria),ou nao tem significado especıfico (se a serie for nao-estacionaria).

3.1.3 Modelos MA e IMA

O modelo MA e um modelo que possui apenas a parte de medias moveis (MovingAverage) do modelo ARIMA mais geral. Um modelo de medias moveis de ordem q erepresentado por MA(q), ou equivalentemente ao modelo ARIMA(0,0,q), sendo q a ordemdo modelo, e assume a forma:

Zt = at − θ1at−1 − ...− θqat−q (3.4)

onde Zt = Zt − µ.

Ja o modelo IMA e um modelo que possui apenas a parte medias moveis (MovingAverage) do modelo ARIMA mais geral, e a serie precisou de d diferencas para se tornarestacionaria. Um modelo de medias moveis integrado de ordem q e representado porIMA(d,q), ou equivalentemente ao modelo ARIMA(0,d,q), sendo q a ordem do modelo, eassume a forma:

Wt = at − θ1at−1 − ...− θqat−q (3.5)

onde Wt = ∆dZt (d diferencas de Zt).

Para ambos os modelos, temos que µ e a media da serie (se a serie for estacionaria),ou nao tem significado especıfico (se serie e nao-estacionaria).

3.1.4 Modelo ARMA

O modelo ARMA e o modelo auto-regressivo (Auto-Regressive) e de medias moveis(Moving Average) combinados em um so. Esse modelo e aplicavel para series temporaisestacionarias, ou seja, nao necessita de diferencas (d = 0). Representa-se este modelocomo ARMA(p,q), sendo p a ordem da parte auto-regressiva, e q a ordem da parte demedias moveis do modelo. Equivalentemente, podemos representa-lo como um modeloARIMA(p,0,q) mais geral, esse modelo assume a forma (MORETIN; TOLOI, 2004):

Zt = φ1Zt−1 + φ2Zt−2 + ...+ φpZt−p + at − θ1at−1 − ...− θqat−q (3.6)

onde Zt = Zt − µ; e µ e a media da serie (para serie estacionaria).

26 3 Modelos ARIMA e ARIMAX

3.2 Modelo ARIMAX

O modelo ARIMAX e similar ao modelo ARIMA descrito anteriormente. A diferenca eque o modelo Auto-Regressivo (Auto-Regressive) Integrado (Integrated) de Medias Moveis(Moving Average) e Entradas Exogenas (Exogenous inputs) possui, alem dos parametrosauto-regressivos e de medias moveis, a entrada exogena (FERRARI, 2006). Desta forma,para o modelo ARIMAX, existira mais um termo a se estimar, r, que corresponde a ordemda equacao que representa a entrada exogena.

As etapas da construcao de um modelo ARIMAX sao os mesmos descritos na Figura3.2.

Na classe de modelos ARIMAX, tem-se um modelo mais simples denominado AR-MAX, onde nao sao realizadas operacoes de diferencas nos valores da serie temporal enem na(s) entrada(s) exogena(s). O modelo ARMAX e um modelo ARIMAX simplifi-cado, e assume a forma (FERRARI, 2006):

p∑j=0

djZt−j = b0Xt +r∑j=1

bjXt−j +

q∑j=0

cjat−j (3.7)

para t = 0,±1,±2, ..., onde:

• Z e um vetor de saıdas observaveis (corresponde aos pontos da serie temporal);

• X e um vetor de entradas observaveis;

• a e um vetor de elementos que caracterizam ruıdos aleatorios nao observaveis.

Assumindo-se que:

• Z e X sao estacionarios;

• a tem media zero e variancia σ2a.

No caso da serie temporal nao ser estacionaria, e necessario realizar a mesma quanti-dade de diferencas na saıda e na entrada. Neste caso, utiliza-se o modelo ARIMAX, queassume a forma (FERRARI, 2006):

p∑j=0

dj∆dZt−j = b0 +

r∑j=1

bj∆dXt−j +

q∑j=0

cjat−j (3.8)

O modelo ARIMAX pode ser generalizado para representar mais de uma entrada.

3.2.1 ARIMAX e suas Subdivisoes

De conhecimento do modelo ARIMA e suas subdivisoes vistas na secao anterior, pode-se construir, por analogia, os modelos ARX, ARIX, MAX e IMAX, que sao derivacoes domodelo ARIMAX.

3.3 Modelo SARIMA 27

3.3 Modelo SARIMA

O Modelo SARIMA e composto por um modelo ARIMA mais uma componente querepresenta a sazonalidade presente na serie temporal (MORETIN; TOLOI, 2004).

Quando e realizada a deteccao de uma componente sazonal em uma serie temporalanalisada, esta sazonalidade pode ser de dois tipos: determinıstica ou estocastica.

Quando a sazonalidade encontrada e determinıstica, com perıodo de 12 meses (su-pondo uma serie temporal mensal e com sazonalidade anual), esta serie pode ser modeladapor (MORETIN; TOLOI, 2004):

Zt = µt +Nt (3.9)

onde µt e uma funcao determinıstica periodica cujos valores sao iguais para cada t′ =t + i ∗ 12 (para i = 0, 1, ...); Nt e um processo estacionario modelado por um modeloARMA(p,q).

Segundo Moretin e Toloi (2004), Nt satisfaz a equacao:

φ(B)Nt = θ(B)at (3.10)

onde (B) e um vetor de operadores de atraso B, ou seja, (B12)Nt = Nt−12, at e um ruıdobranco e µt tem sua solucao dada por:

µt = µ+6∑j=1

[αj cos(2πjt)

12+ βj sin

(2πjt)

12] (3.11)

onde µ, αj, βj sao constantes desconhecidas.

Aplicando-se a diferenca sazonal (1−B12) a Equacao 3.9, tem-se:

(1−B12)Zt = (1−B12)µt + (1−B12)Nt (3.12)

como µt = µt−12, temos:(1−B12)Zt = (1−B12)Nt (3.13)

E finalmente, substituindo-se 3.10 em 3.13, tem-se:

φ(B)Wt = θ(B)(1−B12)at (3.14)

onde Wt = (1−B12)Zt.

Ja a sazonalidade estocastica e identificada atraves da analise da funcao de autocor-relacao (FAC) e da funcao de autocorrelacao parcial (FACP) da serie (FAC e FACP seraodetalhadas na subsecao 4.2.1), que sao diferentes de zero apenas nos multiplos do pe-rıodo de sazonalidade. A sazonalidade estocastica pode ser modelada da seguinte forma(MORETIN; TOLOI, 2004):

Zt = µt +Nt (3.15)

28 3 Modelos ARIMA e ARIMAX

onde µt agora e um processo estocastico. Tem-se que:

(1−B12)µt = Yt (3.16)

onde Yt e um processo estocastico. Novamente aplicando-se o operador (1−B12) a Equacao3.15, e de acordo com 3.16, tem-se:

(1−B12)Zt = Yt + (1−B12)Nt (3.17)

com φY (B)Yt = θY (B)at e φN(B)Nt = θN(B)εt. Onde at e εt sao ruıdos brancos inde-pendentes.

Moretin e Toloi (2004) demonstram que a Equacao 3.17 e equivalente a:

Φ(B12)∆D12Zt = Θ(B12)αt (3.18)

onde:

Φ(B12) = 1 − Φ1B12 − ... − ΦPB

12P : operador auto-regressivo sazonal de ordem P eestacionario;

Θ(B12) = 1−Θ1B12 − ...−ΘQB

12Q: operador de medias moveis sazonal de ordem Q einvertıvel;

∆12 = (1−B12): operador diferenca sazonal;

∆D12 = (1−B12)D: onde D indica o numero de diferencas sazonais realizadas;

αt: pode ser um ruıdo branco.

Como descrito anteriormente, αt pode ser ou nao um ruıdo branco, em caso positivo, aFAC de Zt e zero para todas as posicoes nao-sazonais e o modelo 3.17 e chamado de modelosazonal puro (MORETIN; TOLOI, 2004). Porem, se αt nao for um ruıdo branco e satisfizerum modelo ARIMA(p,d,q) (ϕ(B)αt = θ(B)at), sendo ϕ(B) = (1−B)dφ(B) e at um ruıdobranco, Moretin e Toloi (2004) demonstram que Zt satisfaz o modelo denominado ARIMAsazonal multiplicativo, ou seja, SARIMA(p, d, q)x(P,D,Q)12, a seguir:

φ(B)Φ(B12)(1−B12)D(1−B)dZt = θ(B)Θ(B12)at (3.19)

com θ(B) = 1− θ1B − ...− θqBq e φ(B) = 1− φ1B − ...− φpBp.

3.4 Modelo NARMAX

O modelo NARMAX (Non-linear Auto-Regressive with Moving Average and Exoge-nous inputs) e um modelo nao-linear, ao contrario dos modelos vistos neste capıtulo,porem e um modelo linear em seus parametros.

Devido a caracterıstica nao-linear, o modelo NARMAX e capaz de representar seriestemporais que apresentam um comportamento dinamico mais complexo do que aque-les modelados pelos modelos ARIMAX. Em contrapartida, a estimacao de um modelo

3.4 Modelo NARMAX 29

NARMAX e muito mais dispendiosa que os modelos lineares ja vistos, alem do que, algunspassos do processo de criacao do modelo NARMAX ainda nao estao bem estabelecidos(AGUIRRE; RODRIGUES; JACOME, 1998).

Na criacao de um modelo NARMAX, sao seguidas as mesmas etapas da criacao de ummodelo linear ARIMA/ARIMAX, descritas na Figura 3.2 (na etapa de selecao, deve-seescolher o modelo NARMAX), o que muda sao as tecnicas utilizadas em cada uma dessasetapas.

No modelo NARMAX, todo conhecimento previo existente sobre a serie deve ser uti-lizado para a escolha da estrutura do modelo adequada (AGUIRRE; RODRIGUES; JACOME,1998).

A estrutura do modelo NARMAX mono-variavel assume a forma:

Zt = FL(Zt−1, Zt−2, . . . , Zt−ny , Xt−b−1, . . . , Xt−b−nu+1

, at−1, at−2, . . . , at−ne) + at

(3.20)

para t = 1, ..., N . Onde FL e uma funcao nao-linear; L representa o grau de nao-linearidade; Zt e a saıda, com atraso maximo nz; Xt e a entrada, com atraso maximonx; e at e um ruıdo aditivo, com atraso maximo na; b e o retardo do sistema (AGUIRRE;RODRIGUES; JACOME, 1998).

A funcao FL nao e conhecida, e deve ser estimada de forma a representar adequada-mente toda a dinamica do sistema real. Os modelos polinomiais e racionais sao conside-rados bons modelos para aproximar a funcao FL. Um modelo polinomial de grau L quepode ser usado para representar o modelo NARMAX descrito em 3.20 assume a forma(AGUIRRE; RODRIGUES; JACOME, 1998):

Zt = θ0 +n∑

i1=1

θi1Ui1t +

n∑i1=1

n∑i2=i1

θi1Ui1t U

i2t

+ . . .+n∑

il=1

. . .n∑

il=il−1

θi1...ilUi1t . . . U

ilt + at

(3.21)

onde U1t = Zt−1, U

2t = Zt−2, . . . , U

ny+1t = Xt−d, . . . , U

ny+nu+1t = at−1 , . . . , Un

t = at−ne .Temos ainda que: n = nz + nx + na e θi sao os coeficientes a serem estimados.

A quantidade maxima de termos de um modelo NARMAX polinomial pode crescermuito a medida que o valor de L cresce e em funcao dos atrasos nz, nx e na tambem.Porem, se utilizassemos todos esses termos obterıamos um modelo muito grande. Assim,e aconselhavel reduzir o numero de parametros, porem garantindo que o modelo aindarepresente bem a dinamica da serie temporal. Para isso utiliza-se uma tecnica conhecidacomo deteccao de estrutura, capaz de selecionar os termos que sao realmente importantespara o modelo, e que devem ser incluıdos no mesmo (AGUIRRE; RODRIGUES; JACOME,1998).

Os modelos NARMAX polinomiais sao lineares com relacao aos seus coeficientes.Desta forma, os coeficientes podem ser estimados usando qualquer tecnica de estimacao

30 3 Modelos ARIMA e ARIMAX

de coeficientes para modelos lineares, como os algoritmos Least Mean Square (LMS) ouRecursive Least Square (RLS). Maiores detalhes sobre os modelos NARMAX podem serencontrados em (AGUIRRE; RODRIGUES; JACOME, 1998), pois estes modelos estao fora doescopo desta dissertacao.

31

4 Etapas da Modelagem paraModelo ARIMA/ARIMAX

Este capıtulo descreve com maiores detalhes as etapas de modelagem de uma serietemporal representada por modelos ARIMA e ARIMAX. As variantes do modelo ARIMA:ARMA, AR, MA, etc, bem como o modelo ARIMAX e seus variantes seguem as mesmasetapas gerais de modelagem descritas na Figura 3.2, apresentada no capıtulo anterior. Aseguir essas etapas sao analisadas em detalhes.

4.1 Selecao do Modelo

Nesta fase de selecao e realizada a escolha da melhor estrutura a ser usada para mo-delar a serie temporal, por exemplo, o modelo ARIMA, ARMA, ARIMAX ou NARMAX.Esta escolha e realizada com base no conhecimento previo que se tem a respeito da se-rie temporal em questao, escolhendo-se a categoria cujas caracterısticas sejam aplicaveisaquela serie.

Neste trabalho, utiliza-se sempre o modelo ARIMA(p,d,q) (ou ARIMAX(p,d,r,q), seexistem entradas exogenas) como estrutura, independente da serie ser estacionaria ou nao.Como nao se tem conhecimento previo se a serie temporal e auto-regressiva ou de mediasmoveis ou ambas, esta informacao so sera descoberta na fase de estimacao das ordens domodelo, motivo pelo qual e usado o modelo ARIMA (ou ARIMAX) geral.

4.2 Estimacao das Ordens do Modelo

Nesta etapa, o primeiro passo a ser executado e verificar se a serie precisa de algumatransformacao previa para estabilizar a sua variancia (MORETIN; TOLOI, 2004).

No segundo passo, e preciso verificar se a serie precisa ser diferenciada ou nao. Naose deve diferenciar a serie mais vezes do que ela necessita para tornar-se estacionaria.Analisando-se a variancia e possıvel escolher o parametro d adequadamente, pois a vari-ancia da serie diminui para uma diferenciacao/diferenca adequada e aumenta para umadiferenciacao/diferenca excessiva. Para isso, analisa-se a variancia da serie original e de-pois a variancia da serie com a primeira diferenca. Se a variancia da serie com primeiradiferenca diminuiu de valor, entao serie deve ser diferenciada pelo menos uma vez (d = 1por enquanto), se a variancia aumentou, entao a serie e estacionaria, e d = 0. Em se-

32 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX

guida, compara-se a variancia da serie com uma diferenca e a serie com duas diferencas.Se a variancia da serie com duas diferencas diminuiu, entao a serie sera diferenciada duasvezes (d = 2), caso contrario, a serie ja tornou-se estacionaria com uma diferenca apenas,e d = 1. Na pratica, a maior parte das series se tornam estacionarias com no maximod = 2, por isso neste trabalho e utilizado esse valor como limite maximo de d (MORETIN;TOLOI, 2004).

Uma vez que descobriu-se o melhor valor para d, a partir de agora passa-se a trabalharcom a serie diferenciada, caso d 6= 0. O proximo passo e utilizar uma tecnica para a escolhadas outras ordens dos modelos ARIMA/ARIMAX. A seguir sao apresentadas algumas dasprincipais tecnicas de determinacao da ordem de modelos ARIMA/ARIMAX.

4.2.1 Funcao de Autocorrelacao (FAC) e Funcao de Autocorre-lacao Parcial (FACP) Estimadas

Uma das formas de se encontrar as ordens do modelo e calculando-se e analisando-seas autocorrelacoes e autocorrelacoes parciais estimadas da serie.

A funcao de autocorrelacao estimada e calculada por:

rj =cjc0, j = 1, ..., N (4.1)

onde cj e a funcao de autocovariancia (FACV) estimada, sendo calculada por:

cj =1

N

N−j∑t=1

[(Zt − Z)(Zt+j − Z)], j = 0, 1, ..., N − 1 (4.2)

onde Z = 1N

∑Nt=1 Zt e a media amostral da serie, e r−j = rj (MORETIN; TOLOI, 2004).

E necessario saber se uma rj e considerada nula ou nao. Para isso, utiliza-se umintervalo de confianca aproximado, no qual rj e diferente de zero se (MORETIN; TOLOI,2004):

| rj |> 2σ(rj), j > q (4.3)

onde σ(rj) e a variancia de rj.

Existe tambem a funcao de autocorrelacao parcial estimada, φjj, que tambem e umafuncao utilizada na etapa de identificacao da ordem do modelo ARIMA. A FAC e FACPsao utilizadas para identificacao da ordem do modelo ARIMA exclusivamente, pois nao saocapazes de identificarem as ordens das entradas exogenas presentes no modelo ARIMAX.

De acordo com Moretin e Toloi (2004), denota-se por φkj o j-esimo coeficiente de ummodelo AR(k), de forma que φkk seja o ultimo coeficiente. Vejamos:

ρj = φk1ρj−1 + φk2ρj−2 + ...+ φkkρj−k (4.4)

para j = 1, ..., k, onde ρj e a funcao de autocorrelacao e como nao conhecemos seu valor,usamos o seu valor estimado (rj), obtido pela Equacao 4.1.

Para cada j = 1, ..., k, tem-se uma Equacao 4.4 diferente e o conjunto delas e conhecido

4.2 Estimacao das Ordens do Modelo 33

como equacoes de Yule-Walker, cuja representacao matricial e descrita abaixo:1 ρ1 ρ2 · · · ρk−1

ρ1 1 ρ2 · · · ρk−2...

ρk−1 ρk−2 ρk−3 · · · 1

φk1φk2· · ·φkk

=

ρ1

ρ2

· · ·ρk

(4.5)

Resolvendo as equacoes de Yule-Walker para k = 1, 2, ..., tem-se:

φ11 = ρ1 (4.6)

φ22 =

∣∣∣∣ 1 ρ1

ρ1 ρ2

∣∣∣∣∣∣∣∣ 1 ρ1

ρ1 1

∣∣∣∣ =ρ2 − ρ2

1

1− ρ21

(4.7)

φ33 =

∣∣∣∣∣∣1 ρ1 ρ1

ρ1 1 ρ2

ρ2 ρ1 ρ3

∣∣∣∣∣∣∣∣∣∣∣∣1 ρ1 ρ1

ρ1 1 ρ1

ρ2 ρ1 1

∣∣∣∣∣∣(4.8)

Logo, de forma geral, φjj e calculada da seguinte forma:

φjj =| P∗k || Pk |

(4.9)

onde Pk e a matriz de autocorrelacoes e P∗k e a matriz Pk com a ultima coluna substituıdapelo vetor de autocorrelacoes.

A FACP estimada, φjj, e considerada diferente de zero se (MORETIN; TOLOI, 2004):

| φjj |>2√N, j > p (4.10)

Para descobrir se a serie deve ser representada por um modelo ARI(p,d,0), IMA(0,d,q)ou ARIMA(p,d,q), calcula-se e analisa-se o comportamento da FAC e da FACP da seriediferenciada, e compara-se com o comportamento dos tres modelos acima citados, queestao descritos na Tabela 4.1. Se a FAC e FACP da serie tiverem seus comportamentossemelhantes aos comportamentos do modelo ARIMA(p,d,0) ou ARIMA(0,d,q), entao asordens p e q do modelo serao estimadas tambem de acordo com os comportamentos descri-tos na Tabela 4.1. Se a FAC e FACP da serie tiverem seus comportamentos semelhantesaos comportamentos do modelo ARIMA(p,d,q), entao a estimacao das ordens p e q naoe tao simples e estas nao poderao ser estimadas pela mesma tabela (MORETIN; TOLOI,2004).

Analisar a FAC e a FACP pode dar indıcios de que o modelo trata-se de um ARIMA,mas nao da indıcios sobre os melhores valores para p e q. Para este modelo, e indicado

34 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX

Tabela 4.1: Comportamento da FAC e FACP de varios modelos ARIMA.Modelo FAC FACP

ARIMA(p,d,0) Decai de acordo com exponenciase/ou senoides amortecidas. E in-finita em extensao.

Diferente de zero, para as posicoes≤ p, e igual a zero, para as posicoes> p (p sera o ordem do modelo).

ARIMA(0,d,q) Finita em extensao. O corte acon-tece apos a posicao q (q sera a or-dem do modelo).

Decai de acordo com exponenciase/ou senoides amortecidas. E infi-nita em extensao.

ARIMA(p,d,q) Decai de acordo com exponenciase/ou senoides amortecidas apos aposicao (q − p). E infinita em ex-tensao.

Decai de acordo com exponenciase/ou senoides amortecidas. E infi-nita em extensao.

utilizar a Funcao de Autocorrelacao Estendida (FACE). Esse metodo nao sera abordadoaqui, maiores detalhes sobre o mesmo podem ser encontrados em (MORETIN; TOLOI, 2004).

4.2.2 Criterio de Informacao de Akaike (CIA)

O criterio de informacao de Akaike e um metodo utilizado para estimar as melhoresordens de um modelo. Quando e aplicado a estimacao das ordens de um modelo ARIMA,o CIA escolhe o modelo cujas ordens p e q minimizam a equacao:

CIA(p, q) = ln σ2p,q + (p+ q)

C(N)

N(4.11)

O CIA e um metodo baseado em uma funcao penalizadora, onde N e o numero deamostras da serie temporal, C(N) e uma funcao do tamanho da serie e ln e o operador de

logaritmo natural (com base igual ao numero e). O termo (p+ q)C(N)N

da Equacao 4.11 eo termo penalizador, e aumenta a medida que as ordens do modelo aumentam; enquantoque σ2

p,q e a variancia do erro de modelagem (erro de predicao de um passo a frente ouresıduo), tambem chamada de variancia residual, e diminui a medida que as ordens domodelo aumentam. Assim, este metodo tenta equilibrar essas duas medidas (MORETIN;TOLOI, 2004).

4.2.2.1 CIA para Modelos ARIMA e ARIMAX

Serao escolhidas como ordens do modelo, o par de valores (p,q) que minimizam o valorCIA(p,q) da Equacao 4.12:

CIA(p, q) = N ln σ2a +

N

N − d2(p+ q + 1) +N ln 2π +N (4.12)

4.2 Estimacao das Ordens do Modelo 35

onde σa e o estimador de maxima verossimilhanca de σa (que e a variancia do ruıdo equi-valente a parte de medias moveis do modelo) e d e o numero de diferenciacoes/diferencas(MORETIN; TOLOI, 2004).

No entanto, a Equacao 4.12 nao pode ser utilizada para a estimacao das ordens detodos os tipos de modelo. A equacao do CIA sofrera pequenas modificacoes de acordocom o modelo para o qual o mesmo sera utilizado. A Equacao 4.12, por exemplo, serautilizada se a serie temporal e nao-estacionaria e sofreu diferenciacao/diferenca. Se a seriee estacionaria, a equacao do CIA sera (MORETIN; TOLOI, 2004):

CIA(p, q) = N ln σ2a + 2(p+ q + 2) +N ln 2π +N (4.13)

Porem, quando se deseja comparar varios modelos diferentes para a mesma serie (nestecaso o valor de N nao muda), os dois ultimos termos das Equacoes 4.12 e 4.13 podemser retirados. As duas novas equacoes serao, respectivamente, iguais a (MORETIN; TOLOI,2004):

CIA(p, q) = N ln σ2a +

N

N − d2(p+ q + 1) (4.14)

CIA(p, q) = N ln σ2a + 2(p+ q + 2) (4.15)

As Equacoes 4.14 e 4.15 sao calculadas para todas as combinacoes de p e q, 0 ≤ p ≤ Pe 0 ≤ q ≤ Q, onde os valores de P e Q sao escolhidos de acordo com a equacao a seguir(MORETIN; TOLOI, 2004):

P = Q = lnN (4.16)

onde N e o numero de amostras da serie temporal.

Segundo Moretin e Toloi (2004), e natural a suposicao de que as ordens p e q estimadaspara um modelo se tornem maiores a medida que N aumenta e em geral, os limitessuperiores P e Q sao encontrados em funcao de N . Alguns autores sugerem que sejautilizado como limite superior para as ordens do modelo, o valor de (lnN)α, com 0 ≤α ≤ ∞. Para maiores detalhes ver (MORETIN; TOLOI, 2004) e suas referencias. Nestadissertacao utilizou-se P = Q = (lnN)α com α = 1 que e equivalente a Equacao 4.16.

Pode-se ainda reescrever a equacao de CIA para series estacionarias conforme a equa-cao:

CIA(p, q) = ln σ2p,q +

2(p+ q)

N(4.17)

onde comparando-se com a Equacao 4.15, trocou-se o termo N ln σ2a por ln σ2

p,q, e realizou-se uma simplificacao no termo penalizador. Segundo Moretin e Toloi (2004), os valoresque minimizam a Equacao 4.17 sao os mesmos que minimizam a Equacao 4.15.

Para a combinacao de ordens (p,q) que se esta analisando no momento, e gerado ummodelo com as ordens p e q, os seus coeficientes sao estimados e entao este modelo eutilizado para prever valores para a serie temporal. Os valores previstos por este modelosao comparados com os valores reais da serie, e a diferenca entre eles e chamada de errode modelagem. Apos calculados os erros de modelagem para todos os valores previstos ecalculada a variancia dos erros de modelagem (σ2

p,q), cujo valor e substituıdo na Equacao4.17 e juntamente com os valores de p, q e N vai gerar o ındice CIA(p,q). O ındiceCIA(p,q) e calculado para varias combinacoes diferentes de ordens (p,q) e a combinacao

36 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX

de ordens que sera escolhida para o modelo sera aquela que minimizar o valor do ındice.

Embora o CIA apresentado nesta secao contenha apenas as ordens p e q, ja que eaplicado a estimativa das ordens do modelo ARIMA, o CIA pode ser estendido paraser aplicado tambem na estimativa das ordens do modelo ARIMAX, bastando para issosomar as ordens das entradas exogenas do modelo junto com as ordens (p + q) do termopenalizador.

4.2.2.2 CIA para Modelos AR

Para o caso do modelo utilizado ser um modelo AR, a equacao do CIA sera (MORETIN;TOLOI, 2004):

CIA(p) = N ln σ2p + 2p (4.18)

para p ≤ P e P = lnN .

Existem ainda outras equacoes para o calculo do CIA que foram criados com o intuitode melhorar a qualidade da estimacao das ordens, diminuindo-se para isso, a probabilidadede selecao de ordens maiores que as verdadeiras da serie temporal, ou seja, superestimacaodas ordens.

Um equacao proposta com o intuito de diminuir a probabilidade de superestimar aordem de um modelo AR e a equacao abaixo (MORETIN; TOLOI, 2004):

CIAc(p) = CIA(p) +2(p+ 1)(p+ 2)

(N − p+ 2)(4.19)

para p ≤ P e P = lnN .

Porem, o CIAc mostrou-se util apenas quando N e um numero pequeno ou quando ovalor de P e uma fracao “moderadamente grande” de N (MORETIN; TOLOI, 2004).

Uma outra equacao proposta para melhorar a qualidade da estimacao da ordem deum modelo AR e o CIAα:

CIAα(p) = N ln σ2p + αp (4.20)

para p ≤ P e P = lnN .

Segundo Moretin e Toloi (2004), a probabilidade de selecao da ordem correta domodelo utilizando-se o CIAα aumenta a medida que o valor de α cresce, e um valorconsistente para ser utilizado em α, seria:

α = 2 ln (lnN) (4.21)

4.2.2.3 CIA para Modelos SARIMA

Quando se trata de modelagem utilizando modelos SARIMA, o CIA a ser utilizadosera:

CIA(p, q, P,Q) = −2 logL+ 2a (4.22)

4.2 Estimacao das Ordens do Modelo 37

onde a e o numero de coeficientes do modelo (a = p + q + P + Q), p e a ordem da parteauto-regressiva, q e a ordem da parte de medias moveis, P e a ordem da parte auto-regressiva sazonal e Q e a ordem da parte de medias moveis sazonal e L e a funcao deverossimilhanca utilizando os a coeficientes estimados.

Porem, Barbiero (2003) sugere a utilizacao de uma aproximacao da Equacao 4.22, porquestoes computacionais. A equacao aproximada e mostrada abaixo:

CIA(p, q, P,Q) ∼= N(1 + log 2π) +N log σ2 + 2a (4.23)

onde a e o numero de coeficientes do modelo (a = p + q + P + Q), p e a ordem da parteauto-regressiva, q e a ordem da parte de medias moveis, P e a ordem da parte auto-regressiva sazonal e Q e a ordem da parte de medias moveis sazonal e N e o numero deobservacoes da serie e σ2 e a variancia residual (MEDEIROS, 2006).

4.2.2.4 Outras Equacoes para CIA

Outras equacoes para o calculo do CIA encontrados na literatura, que podem seraplicados a modelos ARIMA e ARIMAX sao:

CIA = logSQE

N+ 2

b

N(4.24)

onde SQE e a Soma dos Quadrados dos Erros (SQE) de ajuste do modelo a serie temporal,b e o numero de coeficientes do modelo, e N e o numero de observacoes da serie (HOFLER,2001).

CIA =−2 logFV

N+ 2

b

N(4.25)

onde b e o numero de coeficientes do modelo, FV e a Funcao de Verossimilhanca (FV)utilizando os b coeficientes estimados, e N e o numero de observacoes da serie (HOFLER,2001).

CIA = N lnσ2erro + 2b (4.26)

onde b e o numero de coeficientes do modelo, σ2erro e a variancia do erro de modelagem

utilizando os b coeficientes estimados, e N e o numero de observacoes da serie (MEDEIROS,2006).

4.2.2.5 Criterio de Informacao de Akaike Modificado

O criterio de informacao de Akaike utilizado nesta dissertacao para a estimacao dasordens do modelo ARIMAX foi modificado de forma a estimar, alem das ordens p, q er, os atrasos c de cada entrada exogena presente no modelo. A diferenca do CIA para oCIA modificado e que o primeiro calcula o valor de Akaike com base na soma das ordensp, q e r do modelo (considerando sempre o atraso igual a zero e todos os termos da parteexogena presentes), enquanto que o CIA modificado calcula o valor de Akaike com base nasoma das ordens p, q e a quantidade de termos da parte exogena do modelo, r′, conforme

38 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX

pode ser visto na equacao modificada do CIA (Equacao 4.27). Isto possibilita a estimacaodo atraso da(s) entrada(s) exogena(s) do modelo ARIMAX.

CIA(p, q, r, c) = N ln σ2p,q,r,c + 2(p+ q + r′) (4.27)

onde c e o atraso da entrada exogena, σ2p,q,r,c e a variancia residual estimada para o

modelo criado com as ordens p, q, r e atraso c; r′ corresponde a quantidade de termosexogenos presentes no modelo ARIMAX. E importante ter em mente que r pode serum unico numero (caso o modelo possua apenas uma entrada exogena) ou pode ser umvetor contendo s ordens (caso o modelo possua s entradas exogenas), neste ultimo caso,a quantidade de termos de todas as s entradas exogenas serao somadas para formar onumero r′. O atraso c tambem pode ser um unico valor ou um vetor contendo os atrasosde todas as entradas exogenas.

De maneira similar ao CIA, no CIA modificado a Equacao 4.27 e calculada para todasas combinacoes de p, q e r, para 0 ≤ p ≤ P , 0 ≤ q ≤ Q e 0 ≤ r ≤ R, onde os valores deP , Q e R sao escolhidos de acordo com a equacao a seguir:

P = Q = R = lnN (4.28)

onde ln e o operador de logaritmo natural (com base igual ao numero e), e N e o numerode amostras da serie temporal.

Por exemplo, suponha um modelo que possua uma entrada exogena X com os se-guintes termos: Xt−1, Xt−2 e Xt−3, ou seja, a ordem r = 3 (r e a quantidade de termosda entrada exogena) e o atraso c = 1 (c e o atrasador do primeiro termo da entradaexogena). Utilizando-se o CIA para estimar a ordem r deste modelo, este estimaria r = 4e o modelo conteria os termos Xt−0, Xt−1, Xt−2 e Xt−3, ou seja, conteria o termo Xt−0

equivocadamente. O CIA modificado testa varios atrasos c diferentes para um mesmovalor de ordem r, e assim identifica qual desses atrasos gerou o modelo com o melhorajuste a serie temporal. Para o mesmo exemplo anteriormente citado, utilizando-se o CIAmodificado, este estimaria a ordem r = 3 e atraso c = 1, e portanto o modelo conteriaapenas os termos Xt−1, Xt−2 e Xt−3, como consequencia disto terıamos tambem r′ = 3(quantidade de termos da parte exogena do modelo).

Ao utilizar-se o CIA e necessario armazenar, durante a sua execucao e apos o seutermino, os valores de p, q e r que apresentaram os menores valores para a equacao do CIA.Entretanto, ao utilizar-se o CIA modificado e necessario armazenar alem dos valores de p,q e r que minimizaram a Equacao 4.27, uma matriz contendo a informacao dos termos detodas as entradas exogenas que fazem parte do modelo ARIMAX. A partir dessa matrizsabe-se os atrasos (c) de cada entrada exogena. Embora o CIA modificado necessitearmazenar mais informacoes que o CIA, este armazenamento nao traz nenhum prejuızoao metodo CIA modificado em termos de tempo de processamento quando comparado aoCIA.

O CIA modificado foi o metodo escolhido e utilizado neste trabalho. A escolha sejustifica pelo metodo ser simples, eficiente e poder ser aplicado aos modelos ARIMA eARIMAX. As equacoes do CIA que foram implementadas no ambiente computacionalpara esta dissertacao foram a Equacao 4.26 e a Equacao 4.27, para serem aplicados aosmodelos ARIMA e ARIMAX, respectivamente.

4.3 Estimacao dos Coeficientes do Modelo 39

4.2.3 Criterio de Informacao Bayesiano (CIB)

O metodo CIB, assim como o CIA, tambem e um metodo baseado em uma funcaopenalizadora (MORETIN; TOLOI, 2004).

Neste caso, escolhe-se o modelo cujas ordens (p, q) minimizam a equacao (MORETIN;TOLOI, 2004):

CIB(p, q) = ln σ2p,q + (p+ q)

lnN

N(4.29)

para um modelo ARIMA.

Para aplica-lo ao modelo ARIMAX basta adicionar o vetor r contendo as ordens detodas as entradas exogena (r1, r2, etc) no calculo. Por exemplo:

CIB(p, q, r) = ln σ2p,q,r + (p+ q + r1 + r2 + ...)

lnN

N(4.30)

4.3 Estimacao dos Coeficientes do Modelo

Nesta fase, identifica-se os coeficientes do modelo anteriormente identificado. Valerelembrar que se o modelo for ARIMA(p,d,0) ou ARIMA(0,d,q), so e necessario identificaros coeficientes da parte auto-regressiva ou da parte de medias moveis, respectivamente.Se o modelo for ARIMAX(p,d,0,r) ou ARIMAX(0,d,q,r), so e necessario identificar oscoeficientes da parte auto-regressiva ou da parte de medias moveis, respectivamente, alemda parte de entradas exogenas.

Assim, serao estimados (p + q + 1) coeficientes (p coeficientes para a parte AR; qcoeficientes para a parte MA; e 1 para o termo at). Se a media da serie µw nao for iguala zero, adiciona-se uma constante ao modelo (θ0), somando-se (p + q + 2) coeficientes aserem estimados, neste ultimo caso.

4.3.1 Metodo de Maxima Verossimilhanca

Dados φ= (φ1, ..., φp) e θ= (θ1, ..., θq), o metodo de maxima verossimilhanca torna-seequivalente a minimizar a funcao:

S∗(η) =N∑t=1

a2t (η | W,W ∗, a∗) (4.31)

onde η=(φ, θ), ou seja, e a combinacao de coeficientes que se esta testando no momento.W ∗ e a∗ sao os valores iniciais estimados de W e a respectivamente, W sao os valoresreais da serie (diferenciada, se d > 0), a sao os ruıdos da serie e N e o numero deamostras da serie (MORETIN; TOLOI, 2004). Detalhando-se a Equacao 4.31, temos quea2t (η | W,W ∗, a∗) significa o valor de a no instante de tempo t elevado ao quadrado,

calculado atraves da Equacao 4.34 para o conjunto de coeficientes η, utilizando-se osvalores da serie W e os valores iniciais W ∗ e a∗.

Para calcular S∗, serao necessarios valores iniciais estimados de at e Wt, chamados de

40 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX

a∗ e W ∗, valores estes que nao temos conhecimento. Uma forma de resolver este problema,e estimar os valores iniciais (nao conhecidos) de at e Wt como sendo sua media, que saoE(at) = 0 e E(Wt) = W , respectivamente (MORETIN; TOLOI, 2004).

Para cada combinacao de valores de coeficientes η diferente, calcula-se o valor de atatraves da Equacao 4.34, para t = 1, ..., N , usando-se os valores iniciais estimados a∗ e W ∗,e os valores Wt da serie temporal. Depois de todos os a1, ..., aN calculados, substitui-seseus valores na Equacao 4.31 e encontra-se o valor de S∗(η).

Apos calculados os valores de S∗ para todas as combinacoes dos coeficientes φ e θ, nointervalo de (-1,1), os coeficientes escolhidos serao aqueles que minimizaram S∗ (MORETIN;TOLOI, 2004).

4.3.2 RLS - Recursive Least Squares (Mınimos Quadrados Re-cursivos)

O RLS e um algoritmo que estima recursivamente os coeficientes do modelo de umfiltro, de tal forma que, no final de sua execucao, tem-se um conjunto de coeficientesestimados tais que, a soma do quadrado dos erros (diferenca entre o sinal esperado e osinal obtido pelo filtro) seja o mınimo (least squared) possıvel (WIKIPEDIA, 2005).

Um filtro pode ser modelado segundo a equacao a seguir:

Z(n) = HTnB(n) (4.32)

onde B(n) e o vetor contendo os sinais de entrada do filtro, Z(n) e o sinal de saıda dofiltro, HT

n e o vetor transposto de Hn e Hn e o vetor contendo os pesos do filtro naiteracao n (WIKIPEDIA, 2005).

A ideia por tras do algoritmo RLS e sempre minimizar uma funcao custo C (geralmenteusa-se o erro quadratico entre o sinal desejado e o sinal obtido), atraves da escolha domelhor conjunto de pesos Hn para a entrada atual, e sempre atualizar o filtro a medidaque uma nova entrada chega. Assim, a cada instante de tempo (n+ 1, por exemplo), umnovo conjunto de pesos Hn+1 e estimado, com base no conjunto de pesos Hn do instanteanterior (WIKIPEDIA, 2005). O algoritmo e chamado recursivo, devido ao fato de que onovo valor de Hn, depende apenas do Hn−1 (anterior) mais uma diferenca (∆). Comovemos na equacao abaixo:

Hn = Hn−1 + ∆Hn−1 (4.33)

A Figura 4.1 ilustra o funcionamento do RLS, onde a cada instante de iteracao n, oerro e(n) e calculado (e(n) = Z(n)− Z(n)), e a partir deste erro e outros parametros, umalgoritmo de atualizacao gera um ∆Hn, que somado aos pesos atuais Hn, darao origemaos novos pesos Hn+1.

O algoritmo RLS pode ser facilmente adaptado para ser utilizado com series tempo-rais, para encontrar os coeficientes de um modelo ARX ou AR que represente uma serie.Quando o algoritmo RLS e aplicado a uma serie temporal, B(n) sera um vetor contendovalores passados da serie, alem dos valores das entradas exogenas e um valor constante,Z(n) sera equivalente a Zn (o valor da serie temporal no instante n previsto pelo modeloARX), Z(n) sera equivalente a Zn (o valor da serie temporal no instante n) e o filtro

4.3 Estimacao dos Coeficientes do Modelo 41

Figura 4.1: Componentes do RLS.

representara o modelo ARX, onde os pesos contidos no vetor Hn serao os coeficientesdesse modelo.

Todos os passos do algoritmo RLS sao sumarizados no Algoritmo descrito na Figura4.2.

As primeiras linhas do algoritmo contem os parametros e variaveis utilizadas peloRLS, bem como as variaveis recebidas e as retornadas pelo algoritmo. Logo apos, temosas inicializacoes de algumas dessas variaveis.

Os passos 1 a 8 descritos na Figura 4.2 contem o algoritmo RLS propriamente dito.Em cada iteracao n (n = 1, ..., N), o vetor B(n) e montado de acordo com a seguintesequencia:

B(n) =

B(1)B(2)

...B(m)

=

Zn−1

Zn−2...

Zn−pX1n−atraso1

X1n−(atraso1+1)

...X1n−r1

X2n−atraso2

X2n−(atraso2+1)

...X2n−r2...

Xsn−atrasos

Xsn−(atrasos+1)

...Xsn−rsbias

42 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX

Parametros :m : quantidade de coeficientes a serem estimados;λ : fator de esquecimento. O λ e um valor fixo a ser escolhido. Quanto menor, menore a contribuicao de amostras antigas do calculo de Hn, ou seja, menos flutuacoes nosvalores dos pesos Hn. Quanto maior seu valor, ocorre o oposto;δ : Valor usado para inicializar a matriz P(0). δ deve ter um valor alto, como 104,por exemplo;N : numero de amostras da serie temporal;P(n) : matriz (m)x(m);B(n) : matriz de entrada (m)x(1);Hn : matriz de pesos (m)x(1);HTn : matriz Hn transposta;

Z(n) : matriz de saıda desejada (1)x(1);g(n) : matriz de ganhos (m)x(1);α(n) : matriz que possui o erro entre as saıdas desejada e obtida (1)x(1);

Inicializacoes :λ : valor fixo entre 0 < λ ≤ 1;Hn=0;P(0)=δ−1I (onde I e uma matriz identidade (m)x(m));n = 1;

Inıcio:1. Iteracao = n

2. Monte : B(n) =

B(1)B(2)

...B(m)

3. Calcule : α(n) = Z(n)−HT

n−1B(n)

4. Calcule : g(n) = P (n− 1)B(n)λ+BT (n)P (n− 1)B(n)−1

5. Calcule : P (n) = λ−1P (n− 1)− g(n)BT (n)λ−1P (n− 1)6. Atualize os pesos : Hn = Hn−1 + g(n)α(n)7. Se n 6= N e Hn nao convergiu: incrementa n e volte ao passo 1. Senao : va aopasso 8.8. Termina a execucao do algoritmo e retorna os pesos finais : HN

Resultados:HN (Hn na iteracao N);

Figura 4.2: Algoritmo RLS (WIKIPEDIA, 2005).

4.3 Estimacao dos Coeficientes do Modelo 43

onde Zn e o valor da serie temporal no instante n; X in e o valor da entrada exogena i

no instante n; s e a quantidade de entradas exogenas existentes; m e a quantidade decoeficientes a serem estimados; p e a ordem da parte AR do modelo; ri e a ordem daentrada exogena i do modelo; atrasoi e o atraso da entrada exogena i do modelo e biase um termo constante que pode ou nao aparecer no modelo ARX (caso o bias nao facaparte do modelo, o seu valor estimado sera igual a zero).

No passo 3, e realizado o calculo de α(n), que nada mais e que a diferenca entre ovalor desejado (que corresponde a propria serie temporal) e o valor estimado pelo modelocom os coeficientes Hn−1. No passo 4 e calculada a matriz de ganhos (g(n)), no passo 5 ecalculada a nova matriz P (n) (que sera utilizada na proxima iteracao do algoritmo). Nopasso 6, a matriz de pesos Hn e atualizada com base na propria matriz Hn−1 (pesos daiteracao anterior). Os pesos da matriz Hn representam todos os coeficientes do modeloARX.

A condicao de parada do algoritmo e quando a matriz Hn tiver convergido ou quandon atinge o valor de N , porque depois da iteracao n = N nao se tem mais conhecimentodos valores das entradas exogenas e nem da serie temporal. Caso uma das condicoesde parada tenha sido atingida, entao o algoritmo termina a sua execucao e retorna comoresultado a matriz Hn (pesos da iteracao n). Caso contrario, o valor de n e incrementado,e a execucao do algoritmo volta ao passo 1.

As vantagens de se usar o algoritmo RLS sao: simplicidade, pois nao precisa invertermatrizes; independencia, pois o RLS depende apenas de seus sinais, nao e dependentedo conhecimento de suas estatısticas; e velocidade, pois converge para o resultado otimorapidamente.

4.3.3 ELS - Extended Least Squares (Mınimos Quadrados Es-tendidos)

O algoritmo RLS nao pode ser utilizado para estimar os coeficientes de um modelo quepossui a parte de medias moveis, como por exemplo o ARIMA ou ARIMAX, porque nestesmodelos existem ruıdos cuja dinamica nao sao conhecidas mas precisam ser estimadas,ja que sao incluıdas no proprio modelo. Para estes dois tipos de modelo, usa-se emsubstituicao ao algoritmo RLS, o algoritmo ELS, que como o proprio nome sugere, e umaextensao do algoritmo RLS.

O algoritmo ELS tem seu funcionamento similar ao do RLS, porem o ELS tambemestima os valores dos ruıdos presentes na serie temporal. O funcionamento do ELS podeser sumarizado no algoritmo descrito na Figura 4.3. O algoritmo esta descrito para ser uti-lizado com o modelo ARIMAX, mas pode ser adaptado para o modelo ARIMA, bastandopara isso desprezar as entradas exogenas.

As primeiras linhas do algoritmo descrito na Figura 4.3 contem os parametros e varia-veis utilizadas pelo ELS, bem como as variaveis recebidas e as retornadas pelo algoritmo.Logo apos, temos as inicializacoes de algumas dessas variaveis. Os passos 1 a 11 contemo algoritmo ELS propriamente dito. Inicialmente no passo 1, e realizada a estimacao damatriz Harxn (diferente de Hn, que contem os coeficientes do modelo ARIMAX) comose o modelo fosse um ARX (ou seja, a matriz B(n) sera montada sem os valores de ruıdos

44 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX

Parametros :m : quantidade de coeficientes a serem estimados;a(n) : matriz de ruıdos da serie que serao estimados pelo ELS;λ : fator de esquecimento. O λ e um valor fixo a ser escolhido. Quanto menor, menore a contribuicao de amostras antigas do calculo de Hn, ou seja, menos flutuacoes nosvalores dos pesos Hn. Quanto maior seu valor, ocorre o oposto;δ : Valor usado para inicializar a matriz P(0). Deve ter um valor alto, como 104;N : numero de amostras da serie temporal;P(n) : matriz (m)x(m);B(n) : matriz de entrada (m)x(1);Hn : matriz de pesos (m)x(1);HTn : matriz Hn transposta;

Harxn : matriz de coeficientes do modelo ARX (numero de termos do modeloARX)x(1);HarxTn : matriz Harxn transposta;Z(n) : matriz de saıda desejada (1)x(1);g(n) : matriz de ganhos (m)x(1);α(n) : matriz que possui o erro entre as saıdas desejada e obtida (1)x(1);

Inicializacoes :λ : valor fixo entre 0 < λ ≤ 1;Hn=0;P(0)=δ−1I (onde I e uma matriz identidade (m)x(m));n = 1;

Inıcio:1. Estime os parametros de um modelo ARX, ou seja, estime os valores da matrizHarxn2. Calcule os ruıdos a(n) = Z(n)−HarxTnB(n) para os valores passados necessarios3. Iteracao = n

4. Monte : B(n) =

B(1)B(2)

...B(m)

5. Calcule : α(n) = Z(n)−HT

n−1B(n)

6. Calcule : g(n) = P (n− 1)B(n)λ+BT (n)P (n− 1)B(n)−1

7. Calcule : P (n) = λ−1P (n− 1)− g(n)BT (n)λ−1P (n− 1)8. Atualize os pesos : Hn = Hn−1 + g(n)α(n)9. Calcule os ruıdos a(n) = Z(n)−HT

nB(n) para os valores passados necessarios10. Se n 6= N e Hn nao convergiu: incrementa n e volte ao passo 3. Senao : va aopasso 11.11. Termina a execucao do algoritmo e retorna os pesos finais : HN

Resultados:HN (Hn na iteracao N);

Figura 4.3: Algoritmo ELS (FERRARI, 2006).

4.3 Estimacao dos Coeficientes do Modelo 45

an−1, at−2, etc). No passo 2, os ruıdos iniciais necessarios para a execucao do algoritmoELS sao estimados. O ruıdo sera a diferenca entre o valor desejado (que e o valor da serietemporal) e o valor estimado pelo modelo ARX (cujos coeficientes foram estimados nopasso 1). Inicialmente os ruıdos sao calculados com base em um modelo ARX e nao ummodelo ARIMAX porque se utilizassemos este ultimo, precisarıamos de valores de ruıdosmais antigos ainda, os quais nao tem-se conhecimento (FERRARI, 2006).

A partir do passo 3, o algoritmo ELS e similar ao RLS. Em cada iteracao n (n =1, ..., N), o vetor B(n) e montado de acordo com a seguinte sequencia:

B(n) =

B(1)B(2)

...B(m)

=

Zn−1

Zn−2...

Zn−pan−0

an−1...

an−qX1n−atraso1

X1n−(atraso1+1)

...X1n−r1

X2n−atraso2

X2n−(atraso2+1)

...X2n−r2...

X in−atrasoi

X in−(atrasoi+1)

...X in−ribias

Onde Zn e o valor da serie temporal no instante n; X i

n e o valor da entrada exogena i noinstante n; an e o valor do ruıdo no instante n que foi estimado pelo ELS; s e a quantidadede entradas exogenas existentes; m e a quantidade de coeficientes a serem estimados; p ea ordem da parte AR do modelo; q e a ordem da parte MA do modelo; ri e a ordem daentrada exogena i do modelo; atrasoi e o atraso da entrada exogena i do modelo e biase um termo constante que pode ou nao aparecer no modelo ARX (caso o bias nao facaparte do modelo, o seu valor estimado sera igual a zero). No passo 3, se n = 1, entao osruıdos a(n) utilizados sao os ruıdos iniciais calculados no passo 2 do algoritmo.

No passo 5, e realizado o calculo de α(n), que nada mais e que a diferenca entre ovalor desejado (que corresponde a propria serie temporal) e o valor estimado pelo modelocom os coeficientes Hn−1.

No passo 6 e calculada a matriz de ganhos (g(n)) e no passo 7 e calculada a nova matrizP (n) (que sera utilizada na proxima iteracao do algoritmo). No passo 8, a matriz de pesos

46 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX

Hn e atualizada com base na propria matriz Hn−1 (pesos da iteracao anterior). Os pesosda matriz Hn representam todos os coeficientes do modelo ARIMAX, com excecao docoeficiente do termo at−0. Este coeficiente nao e estimado pelo algoritmo ELS porque seuvalor e fixo e igual a 1,0.

No passo 9, os ruıdos necessarios para a proxima iteracao do algoritmo sao estimados.O ruıdo, neste ponto, sera a diferenca entre o valor desejado (que e o valor da serietemporal) e o valor estimado pelo modelo ARIMAX (cujos coeficientes foram estimadosno passo 8) (FERRARI, 2006).

O algoritmo para quando a matriz Hn tiver convergido ou quando n atinge o valorde N , porque depois da iteracao n = N nao se tem mais conhecimento dos valores dasentradas exogenas e nem da serie temporal. Caso uma das condicoes de parada tenha sidoatingida, entao o algoritmo termina a sua execucao e retorna como resultado a matriz Hn

(pesos da iteracao n). Caso contrario, o valor de n e incrementado, e a execucao doalgoritmo volta ao passo 3.

As vantagens do algoritmo ELS sao as mesmas do algoritmo RLS.

4.4 Diagnostico do Modelo

Uma vez que foi construıdo um modelo para representar a serie temporal, o proximopasso e fazer o diagnostico deste modelo, ou seja, verificar se ele modela adequadamenteos dados da serie temporal.

Na maioria dos casos, quando um modelo nao e adequado para representar uma serietemporal, deve-se optar por um outro modelo com mais parametros que o anterior, ou seja,com uma ordem superior. Se a variancia residual deste novo modelo e significativamentemenor que a variancia residual do modelo previo, significa que o novo modelo se ajustamelhor aos dados da serie temporal que o modelo previo (MORETIN; TOLOI, 2004).

Nesta etapa do processo de modelagem, alem de diagnosticar se um modelo e adequadoou nao a um serie temporal, pode-se tambem dar indıcios de quais parametros devemser adicionado ao modelo preliminar, no caso de este ter sido diagnosticado como naoadequado a serie temporal (MORETIN; TOLOI, 2004).

A seguir, tem-se alguns testes que sao uteis para diagnosticar se um modelo ARIMA/ARIMAX e adequado ou nao a uma serie temporal:

4.4.1 Teste de Autocorrelacao Residual

Este teste baseia-se na autocorrelacao estimada dos resıduos.

De posse dos vetores φ e θ, que correspondem respectivamente aos coeficientes daparte auto-regressiva e de medias moveis do modelo ARIMA, escolhidos na etapa deestimacao dos coeficientes do modelo, calcula-se at, chamados de resıduos estimados.Onde at pode ser calculado por (MORETIN; TOLOI, 2004):

at = Wt − φ1Wt−1 − ...− φpWt−p + θ1at−1 + ...+ θqat−q (4.34)

4.4 Diagnostico do Modelo 47

onde Wt = ∆dZt.

Se o modelo encontrado for adequado, at devera ser aproximadamente nao correlaci-onado, assim como at o e. Pode-se calcular as autocorrelacoes residuais de at, rk, atravesda seguinte equacao (MORETIN; TOLOI, 2004):

rk =

∑nt=k+1 atat−k∑n

t=1 a2t

(4.35)

ondeN e o numero de amostras da serie original (sem diferenciacao/diferenca) e n = N−d.

Para um modelo adequado, e suposto que: rk ' 0 (para todos os rk). Um bomlimite para considerar rk ' 0 e o valor ±2/

√n (MORETIN; TOLOI, 2004). Assim, se

−2/√n ≤ rk ≤ 2/

√n, rk pode ser considerado igual a zero.

Se algum valor de rk estiver fora deste limite, o modelo nao e adequado, pois issoindica uma quebra de comportamento de ruıdo branco em at, lembrando-se que paravalores pequenos de k, estes limites subestimarao a significancia de qualquer discrepancia(MORETIN; TOLOI, 2004).

O teste de autocorrelacao residual tambem pode ser aplicado a modelos ARIMAX,bastando para isso adicionar do lado direito da Equacao 4.34, os termos do modelo ARI-MAX que correspondem as entradas exogenas com os seus sinais invertidos.

4.4.2 Teste de Autocorrelacao Cruzada

Este teste baseia-se na correlacao cruzada entre o valor atual de at e os valores ante-riores da serie.

A funcao de correlacao cruzada e calculada por (MORETIN; TOLOI, 2004):

sk =

∑nt=k+1 at(Zt−k − Z)

[∑n

t=1 a2t

∑nt=1 /(Zt − Z/)2]1/2

(4.36)

para k = 1, 2, ... . Onde Zt e o valor da serie temporal no instante t, Z e o valor medioda serie e at e calculado pela Equacao 4.34.

Se o modelo for adequado a serie, entao at e Zt−k sao nao-correlacionados, ou seja, acorrelacao cruzada entre eles deve ser igual a zero, para k ≥ 1. A correlacao cruzada ske significativamente diferente de zero se | sk |> 2√

n(exceto para valores pequenos de k)

(MORETIN; TOLOI, 2004).

O teste de autocorrelacao cruzada tambem pode ser aplicado a modelos ARIMAX.

4.4.3 Adicionando Novos Termos ao Modelo ARIMA/ARIMAX

A analise da funcao de correlacao cruzada (sk) e da autocorrelacao residual (rk) atravesde graficos nos da bons indıcios de quais termos devem ser adicionados ao modelo previo,a fim de torna-lo adequado a serie temporal.

48 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX

Se o modelo mostrou-se inadequado, primeiramente deve-se incluir novos termos auto-regressivos ao modelo. Se algum valor sk e significativamente diferente de zero, entaodeve-se adicionar um termo auto-regressivo com atraso k, φkWt−k, ao modelo previo.Deve-se testar, ∀k, se algum valor sk e significativamente diferente de zero (MORETIN;TOLOI, 2004).

Depois de inserir termos auto-regressivos, para as posicoes em que o sk for consideradadiferente de zero, deve-se analisar rk. Se | rk | possui valor significativamente diferente dezero, entao um termo de medias moveis, θkat−k tambem devera ser adicionado ao modelo(MORETIN; TOLOI, 2004).

Moretin e Toloi (2004) ressaltam que se termos de medias moveis sao adicionados nafase de selecao do modelo, a interpretacao de valores grandes de | sk | nao e tao obvia.

4.5 Previsoes com o Modelo ARIMA e ARIMAX

De posse dos valores de uma serie temporal Z= Z1, Z2, ..., Zt, nos instantes t = 1, ..., t,a previsao e realizada para valores Zt+h, onde h ≥ 1 (chamado de horizonte de previsao)e o instante t (o instante cujo valor da serie e o ultimo de que temos conhecimento) echamado de origem de previsao (MORETIN; TOLOI, 2004).

O valor previsto de Zt+h e expresso por: Zt(h).

Supomos que Wt = ∆dZt e de agora em diante usaremos Wt no lugar de Zt.

O valor Wt+h, escrito na forma de equacoes de diferencas e:

Wt+h = φ1Wt+h−1 + ...+ φpWt+h−p − θ1at+h−1 − ...− θqat+h−q + at+h (4.37)

A previsao Wt(h) e a esperanca condicional de Wt+h ([Wt+h]), dadas as amostras daserie nos instantes anteriores. Assim, a previsao Wt(h), ou seja, h passos a frente, expressona forma de equacoes de diferencas, e tomando a esperanca condicional, e (MORETIN;TOLOI, 2004):

Wt(h) = φ1[Wt+h−1] + ...+ φp[Wt+h−p]− θ1[at+h−1]− ...− θq[at+h−q] + [at+h] (4.38)

onde os valores das esperancas sao:

• [Wt+k] = Wt(k) , para k > 0;

• [Wt+k] = Wt+k , para k ≤ 0;

• [at+k] = 0 , para k > 0;

• [at+k] = at+k , para k ≤ 0.

Vale salientar aqui algumas observacoes acerca da Equacao de previsao 4.38 (MORE-TIN; TOLOI, 2004):

1. Os termos de medias moveis desaparecem para h > q;

4.5 Previsoes com o Modelo ARIMA e ARIMAX 49

2. Para calcular Wt(h), precisamos de Wt(h − 1), Wt(h − 2), ..., que sao calculadosrecursivamente;

3. Na pratica so um numero finito de amostras passadas e conhecido. Logo, a previsaoe E[Wt+h | Wt,Wt−1, ...,W1], que e diferente da previsao otima, que seria E[Wt+h |Wt,Wt−1, ...]. Mas a previsao com amostras finitas e uma boa aproximacao daprevisao otima, para um valor grande de t;

4. O erro da previsao a um passo e et(1) = Zt+1 − Zt(1).

A Equacao de previsao 4.38 e aplicavel ao modelo ARIMA. A previsao Wt(h) para omodelo ARIMAX e descrito na Equacao 4.39.

Wt(h) = φ1[Wt+h−1] + ...+ φp[Wt+h−p]− θ1[at+h−1]− ...− θq[at+h−q] + [at+h]

+ϕ11[X

1t+h−c1 ] + ...+ ϕ1

r1[X1

t+h−(c1+r1−1)]

+ϕ21[X

2t+h−c2 ] + ...+ ϕ2

r2[X2

t+h−(c2+r2−1)]

+...

+ϕs1[Xst+h−cs ] + ...+ ϕsrs [X

st+h−(cs+rs−1)].

(4.39)

onde X i contem os valores da entrada exogena i, ϕi e o vetor de coeficientes dos termos daentrada exogena i, ri e a ordem da entrada exogena i no modelo,ci e o atraso da entradaexogena i, s e a quantidade de entradas exogenas e os valores das esperancas sao:

• [Wt+k] = Wt(k) , para k > 0;

• [Wt+k] = Wt+k , para k ≤ 0;

• [at+k] = 0 , para k > 0;

• [at+k] = at+k , para k ≤ 0;

• [X it+k] = X i

t+k ∀k, onde o ındice i identifica as entradas exogenas.

Algumas observacoes acerca da Equacao de previsao 4.39 sao:

1. Os termos de medias moveis desaparecem para h > q;

2. Para calcular Wt(h), precisamos de Wt(h − 1), Wt(h − 2), ..., que sao calculadosrecursivamente;

3. Na pratica so um numero finito de amostras passadas e conhecido. Logo, a previsaoe E[Wt+h | Wt,Wt−1, ...,W1], que e diferente da previsao otima, que seria E[Wt+h |Wt,Wt−1, ...]. Mas a previsao com amostras finitas e uma boa aproximacao daprevisao otima, para um valor grande de t;

4. O erro da previsao a um passo e et(1) = Zt+1 − Zt(1);

5. Supoe-se que as entradas exogenas futuras, ou seja, as entradas exogenas a partirdo instante de origem de previsao, sao conhecidas.

50 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX

4.5.1 Transformacoes

Como visto no capıtulo 2, algumas series necessitam de transformacoes especiais paraestabilizar o valor da variancia, alem das diferenciacoes/diferencas. Este tipo de transfor-macao e muito comum em series economicas, onde usualmente usa-se a funcao log paratransformar a serie original.

Para series que sofrem algum tipo de transformacao, e preciso ter em mente que asprevisoes realizadas nao correspondem as previsoes para a serie original, logo e precisorealizar a transformacao inversa aquela realizada na serie original, sobre as previsoes (seesta for invertıvel). Por exemplo, e a serie original Zt sofreu a seguinte transformacao:

Yt = lnZt (4.40)

entao a inversa e:Zt = eYt (4.41)

e a previsao para Zt+h seria:

Zt(h) = eYt(h) (4.42)

4.6 Etapas da Modelagem e Metodos Escolhidos para

o Sistema

A Figura 4.4 mostra todas as etapas do processo de criacao do modelo ARIMA/ARIMAX, detalhando-se, em cada etapa deste processo, as tecnicas que foram escolhidase implementadas nesta dissertacao.

• Selecao:

Na etapa de selecao, o usuario selecionara o modelo a ser criado: modelo ARIMAou ARIMAX. O passo de selecao deve ser feito pelo usuario e nao de forma au-tomatizada porque somente este pode saber se o processo linear que deu origem aserie temporal possui entrada(s) exogena(s). Se o processo linear possuir entrada(s)exogena(s), entao o usuario deve selecionar o modelo ARIMAX. Caso nao existamentradas exogenas, o usuario deve selecionar o modelo ARIMA.

• Estimacao da ordem:

Na etapa de estimacao da ordem e realizado um teste de estacionariedade sobre aserie temporal, baseado no calculo da variancia da serie temporal, da primeira eda segunda diferencas da serie. Caso a variancia da serie temporal seja menor queas variancias da primeira e segunda diferencas da serie, entao a serie temporal eestacionaria e nao precisa sofrer nenhuma operacao de diferenca. Caso contrario, erealizada a primeira ou a segunda operacao de diferenca sobre a serie, de acordo coma que apresentar a menor variancia. Optou-se por nao realizar nenhuma transfor-macao sobre a serie, como a operacao de diferenca ou a transformacao logarıtmica(com o intuito de estabilizar a variancia da serie), porque a qualidade das previsoesrealizadas nao sofre nenhuma melhoria em funcao desta transformacao (MORETIN;

4.6 Etapas da Modelagem e Metodos Escolhidos para o Sistema 51

Figura 4.4: Fluxograma estendido: construcao de um modelo ARIMA/ARIMAX.

52 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX

TOLOI, 2004). Apos o passo de verificacao da estacionariedade da serie, e sua dife-renca, caso seja necessario, e realizada a estimacao das melhores ordens do modeloARIMA/ARIMAX. Para o modelo ARIMAX serao estimadas as ordens para a parteauto-regressiva, a parte de medias moveis do modelo e a parte de entrada(s) exo-gena(s), enquanto que se o modelo ARIMA foi selecionado, serao estimadas as ordenspara a parte auto-regressiva e a parte de medias moveis do modelo (neste caso aordem da parte exogena sera igual a zero).

Para a estimacao destas ordens e utilizado o metodo CIA, se o modelo e ARIMA,ou o CIA modificado, se o modelo e ARIMAX. O CIA modificado foi implementadonesta dissertacao para que o metodo pudesse, alem das ordens do modelo, estimartambem os atrasos da(s) parte(s) exogena(s) do modelo ARIMAX. Suponha queX represente uma entrada exogena de um modelo ARIMAX qualquer, o primeirotermo da parte exogena do modelo ARIMAX geralmente e o termo com atraso iguala zero, ou seja, Xt−0, e os termos seguintes serao Xt−1, Xt−2, etc. O atraso igual azero em um sistema real sugere que a entrada exogena de um instante t tem reflexona saıda do sistema no mesmo instante t, o seu reflexo e instantaneo. Porem, napratica, isto pode nao acontecer, uma entrada exogena de um instante de tempo ttem reflexo na saıda do sistema no instante t + 1, ou no instante t + 2, etc. Porexemplo, se uma entrada exogena em um instante de tempo t tem reflexo na saıdado sistema dois instantes depois (t + 2), entao tem-se que no modelo ARIMAX oatraso da entrada exogena sera igual a dois, o primeiro termo da parte exogena destemodelo sera o termo com atraso igual a dois (Xt−2) e os termos seguintes serao Xt−3,Xt−4, etc. Portanto, o criterio de informacao de Akaike modificado estima para omodelo ARIMAX, alem das ordens do modelo (p, q e r), os atrasos c de todas asentradas exogenas presentes no modelo.

• Estimacao dos coeficientes:

Uma vez que as melhores ordens para o modelo foram estimadas, tem-se que estimaros coeficientes de cada termo do modelo. Para realizar esta estimacao e utilizado umdos dois algoritmos: o RLS ou o ELS. O RLS e utilizado para estimar os coeficientesde modelos que nao possuem a parte de medias moveis, sendo eles os modelos: AR,ARI, ARIX e ARX. Se o modelo a ser modelado possuir a parte de medias moveis,utiliza-se o algoritmo ELS para estimar os coeficientes do modelo, uma vez que oELS e uma extensao do RLS que permite a estimacao dos valores de ruıdo existentesna serie temporal.

• Diagnostico:

Na etapa de diagnostico sao realizados dois testes: o teste de autocorrelacao resi-dual e o teste de autocorrelacao cruzada. O teste de autocorrelacao residual calculaas autocorrelacoes residuais do modelo e verifica se algum destes valores e signi-ficativamente diferente de zero. Caso algum valor de autocorrelacao residual sejasignificativamente diferente de zero, isto sugere que o modelo nao e adequado pararepresentar a serie temporal, bem como sugere que seja adicionado ao modelo umtermo de medias moveis com atraso igual a posicao na qual a autocorrelacao residualse mostrou diferente de zero. Caso todas as autocorrelacoes residuais sejam iguaisou proximas de zero, o modelo e adequado para a serie temporal ate o momento,porem o teste de autocorrelacao cruzada ainda deve ser realizado.

4.6 Etapas da Modelagem e Metodos Escolhidos para o Sistema 53

O teste de autocorrelacao cruzada calcula as correlacoes cruzadas do modelo e veri-fica se algum destes valores e significativamente diferente de zero. Caso algum valorde correlacao cruzada seja significativamente diferente de zero, isto sugere que o mo-delo nao e adequado para representar a serie temporal, bem como sugere que sejaadicionado ao modelo um termo auto-regressivo com atraso igual a posicao na quala correlacao cruzada foi diferente de zero. Caso todas as correlacoes cruzadas sejamiguais ou proximas de zero, o modelo e adequado para a serie temporal, segundo oteste de autocorrelacao cruzada.

Se os dois testes (autocorrelacao residual e autocorrelacao cruzada) detectem queo modelo e adequado, entao conclui-se que o modelo e realmente adequado pararepresentar a serie temporal e pode ser utilizado a partir de entao para a realizacao depredicoes. Caso contrario, sao adicionados termos auto-regressivos e/ou de mediasmoveis ao modelo e volta-se a primeira etapa do processo de modelagem (a selecao),onde a partir daı todos os passos sao repetidos ate que se encontre um modeloadequado a serie temporal.

54 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX

55

5 Testes e ResultadosPreliminares

Neste capıtulo serao mostradas as tecnicas que foram implementadas para esta dis-sertacao e os problemas enfrentados durante suas implementacoes. Todas as etapas dacriacao do modelo ARIMA/ARIMAX foram implementadas usando a linguagem de pro-gramacao Java. Foi utilizado como ambiente de desenvolvimento o NetBeans IntegratedDevelopment Environment (IDE) versao 6.0 e o Java Development Kit (JDK) versao1.6. Serao apresentados em seguida os resultados preliminares de geracao de modelosARIMA/RIMAX para series temporais fictıcias para proposito de validacao e por fimsera mostrada a interface grafica do ambiente computacional desenvolvido.

A primeira etapa na modelagem de uma serie, seguindo as etapas descritas no Capı-tulo 4, e verificar se a serie necessita de alguma transformacao previa do tipo logarıtmica.Se as series temporais a serem trabalhadas forem series economicas, esta transformacao enecessaria para estabilizar a sua variancia. Em seguida, e realizado um teste na serie, afim de verificar se a serie precisa ou nao precisa ser diferenciada (serie estacionaria), ana-lisando para isso a sua variancia. E em caso positivo, define-se a quantidade de diferencasnecessarias (parametro d) para torna-la estacionaria. Entretanto, nesta dissertacao optou-se por nao utilizar a serie transformada para criar o modelo, uma vez que este tipo detransformacao nao interfere na qualidade das previsoes e ainda geram previsoes viesadas,como ja foi discutido anteriormente.

O metodo utilizado na etapa de estimacao das ordens (p e q) do modelo, foi o CIA,uma vez que este se mostrou mais eficiente, no acerto das ordens do modelo, do que como uso de FAC, FACP e FACE juntas.

Na etapa de estimacao dos coeficientes do modelo, utilizou-se o Metodo de MaximaVerossimilhanca. Este metodo mostrou-se ineficiente, uma vez que o mesmo analisa todasas combinacoes possıveis dos coeficientes do modelo e quando aplicado a modelos maiscomplexos (com uma ordem grande e/ou com varias entradas exogenas), a quantidadede combinacoes testadas pelo metodo cresce exponencialmente. Por exemplo, para ummodelo ARIMA(2,0,3), o metodo de maxima verossimilhanca estimara 5 coeficientes dife-rentes (o coeficiente do termo at nao e estimado porque e sempre igual a 1, 0), construindopara isso varias combinacoes de coeficientes, variando-se o valor de cada coeficiente nointervalo [−1, 1], em passos de 0, 1, totalizando 21 valores possıveis. Para este modeloARIMA, seriam testadas 4.084.101 combinacoes diferentes de coeficientes e consequen-temente 1.801.088.541 iteracoes na execucao do metodo. Se o modelo proposto for umARIMAX(2,0,3,[2,1]), entao a quantidade de coeficientes a serem estimados sera igual a10, e o numero de iteracoes na execucao do metodo sobe para 16.679.880.978.201.

56 5 Testes e Resultados Preliminares

Um dos problemas gerados com o uso deste metodo, foi o estouro do tamanho daheap, em tempo de execucao, da Java Virtual Machine (JVM). Este problema sera melhordetalhado na secao seguinte. Diante disto, optou-se por substituir o Metodo de MaximaVerossimilhanca pelos algoritmos RLS e ELS. Estes ultimos se mostraram metodos velozes,eficientes na estimacao dos coeficientes corretos, bem como nao apresentaram problemasem tempo de execucao, enfrentados com o metodo inicial.

Para o diagnostico do modelo, foi utilizado o Teste de Autocorrelacao Residual jun-tamente com o Teste de Autocorrelacao Cruzada. Se o modelo se mostra adequado, estapronto para ser utilizado para realizar previsoes da serie (ja que previsao e o principal ob-jetivo deste trabalho). Caso contrario, utiliza-se os resultados desses testes tambem paramodificar o modelo, adicionando-se novos termos ao modelo previamente construıdo. Valerelembrar que se o modelo previamente estimado tiver termos de medias moveis (ou seja,o parametro q > 0), a interpretacao de valores grandes de | sk | nao e tao obvia (MORETIN;TOLOI, 2004), e portanto termos auto-regressivos nao serao adicionados ao modelo.

Caso o modelo tenha sido modificado, atualiza-se as ordens do modelo. Apos isto,estima-se novamente os coeficientes do modelo, e em seguida realiza-se novo diagnosticona serie, e assim sucessivamente, ate encontrar um modelo adequado.

Serao apresentados agora os resultados preliminares do sistema de geracao de modelosARIMA e ARIMAX aplicado a series temporais fictıcias que foram construıdas apenaspara a realizacao de testes de validacao de todos os metodos utilizados no processo deestimacao de um modelo ARIMA/ARIMAX. Essas series fictıcias foram criadas a partirde dados de producao de petroleo de duas estacoes de transferencia da PETROBRAS,chamadas de Canto do Amaro (CAM) e Alto do Rodrigues-A (ARA), ambas no RioGrande do Norte.

Nos resultados que serao apresentados, tem-se uma analise de varios aspectos do sis-tema de geracao de modelo ARIMA/ARIMAX, quando aplicado as series de teste. Entreestes aspectos temos: a exatidao da escolha das ordens do modelo e de seus coeficientes,a capacidade do modelo gerado pelo sistema de representar os dados da serie temporal,bem como a qualidade das previsoes sobre a serie. Todos esses aspectos serao avaliados afim de validar os metodos que foram implementados no sistema.

Inicialmente, sera analisada a geracao de um modelo ARIMA. A serie para testecriada com as caracterısticas de um modelo ARIMA tem media 3,48, nao possui entradasexogenas e possui um ruıdo aleatorio de media 0,0 e desvio padrao 0,5. Esta serie contem228 dados, ordenados por dias que vao de 01/08/2007 ate 16/03/2008. O modelo geradorda serie e um modelo ARIMAX(1,0,1,0), onde o ultimo valor refere-se a ordem da(s)entrada(s) exogena(s) que neste caso e igual a zero, uma vez que a serie temporal naopossui entradas exogenas. Neste caso tem-se que o modelo gerador ARIMAX(1,0,1,0) eequivalente ao modelo ARIMA(1,0,1), de ordens p = 1, q = 1, e d = 0. O modelo geradordesta serie temporal e:

Zt = 0, 8Zt−1 + at + 0, 5at−1 (5.1)

onde Zt e a serie temporal sem diferencas e at e o ruıdo aleatorio.

Os dados da serie temporal de teste podem ser vistos no grafico da Figura 5.1.

Apos informados ao sistema todos os dados disponıveis da serie temporal de teste,tem-se a geracao do modelo que, segundo o sistema, e o modelo que melhor representa

5 Testes e Resultados Preliminares 57

Figura 5.1: Grafico contendo os valores originais da serie de teste que simula o compor-tamento de um modelo ARIMA.

esta serie. A serie foi tratada como se fosse uma serie estacionaria para que fosse possıvelverificar se as ordens e coeficientes do modelo gerado foram estimados corretamente. Paraa estimacao das ordens p e q do modelo ARIMA e utilizado o metodo CIA, que testa variasordens variando de 1 a 5 (onde 5 e igual ao ln(228) e 228 e o numero de amostras daserie disponıveis). A Tabela 5.1 mostra o valor do CIA de todas as combinacoes de ordenstestadas. Para a estimacao dos coeficientes do modelo ARIMA e utilizado o metodo ELScom o fator de esquecimento (λ) igual a 0,98 e a matriz de covariancia (δ) inicial igual a104.

Tabela 5.1: Valores do CIA das combinacoes de ordens (p,q).(p,q) 1 2 3 4 51 2.308,81 2.311,27 2.313,33 2.315,08 2.318,352 2.310,82 2.312,99 2.319,98 2.317,79 2.320,073 2.312,87 2.314,89 2.317,21 2.319,15 2.323,964 2.314,91 2.316,92 2.318,95 2.321,29 2.323,335 2.316,93 2.318,86 2.320,91 2.322,81 2.325,31

Os ruıdos correspondentes a parte MA do modelo ARIMA nao sao conhecidos e ne-cessitam ser estimados pelo algoritmo ELS. Esses valores estimados podem ser vistos naFigura 5.2.

Comparando as estimacoes das ordens do modelo para esta serie temporal fictıcia,temos que as ordens estimadas se utilizassemos a FAC, FACP e FACE juntas seriamARIMA(1,3), enquanto que utilizando-se o CIA as ordens encontradas foram ARIMA(1,1),

58 5 Testes e Resultados Preliminares

Figura 5.2: Ruıdos correspondentes a parte MA do modelo ARIMA estimados pelo Algo-ritmo ELS.

onde as ordens (1,1) foram retiradas da Tabela 5.1 e correspondem as ordens que apre-sentaram o CIA de menor valor. O CIA apresentou resultados melhores na estimacao dasordens do modelo, por isto esta tecnica foi escolhida para ser utilizada nesta dissertacaoao inves da FAC, FACP e FACE.

Quando aplicado a serie temporal fictıcia descrita anteriormente, o sistema gerou ummodelo ARIMA(1,0,1) descrito na Equacao 5.2:

Zt = 0, 81Zt−1 + at + 0, 5at−1 (5.2)

O sistema tambem apresenta um grafico contendo duas series juntas: a serie temporalde teste e a serie temporal gerada pelo modelo ARIMA estimado pelo sistema. A partirdeste grafico e possıvel visualizar a qualidade do ajuste do modelo matematico a serietemporal de teste. Este grafico pode ser visto na Figura 5.3.

As Figuras 5.4 e 5.5 mostram a convergencia dos coeficientes dos termos Zt−1 e at−1,respectivamente, em funcao do numero de iteracoes do algoritmo ELS. A convergencia dotermo at nao e mostrada porque este termo e fixo e sempre igual a 1,0.

Analisando-se os resultados obtidos pelo sistema, percebe-se que o modelo geradocontem as mesmas ordens do modelo que gerou a nossa serie temporal de teste, o quesignifica que todas as ordens do modelo foram estimadas corretamente. Com relacaoaos coeficientes do modelo, os coeficientes estimados foram exatamente os coeficientes domodelo que gerou a serie temporal, com excecao do coeficiente do termo Zt−1, cujo valordo coeficiente e 0,8 no modelo gerador da serie, enquanto que o sistema estimou um valoraproximado de 0,81. Portanto, conclui-se que os valores dos coeficientes estimados contem

5 Testes e Resultados Preliminares 59

boa exatidao.

Figura 5.3: Grafico da Serie Real versus Serie gerada pelo modelo ARIMA.

Figura 5.4: Grafico de convergencia do termo Zt−1 do modelo ARIMA.

Analisando-se visualmente a Figura 5.3, verifica-se um bom ajuste entre as duas seriesapresentadas, de onde conclui-se que o modelo ARIMA gerado pelo sistema representa

60 5 Testes e Resultados Preliminares

Figura 5.5: Grafico de convergencia do termo at−1 do modelo ARIMA.

Figura 5.6: Autocorrelacoes Estimadas dos Resıduos do modelo ARIMA.

5 Testes e Resultados Preliminares 61

bem os dados da serie temporal de teste. Mas apenas a verificacao visual nao e suficientee nem precisa para concluirmos que o modelo e adequado a serie temporal, para issotem-se a fase de Diagnostico. Apos o modelo ter sido gerado pelo sistema, foi efetuadoo diagnostico do mesmo realizando o teste de autocorrelacao residual, que analisa asautocorrelacoes estimadas dos resıduos, que podem ser vistas na Figura 5.6. Segundo ografico da Figura 5.6, para j = 4 a autocorrelacao residual extrapolou o limite de ±2/

√n,

dando indıcios de que um termo at−4 deveria ser adicionado ao modelo para torna-loadequado, tornando-se um modelo ARIMA(1,0,4). Porem, analisando-se as varianciasresiduais dos dois modelos, verificou-se que elas sao muito proximas e portanto, segundoMoretin e Toloi (2004), deve-se escolher o modelo ARIMA(1,0,1) pois este possui ordensmenores. Desta forma, conclui-se que o modelo 5.2 e adequado para representar a serietemporal de teste.

Depois do modelo ARIMA ter sido diagnosticado como adequado, o modelo esta aptopara ser utilizado, como por exemplo em aplicacao de previsao. Foram realizadas previsoesde 7 valores para esta serie temporal de teste, utilizando-se os horizontes de previsaoh = 1, ..., 7 e a origem das previsoes em 16/03/2008. Os valores previstos, bem comoos valores reais da serie neste perıodo de tempo, podem ser vistos na Figura 5.7. O erroabsoluto medio das previsoes em relacao a serie real foi de 0,412 e o maior erro absoluto foide 1,230. Um outro ındice que pode ser usado na verificacao da qualidade da previsao e acorrelacao cruzada. O calculo da correlacao cruzada entre a serie prevista e a serie real dauma medida da relacao entre as duas. Se as duas series sao correlacionadas positivamenteelas movem-se na mesma proporcao e direcao, sendo que quanto mais forte for a relacaoentre elas, mais proximo de 1,0 sera a correlacao cruzada. O valor da correlacao cruzadacalculada entre os valores reais da serie e os valores previstos pelo modelo foi de 0,729.

Figura 5.7: Valores previstos utilizando o modelo ARIMA e valores reais da Serie TemporalFictıcia.

62 5 Testes e Resultados Preliminares

Agora sera analisada a geracao de um modelo ARIMAX. A serie para teste criada comas caracterısticas de um modelo ARIMAX tem media 235.978,20, possui duas entradasexogenas e possui um ruıdo aleatorio de media 0,0. Esta serie contem 228 dados, ordenadospor dias que vao de 01/08/2007 ate 16/03/2008. As entradas exogenas tambem possuem228 valores ordenados no mesmo intervalo de dias da serie temporal. O modelo gerador daserie e um modelo ARIMAX(1,0,1,[2,2]), onde o ultimo valor refere-se a um vetor contendoas ordens das entradas exogenas. Este modelo contem ordens p = 1, q = 1, e d = 0, alemdas ordens das entradas exogenas, r1 = 2 e r2 = 2, com seus respectivos atrasos c1 = 0c2 = 0. O modelo gerador da serie tambem pode ser representado como ARIMAX(1,0,1,[2-0,2-0]), onde ao inves de indicar as ordens das entradas exogenas [r1,r2]=[2,2], indica assuas ordens seguidas de seus atrasos [r1 − c1,r2 − c2]=[2-0,2-0]. O modelo gerador destaserie temporal e:

Zt = 0, 8Zt−1 + at − 0, 7at−1 + 1, 0X1t + 0, 6X1

t−1 + 0, 9X2t + 1, 0X2

t−1 (5.3)

onde Zt e a serie temporal sem diferencas, at e o ruıdo aleatorio e X1t e X2

t sao a entradaexogena 1 e a entrada exogena 2, respectivamente.

Os dados da serie temporal de teste podem ser vistos no grafico da Figura 5.8, e osvalores das duas entradas exogenas podem ser vistos nas Figuras 5.9 e 5.10.

Figura 5.8: Grafico contendo os valores originais da serie de teste que simula o compor-tamento de um modelo ARIMAX.

Apos informados ao sistema todos os dados disponıveis da serie temporal de teste,tem-se a geracao do modelo que, segundo o sistema, e o modelo que melhor representaesta serie. A serie foi tratada como se fosse uma serie estacionaria para que fosse possıvelverificar se as ordens e coeficientes do modelo gerado foram estimados corretamente. Paraa estimacao das ordens do modelo ARIMAX e utilizado o metodo CIA, que testa varias

5 Testes e Resultados Preliminares 63

Figura 5.9: Grafico contendo os valores da Entrada Exogena 1 do modelo ARIMAX.

Figura 5.10: Grafico contendo os valores da Entrada Exogena 2 do modelo ARIMAX.

64 5 Testes e Resultados Preliminares

ordens variando de 1 a 5 (onde 5 e igual ao ln(228) e 228 e o numero de amostras da seriedisponıveis). Para a estimacao dos coeficientes do modelo ARIMAX e utilizado o metodoELS com o fator de esquecimento (λ) igual a 0,90 e a matriz de covariancia (δ) inicialigual a 104.

Figura 5.11: Ruıdos correspondentes a parte MA do modelo ARIMAX estimados peloAlgoritmo ELS.

Os ruıdos correspondentes a parte MA do modelo ARIMAX tambem nao sao conhe-cidos e necessitam ser estimados pelo algoritmo ELS. Esses valores estimados podem servistos na Figura 5.11.

Quando aplicado a serie temporal fictıcia descrita anteriormente, o sistema apresentouos seguintes resultados:

Ordens e Atrasos do Modelo ARIMAX: ARIMAX(1,0,1,[2-0,2-0])

Modelo ARIMAX gerado:

Zt = 0, 8Zt−1 + at − 0, 58at−1 + 1, 0X1t + 0, 6X1

t−1 + 0, 9X2t + 1, 0X2

t−1 (5.4)

O sistema apresenta um grafico contendo duas series juntas: a serie temporal de testee a serie temporal gerada pelo modelo ARIMAX estimado pelo sistema, a partir do qual epossıvel visualizar a qualidade do ajuste do modelo matematico a serie temporal de teste.O ajuste da serie temporal gerada pelo modelo ARIMAX a serie temporal de teste podeser visto na Figura 5.12.

As Figuras 5.13, 5.14, 5.15, 5.16, 5.17 e 5.18 mostram a convergencia dos coeficientesdos termos Zt−1, at−1, X

1t , X1

t−1, X2t e X2

t−1, respectivamente, em funcao do numero deiteracoes do algoritmo ELS. A convergencia do termo at nao e mostrada porque este termo

5 Testes e Resultados Preliminares 65

e fixo e sempre igual a 1,0.

Figura 5.12: Grafico da Serie Real versus Serie gerada pelo modelo ARIMAX.

Figura 5.13: Grafico de convergencia do termo Zt−1 do modelo ARIMAX.

Analisando-se os resultados obtidos pelo sistema, percebe-se que o modelo geradocontem as mesmas ordens do modelo que gerou a nossa serie temporal de teste, o que

66 5 Testes e Resultados Preliminares

Figura 5.14: Grafico de convergencia do termo at−1 do modelo ARIMAX.

Figura 5.15: Grafico de convergencia do termo X1t do modelo ARIMAX.

5 Testes e Resultados Preliminares 67

Figura 5.16: Grafico de convergencia do termo X1t−1 do modelo ARIMAX.

Figura 5.17: Grafico de convergencia do termo X2t do modelo ARIMAX.

68 5 Testes e Resultados Preliminares

Figura 5.18: Grafico de convergencia do termo X2t−1 do modelo ARIMAX.

Figura 5.19: Autocorrelacoes Estimadas dos Resıduos do modelo ARIMAX.

5.1 Problemas Tecnicos Enfrentados Durante a Fase de Implementacao do Sistema 69

significa que todas as ordens do modelo foram estimadas corretamente. Com relacaoaos coeficientes do modelo, todos os coeficientes estimados foram exatamente iguais aoscoeficientes do modelo que gerou a serie temporal, exceto o termo at−1 que foi estimadocomo -0,58, enquanto que o valor real e -0,7. Essa diferenca no coeficiente do termo at−1

pode ser justificada pelo fato de que os ruıdos aleatorios nao sao conhecidos e necessitamser estimados pelo sistema, que acaba gerando valores de ruıdos aproximados aos reaismas nao exatos. Portanto, com base em todos os coeficientes estimados, conclui-se que osseus valores estimados contem boa exatidao.

Analisando-se visualmente a Figura 5.12, verifica-se um bom ajuste entre as duasseries apresentadas, de onde conclui-se que o modelo ARIMAX gerado pelo sistema re-presenta bem os dados da serie temporal de teste. Porem apenas a verificacao visual naoe suficiente e nem precisa para concluirmos que o modelo e adequado a serie temporal,para isso tem-se a fase de Diagnostico. Apos o modelo ter sido gerado pelo sistema, foiefetuado o diagnostico do mesmo realizando-se o teste de autocorrelacao residual, queanalisa as autocorrelacoes estimadas dos resıduos, que podem ser vistas na Figura 5.19.Segundo o grafico da Figura 5.19, para j = 25 a autocorrelacao residual extrapolou olimite de ±2/

√n, dando indıcios de que um termo at−25 deveria ser adicionado ao mo-

delo para torna-lo adequado, tornando-se um modelo ARIMAX(1,0,25,[2-0,2-0]). Porem,analisando-se as variancias residuais dos dois modelos, verificou-se que elas sao muito pro-ximas e portanto, segundo Moretin e Toloi (2004), o modelo ARIMAX(1,0,1,[2-0,2-0]) epreferido. Desta forma, conclui-se que o modelo 5.4 e adequado para representar a serietemporal de teste.

Depois de o modelo ARIMAX ter sido diagnosticado como adequado, o modelo estaapto para gerar previsoes sobre a serie temporal. Foram realizadas previsoes de 7 valorespara esta serie temporal de teste, utilizando-se os horizontes de previsao h = 1, ..., 7 e aorigem das previsoes em 16/03/2008. Os valores estimados, bem como os valores reais daserie neste perıodo de tempo, podem ser vistos na Figura 5.20. O erro absoluto medio dasprevisoes em relacao a serie real foi de 0,698 e o maior erro absoluto foi de 0,951. O valorda correlacao cruzada calculada entre os valores reais da serie e os valores previstos pelomodelo foi de 0,999, revelando-nos a qualidade da previsao, uma vez que o valor maximopara a correlacao cruzada e 1,0.

5.1 Problemas Tecnicos Enfrentados Durante a Fase

de Implementacao do Sistema

Durante a fase de implementacao do sistema, incluindo a implementacao dos metodosde analise de series temporais, deparou-se com alguns problemas tecnicos que por algumasvezes tornaram inviavel a utilizacao, no sistema, de determinado metodo ou algoritmoencontrados na literatura para o processamento de series temporais. Dentre os problemasenfrentados, tem-se por exemplo o estouro de pilha.

70 5 Testes e Resultados Preliminares

Figura 5.20: Valores estimados utilizando o modelo ARIMAX e valores reais da SerieTemporal Fictıcia.

5.1.1 Estouro de Pilha

Todos os metodos foram implementados na Linguagem Java, que contem a JVM.Cabe aqui uma rapida explanacao sobre a JVM. Para executar um programa escrito nalinguagem Java em um computador ou outro dispositivo, e necessario existir uma JVMinstalada no mesmo. Quando e realizada a compilacao de um codigo Java, o bytecode(que e um codigo intermediario) e gerado e a JVM e uma maquina virtual (ou imaginaria)que executa as instrucoes do bytecode operacional. A JVM e uma especie de camadaintermediaria entre o programa Java e o Sistema, e gracas a ela e possıvel executar co-digo Java em qualquer plataforma, independentemente da plataforma na qual o codigofoi gerado (ALECRIM, 2004). Cada instancia da JVM aloca um espaco de memoriachamado de heap, que e compartilhado entre todas as suas threads. Heap e usada emtempo de execucao para guardar temporariamente todos os objetos de classes e arrayscriados. O tamanho maximo padrao da heap depende da implementacao da JVM (va-riam de 16MB a 64MB), porem todas as implementacoes permitem que o valor maximoe mınimo da heap sejam modificados. Sempre que o espaco necessario para executar umaaplicacao e maior que o tamanho maximo da heap, a JVM lanca uma excecao chamada“java.lang.OutOfMemoryError: Java Heap Space”. Este erro era apresentado durantea execucao do metodo de escolha dos coeficientes do modelo, chamado de metodo demaxima verossimilhanca. Quando a excecao “java.lang.OutOfMemoryError: Java HeapSpace”ocorre, nao ha como liberar espaco para continuar a aplicacao, porque os dados con-tidos na heap podem ser ainda necessarios para a execucao do resto do metodo. Portantoa melhor solucao seria aumentar o tamanho maximo da heap para um valor satisfatoriopara a aplicacao. Porem, na nossa aplicacao, o valor satisfatorio para o tamanho da heap

5.2 Ambiente Computacional Desenvolvido 71

era superior ao tamanho maximo que o Netbeans 6.0.1 permitia configurar para a heap.Entao a solucao encontrada foi utilizar outro metodo para encontrar os coeficientes domodelo, e o metodo de Maxima Verossimilhanca foi substituıdo pelos metodos RLS e ELScom muito sucesso, por que solucionou o problema de geracao de excecoes anteriormentedescrito e apresentou resultados em tempo computacional inferior ao metodo de maximaverossimilhanca.

5.2 Ambiente Computacional Desenvolvido

Figura 5.21: Tela inicial do sistema de geracao de modelos ARIMA/ARIMAX.

Sera apresentado a seguir o sistema de geracao dos modelos ARIMA/ARIMAX. Osistema possui uma tela inicial onde o usuario do mesmo ira informar o arquivo quecontem os dados da serie temporal atraves do botao “Abrir Dados da Serie”, como podeser visto na Figura 5.21. O arquivo contendo os dados da serie temporal deve ser umarquivo .txt ou .csv. Os formatos aceitos para este arquivos sao:

• O arquivo pode conter uma coluna apenas com os valores da serie temporal, orde-nados no tempo, e sem cabecalho;

• O arquivo pode conter duas colunas separadas por tabulacao ou por espaco, a pri-meira contendo os timestamps e a segunda contendo os valores da serie temporal,ordenadas por ordem crescente do timestamp, sendo a primeira linha deste arquivodestinado ao cabecalho contendo o tıtulo de cada coluna;

• Os valores da serie temporal dentro do arquivo devem ser sempre numeros reais,com as casas decimais separadas por ponto (e nao por vırgula);

72 5 Testes e Resultados Preliminares

• O timestamp da serie temporal contem tres formatos possıveis:

– Ano: o timestamp e um numero inteiro representando um ano. Ex.: 1998;

– Mes/Ano: o timestamp e um numero inteiro representando um mes, separadopor barra (/) ou hıfen (-), seguido de um numero inteiro representando umano. Ex.:01/1998 e 01-1998;

– Dia/Mes/Ano: o timestamp e um numero inteiro representando um dia, sepa-rado por barra (/) ou hıfen (-), seguido de um numero inteiro representandoum mes, separado por barra (/) ou hıfen (-), seguido de um numero inteirorepresentando um ano. Ex.:01/11/1998 e 01-11-1998.

Apos selecionado o arquivo de dados da serie temporal, deve-se selecionar um dos ti-pos de modelo a ser criado: ARIMA ou ARIMAX, de acordo com a presenca de entradasexogenas na serie. Se a serie temporal nao possui entradas exogenas, deve-se selecionaro modelo ARIMA. Se a serie possui entradas exogenas, deve-se selecionar o modelo ARI-MAX. E extremamente importante que o usuario selecione corretamente o tipo do modelo,para a obtencao de um modelo correto para a serie temporal, uma vez que a informacaode que existe ou nao entradas exogenas nao pode ser deduzida pelo sistema.

Caso o modelo selecionado tenha sido o modelo ARIMA, o usuario pode clicar nobotao “Gerar Modelo” para que o sistema estime um modelo para a serie temporal que foianteriormente carregada.

Caso o modelo selecionado tenha sido o modelo ARIMAX, o usuario deve informar onumero de entradas exogenas, e em seguida o usuario deve selecionar um arquivo contendoos dados das entradas exogenas, sendo um arquivo separado para cada entrada exogena.Por exemplo, se a serie contem duas entradas exogenas, o usuario deve digitar 2 nonumero de entradas exogenas, em seguida deve clicar no botao “Abrir Entradas Exogenas”e selecionar o arquivo contendo os dados da primeira entrada exogena e clicar em “Abrir”(existente na janela de busca) para que o primeiro arquivo seja carregado. Em seguida, ajanela de busca sera aberta novamente, onde o usuario deve selecionar o arquivo contendoos dados da segunda entrada exogena e clicar em “Abrir” para que o segundo arquivo sejacarregado. A tela do sistema apos estes passos pode ser vista na Figura 5.22. Apos todosos arquivos carregados, o usuario pode clicar no botao “Gerar Modelo” para que o sistemaestime um modelo para a serie temporal que foi anteriormente carregada.

Apos alguns minutos, o sistema retornara na tela a direta, o modelo mais apropriado aserie temporal carregada, contendo informacoes das ordens do modelo e seus coeficientes,como pode ser visto nas Figuras 5.23 e 5.24. Alem disso sao exibidos varios graficos quedescrevem as caracterısticas da serie: o grafico da serie com seu valores reais, o graficoda serie apos sofrer uma ou duas diferencas (caso a serie seja nao-estacionaria), o graficocom a autocorrelacao residual, o grafico com a autocorrelacao cruzada, entre outros.

Apos a geracao do modelo pelo sistema, o usuario pode optar por realizar previsoes daserie temporal, para isso o usuario deve clicar no botao “Gerar Previsoes”. Os valores daprevisao serao mostrados em um novo grafico intitulado “Previsoes da Serie Temporal”.

5.2 Ambiente Computacional Desenvolvido 73

Figura 5.22: Detalhe da tela do sistema de geracao de modelos ARIMA/ARIMAX aposos arquivos carregados contendo as entradas exogenas.

74 5 Testes e Resultados Preliminares

Figura 5.23: Tela do sistema de geracao de modelos apos a geracao de um modelo ARI-MAX.

5.2 Ambiente Computacional Desenvolvido 75

Figura 5.24: Detalhe da tela do sistema de geracao de modelos apos a geracao de ummodelo ARIMAX, mostrando a exibicao dos coeficientes do modelo gerado.

76 5 Testes e Resultados Preliminares

77

6 Estudo de Caso

Para o estudo de caso os modelos ARIMAX serao utilizados para inferir valores deperda de propano em uma planta de producao de Gas Liquefeito de Petroleo (GLP). Nestaplanta sao utilizados controladores que ajustam o etano e i-pentano presentes na compo-sicao do GLP produzido por uma Unidade de Processamento de Gas Natural (UPGN)(BESERRA et al., 2008).

O gas natural proveniente de campos de producao passa por varias etapas diferentesem uma planta de processamento de tal gas. Na primeira etapa e realizada a remocao deagua e elementos oxidantes e apos isto, o gas e transportado para colunas de destilacaofracionada. Na planta em estudo, existem duas colunas de destilacao de petroleo, adeetanizadora e a debutanizadora, ambas compostas por tres partes: uma coluna, umcondensador e um refervedor (BESERRA et al., 2008). Essas colunas sao responsaveispor realizar a separacao do gas natural, ou gas in natura, em varios compostos ou sub-produtos, atraves do processo de destilacao. Como cada elemento que constitui o gaspossui temperaturas de ebulicao diferentes, atraves da adicao ou subtracao de calor epossıvel separar os seus componentes (BESERRA et al., 2008).

Na Figura 6.1 podem ser vistas as colunas de destilacao fracionada: a primeira e adeetanizadora, que e responsavel pela producao de Gas de Venda ou Gas Industrial (pro-duto de topo) e Lıquido de Gas Natural (LGN) (produto de fundo), a segunda coluna ea debutanizadora, que e responsavel pela producao do GLP (produto de topo), compostopor propanos e butanos, e de C5+, ou gasolina natural (produto de fundo). O controlede quanto e produzido de cada sub-produto e garantido pela atuacao conjunta dos con-troladores relacionados a vazao de refluxo, a temperatura de fundo e ao nıvel da coluna(BESERRA et al., 2008).

Detalhando-se um pouco mais a planta da Figura 6.1, tem-se o fornecimento da cargade entrada da coluna deetanizadora. Essa carga de entrada e constante e constituıda degas natural, que e um gas composto por hidrocarbonetos (C1+). Na coluna deetaniza-dora, uma parte do produto de fundo, composto por C3+ e uma pequena quantidadede C2, conhecido por LGN, sai desta coluna e e transportado a coluna debutanizadora.Uma outra parte do LGN passa por um processo de aquecimento em um reboiler e depoisretorna a coluna deetanizadora (BESERRA et al., 2008). Segundo Beserra et al. (2008), umcontrolador de temperatura ajusta a abertura de uma valvula que regula a vazao de oleotermico que passa por esse reboiler, enquanto que um controlador de nıvel ajusta umaoutra valvula que regula o fluxo de LGN que e fornecido para a coluna debutanizadora.Ja o produto de topo da coluna deetanizadora passa por um trocador de calor e e trans-portado a um vaso de condensado. Um controlador de pressao regula a abertura de umavalvula determinando desta forma a quantidade de gas residual que sera liberado para

78 6 Estudo de Caso

Figura 6.1: Colunas da planta de producao de GLP.

comercializacao. A partir do nıvel presente em um controlador de nıvel, um controladorde fluxo ajusta a abertura da valvula que regula o fluxo de LGN que retornara do vasode condensado a coluna deetanizadora (BESERRA et al., 2008).

Na coluna debutanizadora, uma parte do produto de fundo, a gasolina natural, ecomercializada, enquanto que outra parte passa pelo processo de aquecimento em umreboiler e retorna a mesma coluna. Um controlador e responsavel por regular a vazao deoleo termico que passa pelo reboiler. Enquanto isso, um controlador de pressao ajusta aabertura da valvula que regula a quantidade de produto de topo que e transportado de umvaso de condensado, passando por um air-cooler. Este air-cooler e responsavel por passaro gas para o estado lıquido. Um outro controlador regula a abertura da valvula de refluxoque controla o fluxo de uma parte do GLP contido no vaso de condensado que retornaraa coluna debutanizadora, enquanto que a outra parte do GLP do vaso de condensadoe extraıdo do topo da coluna debutanizadora para ser comercializado (BESERRA et al.,2008).

Dentre os produtos produzidos pela Unidade de Processamento de Gas Natural, o quepossui mais valor economico e o GLP, produzido pela coluna debutanizadora (BESERRAet al., 2008). A coluna deetanizadora produz como produto de topo alguns compostos demenor valor economico que o GLP, porem produz tambem resıduos de propano (C3), que eum composto valioso e que nao deveria existir na producao de topo de tal coluna, gerandoassim desperdıcios e perdas no sentido economico, uma vez que um composto de altovalor sera vendido por um preco inferior ao que deveria. Diante deste problema, propoe-se neste estudo de caso a utilizacao de um modelo ARIMAX para realizar inferencias sobreos valores de fracao molar do propano (C3) que sao produzidos indevidamente no topoda coluna deetanizadora da planta de producao de GLP, utilizando-se como entradasexogenas os valores de vazao de refluxo e temperatura desta coluna, enquanto que a

6 Estudo de Caso 79

serie temporal observada sera a perda de propano (C3) no topo da coluna deetanizadora.Atraves da inferencia do propano (C3) produzido no topo dessa coluna, sera possıvelinterferir nas entradas de forma a diminuir a perda deste composto ao mınimo possıvel, econsequentemente, diminuir o desperdıcio.

Vale salientar que neste estudo de caso nao dispomos da medicao real dos valoresde perda de propano na UPGN no topo da coluna debutanizadora. As colunas aquiutilizadas foram simuladas computacionalmente em um software comercial de processosquımicos, chamado HYSYS (BESERRA et al., 2008), e essas simulacoes foram utilizadas nageracao do modelo ARIMAX. Desta forma, ao inves de dizer que sao realizadas“previsoes”sobre os dados, dizemos que sao realizadas “inferencias” sobre os mesmos, pois nao tem-seconhecimento dos valores reais da perda de propano.

A seguir, sera apresentado o melhor modelo obtido pelo ambiente computacional paraa Serie Temporal de Perdas de Propano no topo da coluna deetanizadora, que sera referen-ciada a partir de agora como Serie Temporal de Perdas de Propano apenas. Inicialmenteforam coletados do sistema HYSYS um conjunto de amostras da serie de Perdas de Pro-pano, alem dos dois conjuntos de dados das entradas exogenas correspondentes, sendoa primeira entrada, X1

t , a vazao de refluxo e a segunda entrada, X2t , a temperatura. A

vazao de refluxo e dada em Kg.Mole/h e a temperatura e dada em graus Celsius. Ja aSerie Temporal de Perdas de Propano e dada em fracao molar e possuıa originalmentevalores muito pequenos da ordem de 10−3, portanto foi feito um pre-processamento sobreos dados da serie, multiplicando-os por 106, logo serie temporal e dada em 10−6∗fracaomolar.

Apos este pre-processamento, foi realizada uma separacao no conjunto de dados daserie e das entradas exogenas. Originalmente estes conjuntos continham 299 amostras,das quais 250 foram utilizadas para estimar o modelo e as outras 49 foram utilizadas paraa realizacao de inferencias.

Pelo fato do estudo de caso em questao possuir entradas exogenas, optou-se por esti-mar um modelo do tipo ARIMAX. Optou-se por nao fazer qualquer transformacao previana serie do tipo logarıtmica, nem utilizar a serie diferenciada para criar o modelo, umavez que este tipo de transformacao nao melhora a qualidade das previsoes, pelo contrario,torna necessario um processamento extra pois gera previsoes viesadas.

A Serie Temporal de Perdas de Propano utilizada para a estimacao do modelo contem250 valores que foram amostrados a cada 30 segundos (ou 0,5 minutos), sendo a serieordenada por minutos que vao de 0 a 124,5, vistos no grafico da Figura 6.2. Os valoresdas duas entradas exogenas podem ser vistos nas Figuras 6.3 e 6.4. Para esta serie foramgerados dois modelos: um contendo termos de medias moveis, ARIMAX(1,0,6,[1-5,4-0]),e outro sem termos de medias moveis, ARIX, que pode ser entendido como um modeloARIMAX com a ordem q = 0, ou seja, ARIMAX(1,0,0,[1-5,4-0]). Dentre esses dois mo-delos, o modelo ARIMAX apresentou um ajuste melhor que o modelo ARIX, uma vezque a soma dos erros absolutos do primeiro foi de 82,67 e do segundo foi de 260,09. Aqualidade das inferencias do modelo ARIX tambem foi inferior aquela apresentada peloARIMAX, pois o modelo ARIX apresentou erro absoluto medio e maior erro absoluto dasinferencias iguais a 34,41 e 52,64 respectivamente, enquanto que o ARIMAX apresentouerro absoluto medio e maior erro absoluto das inferencias iguais a 29,29 e 50,31 respectiva-mente. Atraves da comparacao dos resultados dos modelo ARIX e ARIMAX em relacao

80 6 Estudo de Caso

ao ajuste a serie e as inferencias, optou-se pela utilizacao do modelo ARIMAX. O ajustedo modelo ARIX pode ser visto na Figura 6.5 e o ajuste do modelo ARIMAX pode servisto na Figura 6.6.

Figura 6.2: Serie Temporal de Perdas de Propano (dada em 10−6∗Fracao Molar)

Figura 6.3: Entrada Exogena 1 - Vazao de Refluxo (dada em Kg.Mole/h)

6 Estudo de Caso 81

Figura 6.4: Entrada Exogena 2 - Temperatura (dada em graus Celsius)

Figura 6.5: Grafico da Serie Real versus Serie gerada pelo modelo ARIX.

82 6 Estudo de Caso

Figura 6.6: Grafico da Serie Real versus Serie gerada pelo modelo ARIMAX.

Figura 6.7: Serie Temporal de Perdas de Propano apos duas diferencas.

6 Estudo de Caso 83

Figura 6.8: Grafico da Serie Real diferenciada versus Serie gerada pelo modelo ARIMAX.

Foi gerado tambem um modelo a partir da Serie Temporal de Perdas de Propanocom diferencas. Foi realizado um teste de estacionariedade da serie e verificou-se que estae nao-estacionaria, entao foram realizadas duas diferencas ate que a mesma se tornasseestacionaria. A serie temporal estacionaria resultante das duas diferencas e mostrada naFigura 6.7 e para esta serie o modelo estimado foi o ARIMAX(1,2,1,[1-0,2-1]). O ajuste domodelo ARIMAX com parametro d = 2 pode ser visto na Figura 6.8, onde verifica-se quea qualidade do ajuste foi inferior ao apresentado pelo modelo ARIMAX sem diferencas(d = 0) na serie. Desta forma optou-se por escolher como modelo para a Serie Temporal dePerdas de Propano o modelo ARIMAX com d = 0, uma vez este apresentou melhor ajusteque o modelo com diferencas e nao apresenta o problema de gerar inferencias viesadas.

Assim, apos os testes, o sistema indicou o modelo ARIMAX(1,0,6,[1-5,4-0]) descritona Equacao 6.1:

Zt = 0, 99Zt−1 + 1, 0at + 0, 03at−1 + 0, 33at−2 + 0, 15at−3 + 0, 11at−4 + 0, 19at−5

+0, 13at−6 − 0, 13X1t−5 + 2, 35X2

t − 1, 37X2t−1 − 0, 42X2

t−2

−0, 01X2t−3

(6.1)

onde Zt e a serie temporal sem diferencas, at e o ruıdo aleatorio estimado, X1t e a en-

trada exogena 1 (vazao de refluxo) e X2t e entrada exogena 2 (temperatura), ambas nao

diferenciadas.

Para a estimacao das ordens do modelo ARIMAX, o metodo CIA testou varias ordensvariando de 1 a 6 (onde 6 e igual ao ln(250) e 250 e o numero de amostras da seriedisponıveis). Para a estimacao dos coeficientes do modelo ARIMAX foi utilizado o metodo

84 6 Estudo de Caso

Figura 6.9: Ruıdos correspondentes a parte MA do modelo ARIMAX estimados peloAlgoritmo ELS.

ELS com matriz de covariancia (δ) inicial igual a 104. Para o fator de esquecimento (λ)do algoritmo ELS foi utilizado o valor 1,0, o que significa que as amostras mais recentes emenos recentes da serie temporal serao igualmente ponderadas. Os ruıdos correspondentesa parte MA do modelo ARIMAX nao sao conhecidos e foram estimados pelo algoritmoELS. Esses valores estimados podem ser vistos na Figura 6.9.

A Figura 6.6 mostra a Serie Temporal de Perdas de Propano juntamente com a serietemporal gerada pelo modelo ARIMAX estimado pelo sistema. A partir deste grafico epossıvel visualizar a qualidade do ajuste do modelo matematico a serie temporal, mos-trando um bom ajuste entre as duas series, de onde conclui-se que o modelo ARIMAXgerado pelo sistema representa bem os dados da serie temporal. Para fazer o diagnosticodo modelo, se o modelo e adequado a serie temporal, a verificacao visual auxilia mas naoe suficiente. Para isso foi efetuado o diagnostico do mesmo realizando o teste de auto-correlacao residual, que analisa as autocorrelacoes estimadas dos resıduos, que podem servistas na Figura 6.10. Analisando-se o grafico da Figura 6.10, verifica-se que em j = 7 aautocorrelacao residual extrapolou o limite de ±2/

√n, dando indıcios de que um termo

at−7 deveria ser adicionado ao modelo para torna-lo adequado. O valor de j = 1 tambemextrapolou o limite mas nao foi adicionado porque este termo ja esta presente no modelo.O termo at−7 foi adicionado na primeira iteracao do teste de diagnostico, a cada iteracaoapenas um termo e adicionado ao modelo e entao o grafico de autocorrelacao residuale recalculado para este modelo e novamente verificado. Ao final de todas as iteracoes,ou seja, quando nao haviam mais termos a serem adicionados, chegou-se ao modelo final:ARIMAX(1,0,9,[1-5,4-0]). O modelo ARIMAX(1,0,6,[1-5,4-0]) apresentou a somatoria doserros absolutos de ajuste igual a 82,67 enquanto que o modelo ARIMAX(1,0,9,[1-5,4-0])obteve a somatoria dos erros absolutos de ajuste igual a 80,92, onde conclui-se que este

6 Estudo de Caso 85

ultimo modelo possui um melhor ajuste a serie temporal. Porem, o maior erro absolutoe o erro absoluto medio encontrados nas inferencias do modelo ARIMAX(1,0,6,[1-5,4-0])foram de 50,31 e 29,29 respectivamente, enquanto que o maior erro absoluto e o erroabsoluto medio encontrados nas inferencias do modelo ARIMAX(1,0,9,[1-5,4-0]) foram de54,25 e 29,68 respectivamente. Desta forma, conclui-se que o modelo ARIMAX(1,0,6,[1-5,4-0]) obteve uma qualidade de inferencia superior a do modelo ARIMAX(1,0,9,[1-5,4-0])porque seus erros absolutos foram menores. Alem disso, analisando-se as variancias resi-duais dos modelos ARIMAX(1,0,6,[1-5,4-0]) e ARIMAX(1,0,9,[1-5,4-0]), respectivamente1,36 e 1,32, verificou-se que elas sao muito proximas e portanto, segundo Moretin e Toloi(2004), o modelo ARIMAX(1,0,6,[5,3]) e preferido para representar a serie temporal dePerdas de Propano. O teste de autocorrelacao cruzada nao foi realizado uma vez que, se-gundo Moretin e Toloi (2004), quando o modelo previo estimado contem termos de mediasmoveis a interpretacao de valores grandes desta autocorrelacao nao e tao obvia.

Figura 6.10: Autocorrelacoes Estimadas dos Resıduos do modelo ARIMAX.

As Figuras 6.11 a 6.22 mostram a convergencia dos coeficientes de cada termo domodelo em funcao do numero de iteracoes do algoritmo ELS. A convergencia do termo atnao e mostrada porque este termo e fixo e sempre igual a 1,0.

Depois do modelo ARIMAX ter sido diagnosticado como adequado, o modelo estaapto para gerar inferencias sobre a serie temporal. Foram realizadas inferencias de 49valores para esta serie temporal, utilizando-se os horizontes h = 1, ..., 49 e a origem dasinferencias em t = 124, 5. Os erros relativos de inferencia (em percentuais) podem servistos na Figura 6.23. O erro relativo medio de inferencia (em percentual) foi de 1,71% eo maior erro relativo de inferencia (em percentual) foi de 2,92%.

Alem das inferencias descritas no paragrafo anterior, utilizou-se o modelo gerado pararealizar inferencias sobre um outro conjunto de dados da serie temporal de perdas de

86 6 Estudo de Caso

Figura 6.11: Grafico de convergencia do termo Zt−1 do modelo ARIMAX.

Figura 6.12: Grafico de convergencia do termo at−1 do modelo ARIMAX.

6 Estudo de Caso 87

Figura 6.13: Grafico de convergencia do termo at−2 do modelo ARIMAX.

Figura 6.14: Grafico de convergencia do termo at−3 do modelo ARIMAX.

88 6 Estudo de Caso

Figura 6.15: Grafico de convergencia do termo at−4 do modelo ARIMAX.

Figura 6.16: Grafico de convergencia do termo at−5 do modelo ARIMAX.

6 Estudo de Caso 89

Figura 6.17: Grafico de convergencia do termo at−6 do modelo ARIMAX.

Figura 6.18: Grafico de convergencia do termo X1t−5 do modelo ARIMAX.

90 6 Estudo de Caso

Figura 6.19: Grafico de convergencia do termo X2t do modelo ARIMAX.

Figura 6.20: Grafico de convergencia do termo X2t−1 do modelo ARIMAX.

6 Estudo de Caso 91

Figura 6.21: Grafico de convergencia do termo X2t−2 do modelo ARIMAX.

Figura 6.22: Grafico de convergencia do termo X2t−3 do modelo ARIMAX.

92 6 Estudo de Caso

Figura 6.23: Erros Relativos de Inferencia (em percentuais).

propano, conjunto este completamente diferente daquele que foi utilizado para a estimacaodo modelo. Foram geradas 299 inferencias (utilizando-se os horizontes h = 1, ..., 299 e aorigem das inferencias em t = 124, 5) e o erro relativo medio percentual de tais inferenciasfoi de 1,72%. Os erros relativos de inferencia (em percentuais) deste novo conjunto dedados podem ser vistos na Figura 6.24.

Figura 6.24: Erros Relativos Percentuais de Inferencias sobre um novo conjunto de dadosda serie temporal.

Entre as conclusoes obtidas com o estudo de caso, tem-se: a verificacao da nao-estacionariedade da serie temporal, a estimacao do tipo de modelo mais adequado a serie,sendo ele o ARMAX, a estimacao das ordens e dos coeficientes do modelo, bem como a

6 Estudo de Caso 93

identificacao dos regressores das entradas exogenas com atrasos, o diagnostico do modelo,cuja conclusao foi de que o modelo e adequado a serie e representa bem a sua dinamica,e por fim, a geracao das inferencias sobre a serie com erro relativo percentual medio de1,71%, que e considerado um erro relativo percentual baixo.

94 6 Estudo de Caso

95

7 Conclusoes

Foram realizadas nesta dissertacao todas as etapas de Identificacao de modelos ARIMA/ARIMAX, desde o teste de estacionariedade, a selecao do modelo linear a ser utilizadopara a serie, a estimacao das ordens e dos coeficientes do modelo, bem como a estimacaodos regressores das entradas exogenas com atrasos (utilizando-se o Criterio de Informa-cao de Akaike Modificado). Foram realizados ao final, testes de diagnostico do modeloestimado e inferencias dos dados da serie temporal.

Todas as etapas descritas no paragrafo anterior foram implementadas na linguagemde programacao Java, e deram origem a um sistema que recebe como entradas uma serietemporal e suas entradas exogenas, caso existam, e gera como saıda o modelo estimadopelo sistema, alem de diversos graficos relacionados a serie, como por exemplo: o graficoda serie apos a realizacao de diferencas, os graficos de convergencia dos coeficientes domodelo estimado, o grafico da funcao de autocorrelacao estimada dos resıduos e o graficodo erro relativo percentual da predicao ou inferencia.

Todos as etapas implementadas foram validadas com varias series temporais fictıciaspara modelos ARIMA e ARIMAX.

Apos todas as etapas validadas, o sistema foi aplicado ao Estudo de Caso: a SerieTemporal de Perdas de Propano (C3) no topo da coluna deetanizadora de uma Unidadede Processamento de Gas Natural. Nao ha como verificar se as ordens e os coeficientesdo modelo encontrados para a serie temporal do estudo de caso sao corretos porque naose tem conhecimento do modelo real de tal serie. Porem esta falta de conhecimento naogera prejuızos a nossa aplicacao, uma vez que o objetivo principal da estimacao do modelopara a serie do estudo de caso e a utilizacao deste modelo para gerar inferencias da serie.

As inferencias geradas pelo modelo ARIMAX estimado pelo sistema apresentaram er-ros relativos percentuais que variaram de 0,08% a 2,92%, sendo o erro relativo medio (empercentual) igual a 1,71%. Esses valores demonstram que o modelo estimado e adequadoa serie e gerou inferencias de boa qualidade, ou seja, com baixo erro relativo percentual.Desta forma, o modelo ARIMAX estimado podera ser utilizado como um sensor de soft-ware capaz de estimar os valores de Perda de Propano na coluna deetanizadora sempreque um sensor de hardware nao estiver disponıvel.

7.1 Contribuicoes

As principais contribuicoes desta dissertacao sao:

96 7 Conclusoes

• A modificacao realizada no Criterio de Informacao de Akaike, que possibilita a esti-macao das ordens e tambem dos atrasos das entradas exogenas do modelo ARIMAX;

• A realizacao de todas as etapas da metodologia de modelagem;

• O desenvolvimento de um sistema para modelagem de series temporais implemen-tado na linguagem de programacao Java;

• A aplicacao do sistema desenvolvido para solucionar o problema do estudo de caso.

7.2 Trabalhos Futuros

Como trabalho futuro, pretende-se continuar com o estudo de modelos para seriestemporais com o foco em modelos nao-lineares chamados NARMAX.

97

Referencias

AGUIRRE, L. A. Introducao a Identificacao de Sistemas - Tecnicas Lineares e Nao-lineares Aplicadas a Sistemas Reais. 3. ed. Belo Horizonte, MG: Editora UFMG, 2007.

AGUIRRE, L. A.; RODRIGUES, G. G.; JACOME, C. R. F. Identificacao de sistemasnao-lineares utilizando modelos NARMAX polinomiais - uma revisao e novos resultados.SBA Controle & Automacao, v. 9, n. 2, 1998.

ALECRIM, E. Maquina Virtual Java (Java Virtual Machine). 2004. Acessado em:28/01/2009. Disponıvel em: <http://www.infowester.com/jvm.php>.

ANSUJ, A. P.; ALMEIDA, D. T. de; SANTOS, R. O. dos. Previsao da demanda de exa-mes de direcao veicular no estado do Rio Grande do Sul. XXVIII Congresso Nacional deMatematica Aplicada e Computacional - CNMAC, 2005. Acessado em: 08/01/2008. Dis-ponıvel em: <http://www.sbmac.org.br/eventos/cnmac/cd xxviii cnmac/resumosdos/raquel santos ST14.pdf>.

BARBIERO, C. C. de M. Series Temporais: Um Estudo de Previsao para a Re-ceita Operacional da ECT - Empresa Brasileira de Correios e Telegrafos. Dissertacao(Mestrado) — Universidade Federal de Santa Catarina - Programa de Pos-Graduacaoem Engenharia de Producao - SC, 2003. Acessado em: 30/01/2009. Disponıvel em:<http://www.qualimetria.ufsc.br/dissertacoes arquivos/claudia.pdf>.

BECERRA, V. M. Advanced System Identification CY4A2 - Lecture No-tes - Lecture 3: Recursive Least Squares. University of Reading - Schoolof Systens Engineering. Acessado em: 23/03/2009. 2008. Disponıvel em:<http://www.personal.reading.ac.uk/ shs99vmb/notes/asi/Lecture3.pdf>.

BERGAMASCHI, D. P. Fundamentos de bioestatıstica - aula 8 - notas deaula. UFMT/Instituto de Saude Coletiva/USP/Faculdade de Saude Publica- Programa PQI/CAPES. Acessado em: 08/01/2008. 2003. Disponıvel em:<http://www.fsp.usp.br/ denisepb/aula8testehip.pdf>.

BESERRA, A. F. L.; JUNIOR, J. M. A.; ARAUJO, F. M. U. de; MAITELLI, A. L. Con-troladores Fuzzy aplicados na geracao dinamica de Set Points para colunas de destilacaovisando o ajuste da fracao molar de etanos e pentanos presentes no GLP. CBA, 2008.

BOLETIM SIQUEIRA CAMPOS. Aprendizado instantaneo. Boletim Si-queira Campos, 2002. Acessado em: 08/01/2008. Disponıvel em:<http://www.siqueiracampos.com/pdf/b10.pdf>.

CIENTEC. Consultoria e desenvolvimento de sistemas Ltda, amostragem casual simples-manual tecnico. Acessado em: 08/01/2008. [entre 2001 e 2008]. Disponıvel em:<http://www.matanativa.com.br/matanativa2/ajudasimples.asp>.

98 Referencias

COELHO, A. A. R.; COELHO, L. dos S. Identificacao de Sistemas Dinamicos Lineares.1. ed. Florianopolis, SC: Editora da UFSC, 2004.

EHLERS, R. Analise de series temporais - notas de aula. Departamentode Estatıstica, UFPR. Acessado em: 08/01/2008. 2005. Disponıvel em:<http://leg.ufpr.br/ ehlers/notas/stemp.pdf>.

FAVERO, L. P. L.; OLIVEIRA, M. A. de. Uma breve descricao de algumas tec-nicas para analise de series temporais: Series de Fourier, Wavelets, ARIMA,modelos estruturais para series de tempo e redes neurais. VI SEMEAD - Se-minarios em Administracao - FEA/USP, 2003. Acessado em: 08/06/2008. Dis-ponıvel em: <http://www.ead.fea.usp.br/semead/6semead/MQI/010MQI%20-Algumas%20Tecnicas%20para%20Anal%20de%20Series%20Temporais.doc>.

FERRARI, S. M. Identificacao on-line de motores de inducao atravez de modelo discretopara sinais senoidais - Capıtulo 4: Estimacao de Parametros de Mınimos Quadrados.Dissertacao (Mestrado) — Universidade do Estado de Santa Catarina - Centro de CienciasTecnologicas - Departamento de Engenharia Eletrica, 2006. Acessado em: 23/03/2009.Disponıvel em: <http://www.tede.udesc.br/tde busca/arquivo.php?codArquivo=448>.

HAYKIN, S. Redes Neurais - Princıpios e Pratica. 2. ed. [S.l.]: Editora Bookman, 2000.

HOFLER, R. A. Akaike’s Information Criterion and the Schwarz Criterion -Class Notes. University of Central Florida - College of Business Administration- Department of Economics. Acessado em: 30/01/2009. 2001. Disponıvel em:<http://www.bus.ucf.edu/hofler/eco 6416/eco 6416 classnotes Spring2001/Akaike%20Info%20Criterion.pdf>.

HOTTA, L. K.; VASCONCELLOS, K. L. Aggregation and Disaggregation of structu-ral time series models. Jornal of Times Series Analysis - Blackwell Publishers Ltd.,v. 20, n. 2, 1999. Acessado em: 11/04/2008. Disponıvel em: <http://www.blackwell-synergy.com/doi/pdf/10.1111/1467-9892.00131>.

LEITE, S. Q. Projecoes para a demanda por Energia Eletrica no Bra-sil, 2006-2015. Dissertacao (Mestrado) — Faculdade de Economia e Fi-nancas IBMEC - Programa de Pos-Graduacao e Pesquisa em Administra-cao e Economia - RJ, 2006. Acessado em: 12/06/2008. Disponıvel em:<http://www.ibmecrj.br/sub/RJ/files/dissert mestrado/ECO/ECO sidimarleitedez.pdf>.

LIMA, E. C. R.; CESPEDES, B. J. V. O desempenho do mercado (focus) e do ba-cen na previsao da inflacao: Comparacoes com modelos lineares univariados-nota tec-nica. Ipea - boletim de conjuntura, 2003. Acessado em: 08/01/2008. Disponıvel em:<http://ipea.gov.br/pub/bccj/bc 60m.pdf>.

MACHADO, M. A. S.; JUNIOR, R. G. T.; SOUZA, R. C. Previsao de se-ries temporais de falhas em manutencao industrial usando redes neurais. ENGE-VISTA, v. 7, n. 2, p. 4–18, 2005. Acessado em: 08/01/2008. Disponıvel em:<http://www.uff.br/engevista/2 7Engevista03.pdf>.

Referencias 99

MARQUES, P. A. C. Introducao a filtragem adaptativa - notas de aulada disciplina de processamento digital de sinal II. Instituto Superior deEngenharia de Lisboa. Acessado em: 08/06/2008. [2007]. Disponıvel em:<http://www.deetc.isel.ipl.pt/analisedesinai/pdsII/Blibliografia/Filtragem%20Adaptativa.pdf>.

MARTINS, R. S.; LOBO, D. S.; ARAUJO, M. da P. Formacao de precos e sazonalidadeno mercado de fretes rodoviarios para produtos do agronegocio no estado do Parana.Revista Paraense de Desenvolvimento, n. 106, p. 113–136, 2004. Acessado em: 12/06/2008.Disponıvel em: <http://www.ipardes.gov.br/pdf/revista PR/106/ricardo.pdf>.

MEDEIROS, A. V. de. Modelagem de Sistemas Dinamicos nao lineares utilizandoSistemas Fuzzy, Algoritmos Geneticos e Funcoes de Base Ortonormal. Dissertacao(Mestrado) — Universidade Estadual de Campinas - Faculdade de Engenharia Ele-trica e de Computacao - SP, 2006. Acessado em: 30/01/2009. Disponıvel em:<http://libdigi.unicamp.br/document/?code=vtls000380701>.

MOREIRA, D. S.; DIAS, P. L. da S.; LUCIO, P. S. Sistema de ava-liacao estatıstica de modelos numericos de previsao do tempo. XIVCongresso Brasileiro de Meteorologia - (CBMET), 2006. Acessado em:08/01/2008. Disponıvel em: <http://mtc-m15.sid.inpe.br/col/sid.inpe.br/mtc-m15@80/2006/11.07.11.25/doc/Moreira.Sistema.pdf>.

MOREIRA, M. Angelo. Introducao as redes neuronais artificiais - notas de aula. EscolaSuperior de Tecnologia - Departamento de Matematica. Acessado em: 14/06/2008. 1997.Disponıvel em: <http://ltodi.est.ips.pt/mmoreira/PUBLICACOES P/introducao redesneuronais 1997.pdf>.

MORETIN, P. A.; TOLOI, C. M. C. Analise de Series Temporais. 1. ed. Sao Paulo, SP:Editora Edgard Blucher, 2004.

NGUYEN, H. H.; CHAN, C. W. Applications of data analysis techniques foroil production prediction. Artigo de Engineering Applications of Artificial In-telligence, v. 18, p. 549–558, 2005. Acessado em: 08/01/2008. Disponıvelem: <http://www.sciencedirect.com/science? ob=ArticleURL& udi=B6V2M-4F9F84Y-3& user=687335& rdoc=1& fmt=& orig=search& sort=d&view=c& acct=C000037878& version=1& urlVersion=0& userid=687335&md5=db6084412f4c3f531aba2e467e8de4a6>.

PACHECO, A. G. F. Estudo da influencia de variaveis Meteorologicas no apareci-mento de casos graves de leptospirose em Salvador-BA via modelos de Series Tempo-rais. Dissertacao (Mestrado) — Ministerio da Saude - Fundacao Oswaldo Cruz - Es-cola Nacional de Saude Publica - RJ, 2001. Acessado em: 12/06/2008. Disponıvel em:<http://teses.cict.fiocruz.br/pdf/pachecoagfm.pdf>.

PALMA, J. A. Outliers em Series temporais - Uma Abordagem no Domınio dos ModelosARMA. Dissertacao (Mestrado) — FC-UL, 1998. Acessado em: 08/01/2008. Disponıvelem: <http://ltodi.est.ips.pt/dmat/documentos/papers.htm>.

PEIXOTO, M. L. B. Avaliacao da qualidade do infectometro como instrumento de identifi-cacao de surtos de Infeccao Hospitalar. Dissertacao (Mestrado) — Escola de Enfermagem

100 Referencias

da Universidade Federal de Minas Gerais, 2005. Acessado em: 08/01/2008. Disponıvelem: <http://www.enf.ufmg.br/mestrado/dissertacoes/MariaLuiza.pdf>.

POSKITT, D. S. A note on the Specification and Estimation of ARMA Sys-tems. Jornal of Time Series Analysis - Blackwell Publishing Ltd., v. 26,n. 2, 2005. Acessado em: 11/04/2008. Disponıvel em: <http://www.blackwell-synergy.com/doi/pdf/10.1111/j.1467-9892.2005.00397.x>.

SILVA, J. L. d. C. e. ProCon - Prognostico de Congestionamento de Trafego de Redesusando Wavelets. Tese (Doutorado) — Pos-graduacao em Ciencia da Computacao daUniversidade Federal de Pernambuco, 2004. Acessado em: 08/01/2008. Disponıvel em:<http://www.larces.uece.br/ jlcs/tese.pdf>.

THE APACHE SOFTWARE FOUNDATION. 8 Probability Distributions - The com-mons Math User guide. Acessado em: 08/01/2008. [entre 2003 e 2008]. Disponıvel em:<http://commons.apache.org/math/userguide/distribution.html>.

THERON, R.; FLORES, J. A.; SIERRO, F. J.; VAQUERO, M.; BAR-BERO, F. PaleoPlot:A Tool for the Analysis, Integration and Manipulation ofTime-series Paleorecords. Geoscience and Remote Sensing Symposium. IGARSS’02. 2002 IEEE International, 2002. Acessado em: 08/01/2008. Disponıvel em:<http://ieeexplore.ieee.org/iel5/7969/22041/01027238.pdf>.

VALENCA, M. J. S.; FILHO, D. V.; FERREIRA, T. A. E.; LUDER-MIR, T. B. Um modelo de previsao baseado em inteligencia artificial nagestao de bibliotecas universitarias. XII Seminario Nacional de Bibliote-cas Universitarias - SNBU, 2002. Acessado em: 08/01/2008. Disponıvel em:<http://www.sibi.ufrj.br/snbu/snbu2002/oralpdf/39.a.pdf>.

WIKIPEDIA. Recursive Least Square Filter. Acessado em: 28/01/2008. 2005. Disponıvelem: <http://en.wikipedia.org/wiki/Recursive least squares filter>.

ZIMERMANN, H. R. Diferentes Tecnicas de condicionamento em Series Temporais Tur-bulentas. Dissertacao (Mestrado) — Universidade Federal de Santa Maria - Centro deCiencia Naturais e Exatas - Programa de Pos-Graduacao em Fısica, 2005. Acessado em:08/01/2008. Disponıvel em: <http://www.ufsm.br/pgfisica/alunos/dissertacao.pdf>.

Livros Grátis( http://www.livrosgratis.com.br )

Milhares de Livros para Download: Baixar livros de AdministraçãoBaixar livros de AgronomiaBaixar livros de ArquiteturaBaixar livros de ArtesBaixar livros de AstronomiaBaixar livros de Biologia GeralBaixar livros de Ciência da ComputaçãoBaixar livros de Ciência da InformaçãoBaixar livros de Ciência PolíticaBaixar livros de Ciências da SaúdeBaixar livros de ComunicaçãoBaixar livros do Conselho Nacional de Educação - CNEBaixar livros de Defesa civilBaixar livros de DireitoBaixar livros de Direitos humanosBaixar livros de EconomiaBaixar livros de Economia DomésticaBaixar livros de EducaçãoBaixar livros de Educação - TrânsitoBaixar livros de Educação FísicaBaixar livros de Engenharia AeroespacialBaixar livros de FarmáciaBaixar livros de FilosofiaBaixar livros de FísicaBaixar livros de GeociênciasBaixar livros de GeografiaBaixar livros de HistóriaBaixar livros de Línguas

Baixar livros de LiteraturaBaixar livros de Literatura de CordelBaixar livros de Literatura InfantilBaixar livros de MatemáticaBaixar livros de MedicinaBaixar livros de Medicina VeterináriaBaixar livros de Meio AmbienteBaixar livros de MeteorologiaBaixar Monografias e TCCBaixar livros MultidisciplinarBaixar livros de MúsicaBaixar livros de PsicologiaBaixar livros de QuímicaBaixar livros de Saúde ColetivaBaixar livros de Serviço SocialBaixar livros de SociologiaBaixar livros de TeologiaBaixar livros de TrabalhoBaixar livros de Turismo