Alexandre José dos Santos Modelos Vetoriais Auto ... · Aplicações a dados reais 78 6 Conclusão...

121
Alexandre José dos Santos Modelos Vetoriais Auto-Regressivos com Transição Suave Estruturados por Árvores – STVAR-Tree Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do título de Mestre pelo Programa de Pós- Graduação em Engenharia Elétrica da PUC-Rio. Orientador: Prof. Álvaro de Lima Veiga Filho Rio de Janeiro Setembro de 2009

Transcript of Alexandre José dos Santos Modelos Vetoriais Auto ... · Aplicações a dados reais 78 6 Conclusão...

Alexandre José dos Santos

Modelos Vetoriais Auto-Regressivos com Transição

Suave Estruturados por Árvores – STVAR-Tree

Dissertação de Mestrado

Dissertação apresentada como requisito parcial para obtenção do título de Mestre pelo Programa de Pós-Graduação em Engenharia Elétrica da PUC-Rio.

Orientador: Prof. Álvaro de Lima Veiga Filho

Rio de Janeiro

Setembro de 2009

Alexandre José dos Santos

Modelos Vetoriais Auto-Regressivos com Transição

Suave Estruturados por Árvores – STVAR-Tree

Dissertação apresentada como requisito parcial para obtenção do título de Mestre pelo Programa de Pós-Graduação em Engenharia Elétrica da PUC-Rio. Aprovada pela Comissão Examinadora abaixo assinada.

Prof. Álvaro de Lima Veiga Filho Orientador

Departamento de Engenharia Elétrica PUC-Rio

Prof. Reinaldo Castro Souza Departamento de Engenharia Elétrica

PUC-Rio

Prof. Joel Maurício Corrêa da Rosa Departamento de Estatística

UFF

Prof. José Eugenio Leal Coordenador Setorial do Centro Técnico Científico

PUC-Rio

Rio de Janeiro, 11 de setembro de 2009

Todos os direitos reservados. É proibida a reprodução total ou parcial do trabalho sem autorização da universidade, do autor e do orientador.

Alexandre José dos Santos

Graduou-se em Ciências Estatísticas na Escola Nacional de Ciências Estatísticas – ENCE (Rio de Janeiro, Brasil). Durante o mestrado, trabalhou com modelos estatísticos lineares e não-lineares, tanto univariados quanto multivariados e, ainda, com modelagem de inteligência artificial, todos com aplicações no mercado brasileiro de energia elétrica.

Ficha Catalográfica

Santos, Alexandre José dos

Modelos Vetoriais Auto-Regressivos com

Transição Suave Estruturados por Árvores – STVAR-Tree /

Alexandre José dos Santos ; orientador: Álvaro de Lima

Veiga Filho. – 2009.

121 f. : il. ; 30 cm

Dissertação (Mestrado em Engenharia Elétrica)–

Pontifícia Universidade Católica do Rio de Janeiro, Rio de

Janeiro, 2009.

Inclui bibliografia

1. Engenharia elétrica – Teses. 2. Modelos não-

lineares multivariados. 3. Árvore de regressão. 4. STVAR-

Tree. 5. Teste LM. 6. Vasão de rios. 7. Preço spot. I. Veiga

Filho, Álvaro de Lima. II. Pontifícia Universidade Católica

do Rio de Janeiro. Departamento de Engenharia Elétrica.

III. Título.

CDD: 621.3

Agradecimentos

A Deus, em primeiro lugar, pelo dom da vida.

Ao professor Álvaro Veiga, pela orientação, incentivo e amizade.

À PUC-Rio, pela estrutura e auxílio, imprescindíveis para a realização deste

trabalho.

À CAPES, pelo suporte financeiro.

Aos professores do Departamento de Engenharia Elétrica, pela contribuição a

minha formação, em especial aos professores Álvaro Veiga, Cristiano Fernandes e

Reinaldo Souza.

Aos colegas do Departamento de Engenharia Elétrica, que estiveram disponíveis

para ajudar em todos os momentos.

Aos meus pais, pelo amor incondicional e por não terem medido esforços para me

propiciar a melhor formação possível.

A minha irmã e ao meu sobrinho, pelo amor, companhia, incentivo e confiança.

Aos meus amigos, que estiveram presentes ao longo destes anos, pelo apoio,

compreensão e perdão por não ter outro assunto, que não o mestrado e, no final, a

dissertação.

Resumo

Santos, Alexandre; Veiga, Álvaro. Modelos Vetoriais Auto-Regressivos com Transição Suave Estruturados por Árvores – STVAR-Tree. Rio de Janeiro, 2009. 121p. Dissertação de Mestrado - Departamento de Engenharia Elétrica, Pontifícia Universidade Católica do Rio de Janeiro.

Esta dissertação tem como objetivo principal introduzir uma formulação de

modelo não-linear multivariado, a qual combina o modelo STVAR (Smooth

Transition Vector Autoregressive) com a metodologia CART (Classification and

Regression Tree) a fim de utilizá-lo para geração de cenários e de previsões. O

modelo resultante é um Modelo Vetorial Auto-Regressivo com Transição Suave

Estruturado por Árvores, denominado STVAR-Tree e tem como base o conceito

de múltiplos regimes, definidos por árvore binária. A especificação do modelo é

feita através do teste LM. Desta forma, o crescimento da árvore é condicionado à

existência de não-linearidade nas séries, que aponta a divisão do nó e a variável de

transição correspondente. Em cada divisão, são estimados os parâmetros lineares,

por Mínimos Quadrados Multivariados, e os parâmetros não-lineares, por

Mínimos Quadrados Não-Lineares. Como forma de avaliação do modelo STVAR-

Tree, foram realizados diversos experimentos de Monte Carlo com o objetivo de

constatar a funcionalidade tanto do teste LM quanto da estimação do modelo.

Bons resultados foram obtidos para amostras médias e grandes. Além dos

experimentos, o modelo STVAR-Tree foi aplicado às séries brasileiras de Vazão

de Rios e Preço Spot de energia elétrica. No primeiro estudo, o modelo foi

comparado estatisticamente com o Periodic Autoregressive (PAR) e apresentou

um desempenho muito superior ao concorrente. No segundo caso, a comparação

foi com a modelagem Neuro-Fuzzy e ganhou em uma das quatro séries. Somando

os resultados dos experimentos e das duas aplicações conclui-se que o modelo

STVAR-Tree pode ser utilizado na solução de problemas reais, apresentando bom

desempenho.

Palavras-chave Modelos Não-Lineares Multivariados; Árvore de Regressão; STVAR-Tree;

Teste LM; Vazão de Rios; Preço Spot.

Abstract

Santos, Alexandre; Veiga, Álvaro (advisor). Tree-Structure Smooth Transition Vector Autoregressive Models – STVAR-Tree. Rio de Janeiro, 2009. 121p. MSc. Dissertation. Departamento de Engenharia Elétrica, Pontifícia Universidade Católica do Rio de Janeiro.

The main goal of the dissertation is to introduce a nonlinear multivariate

model, which combines the model STVAR (Smooth Transition Vector

Autoregressive) with the CART (Classification and Regression Tree) method and

use it for generating scenarios and forecasting. The resulting model is a Tree-

Structured Vector Autoregressive model with Smooth Transition, called STVAR-

Tree, which is based on the concept of multiple regimes, defined by binary tree.

The model specification is based on Lagrange Multiplier tests. Thus, the growth

of the tree is conditioned on the existence of nonlinearity in the time series, which

indicates the node to be split and the corresponding transition variable. In each

division, linear parameters are estimated by Multivariate Least Squares, and

nonlinear parameters by Non-Linear Least Squares. As a way of checking the

STVAR-Tree model, several Monte Carlo experiments were performed in order to

see the functionality of both the LM test and the model estimation. Best results

were obtained with medium and large samples. Besides, the STVAR-Tree model

was applied to Brazilian time series of Rivers Flow and electricity spot price. In

the first study, the model was statistically compared to the Periodic

Autoregressive (PAR) model and had a much higher performance than the

competitor. In the second case, the model comparison was with Neural-Fuzzy

Modeling and the STVAR-Tree model won in one of the four series. Adding both

the experiments and the two applications results we conclude that the STVAR-

Tree model may be applied to solve real problems, having good results.

Keywords Multivariate Non Linear Models; Regression Tree; STVAR-Tree; LM Test;

Rivers Flow; Spot Price.

Sumário

1 Introdução 12

1.1. Vazão de Rios 14

1.2. Preço Spot de energia elétrica 16

1.3. Organização da dissertação 17

2 Modelos Lineares Multivariados 18

2.1. Introdução 18

2.2. Modelo VAR 19

2.3. Modelo VEC 25

3 Modelos Não-Lineares 29

3.1. Modelos Não-Lineares Univariados 29

3.2. Modelos Não-Lineares Multivariados 35

3.3. Metodologia CART 47

4 Metodologia 52

4.1. Introdução 52

4.2. Modelo STVAR-Tree 52

4.3. Modelo PAR 62

4.4. Sistema Neuro-Fuzzy 63

4.5. ANFIS: Adaptive Neuro-Fuzzy Inference System

(Sistema Adaptativo de Inferência Neuro-Fuzzy) 63

5 Experimentos e Aplicações 66

5.1. Experimentos de Monte Carlo 66

5.2. Aplicações a dados reais 78

6 Conclusão 114

Referências Bibliográficas 116

Lista de figuras

Gráfico 2.1: Séries temporais bivariadas co-integradas 26

Gráfico 3.1: Função logística com parâmetros fixos 32

Figura 3.1: Exemplo de árvore com ausência de alguns nós 49

Figura 3.2: Exemplo de um modelo gerado por uma

árvore de regressão 50

Figura 4.1: Arquitetura ANFIS equivalente 64

Figura 4.2: Arquitetura ANFIS para o modelo Sugeno 65

Figura 5.1: Arquitetura STVAR-Tree simulada 68

Figura 5.2: Mediana de Φi, i = 1,2 do modelo STVAR-Tree

simulado, com � = 0,1% 75

Figura 5.3: Mediana de Φi, i = 1,2 do modelo STVAR-Tree

simulado, com � = 1% 76

Figura 5.4: Mediana de Φi, i = 1,2 do modelo STVAR-Tree

simulado, com � = 5% 77

Figura 5.5: Mediana de Φi, i = 1,2 do modelo STVAR-Tree

simulado, com � = 10% 77

Figura 5.6: Mediana de Φi, i = 1,2 do modelo STVAR-Tree

simulado, com � = 15% 78

Figura 5.7: Árvore estimada do modelo 7 94

Figura 5.8: FAC e FACP do logaritmo de ENA Sudeste 95

Figura 5.9: FAC e FACP do logaritmo de ENA Sul 95

Figura 5.10: FAC e FACP do logaritmo de ENA Nordeste 95

Figura 5.11: FAC e FACP do logaritmo de ENA Norte 95

Figura 5.12: Árvore estimada do modelo 12 110

Lista de tabelas

Tabela 5.1: Probabilidades em um teste de hipóteses 66

Tabela 5.2: Experimento Monte Carlo – Simulação de um

VAR 67

Tabela 5.3: Experimento Monte Carlo – Simulação de um

STVAR-Tree 69

Tabela 5.4: Experimento Monte Carlo – Estimação dos

parâmetros lineares 71

Tabela 5.5: Experimento Monte Carlo – Estimação da diagonal

principal da matriz de covariâncias dos erros, Σε 71

Tabela 5.6: Experimento Monte Carlo – Estimação dos

parâmetros não-lineares e � 73

Tabela 5.7: Experimento Monte Carlo – Estimação da diagonal

da matriz de covariâncias dos erros, �� 75

Tabela 5.8: Divisão dos dados 79

Tabela 5.9: Estatísticas Descritivas das séries de ENA 79

Tabela 5.10: Estatísticas Descritivas do logaritmo natural

das séries de ENA 80

Tabela 5.11: Matriz de Correlação do logaritmo natural

das séries de ENA 81

Tabela 5.12: Teste Estatístico ADF para o logaritmo das

séries de ENA 82

Tabela 5.13: Número de nós terminais e de parâmetros

dos modelos estimados 83

Tabela 5.14: Critérios de Informação 84

Tabela 5.15: Estatísticas descritivas dos resíduos – in-sample 85

Tabela 5.16: Estatísticas de erro dos modelos – in-sample 86

Tabela 5.17: Testes de normalidade dos resíduos – in-sample 87

Tabela 5.18: Estatísticas descritivas dos resíduos (RC) –

out-of-sample 88

Tabela 5.19: Estatísticas de erro dos modelos (RC) –

out-of-sample 89

Tabela 5.20: Testes de normalidade dos resíduos (RC) –

out-of-sample 89

Tabela 5.21: Estatísticas descritivas dos resíduos –

out-of-sample 90

Tabela 5.22: Estatísticas de erro dos modelos (MM) –

out-of-sample 90

Tabela 5.23: Testes de normalidade dos resíduos (MM) –

out-of-sample 91

Tabela 5.24: Estatísticas descritivas dos resíduos (ARC) –

out-of-sample 92

Tabela 5.25: Estatísticas de erro dos modelos (ARC) –

out-of-sample 92

Tabela 5.26: Testes de normalidade dos resíduos (ARC) –

out-of-sample 93

Tabela 5.27: Modelos PAR(p) para cada um dos sub-mercados 96

Tabela 5.28: Estimativa dos parâmetros dos modelos PAR(p) 96

Tabela 5.29: Estatísticas Descritivas das séries de resíduos 96

Tabela 5.30: Comparação dos modelos STVAR-Tree e PAR(p) 97

Tabela 5.31: Divisão dos dados 97

Tabela 5.32: Estatísticas Descritivas das séries de Preço spot 98

Tabela 5.33: Estatísticas Descritivas do logaritmo natural

das séries de Preço spot 99

Tabela 5.34: Matriz de Correlação do logaritmo natural

das séries de Preço spot 99

Tabela 5.35: Teste Estatístico ADF 100

Tabela 5.36: Teste Co-integração de Johansen 101

Tabela 5.37: Número de nós terminais e de parâmetros

dos modelos estimados 102

Tabela 5.38: Critérios de Informação 103

Tabela 5.39: Estatísticas descritivas dos resíduos – in-sample 103

Tabela 5.40: Estatísticas de erro dos modelos – in-sample 104

Tabela 5.41: Teste de normalidade dos resíduos – in-sample 104

Tabela 5.42: Estatísticas descritivas dos resíduos (RC) –

out-of-sample 105

Tabela 5.43: Estatísticas de erro dos modelos (RC) –

out-of-sample 106

Tabela 5.44: Testes de normalidade dos resíduos (RC) –

out-of-sample 106

Tabela 5.45: Estatísticas descritivas dos resíduos (MM) –

out-of-sample 107

Tabela 5.46: Estatísticas de erro dos modelos (MM) –

out-of-sample 108

Tabela 5.47: Testes de normalidade dos resíduos (MM) –

out-of-sample 108

Tabela 5.48: Estatísticas descritivas dos resíduos (ARC) –

out-of-sample 109

Tabela 5.49: Estatísticas de erro dos modelos (ARC) –

out-of-sample 109

Tabela 5.50: Testes de normalidade dos resíduos (ARC) –

out-of-sample 110

Tabela 5.51: Variáveis disponíveis de acordo com a ordem

da defasagem 111

Tabela 5.52: Modelos selecionados pela modelagem

Neuro-Fuzzy 112

Tabela 5.53: Estatísticas de erro dos modelos – in-sample e

out-of-sample 112

Tabela 5.54: Comparação dos modelos STVAR-Tree e

Neuro-Fuzzy 113

12

1 Introdução

Recentemente, muitos modelos estatísticos para análise e previsão de séries

temporais têm sido propostos na literatura. Os modelos mais famosos e que

ganharam mais destaque nas pesquisas científicas pertencem ao grupo dos

modelos estatísticos lineares. A razão dessa popularidade vem do fato destes

modelos tratarem dados homocedásticos, estacionários e Gaussianos (Box,

Jenkins e Reisel, 1994). Os modelos lineares possuem características vantajosas e

importantes, tais como, fácil interpretação, cálculos de intervalo de confiança,

resultados assintóticos, entre outras.

Muito embora essas características possuam vantagens, a natureza é

intrinsecamente não-linear e muitos fenômenos podem não ser capturados pelos

modelos lineares. Com essa motivação, nos últimos anos, muitos modelos

estatísticos não-lineares vêm sendo propostos. Alguns deles são da classe de

modelos STAR (Smooth Transition Autoregressive), com aplicações em séries

temporais econométricas.

Tong (1978) propôs o modelo TAR (Threshold Autoregressive), o qual tem

como idéia central a mudança dos parâmetros lineares do modelo auto-regressivo,

de acordo com o valor assumido por uma variável de transição (neste caso, uma

variável indicadora). Este modelo atribui um modelo linear diferente para distintas

regiões onde se encontram os valores dessa variável. Caso a variável de transição

seja uma defasagem da variável endógena, o modelo é, então, denominado

SETAR (Self-Exciting Threshold Autoregressive).

Uma generalização do modelo SETAR com dois regimes, incorporando

uma transição suave entre eles, foi proposta por Chan e Tong (1986). Este modelo

foi denominado modelo STAR (Smooth Threshold Autoregressive). Para uma

revisão consulte Teräsvirta (1994). Outras extensões dos modelos TAR têm sido

propostas na literatura, podendo citar o modelo MRSTAR (Multiple Regimes

Smooth Transition Autoregressive), proposto por Dijk e Franses (1999) e o

13

modelo TV-STAR (Time-Varying Smooth Transition Autoregressive), proposto

por Lundbergh e Teräsvirta (2000).

Muitos assuntos em diferentes áreas do conhecimento requerem diversas

relações para serem especificados. Por isso, tornaram-se necessárias técnicas para

lidar com aspectos não-lineares de sistemas. A maioria delas refere-se ao modelo

VAR não-linear, denominado STVAR (Smooth Transition Vector

Autoregressive). O modelo STVAR é a versão multivariada do modelo STAR,

assim como ocorre com os modelos lineares VAR (Vector Autoregressive) e AR

(Autoregressive). Muitas de suas aplicações foram feitas no campo da

Macroeconomia.

Os modelos STAR e STVAR podem ser vistos como modelos lineares auto-

regressivos, univariado e multivariado, respectivamente, onde os seus coeficientes

são determinados pela posição do vetor de variáveis explicativas dentro do

denominado espaço de transição.

É crescente, também, o uso de metodologias estruturadas por árvores de

decisão, tendo em vista uma metodologia alternativa aos tradicionais métodos de

classificação e modelos de regressão. O algoritmo CART (Classification and

Regression Tree) (Breiman et al., 1984) é considerado o principal marco na

utilização de metodologias estruturadas por árvores, cuja filosofia desta

formulação é utilizar modelos mais simples para sub-amostras dos dados,

dividindo de forma conveniente o problema em partes, através do particionamento

recursivo do espaço de variáveis de transição.

As árvores de classificação são úteis quando a variável dependente é

categórica, enquanto que as árvores de regressão devem ser utilizadas na solução

de problemas com variável dependente contínua.

O principal atrativo da metodologia CART é a interpretabilidade

proporcionada pela estrutura de árvore de decisão obtida no modelo final que,

também pode ser lido, como um conjunto de sentenças lógicas a respeito das

variáveis explanatórias.

O foco desta dissertação é uma nova formulação de modelo não-linear

multivariado, o qual combina o modelo não-linear STVAR com a metodologia

CART. O modelo resultante é denominado STVAR-Tree e sua versão univariada

é o modelo STAR-Tree, proposto por Rosa, Veiga e Medeiros (2008).

14

A modelagem STVAR-Tree tem como base o conceito de múltiplos

regimes, os quais são definidos por uma árvore binária. Desta forma, temos um

modelo não-linear paramétrico através de uma árvore de decisão. No STVAR-

Tree, os coeficientes do modelo são determinados através da combinação de

diferentes modelos auto-regressivos multivariados, que podem apresentar

variáveis exógenas no conjunto das variáveis explicativas.

A especificação do modelo é feita através de testes de hipóteses do tipo LM

(Lagrange Multiplier). Assim, o crescimento da árvore é condicionado à

existência de não-linearidade nas séries. Para cada divisão, são estimados os

parâmetros lineares e não-lineares do modelo. No momento em que o teste LM

rejeita a hipótese de não-linearidade (e divisão de todos os nós) na profundidade

em que a árvore se encontra, o procedimento de crescimento da árvore é

finalizado e tem-se, portanto, o modelo final estimado.

Como forma de avaliação do modelo STVAR-Tree proposto nesta

dissertação, foram feitos diversos experimentos de Monte Carlo.

Após as simulações, aplicou-se o modelo STVAR-Tree às séries brasileiras

de Vazão de Rios e às séries de Preço Spot de energia elétrica do mercado

brasileiro.

1.1. Vazão de Rios

No Brasil, o sistema gerador de energia elétrica tem como base as vazões de

rios que afluem naturalmente no país. Por serem originadas das precipitações, as

vazões fluviais possuem muitas irregularidades, tornando-as inconstantes e

difíceis de prever. Por causa dessas irregularidades, o Brasil conta com usinas

termoelétricas de complementação e com reservatórios de acumulação, com o

propósito de regularizar os regimes fluviais. Então, quando as vazões fluviais são

escassas (período de seca), a água que foi armazenada durante o período de

grandes afluências naturais (período de cheia) é utilizada.

O Planejamento da Operação do Sistema Interligado (SIN), executado

atualmente no Operador Nacional do Sistema Elétrico (ONS), permite o melhor

aproveitamento das vazões naturais, evitando o desperdício de água e gastos

excessivos com combustíveis nas usinas termoelétricas. Devido a sua

15

complexidade, este planejamento é feito por etapas com base nos modelos

desenvolvidos no Centro de Pesquisas de Energia Elétrica (CEPEL). Em cada

etapa, os modelos utilizados possuem diferentes horizontes de planejamento,

discretização do tempo, e graus de detalhamento em suas representações (Maceira

et al., 2002).

Potencialmente, o sistema brasileiro de geração de energia elétrica pode

beneficiar-se em larga escala com o contínuo aprimoramento dos modelos de

previsão hidrológica.

A geração de energia elétrica futura é influenciada pelas afluências

hidrológicas futuras, quando as previsões e incertezas envolvidas devem ser

controladas no planejamento. Isto porque a qualidade das previsões hidrológicas

feitas pelos modelos afeta substancialmente o desempenho do sistema. Com isso,

os benefícios e a confiança aumentam e os custos diminuem.

O CEPEL utiliza o modelo PREVIVAZM (Costa et al., 2003) para fornecer

previsões mensais de afluências de vazão de rios para um horizonte de até 12

meses. Este modelo é uma ferramenta para estudos especiais de verificação de

condições de atendimento da demanda energética para o horizonte anual.

Outro modelo é utilizado pelo CEPEL, o modelo PREVIVAZ, para obter as

previsões de afluências semanais, num horizonte de até seis semanas. Essas

previsões são utilizadas no primeiro mês do Programa Mensal de Operação

(PMO), um planejamento de curto prazo. Este modelo é, portanto, executado ao

final de cada mês para a elaboração do PMO do mês seguinte e, durante o mês em

curso, é executado todas as semanas para a realização das revisões do PMO.

Os modelos PREVIVAZ e o PREVIVAZM para obtenção de previsões de

vazões semanais e mensais, respectivamente, utilizam diversas alternativas de

classe de modelo, ordem dos modelos, agrupamento da estrutura de auto-

correlação e métodos de estimação dos parâmetros, acoplado a diferentes pré-

transformações das séries históricas, tipo Box-Cox ou logarítmicas (Box e Cox,

1964), ou sem transformação, e a diferentes formas de estimação de parâmetros

dos modelos. Os algoritmos de previsão destes modelos são testados por um

esquema robusto de validação cruzada e o algoritmo selecionado é aquele de

menor erro quadrático médio de previsão.

As formulações lineares de previsão de séries temporais foram classificadas

em modelos estacionários e modelos periódicos. Na classe de modelos

16

estacionários estão a média e os modelos auto-regressivos de média-móvel,

ARMA(p,q). Já na classe dos modelos periódicos estão os modelos periódicos

auto-regressivos de média-móvel, PARMA(p,q), e o caso particular PAR(p), os

quais se caracterizam por apresentar uma equação de regressão para cada período.

1.2. Preço Spot de energia elétrica

No mercado spot de energia elétrica, toda a energia excedente dos contratos

bilaterais é comprada e vendida no Mercado Atacadista de Energia Elétrica. Estes

contratos formalizam a compra e venda de energia estabelecendo preços, prazos e

montantes de suprimento em intervalos temporais determinados pelos agentes.

O preço spot, também chamado de Preço de Liquidação das Diferenças

(PLD), é definido com base nos Custos Marginais de Operação (CMO), obtidos

por meio de uma cadeia de programas computacionais. O CMO indica quanto

custa a produção de uma unidade de energia adicional à última unidade

consumida pelo mercado.

O Centro de Pesquisas de Energia Elétrica (CEPEL), criado por iniciativa

do Ministério de Minas e Energia de empresas do setor de energia elétrica, utiliza

o software NEWAVE para planejar a operação de subsistemas hidrotérmicos

interligados em longo prazo. Este programa determina, mensalmente, metas de

geração para cada usina, de maneira a atender a demanda, minimizando o valor

esperado do custo total de operação ao longo do período de planejamento. Em

resumo, o NEWAVE é responsável por gerar o CMO, valor base para a

determinação do preço spot de energia elétrica no Brasil. Outro software utilizado

neste processo é o DECOMP, responsável por gerar valores para o preço,

semanalmente.

A Câmara Comercializadora de Energia Elétrica (CCEE) é o órgão

responsável pela determinação e publicação semanal do PLD, calculado

individualmente para cada um dos quatro sub-mercados existentes no Brasil

(Sudeste/Centro, Sul, Nordeste e Norte). Ao final do mês, após o registro e

validação de todos os contratos, a CCEE utiliza o PLD para liquidar as operações

de compra e venda de energia.

17

O preço spot é único e sua definição depende das condições de oferta e

procura do mercado. Como o preço não é, de fato, de mercado e sim fornecido por

modelos computacionais, grandes variações semanais podem ocorrer nos seus

valores. Além disso, fatores externos também podem influenciar o preço spot,

como o nível de armazenamento dos reservatórios das usinas hidrelétricas, a

evolução prevista da demanda de energia e a disponibilidade atual e futura de

usinas e linhas de transmissão de energia elétrica.

Outro problema é quando os próprios modelos matemáticos (da cadeia de

modelos do CEPEL) são abandonados. Um exemplo disso ocorreu no período do

racionamento de 2001/2002 quando alguns valores do PLD semanal foram

regulados pelo governo.

Além disso, alterações nos planos de reparo e manutenção de unidades

térmicas, limites na transmissão de energia entre sub-mercados, e outros motivos,

têm feito com que a volatilidade das séries de preço aumente.

No caso do setor elétrico brasileiro, o preço da energia é função da natureza

da indústria de eletricidade, isto é, da disponibilidade de água nos reservatórios e

no nível de precipitação pluviométrico. A volatilidade está relacionada à dinâmica

das afluências. Outro problema do PLD é o fato de que não leva em conta a reação

da demanda, sendo a apenas a hidrologia - presente e a previsão futura – a

formadora do preço.

1.3. Organização da dissertação

A dissertação está organizada da seguinte forma: o Capítulo 2 apresenta

uma revisão dos modelos lineares multivariados. Já no Capítulo 3, os modelos

não-lineares são revisados, reunindo os modelos univariados e multivariados,

além da metodologia CART. No Capítulo 4 consta a teoria sobre os modelos

STVAR-tree, PAR(p) e Neuro-Fuzzy. As aplicações estão presentes no Capítulo

5. E a dissertação conclui no Capítulo 6.

18

2 Modelos Lineares Multivariados

2.1. Introdução

Neste capítulo, serão apresentados dois modelos lineares, largamente

utilizados na estimação de séries temporais multivariadas. O primeiro deles, o

modelo Vector Autoregressive (VAR), proposto por Sims (1980), foi

desenvolvido como um modelo dinâmico, no qual todas as variáveis a serem

estudadas são tratadas como endógenas. Sendo assim, o modelo VAR examina as

relações lineares existentes entre cada variável endógena e os valores passados das

mesmas variáveis (assume-se uma defasagem p), permitindo ainda a inclusão de

variáveis exógenas na análise.

Este modelo tem como restrições a escolha do conjunto relevante de

variáveis a serem analisadas, que são os valores correntes dos processos, e o

número máximo de defasagens envolvidas nas relações entre elas, normalmente

escolhido com base em critérios estatísticos, como os de Akaike (1974) ou

Schwarz (1978). Por um lado, é desejável incluir o maior número possível de

defasagens, de modo a evitar a imposição de restrições falsas sobre a dinâmica do

modelo. Por outro lado, quanto maior a ordem de defasagens, maior o número de

parâmetros a serem estimados, conseqüentemente, menos graus de liberdade para

a estimação. Um cuidado deve ser tomado ao estimar modelos multivariados.

Geralmente, eles apresentam elevado número de parâmetros, com reflexo no

tamanho de amostra requerido para que se obtenha uma estimação confiável.

Diversos testes estatísticos podem ser utilizados com a finalidade de

verificar a adequação de um modelo. Caso alguma das premissas básicas da

modelagem não for válida, diz-se que existe um erro de especificação do modelo.

Os testes são aplicados em diversos estágios da modelagem, ou seja, a cada

momento da elaboração do modelo aplica-se os testes de diagnóstico para

verificar se todas as exigências básicas são válidas para o conjunto de dados em

questão. A seguir, alguns motivos da realização dos testes:

19

1) Testes com o objetivo de definir a especificação do modelo;

2) Testes para inclusão ou não de variáveis defasadas no modelo;

3) Testes para as propriedades dos termos de perturbação não-observável

(ruído branco);

4) Testes para verificação do ajuste do modelo.

Uma condição básica para estimação do modelo VAR é que as séries

temporais sob análise sejam estacionárias. Isto indica que as médias e variâncias

devem ser constantes ao longo do tempo e o valor das covariâncias entre dois

períodos de tempo devem depender apenas da distância ou defasagem entre os

dois períodos, e não do período de tempo efetivo em que as covariâncias foram

calculadas.

Após a verificação da presença de raízes unitárias nas séries, sendo as

mesmas integradas de mesma ordem, ou seja, necessitando as séries do mesmo

número de diferenciações para se tornarem estacionárias procedem-se os testes de

co-integração. Em existindo relações de co-integração entre as séries, diz-se que

as mesmas apresentam uma relação linear estável no longo prazo.

O teste de co-integração visa determinar o número de vetores de co-

integração que serão necessários no sistema. Um dos procedimentos para

identificar a existência de co-integração é o de Johansen (1988), o qual utiliza

Máxima Verossimilhança para estimar os vetores de co-integração. A hipótese

nula é de que não há nenhum vetor de co-integração versus a hipótese alternativa

de que há pelo menos um vetor de co-integração. Caso o teste detecte a presença

de um vetor de co-integração num sistema, então, ao invés de estimar o modelo

VAR, deve-se utilizar o modelo VEC.

2.2. Modelo VAR

Algumas propriedades importantes do modelo VAR serão discutidas. As

principais utilizações deste modelo são para previsão e análise estrutural.

Considere um conjunto de séries temporais observadas no tempo. Um primeiro

modelo tem de ser especificado e os parâmetros têm de ser estimados. Em

seguida, a adequação do modelo é marcada por diversos instrumentos estatísticos

20

e o modelo pode ser estimado e utilizado para previsão e análise estrutural ou

dinâmico. As principais etapas da modelagem multivariada são:

1) Especificação e estimação do modelo;

2) Avaliação / verificação do modelo;

a. Modelo rejeitado, volta ao passo 1

b. Modelo aceito, avança ao passo 3

3) Previsão

4) Análise estrutural

2.2.1. Formulação Matemática

Sejam ��, ��, … , �� séries temporais multivariadas, com

�� = ���� , ��� , … , �����. Um modelo VAR(p) pode ser expresso matematicamente

pela seguinte formulação:

�� = � + ������ + ������ + ⋯ + !� ; t = 0, 1, 2, … (2.1)

Todos os símbolos utilizados nesta representação possuem significados

usuais, isto é,

�� = ���� , ��� , … , ����� é um vetor aleatório (K x 1) de variáveis endógenas;

� = ���, ��, … , �"�′ é um vetor fixo de interceptos (K x 1), os quais

permitem a possibilidade de média E(yt) não-nula; �$ são matrizes fixas de coeficientes, os quais são interpretados como a

sensibilidade da de uma variável do modelo com relação a uma defasagem de

outra variável; !� = �!��, !�� , … , !���� é um vetor K-dimensional de ruído branco, ou seja,

E(u) = 0, E(utut’) = Σu e E(utus’) = 0.

Cada equação do modelo possui um termo específico, o qual pode ser

interpretado como o choque correspondente à K-ésima equação. Este termo é o

termo de erro !$�.

Qualquer modelo VAR(p) pode ser representado por um modelo Kp-

dimensional VAR(1), dado por:

21

%� = & + '���� + (�, (2.2)

onde,

E as dimensões são: %� ~ (Kp x 1) , & ~ (Kp x 1), ' ~ (Kp x Kp) e (� ~ (Kp

x 1).

%� é estável se para |*| ≤ 1,

A média do modelo VAR(p) é dada por

E as auto-covariâncias são:

onde, Σ, = -�(�(���.

Usando a matriz J com dimensão (K x Kp) dada por: . = /0� : 0 : … : 02. O processo �� é obtido como �� = .%�. Pelo fato de %� ser um processo bem

definido, isto implica que �� também seja. Então, temos:

-���� = .3, constante para todo t,

Γ5�h� = JΓ5�h�J�, também invariantes no tempo.

Seja o polinômio característico do processo VAR(p), dado por:

Dizemos que o processo é estável se, para |*| ≤ 1,

.

Esta é a condição de estabilidade do processo.

22

2.2.2. Representação Média Móvel (MA) de um processo VAR

A representação de médias móveis é um útil instrumento para examinar a

interação entre as variáveis. Chamam-se os coeficientes de �$ de função de

resposta ao impulso observados a partir dos choques !� das variáveis. Estas

funções medem o impacto nas variáveis a partir de seus respectivos choques !�.

Sob a condição de estabilidade, o processo %� tem a representação de Média

Móvel (MA) definida como:

%� = 3 + ∑ �$(��$9$:; (2.3)

onde, %� é expresso em termos do passado e presente do vetor de inovações (� e

do termo média 3.

Além disso, a representação MA de �� pode ser encontrada pré-multiplicando %�

por uma matriz . = /0� : 0 : … : 02 de dimensão (K x Kp). Aqui,

3 = .< , =$ = .�$.� e !� = .(�.

(2.4)

O problema de estimar estes parâmetros incorre nas mesmas dificuldades

em obter os parâmetros do modelo primitivo a partir do modelo reduzido; a

identificação do sistema. Esta metodologia não permite estimação se o sistema é

sub-identificado, isto é, tenha um número de equações menores que os números

de incógnitas.

Para ser possível identificar o sistema escrito na forma MA, é necessário

usar a decomposição de Choleski.

23

2.2.3. Processo estacionário

Um processo estocástico é estacionário se seus momentos de primeira e

segunda ordem são invariantes no tempo. Então, temos o primeiro momento, para

todo t,

Esta condição indica que todos �� possuem o mesmo vetor finito de média

3.

E o segundo momento, para todo t e h = 0, 1,

E esta condição requer que as auto-covariâncias do processo não dependam

do tempo >, mas somente do período ℎ de tempo que separa os vetores �� e ���@.

2.2.4. Estimação

Na estimação das equações do modelo VAR, o sistema apresenta uma

estrutura fixa, com as mesmas variáveis em todas as equações e com o mesmo

número de defasagens, sendo conhecido como “VAR puro”. O estimador para a

representação padrão de um processo VAR(p) é definido por mínimos quadrados

multivariados (ou mínimos quadrados generalizados) expresso da seguinte forma:

AB = �C�C���C�% (2.5)

Este resultado é bastante conhecido na literatura e largamente utilizado.

2.2.5. Previsão

Um dos principais objetivos de análise de séries temporais multivariadas é

gerar previsão. No contexto dos modelos VAR, interessa-nos o modelo que

minimiza o Erro Quadrático Médio (EQM) de previsão, que também é largamente

utilizado como a função-perda na fase de estimação. Além disso, o EQM é um

24

estimador não-viciado da variância dos erros de previsão, útil para a construção de

intervalos e regiões de previsão.

A equação de previsão num horizonte ℎ na origem > é dada pelo valor

esperado condicional:

(2.6)

Supondo normalidade dos termos de erro do modelo, isto é, !� são normais

multivariados com !� e !D independentes para t≠ F. Sob estas condições, os erros

de previsão também são normalmente distribuídos como transformações lineares

de vetores normais:

(2.7)

Este resultado implica que os erros de previsão das componentes individuais

são também normais, dados por:

onde, �",��ℎ� é a k-ésima componente de ���ℎ� e G"�ℎ� é a raiz quadrada do k-

ésimo elemento da diagonal principal da matriz ΣH�ℎ�.

Denotando por *�I�o ponto crítico da distribuição normal, temos:

(2.8)

Então, o intervalo de previsão com �1 − ��%, ℎ períodos a frente, para a k-

ésima componente de �� é:

25

ou

Este resultado pode ser estendido para regiões de previsão, para duas ou

mais componentes. Defina a matriz K = /0L : 02 com dimensão (N x K) e note

que temos um resultado conhecido de vetores normais multivariados, dado por:

(2.9)

Assim, a distribuição M��N� pode ser usada para determinar o elipsóide de

previsão com �1 − ��% para as primeiras N componentes do processo. Para tal,

utiliza-se o método de Bonferroni, considerando que, para um intervalo de

previsão com O1 − ILP %, a região de previsão resultante tem probabilidade no

mínimo �1 − ��% de conter todas as N variáveis conjuntamente.

2.3. Modelo VEC

Relações de equilíbrio são suspeitas entre muitas variáveis, especialmente

econômicas. Suponha que as variáveis de interesse foram coletadas no vetor �� = ���� , ��� , … , ���� e a sua relação de equilíbrio de longo prazo seja A��� =A���� + ⋯ + A���� = 0, onde A = �A�, … , A���. Em algum momento particular,

essa relação pode não ser satisfeita exatamente, mas talvez tenhamos A��� = *Q, onde *Q é uma variável estocástica que representa os desvios do equilíbrio. Se

realmente há um equilíbrio, parece plausível assumir que as variáveis �Q avançam

juntas e que *Q é estável. Assim, *Q pode ser conduzido por uma tendência

estocástica comum. Em outras palavras, não está excluído que cada variável é

integrada, isto é, ainda existe uma combinação linear das variáveis. Variáveis

integradas com essas propriedades são chamadas co-integradas.

No Gráfico 2.1, duas séries temporais co-integradas geradas artificialmente

são representadas.

26

Gráfico 2.1: Séries temporais bivariadas co-integradas

Geralmente, as variáveis em um processo �� K-dimensional são chamadas

co-integradas de ordem (d, b), brevemente, yQ~CI�d, b�, se todos os componentes

do �� são 0�X� e existe uma combinação linear *� = β���, com

A = �A�, … , A��� ≠ 0 tal que *� é 0�X − Z�. Por exemplo, se todos os

componentes de *� 0�1� e β��� é estacionário (I�0�), então yQ~CI�1,1�. O vetor A

é chamado de vetor de co-integração.

Um processo que consiste em variáveis co-integradas é chamado um

processo co-integrado. Estes processos foram introduzidos por Granger (1981) e

Engle & Granger (1987). Desde então, tornaram-se populares em trabalhos

econométricos teóricos e aplicados.

Lüktepohl (2005) chama um processo K-dimensional �� integrado de

ordem d, brevemente, yQ~I�d�, se ∆\�� é estável e ∆\���� não é estável. O

processo 0�X� é chamado co-integrado se existe uma combinação linear β��� com

A ≠ 0, o qual é integrado de ordem menor que d. Se existir apenas um

componente 0�X� no vetor �� e todos os outros componentes forem estáveis 0�0�,

então o vetor �� será 0�X� (Lüktepohl, 2005).

Estritamente falando, as variáveis endógenas de um modelo VAR devem

ser todas estacionárias, ou seja, integradas de ordem zero, I(0), portanto nesse

contexto os autovalores da matriz A localizam-se todos no interior do círculo

unitário. Se não forem, o modelo VEC deve ser estimado ao invés do VAR.

27

2.3.1. Formulação Matemática

Um processo K-dimensional VAR(p), expresso matematicamente por:

(2.10)

é chamado co-integrado de rank r se

tem rank r e assim Π pode ser escrito como uma matriz-produto �A� com � e A

sendo de dimensão (K x r) e de rank r. A matriz A é chamada matriz de co-

integração e � é chamada loading matrix.

Se ^ = 0, Δ�� tem uma representação VAR(p-1) e, para ^ = `,

e assim, o VAR não tem raiz unitária e �� é um processo VAR(p) estável.

Deste modo, �� tem uma representação VEC dada matematicamente por:

(2.11)

onde,

Se esta representação de correção de erros for dada, é fácil descobrir o VAR

correspondente, notando que:

(2.12)

28

2.3.2. Estimação

A estimação dos parâmetros de um modelo VEC é feita em dois estágios.

No primeiro, estima-se a matriz de co-integração A, por mínimos quadrados ou

máxima verossimilhança e, em seguida, substitui-se o verdadeiro valor de A pelo

seu estimador AB na equação, ou seja, considerando:

(2.13)

E, assim, todos os outros parâmetros são estimados na segunda etapa, tendo os

estimadores de dois estágios de � e Γ denotados por:

(2.14)

(2.15)

29

3 Modelos Não-Lineares

3.1. Modelos Não-Lineares Univariados

3.1.1. Modelo TAR

O modelo Auto-regressivo com limiar (TAR – Threshold Autoregressive)

foi proposto inicialmente por Tong (1978). Um pouco mais trabalhado, foi mais

bem desenvolvido por Tong e Lim (1980) e Tong (1983). Conforme os avanços

das pesquisas, este modelo se popularizou com inúmeras aplicações em séries

temporais não-lineares. As análises tornaram-se interessantes pelo fato deste

modelo atribuir um modelo linear diferente para distintas regiões onde se

encontram os valores de uma variável determinada variável de transição. Definiu-

se que se a variável de transição for uma defasagem da variável endógena, o

modelo é, então, denominado modelo auto-regressivo com limiar auto-excitante

SETAR (Self-Exciting Threshold Autoregressive).

3.1.1.1. Formulação Matemática

Defina �� como uma série temporal. Esta série segue um processo TAR

caso,

(3.1)

onde,

os termos �;, ��, … , �a e b;$ , b�$, … , ba$ c = 1, … , ℎ, são os coeficientes reais do

modelo;

��~N0d�0, G��;

0$�. � é uma função indicadora, definida por

30

0$�f�� = g 1, Fh f� ≥ $̂0, �jFk �kl>^á^ckn O modelo pode ser reescrito na forma vetorial,

(3.2)

onde,

os coeficientes do modelo são os vetores � = o�;, ��, … , �ap e

b$ = ob;$, b�$ , … , ba$p e, ainda, *� = o1, ����, ����, … , ���ap. Esta representação do modelo permite verificar que, dependendo do valor

assumido pela variável f�, o modelo ativa um dos h+1 modelos lineares auto-

regressivos de ordem p, AR(p). Conforme dito, caso f� = ���\ o modelo TAR é

denominado SETAR, e tem a seguinte representação matricial:

(3.3)

onde, o escalar d é conhecido como tamanho do limiar ou parâmetro de

defasamento.

3.1.2. Modelo STAR

Uma generalização do modelo SETAR com dois regimes, incorporando

uma transição suave entre eles, foi proposta por Chan e Tong (1986). Este modelo

foi denominado modelo STAR (Smooth Threshold Autoregressive). Para uma

revisão, consulte Teräsvirta (1994).

3.1.2.1. Formulação matemática

Considere �� uma série temporal univariada. A expressão matemática

representada pelo modelo com dois regimes é dada por:

�� = =�� x�rs�F�; , ��u + =�� x�r1 − s�F�; , ��u + �� (3.4)

onde,

31

o vetor ϕ$ = r=$,;, =$,�, … , =$,au� ; c = 1,2 são os coeficientes dos modelos

lineares ligados aos regimes

o vetor x� = �1, ����, ����, … , ���a�′, é formado por 1 na posição inicial

indicando o intercepto do modelo e nas demais posições as defasagens da variável

endógena

a função s�. � é uma função limitada no intervalo [0,1], aqui determinada como a

função logística, dada por:

s�F�; , �� = 11 + h�w�Dx�y� (3.5)

O vetor de parâmetros z = � , �� dessa função contém os parâmetros de

suavidade e locação, respectivamente, com a restrição > 0. O primeiro é o

responsável pelo grau de suavidade da função de transição, e o segundo representa

o limiar entre os dois regimes. Para o mesmo valor de , a distância entre o valor

de F� e c determina o grau de pertinência dos regimes do modelo. Na situação em

que F� = �, a observação pertence a ambos os regimes com igual grau de

pertinência.

Obtemos o modelo TAR se definirmos a função de transição s�. � como

uma função indicadora do tipo:

s�. � = g1, F� ≤ �0, F� > �n

Neste caso, o limiar entre os dois regimes é abrupto e determinado por c, o

parâmetro de limiar ou locação.

Uma das grandes vantagens na utilização dos modelos de transição suave é a

possibilidade de especificar a função de transição de forma a evitar este problema

da busca por um limiar “rígido” entre os regimes. A escolha mais comum para a

função de transição é a função logística. O modelo com esta função de transição é

denominado modelo LSTAR (Logistic Smooth Transition AutoRegressive).

A fim de experimentar a função logística, fixou-se alguns parâmetros e

avaliou-se o seu comportamento através do Gráfico 3.1. O parâmetro de suavidade

32

assumiu os valores do conjunto {1, 2.5, 5, 50}, para representar diferentes níveis

de suavidade da função logística, e o parâmetro de locação c assumiu o valor zero.

Gráfico 3.1: Função logística com parâmetros fixos

Quando tende para zero, a função logística torna-se uma constante igual a

0,5 e o modelo LSTAR se reduz a uma média de dois modelos lineares AR(p).

Este comportamento permite concluir que não existe distinção entre os regimes.

Conforme aumentamos o valor do parâmetro de suavidade , ou seja, com

tendendo para infinito, a função logística aproxima-se de uma função do tipo

degrau e a transição de um regime para o outro se torna uma transição abrupta.

Neste caso, a função logística torna-se uma função indicadora e o modelo é

denominado TAR. E ainda, caso a variável de transição seja uma defasagem da

variável endógena, F� = ���\, o modelo é então denominado SETAR (Self-

Exciting Threshold Autoregression).

Para valores no intervalo (0,1) assumidos pela função logística s�. �, o

modelo LSTAR com dois regimes é definido como uma média ponderada de dois

modelos AR(p), onde os pesos das observações são determinados por esses

valores da função de transição, s�F�; , �� e �1 − s�F�; , ���.

O modelo STAR citado anteriormente possui 2 regimes. Porém, este pode

ser estendido para um número maior de regimes. Neste caso, denomina-se como

33

MRSTAR (Multiple Regime Smooth Transition AutoRegression). Por exemplo, a

representação de um modelo MRSTAR de 4 regimes pode ser escrita da seguinte

forma:

�� = o=�� |�s��F��; �, ��� + =�� |�r1 − s��F��; �, ���up ∗ s��F��; �, ���+ o=~� |�s��F��; �, ��� + =�� |�r1 − s��F��; �, ���up∗ r1 − s��F��; �, ���u + �� (3.6)

Considerando conhecidas as variáveis de transição F�� e F��, nota-se que os

regimes na equação são ponderados por uma composição de funções logísticas

(s��. � e s��. �). Essa composição soma a unidade, por isso podem ser vista como

funções de pertinência. O conceito de pertinência é largamente utilizado na teoria

da Lógica Fuzzy (Zadeh, 1965). Maiores detalhes referentes aos modelos

MRSTAR podem ser obtidos em van Dijk e Franses (1999).

3.1.2.2. Especificação do modelo

Esta seção apresenta uma estratégia de especificação do modelo STAR.

Estratégia esta, definida como “específica-para-geral”. Este procedimento inicia

com um modelo simples e, de acordo com os resultados dos testes estatísticos

aplicados, o modelo tem sua complexidade aumentada.

A primeira preocupação refere-se à seleção das variáveis que irá compor o

modelo, tanto as variáveis que formarão o vetor *� quanto aquelas denominadas

variáveis de transição, que formam o vetor |�.

A modelagem STAR parte de um modelo simples e aumenta sua

complexidade de acordo com os resultados dos testes aplicados. van Dijk,

Terasvirta e Franses (2002) em seu trabalho, propuseram um processo de

construção destes modelos, o qual segue um ciclo de modelagem. Os passos são:

1) Especificação de um modelo AR(p)

Diversos modelos lineares são estimados, começando com um modelo

AR(1) e aumentando a ordem p do modelo, com � = 1,2, … , ����.

Aquele modelo que minimizar os critérios de informação AIC (Akaike,

1974) ou BIC (Schwarz, 1978) deve ser selecionado. Todas as

34

propriedades dos modelos lineares AR(p) devem ser verificadas,

incluindo a que se refere aos resíduos do modelo, definindo-os como

aproximadamente um ruído branco.

2) Teste da hipótese de linearidade contra uma alternativa da família

STAR

Na construção do modelo STAR, o teste de linearidade tem duas

funções. A primeira verifica a adequação do modelo linear para

descrever os dados. A hipótese nula do teste é a de linearidade. No

caso em que esta não for rejeitada, não é necessário estimar um modelo

não-linear para os dados. A segunda determina as variáveis que

formam o vetor de transição |�. Tsay (1989) propôs a aplicação do

teste de linearidade para cada uma das defasagens da variável

endógena (���\) e selecionar como variável de transição aquela que

apresentar o menor p-valor do teste.

3) Estimação dos parâmetros do modelo STAR selecionado

Para estimar os parâmetros do modelo, utiliza-se o método de Mínimos

Quadrados Ordinários (MQO) para os parâmetros lineares e o método

de Mínimos Quadrados Não-Lineares (MQNL) para os parâmetros

não-lineares do modelo STAR. Este último, sob a normalidade dos

erros, é equivalente ao método de Máxima Verossimilhança (MV).

4) Análise de diagnóstico do modelo

O modelo STAR selecionado e estimado deve apresentar resíduos com

boas propriedades. Basicamente, verifica-se a correlação dos resíduos

de forma que eles se comportem como ruído branco.

5) Re-especificação do modelo de acordo com os resultados do

diagnóstico

No caso de selecionar um modelo STAR que não produza resíduos

com boas propriedades, deve-se voltar a etapa 1 e re-especificar um

modelo AR(p) e, assim, seguir todas as etapas.

35

6) Utilização do modelo com fins descritivos ou de previsão

Com todas as etapas acima verificadas, determina-se este modelo como

o modelo final e este deve ser utilizado de acordo com os seus fins.

3.2. Modelos Não-Lineares Multivariados

3.2.1. Modelo TVAR

Tsay (1998) estendeu a abordagem dos modelos TAR (Threshold

Autoregressive) para modelos multivariados, definindo-os como modelos TVAR

(Threshold Vector Autoregressive). Este modelo teve como motivação uma

aplicação no mercado financeiro, onde um ativo foi negociado em dois mercados,

simultaneamente.

3.2.1.1. Formulação matemática

Considere que os modelos lineares locais dependam de algumas variáveis

exógenas. Seja �� = ���� , … , �"��′ uma série temporal k-dimensional e |� =�|��, … , |���′ uma série temporal v-dimensional de variáveis exógenas. Seja

−∞ = ;̂ < �̂ < ⋯ < D̂�� < D̂ = ∞, então �� segue um modelo multivariado de

limiar com variável de limiar *� e um lag d dado pela seguinte expressão:

(3.7)

onde,

� = 1, … , F; �� são vetores de constantes; p e q são inteiros não negativos.

A inovação satisfaz

onde,

o primeiro termo é uma matriz positiva definida simétrica;

36

o segundo é uma seqüência de vetores descorrelatados aleatórios com média zero

e matriz de covariância I, a matriz identidade.

O modelo apresentado tem s regimes e é um modelo linear com relação ao

espaço de limiar *��\, mas é não linear no tempo se s >1. Assume-se que a

variável de limiar *� é conhecida, estacionária e apresenta uma distribuição

contínua e o lag d, o número de regimes s, e os limiares $̂ são desconhecidos.

3.2.1.2. Teste de Linearidade

Primeiramente, Tsay (1998) propôs um teste estatístico para detectar a

necessidade de estimar o modelo TVAR ao invés de um modelo linear, isto é,

testou s =1 contra s > 1. O teste é simples e apresenta um bom desempenho em

amostras finitas. Este teste é uma generalização do proposto em Tsay (1989) para

o caso univariado, e apresenta uma distribuição assintótica Qui-Quadrado. A

generalização também leva em conta a presença de variáveis exógenas e

heterocedasticidade condicional.

Em seguida, o autor considerou o teste LM com a hipótese nula que �� é

linear contra a hipótese alternativa que �� segue um modelo TVAR definido

anteriormente. O teste LM usa a variável de limiar para construir uma regressão

arranjada. Este regressão baseada no crescimento da ordem da variável de limiar

*��\ é:

(3.8)

onde >�c� é o índice temporal de *�$�. É importante notar que a dinâmica da série �� não mudou. O que mudou

foi a ordem que cada dado entra na regressão, isto é, a ordem das linhas, se

víssemos a regressão em um contexto matricial. A idéia do teste é simples: se �� é

linear, então o estimador de mínimos quadrados recursivo da regressão arranjada é

consistente, logo os resíduos previstos são aproximadamente um ruído branco.

Conseqüentemente, os resíduos previstos são descorrelatados do regressor

���$��\. Por outro lado, se �� seguir um modelo de limiar, os resíduos previstos

37

não serão ruído branco, pois o estimador de mínimos quadrados será viesado.

Neste caso, os resíduos previstos serão correlatados com o regressor ���$��\.

Após a aplicação do teste o autor descreve um procedimento de construção

do modelo incluindo a estimação de s e dos limiares. O método de estimação

aplicado é o de mínimos quadrados condicional e a seleção do modelo é realizada

com base no critério de informação de Akaike.

3.2.1.3. Estimação

Considerando estimação por mínimos quadrados condicional e assumindo

que p, q e s são conhecidos, e que a variável de limiar *� é dada, escrevemos o

modelo para o caso de s = 2 da seguinte forma:

Os parâmetros do modelo são

e a sua estimação pode ser obtida em dois passos. Primeiro, para um dado d e �̂, o

modelo acima nada mais é do que duas regressões lineares multivariadas

separadas, cujas estimativas de mínimos quadrados dos seus parâmetros são um

resultado conhecido:

Define-se a soma do quadrado dos resíduos como

onde �$� �̂, X� é o traço de

No passo 2, as estimativas de mínimos quadrados condicional de d e �̂ são

obtidas fazendo

38

Os estimadores de mínimos quadrados condicionais são estimadores

consistentes dos coeficientes, do lag e dos limiares e da matriz de covariâncias.

3.2.1.4. Identificação do modelo

O problema de identificação e especificação de um modelo de limiar

multivariado envolve a seleção de muitos parâmetros. Os problemas mais difíceis

são: a identificação da variável de limiar e a especificação do número de regimes.

A identificação de s pode levar em consideração experiências passadas e

informações a priori sobre o conjunto de dados, ou a complexidade computacional

pode restringir s a um número pequeno.

Assumindo que *� e s são dados, o autor usa o critério AIC para selecionar

um modelo. Dados p, q, d e s, o critério AIC do modelo de limiar multivariado é

dado por:

(3.9)

onde ����, f, X, F� é a função de verossimilhança do regime j avaliado na

estimativa de máxima verossimilhança de �� , �$���, �$���.

3.2.2. Modelo STVAR

O modelo STVAR (Smooth Transition Vector Autoregressive) é a versão

multivariada do modelo STAR descrito na seção 3.1.2. Este modelo é

severamente utilizado para modelar vetores de séries temporais, citando aqui o

campo da Macroeconomia.

3.2.2.1. Formulação matemática

Considere %� = ����, ��� , … , ����� como um vetor (K x 1) de séries

temporais. Uma analogia K-dimensional da expressão matemática representada

pelo modelo STAR com dois regimes é dada por:

39

%� = Φ�� X�rs�F�; , ��u + Φ�� X�r1 − s�F�; , ��u + �� (3.10)

onde,

os vetores Φ$,; , i =1,2 são vetores (K x 1) dos coeficientes interceptos ligados aos

regimes;

a matriz Φ$ = rΦ$,�, … , Φ$,au� i =1,2 tem dimensão (K x K) e é formada pelos

coeficientes dos modelos lineares ligados aos regimes;

o vetor ε� = �ε��, … , ε���� é o vetor k-dimensional de ruído branco com média

zero e matriz de variância-covariância positiva definida Σ�;

a matriz X� = �1, … ,1, %���, %���, … , %��a�′, é formada por 1 na posição inicial

indicando o intercepto do modelo e nas demais posições as defasagens das

variáveis endógenas;

a função s�. � é a função logística.

Observe que no modelo STVAR os regimes são comuns às K variáveis, no

sentido de que uma mesma função de transição determina o regime e a troca de

regimes de todas as K equações do modelo.

3.2.2.2. Teste de Linearidade

Para realizar os testes de linearidade enfrentamos o mesmo problema do

caso univariado. Isto é, o STVAR contém parâmetros que não são identificáveis

sob a hipótese nula. Para solucionar o problema de identificação os autores usam

uma aproximação de Taylor adequada para a função de transição. Por exemplo no

caso da função logística utiliza-se a aproximação de Taylor de terceira ordem em

torno de = 0, resultando em um modelo re-parametrizado:

(3.11)

Desta forma, a hipótese nula original é equivalente à de que �$ = 0, c =1,2,3. A estatística do teste de multiplicador de Lagrange (LM) resultante tem

uma distribuição assintótica qui-quadrada com 3�`� graus de liberdade sob a

hipótese nula.

40

3.2.2.3. Estimação

Quando a linearidade é rejeitada e a variável e a função de transição foram

selecionadas, os parâmetros do modelo STVAR podem ser estimados através de

mínimos quadrados não lineares (MQNL). Sob algumas condições de

regularidade, os estimadores são consistentes e com distribuição assintoticamente

Normal.

3.2.2.4. Adequação

Como proposto em Eitrheim e Teräsvirta (1996), três testes são realizados

com o objetivo de checar se o modelo estimado é adequado. Testa-se se os

resíduos apresentam auto-correlação, se os dados ainda apresentam alguma não

linearidade e se os parâmetros são constantes. Camacho (2004) descreve esses

testes detalhadamente.

3.2.3. Modelo SBTVAR

O modelo TVAR proposto por Tsay (1998) é um modelo linear local com

matrizes auto-regressivas diferentes em cada regime, determinados por uma

variável de limiar (uma das variáveis endógenas), um lag e um limiar. O modelo

SBTVAR (Structural Break Threshold Vector Autoregressive) proposto por

Galvão (2006) também divide a amostra em dois períodos, determinados por um

ponto de quebra, o qual permite diferentes dinâmicas antes e depois desta quebra.

O que mostra que este modelo caracteriza em mudanças abruptas de um regime

para o outro.

Apesar dos modelos não-lineares capturarem algumas características de

modelos de quebras estruturais, pode ser que a quebra também implique em

mudanças nos parâmetros que determinam a não-linearidade.

41

3.2.3.1. Formulação matemática

Defina x� = �x�� , … , x����como um vetor (m x 1) de m variáveis endógenas

e defina x��� = r1, x���, … , x��au como uma matriz (m x (mp+1)), onde p é a

ordem auto-regressiva. O modelo SBTVAR pode ser escrito como:

(3.12)

onde,

0$,��\�� $̂� é uma função indicadora, a qual depende de uma variável de transição

*��\�, do limiar $̂ e do lag X$, e 0���� é uma função indicadora que depende do

ponto de quebra.

O SBTVAR tem um TVAR em cada subconjunto determinado pelo ponto

de quebra, ou seja, a quebra também afeta os parâmetros da função indicadora que

determina os regimes. Se não houver limiar, o VAR com quebra estrutural

(SBVAR) é dado por:

(3.13)

Por outro lado, se houver limiar, mas não quebra estrutural, temos o VAR

com limiar (TVAR), que pode ser escrito como:

(3.14)

3.2.3.2. Estimação

A estimação do SBTVAR pode seguir duas abordagens, a de mínimos

quadrados condicionais, usada em Tsay (1998), apresentada na seção 2.3, ou

máxima verossimilhança, sugerida em Hansen and Seo (2002).

Usando os resíduos, a matriz de covariância é computada de forma

consistente como

42

O estimador de mínimos quadrados condicionais (MQC) é obtido fazendo

Da mesma forma, o estimador de máxima verossimilhança (ML) é obtido

fazendo

O estimador de ML é construído assumindo que as matrizes de covariância

são as mesmas em cada regime. Essa hipótese pode não ser válida quando

aplicada a dados macroeconômicos com variância não constante no tempo, mas o

estimador pode ser modificado para este caso.

3.2.3.3. Seleção do modelo

Em Galvão (2006) é apresentado um procedimento de seleção entre modelos

de limiar. A questão a ser estudada é qual modelo é mais adequado ao conjunto de

dados, um VAR, TVAR, SBVAR ou um SBTVAR.

Mesmo se podendo estimar modelos SBTVAR’s, não fica claro a

necessidade de ter limiares ou transições que variam no tempo para capturar a

estrutura dinâmica dos dados. Testes para limiar em um SBVAR ou para quebra

estrutural em um TVAR são complicados devido à descontinuidade das mudanças

e da presença de parâmetros mal comportados.

A autora propõe um método de especificação do modelo baseado nos limites

assintóticos para os testes LM e de Wald, derivados por Altissimo e Corradi

(2002). A regra de decisão para a seleção do modelo usa limites assintóticos e os

valores máximos das estatísticas de Wald e LM em uma grade de possíveis

valores para os parâmetros mal comportados, como proposto por Altissimo e

Corradi (2002). As estatísticas de Wald e LM são calculadas usando a soma do

quadrado dos resíduos (SSR) sob a hipótese nula e alternativa:

43

O vetor z� contém parâmetros como limiares e quebras do modelo sob a

hipótese nula, e o vetor z� contêm os mesmos parâmetros sob a hipótese

alternativa.

3.2.4. Modelo TVEC

Lo e Zivot (2001) definiram um modelo de co-integração com limiar

multivariado, chamado TVEC (Threshold Vector Error Correction), que é um

caso especial do TVAR do Tsay (1998).

3.2.4.1. Formulação matemática

De acordo com todas as considerações e suposições feitas no modelo

TVAR, Tsay (1998), define-se um modelo de limiar bivariado com 3 regimes pela

expressão:

(3.15)

Pode-se reescrever este modelo como:

(3.16)

onde

Se, em cada regime j, �� é I(1) e co-integrado com o vetor de co-integração

comum A� = �1, −A��, então o rank �∏���� = 1 e

44

Desta forma, a representação do modelo TVEC é dada por:

(3.17)

3.2.4.2. Teste de co-integração

Lo e Zivot (2001) consideram testes de não co-integração contra co-

integração linear e co-integração com limiar, além de testes de linearidade depois

de determinado que existe co-integração nos dados.

Balke e Fomby (1997) discutiram alguns problemas associados a testes de

co-integração com limiar. Os autores notaram que testar a hipótese nula de não

co-integração contra a hipótese alternativa de co-integração com limiar é

complicado. Além disso, para construir testes com alto poder para um tipo

específico de TVEC, é preciso especificar e estimar a forma do modelo de limiar

sob a hipótese alternativa, e isto pode ser difícil, uma vez que existem muitos

tipos de modelos de limiar.

Baseados em resultados de simulações de Monte Carlo, Balke e Fomby

(1997) sugeriram a seguinte estratégia, que Lo e Zivot (2001) estenderam:

1) Testa a hipótese nula de não co-integração contra a alternativa de co-

integração linear.

2) Se a hipótese de não co-integração for rejeitada, testa a hipótese nula

de co-integração linear contra a alternativa de co-integração não-

linear (com limiar).

3) Se a hipótese de linearidade for rejeitada, é realizada a especificação

e estimação do modelo de limiar.

3.2.4.3. Teste de linearidade

Para testar a linearidade, os autores usaram o teste generalizado

apresentado em Tsay (1998), que também é válido para processos co-integrados.

Para implementar esse teste, foi considerada uma regressão arranjada multivariada

para VEC.

45

3.2.4.4. Especificação do modelo

Após a realização dos testes e de rejeitar a não co-integração e linearidade,

é necessário determinar que tipo de modelo de limiar é mais apropriado para o

conjunto de dados. Algumas questões a serem respondidas são o número de

regimes do modelo, se os valores dos limiares são simétricos, qual modelo é mais

apropriado, entre outras.

Duas linhas gerais foram seguidas para determinar a especificação do

modelo de limiar apropriada. A primeira, adotada por Tong (1990), Clements e

Krolzig (1998), e Tsay (1998), usa um critério de seleção como AIC para

determinar a melhor especificação do modelo. A segunda, recentemente revisada

por Hansen (1999), usa um procedimento de testes seqüenciais baseados em

modelos aninhados. Lo e Zivot (2001) seguiram Hansen (1999) e consideraram

testes de hipóteses em ninhos baseadas em estimação irrestrita do modelo TVEC.

3.2.4.5. Estimação

A estimação do modelo é realizada usando mínimos quadrados

condicional seqüenciais, como em Hansen (1999).

3.2.5. Modelo STVEC

O modelo STVEC (Smooth Transition Vector Error Correction) é a versão

não-linear do modelo VEC (Vector Error Correction). A julgar pelas aplicações

destes modelos multivariados não-lineares que estão atualmente disponíveis, um

modelo de particular interesse é aquele em que os componentes do %� linear estão

ligados por uma relação de equilíbrio de longo prazo, enquanto a adaptação para

este equilíbrio é não-linear e pode ser caracterizado como troca de regimes, com

os regimes determinados pelo tamanho e/ou o desvio de sinal de equilíbrio. Em

modelos lineares de séries temporais, este tipo de comportamento é capturado

pelo modelo vetorial de correção de erros, consulte Johansen (1995) para os

46

tratamentos em profundidade. Recentemente, extensões não-lineares destes

conceitos foram consideradas na literatura.

3.2.5.1. Formulação matemática

Concentrando-se na incorporação do mecanismo de transição suave em um

VEC para permitir a não-linearidade ou assimetria dos dados, define-se como um

modelo vetorial de correção de erros com transição suave (Smooth Transition

Vector Error Correction – STVEC) dado por:

(3.18)

onde,

os vetores α$ , i =1,2 são vetores (K x 1) e *� = A�%� para algum vetor (K x 1);

A é o termo de correção de erro, isto é, *� é o desvio da relação de equilíbrio a

qual é dada por A�%� = 0;

a matriz Φ$ = rΦ$,�, … , Φ$,au� i =1,2 tem dimensão (K x K) e é formada pelos

coeficientes dos modelos lineares ligados aos regimes;

o vetor ε� = �ε��, … , ε���� é o vetor k-dimensional de ruído branco com média

zero e matriz de variância-covariância positiva definida Σ�;

a matriz X� = �1, … ,1, %���, %���, … , %��a�′, é formada por 1 na posição inicial

indicando o intercepto do modelo e nas demais posições as defasagens das

variáveis endógenas.

Afigura-se que as formas de correção de erros não-lineares freqüentemente

afetam diferentes ajustes para desvios positivos e negativos, ou para desvios

grandes e pequenos do equilíbrio. Efeitos assimétricos de desvios positivos e

negativos do equilíbrio podem ser obtidos definindo a função s�. � como a função

logística e F� = *���. No modelo resultante, a força de reversão de *� ao seu

atrator muda monotonicamente para valores crescentes de *�. A constante de

locação � pode ser reduzida a zero para tornar a mudança simétrica em torno do

valor de equilíbrio zero.

47

Já os efeitos assimétricos de desvios grandes e pequenos do equilíbrio

podem ser obtidos definindo a função s�. � como a função exponencial, dada por:

s�F�; , �� = 1 − h|��− �F� − ����, > 0.

com F� = *��� e novamente com a constante de locação � reduzida a zero para

centrar a força de equilíbrio em zero.

3.2.5.2. Teste de Linearidade

A seleção da variável de transição é feita testando a linearidade do modelo.

A hipótese nula é de que o conjunto de dados segue um modelo VEC e a

alternativa é de que seguem um STVEC. Para isso, preparam-se uma seqüência de

candidatas a variáveis de transição. Para solucionar o problema de identificação

dos parâmetros sob a hipótese nula, segue-se a abordagem de Luukkonen,

Saikkonen, Teräsvirta (1988) e substitui-se a função de transição por uma

aproximação de Taylor adequada. Desta forma, a metodologia aplicada no teste é

a mesma da aplicada em modelos STVAR.

O teste proposto por Luukkonen, Saikkonen, Teräsvirta (1988) vem sendo

usado em muitos estudos empíricos. Mas esse teste estatístico é baseado em uma

aproximação polinomial, e os erros de aproximação podem afetar a inferência

estatística. Além disso, os testes não são diretamente relacionados com o modelo

de transição suave, logo não pode apontar o que causa a rejeição da linearidade.

Com esta motivação, Seo (2004) considerou testes diretos para ajuste não-linear

em um modelo STVEC, baseados na especificação exata da transição suave.

Hansen e Seo (2002) consideraram os testes para não-linearidade de limiar em um

VEC e Seo (2004) estendeu para VEC de transição suave (STVEC). Os testes são

baseados na estatística LM, que pode ser calculada sob a hipótese nula.

3.3. Metodologia CART

3.3.1. Introdução

A metodologia Classification and Regression Tree (CART), proposta por

Breiman, Friedman, Olshen e Stone (1984), é um método de particionamento

48

recursivo, o qual estrutura os modelos definidos para sub-amostra dos dados,

dividindo de forma conveniente o problema em partes. Isto define a estruturação

por árvores de decisão, servindo de alternativa aos métodos tradicionais de

classificação (variável dependente binária) e regressão (variável dependente

contínua).

O modelo CART é não-paramétrico, sendo, portanto, não-probabilístico,

pois não assume uma distribuição de probabilidade e não seguem suposições

sobre componentes aleatórios e a forma do modelo. A principal vantagem do

CART vem da facilidade de interpretação da estrutura de árvore de decisão. As

variáveis envolvidas na definição da árvore formam um conjunto de sentenças

lógicas do modelo final.

O ciclo da modelagem envolve o crescimento da árvore a partir da raiz (nó

inicial), que contém todas as observações do conjunto de dados, até as folhas (nós

terminais), cada qual contendo parte das observações.

Primeiramente, realiza-se um teste no nó inicial, o qual só admite resposta

do tipo binário {0,1}, sendo então um teste lógico. Este teste é realizado em cada

observação de cada uma das variáveis preditoras e, de acordo com as respostas

lógicas obtidas, a raiz dará origem a dois filhos (novos nós), contendo parte das

observações originais. Por convenção, se a resposta for 1, aloca-se a observação

no nó esquerdo, caso contrário, no nó direito. Para cada nó gerado, este

procedimento de teste lógico deve ser repetido até que não seja mais possível

dividir a árvore. Desta forma, cada um dos nós que não geraram novos nós são os

chamados nós terminais. E cada nó que gerou dois filhos são denominados nós

ancestrais, ou nós de divisão, ou ainda nós intermediários.

O modelo final estimado é representado por um gráfico com o formato de

uma árvore binária de decisão, com os nós ancestrais (ou nós de divisão) e os nós

terminais (ou folhas). Um procedimento importante de numeração dos nós deve

ser adotado. A raiz é sempre o nó 0. E cada nó gerado a partir do nó 0 segue uma

seqüência numérica crescente da esquerda para a direita. Quando os nós não

forem gerados, deve-se saltar os seus números correspondentes e prosseguir a

numeração com o nó à direita mais próximo. A Figura 3.1 ilustra um exemplo de

árvore com ausência de alguns nós.

49

Figura 3.1: Exemplo de árvore com ausência de alguns nós

3.3.2. Formulação matemática

Seja |� = |��, |��, … , |a�′ ∈ � ⊆ ℝa um vetor com � variáveis preditoras de

uma determinada resposta univariada e contínua ��′ ∈ ℝ. Defina ��. � como uma

função desconhecida através da expressão:

�� = ��x�� + �� (3.19)

tal que, não há suposições sobre o termo aleatório ��.

Define-se, conforme Lewis,Stevens (1991), um modelo estruturado por

árvore com K folhas por uma função geral não-linear ��x�;  � de x� e definida

pelo vetor de parâmetros   ∈ ℝ¡, onde r é o número total de parâmetros, através

da expressão:

��x�� ≈ ��x�;  � = ∑ A$0$�x�; z$��$:� (3.20)

onde, 0�.� é uma função indicadora, dada por:

0$�x�; z$� = g1, Fh x� ∈ `$�z$�0, ��. n e   = �A�, … , A�, z�� , … , z�� �′ é o vetor de parâmetros envolvidos na árvore.

50

Usualmente, H(.) é uma função constante definida por K sub-regiões

`$�z�, c = 1, … , £, de algum domínio K ⊂ ℝa.

A Figura 3.2 é um exemplo de um modelo gerado por uma árvore de

regressão que explica a relação entre a variável resposta y e um conjunto de duas

variáveis preditoras x1 e x2 (q = 2). Define-se cj, j = 0,1,...,N, como o valor limite

da partição ki que determinará a inclusão da observação na região.

Figura 3.2: Exemplo de um modelo gerado por uma árvore de regressão

3.3.3. Algoritmo de crescimento

A arquitetura da árvore é definida a partir de um ciclo iterativo que escolhe

um nó a cada passo para ser subdividido e gerar mais 2 nós. A cada iteração, além

do nó a ser dividido, também é especificada uma variável de transição e o limiar

desta divisão (cj). A escolha desta especificação visa minimizar a soma dos erros

quadráticos de previsão. Para a raiz da árvore (primeira divisão), a equação a ser

minimizada é dada por:

SQE�F©� = ∑ ª�� − oA�0�|�; F;, �;� + A�r1 − 0�|�; F;, �;�up«���:� (3.21)

51

Após a especificação, estimam-se os parâmetros dos modelos locais para as

observações alocadas dentro dos nós gerados pela divisão. Esse ciclo se repete até

que não haja mais ganho em efetuar subdivisões na árvore.

Com o modelo final estimado, é possível realizar cortes de algumas folhas,

técnica conhecida como podagem (prunning), a partir de medidas de custo e

complexidade, ou da capacidade preditiva do modelo.

52

4 Metodologia

4.1. Introdução

Neste capítulo apresentam-se os modelos STVAR-Tree, o principal da

dissertação, além dos modelos competidores PAR(p) e Neuro-Fuzzy.

4.2. Modelo STVAR-Tree

O modelo vetorial auto-regressivo de transição suave estruturado por

árvores (em inglês, Smooth Transition Vector Autoregressive-Tree), denominado

aqui por modelo STVAR-Tree, é resultante da combinação do modelo STVAR

(Smooth Transition Vector Autoregressive) com o algoritmo CART

(Classification and Regression Tree), ambos discutidos no Capítulo 3.

A construção do modelo STVAR-Tree é uma adaptação do modelo STAR,

proposto por Dijk, Teräsvirta e Franses (2002). O ciclo da modelagem consiste em

três etapas: especificação, estimação e avaliação do modelo.

A especificação do modelo é feita através de métodos estatísticos, o que

permite desenvolver testes de hipóteses. Por esta abordagem, é possível

especificar um modelo não-linear paramétrico por meio de uma árvore de decisão.

Além disso, a árvore de decisão final pode ser facilmente interpretada, como

sentenças lógicas.

A estimação dos coeficientes pode ser vista como uma combinação de

diferentes modelos auto-regressivos, podendo utilizar variáveis exógenas no

conjunto daquelas que ajudam a compor o espaço de transição.

E, por fim, a avaliação do modelo final dá-se por meio de seu desempenho

(habilidade preditiva) em dados fora da amostra (out-of-sample).

53

4.2.1. Formulação matemática

Sejam ��, ��, … , �� séries temporais multivariadas de variáveis endógenas,

�� = ����, ���, … , �����, �� = ����, ���, … , �����, ..., �� = ����, ���, … , �����. Defina ��. � como uma função desconhecida de séries temporais multivariadas x�,

as quais podem ser as variáveis endógenas defasadas e variáveis exógenas, através

da expressão:

�� = ��x�� + �� (4.1)

tal que Ε /��2 = 0 (vetor nulo de dimensão K) e Ε /�����2 = Σ­ (matriz de

variância-covariância de dimensão K x K).

Define-se, portanto, a função �®¯�x�;  �: ℝ°�� → ℝ, indexada pelos

parâmetros  , como o modelo STVAR-Tree através da expressão:

�®¯�x�;  � = ∑ Φ$z³�´®$�x�; z$�$∈¯ + �� (4.2)

onde,

o vetor |� = r|�� , |��, … , |°�u�, tal que x� ∈ µ°;

o vetor *� = r*�� , *��, … , *a�u�, o qual �z� ⊆ x��, tal que z� ∈ ℝa, � < f, contém

as variáveis endógenas defasadas e, ainda, pode conter variáveis exógenas e

variáveis exógenas defasadas ; e o vetor z³� = �1, … ,1, z��′ contém 1’s indicando

os interceptos acrescidos ao vetor *�;

o vetor �� = ���� , ���, … , ����� é K-dimensional contendo ruídos brancos, ou seja,

Ε /��2 = 0 , Ε /�����2 = ¶·¸, ¹º Q:¹;, ¹º Q»¹ n ® é o conjunto de índices de nós geradores. Define-se ®$ como o subconjunto de ®

contendo os índices dos nós geradores que formam o caminho para a folha (nó

terminal) i; ¯ é o conjunto de índices de folhas (nós terminais);

µ é o conjunto de índices de variáveis de transição;

As funções ´®$, 0 < ´®$ < 1, são conhecidas como funções de pertinência, dadas

por.

54

´®$�x�; z$� = ¼ s O|D½,�; � , ��P¾�,½���¾�,½�� ¿1�∈®− s O|D½,�; � , ��PÀr��¾�,½u���¾�,½�

(4.3)

onde,

l$,�ÁÂÂÃÂÂÄ

−1, Fh k �jÅclℎk �j^j j �kÆℎj c lãk cl�Æ!c k ló jl�hF>^jÆ � �´®$ = 1�;0, Fh k �jÅclℎk �j^j j �kÆℎj c cl�Æ!c k �cÆℎk Xc^hc>k Xk ló jl�hF>^jÆ � �´®$ = 1 − s�;1, Fh k �jÅclℎk �j^j j �kÆℎj c cl�Æ!c k �cÆℎk hFf!h^Xk Xk ló jl�hF>^jÆ � �´®$ = s�.n

Vale ressaltar que ∑ ´®$rx�; z�u = 1, ∀�∈® x� ∈ µ°.

A função s�|�; z� é definida como Função Logística, da forma:

s�|�; , �� = ���ÊËÌ�ÍxËÎ� (4.4)

Define-se   = �Φ$, z$� como a representação de todos os parâmetros do

modelo, sendo particionado em dois grupos, classificados como parâmetros

lineares Φ$ = rΦ�$, … , Φa$u e parâmetros não-lineares z$ = � $ , �$�. A matriz de

parâmetros Φ$ é aquela que contém os coeficientes associados às defasagens das

variáveis dependentes, e o vetor z$ é formado pelos parâmetros de suavidade e

locação, respectivamente.

O motivo de z� ser um subconjunto de x� (conjunto de variáveis de

transição) é evitar regressores não estacionários nos modelos lineares locais, uma

vez que podemos ter séries não estacionárias como variáveis de transição. Uma

ilustração deste caso é dada quando a variável de transição x�$ trata-se de uma

tendência linear, a qual identifica uma possível quebra estrutural nas séries.

4.2.2. Especificação do modelo

O objetivo, aqui, é obter uma estratégia para o crescimento da árvore,

baseado na inferência estatística. Um processo de construção similar ao proposto

por van Dijk, Teräsvirta e Franses (2002) para o modelo STAR foi adaptado para

55

a modelagem STVAR-Tree. Os passos são basicamente os mesmos descritos no

Capítulo 3, os quais seguem o princípio “específico para geral”:

1) Seleção de variáveis relevantes para o modelo

Caso o número de variáveis disponíveis para a composição do modelo seja

elevado, é importante selecionar as mais relevantes. As candidatas à

variáveis de transição podem ser variáveis exógenas ou defasagens da

variável dependente. Dois critérios podem ser utilizados nesta fase: a)

conhecimento subjetivo do problema em questão, ou seja, usar o

conhecimento prévio sobre as séries temporais; ou b) estimar diversos

modelos lineares VAR, incrementando a ordem p do modelo, com � = 1,2, … , ����. Aquele modelo que minimizar os critérios de

informação AIC (Akaike, 1974) ou BIC (Schwarz, 1978) deve ser

selecionado e todas as propriedades dos modelos lineares VAR(p) devem

ser verificadas. As variáveis que compõem este modelo devem ser

selecionadas para a modelagem do STVAR-Tree.

2) Especificação do modelo, baseado em uma sequência de testes de hipótese

do tipo LM, o qual avalia a linearidade de um determinado modelo

Esta etapa define o modelo a ser estimado. Aqui, os conceitos de

inferência estatística são utilizados para determinar o crescimento da

árvore. O procedimento envolve uma seqüência de testes do tipo

Multiplicadores de Lagrange, conhecido como teste LM (do inglês,

Lagrange Multiplier), como apresentado em Luukkonen, Saikkonen e

Teräsvirta (1988). Na construção do modelo STVAR-Tree, o teste LM

verifica a adequação do modelo STVAR-Tree para descrever os dados. No

caso em que a hipótese nula de linearidade for rejeitada, seleciona-se o nó

a ser dividido e a variável de transição para estimar o modelo.

3) Estimação dos parâmetros lineares (constantes dentro dos nós) e não-

lineares (parâmetros da função logística) do modelo selecionado

Dois métodos de estimação são utilizados para produzir as estimativas dos

parâmetros do modelo STVAR-Tree, representados por   = �Φ$, z$�.Para

estimar os parâmetros classificados como lineares Φ$ = rΦ�$, … , Φa$u

utiliza-se Mínimos Quadrados Multivariados (ou Mínimos Quadrados

Generalizados – MQG) e para estimar os parâmetros não-lineares z$ =

56

� $, �$� utiliza-se Mínimos Quadrados Não-Lineares (MQNL), que é

equivalente ao método de Máxima Verossimilhança (MV) sob a

normalidade dos erros. Caso os erros não sejam normais, MQNL é

equivalente à Quase-Máxima Verossimilhança (QMV).

4) Análise de diagnóstico do modelo

Avalia-se os modelos estruturados por árvores pelo seu desempenho

estatístico (habilidade preditiva) em dados fora da amostra (out-of-

sample).

5) Re-especificação do modelo de acordo com os resultados do diagnóstico

No caso de selecionar um modelo STVAR-Tree que não produza

resultados estatísticos satisfatórios, deve-se voltar a etapa 1 e re-

especificar um modelo e, assim, seguir todas as etapas.

6) Utilização do modelo com fins descritivos ou de previsão

Com todas as etapas acima verificadas e satisfeitas, determina-se o modelo �®¯�x�;  � como o modelo final que será utilizado de acordo com os seus

propósitos.

Esta etapa de especificação engloba a etapa de estimação dos parâmetros,

definida na seção posterior, pois o teste LM necessita estimar os modelos sob H0 e

H1, o que indica que, para cada divisão, são estimados os parâmetros lineares e

não-lineares dos modelos.

4.2.3. Estimação dos parâmetros

Definiu-se que, para a estimação de todos os parâmetros do modelo

STVAR-Tree, representados por   = �Φ$, z$�, leva-se em consideração a hipótese

de que o vetor �� = ���� , ���, … , ����� é formado por variáveis aleatórias

normalmente distribuídas com média zero e matriz de variância-covariância Σ­.

Para estimar os parâmetros lineares do modelo inicializa-se os valores dos

parâmetros não-lineares z$ = � $, �$� através de uma grade de valores (grid). Uma

vez inicializados, ou seja, dado que os parâmetros não-lineares são conhecidos, a

estimação do modelo STVAR-Tree corresponde a estimação de uma regressão

multivariada e os parâmetros lineares Φ$ = rΦ�$, … , Φa$u são estimados por

57

Mínimos Quadrados Multivariados (ou Mínimos Quadrados Generalizados –

MQG), dados por:

ΦÏ = /Z�z��Z�z�2��Z�z���Q (4.5)

onde, �� = ���� , ��� , … , �����, z = �z�� , … , z"� �� e

Z�z� = Ñz³�´��x�; z�� ⋯ z³�´��x�; z��⋮ ⋱ ⋮z³�´��x�; z�� ⋯ z³�´��x�; z��Ô

Esse método de estimação é conhecido como Máxima Verossimilhança

Concentrada, sob normalidade dos erros, ou Quase-Máxima Verossimilhança

Concentrada, caso os erros não sejam normais, e a expressão é dada através de:

 Õ = argminÛ∈Ü Ý1Þ ß/�� − �®¯�x�;  �2�/�� − �®¯�x�;  �2��:�

à (4.6)

Os parâmetros não-lineares de  , ou seja, vetor z$ são estimados

condicionalmente a Φ através de MQNL, o qual faz uso de procedimentos de

otimização não-linear. Para a estimação dos parâmetros do modelo STVAR-Tree

considerou-se o algoritmo de Levenberg-Marquadt, completando a estimação da

iteração. Como o método MQNL é muito sensível aos valores iniciais, é feita uma

busca de valores iniciais por grade de valores (grid), que busca a maximização da

função de log-verossimilhança concentrada.

4.2.4. Divisão dos nós – Seqüência de testes LM

Considere um modelo STVAR-Tree com K nós terminais, escrito como:

�> = �®¯�x�;  � = ∑ Φ$z³� ®́$�x�; z$�$∈¯ + �� (4.7)

ou

58

�� = ß Φiz³� ®́$�x�; z$� + Φ�$∗��z³� ®́�$∗���x�; z�$∗���$∈¯��$∗� + Φ�$∗��z³� ®́�$∗���x�; z�$∗��� + �� (4.8)

onde

´®�$∗���x�; z�$∗��� = ´®$∗�x�; z$∗�s�|$∗�; $∗ , �$∗�;

´®�$∗���x�; z�$∗��� = ´®$∗�x�; z$∗�/1 − s�|$∗�; $∗ , �$∗�2.

A equação pode ser escrita na forma:

�� = ß Φ$z³� ®́$�x�; z$� + =z³�´®$∗�x�; z$∗� $∈¯��$∗� + bz³� ®́$∗�x�; z$∗�s�|$∗�; $∗ , �$∗� + �� (4.9)

onde = = Φ�$∗�� e b = Φ�$∗�� − Φ�$∗��.

Define-se, portanto, a construção do modelo através de testes de hipóteses

do tipo Multiplicadores de Lagrange, conhecido como teste LM. Desta forma, o

crescimento da árvore está condicionado à existência de não-linearidade nas séries

modeladas.

Primeiramente, o teste LM deve ser realizado, baseado nas hipóteses:

H0: Linearidade

H1: Não-linearidade

Esta etapa consiste em testar se o nó raiz deve ou não ser dividido. Em

outras palavras, o teste determinará um modelo constante VAR ou o mais simples

modelo STVAR-Tree, com 2 nós terminais.

Sob H0, é fácil verificar que, para = 0, a função logística s�. � assume um

valor constante igual a 0,5, independente do valor do parâmetro de locação �,

pois:

s�|�; 0, �� = 11 + h�;��x�y� = 11 + h; = 11 + 1 = 12

59

Isto implica que a estimação de �®¯�x�;  � será simplesmente a média

ponderada entre os regimes, sendo então, uma combinação linear de modelos

lineares VAR. Consequentemente, o modelo resultante também será linear.

Portanto, seria suficiente testar a linearidade das séries considerando as hipóteses:

H0: = 0

H1: > 0

Porém, ao considerar diferentes valores para o parâmetro �, a função de

verossimilhança pode permanecer inalterada, o que acarretará num problema de

identificação. Como uma solução deste problema, adota-se a proposta de

Luukkonen, Saikkonen e Teräsvirta (1988), que aproxima a função s�. � por uma

expansão de Taylor de 3ª ordem em torno de = 0. Então, ao reescrever o

modelo �®¯�x�;  � considerando a expansão de Taylor no lugar da função s�. �,

chega-se a seguinte expressão:

s�|�; , �� = 12 + 2 �|� − �� + 32 ��|� − ��� + 12 ~�|� − ��~+ â~�|�; , �� (4.10)

onde R~�xQ; γ, c� é o resto da expressão.

Considerando a expansão de Taylor de 3ª ordem em torno de = 0, o

modelo pode ser escrito como:

�� = ß Φ$�z³�´®$�x�; z$� + �;� z³� ®́$∗�x�; z$∗� + ��� z³�´®$∗�x�; z$∗�|$∗�$∈¯��$∗�+ ��� z³�´®$∗�x�; z$∗�|$∗�� + �~� z³�´®$∗�x�; z$∗�|$∗�~ + h� (4.11)

onde h� = �� + b�z³� ®́$∗�x�; z$∗� + â~�|$∗�; $∗ , �$∗�

Os parâmetros �", ` = 0, … ,3 são funções dos parâmetros originais

lineares e não-lineares do modelo, �=, b, $∗ , �$∗�. Desta forma, as hipóteses do

teste LM passam a ser:

60

H0: �� = �� = �~ = 0

H1: caso contrário

Sob H0, o resto da expansão de Taylor desaparece, de forma que as

propriedades do erro permanecem inalteradas. E isto gera condições propícias

para o uso de inferência estatística assintótica.

O teste LM também pode ser aplicado na sua versão do teste F, seguindo os

seguintes passos:

1) Estimar o modelo com K regimes

2) Regredir os resíduos !æ� em hÕ� e calcular a soma dos novos resíduos

quadráticos ��â; = ∑ !³����:� . Os novos resíduos !³� serão ortogonais à

hÕ�.

3) Fazer a regressão de !³� em hÕ� e νæQ. Calcular a soma dos resíduos

quadráticos obtidos a partir desta regressão, ��â� = ∑ è̂����:� .

4) Obter a estatística M�

ê�ëì = Þ ��â; − ��â���â; ,

ou a estatística F

ê�í = ���â; − ��â��/Å��â�/�Þ − l − Å�,

onde l = �f + 2�ℎ + � + 1.

Sob H;, a estatística de teste ê�ëì segue uma distribuição M� assintótica

com Å graus de liberdade, e a estatística de teste ê�í segue aproximadamente

uma distribuição F com m e Þ − l − Å graus de liberdade, onde T é o número de

observações.

Uma vez definidos a estimação do modelo e o teste ML para o crescimento

da árvore, o algoritmo da modelagem torna-se simples.

4.2.5. Controle do crescimento da árvore

Na modelagem STVAR-Tree, o teste LM deve ser executado

seqüencialmente de modo a decidir a divisão de cada um dos nós sob teste. Sabe-

61

se que árvores com muitos nós terminais tornam-se complexas e isto compromete

a análise do modelo final. Com a finalidade de controlar o erro do tipo I (árvore

superestimada), adotou-se o procedimento de diminuir o nível de significância do

teste, de acordo com o crescimento da árvore. Assim, ao realizar o teste pela n-

ésima vez em um nó da d-ésima profundidade, o procedimento adotado faz com

que ��X, l� assuma o valor:

��X, l� = �l\ , onde � é o nível de significância do primeiro teste.

Este procedimento força o teste LM a ser mais rigoroso nas divisões de

maiores profundidades e, assim, o uso de técnicas de podagem citadas no Capítulo

III não deve ser levado em consideração.

4.2.6. Previsão

A flexibilidade da metodologia STVAR-Tree permite que sejam criados

três tipos de previsão diferentes:

1) Combinação de Regimes (RC):

Aplicação direta do modelo estimado. Utiliza-se a equação resultante da

estimação para obter a previsão um passo a frente. Assim, a previsão é

obtida a partir da soma ponderada dos modelos lineares locais, na qual os

pesos são as pertinências das observações em cada regime.

2) Máxima Pertinência (MM):

Observa-se em qual regime a observação apresenta maior pertinência e

aplica-se o modelo local correspondente.

3) Combinação Adaptativa de Regimes (do inglês, Adaptive Regime

Combining – ARC):

Metodologia similar à RC, porém os parâmetros lineares são re-estimados

a cada passo da previsão, utilizando as últimas observações,

correspondentes a um ano. Para séries diárias, as últimas 365 (ou 252, no

mercado financeiro). Séries semanais, as últimas 52 observações. E para

séries mensais, as últimas 12 observações. E assim por diante.

62

4.3. Modelo PAR

Essencialmente, qualquer estrutura de dependência temporal pode ser

reproduzida por modelos de séries temporais lineares do tipo PAR(p), sendo este

tipo de modelo uma abordagem bastante flexível, e bastante popular para a

modelagem estocástica de vazões fluviais (Hipel e McLeod, 1994). Na

terminologia de séries temporais, a tendência hidrológica é conhecida como

estrutura de dependência temporal, sendo quantificada pela função de

autocorrelação estimada do registro de vazões.

A análise deste tipo de séries pode ser feita pelo uso de formulações auto-

regressivas cujos parâmetros apresentam um comportamento periódico. A esta

classe de modelos costuma-se denominar modelos auto-regressivos periódicos de

ordem p - PAR(p), Salas et al. (1980). Em geral, p é um vetor, � = ���, ��, . . . , ����, onde cada elemento fornece a ordem de cada período.

4.3.1. Formulação matemática

O modelo PAR���, ��, . . . , ���� pode ser descrito matematicamente por:

(4.12)

onde,

ï� é uma série sazonal de período s;

F é o número de período (s=12 para séries mensais)

> é o índice do tempo, t=1,2,…,sN, função do ano T (T=1,2,…,N) e do período m

(m=1,2,…,s);

N é o número de anos;

3�é a média sazonal de período s;

G�é o desvio-padrão sazonal de período s;

=�$ é o i-ésimo coeficiente auto-regressivo do período m;

��é a ordem do operador auto-regressivo do período m;

j� é a série de ruídos independentes com média zero e variância .

63

E a correlação do modelo PAR(p) é dada por:

(4.13)

4.4. Sistema Neuro-Fuzzy

Os Sistemas Neuro-Fuzzy (SNF) são ditos “inteligentes” e associam a

capacidade de aprendizado das Redes Neurais e sua tolerância a falhas à

interpretabilidade dos Sistemas Fuzzy (Zadeh, 1965). Ao se combinarem duas ou

mais técnicas, cria-se, muitas vezes, um sinergismo que pode levar a um sistema

mais poderoso. Verifica-se que SNF tem aplicação em diversas áreas, como

reconhecimento de padrões, previsão, classificação, controle, etc., com a obtenção

de bons resultados.

A razão para o seu bom desempenho é que os mesmos implementam um

sistema de inferência fuzzy através de uma arquitetura de redes neurais

(paralelamente distribuída), permitindo assim a integração de conhecimentos

implícitos (própria base de dados) e explícitos (conhecimento de especialistas).

Uma série de arquiteturas de SNF tem sido proposta na literatura nos

últimos anos. Dentre essas, pode-se citar o sistema ANFIS (Jang,1993), um dos

modelos mais conhecidos e utilizados na prática. Passa-se a descrever o sistema

ANFIS, o qual será utilizado no próximo capítulo para modelar o preço spot de

energia elétrica no Brasil.

4.5. ANFIS: Adaptive Neuro-Fuzzy Inference System (Sistema Adaptativo de Inferência Neuro-Fuzzy)

Por simplicidade, considere um sistema de inferência fuzzy com duas

entradas x e y e uma saída z. Para um modelo Fuzzy Sugeno de primeira ordem,

um conjunto usual de regras “se-então” é a seguinte:

64

A partir deste modelo Fuzzy Sugeno de primeira ordem com duas entradas e

duas regras ilustra-se a arquitetura ANFIS como aquela da Figura 4.1, onde os nós

da mesma camada têm funções similares.

Figura 4.1: Arquitetura ANFIS equivalente

A seguir, passa-se a descrever cada camada do modelo.

Camada 1. Cada nó nesta camada ���, ��, ´�, ´�� é um nó adaptativo com

uma função denominada função de pertinência de um conjunto fuzzy, a qual gera

a saída do tipo:

ð�,$ = 3ñ��|�, para c = 1,2, ou

ð�,$ = 3ò�Ëì���, para c = 3,4

onde x (ou y) é a entrada para o nó i e �$ (ou $́��) é um rótulo lingüístico (como

“alto” ou “baixo”) associado a este nó. Esta função especifica o grau, pertencente

ao intervalo [0,1], em que a entrada x (ou y) satisfaz este conjunto conjunto

fuzzy,.

Camada 2. Cada nó nesta camada é um nó fixo rotulado Π, representa o

nível da regra, cuja saída é o produto de todos os sinais de entrada:

ð�,$ = ô$ = 3ñ��|�3ò����.

Camada 3. Cada nó i nesta camada é um nó fixo rotulado N. A partir dessa

camada temos o processo defuzzificador. A saída desse nó é dada pela razão entre

o i-ésimo nível da regra e a soma de todas os níveis:

Camada 4. Cada nó i nesta camada é um nó adaptativo com uma função nó:

65

onde ô$ é um nível da Camada 3 e ��$ , f$ , $̂� é o conjunto de parâmetros deste nó.

Tem-se, então, um produto entre os níveis o valor do conseqüente da regra em si.

Por isso, parâmetros nesta camada são denominados parâmetros conseqüentes.

Camada 5. Cada nó i nesta camada é um nó fixo rotulado Σ, que calcula a

saída geral do sistema como a soma de todos os sinais de sua entrada:

Finalmente, a Figura 4.2 mostra uma arquitetura ANFIS que é equivalente a

um modelo Sugeno de primeira ordem de duas entradas com nove regras, onde

cada entrada tem três funções de pertinência associadas.

Figura 4.2: Arquitetura ANFIS para o modelo Sugeno

A identificação dos parâmetros do modelo ANFIS é realizada, em geral,

empregando algoritmos de aprendizagem híbrida, isto é, combinando estimação

de mínimos quadrados com retro-propagação.

66

5 Experimentos e Aplicações

5.1. Experimentos de Monte Carlo

Experimentos de Monte Carlo foram planejados com o objetivo de constatar

a funcionalidade tanto do teste LM quanto da estimação do modelo STVAR-Tree.

Nos experimentos, foram realizadas 1000 replicações para cada modelo com

tamanho de amostra variando em T = 200, 600 e 1100, numa tentativa de

representar amostras pequenas, médias e grandes. Para evitar efeitos de

inicialização, as 100 primeiras observações geradas foram descartadas e, assim,

passamos a ter amostras de tamanho T = 100, 500 e 1000. Foram considerados os

níveis de significância do teste LM, � = 0,1%, 1%, 5%, 10% e 15%.

5.1.1. Teste LM

Ao efetuarmos um teste de hipóteses, podemos tomar decisões certas ou

erradas, de acordo com a aceitação ou rejeição das hipóteses em questão. Se

representarmos isso numa tabela em termos de probabilidade, temos:

H0 Verdadeira H0 Falsa

P(Rejeitar H0) α 1 - β

(Erro do Tipo I) (Poder do teste)

P(Aceitar H0) 1 - α β

(Decisão correta) (Erro do Tipo II)

Tabela 5.1: Probabilidades em um teste de hipóteses

Para a avaliação do teste LM, foram realizados dois experimentos, baseados

nas seguintes hipóteses:

H0: Linearidade

H1: Não-linearidade

67

Primeiramente, uma análise da coluna que considera H0 verdadeira foi feita,

isto é, um modelo linear, um VAR bivariado, foi simulado, tendo os seguintes

parâmetros fixos:

/�� ��2� = /1 �� ��2��� Ñ 0 00,90 00 0,95Ô + /�� ��2� (5.1)

Neste experimento, definimos o vetor constante como nulo e os erros

aleatórios e independentes �$� , c = 1,2 com distribuição Normal (0,1). A candidata

a variável de transição foi �����. Vale ressaltar que as mesmas análises foram

refeitas considerando a variável de transição �����, porém os resultados não se

alteraram.

A Tabela 5.2 apresenta os resultados obtidos. Duas conclusões deste

primeiro experimento são tiradas, sendo uma positiva e outra negativa:

Positiva: O teste LM apresentou grande nível de acerto quanto à linearidade

dos dados;

Negativa: Os valores de �Ê�aí¡$y© são sempre menores que �¾©�$¾�÷. E isto

indica que o teste LM apresenta uma tendência para a aceitação da linearidade.

Em outras palavras, o teste LM aceita a linearidade mais do que deveria. Uma

atenção a mais deve ser dada aos valores muito baixos para �.

Lineares Não-lineares �Ê�aí¡$y© �¾©�$¾�÷ = 0,1%

T = 100 1000 0 0,0%

T = 500 1000 0 0,0%

T = 1000 1000 0 0,0% �¾©�$¾�÷ = 1%

T = 100 999 1 0,1%

T = 500 999 1 0,1%

T = 1000 999 1 0,1% �¾©�$¾�÷ = 5%

T = 100 970 30 3,0%

T = 500 973 27 2,7%

T = 1000 981 19 1,9% �¾©�$¾�÷ = 10%

T = 100 915 85 8,5%

T = 500 936 64 6,4%

T = 1000 931 69 6,9% �¾©�$¾�÷ = 15%

T = 100 842 158 15,8%

T = 500 877 123 12,3%

T = 1000 899 101 10,1%

Tabela 5.2: Experimento Monte Carlo – Simulação de um VAR

68

Em seguida, foi realizada uma análise da Tabela 5.1 na coluna que considera

H0 falsa. Para tal, basta simular um modelo não-linear. Neste estudo, um modelo

STVAR-Tree bivariado foi simulado, tendo a seguinte arquitetura:

Figura 5.1: Arquitetura STVAR-Tree simulada

A fim de evitar complexidade, definiu-se esta arquitetura por apresentar um

número pequeno de folhas (nós terminais). Matematicamente, o modelo com os

parâmetros fixos é representado por:

/�� ��2� = /1 �� ��2��� Ñ 0 00,90 00 0,95Ô s�|�; , �� + /1 �� ��2��� Ñ 0 00,50 00 0,50Ô r1 − s�|�; , ��u+ /�� ��2� (5.2)

Neste experimento, também definimos o vetor constante como nulo e os

erros aleatórios e independentes �$�, c = 1,2 com distribuição Normal (0,1). A

candidata a variável de transição também foi ����� e os parâmetros não-lineares

da função de transição s������; , �� assumiram os valores � = 0, para o

parâmetro de locação, e o parâmetro de suavidade variou em = 1,5, 10. Vale

ressaltar que, inicialmente, variamos o parâmetro de suavidade em diversos

valores, desde 0.01 até 100. Porém, este procedimento acarretou num custo

computacional muito alto e não houve melhora significativa nos resultados. Por

isso, fixamos somente três valores para .

A Tabela 5.3 apresenta os resultados obtidos. Em geral, o poder do teste

aumenta com o aumento do nível de significância �¾©�$¾�÷ e/ou do parâmetro de

suavidade . O teste LM acusa problemas na identificação de não-linearidade para

amostras de tamanho pequeno.

Conclui-se que, quanto maior o tamanho da amostra, maior o poder do teste,

independente do nível de significância e do valor do parâmetro de suavidade .

69

= 1 = 5 = 10

Lineares Não-

lineares Poder do

teste Lineares Não-

lineares Poder do

teste Lineares Não-

lineares Poder do

teste � = 0,1%

T = 100 1000 0 0,0% 993 7 0,7% 992 8 0,8%

T = 500 600 400 40,0% 114 886 88,6% 107 893 89,3%

T = 1000 25 975 97,5% 0 1000 100,0% 0 1000 100,0% � = 1%

T = 100 986 14 1,4% 952 48 4,8% 915 85 8,5%

T = 500 222 778 77,8% 21 979 97,9% 24 976 97,6%

T = 1000 0 1000 100,0% 0 1000 100,0% 0 1000 100,0% � = 5%

T = 100 895 105 10,5% 750 250 25,0% 708 292 29,2%

T = 500 60 940 94,0% 0 1000 100,0% 1 999 99,9%

T = 1000 0 1000 100,0% 0 1000 100,0% 0 1000 100,0% � = 10%

T = 100 788 212 21,2% 571 429 42,9% 570 430 43,0%

T = 500 20 980 98,0% 0 1000 100,0% 1 999 99,9%

T = 1000 0 1000 100,0% 0 1000 100,0% 0 1000 100,0% � = 15%

T = 100 681 319 31,9% 452 548 54,8% 447 553 55,3%

T = 500 14 986 98,6% 1 999 99,9% 0 1000 100,0%

T = 1000 0 1000 100,0% 0 1000 100,0% 0 1000 100,0%

Tabela 5.3: Experimento Monte Carlo – Simulação de um STVAR-Tree

5.1.2. Modelo STVAR-Tree

Para a avaliação da modelagem STVAR-Tree, foram realizados outros

experimentos de Monte Carlo. Novamente, foram considerados os níveis de

significância para o teste LM � = 0,1%, 1%, 5%, 10% e 15%. Primeiramente, um modelo linear, um VAR bivariado, foi simulado, com os

mesmos parâmetros fixos utilizados na avaliação do teste LM. Aqui, o

experimento avalia a modelagem STVAR-Tree na situação em que o modelo em

questão não apresenta não-linearidade, ou seja, o modelo é linear. E por isso, o

modelo terá como nó terminal a raiz da árvore e, assim, um modelo linear VAR

deverá ser estimado.

Espera-se que os parâmetros lineares estimados sejam aproximadamente

iguais aos valores fixos. A matriz de covariâncias dos erros também foi estimada e

analisada. Considerou-se as medidas de tendência central, média e mediana, além

das medidas de dispersão, desvio-padrão e DAM (desvio absoluto mediano) em

torno da mediana (do inglês, Mean Absolute Deviation, MAD), sendo o último

expresso por:

70

(5.2)

A Tabela 5.4 apresenta os resultados da estimação dos parâmetros lineares Φ.

ΦÏ

Média Mediana Desvio-padrão DAM

� = 0,1%

T = 100 0,00 0,00 0,00 0,00 0,19 0,22 0,10 0,12

0,85 0,00 0,85 0,00 0,06 0,07 0,04 0,04

0,00 0,90 0,00 0,91 0,05 0,05 0,03 0,03

T = 500 0,01 0,00 0,01 0,00 0,05 0,05 0,03 0,03

0,89 0,00 0,89 0,00 0,02 0,02 0,01 0,02

0,00 0,94 0,00 0,94 0,02 0,02 0,01 0,01

T = 1000 0,00 0,00 0,01 0,00 0,04 0,03 0,02 0,02

0,89 0,00 0,89 0,00 0,01 0,01 0,01 0,01

0,00 0,95 0,00 0,95 0,01 0,01 0,01 0,01

� = 1%

T = 100 0,01 0,01 0,00 0,01 0,18 0,21 0,11 0,12

0,85 0,00 0,86 0,00 0,06 0,06 0,04 0,04

0,00 0,90 0,00 0,91 0,05 0,06 0,03 0,03

T = 500 -0,01 -0,01 -0,01 -0,01 0,05 0,06 0,03 0,03

0,89 0,00 0,89 0,00 0,02 0,02 0,01 0,01

0,00 0,94 0,00 0,94 0,01 0,02 0,01 0,01

T = 1000 0,00 0,00 0,00 0,00 0,03 0,04 0,02 0,02

0,90 0,00 0,89 0,00 0,01 0,01 0,01 0,01

0,00 0,95 0,00 0,95 0,01 0,01 0,01 0,01

� = 5%

T = 100 0,00 -0,02 0,00 0,00 0,17 0,24 0,10 0,12

0,85 0,00 0,86 0,00 0,06 0,06 0,04 0,04

0,00 0,90 0,00 0,91 0,05 0,06 0,03 0,03

T = 500 0,00 -0,01 0,01 -0,02 0,06 0,06 0,03 0,03

0,89 0,00 0,89 0,00 0,02 0,02 0,01 0,01

0,00 0,94 0,00 0,95 0,02 0,02 0,01 0,01

T = 1000 0,00 0,00 0,00 0,00 0,04 0,03 0,03 0,02

0,89 0,00 0,89 0,00 0,01 0,01 0,01 0,01

0,00 0,95 0,00 0,95 0,01 0,01 0,01 0,01

� = 10%�

T = 100 0,00 0,00 0,00 0,00 0,19 0,22 0,11 0,12

0,84 0,00 0,85 0,00 0,06 0,07 0,04 0,04

0,00 0,89 0,00 0,90 0,05 0,06 0,04 0,04

T = 500 -0,01 0,00 -0,01 0,01 0,05 0,06 0,03 0,03

0,89 0,00 0,89 0,00 0,02 0,02 0,01 0,01

71

0,00 0,94 0,00 0,94 0,02 0,02 0,01 0,01

T = 1000 0,00 0,01 0,00 0,01 0,04 0,04 0,03 0,02

0,90 0,00 0,90 0,00 0,02 0,02 0,01 0,01

0,00 0,94 0,00 0,95 0,01 0,01 0,01 0,01

� = 15%

T = 100 0,00 -0,01 0,00 0,00 0,19 0,23 0,11 0,11

0,84 0,00 0,85 0,00 0,06 0,07 0,04 0,04

0,00 0,90 0,00 0,91 0,05 0,06 0,03 0,04

T = 500 0,00 0,01 0,00 0,00 0,05 0,05 0,03 0,03

0,89 0,00 0,89 0,00 0,02 0,02 0,01 0,01

0,00 0,94 0,00 0,94 0,02 0,01 0,01 0,01

T = 1000 0,00 0,00 0,00 0,00 0,03 0,04 0,02 0,02

0,89 0,00 0,90 0,00 0,02 0,01 0,01 0,01

0,00 0,95 0,00 0,95 0,01 0,01 0,01 0,01 Tabela 5.4: Experimento Monte Carlo – Estimação dos parâmetros lineares

Conclui-se que, para amostras pequenas, a tendência é subestimar os

parâmetros lineares, independente do nível de significância do teste LM. Para

amostras médias e grandes, o modelo STVAR-Tree estima corretamente os

parâmetros. As medidas de dispersão não apontam grandes afastamentos das

estimativas.

Com os mesmos modelos estimados, foi feita uma análise da estimativa da

matriz de covariâncias dos termos de erro, Σ­, apresentada na Tabela 5.5.

ΣÕ�

� T Média Mediana Desvio-Padrão DAM

0,1% 100 0,96 0,96 0,95 0,96 0,15 0,14 0,10 0,09

500 1,00 0,99 0,99 0,99 0,06 0,06 0,04 0,04

1000 1,00 0,99 1,00 0,99 0,04 0,05 0,03 0,03

1% 100 0,97 0,96 0,96 0,95 0,13 0,14 0,09

500 0,99 0,99 0,99 1,00 0,06 0,06 0,05 0,04

1000 1,00 0,99 1,00 0,98 0,05 0,04 0,03 0,03

5% 100 0,96 0,96 0,95 0,96 0,14 0,14 0,09 0,09

500 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04

1000 1,00 0,99 1,00 0,99 0,04 0,04 0,03 0,03

10% 100 0,97 0,96 0,96 0,95 0,14 0,14 0,09 0,09

500 0,99 1,00 0,99 0,99 0,07 0,07 0,05 0,04

1000 0,99 0,99 0,99 0,99 0,05 0,05 0,03 0,03

15% 100 0,97 0,95 0,96 0,94 0,14 0,14 0,09 0,09

500 0,99 1,00 1,00 1,00 0,06 0,06 0,04 0,04

1000 0,99 0,99 1,00 0,99 0,04 0,04 0,03 0,03 Tabela 5.5: Experimento Monte Carlo – Estimação da diagonal principal da matriz de covariâncias dos erros, Σ­

72

Este resultado mostra que, apesar de amostras pequenas subestimarem os

parâmetros, como resultado final da estimação, os modelos conseguem capturar

toda a estrutura e ajustar valores próximos aos valores observados.

Em seguida, simulou-se um modelo STVAR-Tree, com a mesma arquitetura

e os mesmos parâmetros fixos utilizados na avaliação do teste LM. Esta etapa

avaliou a modelagem STVAR-Tree na situação em que o modelo apresenta não-

linearidade, ou seja, ocorre crescimento da árvore. Aqui, deve-se considerar

somente os resultados para a simulação que detectou a arquitetura especificada.

Então, modelos especificados de modo incorreto, ou seja, que não apresentaram

não-linearidade ou modelos com mais de dois nós terminais foram retirados desta

análise.

A estimação dos parâmetros resultou em outliers e valores extremos para

algumas simulações. Conseqüentemente, tanto a média quanto o desvio-padrão

das estimativas foram fortemente afetados por estes valores. Por isso, a análise

baseada na mediana e no DAM permite tirar melhores conclusões. A Tabela 5.6

apresenta os resultados da estimação dos parâmetros não-lineares e �. Vale

ressaltar que para � = 0,1%, = 1 e T = 100, o teste LM acusou linearidade

para as 1000 replicações, por isso, nenhum parâmetro não-linear foi estimado.

T

æ �̂

Média Mediana Desvio-Padrão DAM Média Mediana Desvio-Padrão DAM

� = 0,1%

¾©�$¾�÷ = 1 100 x x x x x x x x

500 7,71 2,31 20,61 1,28 -0,01 0,02 0,69 0,40

1000 46,94 9,14 181,55 7,22 -0,03 -0,01 0,44 0,10

¾©�$¾�÷ = 5 100 5,06 5,51 2,22 0,89 -0,31 -0,08 0,68 0,05

500 35,45 7,18 132,33 5,08 -0,03 -0,01 0,42 0,12

1000 45,86 9,19 179,68 7,00 -0,03 -0,01 0,43 0,09

¾©�$¾�÷ = 10 100 10,89 5,51 19,45 2,19 -0,20 -0,04 0,49 0,07

500 54,92 10,93 182,54 7,88 -0,02 -0,01 0,33 0,08

1000 48,39 9,85 194,42 7,46 -0,03 -0,01 0,41 0,09

� = 1%

¾©�$¾�÷ = 1 100 9,19 5,78 14,48 4,41 -0,15 -0,07 0,94 0,44

500 45,12 8,56 162,28 6,91 -0,02 -0,01 0,48 0,12

1000 45,86 9,16 188,83 7,15 -0,03 -0,01 0,43 0,09

¾©�$¾�÷ = 5 100 18,92 5,51 58,88 3,44 -0,18 -0,11 0,69 0,28

500 46,51 9,02 185,86 6,67 -0,03 -0,01 0,43 0,10

1000 44,70 9,16 186,16 6,94 -0,03 -0,01 0,41 0,09

¾©�$¾�÷ = 10 100 21,08 6,38 51,01 4,16 -0,15 -0,08 0,63 0,23

73

500 54,30 10,61 187,93 7,94 -0,03 -0,01 0,39 0,09

1000 46,28 9,72 194,65 7,32 -0,03 -0,01 0,40 0,08

� = 5%

¾©�$¾�÷ = 1 100 20,41 5,98 46,89 4,48 0,00 -0,03 0,79 0,33

500 49,29 9,41 181,19 7,38 -0,02 -0,01 0,46 0,11

1000 44,36 9,16 190,31 7,08 -0,03 0,00 0,41 0,09

¾©�$¾�÷ = 5 100 27,85 6,90 83,74 4,92 -0,04 -0,07 0,72 0,30

500 48,58 9,41 206,81 7,03 -0,02 -0,01 0,44 0,10

1000 43,41 9,18 186,85 6,94 -0,03 0,00 0,40 0,08

¾©�$¾�÷ = 10 100 38,70 7,98 153,55 6,01 -0,03 -0,06 0,71 0,27

500 52,93 10,28 205,08 7,75 -0,02 -0,01 0,41 0,09

1000 44,18 9,59 186,10 7,21 -0,03 0,00 0,40 0,08

� = 10%

¾©�$¾�÷ = 1 100 36,75 7,74 144,02 6,26 0,00 -0,05 0,78 0,32

500 49,29 9,51 195,75 7,50 -0,03 -0,01 0,46 0,10

1000 42,79 9,16 182,81 7,05 -0,03 0,00 0,40 0,08

¾©�$¾�÷ = 5 100 35,22 8,13 127,24 6,23 0,00 -0,04 0,77 0,31

500 47,92 9,57 188,50 7,32 -0,03 -0,01 0,44 0,10

1000 42,70 9,20 195,19 6,96 -0,03 0,00 0,40 0,08

¾©�$¾�÷ = 10 100 38,67 9,21 125,79 7,27 0,02 -0,03 0,76 0,29

500 50,96 10,20 194,07 7,82 -0,03 -0,01 0,43 0,09

1000 43,87 9,55 197,48 7,19 -0,03 0,00 0,39 0,08

� = 15%

¾©�$¾�÷ = 1 100 36,80 9,07 120,99 7,02 0,05 -0,02 0,81 0,33

500 48,80 9,64 188,46 7,55 -0,03 -0,01 0,45 0,10

1000 42,69 9,16 194,57 7,03 -0,03 0,00 0,40 0,08

¾©�$¾�÷ = 5 100 37,50 9,42 117,88 7,33 0,04 -0,02 0,78 0,31

500 48,06 9,69 184,07 7,42 -0,03 -0,01 0,44 0,10

1000 42,10 9,17 192,34 6,94 -0,03 0,00 0,39 0,08

¾©�$¾�÷ = 10 100 44,69 10,42 93,41 8,38 0,11 -0,01 0,75 0,27

500 50,24 10,10 188,15 7,68 -0,03 -0,01 0,43 0,09

1000 42,73 9,45 192,65 7,10 -0,03 0,00 0,38 0,08 Tabela 5.6: Experimento Monte Carlo – Estimação dos parâmetros não-lineares e �

Para valores de muito baixos, o modelo STVAR-Tree superestima este

parâmetro, independente do tamanho da amostra e do nível de significância.

Conforme aumentamos o valor de , aumenta a acurácia das estimativas, com

destaque para amostras grandes.

O modelo STVAR-Tree não apresenta problemas em estimar o parâmetro de

locação �. Inicialmente definido como � = 0, em todos os experimentos este foi o

valor médio e mediano, com baixa dispersão, mesmo variando o tamanho de

amostra, o nível de significância e o parâmetro de suavidade .

74

Para estes experimentos, também medimos a dispersão dos dados através da

estimativa da diagonal principal da matriz de covariâncias dos termos de erro ����

foi feita. Vale ressaltar que para � = 0,1%, = 1 e T = 100, o teste LM acusou

linearidade para as 1000 replicações.

ΣÏε � = 0,1% T Média Mediana

Desvio- Padrão DAM

¾©�$¾�÷ = 1 100 x x x x x x x x

500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

1000 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

¾©�$¾�÷ = 5 100 0,85 0,88 0,85 0,92 0,12 0,10 0,11 0,07

500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

1000 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

¾©�$¾�÷ = 10 100 0,87 0,86 0,85 0,82 0,14 0,10 0,11 0,08

500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

1000 0,99 0,99 0,99 0,98 0,06 0,06 0,04 0,04

� = 1%

¾©�$¾�÷ = 1 100 0,88 0,86 0,93 0,86 0,15 0,11 0,11 0,08

500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

1000 0,99 0,99 0,99 0,98 0,06 0,06 0,04 0,04

¾©�$¾�÷ = 5 100 0,89 0,89 0,91 0,87 0,14 0,13 0,09 0,08

500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

1000 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04

¾©�$¾�÷ = 10 100 0,91 0,91 0,92 0,89 0,13 0,13 0,09 0,08

500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

1000 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04

� = 5%

¾©�$¾�÷ = 1 100 0,91 0,89 0,92 0,88 0,14 0,14 0,09 0,08

500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

1000 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04

¾©�$¾�÷ = 5 100 0,92 0,90 0,91 0,89 0,13 0,13 0,09 0,08

500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

1000 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04

¾©�$¾�÷ = 10 100 0,91 0,91 0,91 0,89 0,13 0,13 0,09 0,08

500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

1000 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04

� = 10%

¾©�$¾�÷ = 1 100 0,91 0,90 0,91 0,89 0,13 0,13 0,09 0,09

500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

1000 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04

¾©�$¾�÷ = 5 100 0,91 0,91 0,91 0,90 0,14 0,13 0,09 0,09

500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

1000 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04

75

¾©�$¾�÷ = 10 100 0,91 0,91 0,90 0,90 0,14 0,13 0,09 0,09

500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

1000 0,99 0,99 0,99 0,99 0,06 0,05 0,04 0,04

� = 15%

¾©�$¾�÷ = 1 100 0,91 0,91 0,90 0,90 0,14 0,13 0,09 0,09

500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

1000 0,99 0,99 0,99 0,99 0,05 0,05 0,04 0,04

¾©�$¾�÷ = 5 100 0,91 0,91 0,91 0,90 0,14 0,13 0,09 0,09

500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

1000 0,99 0,99 0,99 0,99 0,05 0,05 0,04 0,04

¾©�$¾�÷ = 10 100 0,92 0,91 0,92 0,90 0,14 0,13 0,09 0,10

500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04

1000 0,99 0,99 0,99 0,99 0,05 0,05 0,03 0,04 Tabela 5.7: Experimento Monte Carlo – Estimação da diagonal da matriz de covariâncias dos erros, ��

Este resultado mostra que o modelo STVAR-Tree consegue capturar toda a

estrutura e ajustar valores próximos aos valores observados.

As figuras a seguir ilustram alguns dos resultados da estimação de ΦÏ ø, i =1,2 dos modelos STVAR-Tree simulados. Por termos muitos dados para analisar,

somente as medianas foram consideradas aqui. Cada conjunto agrupa os modelos

com o mesmo nível de significância do teste LM.

Figura 5.2: Mediana de ΦÏ ø, i = 1,2 do modelo STVAR-Tree simulado, com � = 0,1%

76

Analisando a Figura 5.2, com nível de significância � = 0,1%, percebe-se

que a primeira árvore não foi estimada, justamente pelo fato da não-detecção de

não-linearidade. Mais uma vez, nota-se problemas de estimação para amostras

pequenas. As estimativas são distantes dos valores fixos, mesmo com variação

dos valores do parâmetro de suavidade. Em alguns casos, o modelo estimou

valores maiores que 1. Para amostras médias e grandes, o modelo STVAR-Tree

apresenta melhores resultados, tanto para árvores com divisões suaves quanto para

divisões mais bruscas.

A Figura 5.3 mostra os resultados com nível de significância � = 1%.

Figura 5.3: Mediana de ΦÏ ø, i = 1,2 do modelo STVAR-Tree simulado, com � = 1%

Pode-se repetir aqui as análises feitas para os resultados anteriores. Isto

mostra que com o aumento do nível de significância de � = 0,1% para � = 1%

não houve melhoras nas pequenas amostras. E nas médias e grandes amostras, os

resultados foram praticamente os mesmos.

As Figuras 5.4 e 5.5 ilustram os casos de aumentos do nível de significância

para � = 5% e para � = 10%.

77

Figura 5.4: Mediana de ΦÏ ø, i = 1,2 do modelo STVAR-Tree simulado, com � = 5%

Figura 5.5: Mediana de ΦÏ ø, i = 1,2 do modelo STVAR-Tree simulado, com � = 10%

78

Os resultados para pequenas amostras continuam distantes dos valores fixos

inicialmente, porém, as estimativas não apresentam mais o problema de valores

maiores que 1. Para amostras médias e grandes, os resultados são próximos aos

valores fixos inicialmente.

Por fim, os modelos que consideram nível de significância � = 15%

apresentam estimativas próximas àquelas fixas nas amostras pequenas. E os

comentários dos resultados para as demais amostras são os mesmos das árvores

estimadas anteriormente.

Figura 5.6: Mediana de ΦÏ ø, i = 1,2 do modelo STVAR-Tree simulado, com � = 15%

5.2. Aplicações a dados reais

Nesta seção são apresentadas aplicações para dois conjuntos de dados reais.

A primeira aplicação refere-se à Vazão de Rios, medida pela Energia Natural

Afluente (ENA) dos quatro sub-mercados brasileiros, Sudeste/Centro-Oeste (SE),

Sul (S), Nordeste (NE) e Norte(N). A outra, refere-se ao Preço Spot de energia

elétrica no Brasil, considerando também os quatro sub-mercados brasileiros, com

79

a adição das séries de ENA e Energia Armazenada (EARM), utilizadas como

candidatas a variáveis de transição.

5.2.1. Vazão de Rios

Primeiramente, uma análise exploratória foi feita para conhecimento do

comportamento das séries de ENA. Em seguida, para a modelagem das séries de

Vazão de rios, considerou-se o modelo STVAR-Tree e o modelo PAR(p). Na fase

de estimação dos modelos, foram utilizados 80% das observações e os 20%

restantes foram separados para a previsão fora da amostra (out-of-sample), com 1

passo à frente, utilizada como validação dos modelos ajustados. Estes números

estão mais detalhados na Tabela 5.8.

Período Divisão Início Fim

Observações (univariado)

Observações (multivariado)

In-sample 80% Janeiro/1931 Dezembro/1990 720 2880

Out-of-sample 20% Janeiro/1991 Dezembro/2005 180 720

Total 100% Janeiro/1931 Dezembro/2005 900 3600 Tabela 5.8: Divisão dos dados

A comparação dos modelos foi feita com base em medidas estatísticas no

período out-of-sample, considerando previsões de 1 passo à frente.

5.2.1.1. Análise exploratória

O conjunto de dados de vazão de rios trata de séries mensais, coletadas no

período de Janeiro/1931 a Dezembro/2005, representando 74 anos, no total de 900

observações, para cada um dos 4 submercados. A tabela 5.9 apresenta algumas

estatísticas descritivas das séries.

SE S NE N Média 32.752,88 7.673,40 8.305,83 6.311,03

Mediana 27.175,67 6.316,19 5.884,49 4.183,39 Desvio-padrão 17.158,06 5.384,29 6.068,08 5.278,20

Mínimo 9.115,39 992,44 1.523,22 736,53 Máximo 114.307,50 61.043,77 46.262,92 29.424,81

Assimetria 1,07 2,36 1,59 1,10 Curtose 3,80 15,29 6,45 3,63

Jarque-Bera 197,15 6.501,80 821,40 197,27 P-valor 0,00 0,00 0,00 0,00

Tabela 5.9: Estatísticas Descritivas das séries de ENA

80

O Gráfico 5.1 apresenta a evolução das séries de ENA ao longo dos anos.

Gráfico 5.1: Evolução das séries de ENA

Devido à grande variabilidade dos dados, melhores resultados foram obtidos

ao aplicar o logaritmo natural às séries de ENA. E daqui para frente, somente

estas séries serão consideradas nas análises. A Tabela 5.10 fornece estatísticas

descritivas do logaritmo natural das séries de ENA. As médias das séries

apresentam valores semelhantes às medianas, devido à baixa dispersão medida

pelos desvios-padrão. Nota-se que os valores de mínimo e máximo não são

distantes.

ln(SE) ln(S) ln(NE) lnN) Média 10,27 8,74 8,79 8,38

Mediana 10,21 8,75 8,68 8,34 Desvio-padrão 0,50 0,64 0,68 0,89

Mínimo 9,12 6,90 7,33 6,60 Máximo 11,65 11,02 10,74 10,29

Assimetria 0,16 0,00 0,27 0,03 Curtose 2,19 2,78 2,06 1,74

Jarque-Bera 28,60 1,81 43,80 60,06 P-valor 0,00 0,40 0,00 0,00

Tabela 5.10: Estatísticas Descritivas do logaritmo natural das séries de ENA

Sabemos que se uma variável aleatória segue uma distribuição Normal,

então as medidas de assimetria e curtose são 0 e 3, respectivamente. Para o

logaritmo natural das séries de ENA, as medidas de assimetria são próximas a

zero e as medidas de curtose são menores que 3. Isto nos sugere que as séries não

seguem uma distribuição Normal. Para comprovar estatisticamente, o teste de

Jarque-Bera foi realizado, o qual se baseia nas seguintes hipóteses:

0,00

20000,00

40000,00

60000,00

80000,00

100000,00

120000,00

140000,00

1/1

93

1

12

/19

33

11

/19

36

10

/19

39

9/1

94

2

8/1

94

5

7/1

94

8

6/1

95

1

5/1

95

4

4/1

95

7

3/1

96

0

2/1

96

3

1/1

96

6

12

/19

68

11

/19

71

10

/19

74

9/1

97

7

8/1

98

0

7/1

98

3

6/1

98

6

5/1

98

9

4/1

99

2

3/1

99

5

2/1

99

8

1/2

00

1

12

/20

03

SE S NE N

81

H0: a série é normalmente distribuída

H1: a série não é normalmente distribuída

O teste sugere que a distribuição do logaritmo natural das séries de ENA do

sub-mercado Sul apresenta a normalidade e para os sub-mercados SE, NE e N não

aprenta, devido aos baixíssimos p-valores.

A Tabela 5.10 apresenta as correlações entre as séries de ENA. É possível

notar as correlações elevadas entre os sub-mercados, com exceção do Sul.

ln(SE) ln(S) ln(NE) ln(N) ln(SE) 1 -0,11 0,85 0,78 ln(S) -0,11 1 -0,36 -0,34

ln(NE) 0,85 -0,36 1 0,85 ln(N) 0,78 -0,34 0,85 1

Tabela 5.11: Matriz de Correlação do logaritmo natural das séries de ENA

Visualmente, no Gráfico 5.2, as séries apresentam comportamento de séries

estacionárias, uma vez que os níveis se mantêm constantes. É possível perceber a

ausência de tendência (crescente ou decrescente) nas séries dos quatro sub-

mercados.

Gráfico 5.2: Evolução do logaritmo das séries de ENA

Conforme indicado inicialmente na análise exploratória, com destaque

para o Gráfico 5.2, as séries apresentam comportamento estacionário. Para

comprovar estatisticamente este resultado, o teste ADF (Augmented Dickey-

Fuller) foi realizado, baseado nos valores críticos de McKinnon para a rejeição da

hipótese nula, com as seguintes hipóteses:

0,00

2,00

4,00

6,00

8,00

10,00

12,00

14,00

1/1

93

1

10

/19

33

7/1

93

6

4/1

93

9

1/1

94

2

10

/19

44

7/1

94

7

4/1

95

0

1/1

95

3

10

/19

55

7/1

95

8

4/1

96

1

1/1

96

4

10

/19

66

7/1

96

9

4/1

97

2

1/1

97

5

10

/19

77

7/1

98

0

4/1

98

3

1/1

98

6

10

/19

88

7/1

99

1

4/1

99

4

1/1

99

7

10

/19

99

7/2

00

2

4/2

00

5

ln(SE) ln(S) ln(NE) ln(N)

82

H0: a série tem raiz unitária (não é estacionária)

H1: a série não tem raiz unitária (é estacionária)

Como resultados dos testes, temos a rejeição da hipótese de raiz unitária

para as séries, aos níveis de 1%, 5% e 10%.

ln(SE) ln(S) ln(NE) ln(N)

-20,71 -10,8 -18,98 -23,49

* valores críticos de McKinnon

1%* -3.46

5% -2.87

10% -2.57 Tabela 5.12: Teste Estatístico ADF para o logaritmo das séries de ENA

Portanto, a conclusão que tiramos é que as séries temporais do logaritmo

natural das séries de ENA são 0�0�. Este resultado indica que temos satisfeitas as

condições necessárias para usar o arcabouço da modelagem STVAR-Tree.

5.2.1.2. STVAR-Tree

Para a escolha do modelo STVAR-Tree mais adequado ao logaritmo das

séries de ENA, estimou-se 12 modelos, cada um deles com o aumento de uma

unidade no número de defasagem nas séries das variáveis endógenas dos quatro

sub-sistemas brasileiros, começando na ordem 1 e alcançando o máximo de 12

defasagens.

As candidatas a possíveis variáveis de transição foram as 12 primeiras

defasagens nas séries das variáveis endógenas e o mês. Coloca-se a variável

tempo (mês) no conjunto de variáveis de transição na tentativa de capturar

possíveis efeitos de quebra estrutural nas séries.

O grid de valores dos parâmetros não-lineares foi composto por:

• Suavidade: = �1,5,10�

• Locação: percentis das candidatas a variável de transição, fixos em � = �5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%�.

Com a finalidade de evitar a estimação de árvores complexas e também de

reduzir o tempo computacional, limitou-se árvores com no máximo 8 folhas (nós

83

terminais). Ao analisar diversos resultados de árvores mais complexas, percebeu-

se que estas poderiam até apresentar um ajuste um pouco melhor, porém, com a

limitação, os resultados foram satisfatórios e houve redução de tempo de

processamento e complexidade.

Uma forma de ilustrar essa complexidade seria com a apresentação do

número de nós terminais e de parâmetros dos 12 modelos estimados, já

considerando o procedimento de limitação. Vale lembrar que o número que

identifica o modelo está associado à ordem de defasagem das variáveis

endógenas. A Tabela 5.13 mostra os números.

Modelo

Número de nós

terminais

Número de parâmetros

de suavidade � �

Número de parâmetros locação ���

Número de parâmetros

lineares �Φ�

1 8 7 7 160

2 8 7 7 288

3 8 7 7 416

4 8 7 7 544

5 8 7 7 672

6 8 7 7 800

7 2 1 1 232

8 1 0 0 132

9 1 0 0 148

10 1 0 0 164

11 1 0 0 180

12 1 0 0 196 Tabela 5.13: Número de nós terminais e de parâmetros dos modelos estimados

Conforme aumenta a ordem da defasagem, os modelos apresentam um

decréscimo no número de nós terminais. Isto se deve ao procedimento adotado de

diminuir o nível de significância do teste LM, de acordo com o crescimento da

árvore.

Os modelos de 1 a 6 apresentaram crescimento da árvore e, com a limitação,

esses modelos possuem o número máximo de folhas. O modelo 7 só cresceu da

raiz para as folhas 1 e 2, sendo a arquitetura mais simples de um modelo STVAR-

Tree. Os modelos de 8 a 12 não formaram árvores e, neste caso, modelos lineares

foram estimados. Portanto, estes últimos modelos não serão tratados como

prioritários, já que o objetivo é estimar modelos STVAR-Tree. Caso nenhum dos

anteriores se mostre adequado, pode ser que um desses seja o modelo escolhido.

84

Para cada modelo estimado, verificou-se os valores assumidos pelos

Critérios de Informação Akaike (AIC), Bayesian (BIC), Hannan-Quinn (HQ) e

Final Prediction Error (FPE), expressos por:

(5.4)

(5.5)

(5.6)

(5.7)

onde,

m é a ordem do modelo STVAR-Tree ajustado aos dados;

T é o tamanho da amostra;

K é a dimensão das séries temporais;

ΣÕü�m� é a estimativa da matriz de covariância ruído branco;

O critério FPE auxilia na obtenção de um modelo com melhor capacidade

preditiva. Já os critérios BIC e HQ são os mais consistentes, dentre os quatro. O

objetivo então é selecionar o modelo que minimiza esses valores.

A Tabela 5.14 apresenta os valores dos quatro Critérios de Informação para

os 12 modelos estimados.

Modelo AIC BIC FPE HQ

1 -99,04 -9,58 1,44E-05 -10,21

2 -64,35 -6,10 4,35E-05 -8,37

3 63,48 -0,15 -1,64E-04 -5,07

4 284,42 8,25 -1,07E-05 -0,33

5 598,15 18,79 -1,58E-05 5,53

6 1004,74 31,53 -1,04E-05 12,59

7 -87,34 3,84 -8,75E-06 -2,57

8 -91,43 -1,09 -9,39E-06 -5,26

9 -94,05 1,39 -1,93E-05 -3,86

10 -95,15 4,17 -1,57E-05 -2,30

11 -94,78 7,18 -3,10E-05 -0,64

12 -92,75 10,60 -2,69E-05 1,32 Tabela 5.14: Critérios de Informação

85

O modelo com uma defasagem nas variáveis endógenas apresentou o menor

valor para AIC, BIC e HQ. O modelo com melhor capacidade preditiva, pelo

critério FPE, é o modelo 8. Porém, o modelo final não foi selecionado aqui nesta

etapa. Além dessas, outras estatísticas baseadas nos resíduos foram utilizadas para

seleção do modelo mais adequado, tanto in-sample quanto out-of-sample.

A Tabela 5.15 apresenta as estatísticas Média, Variância, Assimetria e

Curtose dos resíduos no período in-sample. Todos os modelos possuem resíduos

com média nula, variância pequena, assimetria próxima a zero e curtose próxima a

3, com pequenos desvios. Estes resultados mostram o bom ajuste aos dados do

modelo STVAR-Tree.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12

Média

SE 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

S 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

NE 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

N 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

Variância

SE 0,04 0,04 0,03 0,03 0,03 0,02 0,03 0,04 0,04 0,04 0,04 0,04

S 0,23 0,21 0,20 0,19 0,17 0,15 0,22 0,23 0,23 0,22 0,22 0,22

NE 0,04 0,04 0,04 0,03 0,03 0,03 0,04 0,05 0,05 0,04 0,04 0,04

N 0,05 0,04 0,04 0,04 0,03 0,03 0,04 0,05 0,05 0,05 0,04 0,04

Assimetria

SE 0,09 0,10 0,12 0,13 0,20 0,15 0,08 0,04 0,02 0,03 0,04 0,04

S 0,27 0,23 0,22 0,20 0,16 0,12 0,29 0,28 0,29 0,26 0,27 0,27

NE -0,01 0,06 0,09 -0,01 -0,01 -0,05 0,15 0,17 0,16 0,18 0,09 0,10

N 0,63 0,48 0,59 0,46 0,32 0,20 0,45 0,55 0,52 0,50 0,48 0,48

Curtose

SE 3,50 3,27 3,51 3,19 3,24 3,43 3,55 3,07 3,09 3,05 3,23 3,24

S 2,89 2,67 3,10 2,90 2,85 3,18 2,85 2,85 2,89 2,84 2,86 2,86

NE 4,11 4,51 4,50 4,08 4,23 4,32 4,17 3,99 3,96 4,00 3,86 3,92

N 4,87 4,69 4,97 4,73 4,95 3,81 5,15 4,95 5,08 5,06 4,87 4,87

Tabela 5.15: Estatísticas descritivas dos resíduos – in-sample

A Tabela 5.16 apresenta as estatísticas MSE, RMSE, MAE e MAPE, dadas

por:

Mean Squared Error (Erro Quadrático Médio): MSE = �� ∑ ��� − �æ�����:�

Root Mean Squared Error (Raiz do Erro Quadrático Médio): RMSE = ý�� ∑ ��� − �æ�����:�

Mean Absolute Error (Erro Absoluto Médio): MAE = �� ∑ |�� − �æ�|��:�

Mean Absolute Percentual Error (Erro Percentual Absoluto Médio): MAPE = 100 �� ∑ þHx�HæxHx þ��:�

86

Os valores de MSE, RMSE e MAE estão próximos a zero. Além disso, as

medidas de MAPE apontam valores baixos, o que indica que os modelos

estimados controlaram bastante os erros in-sample. É interessante notar que a

dispersão dos valores é mínima, o que não permite destacar um único modelo

como o mais adequado para representar as séries de vazão de rios.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12

MSE

SE 0,04 0,04 0,03 0,03 0,03 0,02 0,03 0,04 0,04 0,04 0,04 0,04

S 0,23 0,21 0,20 0,19 0,17 0,14 0,22 0,23 0,23 0,22 0,22 0,22

NE 0,04 0,04 0,04 0,03 0,03 0,03 0,04 0,05 0,05 0,04 0,04 0,04

N 0,05 0,04 0,04 0,04 0,03 0,03 0,04 0,05 0,05 0,05 0,04 0,04

RMSE

SE 0,19 0,19 0,18 0,17 0,16 0,15 0,19 0,20 0,20 0,19 0,19 0,19

S 0,47 0,45 0,44 0,43 0,41 0,38 0,47 0,48 0,47 0,47 0,47 0,47

NE 0,21 0,19 0,19 0,18 0,18 0,17 0,20 0,21 0,21 0,21 0,21 0,21

N 0,21 0,20 0,19 0,19 0,18 0,17 0,21 0,22 0,22 0,21 0,21 0,21

MAE

SE 0,15 0,15 0,14 0,14 0,13 0,12 0,14 0,16 0,15 0,15 0,15 0,15

S 0,38 0,37 0,35 0,35 0,33 0,30 0,37 0,38 0,38 0,38 0,38 0,38

NE 0,15 0,14 0,14 0,14 0,13 0,12 0,15 0,16 0,16 0,16 0,16 0,16

N 0,16 0,15 0,14 0,15 0,13 0,13 0,16 0,16 0,16 0,16 0,15 0,15

MAPE

SE 1,43 1,42 1,36 1,34 1,25 1,15 1,41 1,51 1,51 1,49 1,46 1,46

S 4,40 4,26 4,06 4,03 3,83 3,47 4,33 4,44 4,41 4,39 4,38 4,38

NE 1,68 1,55 1,51 1,51 1,48 1,39 1,68 1,82 1,82 1,79 1,76 1,76

N 1,90 1,75 1,67 1,74 1,60 1,53 1,87 1,97 1,91 1,88 1,83 1,83

Tabela 5.16: Estatísticas de erro dos modelos – in-sample

Por fim, verificou-se a normalidade dos resíduos dos modelos estimados,

mostrados na Tabela 5.17. Para esta análise, realizou-se tanto a versão

multivariada do teste (descrito a seguir) quanto à versão univariada, dada pelo

teste Jarque-Bera, considerando as hipóteses:

H0: a série é normalmente distribuída

H1: a série não é normalmente distribuída

Sob H0, a estatística de teste (multivariado) é dada por,

√Þ� ��S���� � ~ Ma���

onde,

T é o tamanho da amostra;

87

� � é um vetor que contém a média das discrepâncias;

S� é a estimativa da matriz de covariâncias dos erros;

� é a o número de parâmetros no modelo.

Ao nível de significância �%, rejeita-se H0 para valores de √Þ� ��S���� � maiores que Ma��� ��%�.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12

Teste Normalidade Multivariado

My�÷y� 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

M~��5%� 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81

p-valor 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00

Teste JB

H=0 Normal

H=1 Não-

normal

SE 1 0 1 0 1 1 1 0 0 0 0 0

S 1 1 0 0 0 0 1 1 1 1 1 1

NE 1 1 1 1 1 1 1 1 1 1 1 1

N 1 1 1 1 1 1 1 1 1 1 1 1

p-valor do teste JB

SE 0,02 0,17 0,01 0,22 0,04 0,02 0,01 0,5 0,5 0,5 0,39 0,37

S 0,02 0,01 0,05 0,07 0,14 0,24 0,01 0,01 0,01 0,02 0,02 0,01

NE 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

N 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 Tabela 5.17: Testes de normalidade dos resíduos – in-sample

Conclui-se que os resíduos in-sample de todos os modelos seguem

distribuição Normal multivariada.

Um ponto positivo na estimação é que todos os modelos se ajustaram bem

aos dados. Com a adição da análise dos critérios de informação, seria interessante

selecionar o modelo 1 como o modelo mais adequado por querermos sempre o

modelo mais parcimonioso. Porém, estatísticas descritivas e de erro dos modelos

no período out-of-sample também foram geradas.

Depois de estimados os modelos, 3 tipos de previsão foram realizadas no

período out-of-sample: Combinação de Regimes (RC), Máxima Pertinência (MM)

e Combinação Adaptativa de Regimes (ARC), conforme descritas no Capítulo IV.

Analisar os resíduos gerados por modelos utilizando estes três métodos de

previsão determinará o modelo STVAR-Tree que melhor se adequa aos dados.

Nesta etapa, os modelos de 1 a 12 competem entre si, pois alguns modelos

apresentam bons ajustes out-of-sample e outros não.

A Tabela 5.18 apresenta as estatísticas Média, Variância, Assimetria e

Curtose dos resíduos no período out-of-sample pelo método RC. Nem todos os

88

modelos possuem resíduos com média nula, variância pequena, assimetria

próxima a zero e curtose próxima a 3. Destacam-se com melhores resultados os

modelos 1, 2, 3, 4 e 7.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12

Média

SE -0,14 -0,25 -0,14 0,19 0,14 -8,75 0,09 5,17 5,17 5,17 5,17 5,17

S 0,06 0,16 0,10 -0,42 -2,85 -51,29 0,05 4,50 4,51 4,50 4,50 4,50

NE -0,32 -0,35 0,02 -0,50 1,53 -0,29 0,05 4,28 4,28 4,28 4,28 4,28

N -0,27 -0,25 -0,13 0,68 0,33 9,34 0,13 4,15 4,15 4,15 4,15 4,15

Variância

SE 0,07 0,72 0,32 0,21 3,47 1.498,73 0,04 0,08 0,07 0,07 0,08 0,08

S 0,55 0,95 2,58 1,74 37,35 6.005,73 0,30 0,29 0,29 0,29 0,29 0,29

NE 0,15 0,48 0,35 0,37 6,82 506,98 0,06 0,17 0,17 0,17 0,17 0,17

N 0,14 0,70 0,60 0,27 1,95 1.827,38 0,04 0,25 0,24 0,24 0,24 0,24

Assimetria

SE 0,12 -0,59 -0,93 0,29 1,78 -0,35 0,19 0,21 0,21 0,21 0,22 0,24

S -0,27 0,31 -0,68 -0,31 -1,59 -1,05 -0,13 -0,03 -0,03 -0,02 -0,02 -0,02

NE -0,39 0,25 0,67 -0,06 1,73 -0,03 0,32 0,40 0,40 0,42 0,43 0,43

N 0,27 1,08 -0,38 0,41 0,23 0,17 0,31 0,25 0,26 0,26 0,27 0,27

Curtose

SE 3,36 4,02 7,10 3,32 8,79 7,45 3,23 2,84 2,85 2,81 2,83 2,87

S 2,91 5,33 4,30 5,01 5,57 4,56 2,76 2,41 2,39 2,39 2,40 2,41

NE 4,44 6,26 4,08 3,94 5,82 6,77 3,68 2,49 2,49 2,51 2,52 2,51

N 2,75 7,64 3,77 2,65 5,78 6,22 3,48 1,84 1,84 1,84 1,86 1,87 Tabela 5.18: Estatísticas descritivas dos resíduos (RC) – out-of-sample

Diferentemente do ocorrido no período in-sample, nem todos os valores de

MSE, RMSE, MAE e MAPE do período out-of-sample estão próximos a zero, o

que indica que alguns modelos estimados não conseguiram controlar os erros

neste período. A Tabela 5.19 apresenta as estatísticas, com destaque positivo para

os modelos 1,2 e 7, este último apresentou os menores valores de MAPE.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12

MSE

SE 0,09 0,78 0,34 0,25 3,47 1.566,84 0,05 26,81 26,81 26,83 26,85 26,84

S 0,55 0,97 2,57 1,90 45,26 8.603,08 0,30 20,55 20,60 20,55 20,51 20,52

NE 0,25 0,60 0,35 0,61 9,11 504,22 0,06 18,48 18,46 18,49 18,52 18,52

N 0,21 0,76 0,61 0,73 2,04 1.904,32 0,06 17,46 17,44 17,44 17,46 17,46

RMSE

SE 0,31 0,88 0,58 0,50 1,86 3,96E+01 0,23 5,18 5,18 5,18 5,18 5,18

S 0,74 0,99 1,60 1,38 6,73 9,28E+01 0,54 4,53 4,54 4,53 4,53 4,53

NE 0,50 0,78 0,59 0,78 3,02 2,25E+01 0,25 4,30 4,30 4,30 4,30 4,30

N 0,45 0,87 0,78 0,85 1,43 4,36E+01 0,24 4,18 4,18 4,18 4,18 4,18

MAE SE 0,25 0,62 0,39 0,38 1,13 22,24 0,17 5,17 5,17 5,17 5,17 5,17

89

S 0,59 0,73 1,19 1,03 3,93 59,74 0,44 4,50 4,51 4,50 4,50 4,50

NE 0,40 0,57 0,44 0,62 1,80 12,63 0,18 4,28 4,28 4,28 4,28 4,28

N 0,38 0,63 0,57 0,70 1,00 24,98 0,19 4,15 4,15 4,15 4,15 4,15

MAPE

SE 2,43 6,14 3,78 3,66 10,65 210,13 1,64 50,02 50,02 50,04 50,06 50,05

S 6,61 8,13 13,47 11,67 44,43 666,81 4,89 50,20 50,26 50,21 50,16 50,16

NE 4,83 6,82 5,07 7,11 19,73 141,54 2,10 49,66 49,64 49,67 49,73 49,72

N 4,78 8,01 7,01 8,76 11,42 298,19 2,22 49,80 49,77 49,77 49,81 49,80 Tabela 5.19: Estatísticas de erro dos modelos (RC) – out-of-sample

Por fim, verificou-se a normalidade (nas versões univariada e multivariada

do teste) dos resíduos dos modelos estimados no período out-of-sample,

mostrados na Tabela 5.20.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12

Teste Normalidade Multivariado

My�÷y� 12,94 5,25 1,16 16,98 6,58 5,35 6,60 52,83 52,83 52,83 52,84 52,84

M~��5%� 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81

p-valor 0,00 0,15 0,76 0,00 0,09 0,15 0,09 0,00 0,00 0,00 0,00 0,00

Teste JB

H=0 Normal

H=1 Não-

normal

SE 0 1 1 0 1 1 0 0 0 0 0 0

S 0 1 1 1 1 1 0 0 0 0 0 0

NE 1 1 1 1 1 1 1 1 1 1 1 1

N 0 1 1 1 1 1 0 1 1 1 1 1

p-valor do teste JB

SE 0,45 0,00 0,00 0,14 0,00 0,00 0,43 0,43 0,43 0,39 0,38 0,35

S 0,27 0,00 0,00 0,00 0,00 0,00 0,50 0,21 0,19 0,20 0,20 0,21

NE 0,00 0,00 0,00 0,04 0,00 0,00 0,04 0,04 0,03 0,03 0,03 0,03

N 0,20 0,00 0,02 0,05 0,00 0,00 0,08 0,01 0,01 0,01 0,01 0,01 Tabela 5.20: Testes de normalidade dos resíduos (RC) – out-of-sample

Conclui-se que os resíduos neste período out-of-sample dos modelos 2, 3, 6

e 7 seguem distribuição Normal multivariada, porém, nem todos seguem

distribuição Normal univariada.

Considerando o método de previsão RC, o modelo 7 foi o modelo que

apresentou melhores resultados para os resíduos, em todas as análises. Seleciona-

se, portanto, este modelo como o mais adequado.

Considere, agora, o tipo MM de previsão. A Tabela 5.21 apresenta as

estatísticas Média, Variância, Assimetria e Curtose dos resíduos. Nem todos os

modelos possuem resíduos com média nula, variância pequena, assimetria

próxima a zero e curtose próxima a 3. Destacam-se com melhores resultados os

modelos 7 (com 2 nós terminais), 8 a 12 (não formaram árvores).

90

Modelo

1 2 3 4 5 6 7 8 9 10 11 12

Média

SE 4,91 9,55 -6,40 -18,68 3,29 832,71 -0,18 0,01 0,01 0,01 0,01 0,01

S -1,13 -1,81 25,99 80,23 8,21 795,40 0,59 0,06 0,07 0,07 0,06 0,06

NE 4,60 1,12 -21,89 -9,38 3,67 57,53 0,02 -0,05 -0,05 -0,05 -0,04 -0,04

N 1,50 -0,89 -12,06 -36,53 1,72 -285,57 0,32 -0,03 -0,03 -0,03 -0,03 -0,03

Variância

SE 4,09 529,19 338,47 2,53E+03 0,09 2,03E+06 1,21 0,04 0,04 0,04 0,04 0,04

S 1,00 17,23 2.092,15 1,99E+04 0,50 2,08E+06 7,75 0,28 0,29 0,29 0,29 0,29

NE 7,19 15,72 3.913,94 651,74 0,12 2,21E+04 0,07 0,06 0,06 0,06 0,06 0,06

N 14,14 62,38 587,97 1,03E+04 0,06 2,37E+05 1,65 0,04 0,04 0,04 0,04 0,04

Assimetria

SE -0,60 0,60 -1,74 -1,45 0,53 -1,21 0,36 -0,36 -0,37 -0,30 -0,26 -0,22

S -0,53 -0,79 1,80 1,43 0,05 -1,22 -0,34 -0,09 -0,10 -0,10 -0,11 -0,11

NE -0,56 -1,79 -1,88 -1,34 0,04 -1,33 -0,01 0,05 0,05 0,05 0,06 0,07

N -0,61 -1,51 -1,83 -1,41 0,23 1,26 -0,36 0,41 0,42 0,36 0,47 0,46

Curtose

SE 1,45 6,06 4,26 3,16 3,23 2,48 1,28 3,88 3,95 3,99 4,13 4,23

S 3,01 5,57 4,37 3,13 2,67 2,50 1,27 2,49 2,45 2,51 2,54 2,53

NE 1,42 7,05 4,53 3,02 3,07 2,94 3,11 3,49 3,52 3,43 3,55 3,57

N 1,42 4,98 4,44 3,12 3,34 2,65 1,24 3,80 3,72 3,69 4,24 4,26 Tabela 5.21: Estatísticas descritivas dos resíduos – out-of-sample

A Tabela 5.22 apresenta as estatísticas MSE, RMSE, MAE e MAPE do

período out-of-sample do tipo MM de previsão.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12

MSE

SE 28,17 617,48 377,53 2.869,04 10,91 2,71E+06 1,23 0,04 0,04 0,04 0,04 0,04

S 2,26 20,40 2.756,13 26.224,08 67,94 2,70E+06 8,05 0,28 0,30 0,29 0,29 0,29

NE 28,30 16,87 4.371,11 735,98 13,62 25.237,59 0,07 0,07 0,07 0,07 0,06 0,06

N 16,30 62,82 730,20 11.605,10 3,00 3,17E+05 1,74 0,04 0,04 0,04 0,04 0,04

RMSE

SE 5,31 24,85 19,43 53,56 3,30 1.646,24 1,11 0,19 0,19 0,19 0,19 0,20

S 1,50 4,52 52,50 161,94 8,24 1.644,18 2,84 0,53 0,54 0,54 0,54 0,54

NE 5,32 4,11 66,11 27,13 3,69 158,86 0,27 0,26 0,26 0,26 0,25 0,25

N 4,04 7,93 27,02 107,73 1,73 563,46 1,32 0,21 0,21 0,20 0,21 0,21

MAE

SE 4,91 13,81 10,74 29,04 3,29 1.645,13 1,09 0,14 0,14 0,14 0,15 0,15

S 1,20 2,59 26,53 87,20 8,21 1.641,21 2,78 0,44 0,45 0,44 0,44 0,44

NE 4,60 3,46 30,39 15,70 3,67 154,04 0,21 0,20 0,20 0,20 0,19 0,19

N 4,01 4,78 13,27 58,92 1,72 560,25 1,30 0,16 0,16 0,15 0,15 0,15

MAPE

SE 47,03 137,76 106,46 290,63 31,79 15.947,86 10,54 1,38 1,36 1,38 1,40 1,42

S 13,79 29,05 294,33 968,03 91,98 18.451,97 31,19 4,88 4,98 4,92 4,92 4,92

NE 52,23 40,58 372,37 193,00 42,88 1.794,43 2,48 2,27 2,27 2,26 2,21 2,22

N 48,29 62,67 170,84 768,72 20,84 6.815,21 15,82 1,90 1,88 1,83 1,80 1,82 Tabela 5.22: Estatísticas de erro dos modelos (MM) – out-of-sample

91

Os resultados indicam que os modelos que formaram árvores (1 a 7) não

conseguiram controlar os erros neste período. Os demais modelos, aqueles que

não formaram árvores, apresentaram os menores valores em todas as estatísticas.

Verificou-se a normalidade (nas versões univariada e multivariada do teste) dos

resíduos dos modelos lineares (8 a 12) no período out-of-sample, mostrados na

Tabela 5.23. Para os modelos não-lineares, somente os modelos 2 e 7 não

rejeitaram a hipótese de normalidade na versão multivariada. Dentre esses

modelos destacados, no teste de Jarque-Bera, os resíduos de algumas variáveis dos

modelos lineares (8 a 12) e do modelo não-linear 7 seguem distribuição Normal

univariada.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12

Teste Normalidade Multivariado

30,68 5,26 8,84 8,03 52,77 11,71 1,75 0,96 1,17 1,06 0,77 0,80

7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 p-

valor 0,00 0,15 0,03 0,05 0,00 0,01 0,63 0,81 0,76 0,79 0,86 0,85

Teste JB

H=0 Normal

H=1 Não-

normal

SE 1 1 1 1 1 1 1 1 1 1 1 1

S 1 1 1 1 0 1 1 0 0 0 0 0

NE 1 1 1 1 0 1 0 0 0 0 0 0

N 1 1 1 1 0 1 1 1 1 1 1 1

p-valor do teste JB

SE 0,00 0,00 0,00 0,00 0,02 0,00 0,00 0,02 0,01 0,02 0,01 0,01

S 0,02 0,00 0,00 0,00 0,50 0,00 0,00 0,27 0,22 0,30 0,32 0,32

NE 0,00 0,00 0,00 0,00 0,50 0,00 0,50 0,34 0,29 0,44 0,25 0,22

N 0,00 0,00 0,00 0,00 0,23 0,00 0,00 0,02 0,02 0,03 0,00 0,00 Tabela 5.23: Testes de normalidade dos resíduos (MM) – out-of-sample

Por último, mas não menos importante, o tipo ARC de previsão. A Tabela

5.24 apresenta as estatísticas básicas Média, Variância, Assimetria e Curtose dos

resíduos. Nem todos os modelos possuem resíduos com média nula, variância

pequena, assimetria próxima a zero e curtose próxima a 3. Destacam-se com

melhores resultados os modelos 8 a 12 (não formaram árvores). Dentre os que

formaram árvores, o modelo 7 apresenta as melhores estatísticas.

92

Modelo

1 2 3 4 5 6 7 8 9 10 11 12

Média

SE -6,94 1,59 0,49 0,94 0,10 0,86 -0,05 0,00 0,00 0,00 0,00 0,00

S -130,14 2,55 0,83 1,09 1,20 3,05 0,15 -0,01 0,02 0,02 0,02 0,03

NE -60,10 1,14 0,47 0,72 -0,16 0,25 -0,06 0,01 0,00 0,00 0,01 0,01

N -38,74 2,72 0,78 0,78 -1,40 -0,52 -0,13 0,02 0,00 0,01 0,01 0,01

Variância

SE 1,97E+05 16,24 5,59 0,97 1,42 1,17 0,25 0,11 0,10 0,09 0,08 0,08

S 3,27E+06 42,11 22,31 5,96 6,83 7,67 0,77 0,60 0,57 0,50 0,50 0,48

NE 1,04E+06 24,20 5,96 0,81 2,68 1,83 0,41 0,20 0,18 0,17 0,16 0,14

N 2,73E+05 13,57 4,73 0,77 2,83 2,41 0,34 0,12 0,11 0,09 0,09 0,08

Assimetria

SE 1,92 -1,43 0,04 0,28 -0,57 0,85 0,53 0,38 0,37 0,34 0,37 0,22

S -6,27 0,39 0,40 0,45 -0,13 0,39 0,02 -0,15 0,10 -0,05 -0,03 -0,06

NE 0,70 -2,14 -0,43 0,24 0,48 0,44 1,00 0,05 0,01 0,20 0,32 0,19

N -1,76 -0,13 0,26 0,79 -0,14 -0,20 0,59 -0,03 0,03 0,26 0,37 0,23

Curtose

SE 23,64 9,06 4,19 4,03 2,80 8,16 8,29 2,83 3,20 3,23 3,44 3,15

S 56,61 4,46 3,67 3,42 4,31 2,41 3,98 3,38 2,88 2,60 2,75 2,89

NE 25,66 17,75 4,84 2,74 3,50 8,15 7,67 3,49 3,88 3,34 3,61 3,73

N 23,62 8,25 4,37 3,68 2,74 4,14 6,55 2,94 3,46 3,38 3,56 3,55 Tabela 5.24: Estatísticas descritivas dos resíduos (ARC) – out-of-sample

Com exceção do modelo 7, as estatísticas MSE, RMSE, MAE e MAPE do

tipo ARC de previsão indicam que os modelos que formaram árvores (1 a 7), não

controlaram os erros neste período. A Tabela 5.25 apresenta os resultados.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12

MSE

SE 1,96E+05 18,68 5,79 1,85 1,42 1,90 0,25 0,11 0,10 0,09 0,08 0,08

S 3,26E+06 48,35 22,87 7,11 8,22 16,92 0,79 0,60 0,57 0,50 0,49 0,48

NE 1,04E+06 25,35 6,15 1,33 2,69 1,89 0,41 0,20 0,18 0,17 0,15 0,14

N 2,73E+05 20,87 5,32 1,37 4,76 2,67 0,35 0,12 0,11 0,09 0,09 0,08

RMSE

SE 442,38 4,32 2,41 1,36 1,19 1,38 0,50 0,33 0,32 0,30 0,29 0,27

S 1.806,24 6,95 4,78 2,67 2,87 4,11 0,89 0,77 0,75 0,70 0,70 0,69

NE 1.019,39 5,04 2,48 1,15 1,64 1,37 0,64 0,44 0,43 0,41 0,39 0,38

N 522,59 4,57 2,31 1,17 2,18 1,63 0,59 0,34 0,34 0,30 0,30 0,29

MAE

SE 176,83 3,28 1,69 1,07 0,99 1,05 0,34 0,27 0,26 0,24 0,22 0,21

S 545,09 5,12 3,45 2,03 2,28 3,26 0,68 0,62 0,61 0,58 0,58 0,56

NE 362,75 3,33 1,84 0,91 1,27 1,01 0,45 0,34 0,32 0,32 0,30 0,29

N 213,06 3,53 1,70 0,89 1,73 1,20 0,43 0,27 0,26 0,23 0,23 0,22

MAPE

SE 1.674,98 31,63 16,66 10,42 9,63 10,14 3,29 2,57 2,46 2,27 2,16 2,07

S 6.172,75 57,54 38,43 22,45 25,38 36,45 7,58 6,90 6,81 6,49 6,41 6,22

NE 4.166,97 38,77 21,81 10,78 14,90 11,79 5,23 3,96 3,79 3,77 3,54 3,40

N 2.530,71 41,57 21,02 11,06 21,50 14,66 5,28 3,29 3,14 2,80 2,77 2,68 Tabela 5.25: Estatísticas de erro dos modelos (ARC) – out-of-sample

93

Os demais modelos, aqueles que não formaram árvores, apresentaram os

menores valores em todas as estatísticas.

Verificou-se a normalidade (nas versões univariada e multivariada do teste)

dos resíduos dos modelos lineares (8 a 12) no período out-of-sample, mostrados

na Tabela 5.26. Para os modelos não-lineares, somente os modelos 1, 2, 5 e 7 não

rejeitaram a hipótese de normalidade na versão multivariada. Dentre esses

modelos, os resíduos não seguem distribuição Normal univariada, pelo teste de

Jarque-Bera. Já os lineares (8 a 12) seguem normalidade tanto na versão

multivariada quanto na univariada, em todas as variáveis.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12

Teste Normalidade Multivariado

0,19 8,70 2,87 19,09 7,74 13,79 1,24 0,04 0,01 0,02 0,03 0,04

7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81

p-valor 0,98 0,03 0,41 0,00 0,05 0,00 0,74 1,00 1,00 1,00 1,00 1,00

Teste JB

H=0 Normal

H=1 Não-

normal

SE 1 1 1 1 1 1 1 0 0 0 0 0

S 1 1 1 1 1 1 1 0 0 0 0 0

NE 1 1 1 0 1 1 1 0 0 0 0 0

N 1 1 1 1 0 1 1 0 0 0 1 0

p-valor do teste JB

SE 0,00 0,00 0,02 0,02 0,02 0,00 0,00 0,09 0,10 0,13 0,06 0,41

S 0,00 0,00 0,03 0,03 0,01 0,04 0,04 0,39 0,50 0,50 0,50 0,50

NE 0,00 0,00 0,00 0,31 0,03 0,00 0,00 0,36 0,05 0,34 0,05 0,07

N 0,00 0,00 0,01 0,00 0,50 0,01 0,00 0,50 0,43 0,17 0,04 0,12 Tabela 5.26: Testes de normalidade dos resíduos (ARC) – out-of-sample

Depois de analisar todos esses resultado, desde o número de parâmetros em

cada modelo, os critérios de informação, as estatísticas dos resíduos in-sample e –

out-of-sample dos três tipos de previsão, o modelo que apresentou melhor ajuste

aos dados de vazão de rios foi o modelo 7. Este modelo foi, então, o selecionado

para representar o STVAR-Tree no confronto com o modelo PAR(p).

A Figura 5.7 ilustra a árvore estimada pelo modelo 7, identificando o valor

estimado pelo parâmetro de suavidade � � e de locação ���, além da variável de

transição �����. A interpretação da árvore é feita da seguinte maneira: para

estimar as séries de vazão de rios, medidas aqui pela Energia Natural Afluente

(ENA), o modelo STVAR-Tree mais adequado sugere uma árvore com dois

regimes, com uma transição suave � æ = 1,32� determinada pela defasagem 11 do

94

sub-mercado Sul. O ponto de corte desta variável de transição ocorre no valor �� = 8,7�.

Figura 5.7: Árvore estimada do modelo 7

Portanto, para ENA do Sul com valores menores que 8,7, as séries de ENA

dos quatro sub-mercados são estimadas pelo Regime 1, com 79% de pertinência.

Para ENA do Sul com valores maiores ou iguais a 8,7, as séries de ENA dos

quatro sub-mercados são estimadas pelo Regime 2, com 21% de pertinência.

Os parâmetros lineares estimados, para cada regime, estão a seguir.

Regime 1

��-�N-N ��

= �4,450,653,023,36�+ �0,71 0,23 0,63 0,400 0,15 −0,25 −0,140,050,10 −0,25−0,02 0 0,010,11 0,19 � ��-�N-N ����

+ �−0,06 0,26 −0,10 −0,310,01 −0,18 0,05 0,13−0,05−0,03 0,320,55 −0,21 −0,13−0,23 −0,17� ��-�N-N �

���

+ � 0 −0,08 0,10 0,120,04 0,09 0,02 0−0,1−0,01 0,03−0,07 −0,01 −0,050,01 0,07 � ��-�N-N ���~

+ �−0,07 −0,03 −0,04 −0,060,04 −0,03 0,02 0,010,04−0,21 0,060,07 0,47 −0,22−0,16 −0,09� ��-�N-N �

���

+ � 0,11 0,36 −0,05 0,12−0,08 −0,76 0,37 0,250,16−0,06 0,29−0,13 0,05 0,05−0,12 −0,20� ��-�N-N �

���+ � 0,01 0,14 0,03 −0,030,03 −0,19 0,03 0,860,10−0,16 −0170,29 0,16 0,03−0,23 −0,22� �

�-�N-N ����

+ � 0,04 −0,03 −0,03 0,01−0,29 0,15 −0,20 −0,20−0,100,24 0,02−0,26 −0,11 −0,130,33 0,28 � ��-�N-N ���

Regime 2

��-�N-N ��

= �−1,172,880,041,14 �+ � 0,75 −0,26 0,53 0,130 −1,04 −0,14 0,070,22−0,21 0,850,17 −0,10 −0,01−0,34 −0,33� ��-�N-N �

���+ �0,08 −0,50 −0,05 −0,080,12 0,48 0,01 0,040,090,10 0,090,71 0,13 0,290,04 0,09 � ��-�N-N �

���

+ �−0,04 0,10 −0,04 −0,03−0,05 −0,11 −0,03 −0,040,07−0,03 −0,010,04 0,08 0,06−0,03 −0,05� ��-�N-N �

��~+ � 0,09 0,01 0,04 0,10−0,07 0,14 −0,07 −0,16−0,190,28 −0,100,59 0,72 0,270,05 −0,18 � ��-�N-N �

���

+ �−0,09 −0,86 0,37 0,090,18 0,69 −0,06 0,11−0,17−0,04 −0,720,41 −0,09 −0,060,05 −0,05 � ��-�N-N ����

+ �−0,01 −0,37 0,02 −0,210,04 0,56 −0,11 0,97−0,07−0,01 −0,28−0,17 −0,10 −0,240,06 0,08 � ��-�N-N ����

+ �−0,04 −0,05 −0,02 −0,050,11 0,22 0,07 0,010,11−0,13 0,26−0,15 0,15 0,08−0,18 −0,10� ��-�N-N �

��

95

5.2.1.3. PAR

Quatro modelos PAR(p) foram estimados, um para cada sub-mercado. A

estratégia de seleção de modelos seguida, inicialmente, considerou a mesma

ordem p para todos os meses. Porém, os resultados foram muito ruins. Os resíduos

não tinham boas propriedades e os erros de previsão eram elevados. Como a

modelagem PAR(p) permite que se escolham ordens diferentes para os períodos,

realizou-se este procedimento e os resultados melhoraram, permitindo que o

modelo mais adequado fosse selecionado. O critério utilizado para selecionar a

ordem de cada um dos períodos foi aquele que reduz o valor do BIC.

As Figuras 5.8 a 5.11 a seguir ilustram a Função de Auto Correlação (FAC)

Periódica e a Função de Auto Correlação Parcial (FACP) Periódica, de cada

subsistema. Estas funções auxiliam na seleção da ordem dos modelos.

Figura 5.8: FAC e FACP do logaritmo de ENA

Sudeste

Figura 5.9: FAC e FACP do logaritmo de ENA Sul

Figura 5.10: FAC e FACP do logaritmo de ENA Nordeste

Figura 5.11: FAC e FACP do logaritmo de ENA

Norte

Nem sempre, os resultados obtidos pura e simplesmente pelo critério BIC

foram satisfatórios. Combinando, então, os resultados pelo critério BIC e em

96

conjunto com FAC e FACP Periódicas selecionou-se os modelos, disponíveis na

Tabela 5.27.

Mês

2 3 4 5 6 7 8 9 10 11 12

SE 1 1 1 1 1 3 1 1 1 1 1 S 1 1 2 1 1 1 1 1 1 1 1 NE 2 1 1 1 3 1 1 1 1 2 1 N 4 1 1 1 5 3 4 5 1 1 1

Tabela 5.27: Modelos PAR(p) para cada um dos sub-mercados

Os parâmetros destes modelos foram estimados e constam na Tabela 5.28.

Os valores nulos significam que a ordem era menor que a disponível na tabela.

Mês

1 2 3 4 5 6 7 8 9 10 11 12

SE

lag 1 0,68 0,70 0,69 0,69 0,75 0,94 0,68 0,85 1,12 0,67 0,66 0,69

lag 2 0 0 0 0 0 0 -0,02 0 0 0 0 0

lag 3 0 0 0 0 0 0 0,25 0 0 0 0 0

S lag 1 0,45 0,64 0,54 0,29 0,95 0,55 0,68 0,65 0,53 0,47 0,61 0,75

lag 2 0 0 0 0,38 0 0 0 0 0 0 0 0

NE

lag 1 0,44 1,07 0,79 0,78 0,8 0,56 0,81 0,93 0,91 0,90 0,80 0,71

lag 2 0 -0,34 0 0 0 0,01 0 0 0 0 0 0

lag 3 0 0 0 0 0 0,18 0 0 0 0 0 0

N

lag 1 0,63 0,85 0,66 0,68 0,86 0,77 1,05 1,25 1,47 0,97 0,85 0,8

lag 2 0 -0,31 0 0 0 0 -0,45 -0,49 -1,09 0 0 0

lag 3 0 0 0 0 0 -0,02 0,23 0,11 0,29 0 0 0

lag 4 0 0,35 0 0 0 0,10 0 0,15 -0,10 0 0 0

lag 5 0 0 0 0 0 0,11 0 0 0,32 0 0 0 Tabela 5.28: Estimativa dos parâmetros dos modelos PAR(p)

A Tabela 5.29 apresenta as estatísticas Média, Variância, Assimetria e

Curtose dos resíduos nos períodos in-sample e out-of-sample. Estes resultados

mostram um ajuste razoável aos dados.

In-sample Out-of-sample

Média Variância Assimetria Curtose Média Variância Assimetria Curtose

SE -0,01 2,41 -0,92 2,63 0,01 2,39 -0,92 2,59

S -0,02 1,58 -0,65 3,31 0,06 1,76 -0,48 3,24

NE -0,05 1,71 1,48 4,99 -0,11 1,65 1,55 5,26

N -0,01 1,96 0,22 1,86 -0,02 2,01 0,2 1,86 Tabela 5.29: Estatísticas Descritivas das séries de resíduos

97

5.2.1.4. Comparação dos modelos STVAR-Tree e PAR

Estatisticamente, os modelos STVAR-Tree e PAR(p) foram comparados

pelas medidas de MAPE no período out-of-sample, apresentadas na Tabela 5.30.

Conclui-se que a modelagem STVAR-Tree teve um ajuste muito superior em

comparação com a modelagem PAR. Duas das três estratégias de previsão do

STVAR-Tree, RC e ARC, apresentaram MAPE muito menores.

STVAR-Tree RC STVAR-Tree MM STVAR-Tree ARC PAR

Out-of-sample

SE 1,64 10,54 3,29 13,02

S 4,89 31,19 7,58 11,73

NE 2,10 2,48 5,23 10,96

N 2,22 15,82 5,28 14,68 Tabela 5.30: Comparação dos modelos STVAR-Tree e PAR(p)

Este resultado mostra que o modelo não-linear multivariado denominado

STVAR-Tree é capaz de ser aplicado a problemas reais e que pode competir com

modelos já existentes. Neste caso, o modelo STVAR-Tree ganhou com uma

vantagem bastante expressiva.

5.2.2. Preço spot de energia elétrica

Primeiramente, uma análise exploratória foi feita para conhecimento do

comportamento das séries de Preço spot de energia elétrica do mercado brasileiro,

no patamar médio de carga, medidas em (R$/MWh). Em seguida, para a

modelagem das séries de Preço spot, considerou-se o modelo STVAR-Tree e o

modelo PAR(p). A estratégia de separar 80% das observações na fase de

estimação e os 20% restantes para a previsão out-of-sample foi utilizada, e estes

números estão mais detalhados na Tabela 5.31.

Período Divisão

(%) Observações (univariada)

Observações (multivariada)

In-sample 80%

298 1192

Out-of-sample 20%

74 296

Total 100%

372 1488

Tabela 5.31: Divisão dos dados

98

A comparação dos modelos foi feita com base em medidas estatísticas no

período out-of-sample, considerando previsões de 1 passo à frente.

5.2.2.1. Análise exploratória

Trata-se de séries semanais, coletadas no período de maio/2002 a

junho/2009, no total de 372 semanas de observações.

SE S NE N Média 55,86 56,61 51,26 51,38

Mediana 28,13 27,26 18,59 18,59 Desvio-padrão 71,41 71,79 76,89 72,12

Mínimo 4,00 4,00 4,00 4,00 Máximo 569,59 569,59 569,59 569,59

Assimetria 3,90 3,83 3,71 3,95 Curtose 25,03 24,37 20,77 25,00

Tabela 5.32: Estatísticas Descritivas das séries de Preço spot

O Gráfico 5.3 apresenta a evolução das séries de Preço spot ao longo das

semanas. Note que a série histórica apresenta elevada volatilidade e diversas

quebras estruturais. Vários são os motivos para explicar esse comportamento, a

maioria em razão de efeitos conjunturais ou estruturais da própria formação do

preço spot.

Gráfico 5.3: Evolução das séries de Preço spot

Como o preço não é, de fato, de mercado, e sim fornecido por modelos

computacionais, grandes variações semanais podem ocorrer, por exemplo, quando

0,00

100,00

200,00

300,00

400,00

500,00

600,00

04

/05

/02

-10

/05

/02

03

/08

/02

-09

/08

/02

02

/11

/02

-08

/11

/02

01

/02

/03

-07

/02

/03

03

/05

/03

-09

/05

/03

02

/08

/03

-08

/08

/03

01

/11

/03

-07

/11

/03

31

/01

/04

-06

/02

/04

01

/05

/04

-07

/05

/04

31

/07

/04

-06

/08

/04

30

/10

/04

-05

/11

/04

29

/01

/05

-04

/02

/05

30

/04

/05

-06

/05

/05

30

/07

/05

-05

/08

/05

29

/10

/05

-04

/11

/05

28

/01

/06

-03

/02

/06

29

/04

/06

-05

/05

/06

29

/07

/06

-04

/08

/06

28

/10

/06

-03

/11

/06

27

/01

/07

-02

/02

/07

28

/04

/07

-04

/05

/07

28

/07

/07

-03

/08

/07

27

/10

/07

-02

/11

/07

26

/01

/08

-01

/02

/08

26

/04

/08

-02

/05

/08

26

/07

/08

-01

/08

/08

25

/10

/08

-31

/10

/08

24

/01

/09

-30

/01

/09

25

/04

/09

-01

/05

/09

Preço_SE Preço_S Preço_NE Preço_N

99

parâmetros ou versões desses modelos matemáticos são alterados ou lançados, ou

até mesmo a adoção de valores não advindos dos modelos. Outro problema é

quando os próprios modelos matemáticos são abandonados. Um exemplo disso

ocorreu no período do racionamento de 2001/2002 quando alguns valores do PLD

semanal foram regulados pelo governo. Além disso, descontinuidades no Plano de

Expansão e alterações nos planos de reparo e manutenção de unidades térmicas,

limites na transmissão de energia entre sub-mercados, entre outros motivos, têm

feito com que a volatilidade das séries de preço seja elevada.

Devido à grande variabilidade dos dados, melhores resultados foram obtidos

ao aplicar o logaritmo natural às séries de Preço spot. E daqui para frente, somente

estas séries serão consideradas nas análises. A Tabela 5.33 fornece estatísticas

descritivas do logaritmo natural das séries de Preço spot. As médias das séries

apresentam valores semelhantes às medianas, com alguns desvios devido à baixa

dispersão medida pelos desvios-padrão. Nota-se que os valores de mínimo e

máximo não são distantes (entre 1,39 e 6,35).

ln(SE) ln(S) ln(NE) lnN) Média 3,48 3,49 3,30 3,34

Mediana 3,37 3,31 2,92 2,92 Desvio-padrão 1,04 1,07 1,07 1,06

Mínimo 1,39 1,39 1,39 1,39 Máximo 6,35 6,35 6,35 6,35

Assimetria 0,08 0,02 0,47 0,34 Curtose 2,63 2,62 2,91 2,67

Tabela 5.33: Estatísticas Descritivas do logaritmo natural das séries de Preço spot

A Tabela 5.34 apresenta as correlações entre as séries de Preço spot. É

possível notar as correlações elevadas entre todos os sub-mercados.

ln(SE) ln(S) ln(NE) ln(N) ln(SE) 1 0,96 0,89 0,94 ln(S) 0,96 1 0,86 0,89

ln(NE) 0,89 0,86 1 0,89 ln(N) 0,94 0,89 0,89 1

Tabela 5.34: Matriz de Correlação do logaritmo natural das séries de Preço spot

Visualmente, no Gráfico 5.4, é possível perceber a presença de tendência

crescente no início das séries dos quatro sub-mercados, porém na maior parte do

período analisado as séries apresentam comportamento de séries estacionárias,

uma vez que os níveis se mantêm constantes.

100

Gráfico 5.4: Evolução do logaritmo natural das séries de Preço spot

Para comprovar estatisticamente este resultado, o teste ADF (Augmented

Dickey-Fuller) foi realizado, baseado nos valores críticos de McKinnon para a

rejeição da hipótese nula, com as seguintes hipóteses:

H0: a série tem raiz unitária (não é estacionária)

H1: a série não tem raiz unitária (é estacionária)

Como resultados dos testes, temos a rejeição da hipótese de raiz unitária

para as séries, aos níveis de 1%, 5% e 10%.

ln(SE) ln(S) ln(NE) ln(N)

-2,19 -2,52 -2,76 -2,78 * valores críticos de McKinnon

1%* -3,46

5% -2,87

10% -2,57 Tabela 5.35: Teste Estatístico ADF

Portanto, a conclusão que tiramos é que o logaritmo natural das séries de

Preço spot não são estatisticamente estacionárias, considerando diferentes níveis

de significância. Neste caso, o teste de co-integração deve ser realizado, pois

somente na ausência de co-integração que o modelo STVAR-Tree deve ser

utilizado.

H0: as séries não são co-integradas

H1: as séries são co-integradas

0,00

1,00

2,00

3,00

4,00

5,00

6,00

7,00

04

/05

/02

-10

/05

/02

27

/07

/02

-02

/08

/02

19

/10

/02

-25

/10

/02

11

/01

/03

-17

/01

/03

05

/04

/03

-11

/04

/03

28

/06

/03

-04

/07

/03

20

/09

/03

-26

/09

/03

13

/12

/03

-19

/12

/03

06

/03

/04

-12

/03

/04

29

/05

/04

-04

/06

/04

21

/08

/04

-27

/08

/04

13

/11

/04

-19

/11

/04

05

/02

/05

-11

/02

/05

30

/04

/05

-06

/05

/05

23

/07

/05

-29

/07

/05

15

/10

/05

-21

/10

/05

07

/01

/06

-13

/01

/06

01

/04

/06

-07

/04

/06

24

/06

/06

-30

/06

/06

16

/09

/06

-22

/09

/06

09

/12

/06

-15

/12

/06

03

/03

/07

-09

/03

/07

26

/05

/07

-01

/06

/07

18

/08

/07

-24

/08

/07

10

/11

/07

-16

/11

/07

02

/02

/08

-08

/02

/08

26

/04

/08

-02

/05

/08

19

/07

/08

-25

/07

/08

11

/10

/08

-17

/10

/08

03

/01

/09

-09

/01

/09

28

/03

/09

-03

/04

/09

ln(SE) ln(S) ln(NE) ln(N)

101

Estatística Likelihood

Ratio Valor crítico

5%

Equações de Co-integração

138,95 47,21 Nenhuma(*)

74,71 29,68 Uma(*)

38,98 15,41 Duas(*)

6,42 3,76 Três(*)

Tabela 5.36: Teste Co-integração de Johansen

Pela estatística de teste de Razão de Verossimilhança, o teste de co-

integração rejeita a hipótese nos levando a conclusão que as séries são co-

integradas. Entretanto, ao definir o número de equações co-integradas, o

procedimento de Johansen sugere 4 equações, o que indica que temos uma matriz

de posto completo, nos indicando, assim, a ausência de co-integração entre as

séries testadas. Estritamente falando, as séries de Preço spot no período em

questão são integradas de ordem zero, I(0), portanto temos satisfeitas as condições

necessárias para usar o arcabouço da modelagem STVAR-Tree.

5.2.2.2. STVAR-Tree

Para a escolha do modelo STVAR-Tree mais adequado ao logaritmo das

séries de Preço spot, foi utilizado o mesmo procedimento adotado na modelagem

de Vazão de rios. Estimou-se 13 modelos, cada um deles com o aumento de uma

unidade no número de defasagem nas séries das variáveis endógenas dos quatro

sub-sistemas brasileiros, começando na ordem 1 e alcançando o máximo de 13

defasagens (o equivalente a 3 meses).

As candidatas a possíveis variáveis de transição foram as 13 primeiras

defasagens nas séries das variáveis endógenas, as séries Energia Natural Afluente

(ENA, medidas em %MLT - Média de Longo Termo) e as séries de Energia

Armazenada (EARM, medidas em % do armazenamento máximo).

O grid de valores dos parâmetros não-lineares foi composto por:

• Suavidade: = �1,5,10�

• Locação: percentis das candidatas a variável de transição, fixos em � = �5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%�.

Com a finalidade de evitar a estimação de árvores complexas e também de

reduzir o tempo computacional, limitou-se árvores com no máximo 8 folhas (nós

terminais).

102

Uma forma de ilustrar essa complexidade seria com a apresentação do

número de nós terminais e de parâmetros dos 13 modelos estimados, já

considerando o procedimento de limitação. Vale lembrar que o número que

identifica o modelo está associado à ordem de defasagem das variáveis

endógenas. A Tabela 5.37 mostra os números.

Modelo

Número de nós

terminais

Número de parâmetros

de suavidade � �

Número de parâmetros locação ���

Número de parâmetros

lineares �Φ�

1 8 7 7 160

2 8 7 7 288

3 8 7 7 416

4 8 7 7 544

5 8 7 7 672

6 6 5 5 600

7 5 4 4 580

8 4 3 3 528

9 4 3 3 592

10 3 2 2 492

11 3 2 2 540

12 2 1 1 392

13 2 1 1 424 Tabela 5.37: Número de nós terminais e de parâmetros dos modelos estimados

Todos os modelos apresentaram crescimento da árvore e, com a limitação,

os modelos 1 a 5 possuem o número máximo de folhas. A partir dessa defasagem,

os modelos apresentam um decréscimo no número de nós terminais. Isto se deve

ao procedimento adotado de diminuir o nível de significância do teste, de acordo

com o crescimento da árvore.

Para cada modelo estimado, verificou-se os valores assumidos pelos

Critérios de Informação Akaike (AIC), Bayesian (BIC), Hannan-Quinn (HQ) e

Final Prediction Error (FPE). O objetivo então é selecionar o modelo que

minimiza esses valores. A Tabela 5.38 apresenta os valores dos quatro Critérios

de Informação para os 13 modelos estimados.

O modelo com somente 1 defasagem nas variáveis endógenas apresentou o

menor valor para AIC, BIC e HQ. O modelo com melhor capacidade preditiva,

pelo critério FPE, é o modelo 7. Porém, o modelo final não foi selecionado aqui

nesta etapa.

103

Modelo AIC BIC FPE HQ

1 6,63 -9,84 8,06E-06 -11,07

2 280,72 -2,95 -1,82E-06 -7,35

3 784,82 8,87 -2,34E-07 -0,66

4 1519,36 26,05 -6,19E-08 9,42

5 1828,19 41,22 -6,42E-08 18,76

6 1919,20 53,21 -2,23E-08 25,71

7 1778,97 63,45 -7,03E-08 32,43

8 1431,97 68,40 -3,91E-07 36,13

9 1875,05 89,61 -2,15E-07 48,90

10 1216,61 82,05 -3,56E-07 44,46

11 1520,78 101,71 -2,20E-07 56,32

12 699,99 79,41 -1,80E-06 43,47

13 855,43 94,97 -1,21E-06 52,85 Tabela 5.38: Critérios de Informação

Outras estatísticas, todas baseadas nos resíduos, foram utilizadas para

seleção do modelo mais adequado, tanto in-sample quanto out-of-sample. A

Tabela 5.39 apresenta as estatísticas Média, Variância, Assimetria e Curtose dos

resíduos no período in-sample. Todos os modelos possuem resíduos com média

nula, variância pequena. As medidas de assimetria e curtose apontam desvios dos

valores que indicam normalidade (0 e 3, respectivamente).

Modelo

1 2 3 4 5 6 7 8 9 10 11 12 13

Média

SE 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

S 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

NE 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

NE 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

Variância

SE 0,03 0,03 0,02 0,02 0,02 0,01 0,02 0,02 0,02 0,02 0,02 0,03 0,03

S 0,04 0,04 0,02 0,03 0,03 0,02 0,03 0,03 0,03 0,04 0,03 0,04 0,04

NE 0,05 0,02 0,02 0,01 0,01 0,01 0,01 0,02 0,03 0,02 0,02 0,04 0,04

NE 0,03 0,03 0,02 0,01 0,01 0,01 0,01 0,02 0,01 0,02 0,02 0,03 0,03

Assimetria

SE 1,81 1,91 1,44 3,73 3,85 1,92 3,94 2,19 2,91 2,70 2,98 1,35 1,11

S 1,52 1,92 1,35 3,01 4,05 2,02 3,65 2,99 3,39 2,27 3,23 1,85 1,48

NE 1,63 1,86 2,07 0,31 0,12 2,34 0,48 0,78 1,73 1,74 3,11 0,72 0,97

NE 1,09 -0,47 0,68 0,25 0,90 0,67 0,19 -0,17 0,51 -0,34 -0,65 -1,07 -0,92

Curtose

SE 11,88 16,99 13,37 33,71 37,04 17,62 40,77 20,22 25,68 21,97 27,37 11,52 7,47

S 9,20 15,05 10,58 23,18 33,77 16,45 29,29 23,85 27,70 15,19 26,75 12,84 10,47

NE 19,01 18,40 20,18 6,78 8,40 24,29 12,09 8,54 16,58 16,46 35,74 10,83 10,58

NE 8,67 10,12 6,48 5,66 7,10 9,72 6,49 7,76 8,20 7,40 10,14 13,24 11,62 Tabela 5.39: Estatísticas descritivas dos resíduos – in-sample

104

A Tabela 5.40 apresenta as estatísticas MSE, RMSE, MAE e MAPE. Os

valores de MSE, RMSE e MAE estão próximos a zero e as medidas de MAPE

apontam valores baixos, o que indica que os modelos estimados controlaram

bastante os erros in-sample. É interessante notar que todos os valores estão muito

próximos uns dos outros, não permitindo destacar um único modelo como o mais

adequado para representar as séries de Vazão de rios.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12 13

MSE

SE 0,03 0,03 0,02 0,02 0,02 0,01 0,02 0,02 0,02 0,02 0,02 0,03 0,03

S 0,04 0,04 0,02 0,03 0,03 0,02 0,03 0,03 0,03 0,04 0,03 0,04 0,04

NE 0,05 0,02 0,02 0,01 0,01 0,01 0,01 0,02 0,03 0,02 0,02 0,04 0,04

N 0,03 0,03 0,02 0,01 0,01 0,01 0,01 0,02 0,01 0,02 0,02 0,03 0,03

RMSE

SE 0,18 0,16 0,14 0,13 0,13 0,11 0,12 0,14 0,14 0,15 0,14 0,18 0,16

S 0,21 0,20 0,15 0,16 0,16 0,13 0,16 0,19 0,17 0,19 0,18 0,20 0,19

NE 0,23 0,15 0,14 0,10 0,10 0,11 0,11 0,15 0,16 0,14 0,13 0,20 0,20

N 0,17 0,16 0,13 0,10 0,11 0,09 0,11 0,14 0,12 0,14 0,13 0,18 0,17

MAE

SE 0,11 0,10 0,09 0,08 0,07 0,06 0,07 0,08 0,08 0,09 0,07 0,12 0,12

S 0,14 0,13 0,10 0,09 0,09 0,07 0,09 0,10 0,09 0,12 0,09 0,14 0,14

NE 0,12 0,09 0,09 0,06 0,06 0,06 0,06 0,10 0,10 0,09 0,07 0,13 0,13

N 0,11 0,10 0,09 0,07 0,07 0,05 0,07 0,09 0,07 0,09 0,07 0,12 0,11

MAPE

SE 3,54 3,21 2,87 2,49 2,40 2,15 2,26 2,82 2,93 3,15 2,66 3,85 3,94

S 4,41 4,08 3,60 3,11 2,88 2,63 3,05 3,44 3,42 4,01 3,30 4,49 4,61

NE 3,85 3,17 2,99 2,31 2,13 2,23 2,27 3,47 3,57 3,09 2,52 4,40 4,49

N 3,69 3,35 2,89 2,40 2,38 1,86 2,65 3,07 2,79 3,38 2,77 3,93 3,86 Tabela 5.40: Estatísticas de erro dos modelos – in-sample

Por fim, verificou-se a normalidade dos resíduos dos modelos estimados,

mostrados na Tabela 5.41. Para esta análise, realizou-se a versão multivariada do

teste. O teste univariado de normalidade Jarque-Bera não foi realizado devido ao

tamanho da amostra ser considerado pequeno. Este teste apresenta melhores

desempenhos para amostras em torno de (ou maior que) 1000 observações.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12 13 My�÷y�

0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

M~��5%� 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81

p-valor 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00

Tabela 5.41: Teste de normalidade dos resíduos – in-sample

105

Conclui-se que os resíduos in-sample de todos os modelos seguem

distribuição Normal multivariada.

Além da análise dos critérios de informação, que aponta o modelo 1 como o

modelo mais adequado, e da análise dos resíduos in-sample, que apontam bons

ajustes dos modelos, estatísticas descritivas e de erro dos modelos no período out-

of-sample também foram geradas.

Depois de estimados os modelos, 3 tipos de previsão foram realizadas no

período out-of-sample: Combinação de Regimes (RC), Máxima Pertinência (MM)

e Combinação Adaptativa de Regimes (ARC), conforme descritas no Capítulo IV.

Analisar os resíduos gerados por modelos utilizando estes três métodos de

previsão determinará o modelo STVAR-Tree que melhor se adéqua aos dados.

Nesta etapa, os modelos de 1 a 13 competem entre si, pois alguns modelos

apresentam bons ajustes out-of-sample e outros não.

A Tabela 5.42 apresenta as estatísticas Média, Variância, Assimetria e

Curtose dos resíduos no período out-of-sample pelo método RC. Nem todos os

modelos possuem resíduos com média nula, variância pequena, assimetria

próxima a zero e curtose próxima a 3. Destacam-se com melhores resultados os

modelos 8, 12 e 13.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12 13

Média

SE -2,61 47,30 237,04 2,36 25,14 4,28 0,84 -0,22 -88,88 1,95 106,06 -0,12 -0,08

S -4,71 15,14 522,96 4,70 30,02 7,35 0,61 -0,16 -76,85 0,96 -11,51 -0,15 -0,10

NE -2,38 13,07 -35,31 3,96 20,35 1,58 1,76 0,02 -34,23 3,04 85,84 -0,10 -0,03

NE -2,74 23,52 68,28 0,72 31,32 2,76 0,36 -0,24 8,46 2,77 70,10 -0,17 -0,18

Variância

SE 170,41 1,0E+05 4,1E+05 57,83 2,3E+04 299,04 6,63 0,28 1,4E+05 56,93 6,9E+04 0,25 0,27

S 592,96 3,8E+04 1,7E+06 213,09 2,8E+04 1152,01 3,88 0,34 1,1E+05 22,55 3,0E+04 0,20 0,20

NE 160,72 1,2E+03 1,0E+05 213,68 1,5E+04 843,94 41,96 0,87 1,9E+04 150,35 2,5E+04 0,30 0,31

NE 191,28 6,4E+04 5,5E+04 31,39 4,6E+04 400,42 6,69 0,30 1,2E+04 87,73 5,8E+04 0,35 0,32

Assimetria

SE -6,80 6,52 4,93 3,74 7,43 5,30 2,43 0,07 -3,28 4,71 2,31 0,18 0,04

S -6,80 6,33 3,97 4,12 6,06 6,13 2,43 1,13 -3,37 4,28 0,50 -0,05 0,01

NE -6,80 1,39 -2,44 3,39 6,53 -2,19 3,52 -0,47 -4,06 4,39 2,24 -0,74 -0,01

NE -6,80 6,42 4,11 2,65 7,98 5,29 0,85 -0,55 0,52 4,59 1,67 -0,76 -1,08

Curtose

SE 51,05 49,41 33,34 19,28 59,08 32,48 9,70 3,60 16,05 24,20 8,48 3,05 3,67

S 51,03 47,94 23,25 22,23 39,85 42,38 16,43 9,05 16,95 25,27 7,95 4,46 2,85

NE 51,11 6,07 17,34 14,00 46,05 28,51 16,77 8,58 21,49 21,35 7,11 8,25 5,86

NE 51,05 48,66 25,76 19,39 66,19 39,12 8,32 5,19 11,79 23,88 8,45 4,78 6,09 Tabela 5.42: Estatísticas descritivas dos resíduos (RC) – out-of-sample

106

Diferentemente do ocorrido no período in-sample, nem todos os valores de

MSE, RMSE, MAE e MAPE do período out-of-sample estão próximos a zero, o

que indica que alguns modelos estimados não conseguiram controlar os erros

neste período. A Tabela 5.43 apresenta as estatísticas, com destaque positivo para

os modelos 8, 12 e 13.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12 13

MSE

SE 174,84 1,0E+05 4,6E+05 62,61 2,4E+04 313,19 7,25 0,33 1,4E+05 59,93 7,9E+04 0,26 0,27

S 606,90 3,7E+04 2,0E+06 232,26 2,8E+04 1189,97 4,19 0,36 1,1E+05 23,15 3,0E+04 0,22 0,21

NE 164,17 1,4E+03 1,0E+05 226,42 1,5E+04 834,71 44,48 0,86 2,0E+04 157,49 3,2E+04 0,31 0,31

N 196,15 6,3E+04 5,9E+04 31,47 4,6E+04 402,49 6,73 0,35 1,2E+04 94,20 6,2E+04 0,37 0,35

RMSE

SE 13,22 3,2E+02 6,7E+02 7,91 1,5E+02 17,70 2,69 0,57 3,8E+02 7,74 2,8E+02 0,51 0,52

S 24,64 1,9E+02 1,4E+03 15,24 1,7E+02 34,50 2,05 0,60 3,3E+02 4,81 1,7E+02 0,47 0,46

NE 12,81 3,7E+01 3,2E+02 15,05 1,2E+02 28,89 6,67 0,93 1,4E+02 12,55 1,7E+02 0,56 0,55

N 14,01 2,5E+02 2,4E+02 5,61 2,1E+02 20,06 2,59 0,60 1,1E+02 9,71 2,4E+02 0,61 0,59

MAE

SE 2,72 8,9E+01 2,8E+02 3,10 2,6E+01 4,57 1,38 0,42 1,4E+02 2,26 1,3E+02 0,39 0,38

S 4,83 6,2E+01 6,1E+02 5,55 3,2E+01 7,78 1,16 0,42 1,2E+02 1,93 9,6E+01 0,34 0,35

NE 2,60 1,9E+01 1,3E+02 5,34 2,1E+01 7,96 2,54 0,59 5,5E+01 3,47 9,3E+01 0,38 0,40

N 2,87 7,8E+01 9,9E+01 2,41 3,3E+01 4,62 1,42 0,43 5,6E+01 3,33 1,2E+02 0,42 0,40

MAPE

SE 58,70 2,1E+03 6,9E+03 79,59 6,2E+02 122,16 33,39 10,27 3,4E+03 54,11 3,4E+03 9,72 9,60

S 102,71 1,4E+03 1,5E+04 139,31 7,8E+02 202,39 27,70 10,01 2,9E+03 43,99 2,3E+03 8,20 8,63

NE 61,17 5,0E+02 3,5E+03 135,86 7,0E+02 221,57 64,81 15,40 1,4E+03 83,81 2,4E+03 10,05 10,52

N 68,25 2,4E+03 3,2E+03 73,61 1,0E+03 145,69 45,40 12,14 1,6E+03 103,74 3,6E+03 12,12 11,53 Tabela 5.43: Estatísticas de erro dos modelos (RC) – out-of-sample

Por fim, verificou-se a normalidade (somente na versão multivariada do

teste) dos resíduos dos modelos estimados no período out-of-sample, mostrados

na Tabela 5.44.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12 13 My�÷y�

1,26 1,34 2,96 2,29 0,90 1,07 2,33 3,27 1,43 2,06 3,86 2,25 1,38

M~��5%� 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81

p-valor 0,74 0,72 0,40 0,51 0,83 0,79 0,51 0,35 0,70 0,56 0,28 0,52 0,71

Tabela 5.44: Testes de normalidade dos resíduos (RC) – out-of-sample

Conclui-se que os resíduos de os modelos neste período seguem distribuição

Normal multivariada.

107

Considerando o método de previsão RC, os modelos 8, 12 e 13 foram os que

melhor apresentaram resultados para os resíduos, em todas as análises. Seleciona-

se, portanto, estes modelos como os candidatos aos mais adequados.

Considere, agora, o tipo MM de previsão. A Tabela 5.45 apresenta as

estatísticas Média, Variância, Assimetria e Curtose dos resíduos. Destacam-se os

modelos 8, 12 e 13 por possuírem resíduos com médias próximas a zero,

variâncias pequenas, assimetrias próximas a zero e curtoses próximas a 3.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12 13

Média

SE -1,86 28,31 -4838,89 18,07 -7049,50 -1420,44 -7,21 -0,62 -69,49 0,44 -1470,09 -0,15 -0,08

S -3,21 -5,49 -2086,70 36,74 -5593,02 926,46 13,84 -0,42 -66,77 0,40 -1255,25 -0,10 -0,06

NE -1,68 -4,75 -624,13 -13,53 -5220,35 795,91 32,82 -0,11 -41,85 0,45 -178,57 -0,10 -0,01

NE -2,02 12,38 -3275,96 9,32 -3688,39 -1134,26 36,04 -0,66 19,76 0,61 -846,90 -0,21 -0,23

Variância

SE 181,42 1,0E+05 4,1E+05 9,7E+02 1,9E+07 7,8E+05 25,34 0,29 1,1E+05 1,21 9,8E+06 0,25 0,27

S 625,58 3,8E+04 1,7E+06 4,1E+03 1,2E+07 2,8E+05 138,90 0,34 9,5E+04 2,15 5,8E+06 0,20 0,20

NE 170,38 1,2E+03 1,0E+05 1,8E+03 1,0E+07 2,2E+05 711,13 0,88 4,6E+04 2,17 3,8E+05 0,30 0,31

NE 203,13 6,4E+04 5,5E+04 5,9E+02 5,3E+06 4,9E+05 885,45 0,31 1,0E+04 3,24 3,3E+06 0,35 0,32

Assimetria

SE -8,29 6,52 4,93 0,14 0,99 1,11 1,56 0,02 -3,18 0,73 0,78 0,19 0,04

S -8,30 6,33 3,97 0,37 0,99 -1,13 -1,47 1,12 -2,95 -0,10 0,62 -0,11 0,02

NE -8,29 1,39 -2,44 1,67 0,99 -1,07 -1,28 -0,47 -6,02 2,89 1,39 -0,74 -0,01

NE -8,29 6,42 4,11 -1,39 0,99 1,10 -1,39 -0,53 3,13 -0,31 0,82 -0,73 -1,08

Curtose

SE 69,86 49,41 33,34 3,84 1,98 2,31 5,29 3,48 17,16 9,41 2,76 3,06 3,67

S 69,96 47,94 23,25 3,12 1,98 2,29 4,67 8,99 13,57 7,61 2,41 4,32 2,85

NE 69,83 6,07 17,34 9,75 1,98 2,15 4,51 8,38 41,74 13,83 4,48 8,24 5,86

NE 69,85 48,66 25,76 9,22 1,98 2,26 3,95 5,05 20,65 6,64 2,95 4,77 6,05 Tabela 5.45: Estatísticas descritivas dos resíduos (MM) – out-of-sample

As estatísticas MSE, RMSE, MAE e MAPE do período out-of-sample do

tipo MM de previsão, indicam que os modelos 8, 12 e 13 controlam bem os erros

devido aos valores baixos nas medidas MSE, RMSE e MAE. A Tabela 5.46

apresenta os resultados.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12 13

MSE

SE 182,35 1,0E+05 2,3E+07 1291,84 6,8E+07 2,7E+06 77,03 0,66 1,1E+05 1,39 1,1E+07 0,27 0,27

S 627,18 3,7E+04 6,0E+06 5417,64 4,3E+07 1,1E+06 328,59 0,51 9,8E+04 2,28 7,3E+06 0,20 0,20

NE 170,82 1,2E+03 4,9E+05 1999,19 3,7E+07 8,5E+05 1778,66 0,88 4,7E+04 2,34 4,0E+05 0,31 0,31

N 204,39 6,3E+04 1,0E+07 677,28 1,8E+07 1,7E+06 2172,09 0,73 1,1E+04 3,56 4,0E+06 0,39 0,37

RMSE SE 13,50 324,76 4880,58 35,94 8295,48 1670,86 8,78 0,81 344,60 1,18 3451,63 0,52 0,52

108

S 25,04 193,77 2465,87 73,60 6581,50 1069,38 18,13 0,71 313,59 1,51 2701,13 0,45 0,45

NE 13,07 35,44 700,58 44,71 6143,06 926,20 42,17 0,94 217,16 1,53 638,29 0,56 0,55

N 14,30 251,63 3284,34 26,02 4340,47 1333,48 46,61 0,86 105,33 1,89 2013,69 0,62 0,61

MAE

SE 1,96 102,35 4838,89 21,95 7050,12 1442,91 8,01 0,68 120,07 0,86 2623,88 0,40 0,38

S 3,35 76,96 2313,03 44,31 5593,46 926,67 16,22 0,56 109,01 1,04 2058,59 0,32 0,35

NE 1,87 26,84 637,58 26,15 5220,85 797,64 36,64 0,60 60,62 0,86 462,54 0,38 0,40

N 2,12 86,12 3275,96 15,65 3689,06 1151,63 41,27 0,72 46,25 1,29 1525,44 0,43 0,41

MAPE

SE 41,70 2430,42 1,13E+05 491,12 1,55E+05 31942,70 180,99 16,50 2940,51 19,60 59010,65 9,97 9,59

S 69,55 1823,96 52979,59 981,98 1,23E+05 20460,44 363,25 13,28 2635,57 23,05 45794,87 7,82 8,42

NE 40,70 669,20 15776,37 599,34 1,16E+05 17851,51 836,07 15,67 1701,09 19,90 10672,35 10,08 10,43

N 46,88 2679,58 84431,46 394,88 86630,63 27208,79 1004,20 20,01 1272,66 30,80 36155,36 12,56 11,89 Tabela 5.46: Estatísticas de erro dos modelos (MM) – out-of-sample

Verificou-se a normalidade na versão multivariada do teste dos resíduos no

período out-of-sample, mostrados na Tabela 5.47. Para os modelos 3, 5, 6, 7 e 8

não temos a distribuição Normal multivariada dos resíduos.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12 13 My�÷y�

0,61 0,24 29,59 6,12 24,51 24,91 20,90 12,86 1,34 3,36 5,54 2,37 1,52

M~��5%� 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81

p-valor 0,89 0,97 0,00 0,11 0,00 0,00 0,00 0,00 0,72 0,34 0,14 0,50 0,68

Tabela 5.47: Testes de normalidade dos resíduos (MM) – out-of-sample

Então, pelo tipo de previsão MM, os candidatos a modelos STVAR-Tree

são 12 e 13. Por último, mas não menos importante, o tipo ARC de previsão. A Tabela

5.48 mostra as estatísticas Média, Variância, Assimetria e Curtose dos resíduos.

Apesar de alguns modelos apresentarem médias próximas a zero, as variâncias

não são baixas. Além disso, as medidas de assimetria e curtose estão afastadas

daquelas que sugerem a normalidade. Destacam-se positivamente nesta análise os

modelos 8, 11, 12 e 13.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12 13

Média

SE 6,94 -0,72 16,89 0,46 50,78 -0,73 1,72 0,03 -0,19 0,21 0,06 0,02 0,03

S 5,75 -0,34 18,26 0,54 49,68 -0,78 1,74 0,01 -0,16 0,24 0,07 0,04 0,05

NE 4,97 -0,32 74,33 0,49 52,73 -0,69 1,65 0,00 -0,26 0,19 0,05 -0,03 -0,01

NE 1,67 -0,33 74,38 0,43 52,69 -0,74 1,62 -0,02 -0,33 0,12 -0,04 -0,08 -0,02

Variância SE 2072,79 23,39 2,0E+05 3,58 1,4E+05 118,85 178,04 2,68 6,68 2,41 0,74 2,20 1,78

109

S 1554,87 4,84 2,1E+05 5,01 1,4E+05 119,28 177,31 2,73 5,77 2,58 0,66 1,89 1,49

NE 1425,20 21,28 5,1E+06 3,36 1,5E+05 112,95 194,33 2,56 7,56 2,77 0,83 2,43 2,00

NE 546,44 22,69 5,1E+06 3,63 1,5E+05 112,14 193,17 2,14 6,95 2,46 0,61 2,25 2,07

Assimetria

SE 3,81 -4,79 2,82 3,33 7,48 -7,17 7,18 0,26 -5,01 2,42 1,23 0,11 -0,28

S 3,78 -3,71 2,87 4,43 7,48 -7,17 7,17 0,05 -5,05 3,12 1,58 0,57 0,25

NE 4,03 -2,59 0,55 4,16 7,48 -7,13 7,16 0,81 -4,65 2,35 1,24 -0,14 -0,52

NE 1,99 -2,90 0,55 3,73 7,48 -7,20 7,23 0,13 -5,11 2,22 -0,14 -0,50 -0,50

Curtose

SE 19,49 30,90 19,60 17,23 57,33 54,45 54,34 8,11 32,69 12,79 6,59 5,81 6,35

S 20,86 19,19 20,80 27,29 57,29 54,45 54,27 9,26 33,38 17,31 8,33 6,24 6,35

NE 24,56 21,62 24,12 25,42 57,32 54,06 54,19 8,58 29,08 13,52 8,79 5,48 6,15

NE 17,75 23,16 24,12 22,37 57,32 54,68 54,89 7,02 33,46 13,08 5,47 5,15 5,86 Tabela 5.48: Estatísticas descritivas dos resíduos (ARC) – out-of-sample

As estatísticas MSE, RMSE, MAE e MAPE do tipo ARC de previsão

indicam que os modelos que não conseguiram controlar os erros neste período. Os

resultados estão muito ruins, a exceção do modelo 11. A Tabela 5.49 apresenta os

resultados.

Modelo

1 2 3 4 5 6 7 8 9 10 11 12 13

MSE

SE 2086,47 23,52 2,0E+05 3,73 1,47E+05 117,41 178,03 2,64 6,60 2,41 0,73 2,16 1,75

S 1562,00 4,87 2,0E+05 5,22 1,40E+05 117,89 177,38 2,68 5,70 2,60 0,66 1,86 1,47

NE 1426,12 21,03 5,0E+06 3,54 1,58E+05 111,55 193,81 2,52 7,50 2,76 0,82 2,39 1,96

N 540,12 22,42 5,0E+06 3,75 1,58E+05 110,83 192,58 2,11 6,94 2,44 0,60 2,22 2,04

RMSE

SE 45,68 4,85 450,32 1,93 383,22 10,84 13,34 1,62 2,57 1,55 0,85 1,47 1,32

S 39,52 2,21 456,84 2,28 374,74 10,86 13,32 1,64 2,39 1,61 0,81 1,36 1,21

NE 37,76 4,59 2244,44 1,88 397,90 10,56 13,92 1,59 2,74 1,66 0,91 1,55 1,40

N 23,24 4,74 2244,10 1,94 397,90 10,53 13,88 1,45 2,64 1,56 0,78 1,49 1,43

MAE

SE 15,09 1,52 122,79 0,96 56,58 2,50 2,95 0,96 1,08 0,91 0,56 1,00 0,87

S 13,45 0,89 122,74 1,01 55,41 2,49 2,95 0,93 0,99 0,85 0,51 0,91 0,79

NE 12,53 1,65 520,23 0,92 58,65 2,48 3,03 0,99 1,18 0,94 0,57 1,04 0,91

N 8,35 1,64 519,79 1,00 58,64 2,38 2,95 0,92 1,04 0,87 0,51 1,02 0,92

MAPE

SE 414,13 38,51 2734,77 23,24 1367,63 59,19 70,95 23,24 25,97 21,78 13,95 24,26 21,04

S 321,58 21,32 2719,51 24,09 1330,03 58,25 70,64 21,61 23,07 19,79 12,15 21,14 18,44

NE 377,17 42,59 1,1E+04 23,89 1456,20 70,02 75,90 25,57 30,09 24,17 15,32 26,47 23,57

N 237,54 48,65 1,8E+04 27,42 1464,43 71,43 77,62 26,04 26,98 23,28 14,77 28,02 25,06 Tabela 5.49: Estatísticas de erro dos modelos (ARC) – out-of-sample

Verificou-se a normalidade na versão multivariada do teste dos resíduos no

período out-of-sample, mostrados na Tabela 5.50. Todos os modelos não

rejeitaram a hipótese de normalidade.

110

Modelo

1 2 3 4 5 6 7 8 9 10 11 12 13 My�÷y�

0,52 0,43 0,04 1,77 0,54 0,15 0,47 0,00 0,27 0,47 0,13 0,03 0,02

M~��5%� 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81

p-valor 0,92 0,93 1,00 0,62 0,91 0,99 0,92 1,00 0,97 0,93 0,99 1,00 1,00

Tabela 5.50: Testes de normalidade dos resíduos (ARC) – out-of-sample

Depois de analisar todos esses resultado, desde o número de parâmetros em

cada modelo, os Critérios de Informação, as estatísticas dos resíduos in-sample e

out-of-sample dos três tipos de previsão, o modelo que apresentou melhor ajuste

aos dados de Vazão de rios foi o modelo 12. Este modelo foi, então, o selecionado

para representar o STVAR-Tree no confronto com a modelagem Neuro-Fuzzy.

A Figura 5.12 ilustra a árvore estimada pelo modelo 12, identificando o

valor estimado pelo parâmetro de suavidade � � e de locação ���, além da

variável de transição �^hçk N����.

Figura 5.12: Árvore estimada do modelo 12

A interpretação da árvore é feita da seguinte maneira: para estimar as séries

de Preço spot, o modelo STVAR-Tree mais adequado sugere uma árvore com dois

regimes, com uma transição bruta � æ = 34,07� determinada pela primeira

defasagem do preço spot do sub-mercado Nordeste. O ponto de corte desta

variável de transição ocorre no valor �� = 2,94�. Portanto, para Preço spot do

Nordeste (logaritmo) com valores menores que 2,94, as séries de Preço spot dos

quatro sub-mercados são estimadas pelo Regime 1, com 40% de pertinência. Para

Preço spot do Nordeste (logaritmo) com valores maiores ou iguais 2,94 as séries

de Preço spot dos quatro sub-mercados são estimadas pelo Regime 2, com 60% de

pertinência.

111

5.2.2.3. Neuro-Fuzzy

O emprego de um sistema Neuro-Fuzzy permitiu que o processo de escolha

de “variáveis explicativas” e seus pesos relativos fossem encontrados de maneira

automática, sem a necessidade de decisões empíricas e arbitrárias, baseadas no

conhecimento ou experiência de especialistas. Para a estimação dos parâmetros da

modelagem Neuro-Fuzzy utilizou-se Sistema Adaptativo de Inferência Neuro-

Fuzzy (ANFIS), tendo como saída as séries de Preço spot de cada um dos sub-

mercados (SE, S, NE e N), um por vez, e as estradas foram as defasagens destas

séries acrescidas das defasagens das séries de ENA e EARM, dos respectivos sub-

mercados.

Definiu-se uma estratégia de seleção para estimar automaticamente toda a

combinação possível de modelos levando-se em consideração o número de

defasagens e o número de variáveis explicativas. No caso em questão, temos três

variáveis (Preço, ENA e EARM). A Tabela 5.51 mostra as variáveis, para cada

sub-mercado, de acordo com a ordem da defasagem estipulada.

Ordem da defasagem Variáveis

1 Preço(t-1) ENA(t-1) EARM(t-1)

2 Preço(t-1) ENA(t-1) EARM(t-1) Preço(t-2) ENA(t-2) EARM(t-2)

3 Preço(t-1) ENA(t-1) EARM(t-1) Preço(t-2) ENA(t-2) EARM(t-2) Preço(t-3) ENA(t-3) EARM(t-3) Tabela 5.51: Variáveis disponíveis de acordo com a ordem da defasagem

Quando estipulamos o número máximo de defasagens igual a dois, temos

então um total de 63 combinações, sendo 6 modelos com uma variável de entrada,

15 com duas variáveis, 20 com três variáveis, 15 com quatro variáveis, 6 com

cinco variáveis e, finalmente, 1 com seis variáveis de entrada. Neste último caso,

entram no modelo todas as variáveis com defasagens t-1 e t-2.

Cabe aqui uma ressalva importante, pois quando o número máximo de

defasagens é maior que 2, o número de modelos a ser estimado é muito grande.

Por exemplo, para d=3 o total de modelos estimados será 511, o que eleva (e

muito) o tempo de execução do programa, particularmente quando o número de

variáveis de entrada de um modelo é superior a seis.

Os dados de entrada foram linearmente normalizados, de modo a pertencer

ao intervalo [-1,1]. O método utilizado é denominado Max-Min, dado por:

112

|_lk^ÅjÆc*jXk = | − Åcl�|�Åj|�|� − Åcl�|� (5.10)

Os 80% iniciais do banco de dados foi utilizado para “treinar” os modelos

neuro-fuzzy (estimar os parâmetros do sistema) e os 20% restantes para validar as

previsões a partir dos modelos. Definiu-se os seguintes parâmetros para o sistema

ANFIS:

1) 100 épocas para o treinamento da rede; 2) Erro de aprendizado de 0,1%; 3) 2 MF (membership functions); 4) Função de pertinência em formato de sino;

Uma análise dos resíduos foi feita para a escolha dos modelos mais

adequados, em cada sub-mercado. Em geral, dentre os 63 modelos estimados,

adotou-se que o melhor modelo era aquele com o menor MAPE no conjunto de

validação.

A Tabela 5.52 identifica os modelos mais adequados para cada sub-

mercado. O modelo para o Sudeste teve como variáveis de entrada, Preçot-1 e

ENAt-1. Para Sul e Norte, somente a variável Preçot-1 foi utilizada como entrada.

E, por fim, para o Nordeste, as variáveis de entrada selecionadas foram Preçot-1 e

EARMt-1.

Sub-mercado Preçot-1 ENAt-1 EARMt-1 Preçot-2 ENAt-2 EARMt-2

SE x x

S x

NE x x

N x Tabela 5.52: Modelos selecionados pela modelagem Neuro-Fuzzy

A Tabela 5.53 mostra as estatísticas MSE, RMSE, MAE e MAPE, de cada

um dos sub-mercados nos períodos in-sample e out-of-sample.

In-sample Out-of-sample

MSE RMSE MAE MAPE MSE RMSE MAE MAPE

SE 0,05 0,22 0,14 4,52 0,09 0,3 0,2 4,34

S 0,14 0,38 0,24 8,08 0,09 0,3 0,25 5,27

NE 0,17 0,41 0,26 9,23 0,4 0,63 0,57 11,92

N 0,11 0,34 0,2 7,18 0,18 0,42 0,31 6,7 Tabela 5.53: Estatísticas de erro dos modelos– in-sample e out-of-sample

113

5.2.2.4. Neuro-Fuzzy

Estatisticamente, os modelos STVAR-Tree e Neuro-Fuzzy foram

comparados pelas medidas de MAPE no período out-of-sample, apresentadas na

Tabela 5.54. Conclui-se que, em geral, a modelagem STVAR-Tree não teve um

ajuste superior ao ajuste da modelagem Neuro-Fuzzy. Entretanto, duas das três

estratégias de previsão do STVAR-Tree, RC e ARC, apresentaram MAPE

melhores para o sub-mercado Nordeste.

STVAR-Tree RC STVAR-Tree MM STVAR-Tree ARC Neuro-Fuzzy

Out-of-sample

SE 9,72 9,97 24,26 4,34

S 8,20 7,82 21,14 5,27

NE 10,05 10,08 26,47 11,92

N 12,12 12,56 28,02 6,70 Tabela 5.54: Comparação dos modelos STVAR-Tree e Neuro-Fuzzy

Este resultado mostra que o modelo não-linear multivariado denominado

STVAR-Tree é capaz de ser aplicado a problemas reais e que pode competir com

modelos já existentes.

114

6 Conclusão

Nesta dissertação foi considerada uma nova formulação de modelo não-

linear multivariado, o qual combina o modelo não-linear STVAR (Smooth

Transition Vector Autoregressive) com a metodologia CART (Classification and

Regression Tree). O modelo resultante é denominado STVAR-Tree e tem como

base o conceito de múltiplos regimes, definidos por uma árvore binária

A especificação do modelo é feita através de testes de hipóteses LM

(Lagrange Multiplier). Desta forma, o crescimento da árvore é condicionado à

existência de não-linearidade nas séries modeladas.

Para cada divisão, são estimados os parâmetros lineares, por Mínimos

Quadrados Multivariados, e os parâmetros não-lineares, por Mínimos Quadrados

Não-Lineares. No momento em que o teste LM rejeita a hipótese de não-

linearidade (e divisão de todos os nós) na profundidade em que a árvore se

encontra, o procedimento de crescimento da árvore é finalizado e o modelo

estimado é o modelo final.

Como forma de avaliação do modelo STVAR-Tree proposto nesta

dissertação, foram realizados diversos experimentos de Monte Carlo com o

objetivo de constatar a funcionalidade tanto do teste LM quanto da estimação do

modelo STVAR-Tree.

Quanto à avaliação do teste LM conclui-se que o teste acusa problemas na

identificação de não-linearidade para amostras de tamanho pequeno, o que indica

uma tendência para a aceitação da linearidade. Por isso, quanto maior o tamanho

da amostra, maior o poder do teste LM, independente do nível de significância e

de valores dos parâmetros não-lineares.

Em relação à funcionalidade do modelo STVAR-Tree conclui-se que, para

amostras pequenas, a tendência é subestimar os parâmetros lineares, independente

do nível de significância do teste LM. Para amostras médias e grandes, o modelo

STVAR-Tree estima corretamente os parâmetros. Mas apesar de amostras

pequenas subestimarem os parâmetros, como resultado final da estimação, os

115

modelos conseguem capturar toda a estrutura e ajustar valores próximos aos

valores observados.

Na estimação dos parâmetros não-lineares constatou-se que, para valores de

γ_nominal muito baixos, o modelo STVAR-Tree superestima este parâmetro,

independente do tamanho da amostra e do nível de significância. Conforme

aumentamos o valor de γ_nominal, o modelo melhora as estimativas de æ, com

destaque para amostras grandes. O modelo STVAR-Tree não apresenta problemas

para estimar o parâmetro de locação c.

Após a realização dos experimentos de Monte Carlo, o modelo STVAR-

Tree foi aplicado às séries brasileiras de Vazão de Rios e às séries de Preço Spot

de energia elétrica do mercado brasileiro. Com a finalidade de evitar a estimação

de árvores complexas e também de reduzir o tempo computacional, limitou-se

árvores com no máximo 8 folhas (nós terminais).

No primeiro estudo, constatou-se, estatisticamente, que o modelo STVAR-

Tree comparado ao modelo PAR(p) através das medidas de MAPE no período

out-of-sample, teve um ajuste muito superior. Duas das três estratégias de

previsão do STVAR-Tree, RC e ARC, apresentaram MAPE muito melhores.

No segundo estudo, conclui-se que, em geral, a modelagem STVAR-Tree

não teve um ajuste superior ao ajuste da modelagem Neuro-Fuzzy. Entretanto,

duas das três estratégias de previsão do STVAR-Tree, RC e ARC, apresentaram

MAPE melhores para o sub-mercado Nordeste.

Estes resultados das duas aplicações mostram que o modelo não-linear

multivariado denominado STVAR-Tree é capaz de ser aplicado a problemas reais

e que pode competir com modelos já existentes, lineares ou não-lineares. No

primeiro caso, o modelo STVAR-Tree ganhou do modelo PAR(p) com uma

vantagem bastante expressiva. E no segundo, o modelo STVAR-Tree ganhou da

modelagem Neuro-Fuzzy em uma das quatro séries.

Como trabalho futuro fica a recomendação da extensão dos modelos não-

lineares multivariados. E isto pode ser feito a partir da detecção da presença de um

vetor de co-integração num sistema. Então, ao invés de estimar o modelo

STVAR-Tree, deve-se desenvolver e estimar um modelo, o qual pode ser

denominado STVEC-Tree.

116

Referências Bibliográficas

[1] AKAIKE, H. A new look at the statistical model identification. IEEE

Transactions on Automatic Control 19 (6): 716–723, 1974.

[2] ALTISSIMO F, CORRADI V. Bounds for inference with nuisance

parameters present only under the alternative. Econometrics Journal 5:

494–519, 2002.

[3] BALKE, N.; FOMBY; T. Threshold cointegration. International

Economic Review 38, 627–645, 1997.

[4] BOX, G.; JENKINS, C.; REISEL, G. Time series analysis: Forecasting

and control. Englewood Cliffs: Prentice Hall, 1994.

[5] BREIMAN, L.; FRIEDMAN, J.; OLSHEN, R.; STONE, C. J.

Classification and Regression Trees. Belmont Wadsworth Int. Group,

New York, 1984.

[6] CAMACHO, M. Vector Smooth Transition Regression Models for US

GDP and the Composite Index of Leading Indicators. Journal of

Forecasting 23: 173-196, 2004.

[7] CHAN, K.; TONG, H. On estimating thresholds in autoregressive

models. Journal of Time Series Analysis, 7, 179–190, 1986.

[8] CLEMENTS, M.; KROLZIG, H. A comparison of the forecast

performance of Markov-switching and threshold autoregressive

models of US GNP. Econometrics Journal 1, C47–C75, 1998.

[9] COSTA, F. et al. Modelagem Estocástica de Previsão de Vazões Mensais:

PREVIVAZM, XV Simpósio Brasileiro de Recursos Hídricos, Curitiba,

PR, Brasil, 2003.

[10] EIRTHEIM, O., TERÄSVIRTA, T. Testing the adequacy of smooth

transition autoregressive models. Journal of Econometrics, Vol. 74, pp.

59-76, 1996

117

[11] ENGLE, R.; GRANGER C. Co-Integration and Error Correction:

Representation, Estimation, and Testing. Econometrica, Vol. 55, No 2,

pp. 251-276, 1987.

[12] EPPRECHT, C. Modelos de Transição Suave para Média e

Volatilidade Realizada Aplicados à Previsão de Retornos e Negociação

Automática. 132p. Dissertação de Mestrado, PUC-Rio, Departamento de

Engenharia Elétrica, Rio de Janeiro, 2008.

[13] FRANSES, P.; TERÄSVIRTA, T. Introduction to the special issue:

nonlinear modeling of multivariate macroeconomic relations.

Macroeconomic Dynamics, vol 5, 461-465, 2001.

[14] GALVÃO, A. Structural Break Threshold VARs for Predicting US

Recessions Using the Spread. Journal of Applied Econometrics 21: 463–

487, 2006.

[15] GODFREY, L. G. Misspecification Tests in Econometrics: the

Lagrange Multiplier Principle and Other Approaches. Cambridge

University Press, 1988.

[16] GRANGER, C. Some Properties of Time Series Data and Their Use in

Econometric Model Specification. Journal of Econometrics, 121-130,

1981.

[17] GRANGER, C.; TERÄSVIRTA, T. Modelling Nonlinear Economic

Relationships. Oxford University Press, Oxford, 1993.

[18] HAMILTON, J. Time Series Analysis. Princeton University Press,

Princeton, 1994.

[19] HANSEN, B. Testing linearity. Journal of Economic Surveys 13, 551–

576, 1999.

[20] HILLEBRAND, E.; MEDEIROS, M. Forecasting realized volatility

models: the benefits of bagging and nonlinear specifications. Texto

para Discussão do Dept. de Economia, PUC-Rio, 2007.

[21] HIPEL, K.; MCLOAD, A. Time Series Modelling of Water Resources

and Environmental Systems. Elsevier Science, 1994.

[22] HORNIK, K.; STINCHOMBE, M.; WHITE, H.. Multi-layer

(feedforward) networks are universal approximators. Neural

Networks, 2, 359–366, 1989.

118

[23] HUANG; CHEN; CAMACHO. Determinants of Japanese Yen Interest

Rate Swap Spreads: Evidence from a Smooth Transition Vector

Autoregressive Model. Journal of Futures Markets (28), No.1, pp 82-

107, 2008.

[24] JOHANSEN, S. Statistical analysis of cointegrating vectors. Journal of

Economic Dynamics and Control, Vol. 12, pp. 231-254, 1988.

[25] KASUYA, M. Regime-switching approach to monetary policy effects.

Applied Economics, Volume 37, Issue 3, pages 307 – 326, 2005.

[26] KAVKLER; BÖHM, BORSIC. Smooth, Transition vector error-

correction (STVEC) models: An application to real exchange rates.

[27] KAVKLER; MIKEK; BÖHM, BORSIC, Nonlinear econometric models:

The smooth transition regression approach.

[28] KOOP, G.; PESARAN M.; POTTER, S. Impulse response analysis in

nonlinear multivariate models. Journal of Econometrics, vol74; 119-147,

1996.

[29] LEKKOS, I., MILAS, C.; PANAGIOTIDIS T. Forecasting interest rate

swap spreads using domestic and international risk factors: evidence

from linear and non-linear models. Journal of Forecasting, Forthcoming,

2006.

[30] LEWIS, P.; STEVENS, J. Nonlinear modeling of time series using

multivariate adaptative regression splines. Journal of the American

Statistical Association, 86, 864–877, 1991.

[31] LÜTKEPOHL, H. New Introduction to Multiple Time Series Analysis.

Springer, New York, 2005.

[32] LUUKKONEN, R; SAIKKONEN, P; TERÄSVIRTA, T. Testing

linearity against smooth transition autoregressive models. Biometrika

75, 491-499, 1988.

[33] LO, M.; ZIVOT, E. Threshold Cointegration and Nonlinear

Adjustment to the Law of One Price. Macroeconomic Dynamics,

Volume 5, Issue 04, pp 533-576, 2001.

[34] MACEIRA, M.; TERRY, L. et al. Chain of Optimization Models for

Setting the Energy Dispatch and Spot Price in the Brazilian System.

IEEE Power System Computation Conference, Servilla, Session 43, p. 1-7,

2002.

119

[35] MCALEER, M.; MEDEIROS, M. Realized volatility: a review.

Econometric Reviews, 27, 10-45, 2008.

[36] MEDEIROS, M. C., VEIGA, A. A flexible coefficient smooth transition

time series model. IEEE Transactions on Neural Networks, 16, 97-113,

2005.

[37] MEDEIROS, M. C., VEIGA, A. Modeling multiple regimes in financial

volatility with a flexible coefficient GARCH model. Econometric

Theory, to appear, 2008.

[38] MEDEIROS, M.; VEIGA, A. A hybrid linear-neural model for time

series forecasting. IEEE Transactions on Neural Networks, 11, 1402–

1412, 2000.

[39] MEDEIROS, M.; VEIGA, A. Diagnostic checking in a flexible non-

linear time series model. Journal of Time Series Analysis, 24, 461–482,

2003.

[40] MEDEIROS, M.; VEIGA, A.; PEDREIRA, E. Modeling Exchange rates:

smooth transition, neural networks, and linear models. IEEE

Transactions on Neural Networks, 12, 755-764, 2001.

[41] RIPATTI A.; SAIKKONEN, P. Vector Autoregressive Processes with

Nonlinear Time Trends in Cointegrating Relations. Macroeconomic

Dynamics, Volume 5, Issue 04, pp 577-597, 2001.

[42] ROSA, J. Modelos de Regressão com Transição Suave Estruturados

por Árvores. 157p. Tese de Doutorado, PUC-Rio, Departamento de

Engenharia Elétrica, Rio de Janeiro, 2005.

[43] ROSA J., VEIGA, A., MEDEIROS, M. Tree structured smooth

transition regression models. Computational Statistics and Data

Analysis, 52, 2469-2488, 2008.

[44] ROSA, J., RAMOS, G., VEIGA, A. Application of STAR-Tree Model to

Brazilian Stock Market Time Series. Working Paper do DEE, PUC-Rio,

Apr 2005.

[45] ROSENBLAT, F. A comparison of several perceptron models. In:

Books, S., editor, SELF-ORGANIZING SYSTEMS, volume 1. Spartan

Books, Washington D.C., 1962.

[46] ROTHMAN, P.; van DIJK, D; FRANSES, P. A Multivariate STAR

Analysis of the Relationship Between Money and Output.

120

Macroeconomic Dynamics 5, 506-532, 2001.

[47] ROTHMAN, P.; MILAS, C. Multivariate STAR unemployment rate

forecasts. Econometrics, num 0502010, 2005.

[48] SALAS, J.; DELLEUR, J.; YEVJEVICH, V.; LANE, W. Applied

modelling of hydrologic time series. Water Resources Publications,

484p, 1980.

[49] SCHWARZ, G. Estimating the dimension of a model. Annals of

Statistics 6 (2): 461–464, 1978.

[50] SEO, B. Testing for Nonlinear Adjustment in Smooth Transition

Vector Error Correction Models. Econometric Society Far Eastern

Meetings, No. 749, 2004.

[51] SIMS, C. Macroeconomics and reality. Econometrica, V.48, N0.1, 1-48,

1980.

[52] SKALIN, J.; TERÄSVIRTA, T. Modeling Asymmetries and Moving

Equilibrium in Unemployment Rates. Macroeconomic Dynamics 6,

202-241, 2002.

[53] SRIPINIT, T. Asymmetric Monetary Policy Responses in the US

Economy: Smooth Transition Vector Autoregressive. Working paper,

2008.

[54] TAYLOR, S. Modelling Financial Time Series. John Wiley, Chichester,

UK, 1986.

[55] TERÄSVIRTA, T. Specification, estimation, and evaluation of smooth

transition autoregressive models. Journal of the American Statistical

Association, 89, 208-218, 1994.

[56] TONG, H. Non-linear Time Series: A Dynamical System Approach.

Oxford University Press, 1990.

[57] TONG, H. On a threshold model. In: Chen, C, H., editor, In Patern

Recognition and Signal Processing, volume 5. Sijhoff Noordhoff,

Amsterdam, 1978.

[58] TONG, H. Threshold models in non-linear time series analysis: lecture

notes in statistics 21. Berlin: Springer-Verlag, 1983.

[59] TONG, H.; LIM, K. Threshold autoregressions, limit cycles, and data,

Journal of the Royal Statistical Society B 42, 245-92, 1980.

[60] TSAY, R. Testing and modeling threshold autoregressive processes.

121

Journal of the American Statistical Association, 84, 231-240, 1989.

[61] TSAY, R. Testing and modeling multivariate threshold models. Journal

of the American Statistical Association 93, 1188-1202, 1998.

[62] VAN DIJK, D.; FRANSES, P. Modelling multiple regimes in the

business cycle. Macroeconomic Dynamics, 3:311–340, 1999.

[63] VAN DIJK, D.; T.TERÄSVIRTA; FRANSES, P.. Smooth transition

autoregressive models - A survey of recent developments. Econometric

Reviews, 21, 1-47, 2002.

[64] VAN DIJK, D. Smooth Transition Models: Extensions and Outlier

Robust Inference. Tinberg Institute: Amsterdam, 2001.

[65] WEISE, C. The asymmetric effects of monetary policy: a nonlinear

vector autoregression Approach. Journal of Money, Credit, and Banking

31, 85-108, 1999.

[66] ZADEH, L. Fuzzy sets. Information and Control, 8, 338–353, 1965.