Dissertacao Mestrado Rogercomp Arima Narima

download Dissertacao Mestrado Rogercomp Arima Narima

of 110

Transcript of Dissertacao Mestrado Rogercomp Arima Narima

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    1/110

    Laboratrio de Modelagem, Anlise e Controle de Sistemas No-Lineares

    Departamento de Engenharia EletrnicaUniversidade Federal de Minas Gerais

    Av. Antnio Carlos 6627, 31270-901 Belo Horizonte, MG Brasil

    Fone:+ 55 3499-4866 - Fax:+ 55 3499-4850

    Previso de sries temporais comaplicaes a sries de consumo de

    energia eltrica

    Roger Jnio Campos

    Dissertao submetida banca examinadoradesignada pelo Colegiado do Programa de Ps-Graduao em Engenharia Eltrica da UniversidadeFederal de Minas Gerais, como parte dos requisitosnecessrios obteno do grau de Mestre emEngenharia Eltrica.

    Orientador: Prof. Eduardo M.A.M. Mendes, Ph.D.Co-orientador: Prof. Luis Antonio Aguirre, Ph.D.

    Belo Horizonte, Abril de 2008

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    2/110

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    3/110

    Dedicatria

    Ao nico DEUS que digno de receber toda a honra e a glria, a fora e o poder.

    iii

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    4/110

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    5/110

    Agradecimentos

    Agradeo s misericrdias de Deus, pois, sem essas eu nada seria.

    minha famlia: v Lcia, me (Lucinha), pai (Arnaldo), Flvia e Mo-nique. Em especial minha me, uma mulher a frente do seu tempo, compensamentos retos e ousados, e ao mesmo tempo sempre com os ps nocho. Se no fosse o incentivo dela, eu nem estaria escrevendo estes agra-decimentos.

    minha Llian, que ao longo de cinco anos vm sendo uma companheira

    inigualvel, uma beno de Deus na minha vida. Te amo. turma de longa data, Glucio, Rafael, Bonm, Emerson e Demal, foramamigos nos momentos difceis e excelentes companheiros nos momentosfelizes.

    Agradeo aos amigos do CPDEE, em especial, ao Marco, Arlindo, Said,Eduardo, Luciana,Levi. Aoscompanheiros doMACSINpelas importantesinformaes queforam de grandevalia para a concluso desta dissertao.

    Ao meu orientador Prof. Eduardo Mazoni pela constante atuao e co-laborao no desenvolvimento deste trabalho e tambm por acreditar eapostar em mim.

    Ao Prof. Luis Aguirre pelo incentivo e conana, e pelas sbias e sere-nas palavras.

    v

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    6/110

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    7/110

    Epgrafe

    A Palavra de Deus alicerce para vida de todo cris-to, alimento para alma, direo e consolo a cadadia. Devemos sempre buscar comunho com o Se-nhor atravs da leitura da Bblia, para termos umavida edicada e abenoada; muitas vezes passamospor tribulaesquerendoachar respostasemlugaresdiferentes, mas em Marcos 12:24 Jesus nos adverte:Por ventura no errais vs em razo de no saberdes asEscrituras nem o poder de Deus?Nossa meta deve ser conhecer Jesus, at que todoscheguemos unidade da f, e ao conhecimento do Filho deDeus, a homem perfeito, medida da estatura completade Cristo (Efsios4.13), alimentando-nosda Palavrade Deus, que a Bblia, que foi escrita por homens,mas inspirado peloEsprito Santo de Deus para nos-sas vidas, Para que os seus coraes sejam animados,estando unidos em amor, e enriquecidos da plenitude do

    entendimento para o pleno conhecimento do mistrio deDeus-Cristo, no qual esto escondidos todos os tesourosda sabedoria e da cincia e digo isto, para que ningum vosengane com palavras persuasivas (Colossenses.2:4).Ento conheamos, e prossigamos em conhecer ao SE-NHOR (Osias 6.3a)!!!

    vii

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    8/110

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    9/110

    Sumrio

    Resumo xiii

    Abstract xv

    Lista de Figuras xx

    Lista de Tabelas xxi

    Lista de Abreviaes xxiii

    1 Introduo 11.1 Motivao . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41.3 Apresentao do trabalho . . . . . . . . . . . . . . . . . . . .5

    2 Fundamentao Terica 72.1 Uma breve reviso sobre as tcnicas de previso . . . . . . .7

    2.1.1 Mtodos de Previso . . . . . . . . . . . . . . . . . . .82.1.1.1 Mtodos de Previso de Mdio e longo-

    prazos . . . . . . . . . . . . . . . . . . . . . .82.1.1.2 Mtodos de Previso de curto-prazo . . . .9

    2.2 Identicao de Sistemas . . . . . . . . . . . . . . . . . . . . .12

    ix

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    10/110

    x

    2.3 Representaes Lineares e No-Lineares . . . . . . . . . . . .13

    2.3.1 Modelos ARIMA . . . . . . . . . . . . . . . . . . . . .14

    2.3.1.1 Previso com Modelos ARIMA . . . . . . .16

    2.3.1.2 Atualizando as previses . . . . . . . . . . .18

    2.3.2 Rede Neuro-Fuzzy . . . . . . . . . . . . . . . . . . . .18

    2.3.3 Rede Neural Articial . . . . . . . . . . . . . . . . . .24

    2.3.3.1 Perceptron Multicamadas . . . . . . . . . . .24

    2.3.3.2 Controle de generalizao . . . . . . . . . .262.4 Comentrios nais . . . . . . . . . . . . . . . . . . . . . . . .27

    3 Metodologia 29

    3.1 ndices de desempenho . . . . . . . . . . . . . . . . . . . . . .29

    3.2 Descrio dos dados . . . . . . . . . . . . . . . . . . . . . . .32

    3.2.1 Consumo de New England . . . . . . . . . . . . . . .32

    3.2.2 Consumo de Minas Gerais . . . . . . . . . . . . . . . .34

    3.3 Componente Cclica, sazonal e de tendncia . . . . . . . . . .36

    3.4 Procedimentos para separao das componentes da srietemporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .38

    3.5 Procedimentos para os modelos ARIMA e NARIMA . . . . .41

    3.6 Procedimentos para a RNF . . . . . . . . . . . . . . . . . . . .43

    3.6.1 Modelo de consumo de New England . . . . . . . . .443.6.2 Modelo de consumo da CEMIG . . . . . . . . . . . .45

    3.7 Procedimentos para a RNA . . . . . . . . . . . . . . . . . . .47

    3.7.1 Modelo de consumo de New England . . . . . . . . .48

    3.7.2 Modelo de consumo da Cemig . . . . . . . . . . . . .49

    3.8 Comentrios nais . . . . . . . . . . . . . . . . . . . . . . . .49

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    11/110

    xi

    4 Estudo de caso 1: Srie temporal de New England 514.1 Modelo ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . .514.2 Modelo NARIMA . . . . . . . . . . . . . . . . . . . . . . . . .544.3 Rede Neuro-Fuzzy . . . . . . . . . . . . . . . . . . . . . . . .554.4 Rede Neural Articial . . . . . . . . . . . . . . . . . . . . . .584.5 Comparao das Representaes . . . . . . . . . . . . . . . .59

    5 Estudo de caso 2: Srie temporal da Cemig 61

    5.1 Modelo ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . .615.2 Modelo NARIMA . . . . . . . . . . . . . . . . . . . . . . . . .645.3 Rede Neuro-Fuzzy . . . . . . . . . . . . . . . . . . . . . . . .645.4 Rede Neural Articial . . . . . . . . . . . . . . . . . . . . . .685.5 Comparao das Representaes . . . . . . . . . . . . . . . .70

    6 Discusso e Concluso 75

    6.1 Proposta para trabalhos futuros . . . . . . . . . . . . . . . . .78

    Referncias Bibliogrcas 79

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    12/110

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    13/110

    Resumo

    O objetivo principal desta dissertao estudar e aplicar mtodos depreviso de longo-prazo para previso de consumo de energia eltrica emsries com tendncias e ciclos utilizando apenas os regressores da sriehistrica. Foram realizados dois estudos de caso, o primeiro usando asrie de consumo de energia da cidade de New England (USA), e o outroa srie de consumo do Estado de Minas Gerais (Brasil). O trabalho abordamtodos de previso bastantes disseminados no meio acadmico e cient-co, a saber so eles: o modeloAutoRegressive Integrated Moving Average(ARIMA),Nonlinear AutoRegressive Integrated Moving Average(NARIMA),a Rede Neuro-Fuzzy (RNF) e aRede Neural (RNA). Usando essas quatrorepresentaes a previso de 60 passos frente do consumo de energia estimado. Como primeiro passo, foi denida qual tcnica seria usada paraseparar as componentes das sries temporais. A metodologia usada foiproposta por Mohr (2005). A componente sazonal estimada usando osmodelos NARIMA, RNF e RNA,e osmodelos obtidos so somados com-ponente de tendncia resultando as estimativas do consumo. O modeloARIMA estimado usando a srie temporal sem separar suas componen-tes. Os modelos socomparados usando os ndices de desempenho: MPE,MAPE e RMSE. No caso do consumo do Estado de Minas Gerais, comoa srie temporal composta por poucas observaes, na previso de 60passos frente a componente de tendncia aproximada por uma reta, ecomo no existem amostras para realizar a comparao, realizada uma

    anlise espectral das previses juntamente com a srie original de con-sumo. Os resultados obtidos para os dois estudos de caso mostram que osmodelos ARIMA, NARIMA, RNF e RNA so ferramentas ecientes quepodem auxiliar no planejamento e tomadas de decises no setor eltrico.

    Palavras-chave: previso longo-prazo, consumo de energia, srie tem-poral, ARIMA, NARIMA, Neuro-Fuzzy, Rede Neural.

    xiii

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    14/110

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    15/110

    Abstract

    The main objective of this work is to study and to apply methods of long-term load forecasting to time series with trends and cycles just usingregressorsof thehistorical series. Two case studies were accomplished, therstusingtheseriesofloadofthecityofNewEngland(USA),andtheotherthe seriesof loadof the state ofMinas Gerais (Brazil). The workapproachesmany forecasting methods well know in the academic and scientic eld,such as: the model ARIMA, NARIMA, the Neuro-Fuzzy Network (NFN)and the Articial Neural Network (ANN). Using those four representati-ons the forecast of 60steps ahead of the loadisestimated. First ofall, itwasdened which technique would be used to separate the components of thetemporary series. The chosenmethodology wasproposedby Mohr (2005).The seasonal component was adjusted using the models NARIMA, RNFand RNA, and the obtained models are added to the tendency componentresulting the estimates of the load. The ARIMA model is esteemed usingthe time series without separating their components. The models are com-pared using the performance indices: MPE, MAPE and RMSE. In the caseof the load of the State of Minas Gerais, as the time series is composed byfew observations, in the forecast of 60 steps ahead, the trend component isapproximated by a straight line, and as there is no samples to accomplishthe comparison, a spectral analysis of the forecasts is accomplished withthe original series of load. The results to the two case studies show that

    the models ARIMA, NARIMA, RNF and RNA are efficient tools that canaid in the planning and sockets of decisions in the electric sector.

    Keywords: long-term load forecasting, times series, ARIMA, NARIMA,Neuro-Fuzzy, Neural Network.

    xv

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    16/110

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    17/110

    Lista de Figuras

    2.1 Modelo fuzzy Sugeno com duas entradas e e duas regras(Jang (1993)). . . . . . . . . . . . . . . . . . . . . . . . . . . . .20

    2.2 Arquitetura ANFIS equivalente para o modelo daFigura 2.1(Jang (1993)) . . . . . . . . . . . . . . . . . . . . . . . . . . . .21

    2.3 Arquitetura ANFIS para (a) modelo Sugeno e (b) espao deentrada (Jang (1993)). . . . . . . . . . . . . . . . . . . . . . . .23

    2.4 Arquitetura ANFIS para o modelo Sugeno, onde a normali-zao dos pesos executada na ltima camada (Jang (1993)).23

    3.1 Consumo horrio total da cidade de New England referenteao perodo que se estende de janeiro de 1980 a dezembro de1998. Fonte: ISO-NE. . . . . . . . . . . . . . . . . . . . . . . .33

    3.2 Consumo mensal total da cidade de New England referenteao perodo que se estende de janeiro de 1980 a dezembro de1998. Fonte: ISO-NE . . . . . . . . . . . . . . . . . . . . . . .34

    3.3 Srie de consumo mensal total do Estado de Minas Geraisreferente ao perodo que se estende de dezembro de 1996 a julho de 2006. Fonte: CEMIG. . . . . . . . . . . . . . . . . . .36

    3.4 Componentes de tendncia (- -), sazonalidade (-.-), ciclo (+ ), e consumo total (). . . . . . . . . . . . . . . . . . . . . . .39

    3.5 Componentes de tendncia+ ciclo (- -), sazonalidade (-.-),e consumo total (). . . . . . . . . . . . . . . . . . . . . . . . .40

    3.6 Esquema das etapas do modelo ARIMA. . . . . . . . . . . . .413.7 Representao esquemtica de modelos (a) ARIMA e (b)

    NARIMA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .433.8 RepresentaoesquemticademodeloNeuro-Fuzzydocon-

    sumo de energia de New England. . . . . . . . . . . . . . . .45

    xvii

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    18/110

    xviii

    3.9 RepresentaoesquemticademodeloNeuro-Fuzzydocon-sumo de energia do Estado de Minas Gerais. ( ys representaos dados da componente sazonal da srie de consumo daCemig.) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46

    3.10 Representao esquemtica de modelo Neural do consumode energia de New England. . . . . . . . . . . . . . . . . . . .48

    3.11 Representao esquemtica de modelo Neural do consumode energia do Estado de Minas Gerais. ( ys representa osdados dacomponentesazonal dasriede consumodaCemig.)50

    4.1 Simulao do modelo ARIMA. (a) apresenta os dados deconsumo de energia com a previso de 12 passos frente,e (b) apresenta o detalhe dos dados de validao com asada do modelo ARIMA. () consumo real, (-.-) consumoprevisto. Erros apresentados, MPE: 0,996%; MAPE: 7,406%;RMSE: 1,096;UTheil: 0,892. . . . . . . . . . . . . . . . . . . . .52

    4.2 Simulao do modelo ARIMA. (a) apresenta os dados deconsumo de energia com a previso de 60 passos frente, e(b) apresenta o detalhe dos dados de validao com a sadadomodelo ARIMA.()consumo real, (-.-) consumo previsto.Erros apresentados, MPE: 0,129%; MAPE: 5,920%;, RMSE:1,047;UTheil: 0,995. . . . . . . . . . . . . . . . . . . . . . . . . .53

    4.3 Simulao do modelo NARIMA. (a) apresenta os dados deconsumo de energia com a previso de 12 passos frente, e(b) apresenta o detalhe dos dados de validao com a sadadomodelo ARIMA.()consumo real, (-.-) consumo previsto.Erros apresentados, MPE: -0,298%; MAPE: 6,924%;, RMSE:0,961;UTheil: 0,782. . . . . . . . . . . . . . . . . . . . . . . . . .54

    4.4 Simulao do modelo NARIMA. (a) apresenta os dados deconsumo de energia com a previso de 60 passos frente,e (b) apresenta o detalhe dos dados de validao com asada do modelo ARIMA. () consumo real, (-.-) consumoprevisto. Erros apresentados, MPE: 1,644%; MAPE: 6,810%;RMSE: 1,134;UTheil: 1,076. . . . . . . . . . . . . . . . . . . . .55

    4.5 Simulao da rede Neuro-Fuzzy. (a) apresenta a compara-o do consumo de energia com os dados de validao de12 passos frente, e a (b) apresenta o detalhe dos dados devalidao com a sada da rede. () consumo real, (-.-) con-sumo previsto. Erros apresentados, MPE: 0,801%; MAPE:3,279%; RMSE: 0,518;UTheil: 0,873. . . . . . . . . . . . . . . . .56

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    19/110

    xix

    4.6 Simulao da rede Neuro-Fuzzy. (a) apresenta a compara-o do consumo de energia com os dados de validao de60 passos frente, e a (b) apresenta o detalhe dos dados devalidao com a sada da rede. () consumo real, (-.-) con-sumo previsto. Erros apresentados, MPE: 0,813%; MAPE:2,672%; RMSE: 0,506;UTheil: 0,567. . . . . . . . . . . . . . . . .57

    4.7 Simulao da Rede Neural Articial. (a) apresenta a com-parao do consumo de energia com os dados de validaode 12 passos frente, e a (b) apresenta o detalhe dos da-dos de validao com a sada da rede. () consumo real, (-.-)consumoprevisto. Erroapresentados, MPE:0,204%; MAPE:2,383%; RMSE: 0,364;UTheil: 1,054. . . . . . . . . . . . . . . . .58

    4.8 Simulao da Rede Neural Articial. (a) apresenta a com-parao do consumo de energia com os dados de validaode 60 passos frente, e a (b) apresenta o detalhe dos da-dos de validao com a sada da rede. () consumo real, (-.-)consumoprevisto. Erroapresentados, MPE:1,404%; MAPE:3,142%; RMSE: 0,576;UTheil: 0,998. . . . . . . . . . . . . . . . .59

    5.1 Simulao do modelo ARIMA. (a) apresenta os dados de

    consumo de energia com a previso de 12 passos frente,e (b) apresenta o detalhe dos dados de validao com asada do modelo ARIMA. () consumo real, (-.-) consumoprevisto. Erros apresentados, MPE: 1,956%; MAPE: 3,557%;RMSE: 1,732;UTheil: 1,425. . . . . . . . . . . . . . . . . . . . .62

    5.2 Simulao do modelo ARIMA. (a) apresenta os dados deconsumo de energia com a previso de 60 passos frente,e (b) apresenta o detalhe do modelo ARIMA (-.-) consumoprevisto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .63

    5.3 Simulao do modelo NARIMA. (a) apresenta os dados deconsumo de energia com a previso de 12 passos frente,e (b) apresenta o detalhe dos dados de validao com asada do modelo NARIMA. () consumo real, (-.-) consumoprevisto. Errosapresentados, MPE:-0,075%; MAPE: 2,723%;RMSE: 1,354;UTheil: 1,114. . . . . . . . . . . . . . . . . . . . .65

    5.4 Simulao do modelo NARIMA. (a) apresenta os dados deconsumo de energia com a previso de 60 passos frente, e(b) apresenta o detalhe do modelo NARIMA (-.-) consumoprevisto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .66

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    20/110

    xx

    5.5 Simulao da rede Neuro-Fuzzy. (a) apresenta a compara-o do consumo de energia com os dados de validao de12 passos frente, e a (b) apresenta o detalhe dos dados devalidao com a sada da rede. () consumo real, (-.-) con-sumo previsto. Erros apresentados, MPE: 0,431%; MAPE:1,883%; RMSE: 0,762;UTheil: 0,564. . . . . . . . . . . . . . . . .67

    5.6 Simulao da rede Neuro-Fuzzy. (a) apresenta a compara-o do consumo de energia com os dados de validao de60 passos frente, e a (b) apresenta o detalhe da sada darede (-.-) consumo previsto. . . . . . . . . . . . . . . . . . . .68

    5.7 Simulao da Rede Neural Articial. (a) apresenta a com-parao do consumo de energia com os dados de validaode 12 passos frente, e a (b) apresenta o detalhe dos dadosde validao com a sada da rede () consumo real, (-.-) con-sumo previsto. Erro apresentados, MPE: -0,361%; MAPE:1,503%; RMSE: 0,590;UTheil: 0,313. . . . . . . . . . . . . . . . .69

    5.8 Simulao da Rede Neural Articial. (a) apresenta a com-parao do consumo de energia com os dados de validaode 60 passos frente, e a (b) apresenta o detalhe da sada darede. () consumo real, (-.-) consumo previsto. . . . . . . . .70

    5.9 Comparao das simulaes dos modelos: (a) ARIMA, (b)

    NARIMA,(c)RNF,(d)RNA.Asprevisesiniciam-seapartirda linha vertical contnua (obervao 116). . . . . . . . . . .715.10 Comparao dos espectros de freqncia: (a) srie temporal

    de consumo do Estado de Minas Gerais, (b) ARIMA, (c)NARIMA, (d) RNF, (e) RNA. . . . . . . . . . . . . . . . . . .72

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    21/110

    Lista de Tabelas

    3.1 Comparaodosmodelosatravs dondice dedesempenho:MPE,MAPEeRMSEparaasriedeconsumoemMinasGerais.50

    4.1 Comparaodosmodelosatravs dondice dedesempenho:MPE(%), MAPE(%) e RMSE para a srie de consumo emNew England. . . . . . . . . . . . . . . . . . . . . . . . . . . .60

    5.1 Comparaodosmodelosatravs dondice dedesempenho:MPE(%), MAPE(%), RMSE eUTheil para a srie de consumoem Minas Gerais. . . . . . . . . . . . . . . . . . . . . . . . . .71

    xxi

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    22/110

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    23/110

    Lista de Abreviaes

    AIC Critrio de Informao de AkaikeANFIS Adaptive Neuro-Fuzzy Inference SystemAR Auto Regressive ModelARIMA Auto Regressive Integrated Moving Average ModelARIMAX Auto Regressive Integrated Moving Average Model

    with eXogenous inputARMA Auto Regressive Moving Average ModelARMAX Auto Regressive Moving Average Model

    with eXogenous inputCAKE Current Accumulated Knowledge Element

    CEMIG Companhia Energtica de Minas GeraisCURNOLE Current Residual Nonlinear ElementDAN2 Dynamic Articial Neural Network ModelFAC Funo de autocorrelaoFACp Funo de autocorrelao parcialFARMAX FuzzyAuto Regressive Moving Average

    Model with eXogenous inputMA Moving AverageMAE Mean absolute error

    xxiii

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    24/110

    xxiv

    MAPE Mean absolute percentage errorME Mean errorMIMO Multi input multi outputMISO Multi input sinle outputMLP Multi-layer PerceptronMPE Mean percentage errorMQO Mnimos Quadrados OrdinriosMSE Mean squared errorNARIMA Nonlinear Auto Regressive Integrated

    Moving Average ModelNARMA Nonlinear Auto Regressive Moving Average Model

    RNA Rede Neural ArticialRNF Rede Neuro-FuzzySE Sistema EspecialistaSVM Support Vector MachinesTCS Trend-Cycle-Season Filter

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    25/110

    Captulo 1

    Introduo

    O setor eltrico em todo o mundo vem sofrendo um processo de trans-formao, quer no campo poltico, quer no econmico. A privatizao ea desregulamentao do sistema eltrico so os grandes responsveis pelamudana de cenrio deste sistema. No Brasil o processo de reestruturaofoi iniciado com a promulgao da Lei de Concesses em 1995.

    Nas ltimas duas dcadas, o setor de energia eltrica tem evoludo nadireo do estabelecimento de uma estrutura de mercado. A chamadaindstria de energia eltrica tendo como principal caracterstica a livreconcorrncia na compra e venda de energia eltrica, para a qual constituiatributo indispensvel a desverticalizao, isto , atividades de gerao,transmisso e distribuio so desempenhadas de forma independente eautnoma.

    Com tantas mudanas foi necessrio toda uma reestruturao do sis-temapara que se tenha uma indstria deenergia eltricade altaqualidade,com fornecimento de energia de qualidade e segurana para o consumidorcom a minimizao dos custos. Logo, apreviso de carga1 um tema degrande interesse para este setor. Pois, os custos dos erros de previso aca- bam por gerar um custo nanceiro muito elevado (Oliveira (2004)). Sejaele por erro de previso por excesso (overforecast) ou erro de previso porfalta (underforecast) (Serro (2003)).

    Como pode ser encontrado em Reis (1999) previso de carga eltricapode ser dividida em trs categorias: previso de carga de curto-prazo (ecurtssimo-prazo), mdio-prazo e longo-prazo. Previses de curto-prazonormalmente so de poucos minutos a uma semana frente. Previsesde mdio-prazo englobam horizontes que variam de uma semana a umano, e pormas previses de longo-prazoque visam horizontes acima de um

    1Nesta seo a palavra carga ser utilizada de maneira ampla, de forma a comtemplarqualquer uma das grandezas normalmente consideradas em problemas de previso nosetor eltrico, a saber: carga, demanda e consumo.

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    26/110

    2 1 Introduo

    ano. Os diferentes horizontes de previso so importantes para operaesdiferentesdentro deumacompanhia deenergiaeltrica(Rodrigues (2002)).

    Com o propsito de otimizar as tarefas de umsistema de grande escala,diversas tcnicas esto sendo aplicadas com uma considervel expectativadeeconomianos custose deecincia dosistema, com esteobjetivomuitaspesquisas vm sendo desenvolvidas nesta rea (De Gooijer e Hyndman(2006)).

    Dando passos nesta direo este trabalho apresenta tcnicas de mode-lagem matemtica usadas para a previso de carga. As representaesARIMA (linear), NARIMA (no-linear), a Rede Neuro-Fuzzy (no-linear),e a Rede Neural (no-linear) sero usadas a m de alcanar este propsito.

    Usando essas tcnicas realizada a previso de 5 anos frente doconsumo de energia do Estado de Minas Gerias2. Para vericar-sea capacidadepreditivadosmodelosserorealizadosalgunstestespreliminarescomuma base de dados da companhia eltrica de New England (USA)3. Isto porqueo histrico de dados da CEMIG-Distribuio relativamente pequeno (doano de 1996 a 2006), em especial por causa do racionamento em junho de2001 que mudou toda a dinmica da srie temporal.

    O trabalho foi desenvolvido dentro do escopo do projeto de pesquisa

    intitulado Pesquisa de Modelo de Previso de Consumo de Energia para Curto e Mdio Prazo, utilizando Inteligncia Computacional. O projeto, resultado daparceria entre a UFMG e a CEMIG-Distribuio, por meio de sua Gernciade Planejamento de Mercado, objetiva estudar o problema de previso deconsumo de energia e implementar um sistema computacional que sirvade suporte tomada de decises na rea de comercializao de energia.

    1.1 MotivaoOs anos de 2003 e 2004 foram marcantes para o setor eltrico brasileiro.

    A crise de abastecimento de energia do ano de 2001 forou o GovernoFederal a tomar uma srie de medidas para tentar corrigir os erros domodelo em vigncia e garantir a segurana do suprimento de energiaeltrica no pas. A Leino1040848 / 04 acompanhada do Decretono5.163 / 04

    2A srie de consumo do Estado de Minas Gerais fornecida pela CEMIG-Distribuio(www.cemig.com.br)

    3Dados encontrados no site http: // www.iso-ne.com

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    27/110

    1.1 Motivao 3

    criou uma nova estrutura regulatria para o setor e instituiu uma sriede mecanismos que regulamentam a comercializao de energia entre osagentes do mercado. Alm de garantir a oferta de energia, o novo modelotem como objetivo promover a universalizao do acesso eletricidade ea modicidade tarifria.

    As novas regras denem o papel dos leiles de compra e venda deenergia eltrica. O processo de comercializao passou a ser realizadodentro de um ambiente de contratao regulada em que a compra da ener-gia pelas distribuidoras realizada por meio de leiles, sendo observadoo critrio de menor tarifa. Uma caracterstica importante que os con-tratos negociados referem-se ao fornecimento de energia em horizontesfuturos. Dependendo do tipo de leilo esse horizonte pode ser de 1, 3ou 5 anos. O objetivo reduzir o custo da aquisio da energia eltricaa ser repassada aos consumidores e viabilizar a expanso do setor. Ficoudenido que, para negociar a energia, os geradores devem possuir lastrofsico garantido de todo o montante comercializado nos leiles. Por suavez, as distribuidoras de energia so obrigadas a remeter ao Ministrio deMinas e Energia as previses anuais do consumo de energia, em sua reade operao, em um horizonte de 60 meses, com um erro mximo de 3%

    para cima do montante vericado ao nal do perodo.A qualidade da projeo futura do consumo de energia a ser reali-zada pelas distribuidoras impacta de forma signicativa em dois pontosdistintos. O primeiro se refere ao prprio planejamento da expanso dosistema eltrico, umavezqueestasprojees so utilizadas pelo Ministriode Minas e Energia para dar suporte s decises tomadas neste sentido.O segundo ponto est no contexto operacional e nanceiro das prpriasdistribuidoras. Conforme citado por Oliveira (2004) todo o erro que ultra-passe os limites estabelecidos acarreta em perdas e inui diretamente nos

    resultados nanceiros das distribuidoras. As perdas nanceiras decorrem:(i) das multasaplicadas sobre oserros napreviso; (ii) doscustosreferentes devoluo da energia sobre-contratada e (iii) da contratao de energia apreos maisaltosemleiles deajuste(curto-prazo) decorrentedeprevisesabaixo do consumo real vericado.

    Tendo em vista o contexto criado pelas mudanas estruturais do setor,faz-se necessrio por parte das distribuidoras e comercializadoras de ener-gia, o investimentoemtcnicase metodologias para gerenciaras incertezasinerentes ao mercado. A tomada de deciso relativa contratao futura e

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    28/110

    4 1 Introduo

    o prprio gerenciamento doscontratos(emescalaanual ou mensal) devemestar embasados por previses satisfatrias a cerca do consumo de ener-gia. Percebe-se claramente a demanda, por parte das distribuidoras em:(i) realizar previses anuais para a sua srie de consumo em um horizontede at 5 anos; (ii) realizar previses mensais a cerca do comportamento doconsumo de energia.

    O desao de prever o consumo de energia eltrica no contexto de umaeconomia estvel, com sries temporais razoavelmente estacionrias, jseria um grande desao. Esse desao torna-se tanto maior no contexto deuma economia cujas caractersticas mudam signicativamente em curtosintervalos de tempo, tudo isso agravado pela globalizao mundial.

    Conforme citado, a dinmica do consumo de energia possui uma com-plexidade inerente ao processo. A inuncia de variveis econmicas eclimticas, juntamente com a diculdade de se conhecer as entradas dosistema e a relao destas com o consumo de energia, torna difcil o usode modelos analticos para tratar o problema. Por outro lado, o uso de fer-ramentas baseadas emidenticao de sistemas e inteligncia computacional4vem ganhando fora e a literatura mostra diversas aplicaes realizadascom sucesso. Alguns estudos podem ser encontrados em (Aslanargun,

    Mammadov, Yazici, e Yolacan (2007); Serro (2003); Chow e Leung (1996);Haydari, Kavehnia, Askari, e Ganbariyan (2007)).

    1.2 ObjetivosEste trabalho abordar o problema de previso de srie temporais no-

    estacionrias de consumo de energia eltrica por meio das seguintes me-todologias de modelagem:

    1. Modelo AutoRegressivo integrado de Mdia Mvel, ARIMA;2. Modelo No-linear AutoRegressivo integrado de Mdia Mvel, NA-

    RIMA;

    3. Rede Neuro-Fuzzy, RNF;

    4. Rede Neural Articial, RNA.4Tais como modelos ARIMA, Rede Neural, Lgica Fuzzy

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    29/110

    1.3 Apresentao do trabalho 5

    Por meio de duas sries temporais: (i) consumo de energia da cidadede New England e (ii) consumo de energia do Estado de Minas Gerais,as metodologias numeradas acima sero aplicadas com intuito de realizarprevises de 60 passos (meses) frente.

    Deseja-se investigar at que ponto essas metodologias de fato mostramrobustez medida que o horizonte de previso aumenta. Como tambm,estas metodologias se comportam quando so utilizadas para modelarsries temporais no-estacionrias e com irregularidades.

    1.3 Apresentao do trabalhoEste trabalho apresenta mais 5 Captulos. No Captulo 2 ser feita uma

    reviso bibliogrca contendo de forma resumida e geral os conceitos en-volvidosno mbitoda previsode sries temporais, em especial a previsodo consumo de energia eltrica.

    No Captulo 3 sero apresentadas as metodologias para obter os mo-delos de previso. Ser mostrada a metodologia para a decomposio desries temporais, para o modelo ARIMA, NARIMA, Rede Neuro-Fuzzy eRede Neural. A avaliao do desempenho da metodologia ser feita nosCaptulos 4 e 5.

    No Captulo 4 sero mostrados os resultados, usando as diferentesrepresentaes matemticas, para a srie temporal de consumo de energiada cidade de New England, USA. E no Captulo 5 sero mostrados osresultados da previso para a srie de consumo de energia do Estado deMinas Gerias, Brasil.

    Uma breve discusso dos resultados encontrados, impresses gerais econcluses esto disponveis no Captulo 6.

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    30/110

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    31/110

    Captulo 2

    Fundamentao Terica

    Neste Captulo sero discutidos os principais trabalhos que aplicam

    tcnicas para a previsode sries temporais. Abordar-se- tambmos fun-damentos tericos das tcnicas que so usadas ao longo desta dissertao.

    2.1 Uma breve reviso sobre as tcnicas de pre-viso

    Para previso de carga de curto-prazo vrios fatores devem ser con-siderados, tais como fatores de tempo, dados climticos e as possveisclasses de consumidores. A previso de mdio e curto-prazos leva emconta a carga histrica e dados climticos, o nmero de consumidores emcada classe, a economia e dados demogrcos e suas respectivasprevises,dentre outros fatores (Serro (2003); Rodrigues (2002)).

    Os fatores de tempo incluem o ms de um ano, o dia de uma semana euma hora de um dia. Existem importantes diferenas entre carga de diasteis de uma semana e carga de um nal de semana. A carga em diferen-tes dias teis de uma semana tambm podem apresentar comportamentosdiferentes. Por exemplo, segundas e sextas-feiras so adjacentes aos -

    nais de semana, por isso podem ter estruturas diferentes do que teras aquintas-feiras. Isso ocorre particularmente durante o vero. Feriados somais difceis de prever que dias normais por causa de suas ocorrnciasinfreqentes.

    Fatores climticas inuenciam na carga. De fato, os fatores climticosso os mais importantes na previso de carga de curto-prazo (Campos, Jesus, e Mendes (2007); Pandian, Duraiswamy, Rajan, e Kanagaraj (2006)).Vrias variveis climticas devem ser consideradas para a previso decarga. Temperatura e umidade do ar so as variveis mais usadas para

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    32/110

    8 2 Fundamentao Terica

    a previso da carga. Uma pesquisa de previso curto-prazo de cargaeltrica, (Hippert, Pedreira, e Souza (2001)), indica que dos 22 artigosque so considerados, 13 fazem o uso apenas da temperatura, 3 usam atemperatura e umidade, 3 utilizam parmetros climticos adicionais e 3usam apenas parmetros de carga.

    2.1.1 Mtodos de PrevisoNas ltimas dcadas foram desenvolvidos vrios mtodos de previ-

    so. Uma variedade de mtodos, modelos de regresso, Redes Neurais,Lgica Fuzzy, sistemas especialistas e algoritmos de aprendizagem estats-ticos, sousados normalmentepara previses de curto-prazo (DeGooijer eHyndman (2006)). O desenvolvimento, melhorias, e investigao de ferra-mentas apropriadas tmlevadoo desenvolvimento de tcnicas deprevisomais precisas.

    Aproximaes estatsticas usualmente requerem um modelo matem-tico que represente a carga eltrica como uma funo de diferentes fatores,tais como, tempo, condies meteorolgicas, e classes de consumidores.As duas categorias importantes de tal modelo matemtico so: modelos

    aditivos e modelos multiplicativos. Eles diferem se a previso de carga um somatrio (aditivo) de vrios componentes ou o produto (multipli-cativo) de vrios fatores. Por exemplo, Chen, Canizares, e Singh (2001)apresentam um modelo aditivo que prediz a carga como uma funo dequatro componentes, (i) a parte normal da carga ( um conjunto de car-gas normalizadas para cada tipo de dia que foi identicado em um ano),(ii) a parte sensvel da carga em relao as condies meteorolgicas, (iii)uma componente especial que cria uma divergncia do padro de cargahabitual e (iv) o termo aleatrio (rudo).

    2.1.1.1 Mtodos de Previso de Mdio e longo-prazos

    A modelagem de uso nal, modelagem economtrica, e suas combi-naes so os mtodos de previso de mdio e longo-prazos usados commais freqncia (De Gooijer e Hyndman (2006)).

    Modelos Economtricos - A aproximao economtrica combina teoriaeconmica e tcnicas estatsticas para previso da demanda eltrica. Esta

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    33/110

    2.1 Uma breve reviso sobre as tcnicas de previso 9

    aproximao estima a relao entre consumo de energia (varivel depen-dente) e fatores que inuenciam no consumo. As relaes so estimadaspelo mtodo dos mnimos quadrados ou mtodos de sries temporaisDe Gooijer e Hyndman (2006).

    Uma dasopesnessaestrutura agregara aproximao economtrica,quandoo consumoemsetoresdiferentes (residencial, comercial, industrial,etc) calculado como umafunodas condies meteorolgicas, econmi-cas e outras variveis, e ento so agregadas as estimativas usando dadoshistricos. A integrao da aproximaoeconomtrica coma aproximaocondicionalse d quando componentes comportamentais so inseridas nasequaes da aproximao (condicional).

    Modelos de aprendizagem estatsticos - Os mtodoscondicionale econo-mtrico requerem grande informao dos consumidores, seu equipamen-tos, economia, etc. A aplicao desses mtodos costuma ser complicada erequer participao humana. Alm disso tal informao no est freqen-temente disponvel.

    Para simplicar as previses de mdio-prazo e obter mais preciso,Feinberg, Hajagos, e Genethliou (2002, 2003) evitam o uso de informaesde difcil disponibilidade, e desenvolvem um modelo estatstico para acarga por meio dos dados histricos. O modelo pode ser aplicado paraprevises de mdio e longo-prazos.

    2.1.1.2 Mtodos de Previso de curto-prazo

    Uma variedade de tcnicas estatsticas e de inteligncia computacionaltem sido desenvolvida para previso de carga de curto-prazo (De Gooijere Hyndman (2006); Campos et al. (2007); Pandian et al. (2006); Ghiassi,Zimbra, e Saidane (2005b)). A seguir so, sucintamente, apresentados osmtodos de previso mais usados.

    Mtodos de Regresso - Engle, Mustafa, e Rice (1992) apresentaram v-rios modelos de regresso para a previso de um dia frente do picode carga. Seus modelos incorporam inuncias determinsticas: feriados;inuncias estocsticas: mdia da carga; inuncia exgena: condiesmeteorolgicas. Outras referncias tais como, (Hyde e Hodnett (1997); Ru-zic, Vuckovic, e Nikolic (1998); Charytoniuk, Chen, e Olinda (1998); Haida

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    34/110

    10 2 Fundamentao Terica

    e Muto (1994)) descrevem outrasaplicaes dosmodelos de regresso parapreviso de carga.

    Sries Temporais - Esses mtodos tm sido aplicados por dcadas nasreas de economia, processamento digital de sinais, como tambm napreviso da carga eltrica (Morettin e Toloi (2006); Box, Jenkins, e Reinsel(1994)). Em particular, ARMA, ARIMA, ARMAX, e ARIMAX so mtodosclssicos mais usados em sries temporais.

    Em Aslanargun et al. (2007) realizada uma comparao entre os mo-delos ARIMA, RedeNeurale modelos hbridos usandoa srie temporal deturistas que chegam na Turquia. Seus resultados mostram que o modeloARIMA apresenta bom desempenho, mas os modelos com componentesno-lineares apresentam melhores desempenho em relao ao ARIMA.

    Chow e Leung (1996) apresentam uma rede neural no-linear autore-gressiva integrada (NARI) para a previso de curto-prazo (1 dia frente)do consumo de energia de Hong Kong.

    Fan e McDonald (1994) e Cho, Hwang, e Chen (1995) descrevem a im-plementao dos modelos ARIMAX (autoregressivo integrado de mdiamvel com entradas exgenas) para previso de carga. Yang, Huang, e

    Huang (1996) usaramprogramao evolucionria1 para identicar os par-metros do modelo ARMAX (autoregressivo de mdia mvel com entradasexgenas) para previso de uma semana frente de dados horrios decarga. Yang e Huang (1998) propuseram um modelo Fuzzy autoregres-sivo de mdia mvel com variveis exgenas de entrada (FARMAX) parapreviso de um ano frente de dados horrios de carga.

    Redes Neurais - o uso de Redes Neurais articiais (RNA) tem sido am-plamente estudada na aplicao de previso de carga desde 1990 (veja

    (Peng, Hubele, e Karady (1992))).Bakirtzis, Petridis, Kiartzis, Alexiadis, e Maissis (1996) desenvolveramuma RNA baseada em um modelo de previso de carga de curto-prazopara centrode controle de energia da Greek Public Power Corporation. Asvariveis de entrada incluam dados histricos de carga horria, tempera-tura, e o dia da semana. O modelo pde prever pers de carga de at setedias frente.

    1Programao evolucionria um mtodo para simular a evoluo e constitui umalgoritmo de otimizao estocstico (Fogel (1994)).

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    35/110

    2.1 Uma breve reviso sobre as tcnicas de previso 11

    Papalexopoulos, Hao, e Peng (1994) tambm desenvolveram e imple-mentaram uma RNAfeedforwardmulti-camadas para previso de curto-prazo do sistema de carga. No modelo trs tipos de variveis so usadascomo entradas para a RNA: relao das estaes do ano, condies clim-ticas, e dados histricos de carga.

    EmGhiassi, Saidane, e Zimbra (2005a) apresentamum modelo de RedeNeural dinmico, nomeado de DAN2 (dynamic articial neural network mo-del). Ghiassi et al. (2005b) utilizaram essa metodologia para prever a cargaeltrica em mdio-prazo. A DAN2 foi usada para modelar e prever car-gas, mensalmente, quadrimestralmente, e anualmente usando dados daTaiwan Power Company. Os resultados apresentados pelos autores apre-sentaram bom desempenho. Muitos estudos publicados usam RNAs emconjunto com outras tcnicas de previso, tais como, rvores de regres-so (Mori e Kosemura (2001)), sries temporais (Chow e Leung (1996)) ouLgica Fuzzy (Skarman e Georgiopoulous (1998)).

    Sistemas Especialistas (SE) -Ho, Hsu, Chen, Lee, Liang, Lai, e Chen(1990) propuseram um SE baseado em conhecimento para previso decarga de curto-prazo da Taiwan Power System. Conhecimentos do ope-rador e observaes horrias do sistema de carga foram empregadas paraestabelecer onze tipos de dias diferentes. O algoritmo desenvolvido foicomparado com a metodologia de Box e Jenkins e apresentou bons resul-tados.

    Lgica Fuzzy - Campos et al. (2007) desenvolveram um modelo Neuro-Fuzzy para previso de curto-prazo do consumo de energia da cidade deNova York. O modelo obtido apresentou desempenho satisfatrio paraprevises de at 48 passos (240 minutos) frente. Os autores desse tra- balho comparam os resultados obtidos com os resultados encontrados emPandian et al. (2006), e concluem que a previso usando o modelo Neuro-Fuzzy mais eciente. Referncias (Kiartzis e Bakirtzis (2000); Miranda eMonteiro (2000); Skarman e Georgiopoulous (1998)) descrevem aplicaesda Lgica Fuzzy para previso de carga eltrica.

    Mquinas de Vetores de Suporte (SVM)- Mohandes (2002) aplicou omtodo SVM para previso de carga eltrica de curto-prazo. O autor

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    36/110

    12 2 Fundamentao Terica

    comparou seu desempenho com os modelos autoregressivos (AR). Os re-sultados indicam que a tcnica SVM apresentou melhores resultados queos modelos AR. Chen, Chang, e Lin (2002) desenvolveram um modelousando SVM para prever a demanda de carga diria. Li e Fang (2003)tambm usam um modelo SVM para previso de carga de curto-prazo.

    2.2 Identicao de SistemasA Identicao de Sistemas a rea do conhecimento que estuda tc-

    nicas alternativas de modelagem matemtica. Nela h a necessidade dedesenvolver formasde seobter modelos matemticos a partirde dados ob-servados e no exclusivamente partindo-se das equaes que descrevem afsica do processo (Ljung (1987)).

    O problema de Identicao de Sistemas pode ser dividido em cincoetapas (Ljung (1987)):

    obteno de dados deexperimentaodo sistema que se deseja mode-lar;

    aplicao de testes aos dados obtidos paradeteco de no-linearidades; deteco de estruturaque ser utilizada para representar o sistema;

    estimao dos parmetrosdo modelo;

    validaodo modelo obtido.

    A experimentao consiste na determinao do sinal de entrada, naescolha da taxa de amostragem e na coleta dos dados para a estimao de

    parmetros e ajuste do modelo (Sderstrm e Stoica (1989)). A existnciade no-linearidades no sistema pode ser vericada a partir de testes noparamtricos, utilizando apenas os sinais coletados.

    A deteco da estrutura para representao dos sistemas de grandeimportncia na Identicao de Sistemas. Nesta etapa termos desnecess-rios no modelo e que podem provocar instabilidade numrica e ocasionarcomportamentos dinmicos esprios aos sistema so detectados e extra-dos da estrutura do modelo (Billings, Chen, e Korenberg (1989); Aguirre eBillings (1995))

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    37/110

    2.3 Representaes Lineares e No-Lineares 13

    A estimao de parmetros consiste em determinar os parmetros deuma determinada estrutura a m de que o modelo reproduza o comporta-mento do sistema original. Um critrio comumente usado para estimaode parmetros o mtodo dos Mnimos Quadrados que se resume na mi-nimizao da soma do quadrado das diferenas entre os dados e a sadaestimada pelo modelo (Aguirre (2007); Corra (2001)).

    Finalizando o processo de Identicao de Sistemas, o ltimo passo avalidao. A validao consiste essencialmente em vericar se os modelosincorporam ounoascaractersticas de interesse dosistemaoriginal. Almdisso, interessante poder comparar os modelos entre si e decidir se halgum candidato signicadamente melhor que os demais.

    Todo o detalhamento do processo de Identicao de Sistemas podeser visto em Aguirre (2007).

    2.3 Representaes Lineares e No-Lineares

    Existem diversas formas de representar o mesmo modelo matemtico,

    ou seja, h vrias formas em que as equaes que descrevem o comporta-mento do sistema podem ser escritas. A forma em que um modelo mate-mtico expresso s vezes chamada derepresentao(Aguirre (2007)).

    Existem vrias representaes lineares e no lineares. Uma das maisimportantes na modelagem de sistemas dinmicos lineares a funo detransferncia. Outra maneira til de expressar modelos usando repre-sentao em espao de estados. Essas duas representaes normalmenteso apresentadas no contexto de sistemas contnuos no tempo. No caso derepresentaes no contexto de sistemas lineares discretos pode-se citar os

    modelos ARX, ARMAX, ARMA, ARIMA. No caso de representaes no-lineares citam-se os modelos de Hammersteine de Wiener, modelo NARX,NARMAX,funes radiaisdebase, Redes NeuraisArticais, Neuro-Fuzzy,dentre outras. As descries dessas representaes lineares e no-linearesso encontradas em Aguirre (2007).

    Neste trabalho so usadas representaes lineares e no lineares. Omodelo ARIMA (linear), NARIMA (no-linear), Rede Neuro-Fuzzy (no-linear) e Rede Neural Articial (no-linear) sero descritas no decorrerdeste Captulo.

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    38/110

    14 2 Fundamentao Terica

    2.3.1 Modelos ARIMAUma metodologia bastante utilizada na modelagem de sries tempo-

    rais no-estacionrias foi proposta por Box e Jenkins (1970). Tal meto-dologia consiste em ajustar modelos auto-regressivos integrados de m-dias mveis, ARIMA (do inglsAutoRegressive Integrated Moving Average),uma extenso dos modelos lineares paramtricos ARMA (modelos auto-regressivos de mdias mveis) amplamente divulgados na literatura cien-tca (Aguirre (2007)).

    Para a formulao do modelo ARIMA a partir de uma srie temporal,

    y(k), preciso introduzir os seguintes operadores: Operador de atraso,q 1, denido por

    q 1 y(k) = y(k 1), q m y(k) = y(k m),

    Operador de avano,q+ 1, denido por

    q+ 1 y(k) = y(k + 1), q+ m y(k) = y(k + m),

    Operador de primeira diferena assim denido y(k) = y(k) y(k 1)= (1 q 1) y(k).

    em que = 1 q 1.

    O operador soma,S, tem a seguinte expresso

    Sy(k) =

    j= 0 y(k j) = y(k) + y(k 1)+ . . .

    = (1+ q 1 + q 2 + . . .) y(k),

    Note que

    Sy(k) = (1 q 1) 1 y(k) = 1 y(k),

    ou seja

    S = 1.

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    39/110

    2.3 Representaes Lineares e No-Lineares 15

    Vrias sries temporais, especialmente econmicas e nanceiras, sono-estacionrias (Morettin e Toloi (2006)), mas quandose toma a primeiradiferena, normalmente a srie resultante pode ser considerada estacion-ria2. Por exemplo, a sriey(k) no-estacionria, mas

    W (k) = y(k) y(k 1)= (1 q 1) y(k) = y(k)

    pode ser estacionria.Se W (k) = d y(k) for estacionria, pode-se representarW (k) por um

    modelo ARMA(p,q) da seguinte forma

    p(q p)W (k) = q(q q) (k), (2.1)

    sendo que(k) um processo aleatrio branco (rudo branco).SeW (k) a primeira diferena dey(k), ento a srie temporaly(k) a

    soma (integral) deW (k)epodesermodeladapeloseguintemodeloARIMA

    p(q p) d y(k) = 0 + q(q q) (k), (2.2)

    de ordem ( p,d,q), normalmente referido como ARIMA( p,d,q). p e q so as

    ordens de e , respectivamente, isto , p(q p

    ) = 1 1(q 1

    ) . . . p(q p

    )e q(q q) = 1 1(q 1) . . . q(q q). O parmetro 0 representa a constanteno modelo.

    Explicitando a Equao 2.2 em funo dey(k) e considerandod = 1,tem-se o modelo ARIMA(p,1,q):

    y(k) = (1+ 1) y(k 1)+ (2 1) y(k 2)+ . . .+ ( p p 1) y(k p) p y(k p 1)+ 0 1 (k 1) 2 (k 2) . . . q (k q) + (q)

    . (2.3)

    O modelo 2.3 um modelo linear discreto no tempo que explica o valorda sada y(k) em funo de valores prvios da prpria sada. O modeloNARIMA (do inglsNonlinear Auto Regressive Integrated Moving Average Model) representado da seguinte forma:

    2De acordo com Aguirre (2007) um processo estacionrio se as leis de probabilidadeque o regem no variam com o tempo. Pode-se dizer que um processo estacionrio estem equilbrio estatstico. O conceito de estacionariedade est intimamente ligado ao deinvarincia.

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    40/110

    16 2 Fundamentao Terica

    y(k) = F [(1+ 1) y(k 1)+ (2 1) y(k 2)+ . . .+ ( p p 1) y(k p) p y(k p 1)+ 0 1 (k 1) 2 (k 2) . . . q (k q) + (q)]

    , (2.4)

    sendo que, o grau de no-linearidade, eF[.] uma funo no-linearque pode assumir uma variedade de formas, tais como racional e polino-mial (Aguirre (2007)). Esta ltima satisfatria em muitos casos (Corra(2001); Coelho (2002)). Uma das mais importantes vantagens do modelopolinomial NARIMA que este linear nos parmetros, possibilitandoassim, o uso do mtodo do mnimos quadrados na estimaodos mesmos.Noteque nomodelo (2.1) todas as razesde p(q p) esto fora docrculode raio unitrio (Box et al. (1994); Morettin e Toloi (2006)). Portanto, pode-se escrever o modelo (2.2) da seguinte forma

    (q q) y(k) = q(q q) (k), (2.5)

    em que(q q) um operador autoregressivo no-estacionrio, de ordem p+ d,comd razes iguaisa um, sobre o crculo deraiounitrio, e asrestantes p fora do crculo, isto ,

    (q q) y(k) = p(q p) d = p(q p)(1 q p). (2.6)

    O modelo (2.2) supe que ad-sima diferena da sriey(k) pode serrepresentada por um modelo ARMA. Na maioria dos casos, a primeiraderivada,d = 1, suciente para tornar a srie temporal estacionria, en-quanto que sed > 2 a relao sinal-rudo dos dados na fasede identicaopode ser alterada prejudicialmente.

    Quando a srie corretamente diferenciada, a varincia da srie trans-formada diminui, ao passo que o excesso de diferenas aumentar a vari-ncia. Detalhes sobre a diferenciao de sries temporais quanto ao nvele a inclinao podem ser vistos em Morettin e Toloi (2006).

    2.3.1.1 Previso com Modelos ARIMA

    Nesta seo ser apresentado um mtodo de previso utilizando a re-presentao do modelo ARIMA por Equao de diferenas (discutido an-

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    41/110

    2.3 Representaes Lineares e No-Lineares 17

    teriormente).A idia central prever o valor dey(k + h) supondo que se conhece as

    observaes passadas, isto ,. . . , y(k 2), y(k 1), y(k). Nesse contexto, oinstantek chamado origem das previses eh o horizonte das previses.

    Esse mtodo de previso ser demonstrado utilizando um exemplocom um modelo ARIMA(2,1,2). Suponha que o modelo construdo para asrie temporaly(k) seja um ARIMA(2,1,2) com a seguinte forma

    (1 1q 1 2q 2)(1 q 1) y(k) = (1 1q 1 2q 2) (k),

    ento(1 1q 1 2q 2)(1 q 1) y(k + h) = (1 1q 1 2q 2) (k + h).

    Considerando que

    q 1 y(k) = y(k 1), e y(k + h 1)= yk(h 1),

    ento

    y(k + h) = (1+ 1) y(k + h 1) (1 2) y(k + h 2) 3 y(k + h 3)+ (k + h) 1 (k + h 1)

    2 (k + h 2).

    Logo,

    yk(h) = (1+ 1) yk(h 1) (1 2) yk(h 2) 3 yk(h 3)++ k(h) 1 k(h 1) 2 k(h 2).

    Assim tem-se que

    yk(1) = (1+ 1) y(k) (1 2) y(k 1) 3 y(k 2) 1 (k) 2 (k 1), yk(2) = (1+ 1) yk(1) (1 2) y(k) 3 y(k 1) 2 (k), yk(3) = (1+ 1) yk(2) (1 2) yk(1) 3 y(k), yk(h) = (1+ 1) yk(h 1) (1 2) yk(h 2) 3 yk(h 3), h 4

    Das predies acima, observa-se que:

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    42/110

    18 2 Fundamentao Terica

    os termos de mdias mveis ( (k)) desaparecem parah > q (q aordem da parte MA), pois, no existe este valor parah > q;

    paracalcular yk(h)precisode yk(h 1), yk(h 2),. . . quesocalculadosrecursivamente.

    2.3.1.2 Atualizando as previses

    Inicialmente, determina-seasprevises yk(h+ 1)apartirdeduasorigens:

    (a) k + 1 : yk+ 1(h) = h (k + 1)+ h+ 1 (k) + h+ 2 (k 1)+ , (2.7)(b) k : yk(h + 1) = h+ 1 (k) + h+ 2 (k 1)+ (2.8)

    Subtraindo (2.7) de (2.8) e aps algumas manipulaes obtm-se

    yk+ 1(h) = yk(h + 1)+ h t+ 1. (2.9)

    Dessa maneira, a previso deyk(h + 1), feita no instantek, pode seratualizada quandoum novo dado,y(k+ 1), observado. Assim, a previso yk(h + 1), na origemk+ 1, pode ser realizada, adicionando-se yk(h + 1) ummltiplo do erro de previso(k + 1)= y(k + 1) yk(1).

    2.3.2 Rede Neuro-FuzzyUma rede neuro-fuzzy pode ser denida como sendo umsistema fuzzy3

    que treinado por algum algoritmo derivado da teoria de aprendizado demquina. Este tipo de rede o resultado da unio destes dois modelos.Com isto, tem-se a capacidade das redes neurais em reconhecimento eclassicao, sem esquecer da robustez e habilidade de generalizao.

    Por outro lado, tm-se os sistemas fuzzy que, por meio da suas regrase conjuntos fuzzy, facilitam o entendimento do problema, porque modelao ambiente por meio de uma linguagem prxima da usada pelos especi-alistas. Por exemplo, os sistemas fuzzy tm demonstrado serem bastante

    3A lgica Fuzzy, desenvolvida por Lofti A. Zadeh na Universidade da Califrnia emBerkeley na dcada de 60, combina teoria probabilstica, inteligncia articial e redesneurais para que possa representar o pensamento humano, ou seja, ligar a lingstica e ainteligncia humana, pois, muitos conceitos so melhores denidos por palavras do quepela matemtica (Zadeh (1965)).

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    43/110

    2.3 Representaes Lineares e No-Lineares 19

    consistentes e conveis, quando aplicados a sistemas de controle, reco-nhecimento de padres, interpolao de funes e previso (Cox (1994); Jang (1993)).

    O primeiro aspecto que torna possvel essa integrao o fato de asredes neurais e os sistemas fuzzy serem aproximadores universais. Por-tanto, a rede neuro-fuzzy mantm essa caracterstica fundamental parao desenvolvimento das aplicaes. Outro aspecto que ambos os siste-masmanipulam dados incompletos, imprecisos, complexos e no-lineares,alm de alto grau de abstrao de informao irrelevante para o sistema.

    As redes neuro-fuzzy herdam da rede neural sua capacidade de apren-dizagem, generalizao, classicao, robustez, adaptao e agrupamentode dados comuns emclusters. As redes neurais sempre foram vistas comouma caixa preta, ouseja, no possvelobter o conhecimentosobre asdeci-ses da rede no processode treinamento. O advento das redesneuro-fuzzyquebra este conceito de caixa preta das redes neurais, porque o compor-tamento deste modelo pode ser entendimento atravs da observao dasvariveis lingsticas, das funes de pertinncia, dos relacionamentos en-trada / sadae das prprias regras fuzzy, asquais podemexplicar facilmenteo funcionamento do sistema, devido a simplicidade e proximidade com a

    linguagem humana.A arquitetura ANFIS ( Adaptive Neuro-Fuzzy Inference System) foi pro-posta por Jang (1993), e possivelmente seja o sistema neuro-fuzzy maisconhecido e empregado devido as suas qualidades de bom classicador eprevisor4.

    Estruturalmente, verica-se que a nica limitao na congurao darede para os sistemas adaptativos como o ANFIS que esta deve ser dotipo feedforward (Jang, Sun, e Mizutani (1997)). Apesar dessa mnimarestrio, as redes adaptativas podem ser empregadas em uma amplavariedade de aplicaes, como na tomada de deciso, no processamentode sinais e em controle. A seguir descreve-se a arquitetura do sistema deinferncia ANFIS.

    Arquitetura - Por simplicidade, considere um sistema de infernciafuzzy com duas entradasx e y e uma sadaz. Para um modelo fuzzy

    4Uma possvel extensoaoANFIS o modeloCANFIS(Coative Neuro-Fuzzy Modelling)proposto por Mizutani e Jang (1995). Uma das vantagens deste modelo que ele aceitamltiplas entradas e mltiplas sadas.

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    44/110

    20 2 Fundamentao Terica

    Sugeno de primeira ordem, um conjunto usual de regras se-ento aseguinte:

    Regra 1:Se x A1 e y B1 ento f 1(x, y) = p1x + q1 y + r1,Regra 2:Se x A2 e y B2 ento f 2(x, y) = p2x + q2 y + r2.

    A Figura 2.1 ilustra o mecanismo de raciocnio para esse modelo fuzzySugeno de primeira ordem com duas entradas e duas regras; a arquiteturaANFIS equivalente aquelamostradanaFigura2.2, ondeosns damesma

    camada tmfunes similares. A seguir, passa-se a descrever cada camadado modelo.

    Figura 2.1: Modelo fuzzy Sugeno com duas entradas e e duas regras (Jang(1993)).

    Camada 1 -cada n nesta camada um n adaptativo com uma funon do tipo (denota-se a sada doi-simo n na camadal comoOl,i):

    O1,i = Ai(x), para i = 1, 2, ouO1,i = Bi 2( y), para i = 3, 4, (2.10)

    sendox (ou y) a entrada para o ni e Ai (ouBi 2) um rtulo lingstico(como pequeno ou grande) associado a este n. Em outras palavras,Ol,i a funo de pertinncia parametrizada apropriadamente, tal como afuno sino (bell) generalizada:

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    45/110

    2.3 Representaes Lineares e No-Lineares 21

    Figura 2.2: Arquitetura ANFIS equivalente para o modelo da Figura 2.1(Jang (1993))

    A(x) =1

    1+ x ciai2b , (2.11)

    ai, bi, ci o conjunto de parmetros que determinam funo sino.Camada 2 -cada n nesta camada um n xo rotulado por, cuja

    sada o produto de todos os sinais da entrada:

    O2,i = wi = Ai(x) Bi( y), i = 1, 2. (2.12)

    Cada n de sada dessa camada representa o nvel de disparo ( ringstrength), wi, da regra. Em geral, qualquer outro operador T-norma podeser usado como funo n nessa camada.

    Camada 3 -cada ni nesta camada um n rotulado N. A partir dessacamada tem-se o processo de defuzzicao. A sada desse n, chamadanvel de disparo normalizada, dada pela razo entre oi-simo nvel dedisparo da regra e a soma de todas os nveis de disparo:

    O3,i = wi =wi

    w1 + w2, i = 1, 2. (2.13)

    Camada 4 -Cada n i nesta camada um n adaptativo com uma

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    46/110

    22 2 Fundamentao Terica

    funo n do tipo

    O4,i = wi f i = wi( pix + qi y + ri), (2.14)

    em quewi um nvel de disparo normalizado da camada 3 epi, qi, ri oconjunto de parmetros deste n. Tem-se, ento, um produto entre os n-veis de disparo normalizados e o valor do conseqente da regra em si. Porisso, parmetros nesta camada so denominados parmetros conseqen-tes.

    Camada5-Cadani nestacamadaumnxorotulado , que calculaa sada geral do sistema como a soma de todos os sinais de sua entrada:

    O5,i =i

    wi f i =i wi f ii wi

    . (2.15)

    Note-se que a arquitetura dessa rede adaptativa no nica; pode-secombinarascamadas3e4paraseobterumaredeequivalentecomsomentequatro camadas. Da mesmaforma, possvel tambmnormalizar os pesos

    na ltima camada.Finalmente, a Figura 2.3 (a) mostra uma arquitetura ANFIS que equi-valente a um modelo Sugeno de primeira ordem de duas entradas comnove regras, onde cada entrada tem trs funes de pertinncia associa-das, e a Figura 2.3 (b) ilustra como o espao de entrada bi-dimensional particionado em nove regiesfuzzy sobrepostas (grid), cada uma delas go-vernadas por umaregrafuzzy se-ento. A identicaodosparmetros domodelo ANFIS realizada, em geral, empregando algoritmos de aprendi-zagem hbrida, isto , combinando estimao de mnimos quadrados com

    retropropagao (Mathworks (2001)).O treinamento do modelo ANFIS realizado em duas etapas. Na pri-meira etapa os parmetros dos antecedentes cam xos e os conseqentessoestimados pelo mtodo dosmnimos quadradosordinrios (MQO)5. Jna etapa 2 os parmetros dos conseqentes cam xos e os parmetros dosantecedentes so ajustados pelo algoritmo Gradiente Descendente6 (Jang

    5Veja detalhes do mtodo MQO em (Aguirre (2007)).6Veja detalhes do algoritmo Gradiente Descendente em (Braga, Carvalho, e Ludemir

    (2000)).

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    47/110

    2.3 Representaes Lineares e No-Lineares 23

    Figura 2.3: Arquitetura ANFIS para (a) modelo Sugeno e (b) espao deentrada (Jang (1993)).

    et al. (1997)).Note que a arquitetura dessa rede adaptativa no nica; pode-se

    combinarascamadas3e4paraseobterumaredeequivalentecomsomentequatro camadas. Da mesma forma possvel tambm normalizar os pesosna ltima camada, a Figura 2.3 ilustra uma ANFIS deste tipo. A estruturamostrada na Figura 2.4 utilizada neste trabalho.

    Figura2.4: ArquiteturaANFISparaomodeloSugeno, onde anormalizaodos pesos executada na ltima camada (Jang (1993)).

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    48/110

    24 2 Fundamentao Terica

    2.3.3 Rede Neural ArticialEsta seo faz uma sucinta apresentao das Redes Neurais Articiais

    (RNAs). Maiores informaes a respeito do assunto podem ser encontra-das nos textos (Braga et al. (2000); Haykin (2001)).

    As redes neurais articiais (RNAs) so estruturas matemticas capazesde aprender, memorizar e generalizar determinadassituaes e problemasa elas apresentadas. Uma Rede Neural formada pela interconexo de umdeterminado nmero de nodos (neurnios). Braga et al. (2000) dizem queos neurnios so unidades de processamento no-linear. Toda fundamen-

    tao terica referente s redes neurais articiais pode ser vista com maisdetalhes em Braga et al. (2000); Haykin (2001).Os problemas, aos quais as RNAs so aplicveis, consistem basica-

    mente em situaes onde existam dados, experimentais ou no, que soapresentados rede em uma etapa denominada de treinamento, ondeos pesos sinpticos so ajustados com intuito de que alguma tarefa sejarealizada. Alm da capacidade de aprendizado a partir de exemplos. asredes possuem a capacidade de generalizao, que consiste na habilidadeda mesma em apresentar solues para dados distintos (dados de valida-o), diferentes dos dados apresentados na etapa de treinamento. Bragaet al. (2000) citam que as principais caractersticas das RNAs so: (i) oaprendizado a partir de exemplos; (ii) adaptabilidade; (iii) capacidade degeneralizao; (iv) tolerncia a falhas; e (v) rpida implementao.

    No contexto deste presente trabalho, as RNAs sero aplicadas para aaproximao de funes e para a previso de valores futuros da srie deconsumo de energia de New England e do Estado de Minas Gerais.

    2.3.3.1 Perceptron Multicamadas

    A Perceptron Multicamada mais conhecida por sua sigla MLP, doinglsMultilayer Perceptron. A caracterstica marcante de uma rede MLP que ela pode ter vrias camadas ocultas. A MLP basicamente consistede uma camada de ns, (fontes de entrada), uma ou mais camadas de nsprocessadores ou computacionais (neurnios) ocultos e uma camada desada tambm composta por ns computacionais. A camada formada porneurnios ocultos (camada oculta) recebe este nome porque no h acessoda entrada e nem da sada sobre esta camada.

    Asredes MLPpossuem capacidadede resolverproblemasno-lineares.

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    49/110

    2.3 Representaes Lineares e No-Lineares 25

    As no-linearidades so inseridas nos modelos por meio das funes deativao no-lineares de cada neurnio e da composio de sua estruturaemcamadassucessivas. A funodeativao, tambmchamadadefunode transferncia, uma funo matemtica que, aplicada combinaolinear entre as variveis de entrada e pesos que chegam a determinadoneurnio, retorna ao seu valor de sada, ou seja, determina a relao entreentradas e sadas de cada neurnio da rede. Neste projeto utilizada afuno tangente hiperblica, tanto para a camada de entrada quanto paraa de sada, dada por

    tanh(x) = 21+ e 2x 1. (2.16)

    A funo de ativao tangente hiperblica geralmente usada para a pre-viso de sries temporais (Zhang, Patuwo, e Hu (1998)).

    A Equao 2.16 se aproxima de uma funo degrau, porm passvelde diferenciao tornando possvel o treinamento por mtodos que usamo gradiente. A saday para uma rede MLP com uma camada escondida dada por

    y = N

    j= 1W j f

    n

    i= 1xiwi j + bi + B (2.17)

    Haykin (2001) cita que o modelo Neural multi-camadas, sendo umaproximador universal de funes, capaz de aproximar qualquer funocontnua desde que o nmero de neurnios na camada escondida sejasucientemente grande.

    O algoritmo de treinamento de retropropagao do erro, mais conhe-cido comobackpropagation(Rumelhart e McClelland (1986)), o algoritmomais popular para o treinamento de RNAs multicamadas. Basicamente oalgoritmo consiste de dois passos: a propagao e a retropropagao. Noprimeiro passo, um vetor de entradas aplicado camada de entrada e oseu efeito se propaga pela rede (Equao 2.17) produzindo um conjunto desadas. A resposta obtida pela rede subtrada da resposta desejada paraproduzir um sinal de erro. O segunda passo consiste em propagar essesinal de erro na direo contrria s conexes sinpticas, ajustando-as de

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    50/110

    26 2 Fundamentao Terica

    forma a aproximar as sadas da rede das sadas desejadas.Em uma rede MLP, basicamente, tem-se como parmetros de escolha:

    (i) o nmerode neurnios nacamada deentrada; (ii) o nmero decamadasescondidas e o nmero de neurnios nestas camadas; (iii) o nmero deneurniosnacamada desada. Apesarda literaturacitaralguns algoritmospara realizar a escolha destes parmetros, no existe uma soluo geralque atenda a todos os casos. Dessa forma, essa escolha torna-se parte doproblema e a soluo varia de acordo com cada caso e de acordo com acomplexidade de cada processo.

    Como o problema deste trabalho se resume a previso de sries tem-porais, a escolha do nmero de neurnios na camada de entrada trata-seda escolha dos atrasos (lags) da srie temporal.Novamente este um fatorque depende muito das caractersticas do processo em estudo.

    2.3.3.2 Controle de generalizao

    Um ponto importante a ser observado no treinamento de redes MLP o controle de generalizao. Sabe-se que quando uma rede apresentacomplexidade inferior complexidade do problema ela no conseguir seajustar aos dados e ir apresentar erros elevados, tanto no treinamento,quanto na validao. Essa uma questo que deve ser observada nomomento do treinamento da rede. Uma forma de se tratar este problema o uso do algoritmo chamadoEarly Stopping ou Parada Precoce (Braga et al.(2000)).

    O processo de treinamento de uma RNA pode ser dividido em duasetapas distintas. Na primeira o erro de treinamento e o erro de validaodiminuemmostrandoquea redeest apreendendoasprincipais caracters-ticasdosdadosapresentados. Nosegundo momento o erro de treinamentocontinua a diminuir enquanto que o erro de validao tende a aumentar.Nesse ponto a rede passa e se especializar aos dados do treinamento acar-retandoa perda dacapacidade degeneralizaoe noconseqenteaumentodo erro de de validao. O algoritmo sugere que o treinamento se encerrequando o erro de validao comece a aumentar.

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    51/110

    2.4 Comentrios nais 27

    2.4 Comentrios naisEste Captulo teve como principal nalidade familiarizar o leitor comtcnicas de aproximao de sistemas lineares e no-lineares. Foi discutidotambm fatores que afetam a preciso das previses, tais como, fatoresclimticos, classe de consumidores, assim como a economia, dentre outros.Mtodos de previso de carga usam modelagem matemtica avanada.

    Uma breve reviso bibliogrca foi apresentada mostrando as princi-pais tcnicas que esto sendo abordadas na literatura para a previso decurto, mdio e longo-prazos do consumo de energia eltrica.

    Alguns aspectos abordados neste Captulo sero usados nos Captulosseguintes. No prximo Captulo apresentada a metodologia utilizadaneste trabalho.

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    52/110

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    53/110

    Captulo 3

    Metodologia

    "Todos modelos so errados, mas alguns so teis."

    G.E.P. Box

    Este Captuloapresentaa metodologia utilizadapara a modelagemdassriestemporaisdeconsumodeenergiaeltricadacidadedeNewEnglande do Estado de Minas Gerias.

    Ao longo deste Captulo sero abordados os principais ndices de de-sempenho que so utilizados para quanticar o quo satisfatrio so osresultados das previses dos modelos. Em especial dar-se- nfase na li-teratura, que trata especicamente da previso de longo-prazo no setorenergtico. A descrio das sries temporais de New England e de Mi-nas Gerais sero mostradas. No caso de Minas Gerais, ser mostrada ametodologia para se obter a srie de consumo total.

    A metodologia usada para separar as componentes de uma srie tem-poral, o ltro TCS (Mohr (2005)), ser vista. Logo aps, os procedimentosparaobtenode modelos ARIMA, NARIMA, RNF e RNA sero descritos.

    3.1 ndices de desempenhoEm problemas de previso de sries temporais, uma importante ta-

    refa a de quanticar a qualidade da predio obtida. Isso permite, porexemplo, comparar diversos algoritmos e diversas estruturas de mode-los utilizando ndices de desempenho. A seguir so apresentados algunsdos ndices de desempenho mais utilizados em problemas de previso desries temporais.

    Antes de rever as denies de alguns ndices, necessrio a seguintenomenclatura: a srie temporal a ser predita ser indicada pory(k), e

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    54/110

    30 3 Metodologia

    a previso por y(k). A previso usada neste trabalho a predio dekpassos-a-frente, em quek pode assumir valores de 1 at o horizonte depreviso. Os cinco erros mais usados na literatura so:

    O erro mdio (ME do inglsmean error)

    ME =1N

    N

    k= 1 y(k) y(k), (3.1)

    O erro absoluto mdio (MAE do inglsmean absolute error)

    MAE =1N

    N

    k= 1 y(k) y(k) , (3.2)

    O erro quadrtico mdio (MSE do inglsmean squared error)

    MSE =1N

    N

    k= 1( y(k) y(k))2, (3.3)

    O erro percentual mdio (MPE do inglsmean percentage error)

    MPE =1N

    N

    k= 1

    y(k) y(k) y(k)

    100, (3.4)

    O erro percentual absoluto mdio (MAPE do inglsmean absolute percentage error)

    MAPE =1

    N

    N

    k= 1

    y(k) y(k)

    y(k) 100, (3.5)

    Os ndices de erro (3.1)-(3.5) servem, por exemplo, para comparar doisprevisores. Entretanto, tais ndices no indicam se o desempenho de umdeterminado previsor "razovel". Dependendo do nvel da parcela es-tocstica em uma srie temporal, umMAPE = 10% pode ser um timodesempenho. Semelhantemante, tomando-se uma srie puramente de-terminstica e estacionria, umMAPE = 1% pode indicar um pssimoprevisor. A m de prover ndices que permitam avaliar a qualidade de

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    55/110

    3.1 ndices de desempenho 31

    um previsor relativa aos dados, dene-se a raiz do erro quadrtico mdionormalizado (RMSE do inglsroot mean square error)

    RMSE = N k= 1 ( y(k) y(k))2 N k= 1 ( y(k) y)2

    , (3.6)

    em quey o valor mdio dey(k), sendo que a mdia calculada na janelade identicao (estimao de parmetros ou treinamento). A expresso(3.6) mostra que o erro de previso do modelo sendo avaliado (numerador

    na Equao (3.6)) normalizado pelo erro cometido por umpreditor trivial,que nesse caso nada mais do que o valor mdio dos dados. Assim,valoresRMSE 1 indicam que a ao do previsor sendo avaliado no signicativamente melhor do que simplesmente tomar o valor mdio dosdados, y, e consider-lo como previso. Deve ser notado que a utilidadedo ndice RMSE aumenta medida que a componente estocstica da srietemporaly(k) ser torna dominante.

    Para dados em que a(s) componente(s) determinstica(s) (so) domi-nante(s), outros ndices devem ser usados. Uma alternativa interessante

    UTheil = N k= 1 ( y(k) y(k))2

    N k= 1 ( y(k) y(k 1))2, (3.7)

    que conhecido como estatsticaU de Theil(Theil (1958)). A interpretaodas Equaes3.6 e 3.7 simples. No primeirocaso, descritoacima, o ndicecompara as predies do modelo com a mdia temporal do sinal, que usada comopreditor trivial. Semelhantemente, na estatsticaU de Theil opreditor trivial o valor anterior da srie temporal. Em ambos os casos,valores menores do que a unidade indicam um melhor desempenho emrelaoaopreditorpadroconsiderado(mdiaouumpasso frente). Uma boa comparao de vrios ndices pode ser encontrada em (Fair (1986)).

    Deve ser notado que o previsor trivial noU de Theil apenas umareviso de um passo frente. Isso torna o previsor trivial difcil de sersuperado quando se deseja fazer a previso vrios passos a frente.

    Vale observar que para avaliar corretamente o desempenho de um

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    56/110

    32 3 Metodologia

    determinado previsor, qualquer que seja o ndice usado, o mesmo precisaser calculado em um trecho de dados devalidao, ou seja dados que noforam usados na construo do modelo.

    Na literatura especializada, artigos que trataram especicamente dapredio de longo-prazo no setor energtico utilizaram os seguintes cri-trios de erro: MPE (Al-Saba e El-Amin (1999)), max(MPE) (Al-Saba eEl-Amin (1999)), erros nas unidades de medio (MWh) (Da, Jiangyan, e Jilai (2000)), MSE (Ang e Goh (1991)), MAPE (Fung e Tummala (1993)).Aqui vale a pena ressaltar que em (Kandil, El-Debeiky, e Hasanien (2001))seis diferentes ndices de erro (os cinco das eqs. 3.1-3.5 e mais o desviopadro dos erros) foram usados na avaliao de previses de longo-prazo.Em Makridakis, Wheelwright, e Myndman (1998) a estatsticaU de Theilutilizada para avaliar o desempenho de diversos previsores em problemasde predio de longo-prazo de diversas grandezas.

    Como pode ser constatado, ao contrrio do que acontece em trabalhosna rea de previso de curtssimo prazo, onde o ndice MAPE domina,no h preferncia entre os autores sobre qual ndice de erro utilizar. Issosugere que mais de um ndice deva ser levado em conta na avaliaode diferentes mtodos de previso. Neste trabalho os ndices MPE (3.4),

    MAPE (3.5), RMSE (3.6) eU de Theil (3.7) so considerados para avaliar odesempenho das previses.

    3.2 Descrio dos dadosNeste trabalho so realizados dois estudos de caso distintos. No pri-

    meiro estudo, a previso do consumo de energia eltrica usando dadosda companhia de eltrica de New England, no USA, realizada. E nosegundo estudo realizada a previso do consumo de energia eltrica no

    Estado de Minas Gerais, Brasil. A primeira srie temporal usada paravericar a capacidade preditiva dos modelos, uma vez que o histrico dedados da segunda srie muito pequeno, dicultando, assim, a validao.As sries de consumo so apresentadas nas prximas sees.

    3.2.1 Consumo de New EnglandOs dados de consumo da companhia energtica de New England esto

    disponibilizados na internet (www.iso-ne.com ), e compreendem o con-

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    57/110

    3.2 Descrio dos dados 33

    sumo horrio de energia do ano de 1980 a 1998. Os arquivos disponveisesto no formato Excel e cada arquivo contm 8760 amostras (alguns con-tm 8784 amostras, referentes aos anos bissextos no perodo de 1980 a1998). Assim, as amostras de consumo horrio relativas ao ano de 1980so encontradas no arquivoHourlyData1980.xls , e sucessivamente at oano de 1998 (HourlyData1998.xls ), totalizando dezoito arquivos. Estesarquivos foram unidosnoMatlab e salvosno arquivoNE_hourly.mat ,com166560 amostras horrias (dezoito anos). Como os dados de carga estoagrupados por hora, o valor de demanda e de consumo de cada ponto numericamente o mesmo. Sendo assim, os dados podem ser agrupadospor dia e por ms1.

    A srie temporal de consumo de energia horria total da companhiaeltrica de New England mostrada na Figura (3.1) e a Figura (3.2) exibeo consumo total de energia agrupado mensalmente.

    0 2 4 6 8 10 12 14 16

    x 104

    0.4

    0.6

    0.8

    1

    1.2

    1.4

    1.6

    1.8

    2

    2.2x 10

    4

    Horas

    C a r g a

    ( W h )

    Figura 3.1: Consumo horrio total da cidade de New England referenteao perodo que se estende de janeiro de 1980 a dezembro de 1998. Fonte:ISO-NE.

    O agrupamento mensal dos dados da companhia de New Englandtotaliza 228 amostras.

    1Todas as anlises que so realizadas neste trabalho levam em considerao os dadosagrupados mensalmente.

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    58/110

    34 3 Metodologia

    0 50 100 150 2006

    7

    8

    9

    10

    11

    12x 10

    6

    Meses

    C o n s u m o

    ( W h )

    Figura 3.2: Consumo mensal total da cidade de New England referenteao perodo que se estende de janeiro de 1980 a dezembro de 1998. Fonte:ISO-NE

    .

    3.2.2 Consumo de Minas GeraisNosegundoestudodecasosousadosdadosdaCompanhiaEnergtica

    de Minas Gerais, a CEMIG-Distribuio2. Abase de dadosdisponibilizadapela CEMIG contempla os valores mensais de consumo de energia emwatt-hora (wh) entre dezembro de 1996 e julho de 2006. Para cada classede consumidores, determinadas internamente pela CEMIG, existe umasrie contendo os valores mensais no horizonte temporal citado. As sriesdisponveis so mostrados abaixo:

    residencial ( yre); comercial ( yco);

    industrial ( yin);

    rural ( yru);

    poder pblico ( y pp);2A partir desse ponto CEMIG-Distribuio ser citada apenas como CEMIG.

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    59/110

    3.2 Descrio dos dados 35

    iluminao pblica ( yip); servio pblico ( ysp); consumo prprio ( ycp).A srie de consumo total de energia consiste no somatrio do consumo

    referente s demais sries e denida por

    yto = yre + yco + yin + yru + y pp + yip + ysp + ycp.

    Em uma etapa anterior os dados passaram por um processo de ltra-gem em que as amostras despadronizadasoutliers foram retiradas e subs-titudas por valores obtidos por meio de interpolao polinomial. Paraidenticao deoutliers, foi aplicado o teste de Grubbs (Grubbs (1969)).Esse algoritmo considera que os dados obedecem razoavelmente a umadistribuio normal, ou seja, aqueles pontos que parecem fugir do padroestatstico de uma distribuio gaussiana so caracterizados comooutliers.Retirados osoutliers, a interpolao das sries foi realizada por meio deuma funo que utiliza um polinmio de 3a ordem.

    O procedimento descrito em um relatrio interno (Aguirre, Aguirre,

    Mendes,e Martinez(2006)). Porquestesrelacionadasa condencialidade,os dadossoapresentadoscomescalanormalizada, omitindo-seos valoresreais em (wh) do consumo de energia da companhia. A normalizao dosdados foi feita tal que os valores da srie se situassem dentro do rangeentre 0 e 1. Para isso tem-se:

    yn(k) = y(k) ymax

    , (3.8)

    em que yn(k) o vetor de dados normalizado eymax o maior valor dasriey(k). A srie normalizada apresentada na Figura 3.3. Esta srie dacorresponde a 1 / 8 da energia total distribuda pela CEMIG e contemplaum nvel de tenso de distribuio.

    A Figura 3.3 mostra o comportamento da srie de consumo total queser utilizada como base para obteno dos modelos, j que o objetivo realizara previsodo consumo total da companhia. Algunspontospodemser percebidos claramente por uma simples inspeo visual:

    i) A srie apresenta uma quebra na tendncia no ano de 2001 causadapela crise de abastecimento;

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    60/110

    36 3 Metodologia

    0 20 40 60 80 100 1200.7

    0.75

    0.8

    0.85

    0.9

    0.95

    1

    Meses

    A m p l i t u d e

    Figura 3.3: Srie de consumo mensal total do Estado de Minas Geraisreferente ao perodo que se estende de dezembro de 1996 a julho de 2006.Fonte: CEMIG.

    ii) A componente de tendncia sofre alteraes e apresenta comporta-mentos distintos no pr e ps-racionamento;

    iii) possvel vericar visualmente a existncia de certa sazonalidadenos dados, possivelmente causada pela inuncia de fatores scio-comerciais. importante chamar a ateno para o fato de esta srieser menos irregular do que aquela mostrada na Figura 3.2.

    A prxima seo detalha uma metodologia que usada neste trabalhopara ltrar as componentes das sries temporais: componente de tendn-cia, componente cclica e componente sazonal.

    3.3 Componente Cclica, sazonal e de tendnciaA abordagem de anlise de sries temporais baseados em tendncias

    parte do pressuposto de que uma srie temporal pode ser entendida comoa composio de comportamentos de tendncia, fatores cclicos, variaessazonais, alm de fatores aleatrios representados de maneira genricacomo rudo branco.

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    61/110

    3.3 Componente Cclica, sazonal e de tendncia 37

    Tendncia em uma srie temporal a mudana gradual observada pormeio da variao dos valores da srie ao longo do tempo e que se mantmao se remover os componentesde ciclos, sazonalidades e fatores aleatrios.Quando aplicado ao consumo de energia eltrica, esse conceito normal-mente est relacionado ao comportamento do consumo ao longo do tempodevido alterao correspondente na quantidade de consumidores ou smudanas de perl de clientes percebidas a longo-prazo.

    Ciclos e sazonalidades so comportamentos estocsticos que acontecemde maneira recorrente ao longo de um perodo denido.

    Morettin e Toloi (2006) conceituam que os comportamentos sazonaisso utuaes ocasionadas na srie temporal devido inuncia de algumfator externo de sazonalidade.

    Os componentes de ciclo apresentam um comportamento similar, noentanto, normalmente apresentam comprimento maior que os componen-tes sazonais e no apresentam durao uniforme.

    No caso de sries temporais de energia eltrica comum observar aexistncia de comportamentos recorrentes que caracterizam a sazonali-dade devido a inuncia de fatores exgenos, em diferentes horizontes deobservao. Tais comportamentos podem ser identicados em situaes

    como as descritas a seguir: Variaes anuais, normalmente associadas a inuncia de polticas

    governamentais;

    Variaes regulares ao longo dos meses do ano, devido s mudanasde temperaturacaractersticasdecada pocaquegeramnecessidadesde comportamentos particulares quanto a utilizao de equipamen-tos eletro-intensivos, sobretudo para a classe residencial;

    Comportamentos caractersticos em cada um dos dias da semana,principalmente devido a intensidade das atividades comerciais e in-dustriais;

    Comportamentos caractersticos para cada hora do dia, de acordocom o perl das classes consumidoras.

    Com a remoo das componentes de tendncia, ciclos e sazonalidades,tm-se os componentesresiduais que podem, eventualmente, representarfatores aleatrios para o entendimento do comportamento do consumo.

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    62/110

    38 3 Metodologia

    Considerando que toda srie temporal de energia eltrica possui um com-ponente gerado pela inuncia de fatores aleatrios, mesmo se o compor-tamento exato dos demais componentes da srie forem identicados compreciso, ainda existir divergncia entre os valores previstos pelo modeloe valores observados. Uma vez que a componente residual isolada, amagnitude deste componente pode ser utilizada para se dimensionar opercentual de incerteza que se deve considerar ao se realizar a previso devalores futuros da srie.

    No presente trabalho foi utilizada uma abordagem para identicaode tendncias, ciclos e sazonalidades proposta por Mohr (2005) chamadaltro TCS (Trend Cycle Season). O ltro TCS pode ser entendido comoum mtodo para a decomposio de sries temporais univariadas nascomponentes de tendncia, ciclo e sazonalidade, baseada no ltro HPde Hodrick e Prescott (Hodrick e Prescott (1997)). fundamentada emmodelos estocsticos explcitos tanto para a identicao de tendnciaquanto de ciclos e sazonalidades, permitindo a extrao simultnea dostrs componentes da srie.

    No ltro HP, a tendncia estocstica restrita a um modelo de segundaordem. O ltro TCS uma extensodoltro HPnamedidaemque criaum

    modelodeextraodetendnciadequalquerordemeadicionaummodeloestocstico para a extrao das componentes de ciclo e sazonalidades. Osprocessos cclicos e sazonais denidos no algoritmo TCS assumem que oscomponentes seguem a denio de processos estacionrios ARMA.

    Em (Mohr (2005)) so discutidas as caractersticas dos ltros TCS e apresentadaa demonstraomatemtica do algoritmo. Umaoutratcnica,encontrada em Coelho (2006), verica se h algum padro determinsticona srie temporal alm do comportamento quase-peridico.

    3.4 Procedimentosparaseparaodas componen-tes da srie temporal

    A srie de consumo do Estado de Minas Gerais apresenta apenas 116amostras. Como pode ser visto na Figura 3.3 a srie de consumo do Estadode Minas Gerais apresenta mudana de comportamento, principalmentea partir da amostra 55, onde o racionamento de energia eltrica no pasocorreu devido ao baixo nvel de gua dos reservatrios. Devido a essa

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    63/110

    3.4 Procedimentos para separao das componentes da srie temporal 39

    mudana de dinmica da srie, e tambm por apresentar a componentede tendncia com crescimento bastante elevado, mesmo tendo ocorridoo racionamento, foi preciso modelar o consumo atravs da componentesazonal e tendncia+ ciclos separadas. As componentes de tendncia,sazonalidade e ciclo dos dados da srie temporal de consumo, Figura 3.3,foramseparadosusandoametodologiacitadanase3.3. NaFigura3.4podeobservar as componentes de tendncia, sazonalidade e ciclo, separadaspelo ltro TCS. A Figura 3.5 apresenta a componente de sazonalidade e asoma das componentes de tendncia e ciclo.

    0 20 40 60 80 100 1200.7

    0.8

    0.9

    1

    0 20 40 60 80 100 1200.15

    0.1

    0.05

    0

    0.05

    0.1

    Figura 3.4: Componentes de tendncia (- -), sazonalidade (-.-), ciclo (+ ), econsumo total ().

    A componente sazonalidadefoimantida separadapara servir como en-trada para as representaes no-lineares, pois esta componente apresentaciclos anuais bem denidos. As componentes restantes foram somados(tendncia+ ciclo). Percebe-se na Figura 3.5 que quando a componente c-clica somada a componente de tendncia o resultado uma componenteque acompanha melhor a srie temporal. A partir daqui, quando for ci-tado no texto "componente tendncia", deve-se entender que corresponde soma das componentes de tendncia e ciclo.

    Para as previses livre de 60 passos frente, para a componente de

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    64/110

    40 3 Metodologia

    0 20 40 60 80 100 1200.2

    0

    0.2

    0.4

    0.6

    0.8

    1

    1.2

    Meses

    Figura 3.5: Componentes de tendncia+ ciclo (- -), sazonalidade (-.-), econsumo total ().

    tendncia foi ajustada uma reta com o mesmo coeciente angular do tre-cho referente s observaes 80 a 116, pois a partir dessas amostrasque tendncia do consumo se mostra crescente, desconsiderando assim atendncia pr-racionamento. Assim considerando-se que a tendncia dasobservaes 80 a 116 uma reta a previso de 60 passos frente obtida.

    Para a previso livre de 60passos frenteda srie deNew England nofoi necessrio aproximar a tendncia por uma reta, pois, esta srie de con-sumo possui bastante amostras, uma vez que as previses no extrapolam

    o tamanho da srie.Para obteno de modelos NARIMA tambm foi necessrio retirar a

    componente da tendncia da srie de New England. No entanto, os re-sultados da modelagem usando as representaes Neural e Neuro-Fuzzymostraram-se satisfatrias sem a extrao da componente tendncia.

    Para a srie de consumo do Estado de Minas Gerais o procedimento deseparar a componente de tendncia da srie foi aplicado para obteno demodelos NARIMA, Neurais e Neuro-Fuzzy.

  • 8/6/2019 Dissertacao Mestrado Rogercomp Arima Narima

    65