Análise de consumo de energia de PMEs - ULisboa › downloadFile › ... · eletrica de PMEs de...
Transcript of Análise de consumo de energia de PMEs - ULisboa › downloadFile › ... · eletrica de PMEs de...
Análise de consumo de energia de PMEs
Hugo Miguel Pimenta de Castro Martins
Dissertação para obtenção do Grau de Mestre em
Engenharia Informática e de Computadores
Orientadores: Prof. José Alberto Rodrigues Pereira SardinhaProf. Francisco António Chaves Saraiva de Melo
Júri
Presidente: Prof. Nuno João Neves MamedeOrientador: Prof. Francisco António Chaves Saraiva de Melo
Vogal: Prof. Andreas Miroslaus Wichert
Junho 2017
ii
Agradecimentos
O desenvolvimento da presente dissertacao apenas foi possıvel com o apoio de muitas pessoas, a
todas elas expresso o meu agradecimento, dedicando algumas palavras.
Quero agradecer aos meus orientadores, Professor Jose Alberto Sardinha e Professor Francisco de
Melo, por todo o apoio, sabedoria e disponibilidade com que me orientaram ao longo deste processo
de desenvolvimento da presente dissertacao.
O meu sentido agradecimento a todos os Professores do MEIC (Mestrado em Engenharia In-
formatica e de Computadores) do Instituto Superior Tecnico que acompanharam o meu percurso academico,
enriquecendo os meus conhecimentos, experiencias . . . revelaram-se preciosos, possibilitando que me
tornasse numa pessoa melhor e profissional.
Por ultimo guardo um especial agradecimento aos meus pais, irmaos e restantes familiares, que
foram incansaveis no apoio, carinho e compreensao. Revelaram-se um suporte fundamental durante
todo o meu percurso academico, assim como no culminar do presente trabalho de dissertacao.
. . . a todos, o meu sincero . . . Obrigado!
iii
iv
Resumo
A liberalizacao do mercado de energia eletrica impulsionou o interesse de comercializadores e clien-
tes no desenvolvimento de modelos que elaborem previsoes precisas de consumo de energia eletrica.
Previsoes precisas podem apoiar a tomada de decisao dos fornecedores na determinacao do preco a
cobrar no contrato de fornecimento de energia eletrica de cada cliente. Esta dissertacao tem como ob-
jetivo desenvolver modelos que descrevam adequadamente o comportamento do consumo de energia
eletrica de PMEs de diferentes setores de atividade, medido em perıodos de 15 minutos e diarios, e
que possam ser usados para fazer previsoes precisas a medio prazo. Para atingir esse objetivo, com-
paramos a capacidade preditiva de modelos desenvolvidos por tres tecnicas de modelacao, nomeada-
mente Redes Neuronais Artificiais, Regressao Linear Multipla e Grey Model, na previsao do consumo
de energia eletrica de duas PMEs portuguesas. Com base nos resultados obtidos, concluımos que os
modelos baseados em Redes Neuronais Artificiais apresentaram a capacidade preditiva mais precisa,
comparativamente com os modelos desenvolvidos pelas outras duas tecnicas aplicadas.
Palavras-chave: PMEs, consumos de energia eletrica, capacidade preditiva, Redes Neuro-
nais Artificiais, Regressao Linear Multipla, Grey Model
v
vi
Abstract
The liberalization of the electricity market has increased the interest of suppliers and customers in the
development of models that produce accurate forecasts of electricity consumption. Accurate forecasts
can support the decision-making of suppliers in determining the price to be charged in each customer’s
electricity supply contract. This dissertation aims to develop models that adequately describe the beha-
viour of the electricity consumption of SMEs from different sectors of activity, measured in periods of
15-minute and daily, and that can be used to produce accurate medium-term forecasts. To achieve this
goal, we compared the predictive capacity of models developed by three modelling techniques, namely
Artificial Neural Networks, Multiple Linear Regression and Grey Model, in the forecast of the electricity
consumption of two Portuguese SMEs. Based on the results obtained, we conclude that the models
based on Artificial Neural Networks presented the most accurate predictive capacity, compared to the
models developed by the other two applied techniques.
Keywords: SME, electricity consumption, predictive capacity, Artificial Neural Network, Multiple
Linear Regression, Grey Model
vii
viii
Conteudo
Agradecimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v
Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii
Lista de Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi
Lista de Figuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xv
Lista de Sımbolos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix
Glossario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxi
1 Introducao 1
1.1 Objetivo e desafios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Contribuicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Organizacao da dissertacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Estado da Arte 4
3 Enquadramento e Revisao tecnica 7
3.1 Estrutura empresarial em Portugal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2 Modelos de previsao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.3 Regressao Linear Multipla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.3.1 Estimacao dos parametros do modelo . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.3.2 Coeficiente de determinacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.3.3 Testes de significancia para os coeficientes de regressao . . . . . . . . . . . . . . 11
3.3.4 Series de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.4 Redes Neuronais Artificiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.4.1 Redes Neuronais com multiplas camadas . . . . . . . . . . . . . . . . . . . . . . . 14
3.4.2 Algoritmos de treino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.5 Grey Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.5.1 Tecnica de modelacao GM(1,1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.5.2 Tecnica de modelacao Fourier GM(1,1) . . . . . . . . . . . . . . . . . . . . . . . . 22
3.5.3 Tecnica de modelacao GM(1,N) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.6 Selecao e Comparacao de modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
ix
4 Metodologia Proposta 27
4.1 Apresentacao, tratamento e particionamento dos dados . . . . . . . . . . . . . . . . . . . 27
4.2 Redes Neuronais Artificiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.2.1 Definicao da arquitetura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.2.2 Estrategias de treino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.2.3 Analise dos resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.3 Regressao Linear Multipla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.3.1 Definicao das variaveis independentes . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.3.2 Teste de significancia para os coeficientes de regressao . . . . . . . . . . . . . . 35
4.3.3 Grau de ajustamento dos modelos aos dados . . . . . . . . . . . . . . . . . . . . . 37
4.3.4 Analise dos resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.4 Grey Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.4.1 Tecnica GM(1,1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.4.2 Tecnica Fourier GM(1,1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.4.3 Tecnica GM(1,N) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.5 Metodologia de Avaliacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5 Resultados 46
5.1 Redes Neuronais Artificiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
5.2 Regressao Linear Multipla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
5.3 Grey Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.4 Analise comparativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
6 Conclusoes 65
Bibliografia 65
A Anexos 69
x
Lista de Tabelas
3.1 Criterio de avaliacao de um modelo de previsao, segundo a medida de desempenho MAPE 26
4.1 Estatısticas das observacoes do consumo de energia eletrica das PMEs, medido em
perıodos de 15 minutos e diarios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.2 As variaveis de entrada que foram adicionadas no desenvolvimento dos modelos baseados em
Redes Neuronais Artificiais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.3 Variaveis adicionadas no desenvolvimento dos modelos, com o objetivo de explicar a
variancia do consumo de energia eletrica das PMEs, medido em perıodos diarios. . . . . 35
4.4 Representacao dos dias da semana e feriado (variaveis dummy ), na modelacao do con-
sumo de energia eletrica das PMEs, registado em perıodos diarios. . . . . . . . . . . . . 35
4.5 Probabilidade do coeficiente de cada variavel independente incluıda no desenvolvimento
do modelo nao ser nulo - consumo diario. . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.6 Valores dos coeficientes de determinacao ajustado e resultados obtidos no perıodo de
treino, pelos quatro modelos candidatos, de acordo com a medida de desempenho MAPE
- consumo medido em perıodos de 15 minutos - Regressao Linear Multipla. . . . . . . . . 38
4.7 Valores dos coeficientes de determinacao ajustado e resultados obtidos no perıodo de
treino, pelos quatro modelos candidatos, de acordo com a medida de desempenho MAPE
- consumo medido em perıodos diarios - Regressao Linear Multipla. . . . . . . . . . . . . 38
4.8 Resultados das previsoes produzidas pelos modelos baseados nas metodologias GM(1,1),
Fourier GM(1,1) e GM(1,N), de acordo com a medida de desempenho MAPE (fase de
treino). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.9 Resultados obtidos pelos modelos desenvolvidos pela tecnica GM(1,N), que adicionaram
variaveis quantitativas e variaveis dummy, de acordo com a medida de desempenho
MAPE - perıodo de treino. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.1 Erros das previsoes obtidas pelos modelos baseados em Redes Neuronais que exibi-
ram a capacidade preditiva mais precisa, com e sem a adicao do consumo do dia ante-
rior como variavel de entrada, em cada dia do perıodo de teste - consumo medido em
perıodos de 15 minutos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
xi
5.2 Valores dos parametros incluıdos no desenvolvimento do modelo baseado em Redes
Neuronais Artificiais que apresentou a capacidade preditiva mais precisa, em cada caso
de estudo - consumo medido em perıodos de 15 minutos. . . . . . . . . . . . . . . . . . . 49
5.3 Erros obtidos em cada dia do perıodo de teste pelos modelos que exibiram a capacidade
preditiva mais precisa, com e sem a adicao do consumo do dia anterior como variavel de
entrada, nos dois casos de estudo - RNA - Consumo registado em perıodos de diarios. . 51
5.4 Valores dos parametros incluıdos no desenvolvimento do modelo baseado em Redes
Neuronais Artificiais que apresentou a capacidade preditiva mais precisa, em cada caso
de estudo - consumo medido em perıodos diarios. . . . . . . . . . . . . . . . . . . . . . . 53
5.5 Resultado das previsoes obtidas no perıodo de teste, pelos quatro modelos candidatos,
de acordo com a medida de desempenho MAPE - Consumo medido em perıodos de 15
minutos - Regressao Multipla. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.6 Resultado das previsoes obtidas no perıodo de teste, pelos cinco modelos candidatos,
de acordo com a medida de desempenho MAPE - Consumo medido em perıodos diarios
- Regressao Linear Multipla. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5.7 Erros obtidos em cada dia do perıodo de teste pelos modelos que exibiram a capaci-
dade preditiva mais precisa - Consumo medido em perıodos de 15 minutos e diarios -
Regressao Linear Multipla. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.8 Resultados das previsoes obtidas no perıodo de teste, pelos modelos desenvolvidos pe-
las tres tecnicas Grey Model, de acordo com a medida de desempenho MAPE. . . . . . . 58
5.9 Erros das previsoes obtidas em cada dia do perıodo de teste pelo modelo desenvolvido
pela tecnica Fourier GM(1,1). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.10 Erros das previsoes obtidas em cada dia do perıodo de teste, pelo modelo desenvolvido
pela tecnica GM(1,N) - consumo medido em perıodos diarios. . . . . . . . . . . . . . . . . 62
A.1 PME Industria Metalurgica - Informacoes sobre os parametro do modelo de Regressao
Multipla - Consumo de energia eletrica, registado em perıodos de 15 minutos. . . . . . . 69
A.2 PME Industria da Ceramica e do Vidro - Informacoes sobre cada parametro do modelo de
Regressao Multipla - Consumo de energia eletrica, registado em perıodos de 15 minutos. 70
A.3 Caso de Estudo PME Industria Metalurgica - Informacoes sobre cada parametro do mo-
delo de Regressao Multipla - Consumo de energia eletrica, registado em perıodos diarios. 70
A.4 PME Industria Metalurgica - Erros percentuais (MAPE) nos diferentes dias do perıodo de
teste na previsao do consumo de energia eletrica, registado em perıodos diarios, Modelo
de regressao multipla. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
A.5 PME Industria da Ceramica e do Vidro - Informacoes sobre os parametros do modelo de
Regressao Multipla - Consumo de energia eletrica, registado em perıodos diarios. . . . . 71
A.6 PME Industria da Ceramica e do Vidro - Erros percentuais (MAPE) nos diferentes dias
do perıodo de teste na previsao do consumo de energia eletrica, registado em perıodos
diarios, Modelo de Regressao Multipla. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
xii
A.7 PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica,
registado diariamente no perıodo de treino - Redes neuronais (inclusao do consumo do
dia anterior e algoritmo Resilient Backpropagation) . . . . . . . . . . . . . . . . . . . . . . 73
A.8 PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica,
registado diariamente no perıodo de teste - Redes neuronais (inclusao do consumo do
dia anterior e algoritmo Resilient Backpropagation) . . . . . . . . . . . . . . . . . . . . . . 74
A.9 PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica,
registado diariamente no perıodo de teste - Redes neuronais (inclusao do consumo do
dia anterior e algoritmo Backpropagation) . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
A.10 PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica,
registado diariamente no perıodo de teste - Redes neuronais (exclusao do consumo do
dia anterior e algoritmo Resilient Backpropagation) . . . . . . . . . . . . . . . . . . . . . . 76
A.11 PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica,
registado diariamente no perıodo de teste - Redes neuronais (exclusao do consumo do
dia anterior e algoritmo Backpropagation) . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
A.12 PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica,
registado em perıodos de 15 minutos no perıodo de teste - Redes neuronais (exclusao
do consumo do dia anterior e algoritmo Resilient Backpropagation) . . . . . . . . . . . . . 78
A.13 PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica,
registado em perıodos de 15 minutos no perıodo de treino - Redes neuronais (inclusao
do consumo do dia anterior e algoritmo Resilient Backpropagation) . . . . . . . . . . . . . 79
A.14 PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica,
registado em perıodos de 15 minutos no perıodo de teste - Redes neuronais (inclusao do
consumo do dia anterior e algoritmo Resilient Backpropagation) . . . . . . . . . . . . . . 80
A.15 PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de energia
eletrica, registado em perıodos de 15 minutos no perıodo de teste - Redes neuronais
(exclusao do consumo do dia anterior e algoritmo Resilient Backpropagation) . . . . . . . 81
A.16 PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de energia
eletrica, registado em perıodos de 15 minutos no perıodo de treino - Redes neuronais
(inclusao do consumo do dia anterior e algoritmo Resilient Backpropagation) . . . . . . . 82
A.17 PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de energia
eletrica, registado em perıodos de 15 minutos no perıodo de teste - Redes neuronais
(inclusao do consumo do dia anterior e algoritmo Resilient Backpropagation) . . . . . . . 83
A.18 PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de ener-
gia eletrica, registado diariamente no perıodo de treino - Redes neuronais (inclusao do
consumo do dia anterior e algoritmo Resilient Backpropagation) . . . . . . . . . . . . . . 84
A.19 PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de ener-
gia eletrica, registado diariamente no perıodo de teste - Redes neuronais (inclusao do
consumo do dia anterior e algoritmo Resilient Backpropagation) . . . . . . . . . . . . . . 85
xiii
A.20 PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de ener-
gia eletrica, registado diariamente no perıodo de teste - Redes neuronais (inclusao do
consumo do dia anterior e algoritmo Backpropagation) . . . . . . . . . . . . . . . . . . . . 86
A.21 PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de ener-
gia eletrica, registado diariamente no perıodo de teste - Redes neuronais (exclusao do
consumo do dia anterior e algoritmo Resilient Backpropagation) . . . . . . . . . . . . . . 87
A.22 PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de ener-
gia eletrica registado diariamente no perıodo de teste - Redes neuronais (exclusao do
consumo do dia anterior e algoritmo Backpropagation) . . . . . . . . . . . . . . . . . . . . 88
xiv
Lista de Figuras
3.1 Exemplo de uma Rede Neuronal Artificial (MLP) com duas camadas intermedias. . . . . 14
3.2 Representacao grafica das funcoes de ativacao, Sigmoidal e Linear . . . . . . . . . . . . 16
3.3 Exemplo de uma rede neuronal implementada com o algoritmo de treino Backpropagation. 17
4.1 Consumo de energia eletrica da PME da industria Metalurgica, medido em perıodos de
15 minutos, entre 1 de fevereiro a 30 de abril de 2013. . . . . . . . . . . . . . . . . . . . . 28
4.2 Consumo da PME da industria da Ceramica e do Vidro, no perıodo de 1 de Fevereiro a
30 de Abril de 2013, medido em perıodos de 15 minutos. . . . . . . . . . . . . . . . . . . 29
4.3 Consumo de energia eletrica da PME da industria Metalurgica, medido em perıodos
diarios, entre 1 de fevereiro a 30 de abril de 2013. . . . . . . . . . . . . . . . . . . . . . . 29
4.4 Consumo da PME da industria da Ceramica e do Vidro, no perıodo de 1 de Fevereiro a
30 de Abril de 2013, medido em perıodos diarios. . . . . . . . . . . . . . . . . . . . . . . . 29
4.5 Fluxograma que sintetiza a metodologia adotada no desenvolvimento de um modelo ba-
seado em Redes Neuronais Artificiais que descreva adequadamente o comportamento
do consumo das PMEs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.6 Fluxograma que pretende sintetizar a metodologia utilizada na elaboracao de um modelo
de regressao multipla capaz de modelar o consumo de energia eletrica das PMEs. . . . . 34
4.7 Tarefas elaboradas em cada fase de desenvolvimento de um modelo baseado em cada
uma das tres tecnicas Grey Model, GM(1,1), Fourier GM(1,1) e GM(1,N). . . . . . . . . . 39
4.8 Caso de estudo da PME da industria da Ceramica e do Vidro - Amostra de treino (do lado
direito) e a nova amostra acumulativa dos dados (do lado esquerdo). . . . . . . . . . . . . 40
4.9 Previsoes do consumo de energia eletrica medido em perıodos de 15 minutos (perıodo
de treino) - GM(1,1) e Fourier GM(1,1). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.10 Previsoes do consumo de energia eletrica medido em perıodos de diarios (perıodo de
treino) - GM(1,1) e Fourier GM(1,1). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.11 Previsoes do consumo de energia eletrica medido em perıodos de 15 minutos (perıodo
de treino) - GM(1,N). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.12 Previsoes do consumo de energia eletrica medido em perıodos diarios (perıodo de treino)
- GM(1,N). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
xv
5.1 Media dos erros das previsoes obtidas pelos modelos baseados em Redes Neuronais
em funcao do numero de camadas intermedias - perıodo de teste - consumo medido em
perıodos de 15 minutos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.2 PME da industria Metalurgica - Comparacao entre as previsoes obtidas pelo modelo ba-
seado em Redes Neuronais Artificiais e as observacoes da amostra de teste - consumo
medido em perıodos de 15 minutos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.3 PME da Ceramica e do Vidro - Comparacao entre as previsoes obtidas pelo modelo
baseado em Redes Neuronais Artificiais e as observacoes da amostra de teste - consumo
medido em perıodos de 15 minutos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
5.4 PME da Industria Metalugica - Analise comparativa das previsoes desenvolvidas pelas
Redes Neuronais, com e sem a adicao do consumo do dia anterior - consumo medido
em perıodos diarios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.5 PME da Industria da Ceramica e do Vidro - Analise comparativa das previsoes desen-
volvidas por redes neuronais, implementadas com e sem variavel do consumo do dia
anterior, Consumo registado diariamente. . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.6 Media dos erros das previsoes obtidas pelos modelos baseados em Redes Neuronais
em funcao do numero de camadas intermedias - perıodo de teste - consumo medido em
perıodos diarios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.7 PME da industria Metalurgica - Comparacao entre as previsoes obtidas pelo modelo ba-
seado em Redes Neuronais Artificiais e as observacoes da amostra de teste - consumo
medido em perıodos diarios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.8 PME da Ceramica e do Vidro - Comparacao entre as previsoes obtidas pelo modelo
baseado em Redes Neuronais Artificiais e as observacoes da amostra de teste - consumo
medido em perıodos diarios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.9 PME da industria Metalurgica - Comparacao entre as observacoes da amostra de teste e
as previsoes desenvolvidas pelo modelo de Regressao Linear Multipla - consumo medido
em perıodos de 15 minutos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.10 PME da industria da Ceramica e do Vidro - Comparacao entre as observacoes da amos-
tra de teste e as previsoes desenvolvidas pelo modelo de Regressao Linear Multipla -
consumo medido em perıodos de 15 minutos. . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.11 PME da industria Metalurgica - Comparacao entre as observacoes da amostra de teste e
as previsoes desenvolvidas pelo modelo de Regressao Linear Multipla - consumo medido
em perıodos diarios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5.12 PME da industria da Ceramica e do Vidro - Comparacao entre as observacoes da amos-
tra de teste e as previsoes obtidas pelo modelo de Regressao Linear Multipla - consumo
medido em perıodos diarios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.13 Comparacao entre as previsoes obtidas pelos modelos baseados em GM(1,1) e Fourier
GM(1,1) e as observacoes da amostra de teste - consumo medido em perıodos de 15
minutos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
xvi
5.14 Comparacao entre as previsoes obtidas pelos modelos baseados em GM(1,1) e Fourier
GM(1,1) e as observacoes da amostra de teste - consumo medido em perıodos diarios. . 59
5.15 Comparacao entre as previsoes obtidas pelo modelo baseado em GM(1,N) e as observacoes
da amostra de teste - consumo medido em perıodos de 15 minutos. . . . . . . . . . . . . 60
5.16 Comparacao entre as previsoes obtidas pelo modelo baseado em GM(1,N) e as observacoes
da amostra de teste - consumo medido em perıodos diarios. . . . . . . . . . . . . . . . . 61
5.17 PME Metalurgica - Analise comparativa entre as previsoes obtidas em cada dia do perıodo
de teste, pelos modelos desenvolvidos por cada tecnica de modelacao, e as observacoes
da amostra de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.18 PME Ceramica e do Vidro - Analise comparativa entre as previsoes obtidas em cada dia
do perıodo de teste, pelos modelos desenvolvidos por cada tecnica de modelacao, e as
observacoes da amostra de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
A.1 PME da Industria Metalurgica - Previsoes do consumo de energia eletrica, registado em
perıodos de 15 minutos no perıodo de treino - modelo de Regressao Multipla. . . . . . . 69
A.2 PME da Industria da Ceramica e do Vidro - Previsoes do consumo de energia eletrica,
registado em perıodos de 15 minutos no perıodo de treino - modelo de Regressao Multipla. 69
A.3 PME da Industria Metalurgica - Previsoes do consumo de energia eletrica, registado em
perıodos de 15 minutos no perıodo de treino - Modelo de Regressao Multipla. . . . . . . 71
A.4 PME da Industria da Ceramica e do Vidro - Previsoes do consumo de energia eletrica,
registado em perıodos de 15 minutos no perıodo de treino - Modelo de Regressao Multipla. 71
A.5 PME da Industria Metalurgica - Previsoes do consumo de energia eletrica, registado dia-
riamente no perıodo de treino - Rede Neuronal. . . . . . . . . . . . . . . . . . . . . . . . . 72
A.6 PME da Industria Metalurgica - Previsoes do consumo de energia eletrica, registado em
perıodos de 15 minutos no perıodo de treino - Rede Neuronal. . . . . . . . . . . . . . . . 72
A.7 PME da Industria da Ceramica e do Vidro - Previsoes desenvolvidas do consumo de
energia eletrica, registado diariamente, no perıodo de treino - Rede Neuronal. . . . . . . 73
A.8 PME da Industria da Ceramica e do Vidro - Previsoes desenvolvidas do consumo de
energia eletrica, registado em perıodos de 15 minutos, no perıodo de treino - Rede Neu-
ronal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
xvii
xviii
Lista de Sımbolos
Coeficiente de Regressao
R2 Coeficiente de determinacao.
SQE Soma de quadrados do erro.
SQR Soma de quadrados da regressao.
SQT Soma de quadrados total.
Normalizacao
x0 Valor original.
xmax Valor maximo dos dados originais.
xmin Valor mınimo dos dados originais.
xn Valor normalizado.
Series Fourier
a0, ai, bi Coeficientes de Fourier.
f(t) Funcao periodica.
N Numero de termos de Fourier.
T Perıodo.
Regressao Linear Multipla
β Constante.
β1, ..., βp Coeficientes de regressao.
εt Erros aleatorios.
p Numero de variaveis independentes.
X1, ..., Xt Variaveis independentes.
Y Variavel dependente.
xix
Medidas de desempenho (MAPE e RMSE)
Xi Corresponde ao i-esimo valor previsto.
n Numero total de observacoes.
Xi Corresponde ao i-esimo valor observado.
xx
Glossario
AGO Accumulated Generating Operation
Fourier GM(1,1) Fourier Grey Model (1,1)
GM(1,1) Grey Model (1,1)
GM(1,N) Grey Model (1,N)
GM Grey Model
IAGO Inverse Accumulated Generating Operation
INE Instituto Nacional de Estatıstica
MAPE Mean Absolute Percentage Error
PIB Produto Interno Bruto
PMEs Pequenas e Medias Empresas
RMSE Root Mean Square Deviation
RNA Rede Neuronal Artificial
xxi
xxii
Capıtulo 1
Introducao
A liberalizacao do mercado de energia eletrica foi introduzida em Portugal no inıcio do novo milenio,
possibilitando a extincao das tarifas reguladas de venda de eletricidade, a entrada de novos comercia-
lizadores de energia eletrica (livre concorrencia), precos mais competitivos e um incremento no poder
de escolha do consumidor. Este processo foi implementado de forma gradual entre os anos de 2000
e 2013. Atualmente, no mercado ”livre”, os precos de venda da energia eletrica sao estabelecidos
por cada comercializador, respeitando as regras da concorrencia (Regulamento das Relacoes Comer-
ciais) e com base no valor de mercado. No mercado regulado, os precos de venda da energia eletrica
eram fixados anualmente pela Entidade Reguladora dos Servicos Energeticos (ERSE). A alteracao na
forma como e estabelecido atualmente os precos de venda da energia eletrica, possibilitou aos clientes
celebrarem contratos de fornecimento de energia eletrica a precos mais competitivos [1].
No entanto, a liberalizacao do mercado da energia eletrica nao trouxe apenas oportunidades e van-
tagens a comercializadores e clientes, mas tambem desafios e riscos, por exemplo, a flutuacao dos
precos da energia eletrica e a incerteza da procura de energia eletrica por parte dos clientes. Para
suportar a tomada de decisao na gestao dos riscos associados a liberalizacao, comercializadores e cli-
entes deverao desenvolver modelos que elaborem previsoes precisas de consumo de energia eletrica.
Nos contratos de fornecimento de energia eletrica, os comercializadores cobram, habitualmente, precos
fixos aos seus clientes, que dependem do risco associado ao padrao e volume de consumos de energia
eletrica de cada cliente. Na determinacao do premio de risco a contratualizar com o seu cliente, os co-
mercializadores utilizam as previsoes do seu consumo de energia eletrica. A compreensao desse risco
devera tambem ser uma prioridade para o cliente, de modo evitar as elevadas penalizacoes impostas
pelo seu comercializador, resultante da contratacao excessiva ou por defeito de energia eletrica [2].
A previsao de consumo de energia eletrica e bastante abordada na literatura, tendo em conta o
impacto do preco da energia eletrica nas financas de paıses e empresas. No entanto, a grande mai-
oria dos estudos publicados na ultima decada analisaram o consumo de paıses ou regioes, e nao de
Pequenas e Medias Empresas. Esta dissertacao tem como objetivo desenvolver modelos que descre-
vam adequadamente o comportamento do consumo de energia eletrica de duas PMEs portuguesas de
diferentes sectores de atividade (Metalurgica e da Ceramica e do Vidro), medido em perıodos de 15
1
minutos e diarios, e que possam ser usados para fazer previsoes precisas a medio prazo. A expressao
medio prazo indica o horizonte de previsao dos modelos, cobrindo algumas semanas a um ano.
1.1 Objetivo e desafios
A liberalizacao do mercado de energia eletrica impulsionou o interesse de comercializadores e clientes,
pelo desenvolvimento de modelos que elaborem previsoes precisas de consumos de energia eletrica.
Um modelo que exiba uma boa capacidade preditiva permite suportar a tomada de decisao de co-
mercializadores e clientes na gestao de riscos, por exemplo, a flutuacao do preco da energia eletrica
e a incerteza na procura de energia eletrica por parte dos clientes. Face ao desafio enumerado, na
presente dissertacao definimos o objetivo de desenvolver modelos que descrevam adequadamente o
comportamento do consumo de energia eletrica de duas Pequenas e Medias Empresas portuguesas
de diferentes sectores de atividade (Metalurgica e da Ceramica e do Vidro), medido em perıodos de 15
minutos e diarios, e que possam ser usados para fazer previsoes precisas a medio prazo. Atraves da
previsao do consumo de energia eletrica com diferentes perıodos de mensuracao, apresentamos duas
perspetivas de analise do padrao de consumo das PMEs, uma analise detalhada com as observacoes
medidas em perıodos de 15 minutos e outra global com as observacoes medidas em perıodos diarios.
O desenvolvimento de um modelo que apresente uma boa capacidade preditiva e que possa ser
usado para fazer previsoes precisas do consumo de energia eletrica de PMEs, apresenta inumeros
desafios, p. ex. as propriedades estatısticas dos dados exibem modificacoes ao longo do tempo (dados
nao-estacionarios); a relacao entre o consumo de energia eletrica (variavel dependente) e as variaveis
independentes (variaveis que se julgam relevantes para explicar o comportamento da variavel depen-
dente) pode ser nao linear (nao-linearidade); e variacoes aleatorias de dia para dia (dados altamente
ruidosos). Na presente dissertacao propusemo-nos solucionar os desafios enumerados anteriormente.
1.2 Contribuicao
Nesta dissertacao, contribuımos com a elaboracao de uma analise comparativa da capacidade preditiva
de modelos desenvolvidos por tres tecnicas de modelacao, nomeadamente Redes Neuronais Artificiais,
Regressao Linear Multipla e Grey Model, na previsao do consumo de energia eletrica de duas PMEs
portuguesas de diferentes setores de atividade, medido em perıodos de 15 minutos e diarios.
2
1.3 Organizacao da dissertacao
Esta dissertacao esta organizada em seis capıtulos. No segundo capıtulo, apresentamos uma analise
crıtica de estudos que abordaram a tematica de modelacao e previsao de consumo de energia eletrica,
com o objetivo de identificarmos as principais diferencas entre as solucoes implementadas nos estudos
analisados e as metodologias adotadas nesta dissertacao. No terceiro capıtulo abordamos os con-
ceitos associados as tecnicas de modelacao aplicadas na elaboracao desta dissertacao. No quarto
capıtulo as motivacoes que levaram a aplicacao das tres tecnicas de modelacao adotadas, as tarefas
elaboradas em cada fase de desenvolvimento dos modelos e a medida de desempenho usada para
analisar a capacidade preditiva dos modelos. No capıtulo cinco, analisamos os resultados obtidos no
perıodo de teste, pelos varios modelos desenvolvidos pelas tres tecnicas de modelacao aplicadas nesta
dissertacao (Redes Neuronais Artificiais, Regressao Linear Multipla e Grey Model), na previsao do con-
sumo de energia eletrica de duas PMEs portuguesas, medido em perıodos de 15 minutos e diarios. No
sexto e ultimo capıtulo, apresentamos as principais conclusoes obtidas nesta dissertacao.
3
Capıtulo 2
Estado da Arte
Conforme foi mencionado na introducao da presente dissertacao, a previsao de consumo de energia
eletrica e bastante abordada na literatura, tendo em conta o impacto do preco da energia eletrica nas
financas de paıses e empresas. Segundo Berk [2], a liberalizacao do setor energetico impulsionou o
interesse de participantes ativos no mercado (comercializadores e clientes), no desenvolvimento de mo-
delos que elaborem previsoes precisas de consumo de energia eletrica, com o intuito de minimizarem a
sua exposicao a evolucao do preco da energia eletrica e os riscos inerentes a gestao da energia eletrica.
A energia eletrica e um fator extremamente relevante para o desenvolvimento social e economico dos
paıses e a capacidade de prever com precisao a sua procura, proporciona uma gestao eficiente [3]. A
obtencao de previsoes subestimadas podem causar interrupcoes no fornecimento de energia eletrica,
o que sera devastador para a vida e economia das populacoes, enquanto uma previsao superestimada
levara a desperdıcio de recursos financeiros [4].
Perante essa necessidade, na ultima decada foi publicada uma literatura bastante vasta sobre
a tematica de modelacao e previsao de consumo de energia eletrica, resultado da contribuicao de
inumeros investigadores, que atraves dos seus estudos analisaram a capacidade preditiva de modelos
desenvolvidos por diferentes tecnicas de modelacao. Contudo, a grande maioria dos artigos publicados
na ultima decada utilizaram como casos de estudo paıses ou regioes, e nao empresas, o que motivou
a analise do consumo de energia eletrica de Pequenas e Medias Empresas (PMEs) nesta dissertacao.
Visto ser um tema ainda pouco explorado, existe a necessidade de serem elaborados estudos que
analisem a capacidade preditiva de modelos desenvolvidos por diferentes tecnicas de modelacao, na
previsao do consumo de energia eletrica de PMEs, com o objetivo de determinar a tecnica que permita
desenvolver o modelo mais preciso. Berk [2] menciona que a modelacao e previsao do consumo de
energia eletrica de PMEs e um tema de investigacao ainda recente e que nao existem muitos estudos
publicados, justificado em parte, face a dificuldade de acesso a dados que caracterizam PMEs.
Um estudo semelhante ao proposto na presente dissertacao e apresentado no livro “Modeling and
Forecasting Electricity Demand: A Risk Management Perspective” [2], onde o autor define o objetivo
de desenvolver um modelo estocastico flexıvel para prever o consumo de energia eletrica de PME de
diversos setores de negocios. Para atingir o objetivo proposto, o autor analisou a capacidade predi-
4
tiva de modelos desenvolvidos por uma solucao hıbrida, que combina duas tecnicas de modelacao,
Regressao Linear Multipla e ARIMA. O estudo citado difere da presente dissertacao no numero de
tecnicas de modelacao aplicadas e na periodicidade das observacoes, usou observacoes do consumo
de energia eletrica das PMEs, medidas em perıodos de hora em hora. Nesta dissertacao, contribuımos
com a elaboracao de uma analise comparativa da capacidade preditiva de modelos desenvolvidos por
tres tecnicas de modelacao, nomeadamente Redes Neuronais Artificiais, Regressao Linear Multipla e
Grey Model, na previsao do consumo de energia eletrica de duas PMEs portuguesas de diferentes
areas comerciais (Metalurgica e da Ceramica e do Vidro), medido em perıodos de 15 minutos e diarios.
Atraves da previsao do consumo com diferentes perıodos de mensuracao, apresentamos duas perspeti-
vas de analise do padrao de consumo das PMEs, uma analise detalhada com as observacoes medidas
em perıodos de 15 minutos e outra global com as observacoes medidas em perıodos diarios.
Nos ultimos anos foram publicados inumeros estudos que tambem analisaram a capacidade pre-
ditiva de modelos desenvolvidos por tecnicas de modelacao com caracterısticas distintas (lineares e
nao lineares), na previsao de consumo de energia eletrica de diferentes casos de estudo, por exemplo,
consumo de energia eletrica da India [3], China [5], Grecia [6], Coreia do Sul [7] e do setor industrial
do Irao [8]. Nesses estudos foram aplicadas as tecnicas, Redes Neuronais Artificiais e Regressao Li-
near Multipla. A capacidade das Redes Neuronais Artificiais em modelar relacoes complexas, lineares
ou nao lineares, entre o consumo de energia eletrica e as variaveis independentes (variaveis relevan-
tes para explicar o comportamento do consumo), permitiu desenvolver os modelos com a capacidade
preditiva mais precisa, comparativamente com os modelos obtidos pela Regressao Linear Multipla.
Os estudos citados apresentam diferencas relevantes em comparacao com a presente dissertacao,
p. ex. nao usaram como caso de estudo o consumo de energia eletrica de PMEs, na periodicidade das
observacoes (consumos medidos em perıodos anuais) e no numero de tecnicas de modelacao aplica-
das. A utilizacao de observacoes medidas em perıodos curtos, conforme e explorado neste estudo,
confere um conjunto de desafios que nao se colocam em observacoes medidas em perıodos anuais,
como a presenca de multiplas sazonalidades (diaria, semanal, anual), que interferem significativamente
no desenvolvimento de um modelo que exiba uma boa capacidade preditiva. Existem ainda fatores que
promovem modificacoes anomalas na sazonalidade diaria e semanal do consumo de energia eletrica
das PMEs. Fatores que estao relacionados com a ocorrencia de dias atıpicos, por exemplo, feriados,
ferias ou dias de ponte. Nesta dissertacao propusemo-nos solucionar os desafios enumerados.
No artigo [9] foi elaborada uma analise comparativa da capacidade preditiva de modelos desen-
volvidos pelas tecnicas de modelacao, ARIMA e Redes Neuronais Artificiais, na previsao de consumo
de energia eletrica do estado de Victoria, Australia, medido em perıodos anuais. Numa fase inicial do
desenvolvimento da presente dissertacao, ponderamos a aplicacao da tecnica ARIMA, motivada pela
precisao dos resultados apresentados nos artigos [10, 11]. No entanto, quando aplicada a modelar o
consumo de energia eletrica das PMEs, medido em perıodos de 15 minutos e diarios, a sua capacidade
preditiva ficou aquem do esperado. A imprecisao dos resultados obtidos esteve relacionada a com a in-
capacidade desta tecnica em representar o padrao de consumo de dias atıpicos, por exemplo, feriados
ou pontes, tratando-os como dias “normais”. Nestes dias atıpicos, o padrao de consumo das PMEs e
5
fortemente afetado, onde apenas e observado um consumo residual, devido a ausencia de producao
nas PMEs. Face a incapacidade dos modelos ARIMA em desenvolverem previsoes precisas, pro-
curamos uma alternativa que permitisse tratar de forma otimizada, todas as caracterısticas do consumo
de energia eletrica das PMEs, e optamos pela aplicacao da tecnica de modelacao, Regressao Linear
Multipla, que apresenta como vantagem comparativamente com os modelos ARIMA, possibilitarem a
adicao de variaveis independentes na elaboracao dos modelos (variaveis que se julgam relevantes para
explicar o comportamento do consumo de energia eletrica das PMEs).
Nesta dissertacao foi analisada a capacidade preditiva de modelos baseados em Redes Neuro-
nais Artificiais com varias arquiteturas e estrategias de treino, nomeadamente diferentes camadas in-
termedias, numero de neuronios intermedios, combinacoes de variaveis de entrada e criterios de con-
vergencia. Atraves dessa analise foram identificados os valores dos parametros que foram incluıdos
no desenvolvimento do modelo que apresentou a capacidade preditiva mais precisa, na previsao do
consumo de energia eletrica de cada caso de estudo, medido em perıodos de 15 minutos e diarios. Um
estudo relacionado com o proposto nesta dissertacao e apresentado no artigo de [6], onde foi anali-
sada a capacidade preditiva de modelos baseados em Redes Neuronais Artificiais com varios valores
nos seus parametros, nomeadamente, diferentes algoritmos de treino, camadas intermedias, neuronios
intermedios e funcoes de ativacao, com o objetivo de determinar os valores dos parametros que foram
incluıdos no modelo com a capacidade preditiva mais precisa, na previsao do consumo da Grecia.
O consumo de energia eletrica de diferentes regioes da China, foram utilizados como casos de
estudo nos artigos [12, 13, 14, 15], com o objetivo de analisar a capacidade preditiva de modelos de-
senvolvidos pela tecnica de modelacao Grey Model, GM(1,1). No artigo [16] foi analisada a capacidade
preditiva da tecnica Grey Model, GM(1,N), na previsao do consumo de energia eletrica de Guangzhou,
China. A tecnica Grey Model, GM(1,N), apresenta a vantagem de permitir a adicao de variaveis inde-
pendentes para explicar o comportamento da variavel dependente (consumo de energia eletrica do caso
de estudo), comparativamente com a tecnica GM(1,1) que usa apenas a serie temporal em analise. Os
artigos citados anteriormente usaram observacoes medidas em perıodos anuais.
A ausencia de estudos que analisem a capacidade preditiva de modelos desenvolvidos pela tecnica
de modelacao Grey Model, na previsao de consumos de energia eletrica medidos em perıodos redu-
zidos, p. ex. 15 minutos ou diarios, motivou a sua aplicacao nesta dissertacao. Com a elaboracao
deste estudo contribuımos com uma analise a capacidade preditiva de modelos desenvolvidos por tres
tecnicas Grey Model com diferentes caracterısticas, GM(1,1), Fourier GM(1,1) e GM(1,N), na previsao
do consumo de energia eletrica de duas PMEs, medido em perıodos de 15 minutos e diarios.
6
Capıtulo 3
Enquadramento e Revisao tecnica
Neste capıtulo abordamos os conceitos associados as tres tecnicas de modelacao aplicadas nesta
dissertacao (Redes Neuronais Artificiais, Regressao Linear Multipla e Grey Model), no desenvolvimento
de modelos que possam ser usados para prever o consumo de energia eletrica de PMEs, assim como
a medida de desempenho usada para analisar a capacidade preditiva dos modelos obtidos. Na seccao
3.1 destacamos a importancia das Pequenas e Medias Empresas na estrutura empresarial em Portugal.
3.1 Estrutura empresarial em Portugal
De acordo com o estudo publicado pelo INE (Instituto Nacional de Estatıstica) a 17 de marco de 2016,
sobre os indicadores economicos e financeiros das empresas nao financeiras portuguesas, referentes
ao ano de 2014, as pequenas e medias empresas (PMEs) assumem uma importancia determinante
na estrutura empresarial portuguesa. No ano de 2014, existia 1 126 344 PMEs, representando 99.9%
das empresas nao financeiras sediadas em Portugal, onde apenas 973 eram grandes empresas. Os
postos de trabalho criados pelas PMEs (2 764 311) equivaleram a 80% dos empregos das empresas
nao financeiras. As PMEs contribuıram com mais de metade dos negocios efetuados na estrutura
empresarial portuguesa (59.3%), gerando um volume de negocio de 191 273 mil milhoes de euros [17].
3.2 Modelos de previsao
Uma das tarefas mais frequentes em analise de dados e tentar desenvolver um modelo que descreva
adequadamente o comportamento da amostra de dados do problema em analise (p. ex. o consumo de
energia eletrica de uma PME), pois permite que o modelo obtido possa ser usado para fazer previsoes
sobre novas observacoes do mesmo problema. Estes modelos sao obtidos com base numa amostra
de treino, composta por um conjunto de observacoes de uma variavel dependente (variavel cujo com-
portamento se pretende modelar) e tambem por valores de variaveis independentes (variaveis que se
julgam relevantes para descrever o comportamento da variavel dependente) [18].
7
Existem inumeras tecnicas de modelacao que podem ser aplicadas no desenvolvimento de um mo-
delo de previsao. As tecnicas de modelacao definem a forma como e modelada a relacao entre a
variavel dependente e cada variavel independente, dado o objetivo de desenvolver um modelo que
descreva o comportamento da variavel dependente e que possa ser usado para fazer previsoes sobre
novas observacoes dessa variavel, de acordo com os valores definidos nas variaveis independentes.
Por exemplo, suponhamos que dispomos de uma amostra de dados com o numero de colaborados,
unidades produzidas, identificador do mes e o consumo de energia eletrica de uma determinada PME
(dados medidos em perıodos mensais). Em face destes dados poderia haver o interesse em desen-
volver um modelo que fosse capaz de, dado o numero de colaboradores, unidades produzidas e o
identificador do mes, prever o valor do consumo de energia eletrica da PME. Nas proximas seccoes
apresentamos os principais conceitos relacionados com as tres tecnicas de modelacao aplicadas nesta
dissertacao, na modelacao do comportamento do consumo de energia eletrica de duas PMEs portu-
guesas, designadamente a Regressao Linear Multipla, Redes Neuronais Artificiais e Grey Model.
3.3 Regressao Linear Multipla
A Regressao Linear Multipla e uma tecnica de modelacao usada no desenvolvimento de um modelo que
descreva a relacao linear entre uma variavel dependente (variavel cujo comportamento se pretende
modelar) e duas ou mais variaveis independentes (variaveis que se julgam relevantes para explicar
a variancia da variavel dependente). Modelo que pode ser usado para fazer previsoes sobre novas
observacoes da variavel dependente, com base nos valores definidos nas variaveis independentes
[19].
Uma forma pratica de determinar se a relacao entre duas variaveis e linear, ou nao linear, e atraves
da analise do diagrama de dispersao dos dados [20]. Se os dados estiverem distribuıdos em torno
de uma linha reta que mostre uma taxa estavel de incremento, ou decremento, podemos dizer que
existe uma relacao linear entre as variaveis [21]. Por exemplo, suponha que uma determinada em-
presa deseja estimar o impacto do incremento do numero de unidades produzidas sobre o valor do
seu consumo de energia eletrica. Atraves da analise do diagrama de dispersao dos dados, a empresa
determinou que, por cada incremento de 100 unidades produzidas, o valor do seu consumo de energia
eletrica incrementa 150 kWh, o que indica que existe uma relacao linear entre o numero de unidades
produzidas e o valor do consumo de eletricidade da empresa. Caso a relacao seja nao linear, os dados
estarao distribuıdos em torno de uma linha curva, como resultado de uma taxa instavel de incremento,
ou decremento, nos dados de uma das variaveis. A utilizacao desta tecnica para descrever relacoes
nao lineares entre variaveis, geralmente, nao e satisfatoria, uma vez que a Regressao Linear Multipla
pressupoe que a relacao entre a variavel dependente e cada uma variaveis independentes e linear [22].
O desenvolvimento de um modelo de regressao linear multipla que descreva a relacao linear entre
uma variavel dependente Y e as p variaveis independentes resulta da aplicacao da seguinte equacao:
Y = β0 + β1X1 + β2X2 + ...+ βpXp + ε, (3.1)
8
em que Y corresponde a variavel dependente (estimada pelo modelo), X1, ..., Xp as p variaveis in-
dependentes ou explicativas, β0, β1, ..., βp os parametros ou coeficientes de regressao e εi os erros
aleatorios. β0 e a constante do modelo. Os parametros βj , j = 1, ..., k representam a variacao esperada
na variavel dependente Y para cada unidade de variacao em xj [22].
O modelo que nos permite descrever a i-esima observacao, yi, da variavel dependente Y , e dada pela
seguinte equacao:
yi = β0 + β1xi1 + β2xi2 + ...+ βpxip + εi, (3.2)
i=1,...,n.
Para se proceder ao ajustamento do modelo apresentado na equacao 3.2 e conveniente expressar as
operacoes matematicas utilizando notacao matricial, uma vez que simplifica os calculos face ao numero
elevado de parametros. O modelo apresentado na equacao 3.2 e um sistema de n equacoes que pode
ser reescrito em notacao matricial da seguinte forma:
Y = Xβ + ε (3.3)
onde,
Y =
y1...
yn
, X =
1 x11 x12 · · · x1k
1 x21 x22 · · · x2k...
......
...
1 xn1 xn2 · · · xnk
, β =
β0
β1...
βk
, ε =
ε1...
εk
(3.4)
• Y e um vetor (n× 1), cujos elementos correspondem as observacoes da variavel dependente;
• X e uma matriz de dimensao (n× (p+ 1)), cujas linhas sao preenchidas com as observacoes das
variaveis independentes;
• β e um vetor coluna (p + 1) × 1, cujos elementos sao os valores dos parametros do modelo,
β0, β1, ..., βp.
• ε e um vetor de dimensao n× 1, cujos elementos sao os erros aleatorios.
A construcao de um modelo de regressao linear multipla e realizada em tres fases. Na primeira fase
procede-se a estimacao dos parametros do modelo. Na fase seguinte, avalia-se o grau de ajustamento
do modelo estimado aos dados. Finalmente, avalia-se o contributo de cada variavel independente
incluıda na construcao do modelo, para explicar a variancia da variavel dependente. Se o modelo
estimado for inadequado, deve ser ponderada a construcao do modelo sem as variaveis independentes
que nao contribuıram significativamente para explicar a variancia da variavel dependente e repetem-se
os passos anteriores, de modo a otimizar o grau de ajustamento do modelo aos dados.
9
3.3.1 Estimacao dos parametros do modelo
O objetivo desta fase e estimar os valores dos parametros, ou tambem denominados por coeficientes
de regressao. No processo de estimacao dos parametros do modelo e usado o metodo dos mınimos
quadrados, que essencialmente tenta obter os valores dos parametros que minimizam a soma dos
quadrados dos erros (SQE) das previsoes desenvolvidas pelo modelo sobre a amostra de treino.
SQE =
n∑i=1
ε2i = εT ε = (Y −Xβ)T (Y −Xβ) (3.5)
O estimador dos mınimos quadrados β sera a solucao (em ordem a β) das seguintes equacoes:
∂SQE∂β
= 0⇔ XTXβ = XTY (3.6)
Para resolver estas equacoes (em ordem a β) multiplicam-se ambos os membros, a esquerda, por
(XTX)−1, obtendo-se os valores estimados dos parametros do modelo:
β = (XTX)−1XTY (3.7)
O modelo de regressao ajustado, correspondente a 3.2, e obtido da seguinte forma:
yi = β0 +
k∑j=1
βjxij (3.8)
i=1,...,n
ou, em notacao matricial,
Y = Xβ (3.9)
3.3.2 Coeficiente de determinacao
Identificado o modelo e estimados os seus parametros, resta-nos avaliar se o modelo obtido e adequado
a descrever a variancia da variavel dependente, antes de o utilizar para fazer previsoes. Uma das formas
de medir o grau de ajustamento de um modelo aos dados e atraves da utilizacao do coeficiente de
determinacao multipla, R2, que indica a proporcao da variancia da variavel dependente que e explicada
pelo modelo obtido [21]. O valor do coeficiente de determinacao multipla e definido da seguinte forma:
R2 =SQRSQT
= 1− SQESQT
(3.10)
O valor deste coeficiente esta compreendido entre 0 e 1. Por exemplo, o coeficiente R2 apresenta
um valor de 0.95, isso significa que 95% da variacao da variavel dependente e explicada pelo modelo.
- A soma de quadrados total, SQT , mede a variacao total das observacoes em torno da sua media,
SQT = Y TY −(∑ni=1 yi)
2
n= Y TY − ny2, (3.11)
10
- A soma de quadrados da regressao, SQR, mede a quantidade de variacao da variavel dependente
que e explicada pelo modelo,
SQR = βTXTY −(∑ni=1 yi)
2
n= βTXTY − ny2, (3.12)
- A soma de quadrados do erro (residual), SQE , mede a variacao que nao e explicada pelo modelo,
SQE = Y TY − βTXTY. (3.13)
onde n corresponde ao numero de observacoes da amostra de treino, p o numero de variaveis inde-
pendentes e y = 1n
∑ni=1 yi .
Contudo, um valor significativo no coeficiente de determinacao (R2) nao implica que o modelo apre-
sente um bom ajustamento a amostra de treino, uma vez que a adicao de novas variaveis ao modelo
promove sempre o incremento do valor deste coeficiente, sem ter em conta se a variavel e ou nao es-
tatisticamente significativa. Por este motivo R2 nao sera um bom indicador do grau de ajustamento do
modelo [22]. Alguns investigadores preferem utilizar o coeficiente de determinacao ajustado:
R2ajust. = 1−
SQE
n−pSQT
n−1
= 1− (n− 1
n− p)(1−R2). (3.14)
O coeficiente R2ajust. fornecer uma ideia mais precisa da proporcao de variacao da variavel depen-
dente explicada pelo modelo, uma vez que tem em conta o numero de variaveis independentes. Ao
contrario do que acontece com o coeficiente R2, o valor do coeficiente R2ajust. nao aumenta sempre
que sao adicionadas novas variaveis independentes ao modelo. Se forem adicionadas variaveis inde-
pendentes desnecessarias, o valor do coeficiente R2ajust. na maior parte dos casos decresce [22].
3.3.3 Testes de significancia para os coeficientes de regressao
No caso de o modelo obtido se revelar inadequado a descrever a variancia da variavel dependente,
devemos identificar as variaveis independentes que enfraqueceram o grau de ajustamento do modelo
aos dados, de modo a ponderarmos a sua construcao sem as respetivas variaveis. Para atingirmos
esse objetivo, devemos avaliar o contributo de cada variavel independente para explicar a variancia
da variavel dependente. Incluir variaveis independentes que nao contribuem significativamente para
explicar a variancia da variavel dependente, normalmente, enfraquecem o grau de ajustamento do
modelo aos dados. O contributo de uma variavel independente xj , incluıda no desenvolvimento de um
modelo com p variaveis independentes, para explicar a variancia de uma variavel dependente Y, pode
ser avaliado com a realizacao de um teste de significancia ao respetivo parametro βj :
- Hipotese nula
H0 : βj = 0 (3.15)
11
- Hipotese alternativa
H0 : βj 6= 0 (3.16)
- Estatıstica de teste
T0 =βj
se(βj
) (3.17)
- Regiao de rejeicao
|T0| > Tt = Tα/2 [n− p] (3.18)
onde,
- βj corresponde ao valor estimado do parametro (coeficiente de regressao) da variavel independente
j;
- se(βj) a estimativa do erro padrao do parametro (coeficiente de regressao) βj , que corresponde a
raiz quadrada da variancia estimada para o j-esimo coeficiente de regressao, ou seja,
se(βj) =√σ2Cjj (3.19)
sendo Cjj o j-esimo da diagonal principal da matriz C (eq. 3.20), correspondente a βj .
C =(XTX
)−1=
C00 C01 C02
C10 C11 C12
C20 C21 C22
(3.20)
- σ2 a variancia estimada do erro, que e obtida atraves da divisao da soma dos quadrados do erro pela
diferenca entre o numero de observacoes (n) e o numero de variaveis independentes (p),
σ2 =SQEn− p
(3.21)
A nao rejeicao da hipotese nula H0, fornece-nos a indicacao de que devemos ponderar a construcao
do modelo sem a variavel independente xj . A hipotese nula pode ser rejeitada, com um grau de
significancia α, no caso do valor obtido pela estatıstica de teste T0 ser superior ao valor de Tt (valor
tabelado da distribuicao t de Student) com n – p graus de liberdade. Uma probabilidade inferior a 90%
do parametro bj nao ser nulo, leva-nos a ponderar a construcao do modelo sem a variavel xj [18].
12
3.3.4 Series de Fourier
Nesta dissertacao recorremos a uma tecnica matematica, denominada Series de Fourier, para mo-
delar a sazonalidade do consumo de energia eletrica das PME, medido em perıodos de 15 minutos.
De acordo com o teorema de Fourier, qualquer funcao periodica pode ser representada como uma
combinacao linear de senos e cossenos [23]. Uma funcao periodica f(t), com um perıodo T , pode ser
representada como uma serie de Fourier:
f(t) =a02
+
N∑n=1
[ancos
(2πn
Tt
)+ bnsin
(2πn
Tt
)](3.22)
em que f(t) e uma funcao periodica, T o perıodo, 2πT a frequencia fundamental e N o numero de
termos de Fourier (o valor maximo de N e metade do perıodo escolhido) [24]. Quanto maior o numero
de termos da serie, mais precisa sera a aproximacao a funcao periodica [25]. Os coeficientes de Fourier
a0, an, bn sao calculados da seguinte forma:
a0 =2
T
∫ T
0
f(t)dt, (3.23)
an =2
T
∫ T
0
f(t)cos
(2πn
Tt
)dt, (3.24)
bn =2
T
∫ T
0
f(t)sin
(2πn
Tt
)dt, (3.25)
n=1,..., N.
Os coeficientes (seno e cosseno) de cada termo de Fourier foram incluıdos na construcao dos
modelos de Regressao Linear Multipla como variaveis independentes, com objetivo de descrever a
sazonalidade do consumo de energia eletrica das PMEs, medido em perıodos de 15 minutos.
3.4 Redes Neuronais Artificiais
A capacidade das Redes Neuronais Artificiais em modelar relacoes funcionais complexas, lineares ou
nao lineares, entre a variavel dependente e cada uma das variaveis independentes, tornam esta tecnica
de modelacao, uma solucao extremamente atrativa a aplicar em casos reais, comparativamente com
a tecnica de modelacao, Regressao Linear Multipla, que assume que a relacao entre as variaveis e
linear. Essa capacidade possibilita, normalmente, o desenvolvimento de modelos com uma capacidade
preditiva mais precisa. O desenvolvimento de um modelo baseado em Redes Neuronais Artificiais
envolve um conjunto de tarefas:
- Normalizacao dos dados;
- Definicao da arquitetura: numero de variaveis de entrada (independentes), camadas intermedias
e respetivo numero de neuronios intermedios, neuronios de saıda e funcoes de ativacao;
- Definicao do algoritmo de treino e criterio de convergencia.
13
Nas proximas subseccoes abordamos os conceitos associados a cada tarefa envolvida no processo
de desenvolvimento de um modelo baseado em Redes Neuronais Artificias.
3.4.1 Redes Neuronais com multiplas camadas
Nas ultimas decadas, foram implementadas varias arquiteturas de Redes Neuronais Artificias, contudo,
as Redes Neuronais Perceptron com multiplas camadas (MLP) prevalecem como a arquitetura mais
generalizada [26] [27]. A sua arquitetura em cascata confere as Redes Neuronais (MLP), a capacidade
de modelar relacoes complexas e nao lineares, entre as variaveis de entrada (variaveis independentes)
e a saıda desejada (variavel dependente). Na figura 3.1 e ilustrado um exemplo de uma Rede Neuronal
com multiplas camadas (MLP). Com base na analise da figura 3.1 constatamos que a Rede Neuronal e
composta por varias camadas de neuronios (camada de entrada, intermedia e de saıda), em que cada
uma delas desempenha uma funcao especıfica.
Figura 3.1: Exemplo de uma Rede Neuronal Artificial (MLP) com duas camadas intermedias (imagemretirada do livro [28]).
A primeira camada, definida como camada de entrada, possui uma serie de variaveis de entrada,
onde sao apresentadas as observacoes das variaveis independentes, que formam a amostra de treino.
Cada variavel de entrada esta posteriormente ligada a um conjunto de neuronios intermedios, res-
ponsaveis por descrever a relacao entre as variaveis de entrada e a saıda desejada (variavel depen-
dente). No exemplo ilustrado na figura 3.1, sao apresentadas duas camadas intermedias, no entanto o
numero destas camadas e variavel, estando dependente da complexidade do problema. Cada neuronio
intermedio, por sua vez, esta ligado aos neuronios de saıda, onde sao apresentados os resultados (pre-
visoes) obtidos pela rede neuronal. As ligacoes entre neuronios tem associado a si um peso, que con-
fere a importancia dessa ligacao no contexto da rede neuronal. O ajustamento iterativo dos pesos das
ligacoes, permite a rede neuronal descrever a relacao entre as variaveis de entrada e a saıda desejada
[18].
No desenvolvimento de um modelo baseado em Redes Neuronais Artificiais e necessario determinar
os parametros da sua arquitetura: numero de variaveis de entradas, camada(s) intermedia(s), neuronios
na(s) camada(s) intermedia(s) e neuronios de saıda [27]. Para alem da arquitetura, tambem deverao
ser implementadas as seguintes tarefas: normalizacao dos dados, escolha das funcoes de ativacao,
14
algoritmo de treino e do criterio de convergencia [29].
Numero de variaveis de entradas: Determinar o numero de variaveis de entrada e relativamente sim-
ples, correspondendo ao numero de variaveis independentes que pretendemos fornecer na construcao
do modelo para explicar o comportamento da variavel dependente.
Numero de camadas intermedias e respetivo numero de neuronios: O numero de camadas in-
termedias e respetivo numero de neuronios apresentam um papel determinante na obtencao de resul-
tados precisos pela Rede Neuronal, uma vez que sao os neuronios presentes nas camadas intermedias
que permitem descrever a relacao entre as variaveis de entrada e a saıda desejada (variavel depen-
dente). Inumeros estudos fazem referencia que apenas uma camada intermedia e suficiente para mode-
lar o comportamento da variavel dependente. Contudo, mencionam que podera ser necessario definir
um numero significativo de neuronios intermedios, o que provocara um aumento do tempo de treino
e uma deterioracao da capacidade de generalizacao da rede neuronal, o que e de todo indesejado
[26, 29].
Numero de neuronios de saıda: O numero de neuronios de saıda corresponde ao horizonte temporal
da previsao.
Normalizacao dos dados: Apos a escolha dos dados que serao usados no treino das Redes Neuronais
Artificias, e pratica comum a preparacao dos mesmos, de forma a desenvolvermos um modelo que
descreva adequadamente a relacao entre a saıda desejada (variavel dependente) e as variaveis de
entrada [30]. O objetivo passa por garantir que todas as variaveis de entrada apresentem o mesmo
peso no inıcio do treino das Redes Neuronais. Outra motivacao inerente a normalizacao dos dados,
esta relacionada com a escolha das funcoes de ativacao, que produzem resultados num determinado
domınio valores, nesse caso a normalizacao devera obedecer a esse domınio [26]. Neste estudo foram
adotadas funcoes de ativacao do tipo sigmoidal nas camadas intermedias, que apresentam um domınio
de valores entre 0 e 1. A normalizacao para um domınio de valores entre 0 e 1 e obtida atraves da
aplicacao de uma transformacao linear:
xn =x0 − xminxmax − xmin
(3.26)
onde xn e o valor normalizado, x0 o valor observado, xmin e xmax o valor mınimo e maximo dos
dados.
Funcoes de ativacao: As funcoes de ativacao sao usada para limitar a amplitude da saıda de cada
neuronio [27]. Na construcao de uma Rede Neuronal Perceptron com multiplas camadas (MLP) e
pratica comum a adocao de funcoes de ativacao nao lineares nas camadas intermedias, do tipo sigmoidal
(eq. 3.28), pois permitem descrever relacoes complexas, nao lineares, entre as variaveis de entrada e
a saıda desejada (variavel dependente), enquanto na camada de saıda uma funcao linear (eq. 3.27),
que apresenta a vantagem de nao limitar os resultados possıveis a obter pela rede neuronal, uma vez
que nao convergem assimptoticamente [30]. Na figura 3.2 e apresentada a representacao grafica das
funcoes de ativacao, Sigmoidal e Linear.
15
• Funcao de ativacao linear, domınio de valores [−∞, +∞]
f(x) = x (3.27)
• Funcao de ativacao do tipo sigmoidal, domınio de valores [0,1]
f(x) =1
1 + e−x(3.28)
Figura 3.2: Representacao grafica das funcoes de ativacao, Sigmoidal e Linear (fonte [28])
3.4.2 Algoritmos de treino
A plasticidade neuronal confere ao cerebro humano a capacidade de aprender a partir da sua ex-
periencia, num processo onde sao reforcadas as ligacoes sinapticas entre os neuronios que conduzi-
ram a uma ”resposta correta”, ou enfraquecidas as ligacoes que levaram a obtencao de uma ”resposta
incorreta”[28]. O processo descrito anteriormente serviu de inspiracao a elaboracao dos algoritmos de
treino, que permitem as Redes Neuronais Artificiais modelar relacoes complexas, linear ou nao lineares,
entre uma variavel objetivo (variavel dependente) e n variaveis de entrada (variaveis independentes),
atraves da modificacao iterativa dos pesos das ligacoes entre os neuronios. De forma resumida, os
algoritmos de treino estabelecem as regras na modificacao dos pesos das ligacoes, com o objetivo de
determinar os pesos ideais que levem a minimizacao do erro quadratico medio (MSE), entre a saıda de-
sejada (observacoes da variavel dependente) e os resultados obtidos pela rede neuronal. O algoritmo
de treino mais utilizado em Redes Neuronais com multiplas camadas e o algoritmo Backpropagation.
Algoritmo Backpropagation
No algoritmo Backpropagation, as observacoes das variaveis de entrada, x1, x2, ..., xn, sao propagadas
atraves da rede, da esquerda para a direita (Figura 3.3), e consoante os resultados obtidos na saıda
da rede, propaga para tras os erros desses resultados, e1, e2, ..., el, de forma a modificar os pesos das
ligacoes entre os neuronios para que da proxima vez (iteracao) a rede neuronal produza resultados
mais precisos. O sımbolo wij denota o peso da ligacao entre o neuronio i na camada de entrada
e o neuronio j na camada intermedia, e wjk o peso entre o neuronio j da camada intermedia e o
neuronio k da camada de saıda [28]. O treino de uma rede neuronal artificial com o algoritmo de treino
Backpropagation envolve uma serie de passos, que serao descritos de seguida:
16
Figura 3.3: Exemplo de uma rede neuronal implementada com o algoritmo de treino Backpropagation(imagem retirada do livro [28]).
- 1o passo: Inicializacao. Os pesos das ligacoes entre neuronios sao inicializados com valores
aleatorios uniformemente distribuıdos num pequeno intervalo de valores:
(−2.4
Fi,+
2.4
Fi
)(3.29)
em que Fi e o numero de entradas (ligacoes) do neuronio de entrada i.
- 2o passo: Ativacao. O valor atual de saıda do neuronio j da camada intermedia e calculado da
seguinte forma:
yj(p) = f
[n∑i=1
xi(p)× wij(p)
], (3.30)
em que n e o numero de entradas (ligacoes) do neuronio j na camada intermedia, f a funcao de
ativacao, xi o neuronio i da camada de entrada e wij o peso entre o neuronio j da camada de
entrada e o neuronio i da camada intermedia.
O valor atual de saıda do neuronio k da camada de saıda e calculado da seguinte forma:
yk(p) = f
m∑j=1
xjk(p)× wjk(p)
, (3.31)
em que m e o numero de entradas do neuronio k da camada de saıda, f a funcao de ativacao,
xjk o neuronio j da camada de intermedia e wij o peso entre o neuronio j da camada intermedia
e o neuronio k da camada de saıda.
- 3.o passo (a): Determinar o peso da ligacao para um neuronio da camada de saıda.
17
∆wjk(p) = α× yj(p)× δk(p) (3.32)
onde α e a taxa de aprendizagem, uma constante positiva, e δk(p) representa o gradiente do erro
do neuronio j da camada intermedia.
δk(p) = yk(p)× [1− yk(p)]× ek(p) (3.33)
onde ek(p) representa o erro entre o valor obtido pela rede, yk(p), e o valor desejado yi(p) na
iteracao p:
ek(p) = yi(p)− yk(p) (3.34)
O algoritmo backpropagation aplica uma correlacao ∆wjk(p) ao peso sinaptico wjk(p):
wjk(p+ 1) = wjk(p) + ∆wjk(p) (3.35)
- 3.o passo (b): Determinar o peso da ligacao para um neuronio da camada intermedia.
∆wij(p) = α× xi(p)× δj(p) (3.36)
onde α e a taxa de aprendizagem, uma constante positiva, e δj(p) representa o gradiente do erro
do neuronio j da camada intermedia.
δj(p) = yj(p)× [1− yj(p)]×l∑
k=1
δk(p)× wjk(p) (3.37)
onde l e o numero de neuronios na camada de saıda.
O algoritmo backpropagation aplica uma correlacao ∆wij(p) ao peso sinaptico wij(p):
wij(p+ 1) = wij(p) + ∆wij(p) (3.38)
- 4o Passo: Incrementar a iteracao p por 1, (p+1), voltar ao 2o passo e repetir o processo ate que o
criterio de convergencia selecionado seja satisfeito.
Algoritmo Resilient Backpropagation
As Redes Neuronais Artificiais com multiplas camadas sao normalmente configuradas com funcoes de
ativacao do tipo sigmoidal nas camadas intermedias, que comprimem um intervalo infinito de valores
de entradas num intervalo finito de valores de saıda. Os valores de saıda situam-se no intervalo [0,1].
As funcoes sigmoidais sao caracterizadas pelo facto do seu declive tender para zero quando o valor
18
da entrada se aproxima de −∞ ou +∞, o que representa um problema quando e usado o algoritmo
Backpropagation para treinar uma rede neuronal com funcoes de ativacao nas camadas intermedias,
uma vez em que o gradiente pode ter uma magnitude muito baixa. Valores pequenos no gradiente
originam pequenas atualizacoes nos pesos, mesmo que ainda estejam distantes dos valores otimos
[31].
O algoritmo de treino Resilient Backpropagation elimina os efeitos ineficientes da pequena mag-
nitude das derivadas parciais, onde apenas o sinal da derivada e utilizado na atualizacao do peso.
Atraves dessa alteracao, este algoritmo apresenta, normalmente, uma maior rapidez de convergencia,
comparativamente com o algoritmo Backpropagation. No algoritmo em analise, o valor da atualizacao
de cada peso e determinado individualmente, ∆ij , sendo incrementado por um fator +∆ij sempre que
o sinal da derivada nao varia em duas iteracoes sucessivas. Da mesma forma, o valor de atualizacao
e decrementado por um fator −∆ij , quando o sinal da derivada muda em relacao a iteracao anterior.
Se a derivada for zero, o valor da atualizacao permanecera o mesmo. Enquanto os pesos oscilarem, o
valor de atualizacao do peso vai sendo decrementado, caso contrario esse valor e incrementado [31].
∆wij(p) =
−∆
(t)ij if∂E
(t)
∂wij> 0,
+∆(t)ij if∂E
(t)
∂wij< 0,
0 else
(3.39)
em que ∂e(p)
∂wijcorresponde a derivada parcial do erro, e(p), em relacao ao peso da ligacao wij .
O valor da atualizacao ∆ij e modificado de acordo com as seguintes regras:
∆(t)ij =
η+ ·∆(t−1)
ij , if∂E(t−1)
∂wij· ∂E
(t)
∂wij> 0
η− ·∆(t−1)ij , if∂E
(t−1)
∂wij· ∂E
(t)
∂wij< 0
∆(t−1)ij , else
(3.40)
onde η+ e η− sao constantes, 0 < η− < 1 < η+.
O algoritmo Resilient Backpropagation aplica uma correlacao ∆wij(p) ao peso sinaptico wij(p):
wij(p+ 1) = wij(p) + ∆wij(p) (3.41)
Criterio de convergencia
A estrategia ideal para interromper o treino de uma rede neuronal, e definida quando esta encontra-se
otimamente treinada, isto e, quando a rede neuronal modelou adequadamente o comportamento da
variavel dependente. Significa que a suspensao devera ser desencadeada exatamente no momento
em que o erro obtido a saıda da rede neuronal tenha atingindo o seu valor mınimo, de forma a evitar
uma interrupcao precoce. No entanto, se a otimizacao for alem desse ponto, podera resultar num
excesso de treino, definido na literatura como overtraining ou overfitting. Um modelo sobre ajustado e
claramente indesejado, pois modelou as pequenas particularidades da amostra de treino, perdendo a
sua capacidade de generalizacao [18].
19
Existem inumeros criterios de convergencia sugeridos na literatura para determinar o momento in-
dicado para interromper o treino de uma rede neuronal, p. ex. quando nao e observada uma melhoria
relevante no erro quadratico medio entre a saıda desejada e o padrao de saıda gerado pela rede neu-
ronal, entre duas iteracoes, ou quanto e atingindo um determinado numero de iteracoes [32].
3.5 Grey Model
A ultima tecnica de modelacao aplicada nesta dissertacao, denominada Grey Model, ou pela sigla
GM(n,m), apresenta como principal caracterıstica a capacidade de desenvolver modelos que descrevam
o comportamento de series temporais com poucas observacoes (mınimo quatro observacoes), atraves
da utilizacao de equacoes diferenciais [24] [33]. Esta capacidade apresenta-se como uma vantagem
comparativamente com as tecnicas mais comuns, p. ex. Redes Neuronais Artificiais ou Regressao
Linear Multipla, que requerem uma amostra de maior dimensao. Na sigla GM(n,m), n indica a ordem
da equacao diferencial e m o numero de variaveis incluıdas no desenvolvimento do modelo [34].
Nesta dissertacao, analisamos a capacidade preditiva de modelos desenvolvidos pela tecnica de
modelacao Grey Model com diferentes parametros (numero de variaveis incluıdas), e por uma tecnica
de modelacao hıbrida que combina a tecnica Grey Model e uma tecnica matematica, denominada
Series de Fourier. Nas proximas subseccoes apresentamos os conceitos associados as tres tecnicas
Grey Model aplicadas neste estudo, nomeadamente GM(1,1), Fourier GM(1,1) e GM(1,N).
3.5.1 Tecnica de modelacao GM(1,1)
A configuracao mais comum da tecnica de modelacao Grey Model, denominada GM(1,1), usa apenas
uma variavel (variavel dependente) e uma equacao diferencial de primeira ordem para desenvolver um
modelo que descreva o comportamento dessa variavel [24]. O desenvolvimento de um modelo baseado
na tecnica GM(1,1) engloba uma serie de passos, descritos nos proximos pontos:
A serie temporal da variavel em analise e definida por X(0):
X(0) = (x(0)(1), x(0)(2), ..., x(0)(n)), n ≥ 4 (3.42)
em que n e o numero de observacoes da serie temporal.
• 1o Passo: Suavizar a aleatoriedade das observacoes. A tecnica GM(1,1) apresenta o ar-
gumento de que suavizando a componente aleatoria da serie temporal X(0) e possıvel inferir a
correlacao entre as observacoes. Para atingir o objetivo proposto, as observacoes da serie tem-
poralX(0) sao submetidas a um operador denominado Accumulating Generation Operator (AGO),
onde obtemos uma nova serie temporal (acumulativa) X(1):
X(1) = (x(1)(1), x(1)(2), ..., x(1)(n)), n ≥ 4 (3.43)
onde,
20
x(1)(k) =
k∑i=1
(x(0)(i)), k = 1, 2, ..., n (3.44)
A sequencia media gerada, Z(1) em relacao a X(1) e definida por:
Z(1) = (z(1)(1), z(1)(2), ..., z(1)(n)) (3.45)
onde z(1)(k) e o valor medio de duas observacoes adjacentes:
z(1)(k) = 0.5x(1)(k) + 0.5x(1)(k − 1), k = 2, 3, ..., n. (3.46)
• 2o Passo: Desenvolvimento do modelo baseado na tecnica GM(1,1). A nova serie temporal
(acumulativa), X(1), e aplicada a uma equacao diferencial de primeira ordem, com o objetivo de
desenvolver um modelo que descreva a correlacao entre as observacoes.
dx(1)(t)
dt+ ax(1)(t) = b (3.47)
em que o parametro a corresponde ao coeficiente de desenvolvimento, que reflete a tendencia
das observacoes, e o parametro b ao coeficiente de correlacao, que reflete a relacao entre as
observacoes. Os parametros a e b sao obtidos a partir da seguinte equacao:
[a, b]T = (BTB−1
)BTY (3.48)
onde,
Y = [x(0)(2), x(0)(3), ..., x(0)(n)]T , (3.49)
e,
B =
−z(1)(2) 1
−z(1)(3) 1...
...
−z(1)(n) 1
(3.50)
A solucao geral da equacao 3.47 e dada por:
x(1)p (k + 1) =
[x(0)(1)− b
a
]e−ak +
b
a(3.51)
onde x(1)p (k + 1) corresponde ao valor de x(1)(k + 1) obtido pelo modelo. Neste passo, as pre-
visoes obtidas pelo modelo ainda estao afetadas pela aplicacao do operador acumulativo (AGO).
21
• 3o Passo: Reverter o processo acumulativo. As previsoes produzidas pelo modelo obtido sao
submetidas a um operador denominado Inverse Accumulating Generation Operator (IAGO), para
reverter o processo acumulativo (AGO), atraves da subtracao de previsoes adjacentes.
x(0)p (k + 1) = x(1)p (k + 1)− x(1)p (k) (3.52)
3.5.2 Tecnica de modelacao Fourier GM(1,1)
Nesta dissertacao foi introduzida uma tecnica de modelacao hıbrida, denominada Fourier GM(1,1), que
combina a tecnica GM(1,1) e uma tecnica matematica baseada no teorema de Fourier. A aplicacao
desta tecnica hıbrida permite melhorar a capacidade preditiva dos modelos desenvolvidos pela tecnica
GM(1,1), onde recorremos a uma tecnica matematica, denominada Series de Fourier, para modelar a
sazonalidade dos dados. O desenvolvimento de um modelo baseado em Fourier GM(1,1) engloba uma
serie de passos:
• 1o Passo: Estimar a serie residual. As observacoes que compoem a serie residual, corres-
pondem a diferenca entre os valores da amostra de treino e os valores previstos pelo modelo
desenvolvido pela tecnica de modelacao GM(1,1), conforme e apresentado na seguinte equacao:
ε(0)(k) = x(0)(k)− x(0)p , (3.53)
k=2,3,...,n.
onde,
ε(0) = (ε(0)(2), ..., ε(0)(n))), (3.54)
• 2o Passo: Modelar a sazonalidade dos dados. A tecnica matematica, Series de Fourier, foi
usada para modelar a sazonalidade da serie residual. A serie residual ε(0)(k) pode ser represen-
tada como uma serie de Fourier:
ε(0)(k) =a02
+
z∑i=1
[aicos
(2πi
Tk
)+ bisin
(2πi
Tk
)], k = 2, ..., n, (3.55)
onde T = n− 1 indica o perıodo da serie residual e z = |(n−12
)− 1| o numero de termos.
• Estimar os coeficientes de Fourier. Os coeficientes de Fourier a0, an, bn sao obtidos:
C = (PTP )−1PT ε(0). (3.56)
onde,
C = [a0a1b1a2b2...anbn]T. (3.57)
22
e,
P =
1/2 cos
(2 2πT
)sin(2 2πT
)cos(2 2π2T
)sin(2 2π2T
)... cos
(2 2πzT
)sin(2 2πzT
)1/2 cos
(3 2πT
)sin(3 2πT
)cos(3 2π2T
)sin(3 2π2T
)... cos
(3 2πzT
)sin(3 2πzT
)... ... ... ... ... ... ... ...
1/2 cos(n 2πT
)sin(n 2πT
)cos(n 2π2
T
)sin(n 2π2
T
)... cos
(n 2πz
T
)sin(n 2πz
T
)
(3.58)
• Melhorar a capacidade preditiva do modelo. De forma a efetivar a melhoria na capacidade
preditiva do modelo desenvolvido pela tecnica GM(1,1), os novos valores da serie residual, obtidos
na aplicacao da tecnica matematica, Series de Fourier, sao adicionados aos valores previstos pelo
modelo.
x(0)pf (k) = x(0)p + ε(0)p (k), (3.59)
k=2,3,..., n.
3.5.3 Tecnica de modelacao GM(1,N)
A configuracao mais complexa da tecnica de modelacao Grey Model, denominada GM(1,N), usa N
variaveis independentes na construcao do modelo (variaveis que se julgam relevantes para explicar o
comportamento da variavel dependente) e uma equacao diferencial de primeira ordem para desenvolver
um modelo que descreva a relacao entre uma variavel dependente (variavel cujo comportamento se
pretende modelar) e as N variaveis independentes [34]. O desenvolvimento de um modelo baseado na
tecnica de modelacao GM(1,N) engloba uma serie de passos, descritos nos proximos pontos:
• 1o Passo: Determinar a variavel dependente, X(0)1 , e as N variaveis independentes. Nesta
dissertacao foi usada como variavel dependente o consumo de energia eletrica de duas PMEs.
X(0)1 = (x
(0)1 (1), x
(0)1 (2), ..., x
(0)1 (n)) (3.60)
em que n indica o numero de observacoes da variavel dependente.
Apos a escolha da variavel dependente, necessitamos de definir as variaveis independentes que
serao usadas para explicar o comportamento da variavel dependente.
x(0)i = (x
(0)i (1), x
(0)i (2), ..., x
(0)i (n)), (3.61)
i = 2, ..., N .
onde X(0)i corresponde a i-esima variavel independente, n o numero de observacoes da variavel
independente i, e N − 1 o numero de variaveis independentes.
23
• 2o Passo: Suavizar a aleatoriedade da amostra de treino. A tecnica GM(1,N) apresenta o
argumento de que suavizando a componente aleatoria das observacoes da variavel dependente
e dos valores das variaveis independentes e possıvel inferir a correlacao entre a variavel depen-
dente e as variaveis independentes. Para atingir o objetivo proposto, as observacoes da variavel
dependente e os valores das variaveis independentes sao submetidos a um operador denominado
Accumulating Generation Operator (AGO), onde obtemos novas series temporais (acumulativas):
X(1)j (k) =
k∑g=1
X(0)j (g), (3.62)
onde, j = 1, 2, ..., N e k = 1, 2, ..., n.
• 3o Passo: Desenvolvimento de um modelo baseado na tecnica GM(1,N). Esta tecnica de
modelacao utiliza uma equacao diferencial de primeira ordem para desenvolver um modelo que
descreva a correlacao entre uma variavel dependente X1 e as N variaveis independentes.
dx(1)1
dt+ ax
(1)1 =
N∑i=2
bix(1)i (3.63)
onde o parametro a corresponde ao coeficiente de desenvolvimento, que reflete a tendencia das
observacoes da variavel dependente, e os parametros b aos coeficientes de correlacao, que refle-
tem a relacao entre a variavel dependente e cada variavel dependente. Os parametros a e b sao
estimados da seguinte forma:
a = [BTB]−1BTY. (3.64)
onde,
a = [a, b1, ..., bN ]T , (3.65)
B =
−z(1)1 (2) x
(1)2 (2) · · · x
(1)N (2)
−z(1)1 (3) x(1)2 (3) · · · x
(1)N (3)
......
......
−z(1)1 (n) x(1)2 (n) · · · x
(1)N (n)
, (3.66)
z(1)1 (k) =
1
2(x
(1)1 (k) + x
(1)1 (k − 1)) (3.67)
k=2,. . . ,n.
e,
24
Y =
x(0)1 (2)
x(0)1 (3)
...
x(0)1 (n)
(3.68)
• A solucao geral da equacao 3.63 e dada na forma:
x(1)(k + 1) =
[x(1)1 (0)− 1
a
N∑i=2
bix(1)i (k + 1)
]e−ak +
1
a
N∑i=2
bix(1)i (k + 1) (3.69)
• 4o Passo: Reverter o processo acumulativo. As previsoes produzidas pelo modelo obtido sao
submetidas a um operador denominado Inverse Accumulating Generation Operator (IAGO), para
reverter o processo acumulativo (AGO), atraves da subtracao de previsoes adjacentes.
x(0)1 (k + 1) = x(1)(k + 1)− x(1)(k) (3.70)
3.6 Selecao e Comparacao de modelos
Dado o objetivo de desenvolver um modelo que possa ser usado para fazer previsoes fiaveis de um
determinado problema, somos confrontados com a questao de qual a melhor tecnica de modelacao
para o obter. Na ausencia de um conhecimento previo que nos ajude a determinar a tecnica que permita
desenvolver o modelo com a capacidade preditiva mais precisa, resta-nos entao a experimentacao.
O objetivo da experimentacao e comparar um conjunto de modelos alternativos, obtidos nao so por
diferentes tecnicas de modelacao, mas tambem com diferentes valores nos seus parametros. Definidos
os modelos que queremos considerar, necessitamos ainda de definir qual o criterio para os comparar,
ou seja, o que e importante para a aplicacao em analise. Possıveis alternativas incluem a rapidez de
obtencao dos modelos (importante em problemas com um grande conjunto de dados) e a capacidade
preditiva dos modelos. A capacidade preditiva e o criterio mais comum, e e aferida com recurso a uma
medida de desempenho [18]. As medidas de desempenho permitem avaliar a diferenca entre os valores
previstos pelos modelos e os valores observados. MAPE (Mean absolute percentage error ) e RMSE
(Root Mean Squared Error ) sao as medidas de desempenho mais usadas na literatura.
A medida de desempenho MAPE permite medir o erro medio absoluto entre as previsoes obtidas
por um determinado modelo e os valores observados (valores efetivos). Apresenta como vantagem,
comparativamente com a medida de desempenho RMSE, a apresentacao do resultado num valor per-
centual, o que facilita a sua interpretacao, assim como a independencia da escala dos dados, que
proporciona uma analise comparativa entre os resultados obtidos de diferentes casos de estudo [35]. O
valor da medida de desempenho MAPE e calculado da seguinte forma:
MAPE =1
n
n∑i=1
∣∣∣Xi − Xi
∣∣∣Xt
∗ 100, (3.71)
25
Tabela 3.1: Criterio de avaliacao de um modelo de previsao, segundo a medida de desempenho MAPE [12, 13]
MAPE (%) Qualidade da Previsao<10 Previsao com elevada precisao
10-20 Previsao boa20-50 Previsao razoavel>50 Previsao imprecisa
ondeXi corresponde ao i-esimo valor observado, Xi ao i-esimo valor previsto e n o total de observacoes.
Na tabela 3.1 apresentamos os criterios que permitem classificar a capacidade preditiva de um
modelo de previsao, segundo a medida de desempenho MAPE. Atraves da sua analise, constatamos
que idealmente os modelos devem apresentar um erro inferior a 10%, de modo a classificarmos a
sua capacidade preditiva de elevada precisao. A obtencao de um erro superior a 50% indica que a
capacidade preditiva do modelo e imprecisa. Nos nıveis intermedios, constatamos que um erro entre
10% e 20%, classifica a capacidade preditiva do modelo como boa, enquanto um erro entre 20% e
50%, como razoavel [12, 13].
Relativamente a medida de desempenho RMSE, permite estimar o desvio padrao do erro entre
os valores previstos pelo modelo e os valores observados. Apresenta como principal desvantagem a
dependencia da escala dos dados. O valor da medida RMSE e calculado da seguinte forma:
RMSE =
√√√√ 1
n
n∑i=1
(Xi − Xi)2, (3.72)
ondeXi corresponde ao i-esimo valor observado, Xi ao i-esimo valor previsto e n o total de observacoes.
26
Capıtulo 4
Metodologia Proposta
Na presente dissertacao, definimos o objetivo de desenvolver modelos que descrevam adequadamente
o comportamento do consumo de energia eletrica de duas PMEs portuguesas de diferentes sectores de
atividade (Metalurgica e da Ceramica e do Vidro), medido em perıodos de 15 minutos e diarios, e que
possam ser usados para fazer previsoes precisas. Para atingir o objetivo proposto, elaboramos uma
analise comparativa da capacidade preditiva de modelos desenvolvidos por tres tecnicas de modelacao,
nomeadamente, Redes Neuronais Artificiais, Regressao Linear Multipla e Grey Model.
De acordo com as caracterısticas dos dados, p. ex. a presenca de multiplas sazonalidades (diaria,
semanal e anual) e a ocorrencia de dias atıpicos (feriados, ferias ou dias de ponte), que promovem
modificacoes anomalas na sazonalidade diaria e semanal do consumo de energia eletrica das PMEs,
foram definidos tres criterios na escolha das tres tecnicas de modelacao aplicadas nesta dissertacao: i)
tecnicas com caracterısticas distintas (lineares e nao lineares), com o objetivo de enriquecer a diversi-
dade de tecnicas aplicadas neste estudo; ii) as tecnicas permitem a adicao de variaveis independentes
na construcao dos modelos, com o objetivo de solucionar a ocorrencia de dias atıpicos e representar
a sazonalidade do consumo das PMEs, e iii) a implementacao de uma tecnica de modelacao pouco
explorada na modelacao e previsao de consumo de energia eletrica, medido em perıodos reduzidos.
4.1 Apresentacao, tratamento e particionamento dos dados
Os dados utilizados nesta dissertacao, correspondem as observacoes do consumo de energia eletrica
de duas PMEs portuguesas de diferentes sectores de atividade (Metalurgica e da Ceramica e do Vidro),
medidas em perıodos de 15 minutos, tendo por base o horizonte temporal de 1 de fevereiro a 30 de
abril de 2013, considerando um total de 8544 observacoes. Atraves da analise dos dados fornecidos
pelas PMEs, foi identificada a ausencia das observacoes referentes ao consumo de energia eletrica de
dias atıpicos, p. ex. feriados, ferias ou dias de ponte. Durante o perıodo mencionado foram observados
oito dias atıpicos na PME da industria Metalurgica, nos dias 10 e 12 de fevereiro, 29, 30 e 31 de marco,
e 1, 25 e 26 de abril de 2013. Na PME da industria da Ceramica e do Vidro foram observados 10 dias
atıpicos, nos dias 10, 11, 12, 16 e 17 de fevereiro, 29, 30, 31 de marco e 25 e 26 de abril de 2013.
27
Tabela 4.1: Estatısticas das observacoes do consumo de energia eletrica das PMEs, medido em perıodos de 15minutos e diarios.
Casos de EstudoConsumo mınimo Consumo maximo Media dos consumos
15 Minutos Diarios 15 Minutos Diarios 15 Minutos DiariosPME industriaMetalurgica
26 kWh 2496 kWh 522 kWh 31380 kWh 206.8 kWh 19820 kWh
PME industria daCeramica e do Vidro
2 kWh 192 kWh 160 kWh 8053 kWh 48.02 kWh 4611 kWh
A solucao adotada na presente dissertacao passou pelo preenchimento dos diferentes perıodos de
15 minutos do dia atıpico (96 perıodos), com o valor mınimo da amostra. Valor que nao devera diferir
significativamente dos valores observados num dia atıpico, face a ausencia de producao. Uma solucao
alternativa passaria pelo preenchimento dos diferentes perıodos de 15 minutos dos dias atıpicos, com
as observacoes de um dia analogo da semana anterior ou posterior. No entanto, esta solucao foi
colocada de parte, uma vez que influenciaria o padrao de consumo da PME.
Figura 4.1: Consumo de energia eletrica da PME da industria Metalurgica, medido em perıodos de 15 minutos,entre 1 de fevereiro a 30 de abril de 2013.
As figuras 4.1 e 4.2 ilustram os cronogramas das series temporais com as observacoes do consumo
de energia eletrica das PMEs, medido em perıodos de 15 minutos, nos dias compreendidos entre 1 de
fevereiro e 30 de abril de 2013. Atraves da analise das figuras 4.1 e 4.2, constatamos que existe um
padrao de consumo distinto nos dias uteis e ao fim de semana. Aos sabados, apenas sao observados
consumos relevantes ate as 14h, apos essa hora o consumo apenas e residual, enquanto aos domingos
os consumos observados sao quase nulos (irrelevantes), o que supoe a ausencia de atividade nas
PMEs. Na tabela 4.1 e apresentada uma descricao estatıstica da amostra de dados.
O objetivo proposto neste estudo passou nao so pela modelacao e previsao do consumo de energia
eletrica das PMEs, medido em perıodos de 15 minutos, mas tambem em perıodos diarios. Atraves da
previsao do consumo de energia eletrica com diferentes perıodos de mensuracao, apresentamos duas
perspetivas de analise do padrao de consumo das PMEs, uma analise detalhada com as observacoes
medidas em perıodos de 15 minutos e outra global com as observacoes medidas em perıodos diarios.
Para atingir esse objetivo, foi necessario agregar as 96 observacoes diarias, de forma a obter uma
nova serie temporal com os consumos diarios das PMEs. As figuras 4.3 e 4.4 ilustram os cronogramas
das series temporais com o consumo de energia eletrica das PMEs, medido em perıodos diarios, nos
dias compreendidos entre 1 de fevereiro a 30 de abril de 2013, correspondendo a um total de 89
28
Figura 4.2: Consumo da PME da industria da Ceramica e do Vidro, no perıodo de 1 de Fevereiro a 30 de Abril de2013, medido em perıodos de 15 minutos.
observacoes. Na tabela 4.1 e apresentada uma descricao estatıstica das observacoes do consumo de
energia eletrica das PMEs medido diariamente.
Figura 4.3: Consumo de energia eletrica da PME da industria Metalurgica, medido em perıodos diarios, entre 1de fevereiro a 30 de abril de 2013.
Os dados foram particionados em dois subconjuntos, um de treino e outro de teste. Como con-
junto de treino, utilizado no desenvolvimento dos modelos, foram consideradas 7200 observacoes (75
observacoes no consumo diario), referente ao perıodo de 1 de fevereiro a 16 de abril de 2013. As restan-
tes duas semanas de dados, correspondentes aos dias de 17 a 30 de abril de 2013 (1344 observacoes
no consumo de 15 minutos ou 14 observacoes no consumo diario), foram utilizados como conjunto de
teste, com o intuito de analisarmos a capacidade preditiva dos modelos.
Figura 4.4: Consumo da PME da industria da Ceramica e do Vidro, no perıodo de 1 de Fevereiro a 30 de Abril de2013, medido em perıodos diarios.
29
4.2 Redes Neuronais Artificiais
As Redes Neuronais Artificiais apresentam a capacidade de modelar relacoes funcionais complexas,
lineares ou nao lineares, entre o consumo de energia eletrica das PMEs e cada variavel independente
(variavel de entrada), o que tornou esta tecnica de modelacao uma solucao extremamente atrativa a
implementar nesta dissertacao. Essa capacidade representa uma vantagem comparativamente com as
tecnicas de modelacao, Regressao Linear Multipla e Grey Model, que assumem que a relacao entre as
variaveis e linear. Na figura 4.5 e ilustrado um fluxograma que sintetiza a metodologia adotada nesta
dissertacao, no desenvolvimento de um modelo baseado em Redes Neuronais Artificiais que descreva
adequadamente o comportamento do consumo de energia eletrica das PMEs, medido em perıodos de
15 minutos e diarios, e que possa ser usado para fazer previsoes precisas.
Figura 4.5: Fluxograma que sintetiza a metodologia adotada no desenvolvimento de um modelo baseado emRedes Neuronais Artificiais que descreva adequadamente o comportamento do consumo das PMEs.
Nas proximas subseccoes serao elucidadas as tarefas subjacentes a cada fase de desenvolvimento
da metodologia proposta: i) definicao da arquitetura (numero de variaveis de entrada, camadas in-
termedias, neuronios na(s) camadas intermedia(s) e funcoes de ativacao) e normalizacao dos dados;
ii) estrategia de treino (escolha do algoritmo de treino e criterio de convergencia); e iii) analise dos
resultados obtidos.
4.2.1 Definicao da arquitetura
No desenvolvimento de um modelo baseado em Redes Neuronais Artificiais que descreva adequada-
mente o comportamento do consumo de energia eletrica de cada PME, medido em perıodos de 15
minutos e diarios, e determinante a normalizacao dos dados e a selecao otimizada dos parametros da
sua arquitetura: as variaveis de entrada, numero de camadas intermedias, numero de neuronios em
cada camada intermedia e as funcoes de ativacao a adotar nas camadas intermedias e de saıda.
Variaveis de entradas: Para explicar o comportamento do consumo de energia eletrica das duas PMEs
portuguesas usadas como casos de estudo, medido em perıodos de 15 minutos, as Redes Neuronais
Artificiais adicionaram cinco variaveis de entrada, com as informacoes referentes ao horario, dia da se-
mana, mes, indicador de dias atıpicos e o consumo do dia anterior. No consumo medido em perıodos
30
Tabela 4.2: As variaveis de entrada que foram adicionadas no desenvolvimento dos modelos baseados emRedes Neuronais Artificiais.
Variaveis de entradaFuncao
Consumo 15 minutos Consumo DiarioIndicador do horario - Representar a sazonalidade diaria
Indicador do dia da semana Dia da semana Sazonalidade semanalIndicador do mes Mes Sazonalidade anual
Indicador de dias atıpicos Indicador de dias atıpicos Padrao de consumo de dias atıpicos
Consumo do dia anterior Consumo do dia anteriorPadrao de consumo do dia posteriora um dia atıpico
diarios, as Redes Neuronais Artificiais incluıram quatro variaveis de entrada, com as informacoes refe-
rentes ao dia da semana, mes, indicador de feriados e o consumo do dia anterior. Nos proximos pontos
sera apresentada a importancia de cada variavel de entrada e como representamos a sua informacao.
- Horario: A sazonalidade diaria foi representada atraves da adicao de uma variavel com a funcao
de identificar os diferentes perıodos de 15 minutos, em que ocorreram as medicoes do consumo
de energia eletrica das PMEs, entre a 00h15 e as 24h00, com valores entre 1 e 96;
- Dia da semana: As PMEs exibem um padrao de consumo distinto nos dias uteis e ao fim de
semana. Aos sabados, apenas sao observados consumos relevantes ate as 14h, apos essa hora
o consumo apenas e residual, enquanto aos domingos os consumos observados sao quase nulos,
o que supoe a ausencia de atividade nas PMEs. Nos dias uteis (segunda a sexta) o padrao de
consumo e semelhante. Para representar a sazonalidade semanal do consumo das PMEs, foi
adicionada uma variavel com a funcao de identificar os dias da semana, com valores entre 1 e 7;
- Mes: Para representar a sazonalidade anual, foi adicionada uma variavel com a funcao de identi-
ficar o mes em que foi observado o consumo em analise, atraves da atribuicao de valores entre 1
e 12;
- Identificador de dias atıpicos: Existem alguns fatores que influenciam negativamente a sazonali-
dade diaria e semanal do consumo de energia eletrica das PMEs. Fatores que estao relacionados
com a ocorrencia de dias atıpicos, por exemplo, feriados, ferias ou pontes. Nestes dias nao existe
producao nas PMEs. No desenvolvimento dos modelos baseados em Redes Neuronais Artificiais
foi adicionada uma variavel binaria com a funcao de identificar dias atıpicos;
- Consumo do dia anterior: Os trabalhadores das PMEs utilizadas como casos de estudo laboram
por turnos. No entanto, no dia posterior a um dia atıpico e observado um padrao de consumo
anomalo, face a ausencia de consumos relevantes entre a 00h00 e as 07h00, como consequencia
da ausencia de producao neste perıodo temporal. De forma a contrariarmos esse desafio, foi
adicionada uma variavel com as observacoes do consumo do dia anterior (consumo diario), com a
funcao de identificar os dias posteriores a um dia atıpico, caso se registe um valor apenas residual
no consumo do dia anterior (consumo mais baixo, comparativamente com os dias “normais”).
31
Numero de camadas intermedias e respetivo numero de neuronios: Nesta dissertacao foram im-
plementados modelos baseados em Redes Neuronais Artificiais com diferentes camadas intermedias
(1 a 4 camadas intermedias) e numero de neuronios na(s) camada(s) intermedia(s) (4 ou 8 neuronios),
com o intuito de analisarmos a sua capacidade preditiva e determinarmos os valores adequados.
A escolha de um numero superior a 8 neuronios intermedios poderia provocar um incremento no
tempo de treino e deteriorar a capacidade de generalizacao dos modelos baseados em Redes Neuro-
nais Artificiais. Enquanto a escolha de um numero inferior a 4 neuronios, poderia nao ser suficiente
para modelar adequadamente o comportamento do consumo de energia eletrica das PMEs.
Funcoes de ativacao: Nas camadas intermedias foram usadas funcoes de ativacao do tipo sigmoidal,
com o objetivo de permitir a rede neuronal modelar a relacao nao linear entre a saıda desejada (con-
sumo de energia eletrica da PME) e cada variavel de entrada. Na camada de saıda foi usada uma
funcao linear, pois permite ao modelo fazer previsoes fora do intervalo de valores da amostra de treino.
Normalizacao dos dados: Nesta dissertacao os dados foram normalizados para o domınio [0,1]. O
objetivo foi garantir que todas as variaveis de entrada apresentassem o mesmo peso no inıcio do treino
das Redes Neuronais. Desta forma, evitamos que seja atribuıda um maior peso as variaveis que apre-
sentem valores elevados. Outra razao inerente a normalizacao dos dados esta relacionada com a
escolha da funcao de ativacao, que produzem resultados num determinado domınio de valores, nesse
caso a normalizacao deve obedecer a esse domınio. Neste estudo foram adotadas funcoes de ativacao
do tipo sigmoidal nas camadas intermedias, que apresentam um domınio de valores entre 0 e 1.
4.2.2 Estrategias de treino
Apos a definicao da arquitetura das Redes Neuronais Artificiais, o passo seguinte foi a selecao do
algoritmo treino e criterio de convergencia. Na modelacao do comportamento do consumo de energia
eletrica das PMEs, medido em perıodos diarios, configuramos as Redes Neuronais Artificiais com dois
algoritmos de treino, nomeadamente, o algoritmo Backpropagation e o Resilient Backpropagation, com
o intuito de analisarmos a capacidade preditiva dos modelos obtidos, e determinar qual dos algoritmos
permitiu a desenvolver o modelo mais preciso. Na modelacao do comportamento do consumo de
energia eletrica das PMEs, medido em perıodos de 15 minutos, as Redes Neuronais Artificiais apenas
foram configuradas com o algoritmo de treino Resilient Backpropagation. A justificacao esta relacionada
com a elevada quantidade de dados utilizados no treino das Redes Neuronais, que restringiu a utilizacao
do algoritmo Backpropagation, uma vez que apresentou um processo de convergencia muito lento.
Para interromper o treino das Redes Neuronais Artificiais, definimos como criterio de convergencia,
quando nao e observada uma melhoria significativa entre duas iteracoes, no erro quadratico medio
entre a saıda desejada (valores observados do consumo de energia eletrica da PME) e o padrao de
saıda gerado pelo modelo (previsoes desenvolvidas). Na modelacao do comportamento do consumo
de energia eletrica das PMEs, medido em perıodos de 15 minutos, foram definidos dois valores per-
centuais para controlar o limiar de melhoria que deve ser observada no erro quadratico medio entre
iteracoes, 5% e 10%. Enquanto na modelacao do comportamento do consumo medido diariamente,
32
foram definidos os valores de 1% e 10%. Face a quantidade relevante de dados utilizados no treino das
Redes Neuronais aplicadas a modelar o consumo medido em perıodos de 15 minutos, o valor mınimo
definido como percentagem de melhoria que deve ser observada entre iteracoes, foi de 5% e nao 1%.
Atraves da experimentacao de dois valores percentuais distintos, podemos compreender se um
treino mais prolongado, como resultado da definicao de um menor criterio de convergencia, propor-
cionou uma melhoria na capacidade preditiva dos modelos, ou se pelo contrario, a capacidade de
generalizacao do modelo se deteriora, face a um excesso de treino, consequencia da modelacao das
pequenas particularidades da amostra de treino, o que nao e de todo desejavel.
4.2.3 Analise dos resultados
Na seccao 5.1 sera analisada a capacidade preditiva de 120 modelos baseados em Redes Neuro-
nais Artificiais com varias arquiteturas e estrategias de treino, nomeadamente diferentes camadas in-
termedias (1 a 4 camadas intermedias), numero de neuronios em cada camada intermedia (4 ou 8
neuronios intermedios), combinacoes de variaveis de entrada (com e sem a adicao do consumo do dia
anterior como variavel de entrada) e criterios de convergencia (valor de 5% ou 10%). Atraves dessa
analise foram identificados os valores dos parametros que foram incluıdos no desenvolvimento do mo-
delo que apresentou a capacidade preditiva mais precisa no perıodo de teste, na previsao do consumo
de energia eletrica de cada caso de estudo, medido em perıodos de 15 minutos.
Na previsao do consumo de energia eletrica de cada caso de estudo, medido em perıodos diarios, foi
analisada a capacidade preditiva de 240 modelos baseados em Redes Neuronais Artificiais com varias
arquiteturas e estrategias de treino, nomeadamente diferentes camadas intermedias (1 a 4 camadas
intermedias), numero de neuronios em cada camada intermedia (4 ou 8 neuronios intermedios), algo-
ritmos de treino (algoritmo Backpropagation e Resilient Backpropagation), combinacoes de variaveis
de entrada (com e sem a adicao do consumo do dia anterior) e criterios de convergencia (valor de
1% ou 10%), com o objetivo de identificarmos os valores dos parametros do modelo que apresentou a
capacidade preditiva mais precisa no perıodo de teste.
4.3 Regressao Linear Multipla
Nesta dissertacao, analisamos a capacidade preditiva de modelos desenvolvidos por tecnicas com
caracterısticas distintas (lineares e nao lineares), na previsao do consumo de energia eletrica de PMEs,
registado em perıodos de 15 minutos e diarios, com o intuito de enriquecer a diversidade de tecnicas
de modelacao aplicadas neste estudo. A necessidade de adicionarmos variaveis independentes na
construcao dos modelos, para modelarmos adequadamente o comportamento do consumo de energia
eletrica das PMEs, optamos pela tecnica de modelacao, Regressao Linear Multipla. Esta tecnica foi
aplicada nesta dissertacao para modelar a relacao (linear) entre o consumo de energia eletrica das
PMEs e um conjunto de variaveis independentes, usadas para explicar o seu comportamento.
A metodologia utilizada no desenvolvimento de um modelo baseado em Regressao Linear multipla
33
Figura 4.6: Fluxograma que pretende sintetizar a metodologia utilizada na elaboracao de um modelo deregressao multipla capaz de modelar o consumo de energia eletrica das PMEs.
capaz de modelar o comportamento do consumo de energia eletrica das PMEs e ilustrada no fluxo-
grama 4.6, onde sao enumeradas as quatro fases de desenvolvimento do modelo: i) definicao das
variaveis independentes; ii) teste de significancia para os coeficientes de regressao; iii) avaliar o grau
de ajustamento do modelo aos dados; e iv) analise dos resultados obtidos. Nas proximas subseccoes
serao elucidadas as tarefas elaboradas em cada fase de desenvolvimento.
4.3.1 Definicao das variaveis independentes
Tal como as Redes Neuronais Artificiais, os modelos desenvolvidos pela tecnica de modelacao, Re-
gressao Linear Multipla, adicionaram as informacoes referentes ao dia da semana, mes, indicador de
dias atıpicos e o consumo do dia anterior, para explicar a variancia do consumo de energia eletrica das
PMEs, medido em perıodos diarios. Para representar a sazonalidade semanal do consumo das PMEs,
foram adicionadas seis variaveis dummy (binarias), com a funcao de identificar o dia da semana. A
sazonalidade anual, atraves da adicao de duas variaveis dummy, com a funcao de identificar os meses
em analise (fevereiro, marco e abril). Uma variavel dummy para identificar os dias atıpicos. Na tabela
4.4 e apresentado um exemplo que permite elucidar o procedimento de identificacao dos dias da se-
mana e feriados pelas sete variaveis dummy incluıdas na elaboracao dos modelos. A ultima variavel
independente adicionada na construcao dos modelos foi o consumo do dia anterior, com a funcao de
identificar os dias posteriores a um dia atıpico. Na tabela 4.3 sao apresentadas as variaveis usadas
para explicar a variancia do consumo de energia eletrica das PMEs, medido em perıodos diarios.
O modelo proposto para prever o consumo de energia eletrica de cada PME, medido em perıodos
diarios, e expresso pela seguinte equacao:
Y =
6∑j=1
(βjXj) + β7X7 +
9∑k=8
(βkXk) + β10X10 (4.1)
onde, Y e o consumo de energia eletrica previsto; as variaveis dummy X1, ..., X6 sao os indicadores do
dia da semana; X7 o indicador de dias atıpicos; X8, ..., X9 os indicadores dos meses (fevereiro a abril);
X10 a variavel com as observacoes do consumo do dia anterior e β1...β3 os parametros do modelo.
34
Tabela 4.3: Variaveis adicionadas no desenvolvimento dos modelos, com o objetivo de explicar a variancia doconsumo de energia eletrica das PMEs, medido em perıodos diarios.
Variaveis explicativas DescricaoX1,..,6 Indicadores do dia da semanaX7 Indicador de dias atıpicos
X8,..,9 Indicadores dos mesesX10 Consumo do dia anterior
Tabela 4.4: Representacao dos dias da semana e feriado (variaveis dummy), na modelacao do consumo deenergia eletrica das PMEs, registado em perıodos diarios.
Variaveis dummyDia da Semana X1 X2 X3 X4 X5 X6 X7 (dia atıpico)
segunda 1 0 0 0 0 0 0terca 0 1 0 0 0 0 0
quarta 0 0 1 0 0 0 0quinta 0 0 0 1 0 0 0sexta 0 0 0 0 1 0 0
sabado 0 0 0 0 0 1 0domingo 0 0 0 0 0 0 0segunda 0 0 0 0 0 0 1
Nesta dissertacao recorremos a uma tecnica matematica, denominada Series de Fourier, para
modelar a sazonalidade do consumo de energia eletrica das PME, medido em perıodos de 15 mi-
nutos. De acordo com a teoria de Fourier, qualquer funcao periodica pode ser representada como uma
combinacao linear de senos e cossenos. Os coeficientes (seno e cosseno) de cada termo de Fourier
foram adicionados aos modelos desenvolvidos pela Regressao Linear Multipla como variaveis indepen-
dentes, com o objetivo de descrever as multiplas sazonalidades (diaria, semanal e anual) do consumo
de energia eletrica das PMEs. As Series de Fourier foram configuradas com os seguintes parametros:
T=672, que corresponde ao perıodo (amplitude do ciclo sazonal do consumo de energia eletrica das
PMEs) e N=336 o numero de termos de Fourier. Para alem dos coeficientes (seno e cosseno) de cada
termo de Fourier, foram tambem adicionadas duas variaveis independentes, o indicador de dias atıpicos
e o consumo do dia anterior. O modelo proposto para prever o consumo de energia eletrica das PMEs,
medido em perıodos de 15 minutos, e expresso pela seguinte equacao:
Y = β1X1 + β2X2 +
338∑s=3
(βsXs) +
674∑c=339
(βcXc) (4.2)
onde, Y e o consumo de energia eletrica previsto, X1 o indicador de dias atıpicos, X2 o consumo do dia
anterior, X3, ..., X338 sao os coeficientes (senos) de cada termo de Fourier, X339, ..., X674 os coeficientes
(cossenos) de cada termo de Fourier; e β1...β674 os parametros (coeficientes) do modelo.
4.3.2 Teste de significancia para os coeficientes de regressao
Antes de usarmos os modelos obtidos para fazer previsoes, avaliamos o contributo de cada variavel
independente para explicar a variancia do consumo das PMEs. Adicionar variaveis independentes
que nao contribuem significativamente para explicar a variancia do consumo das PMEs, normalmente,
35
enfraquecem o grau de ajustamento do modelo aos dados. Nesta dissertacao realizamos um teste de
significancia ao coeficiente de cada variavel independente incluıda na construcao dos modelos.
Nos modelos desenvolvidos para descrever o comportamento do consumo de cada PME, medido
em perıodos de 15 minutos, os coeficientes das variaveis independentes apresentaram uma proba-
bilidade superior a 95% de nao serem nulos, o que significa que todas as variaveis (coeficientes de
Fourier, indicador de dias atıpicos e consumo do dia anterior) sao necessarias para explicar a variancia
do consumo. Nesta dissertacao analisamos a capacidade preditiva de quatro modelos candidatos,
com diferentes conjugacoes de variaveis independentes, com o objetivo de identificarmos as variaveis
que foram incluıdas no modelo que apresentou a capacidade preditiva mais precisa, na previsao do
consumo de energia eletrica de cada caso de estudo, medido em perıodos de 15 minutos.
• Modelo 1 (coeficientes de Fourier, indicador de dias atıpicos e consumo do dia anterior);
• Modelo 2 (coeficientes de Fourier);
• Modelo 3 (coeficientes de Fourier e indicador de dias atıpicos);
• Modelo 4 (coeficientes de Fourier e consumo do dia anterior).
Identificados os modelos candidatos que serao utilizados para prever o consumo de energia eletrica
das PMEs, medido em perıodos de 15 minutos, avaliamos agora o contributo de cada variavel indepen-
dente para explicar a variancia do consumo de energia eletrica das PMEs, medido em perıodos diarios.
Observando os valores anunciados na tabela 4.5, referente ao caso de estudo da PME da industria Me-
talurgica, verificamos que os coeficientes das variaveis dos meses exibem uma probabilidade inferior a
90% de nao serem nulos, o que pode ser considerado baixo, levando-nos a considerar a alternativa de
construir o modelo sem os indicadores dos meses (X8 e X9). Um padrao de consumo semelhante nos
meses em analise (fevereiro, marco e abril de 2013) pode justificar a sua exclusao.
Os coeficientes dos indicadores dos meses (X8 e X9), indicador de dias atıpicos (X7) e o consumo
do dia anterior X10 apresentam uma probabilidade inferior a 90% de nao serem nulos, o que significa
que nao contribuıram para explicar a variancia do consumo de energia eletrica da PME da Ceramica
e do Vidro. A presenca do indicador de dias atıpicos, nas variaveis que nao contribuıram significativa-
mente para explicar a variancia do consumo da PME, foi inesperada. Uma possıvel explicacao pode
estar relacionada com um padrao de consumo semelhante em dias atıpicos (feriados ou dias de ponte)
e aos domingos. Tal como na modelacao do consumo medido em perıodos de 15 minutos, tambem
foram desenvolvidos seis modelos candidatos, atraves da experimentacao de diferentes conjugacoes
de variaveis independentes a adicionar na sua construcao.
• Modelo 1 (indicadores do dia da semana, mes, dias atıpicos e consumo do dia anterior);
• Modelo 2 (indicadores do dia da semana);
• Modelo 3 (indicadores do dia da semana e de dias atıpicos);
• Modelo 4 (indicadores do dia da semana, dias atıpicos e consumo do dia anterior);
36
Tabela 4.5: Probabilidade do coeficiente de cada variavel independente incluıda no desenvolvimento do modelonao ser nulo - consumo diario.
Caso de estudoVariaveis do modelo
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
PME Metalurgica 0.000 0.000 0.000 0.000 0.000 0.000 0.034 0.679 0.076 0.016PME Ceramica
e do Vidro0.000 0.000 0.000 0.000 0.000 0.000 0.468 0.877 0.960 0.124
• Modelo 5 (indicadores do dia da semana e dos meses);
• Modelo 6 (indicadores do dia da semana e consumo do dia anterior).
Nesta dissertacao foi analisada a capacidade preditiva dos seis modelos candidatos, com o objetivo
de identificar as variaveis independentes que foram adicionadas no modelo que apresentou a capaci-
dade preditiva mais precisa, na previsao do consumo de cada PME, medido em perıodos diarios.
4.3.3 Grau de ajustamento dos modelos aos dados
Identificados os modelos candidatos e estimados os seus parametros, precisamos de avaliar se os
modelos candidatos sao adequados a descrever a variancia da variavel dependente, antes de os usar
para fazer previsoes. Nesta dissertacao usamos o coeficiente de determinacao ajustado, R2ajust., para
medir o grau de ajustamento dos modelos aos dados. Este coeficiente indica a proporcao da variancia
da variavel dependente que e explicada pelo modelo. O valor deste coeficiente esta compreendido
entre 0 e 1. Por exemplo, o coeficiente R2 apresenta um valor de 0.95, isso significa que 95% da
variacao do consumo da PME e explicada pelo modelo. Para complementar a analise do coeficiente de
determinacao ajustado, tambem foram analisados os resultados obtidos no perıodo de treino.
Na tabela 4.6 sao apresentados os valores dos coeficientes de determinacao ajustados e os resulta-
dos obtidos no perıodo de treino, pelos quatro modelos candidatos, na previsao do consumo de energia
eletrica das PMEs, medido em perıodos de 15 minutos. O modelo candidato que apresentou o valor
mais elevado do coeficiente de determinacao ajustado foi o modelo 1, que adicionou todas as variaveis
independentes (coeficientes de Fourier, indicador de dias atıpicos e o consumo do dia anterior).
Na PME da industria Metalurgica o modelo 1 apresentou um valor de 0.908 no coeficiente de
determinacao, o que significa que apenas 90.8% da variancia do consumo de energia eletrica da PME,
medido em perıodos de 15 minutos, e explicada pelo modelo. O modelo 1 obteve no perıodo de treino
um erro de 52.733%, o que indicia que o modelo candidato nao conseguiu descrever adequadamente o
comportamento do consumo de energia eletrica da PME. Relativamente a PME da Ceramica e do Vidro,
o modelo 1 apresentou um valor de 0.845 no coeficiente de determinacao, o que significa que apenas
84.5% da variancia do consumo de energia eletrica da PME, medido em perıodos de 15 minutos, e
explicada pelo modelo. O modelo 1 obteve no perıodo de treino um erro de 166.553%.
Na tabela 4.7 sao apresentados os valores dos coeficientes de determinacao ajustados e os resul-
tados obtidos no perıodo de treino, pelos seis modelos candidatos, na previsao do consumo de energia
eletrica das PMEs, medido em perıodos diarios. O modelo candidato que apresentou o valor mais ele-
vado do coeficiente de determinacao ajustado foi o modelo 3, que adicionou as variaveis independentes
37
Tabela 4.6: Valores dos coeficientes de determinacao ajustado e resultados obtidos no perıodo de treino, pelosquatro modelos candidatos, de acordo com a medida de desempenho MAPE - consumo medido em perıodos de
15 minutos - Regressao Linear Multipla.
Modelo deRegressao Multipla
PME IndustriaMetalurgica
PME IndustriaCeramica e do Vidro
R2ajust. MAPE R2
ajust. MAPEmodelo 1 0.908 52.733% 0.845 166.553%modelo 2 0.839 53.327% 0.757 168.209%modelo 3 0.908 52.822% 0.843 165.206%modelo 4 0.841 52.400% 0.786 160.149%
Tabela 4.7: Valores dos coeficientes de determinacao ajustado e resultados obtidos no perıodo de treino, pelosquatro modelos candidatos, de acordo com a medida de desempenho MAPE - consumo medido em perıodos
diarios - Regressao Linear Multipla.
Modelos candidatosPME Metalurgica PME Ceramica e do VidroR2
ajust. MAPE R2ajust. MAPE
modelo 1 0.988 8.156% 0.954 21.775%modelo 2 0.985 9.483% 0.952 19.393%modelo 3 0.989 5.777% 0.955 12.157%modelo 4 0.987 7.978% 0.954 22.052%modelo 5 0.986 9.533% 0.952 18.390%modelo 6 0.986 9.762% 0.954 20.521%
referentes ao dia da semana e indicador de dias atıpicos. Na PME da industria Metalurgica o modelo 3
apresentou um valor de 0.989 no coeficiente de determinacao, o que significa que 98.9% da variancia
do consumo de energia eletrica da PME e explicada pelo modelo. O modelo 3 obteve no perıodo de
treino, um erro de 5.777%, o que indicia que o modelo candidato foi capaz de descrever adequada-
mente o comportamento do consumo da PME. Relativamente a PME da industria da Ceramica e do
Vidro, o modelo 3 apresentou um valor de 0.955 no coeficiente de determinacao, o que significa que
95.5% da variancia do consumo de energia eletrica da PME e explicada pelo modelo. O modelo 1
obteve no perıodo de treino, um erro de 12.157%, o que indicia que o modelo candidato foi capaz de
descrever adequadamente o comportamento do consumo da PME, medido em perıodos diarios.
4.3.4 Analise dos resultados
Na seccao 5.2 sera analisada a capacidade preditiva de cada modelo candidato no perıodo de teste.
Atraves dessa analise serao identificadas as variaveis independentes que foram incluıdas na construcao
do modelo que apresentou a capacidade preditiva mais precisa, na previsao do consumo de energia
eletrica de cada caso de estudo, medido em perıodos de 15 minutos e diarios.
4.4 Grey Model
A ausencia de estudos que analisem a capacidade preditiva de modelos desenvolvidos pela tecnica de
modelacao Grey Model, na previsao de consumo de energia eletrica medido em perıodos reduzidos,
38
motivou a sua aplicacao na presente dissertacao. Com a elaboracao desta dissertacao, contribuımos
com uma analise a capacidade preditiva de modelos desenvolvidos por tres tecnicas Grey Model com
caracterısticas distintas, nomeadamente GM(1,1), Fourier GM(1,1) e GM(1,N), na previsao do consumo
de energia eletrica de duas PMEs portuguesas, medido em perıodos de 15 minutos e diarios. Na figura
4.7 e ilustrado um fluxograma que enumera as principais tarefas elaboradas no desenvolvimento de um
modelo baseado em cada uma das tres tecnicas Grey Model : GM(1,1) (tarefas tracejadas a verde),
Fourier GM(1,1) (tarefas tracejadas a vermelho) e GM(1,N) (tarefas tracejadas a azul).
Figura 4.7: Tarefas elaboradas em cada fase de desenvolvimento de um modelo baseado em cada uma das trestecnicas Grey Model, GM(1,1), Fourier GM(1,1) e GM(1,N).
Nas proximas subseccoes sao descritas as principais tarefas elaboradas em cada fase de desenvol-
vimento dos modelos baseados nas tecnicas GM(1,1), Fourier GM(1,1) e GM(1,N), e uma analise dos
resultados obtidos no perıodo de treino.
4.4.1 Tecnica GM(1,1)
A tecnica de modelacao GM(1,1), designada ”Grey Model First Order One Variable”, foi o primeiro Grey
Model aplicado nesta dissertacao, que apresenta como vantagem a baixa carga computacional que en-
volve o processo de desenvolvimento de um modelo dos dados. Nesta dissertacao apenas analisamos
a capacidade preditiva dos modelos desenvolvidos pela tecnica GM(1,1), relegando para segundo plano
a carga computacional que envolve o seu desenvolvimento. O desenvolvimento de um modelo base-
ado na tecnica GM(1,1) engloba tres tarefas, tracejadas a verde na figura 4.7: ”Accumulating Generation
Operator”, implementacao do modelo e ”Inverse Accumulating Generation Operator”.
Accumulating Generation Operator (AGO): A primeira tarefa elaborada no desenvolvimento de um
modelo baseado na tecnica GM(1,1), passou por suavizar a aleatoriedade da serie temporal com
as observacoes do consumo de energia eletrica da PME. A tecnica GM(1,1) apresenta o argumento
de que suavizando a componente aleatoria da serie temporal e possıvel inferir a correlacao entre as
observacoes. Para atingir o objetivo proposto, as observacoes da serie temporal foram submetidas a
39
Tabela 4.8: Resultados das previsoes produzidas pelos modelos baseados nas metodologias GM(1,1), FourierGM(1,1) e GM(1,N), de acordo com a medida de desempenho MAPE (fase de treino).
Grey ModelsPME Metalurgica PME Ceramica e do Vidro
15 minutos Diarios 15 minutos DiariosGM(1,1) 168.733% 135.123% 422.034% 362.487%
Fourier GM(1,1) 53.491% 48.612% 165.689% 140.150%GM(1,N) 215.866% 20.184% 607.897% 54.488%
um operador denominado Accumulating Generation Operator, onde obtivemos uma nova serie temporal
(acumulativa). As observacoes do consumo de energia eletrica da PME da Ceramica e do Vidro sao
ilustradas do lado direito da figura 4.8 e as observacoes da nova serie temporal (acumulativa) do lado
esquerdo.
Figura 4.8: Caso de estudo da PME da industria da Ceramica e do Vidro - Amostra de treino (do lado direito) e anova amostra acumulativa dos dados (do lado esquerdo).
Implementacao do modelo: Apos suavizar a componente aleatoria da serie temporal com as observacoes
do consumo de energia eletrica da PME, desenvolvemos um modelo que descreve a correlacao entre
as observacoes da nova serie temporal (acumulativa);
Inverse Accumulating Generation Operator (IAGO): Na ultima fase, as previsoes obtidas pelo mo-
delo foram submetidas a um operador denominado ”Inverse Accumulating Generation Operator”, com
o objetivo de reverter o processo acumulativo, atraves da subtracao de previsoes adjacentes.
Analise dos resultados obtidos no perıodo de treino: Na tabela 4.8 sao apresentados os resultados
das previsoes obtidas no perıodo de treino, pelos modelos desenvolvidos pela tecnica GM(1,1), de
acordo com a medida de desempenho MAPE. Os elevados erros apresentados no perıodo de treino
sao um indicador de que os modelos desenvolvidos nao foram capazes de modelar adequadamente
o comportamento do consumo das PMEs, medido em perıodos de 15 minutos e diarios. Nas figuras
4.10 e 4.9 observamos uma diferenca significativa entre os valores previstos pelos modelos (ilustrados
a vermelho) e os valores observados no perıodo de treino (ilustrados a preto). Os modelos nao foram
capazes de representar a sazonalidade do consumo de energia eletrica das PMEs. No capıtulo 5.3
analisaremos a capacidade preditiva dos modelos desenvolvidos por GM(1,1) no perıodo de teste.
40
Figura 4.9: Previsoes do consumo de energia eletrica medido em perıodos de 15 minutos (perıodo de treino) -GM(1,1) e Fourier GM(1,1) - PME da industria da Ceramica e do Vidro (esquerda) e PME Metalurgica (direita).
4.4.2 Tecnica Fourier GM(1,1)
Nesta dissertacao foi usada uma tecnica de modelacao hıbrida, denominada Fourier GM(1,1), para
solucionar a incapacidade da tecnica GM(1,1) em modelar a sazonalidade do consumo de energia
eletrica das PMEs. Esta tecnica hıbrida combina a tecnica GM(1,1) e uma tecnica matematica, deno-
minada Series de Fourier, usada para modelar a sazonalidade dos dados. Na figura 4.7 sao ilustradas
as duas fases de desenvolvimento de um modelo baseado na tecnica Fourier GM(1,1). A primeira fase
corresponde ao desenvolvimento de um modelo baseado na tecnica GM(1,1), processo descrito e ex-
plicado na subseccao 4.4.1 e ilustrado na figura 4.7 nas tarefas tracejadas a verde. Na segunda fase,
duas tarefas exclusivas, tracejadas a vermelho na figura 4.7, sao aplicadas para melhorar a capacidade
preditiva do modelo desenvolvido pela tecnica GM(1,1): estimar a serie residual e Fourier GM(1,1).
Estimar a serie residual: A primeira tarefa exclusiva envolve a estimacao da serie residual. As
observacoes que compoem a serie residual, correspondem a diferenca entre as observacoes da amos-
tra de treino e as previsoes obtidas pelo modelo desenvolvido pela tecnica GM(1,1);
Fourier GM(1,1): Na segunda tarefa exclusiva, a tecnica matematica, Series de Fourier, foi usada na
determinacao da sazonalidade da serie residual. Os novos valores da serie residual, obtidos atraves da
aplicacao da tecnica Series de Fourier, foram adicionados aos valores previstos pelo modelo.
Figura 4.10: Previsoes do consumo de energia eletrica medido em perıodos diarios (perıodo de treino) - GM(1,1)e Fourier GM(1,1) - PME da industria da Ceramica e do Vidro (esquerda) e PME Metalurgica (direita).
Analise dos resultados obtidos no perıodo de treino: Na tabela 4.8 sao apresentados os resultados
41
das previsoes obtidas no perıodo de treino, pelos modelos desenvolvidos pela tecnica Fourier GM(1,1),
de acordo com a medida de desempenho MAPE. Os elevados erros apresentados no perıodo de treino
sao um indicador de que os modelos desenvolvidos nao foram capazes de modelar adequadamente
o comportamento do consumo das PMEs, medido em perıodos de 15 minutos e diarios. Atraves da
analise das figuras 4.10 e 4.9, constatamos que os valores previstos pelos modelos desenvolvidos
pela tecnica Fourier GM(1,1) (ilustrados a azul) acompanham de forma bastante aproximada os valores
observados no perıodo de treino (ilustrados a preto). No entanto, estes modelos nao conseguiram
representar o padrao de consumo de dias atıpicos, p. ex. feriados ou dias de ponte, refletindo-se nos
elevados erros obtidos no perıodo de treino. No capıtulo 5.3 analisaremos a capacidade preditiva dos
modelos desenvolvidos por Fourier GM(1,1) no perıodo de teste.
4.4.3 Tecnica GM(1,N)
A ultima tecnica Grey Model aplicada nesta dissertacao, denominada GM (1,N), apresenta a vantagem
de possibilitar a inclusao de variaveis independentes ao modelo a desenvolver. As variaveis indepen-
dentes sao relevantes para explicar o comportamento do consumo de energia eletrica das PMEs. A in-
capacidade revelada pelos modelos implementados pela tecnica Fourier GM(1,1) em modelar o padrao
de consumo de um dia atıpico (p. ex. feriados ou dias de ponte) pode ser solucionada com a inclusao
de uma variavel dummy para identificar a ocorrencia desses dias. A figura 4.7 ilustra um fluxograma que
identifica as duas fases de desenvolvimento de um modelo baseado na metodologia GM(1,N): definicao
das variaveis independentes (tarefa tracejada a azul); e a aplicacao de tres tarefas tracejadas a verde,
responsaveis pela implementacao do modelo: (”Accumulating Generation Operator”, implementacao do
modelo baseado na tecnica GM(1,N) e ”Inverse Accumulating Generation Operator” ).
Definicao das variaveis independentes: Os modelos desenvolvidos pela tecnica GM(1,N) adiciona-
ram as mesmas variaveis independentes que os modelos baseados em Redes Neuronais Artificiais
e Regressao Linear Multipla, na modelacao do consumo de energia eletrica das PMEs medido em
perıodos de 15 minutos, nomeadamente o horario do consumo, dia da semana, mes, indicador de dias
atıpicos e o consumo do dia anterior. Contudo, foi nos colocado um dilema na implementacao destes
modelos, como apresentar as informacoes que caracterizam estas variaveis. Nesta dissertacao foram
ponderadas duas solucoes distintas. A primeira solucao, e adotada nesta dissertacao, passou pela
adicao de variaveis independentes (quantitativas), que podem assumir qualquer valor numerico den-
tro de um determinado intervalo, para representar as informacoes referentes ao horario do consumo
(1,...,96), dia da semana (1,...7) e mes (1,...,12), uma variavel dummy para identificar dias atıpicos,
e uma variavel com as observacoes do consumo do dia anterior. A segunda solucao, passaria pela
adicao de variaveis dummy no processo de identificacao do horario do consumo (96 variaveis dummy ),
dia da semana (6 variaveis dummy ) e do mes (onze variaveis dummy ). Face ao numero consideravel
de variaveis a incluir na implementacao dos modelos, levou-nos a refutar a segunda solucao.
A questao de como apresentar os valores das variaveis explicativas dia da semana e mes foi igual-
mente colocada na modelacao do consumo de energia eletrica medido em perıodos diarios. A primeira
42
Tabela 4.9: Resultados obtidos pelos modelos desenvolvidos pela tecnica GM(1,N), que adicionaram variaveisquantitativas e variaveis dummy, de acordo com a medida de desempenho MAPE - perıodo de treino.
PME Metalurgica PME MetalurgicaModelos que adicionaram variaveis dummy 20.184% 54.488%
Modelos que adicionaram variaveis quantitativas 96.973% 510.769%
solucao aplicada neste estudo, passou pela adicao de variaveis independentes (quantitativas), que po-
dem assumir qualquer valor numerico dentro de um determinado intervalo, para identificar o dia da
semana (1,...7) e mes (1,...,12), uma variavel dummy para identificar dias atıpicos, e uma variavel com
as observacoes do consumo do dia anterior. Na segunda solucao, foram incluıdas variaveis dummy
na identificacao do dia da semana (6 variaveis dummy ), mes (onze variaveis dummy ), dias atıpicos
(uma variavel dummy ) e uma variavel com as observacoes do consumo do dia anterior. Para determi-
nar a solucao que permita desenvolver o modelo com a capacidade preditiva mais precisa, analisamos
os resultados obtidos no perıodo de treino pelos modelos implementados pelas duas solucoes. Os
resultados exibidos na tabela 4.9 mostram que os modelos que incluıram as variaveis dummy foram
significativamente mais precisos.
Accumulating Generation Operator (AGO): A tecnica GM(1,N) apresenta o argumento de que sua-
vizando a componente aleatoria das observacoes da variavel dependente e dos valores das variaveis
independentes e possıvel inferir a correlacao entre a variavel dependente e as variaveis independen-
tes. Para atingir o objetivo proposto, as observacoes da variavel dependente e os valores das variaveis
independentes foram submetidos a um operador denominado Accumulating Generation Operator, onde
obtivemos novas series temporais (acumulativas).
Implementacao do modelo: Apos suavizar a aleatoriedade da amostra de treino, desenvolvemos
um modelo que descreve a correlacao entre o consumo de energia eletrica da PME e as variaveis
independentes;
Inverse Accumulating Generation Operator (IAGO): Na ultima fase, as previsoes do modelo ob-
tido foram submetidas a um operador denominado ”Inverse Accumulating Generation Operator”, com o
proposito de reverter o processo acumulativo, atraves da subtracao de previsoes adjacentes.
Figura 4.11: Previsoes do consumo de energia eletrica medido em perıodos de 15 minutos (perıodo de treino) -GM(1,N) - PME da industria da Ceramica e do Vidro (esquerda) e PME Metalurgica (direita).
Analise dos resultados obtidos no perıodo de treino: Na tabela 4.8 sao apresentados os resultados
43
das previsoes obtidas no perıodo de treino pelos modelos desenvolvidos pela tecnica GM(1,N), de
acordo com a medida de desempenho MAPE. Os elevados erros apresentados no perıodo de treino
sao um indicador de que os modelos desenvolvidos nao foram capazes de modelar adequadamente o
comportamento do consumo das PMEs, medido em perıodos de 15 minutos. Na figura 4.12 observamos
uma diferenca significativa entre os valores previstos pelos modelos implementados pela metodologia
GM(1,N) (ilustrados a vermelho) e os valores observados na fase de treino (ilustrados a preto).
Quanto a modelacao do consumo medido em perıodos diarios, obtivemos resultados dıspares entre
casos de casos de estudo. No caso de estudo da PME da industria Metalurgica, o modelo implemen-
tado pela tecnica GM(1,N) apresentou um erro de 20.184% no perıodo de treino, o que significa que
conseguiu modelar de forma satisfatoria o comportamento do consumo da PME. Na PME da Ceramica
e do Vidro, o modelo implementado pela tecnica GM(1,N) apresentou um erro de 54.488%, o que signi-
fica que nao foi capaz de modelar adequadamente o comportamento do consumo da PME. Conforme
se pode observar na figura 4.12, existe uma dispersao importante entre os valores previstos pelos mo-
delos (ilustrados a azul) e os valores observados no perıodo de treino (ilustrados a preto). No capıtulo
5.3 analisaremos a capacidade preditiva dos modelos desenvolvidos por GM(1,N) no perıodo de teste.
Figura 4.12: Previsoes do consumo de energia eletrica medido em perıodos diarios (perıodo de treino) -GM(1,N) - PME da industria da Ceramica e do Vidro (esquerda) e PME Metalurgica (direita).
4.5 Metodologia de Avaliacao
Dado o objetivo de desenvolver modelos que possam ser usados para fazer previsoes precisas do
consumo de energia eletrica de duas PMEs portuguesas de diferentes setores de atividade (Metalurgica
e da Ceramica e do Vidro), medido em perıodos de 15 minutos e diarios, somos confrontados com a
questao de qual a melhor tecnica de modelacao para os obter. Para responder a essa questao, nesta
dissertacao analisamos a capacidade preditiva de um conjunto de modelos alternativos, obtidos nao
so por tres tecnicas de modelacao distintas, nomeadamente Redes Neuronais Artificiais, Regressao
Linear Multipla e Grey Model, mas tambem com diferentes valores nos seus parametros.
• Redes Neuronais Artificiais: Foram desenvolvidos modelos baseados em Redes Neuronais
Artificiais com varias arquiteturas e estrategias de treino, nomeadamente diferentes camadas
44
intermedias, numero de neuronios em cada camada intermedia, combinacoes de variaveis de
entrada, algoritmos de treino e criterios de convergencia.
• Regressao Linear Multipla: Na aplicacao da tecnica de modelacao, Regressao Linear Multipla,
foram desenvolvidos modelos com diferentes conjugacoes de variaveis independentes.
• Grey Model: Foram desenvolvidos modelos baseados em tres tecnicas Grey Model com carac-
terısticas distintas, nomeadamente GM(1,1), Fourier GM(1,1) e GM(1,N).
A capacidade preditiva dos modelos foi aferida com recurso a medida de desempenho MAPE (Mean
absolute percentage error ). Esta medida de desempenho permite medir o erro medio absoluto entre
as previsoes obtidas por um determinado modelo e os valores observados. Conforme foi mencionado
na seccao 3.6, esta medida de desempenho apresenta como vantagem a exibicao dos seus resultados
num valor percentual, o que facilita sua interpretacao. Outra vantagem e a independencia da escala
dos dados, o que proporciona uma analise comparativa dos resultados obtidos entre casos de estudo.
Com a elaboracao desta analise comparativa, pretendemos determinar a tecnica de modelacao e
respetivos parametros que permitiram desenvolver o modelo que obteve a capacidade preditiva mais
precisa, na previsao do consumo de energia eletrica de cada caso de estudo (PME da industria Me-
talurgica e da Ceramica e do Vidro), medido em perıodos de 15 minutos e diarios.
45
Capıtulo 5
Resultados
Este capıtulo esta dividido em quatro seccoes. Nas seccoes 5.1 (Redes Neuronais Artificiais), 5.2 (Re-
gressao Linear Multipla) e 5.3 (Grey Model) sao enumeradas as principais conclusoes dos resultados
obtidos no perıodo de teste, pelos modelos desenvolvidos pelas tres tecnicas de modelacao aplicadas
nesta dissertacao, na previsao do consumo de energia eletrica de duas PMEs portuguesas de diferen-
tes setores de atividade (Metalurgica e da Ceramica e do Vidro), medido em perıodos de 15 minutos e
diarios. Na seccao 5.4 e apresentada uma analise comparativa da capacidade preditiva dos modelos
obtidos pelas tres tecnicas de modelacao e identificada a que desenvolveu o modelo mais preciso.
5.1 Redes Neuronais Artificiais
Em cada caso de estudo, foi analisada a capacidade preditiva de 120 modelos baseados em Redes
Neuronais Artificiais com varias arquiteturas e estrategias de treino: diferentes camadas intermedias
(1 a 4 camadas intermedias), numero de neuronios em cada camada intermedia (4 ou 8 neuronios
intermedios), combinacoes de variaveis de entrada (com e sem a adicao do consumo do dia anterior
como variavel de entrada) e criterios de convergencia (valor de 5% ou 10%). Atraves dessa analise
foram identificados os valores dos parametros que foram incluıdos no desenvolvimento do modelo que
apresentou a capacidade preditiva mais precisa, na previsao do consumo de energia eletrica de cada
caso de estudo, medido em perıodos de 15 minutos. De acordo com os resultados das previsoes
obtidas pelos 120 modelos no perıodo de teste, destacamos as seguintes conclusoes:
• Um treino mais prolongado, como resultado da definicao de um menor criterio de convergencia
(5%), proporcionou uma melhoria residual na capacidade preditiva dos modelos desenvolvidos
para prever o consumo de energia eletrica das duas PMEs, medido em perıodos de 15 minutos.
No caso de estudo da PME da industria Metalurgica, os modelos desenvolvidos com um criterio
de convergencia de 5% apresentaram um erro medio de 14.223%, ao passo que, os modelos
que foram configurados com um criterio de 10% mostraram um erro medio de 15.041%. No
caso de estudo da PME da Ceramica e do Vidro, os modelos implementados com um criterio
de convergencia de 5% exibiram um erro medio de 25.246%, enquanto os modelos que foram
46
configurados com um criterio de 10% mostraram um erro medio de 27.736%;
• Os modelos obtidos pelas Redes Neuronais Artificiais que adicionaram o consumo do dia anterior
como variavel de entrada representaram, de uma forma mais adequada, o padrao de consumo do
dia posterior a um dia atıpico. No caso de estudo da PME da industria Metalurgica, os modelos
que adicionaram o consumo do dia anterior, exibiram um erro medio de 14.223%, ao passo que,
os modelos que excluıram essa variavel da sua construcao, apresentaram um erro medio de
16.805%. Relativamente ao caso de estudo da PME da Ceramica e do Vidro, os modelos que
adicionaram o consumo do dia anterior exibiram um erro medio 16.805%, enquanto os modelos
que excluıram essa variavel da sua construcao, mostraram um erro medio de 36.617%.
Na tabela 5.1 apresentamos os erros das previsoes obtidas pelos modelos que exibiram a ca-
pacidade preditiva mais precisa, com e sem a adicao do consumo do dia anterior como variavel
de entrada, em cada dia do perıodo de teste. O modelo que incluiu o consumo do dia anterior
apresentou no dia 27-04-2013 (dia posterior a um dia atıpico) um erro de 30.342% na PME da
industria Metalurgica e 46.212% na PME da Ceramica e do Vidro. Os resultados do modelo que
excluiu esta variavel foram significativamente menos precisos, exibindo no dia 27-04-2013 um erro
de 92.105% na PME da industria Metalurgica e 232.033% na PME da Ceramica e do Vidro;
Figura 5.1: Media dos erros das previsoes obtidas pelos modelos baseados em Redes Neuronais em funcao donumero de camadas intermedias - perıodo de teste - consumo medido em perıodos de 15 minutos.
• O incremento do numero de camadas intermedias permitiu melhorar a capacidade preditiva dos
modelos, conforme ilustra a figura 5.1. Os modelos desenvolvidos pelas Redes Neuronais que
foram configuradas com quatro camadas intermedias apresentaram no perıodo de teste um erro
medio de 11.743% no caso de estudo da PME da industria Metalurgica e 19.170% na PME da
industria da Ceramica e do Vidro. Ao passo que, os modelos implementados pelas Redes Neuro-
nais que foram configuradas com apenas uma camada intermedia apresentaram um erro medio
de 38.858% na PME da industria Metalurgica e 34.779% na PME da Ceramica e do Vidro;
• Na tabela 5.2 sao apresentados os valores dos parametros que foram incluıdos no desenvolvi-
mento do modelo baseado em Redes Neuronais Artificiais que apresentou a capacidade predi-
tiva mais precisa em cada caso de estudo, na previsao do consumo de energia eletrica, medido
em perıodos de 15 minutos. A Rede Neuronal que desenvolveu o modelo com a capacidade
47
Tabela 5.1: Erros das previsoes obtidas pelos modelos baseados em Redes Neuronais que exibiram acapacidade preditiva mais precisa, com e sem a adicao do consumo do dia anterior como variavel de entrada, em
cada dia do perıodo de teste - consumo medido em perıodos de 15 minutos.
Perıodo de testeCasos de estudo
PME Metalurgica PME Ceramica e do VidroAdicao Exclusao Adicao Exclusao
17-04-2013 9.208% 8.301% 15.791% 8.834%18-04-2013 6.317% 7.211% 8.039% 7.820%19-04-2013 6.969% 7.600% 12.777% 12.666%20-04-2013 12.298% 13.900% 22.122% 30.182%21-04-2013 7.151% 8.782% 38.718% 39.792%22-04-2013 10.020% 8.487% 29.809% 42.173%23-04-2013 8.190% 10.431% 14.630% 13.908%24-04-2013 7.432% 6.714% 14.858% 14.768%25-04-2013 0.006% 0.307% 0.329% 0.649%26-04-2013 0.006% 0.329% 0.834% 0.641%27-04-2013 30.342% 92.105% 46.212% 232.033%28-04-2013 8.238% 8.170% 18.810% 22.378%29-04-2013 9.888% 8.453% 24.330% 22.140%30-04-2013 12.668% 14.743% 18.602% 18.403%
Total (MAPE) 9.195% 13.967% 18.990% 33.313%
Figura 5.2: PME da industria Metalurgica - Comparacao entre as previsoes obtidas pelo modelo baseado emRedes Neuronais Artificiais e as observacoes da amostra de teste - consumo medido em perıodos de 15 minutos.
preditiva mais precisa no caso de estudo da PME da industria Metalurgica, apresentou como ar-
quitetura, cinco variaveis de entrada (horario, dia da semana, mes, indicador de dias atıpicos e
consumo do dia anterior), quatro camadas intermedias, uma disposicao de neuronios nas cama-
das intermedias (8-8-4-8), usou o algoritmo de treino Resilient Backpropagation e um criterio de
convergencia de 5%. Este modelo obteve um erro de 9.195% no perıodo de teste, que de acordo
com a medida de desempenho MAPE a sua capacidade preditiva pode ser classificada de pre-
cisa. A figura 5.2 ilustra como as previsoes do modelo (ilustradas a azul), conseguem reproduzir
com bastante fidelidade as observacoes da amostra de teste (ilustradas a preto);
• Quanto ao caso de estudo da PME da industria da Ceramica e do Vidro, a Rede Neuronal que
desenvolveu o modelo com a capacidade preditiva mais precisa, apresentou como arquitetura,
cinco variaveis de entrada, quatro camadas intermedias, uma disposicao de neuronios nas cama-
48
Tabela 5.2: Valores dos parametros incluıdos no desenvolvimento do modelo baseado em Redes NeuronaisArtificiais que apresentou a capacidade preditiva mais precisa, em cada caso de estudo - consumo medido em
perıodos de 15 minutos.
PME Metalurgica PME Ceramica e do VidroNumero de camadas intermedias 4 4
Arquitetura 5-8-8-4-8-1 5-4-8-4-4-1
Variaveis de entrada
- Horario;- Dia da semana;- Mes;- Consumo do dia anterior;- Indicador de dias atıpicos.
- Horario;- Dia da semana;- Mes;- Consumo do dia anterior;- Indicador de dias atıpicos.
Criterio de convergencia 0.05 (5%) 0.05 (5%)Algoritmo de treino Resilient Backpropagation Resilient Backpropagation
Erro no perıodo de treino 11.485% 20.122%Erro no perıodo de teste 9.195% 18.990%
das intermedias (4-8-4-4), usou o algoritmo de treino Resilient Backpropagation e um criterio de
convergencia de 5%. O modelo obteve um erro de 18.990% no perıodo de teste, que de acordo
com a medida de desempenho MAPE apresenta uma boa capacidade preditiva. A figura 5.3 ilus-
tra como as previsoes do modelo (ilustradas a azul), acompanham de forma bastante satisfatoria
as observacoes da amostra de teste (ilustradas a preto).
Figura 5.3: PME da Ceramica e do Vidro - Comparacao entre as previsoes obtidas pelo modelo baseado emRedes Neuronais Artificiais e as observacoes da amostra de teste - consumo medido em perıodos de 15 minutos.
Na previsao do consumo de energia eletrica de cada caso de estudo, medido em perıodos diarios, foi
analisada a capacidade preditiva de 240 modelos baseados em Redes Neuronais Artificiais com varias
arquiteturas e estrategias de treino, nomeadamente diferentes camadas intermedias (1 a 4 camadas
intermedias), numero de neuronios em cada camada intermedia (4 ou 8 neuronios intermedios), algorit-
mos de treino (algoritmo Backpropagation e Resilient Backpropagation), combinacoes de variaveis de
entrada (com e sem a adicao do consumo do dia anterior) e criterios de convergencia (valor de 1% ou
10%), com o objetivo de identificarmos os valores dos parametros do modelo que apresentou a capa-
cidade preditiva mais precisa. Com base na analise dos resultados das previsoes obtidas pelos 240
modelos candidatos no perıodo de teste, destacamos as seguintes conclusoes:
• Um treino mais prolongado, como resultado da definicao de um menor criterio de convergencia
49
(1%), proporcionou uma melhoria significativa na capacidade preditiva dos modelos desenvolvidos
para prever o consumo de energia eletrica das PMEs, medido em perıodos diarios. No caso de
estudo da PME industria Metalurgica, os modelos desenvolvidos com um criterio de convergencia
de 1% apresentaram um erro medio de 7.403%, ao passo que, os modelos configurados com um
criterio de 10% mostraram um erro medio de 16.748%. Relativamente ao caso de estudo da PME
da industria da Ceramica e do Vidro, os modelos implementados com um criterio de convergencia
de 1% exibiram um erro medio de 16.788%, enquanto os modelos configurados com um criterio
de 10% apresentaram um erro medio de 41.823%;
Figura 5.4: PME da Industria Metalugica - Analise comparativa das previsoes desenvolvidas pelas RedesNeuronais, com e sem a adicao do consumo do dia anterior - consumo medido em perıodos diarios.
• Os modelos obtidos pelas Redes Neuronais Artificiais que adicionaram o consumo do dia anterior
como variavel de entrada representaram, de uma forma mais adequada, o padrao de consumo do
dia posterior a um dia atıpico. No caso de estudo da PME da industria Metalurgica, os modelos
que adicionaram o consumo do dia anterior, exibiram um erro medio de 7.403%, ao passo que,
os modelos que excluıram essa variavel da sua construcao, apresentaram um erro medio de
11.928%. Relativamente ao caso de estudo da PME da Ceramica e do Vidro, os modelos que
adicionaram o consumo do dia anterior exibiram um erro medio 16.788%, enquanto os modelos
que excluıram essa variavel da sua construcao, mostraram um erro medio de 31.556%.
Na tabela 5.3 apresentamos os erros das previsoes obtidas pelos modelos que exibiram a capa-
cidade preditiva mais precisa, com e sem a adicao do consumo do dia anterior como variavel de
entrada, em cada dia do perıodo de teste. O modelo que incluiu o consumo do dia anterior apre-
sentou no dia 27-04-2013 (dia posterior a um dia atıpico) um erro de 2.616% na PME da industria
Metalurgica e 10.023% na PME da Ceramica e do Vidro. Os resultados do modelo que excluiu
esta variavel foram significativamente menos precisos, exibindo no dia 27-04-2013 um erro de
89.643% na PME da industria Metalurgica e 225.912% na PME da Ceramica e do Vidro. As figu-
ras 5.4 e 5.5 exibem uma diferenca relevante nas previsoes desenvolvidas pelas redes neuronais
que nao incluıram o consumo do dia anterior e o consumo observado no dia 27-04-2013;
• O incremento do numero de camadas intermedias permitiu melhorar a capacidade preditiva dos
modelos, conforme ilustra a figura 5.6. Os modelos desenvolvidos pelas Redes Neuronais que
50
Tabela 5.3: Erros obtidos em cada dia do perıodo de teste pelos modelos que exibiram a capacidade preditivamais precisa, com e sem a adicao do consumo do dia anterior como variavel de entrada, nos dois casos de
estudo - RNA - Consumo registado em perıodos de diarios.
Perıodo de testeCasos de estudo
PME Metalurgica PME Ceramica e do VidroAdicao Exclusao Adicao Exclusao
17-04-13 2.806% 3.299% 4.301% 5.810%18-04-13 1.347% 1.326% 4.041% 3.986%19-04-13 1.719% 1.994% 14.984% 14.656%20-04-13 0.694% 1.158% 23.035% 27.790%21-04-13 7.239% 4.461% 37.729% 31.266%22-04-13 6.408% 6.331% 1.746% 3.283%23-04-13 1.858% 1.598% 9.819% 6.081%24-04-13 0.789% 0.311% 2.036% 4.019%25-04-13 7.212% 1.275% 13.461% 12.582%26-04-13 6.420% 0.325% 7.117% 6.453%27-04-13 2.616% 89.643% 10.023% 225.912%28-04-13 6.825% 2.802% 6.942% 21.218%29-04-13 2.449% 2.374% 6.860% 8.276%30-04-13 10.770% 10.534% 6.912% 3.045%
Total (MAPE) 4.225% 9.102% 10.643% 26.741%
Figura 5.5: PME da Industria da Ceramica e do Vidro - Analise comparativa das previsoes desenvolvidas porredes neuronais, implementadas com e sem variavel do consumo do dia anterior, Consumo registado diariamente.
foram configuradas com quatro camadas intermedias apresentaram no perıodo de teste um erro
medio de 5.614% no caso de estudo da PME da industria Metalurgica e 12.048% na PME da
industria da Ceramica e do Vidro. Ao passo que, os modelos implementados pelas Redes Neuro-
nais que foram configuradas com apenas uma camada intermedia apresentaram um erro medio
de 11.797% na PME da industria Metalurgica e 26.981% na PME da Ceramica e do Vidro;
• Os modelos baseados em Redes Neuronais que foram configuradas com o algoritmo de treino Re-
silient Backpropagation, apresentaram uma capacidade preditiva mais precisa, comparativamente
com os modelos baseados em Redes Neuronais que usaram o algoritmo Backpropagation. Na
PME da industria Metalurgica os modelos desenvolvidos pelas Redes Neuronais configuradas
com o algoritmo Resilient Backpropagation apresentaram um erro medio de 7.403% e na PME
da Ceramica e do Vidro um erro medio de 16.788%. Os modelos desenvolvidos pelas Redes
51
Figura 5.6: Media dos erros das previsoes obtidas pelos modelos baseados em Redes Neuronais em funcao donumero de camadas intermedias - perıodo de teste - consumo medido em perıodos diarios.
Neuronais que foram implementadas com o algoritmo Backpropagation, exibiram um erro medio
de 15.352% na PME da industria Metalurgica e de 27.681% na PME da Ceramica e do Vidro;
• Na tabela 5.4 sao apresentados os valores dos parametros que foram incluıdos no desenvolvi-
mento do modelo baseado em Redes Neuronais Artificiais que apresentou a capacidade preditiva
mais precisa em cada caso de estudo, na previsao do consumo de energia eletrica, medido em
perıodos diarios. A Rede Neuronal que desenvolveu o modelo com a capacidade preditiva mais
precisa no caso de estudo da PME da industria Metalurgica, apresentou como arquitetura, quatro
variaveis de entrada (dia da semana, mes, indicador de dias atıpicos e o consumo do dia anterior),
quatro camadas intermedias, uma disposicao de neuronios nas camadas intermedias (8-4-8-4),
usou o algoritmo de treino Resilient Backpropagation e um criterio de convergencia de 1%. Este
modelo obteve um erro de 4.225% no perıodo de teste, que de acordo com a medida de desem-
penho MAPE a sua capacidade preditiva pode ser classificada de precisa. A figura 5.7 ilustra
como as previsoes do modelo (ilustradas a azul), conseguem reproduzir com bastante fidelidade
as observacoes da amostra de teste (ilustradas a preto);
Figura 5.7: PME da industria Metalurgica - Comparacao entre as previsoes obtidas pelo modelo baseado emRedes Neuronais Artificiais e as observacoes da amostra de teste - consumo medido em perıodos diarios.
• Quanto ao caso de estudo da PME da industria da PME da industria da Ceramica e do Vidro, a
Rede Neuronal que desenvolveu o modelo com a capacidade preditiva mais precisa, apresentou
como arquitetura, quatro variaveis de entrada, quatro camadas intermedias, uma disposicao de
52
Tabela 5.4: Valores dos parametros incluıdos no desenvolvimento do modelo baseado em Redes NeuronaisArtificiais que apresentou a capacidade preditiva mais precisa, em cada caso de estudo - consumo medido em
perıodos diarios.
PME Metalurgica PME Ceramica e do VidroNumero de camadas intermedias 4 4
Arquitetura de rede 4-8-4-8-4-1 4-8-4-4-4-1
Variaveis de entrada
- Dia da semana;- Mes;- Consumo do dia anterior;- Indicador de dias atıpicos.
- Dia da semana;- Mes;- Consumo do dia anterior;- Indicador de dias atıpicos.
Criterio de convergencia 0.01 (1%) 0.01 (1%)Algoritmo de treino Resilient Backpropagation Resilient Backpropagation
Erro no perıodo de treino 5.802% 9.258%Erro no perıodo de teste 4.225% 10.643%
neuronios nas camadas intermedias (8-4-4-4), usou o algoritmo de treino Resilient Backpropa-
gation e um criterio de convergencia de 1%. O modelo obteve um erro de 10.643% no perıodo
de teste, que de acordo com a medida de desempenho MAPE apresenta uma boa capacidade
preditiva. A figura 5.8 ilustra como as previsoes do modelo (ilustradas a azul), acompanham de
forma bastante satisfatoria as observacoes da amostra de teste (ilustradas a preto).
Figura 5.8: PME da Ceramica e do Vidro - Comparacao entre as previsoes obtidas pelo modelo baseado emRedes Neuronais Artificiais e as observacoes da amostra de teste - consumo medido em perıodos diarios.
53
5.2 Regressao Linear Multipla
Na tecnica de modelacao, Regressao Linear Multipla, foi analisada a capacidade preditiva de quatro
modelos candidatos com diferentes conjugacoes de variaveis independentes (coeficientes de Fourier,
indicador de dias atıpicos e o consumo do dia anterior), com o objetivo de identificarmos as variaveis
que foram incluıdas no modelo que apresentou a capacidade preditiva mais precisa, na previsao do
consumo de energia eletrica de cada caso de estudo, medido em perıodos de 15 minutos. Na tabela 5.5
mostramos os resultados das previsoes obtidas pelos quatro modelos candidatos no perıodo de teste,
de acordo com a medida de desempenho MAPE. Com base nos resultados das previsoes obtidas pelos
quatro modelos candidatos no perıodo de teste, destacamos as seguintes conclusoes:
• Nenhum dos modelos candidatos apresentou uma capacidade preditiva satisfatoria. No caso de
estudo da PME da industria Metalurgica, o modelo candidato que apresentou a capacidade pre-
ditiva “menos imprecisa”, foi o modelo 3, que adicionou na sua implementacao os coeficientes de
Fourier e o indicador de dias atıpicos, exibindo um erro de 87.758% no perıodo de teste. Quanto
ao caso de estudo da PME da industria da Ceramica e do Vidro, foi o modelo 1 que apresentou o
menor erro, 265.224%, adicionando na sua implementacao os coeficientes de Fourier, indicador
de dias atıpicos e o consumo do dia anterior;
• Com base na analise da tabela 5.7, onde sao apresentados os erros obtidos em cada dia do
perıodo de teste, constatamos que a baixa capacidade preditiva dos modelos foi influenciada
negativamente pelos erros registados nos dias 25, 26 (dias atıpicos) e 27 de abril (dia posterior a
um dia atıpico). No caso de estudo da PME da industria Metalurgica, foram registados erros de
525.324% e 401.138% nos dias 25 e 26 de abril, e no dia 27 de abril, um erro de 100.776%. Na
PME da industria da Ceramica e do Vidro, foram registados erros de 1985.583% e 1192.135%
nos dias 25 e 26 de abril, e no dia 27 de abril, um erro de 205.885%. O erro medio nos restantes
dias, com a exclusao dos erros observados nos dias 25, 26 e 27 de abril, ronda os 18.306% na
PME da industria Metalurgica e 29.958% na PME da Ceramica e do Vidro, valores que, embora
nao sejam excelentes, sao perfeitamente aceitaveis;
• Atraves da analise das figuras 5.9 e 5.10, confirmamos que existe uma discrepancia importante
entre as previsoes desenvolvidas nos dias 25, 26 e 27 de abril e os valores observados no perıodo
de teste, o que revela a incapacidade dos modelos em representar o padrao de consumo de dias
atıpicos e do dia posterior a dias atıpicos;
• A baixa capacidade preditiva dos modelos desenvolvidos pela Regressao Linear multipla esteve
relacionada com a adicao dos coeficientes de Fourier na sua construcao. Os coeficientes de Fou-
rier foram adicionados na construcao dos modelos com o objetivo de representar a sazonalidade
do consumo de energia eletrica das PMEs, medido em perıodos de 15 minutos. Mesmo com
a adicao de uma variavel responsavel por identificar dias atıpicos, os coeficientes de Fourier in-
cluıram a sazonalidade do dia em analise, provocando um acrescimo relevante no erro global dos
modelos, tratando os dias atıpicos como “dias normais”.
54
Figura 5.9: PME da industria Metalurgica - Comparacao entre as observacoes da amostra de teste e asprevisoes desenvolvidas pelo modelo de Regressao Linear Multipla - consumo medido em perıodos de 15
minutos.
Figura 5.10: PME da industria da Ceramica e do Vidro - Comparacao entre as observacoes da amostra de testee as previsoes desenvolvidas pelo modelo de Regressao Linear Multipla - consumo medido em perıodos de 15
minutos.
Na previsao do consumo de cada caso de estudo, medido em perıodos diarios, foi analisada a
capacidade preditiva de seis modelos candidatos com diferentes conjugacoes de variaveis independen-
tes (indicador do dia da semana, mes, dias atıpicos e o consumo do dia anterior), com o objetivo de
identificarmos as variaveis que foram incluıdas no modelo que apresentou a capacidade preditiva mais
precisa. Na tabela 5.6 mostramos os resultados das previsoes obtidas pelos seis modelos candidatos
no perıodo de teste, de acordo com a medida de desempenho MAPE. Com base nos resultados das
previsoes obtidas pelos modelos candidatos no perıodo de teste, destacamos as seguintes conclusoes:
• O modelo candidato que apresentou a capacidade preditiva mais precisa, na previsao do con-
sumo de energia eletrica das PMEs, medido em perıodos diarios, foi o modelo 3, que adicionou
Tabela 5.5: Resultado das previsoes obtidas no perıodo de teste, pelos quatro modelos candidatos, de acordocom a medida de desempenho MAPE - Consumo medido em perıodos de 15 minutos - Regressao Multipla.
Modelos deRegressao Multipla
PME da industriaMetalurgica
PME da industria daCeramica e do Vidro
modelo 1 90.457% 265.224%modelo 2 147.995% 497.854%modelo 3 87.758% 281.315%modelo 4 139.374% 418.071%
55
Tabela 5.6: Resultado das previsoes obtidas no perıodo de teste, pelos cinco modelos candidatos, de acordocom a medida de desempenho MAPE - Consumo medido em perıodos diarios - Regressao Linear Multipla.
Modelos deRegressao Multipla
PME da industriaMetalurgica
PME da industria daCeramica e do Vidro
modelo 1 12.311% 42.889%modelo 2 16.297% 42.800%modelo 3 8.304% 27.890%modelo 4 11.219% 43.165%modelo 5 17.356% 45.807%modelo 6 16.740% 47.848%
na sua construcao os indicadores do dia da semana e de dias atıpicos. A indicacao de nao ser ne-
cessario adicionar os indicadores dos meses pode estar relacionado com um padrao de consumo
semelhante nos meses em analise (fevereiro, marco e abril). Quanto ao consumo do dia anterior,
a Regressao Linear Multipla nao foi capaz de descrever a relacao nao linear entre o consumo de
energia eletrica das PMEs e o consumo do dia anterior;
• No caso de estudo da PME da industria Metalurgica, o modelo 3 apresentou uma capacidade
preditiva bastante precisa, exibindo um erro de 8.304% no perıodo de teste. Um erro signifi-
cativamente inferior ao apresentado pelo modelo 1, 12.311%, que adicionou todas as variaveis
independentes. Na PME da industria da Ceramica e do Vidro, a diferenca entre o erro apresen-
tado pelo modelo 3 e o modelo 1 ainda e mais acentuada. O modelo 3, que adicionou apenas os
indicadores do dia da semana e de dias atıpicos, exibiu um erro de 27.890%, enquanto o modelo
1, que adicionou todas as variaveis independentes apresentou um erro de 42.899%;
Figura 5.11: PME da industria Metalurgica - Comparacao entre as observacoes da amostra de teste e asprevisoes desenvolvidas pelo modelo de Regressao Linear Multipla - consumo medido em perıodos diarios.
• As figuras 5.11 (PME da industria Metalurgica) e 5.12 (PME da industria da Ceramica e do Vi-
dro), mostram como as previsoes obtidas pelo modelo 3, reproduzem com bastante fidelidade as
observacoes da amostra de teste. No entanto, no dia 27-04-2013, observamos uma diferenca sig-
nificativa entre o consumo observado e o valor previsto pelo modelo. Este dia corresponde a um
dia posterior a um dia atıpico, que apresenta um padrao de consumo anomalo, face a ausencia de
consumos relevantes no perıodo entre a 00h00 e as 07h00. Atraves da analise da tabela 5.7, que
apresenta os erros obtidos em cada dia do perıodo de teste, pelo modelo 3, constatamos que o
56
Tabela 5.7: Erros obtidos em cada dia do perıodo de teste pelos modelos que exibiram a capacidade preditivamais precisa - Consumo medido em perıodos de 15 minutos e diarios - Regressao Linear Multipla.
Perıodo de TestePME Industria
Metalurgica(15 minutos)
PME IndustriaCeramica e do Vidro
(15 minutos)
PME IndustriaMetalurgica
(diario)
PME IndustriaCeramica e do Vidro
(diario)17-04-2013 7.658% 6.741% 5.318% 1.864%18-04-2013 6.781% 8.209% 1.054% 2.853%19-04-2013 7.153% 19.847% 1.762% 15.920%20-04-2013 21.148% 28.210% 1.915% 20.359%21-04-2013 52.254% 49.133% 2.597% 52.253%22-04-2013 10.933% 60.269% 1.005% 2.194%23-04-2013 7.382% 12.321% 0.346% 3.587%24-04-2013 6.280% 15.615% 1.638% 0.140%25-04-2013 525.324% 1985.583% 0.000% 6.250%26-04-2013 401.138% 1192.135% 0.000% 6.250%27-04-2013 100.776% 205.885% 88.191% 259.447%28-04-2013 55.049% 93.288% 0.906% 15.794%29-04-2013 11.802% 17.380% 2.754% 3.082%30-04-2013 14.929% 18.524% 8.766% 0.471%
Total (MAPE) 87.758% 265.224% 8.304% 27.890%
unico erro relevante foi registado no dia 27-04-2013, com um valor de 88.181% no caso de estudo
da PME da industria Metalurgica e na PME da industria da Ceramica e do Vidro de 259.447%. A
incapacidade em representar o padrao de consumo do dia posterior a um dia atıpico confere uma
capacidade preditiva menos precisa aos modelos obtidos.
Figura 5.12: PME da industria da Ceramica e do Vidro - Comparacao entre as observacoes da amostra de testee as previsoes obtidas pelo modelo de Regressao Linear Multipla - consumo medido em perıodos diarios.
57
Tabela 5.8: Resultados das previsoes obtidas no perıodo de teste, pelos modelos desenvolvidos pelas trestecnicas Grey Model, de acordo com a medida de desempenho MAPE.
Grey ModelsPME Metalurgica PME Ceramica e do Vidro
15 minutos Diarios 15 minutos DiariosGM(1,1) 192.041% 220.531% 499.154% 540.814%
Fourier GM(1,1) 144.815% 148.318% 519.775% 537.898%GM(1,N) 271.280% 32.434% 715.665% 86.445%
5.3 Grey Model
Finalmente, analisamos a capacidade preditiva dos modelos desenvolvidos pelas tres tecnicas Grey
Model aplicadas na presente dissertacao, nomeadamente GM(1,1), Fourier GM(1,1) e GM(1,N), na pre-
visao do consumo de energia eletrica de duas PMEs portuguesas, medido em perıodos de 15 minutos
e diarios. Na tabela 5.8 apresentamos os resultados das previsoes obtidas pelos modelos no perıodo
de teste, de acordo com a medida de desempenho MAPE. Em funcao da analise dos resultados das
previsoes obtidas pelos diferentes modelos, enumeramos as seguintes conclusoes:
• Os modelos desenvolvidos pela tecnica GM(1,1) revelaram incapacidade em representar a sa-
zonalidade do consumo de energia eletrica das PMEs, medido em perıodos de 15 minutos e
diarios. As figuras 5.13 (consumo medido em perıodos de 15 minutos) e 5.14 (consumo medido
em perıodos diarios) mostram uma discrepancia importante entre os valores previstos (ilustrados
a vermelho) e os valores observados na perıodo de teste (ilustrados a preto). Apenas a tendencia
do consumo de energia eletrica das PMEs e ilustrada. Do lado esquerdo das figuras 5.13 e 5.14
sao ilustradas as previsoes do consumo de energia eletrica da PME da industria da Ceramica e
do Vidro, e do lado direito as previsoes do consumo da PME da industria Metalurgica;
Figura 5.13: Comparacao entre as previsoes obtidas pelos modelos baseados em GM(1,1) e Fourier GM(1,1) eas observacoes da amostra de teste - consumo medido em perıodos de 15 minutos - PME da industria da
Ceramica e do Vidro (esq.) e PME da industria Metalurgica (drt.).
• No caso de estudo da PME da industria Metalurgica, os modelos desenvolvidos pela tecnica
GM(1,1) apresentaram um erro de 192.041% na previsao do consumo medido em perıodos de
15 minutos e de 220.531% no consumo medido em perıodos diarios. Relativamente ao caso de
estudo da PME da Ceramica e do Vidro, os modelos desenvolvidos por GM(1,1) exibiram um erro
de 499.154% na previsao do consumo medido em perıodos de 15 minutos e de 540.814% no
consumo medido em perıodos diarios. A incapacidade dos modelos desenvolvidos por GM(1,1),
58
em representar a sazonalidade do consumo das PMEs, justifica a baixa capacidade preditiva;
Figura 5.14: Comparacao entre as previsoes obtidas pelos modelos baseados em GM(1,1) e Fourier GM(1,1) eas observacoes da amostra de teste - consumo medido em perıodos diarios - PME da industria da Ceramica e do
Vidro (esq.) e PME da industria Metalurgica (drt.).
• Consultando os resultados exibidos na tabela 5.8, verificamos que os modelos desenvolvidos pela
tecnica Fourier GM(1,1) exibiram erros extremamente elevados no perıodo de teste, o que atesta
a sua incapacidade em prever com precisao o consumo de energia eletrica de PMEs, medido em
perıodos de 15 minutos e diarios. Nas figuras 5.13 e 5.14, observamos uma diferenca significativa
entre os valores previstos (ilustrados a azul) e os valores observados (ilustrados a preto) nos dias
25, 26 (dias atıpicos - feriado e dia de ponte) e 27 de abril (dia posterior a um dia atıpico);
• No caso de estudo da PME da industria Metalurgica, os modelos desenvolvidos pela tecnica Fou-
rier GM(1,1) apresentaram um erro de 148.318% na previsao do consumo medido em perıodos
de 15 minutos e de 144.815% no consumo medido em perıodos diarios. Relativamente ao caso
de estudo da PME da industria da Ceramica e do Vidro, os modelos desenvolvidos pela tecnica
Fourier GM(1,1) exibiram um erro de 537.898% na previsao do consumo medido em perıodos de
15 minutos e de 519.775% no consumo medido em perıodos diarios;
• A incapacidade dos modelos desenvolvidos pela tecnica Fourier GM(1,1) em modelar o padrao
de consumo de dias atıpicos (feriados, ferias ou dias de ponte) e do dia posterior a dias atıpicos,
contribuiu para a obtencao de uma baixa capacidade preditiva. Esta afirmacao e sustentada com
base na analise da tabela 5.9, onde sao apresentados os erros das previsoes obtidas em cada
dia do perıodo de teste. Atraves da sua analise constatamos que os erros mais relevantes foram
observados em dias atıpicos, 25 e 26 de abril de 2013. Outro erro significativo foi registado no
dia 27 de abril, dia posterior a um dia atıpico. O erro medio nos restantes dias (excluindo os dias
25, 26 e 27 de abril) ronda os 10% na previsao do consumo medido em perıodos de 15 minutos,
e 11% na previsao do consumo medido diariamente na PME da industria Metalurgica. Valores
que, embora nao sejam excelentes, sao perfeitamente aceitaveis. O mesmo se constata na PME
da Ceramica e do Vidro, onde o erro medio ronda os 26% na previsao do consumo medido em
perıodos de 15 minutos e 13% na previsao do consumo medido diariamente;
• Os resultados apresentados na tabela 5.8, permitem constatar que a adicao de variaveis indepen-
dentes na construcao dos modelos desenvolvidos pela tecnica GM(1,N) nao permitiu obter uma
59
Tabela 5.9: Erros das previsoes obtidas em cada dia do perıodo de teste pelo modelo desenvolvido pela tecnicaFourier GM(1,1).
Perıodo de TestePME Industria
Metalurgica(15 minutos)
PME IndustriaCeramica e do Vidro
(15 minutos)
PME IndustriaMetalurgica
(diario)
PME IndustriaCeramica e do Vidro
(diario)17-04-2013 7.842% 10.295% 3.700% 6.714%18-04-2013 6.665% 11.901% 2.574% 7.582%19-04-2013 10.597% 18.634% 12.275% 19.905%20-04-2013 13.897% 21.359% 12.899% 26.940%21-04-2013 8.248% 26.473% 20.728% 28.715%22-04-2013 8.644% 64.738% 9.130% 0.163%23-04-2013 10.857% 13.748% 9.654% 6.888%24-04-2013 6.384% 18.927% 0.203% 5.816%25-04-2013 1032.979% 3780.328% 1008.595% 3742.157%26-04-2013 854.193% 3189.568% 829.821% 3151.253%27-04-2013 79.903% 276.680% 65.734% 237.977%28-04-2013 6.384% 64.239% 21.190% 35.569%29-04-2013 10.976% 15.438% 12.802% 4.217%30-04-2013 18.899% 18.238% 18.110% 2.957%
Total (MAPE) 148.318% 537.898% 144.815% 519.775%
capacidade preditiva satisfatoria, na previsao do consumo de energia eletrica das PMEs, me-
dido em perıodos de 15 minutos. A adicao de variaveis independentes com valores nao binarios
(horario, dia da semana e mes) esteve relacionada com a incapacidade em modelar adequada-
mente a componente periodica do consumo das PMEs medido em perıodos de 15 minutos;
• No caso de estudo da PME da industria Metalurgica, os modelos desenvolvidos pela tecnica
GM(1,N) apresentaram um erro de 271.280% na previsao do consumo medido em perıodos de
15 minutos. Enquanto na PME da Ceramica e do Vidro, os modelos desenvolvidos por GM(1,N)
exibiram um erro de 715.665%. A figura 5.15 mostra uma discrepancia importante entre os valores
previstos (ilustrados a azul) e os valores observados na fase de teste (ilustrados a preto);
Figura 5.15: Comparacao entre as previsoes obtidas pelo modelo baseado em GM(1,N) e as observacoes daamostra de teste - consumo medido em perıodos de 15 minutos - PME da industria da Ceramica e do Vidro (esq.)
e PME da industria Metalurgica (drt.).
• Na previsao do consumo de energia eletrica medido em perıodos diarios, obtivemos uma me-
lhoria significativa na capacidade preditiva dos modelos desenvolvidos pela tecnica GM(1,N), em
comparacao com os resultados exibidos pelos modelos desenvolvidos pelas outras duas tecnicas
Grey Model (Fourier GM(1,1) e GM(1,1)). A adicao de variaveis independentes na construcao
60
dos modelos possibilitou incrementar a sua capacidade preditiva. No entanto, os elevados erros
obtidos no perıodo de teste desaconselham a sua aplicacao para prever o consumo de energia
eletrica de PME, medido em perıodos diarios;
• No caso de estudo da PME da industria Metalurgica, o modelo desenvolvido pela tecnica GM(1,N)
apresentou um erro de 32.434% no perıodo de teste, que de acordo com a medida de desem-
penho MAPE a sua capacidade preditiva pode ser classificada como ”razoavel”. Quanto ao caso
de estudo da PME da industria da Ceramica e do Vidro, os resultados obtidos foram imprecisos,
com um erro de 86.445%. A figura 5.16 mostra como as previsoes obtidas pelo modelo desenvol-
vido pela tecnica GM(1,N) (ilustradas a azul) nao reproduzem com precisao as observacoes da
amostra de teste (ilustradas a preto);
• Na tabela 5.10 sao apresentados os erros das previsoes obtidas em cada dia do perıodo de teste
pelo modelo desenvolvido pela tecnica GM(1,N). Atraves da sua analise, constatamos que no
caso de estudo da PME da industria Metalurgica, o erro mais relevante foi observado no dia 25
de abril, com um valor de 240.729%. Na PME da industria da Ceramica e do Vidro os erros mais
relevantes foram observados nos dias 25 e 26 de abril, com valores de 723.460% e 297.819%.
A incapacidade dos modelos desenvolvidos pela tecnica GM(1,N) em representar o padrao de
consumo de dias atıpicos, esteve relacionado com a sua baixa capacidade preditiva, mesmo com
a adicao de uma variavel com a funcao de identificar dias atıpicos;
Figura 5.16: Comparacao entre as previsoes obtidas pelo modelo baseado em GM(1,N) e as observacoes daamostra de teste - consumo medido em perıodos diarios - PME da industria da Ceramica e do Vidro (esq.) e PME
da industria Metalurgica (drt.).
• Os modelos desenvolvidos pelas tres tecnicas Grey Model apresentaram erros significativos no
perıodo de teste, o que revela a sua incapacidade em modelar adequadamente o comportamento
do consumo de energia eletrica de PMEs, medido em perıodos curtos (15 minutos e diarios). Essa
incapacidade esta relacionada com a elevada volatilidade dos dados (multiplas sazonalidades).
61
Tabela 5.10: Erros das previsoes obtidas em cada dia do perıodo de teste, pelo modelo desenvolvido pelatecnica GM(1,N) - consumo medido em perıodos diarios.
Perıodo de TestePME Industria
Metalurgica(Diarios)
PME IndustriaCeramica e do Vidro
(Diarios)17-04-2013 12.126% 12.454%18-04-2013 1.887% 2.394%19-04-2013 5.124% 30.966%20-04-2013 19.298% 6.447%21-04-2013 39.657% 8.342%22-04-2013 13.021% 16.906%23-04-2013 3.367% 4.971%24-04-2013 8.702% 12.656%25-04-2013 240.729% 723.460%26-04-2013 4.122% 297.819%27-04-2013 24.050% 20.703%28-04-2013 68.003% 64.185%29-04-2013 8.748% 8.320%30-04-2013 5.235% 0.605%
Total (MAPE) 32.434% 86.445%
5.4 Analise comparativa
De acordo com os resultados discutidos nas seccoes anteriores, concluımos que os modelos baseados
em Redes Neuronais Artificiais apresentaram a capacidade preditiva mais precisa, comparativamente
com os modelos desenvolvidos pelas outras duas tecnicas aplicadas nesta dissertacao, Regressao Li-
near Multipla e Grey Model, na previsao do consumo das PMEs medido em perıodos de 15 minutos e
diarios. No caso de estudo da PME da industria Metalurgica, os modelos baseados em Redes Neuro-
nais Artificiais revelaram uma capacidade preditiva bastante precisa, na previsao do consumo medido
em perıodos de 15 minutos e diarios, exibindo um erro de 9.195% e 4.225%, respetivamente. Relati-
vamente ao caso de estudo da PME da industria da Ceramica e do Vidro, os modelos baseados em
Redes Neuronais Artificiais exibiram uma boa capacidade preditiva, na previsao do consumo medido
em perıodos de 15 minutos e diarios, apresentando um erro de 18.990% e 10.643%, respetivamente.
A discrepancia nos erros exibidos em cada caso de estudo, no perıodo de teste, pode ser justificada
pela ocorrencia de consumos anormalmente elevados nos dias 19 e 20 de abril de 2013 (sabado e do-
mingo) na PME da industria da Ceramica, contribuindo para a obtencao de um erro global mais elevado
nos modelos desenvolvidos neste caso de estudo. Na previsao do consumo medido em perıodos de
15 minutos, outro erro que contribuiu para a obtencao de uma capacidade preditiva menos precisa do
modelo desenvolvido no caso de estudo da PME da Ceramica e do Vidro, foi observado no dia 29 de
abril de 2013. Neste dia, foram registados consumos anormalmente elevado no perıodo entre a 00h00
e as 07h00 para o padrao de consumo de uma segunda-feira. Relativamente a obtencao de previsoes
mais precisas no consumo medido em perıodos diarios, comparativamente com o consumo medido em
perıodos de 15 minutos, esta relacionada com a enorme volatilidade das observacoes.
Os modelos desenvolvidos pela Regressao Linear Multipla apresentaram uma capacidade preditiva
ligeiramente inferior aos modelos baseados em Redes Neuronais Artificiais, na previsao do consumo de
62
energia eletrica registado diariamente, exibindo um erro de 10.643% na PME da industria Metalurgica
e 27.890% na PME da Ceramica e do Vidro. A precisao acrescida nas previsoes obtidas pelos mo-
delos baseados em Redes Neuronais Artificiais esteve relacionada com a capacidade em modelarem
adequadamente o padrao de consumo do dia posterior a um dia atıpico. Nos graficos 5.17 (PME Me-
talurgica) e 5.18 (PME da Ceramica e do Vidro) e ilustrada uma comparacao entre as previsoes obtidas
em cada dia do perıodo de teste, pelos modelos desenvolvidos pelas tres tecnicas de modelacao, e as
observacoes da amostra de teste. Atraves da sua analise constatamos que, a previsao elaborada pelo
modelo baseado em Redes Neuronais Artificiais (ilustrada a vermelho), no dia 27 de abril (dia posterior
a um dia atıpico), aproxima-se com precisao ao valor observado (ilustrado a azul), algo que nao se
observa nas previsoes obtidas pelos modelos desenvolvidos pelas tecnicas, Regressao Linear Multipla
(ilustradas a roxo) e Grey Model (ilustradas a verde), que apresentaram previsoes sobrestimadas.
A capacidade preditiva dos modelos desenvolvidos pela tecnica de modelacao, Regressao Linear
Multipla, na previsao do consumo medido em perıodos de 15 minutos, revelou-se imprecisa. A impre-
cisao dos resultados esteve relacionada com a adicao dos coeficientes de Fourier na construcao dos
modelos. Mesmo com a adicao de uma variavel com a funcao de identificar dias atıpicos, os coeficien-
tes de Fourier incluıram a sazonalidade do dia em analise, provocando um acrescimo significativo no
erro global dos modelos.
Figura 5.17: PME Metalurgica - Analise comparativa entre as previsoes obtidas em cada dia do perıodo de teste,pelos modelos desenvolvidos por cada tecnica de modelacao, e as observacoes da amostra de teste.
A tecnica Grey Model que desenvolveu o modelo “menos impreciso”, na previsao do consumo me-
dido em perıodos de 15 minutos, foi Fourier GM(1,1). A incapacidade dos modelos desenvolvidos pela
tecnica Fourier GM(1,1) em representar o padrao de consumo de dias atıpicos, contribuiu negativa-
mente para a obtencao de uma capacidade preditiva imprecisa nos dois casos de estudo. Quanto ao
consumo registado diariamente, GM(1,N) foi a tecnica Grey Model que desenvolveu o modelo que apre-
sentou a capacidade preditiva mais satisfatoria. Contudo, os elevados erros obtidos no perıodo de teste,
desaconselham a aplicacao desta tecnica. O modelo baseado na tecnica GM(1,N) apresentou um erro
de 37.687% na PME da industria Metalurgica, enquanto na PME da industria da Ceramica e do Vidro,
obteve um erro de 87.857%. A ideia chave que podemos extrair da aplicacao dos tres Grey Models e
a sua incapacidade em modelar adequadamente o comportamento do consumo de energia eletrica de
PMEs, medido em perıodos curtos (15 minutos e diarios). Essa incapacidade esteve relacionada com
63
a elevada volatilidade dos dados (presenca de multiplas sazonalidades (diaria, semanal e anual)).
Figura 5.18: PME Ceramica e do Vidro - Analise comparativa entre as previsoes obtidas em cada dia do perıodode teste, pelos modelos desenvolvidos por cada tecnica de modelacao, e as observacoes da amostra de teste.
64
Capıtulo 6
Conclusoes
Nesta dissertacao, contribuımos com a elaboracao de uma analise comparativa da capacidade preditiva
de modelos desenvolvidos por tres tecnicas de modelacao, nomeadamente Redes Neuronais Artifici-
ais, Regressao Linear Multipla e Grey Model, na previsao do consumo de energia eletrica de duas
PMEs portuguesas de diferentes areas comerciais (Metalurgica e da Ceramica e do Vidro), medido em
perıodos de 15 minutos e diarios. De acordo com os resultados das previsoes obtidas, concluımos
que os modelos baseados em Redes Neuronais Artificiais apresentaram a capacidade preditiva mais
precisa, comparativamente com os modelos desenvolvidos pelas outras duas tecnicas aplicadas.
A precisao acrescida nas previsoes obtidas pelos modelos baseados em Redes Neuronais, esteve
relacionada com a capacidade em modelarem adequadamente o padrao de consumo do dia posterior a
um dia atıpico (p. ex. feriado ou dia de ponte), onde e observado um padrao de consumo anomalo, face
a ausencia de consumos relevantes no perıodo entre a 00h00 e as 07h00. A capacidade preditiva dos
modelos desenvolvidos pela Regressao Linear Multipla, na previsao do consumo de energia eletrica
medido em perıodos de 15 minutos, revelou-se imprecisa. Essa imprecisao esteve relacionada com a
adicao dos coeficientes de Fourier na construcao dos modelos. Mesmo com a adicao de uma variavel
com a funcao de identificar dias atıpicos, os coeficientes de Fourier incluıram a componente periodica
do dia em analise, provocando um acrescimo significativo no erro global dos modelos.
As tres tecnicas Grey Model aplicadas nesta dissertacao, GM(1,1), Fourier GM(1,1) e GM(1,N),
revelaram incapacidade em modelar adequadamente o comportamento do consumo de energia eletrica
de PMEs, medido em perıodos curtos (15 minutos e diarios). Essa incapacidade esteve relacionada
com a elevada volatilidade dos dados (presenca de multiplas sazonalidades (diaria, semanal, anual)).
Como trabalho futuro, pretendemos usar uma amostra de maior dimensao, pelo menos um ano de
observacoes, de forma a analisarmos a capacidade preditiva dos modelos num perıodo mais longo.
Outra tarefa a desenvolver futuramente, esta relacionada com a adicao de indicadores economicos na
construcao dos modelos, por exemplo, numero de funcionarios e o valor da producao. A adicao de
indicadores economicos na construcao dos modelos permitira prever o consumo de energia eletrica
das PME, de acordo com os valores especificados nesses indicadores.
65
Bibliografia
[1] EDP. Liberalizacao do mercado de eletricidade e gas. https://www.edp.pt/pt/particulares/
informacoesuteis/Pages/ALiberalizacao.aspx.
[2] K. Berk. Modeling and Forecasting Electricity Demand: A Risk Management Perspective. Springer,
1st edition, 2015. ISBN: 978-3-658-08668-8.
[3] S. Saravanan, S. Kannan, and C. Thangaraj. Forecasting India’s Electricity Demand Using Artificial
Neural Network. In International Conference On Advances In Engineering, Science And Manage-
ment, 2012.
[4] K. Kavaklioglu, H. Ceylan, H. K. Ozturk, and O. E. Canyurt. Modeling and prediction of Turkey’s
electricity consumption using Artificial Neural Networks. Energy Conversion and Management,
page 2719–2727, 2009.
[5] J. Deng. Modeling and Prediction of China’s Electricity Consumption Using Artificial Neural
Network. In International Conference on Energy and Environment Technology, 2010.
[6] L. Ekonomou. Greek long-term energy consumption prediction using artificial neural networks.
Energy, page 512–517, 2009.
[7] Z. W. Geem and W. E. Roper. Energy demand estimation of South Korea using artificial neural
network. Energy Policy, page 4049–4054, 2009.
[8] M. A. Azadeh and S. Sohrabkhani. Annual Electricity Consumption Forecasting with Neural
Network in High Energy Consuming Industrial Sectors of Iran. In Industrial Technology, 2006.
[9] A. Abraham and B. Nath. A neuro-fuzzy approach for modelling electricity demand in Victoria.
Applied Soft Computing, page 127–138, 2001.
[10] M. N. Mehr, F. F. Samavati, and M. Jeihoonian. Annual energy demand estimation of Iran industrial
sector by Fuzzy regression and ARIMA. In Eighth International Conference on Fuzzy Systems and
Knowledge Discovery (FSKD), 2011.
[11] E. Erdogdu. Electricity demand analysis using cointegration and ARIMA modelling: A case study
of Turkey. Energy Policy, page 1129–1146, 2006.
66
[12] Q. Wang, F. Xia, and X. Wang. Integration of grey model and multiple regression model to predict
energy consumption. In International Conference on Energy and Environment Technology, 2009.
[13] Q. Wang. Grey Prediction Model and Multivariate Statistical Techniques Forecasting Electrical
Energy Consumption in Wenzhou, China. Second International Symposium on Intelligent Informa-
tion Technology and Security Informatics, 2009.
[14] C.-C. Hsu and C.-Y. Chen. Applications of improved grey prediction model for power demand
forecasting. Energy Conversion and Management, page 2241–2249, 2003.
[15] L. Zhou and D. Xie. Prediction of Rural Electricity Consumption Based on Grey-Markov Model.
2011.
[16] X. B. Li, Z. X. Jing, and Q. H. Wu. Application of improved gm(1,n) models in annual electricity
demand forecasting. 2015.
[17] INE. Resultados finais para 2014. VAB das empresas nao financeiras aumentou 4,0%, em termos
nominais. https://www.ine.pt/ngt_server/attachfileu.jsp?look_parentBoui=255919163&
att_display=n&att_download=y, 2016.
[18] L. Torgo. A Linguagem R: Programacao para a analise de dados, chapter 9, pages 173–180.
Escolar Editora, 1st edition, 2009. ISBN: 978-972-592-246-0.
[19] M. P. Allen. Understanding Regression Analysis, chapter 16, page 76. Springer Science & Business
Media, 1st edition, 1997. ISBN: 9780306456480.
[20] A. Kumar. Research Methodology in Social Science, chapter 7, page 127. Sarup & Sons, 2nd
edition, 2002. ISBN: 9788176252782.
[21] R. Hubbard and A. O’Brien. Introducao a Economia, chapter 1, page 87. Bookman, 2nd edition,
2010. ISBN: 9780136092056.
[22] C. Sousa. Regressao Linear Multipla. Escola Superior de Tecnologia Universidade do Al-
garve, 2007. http://w3.ualg.pt/~cfsousa/Ensino/Comp_mat/regress%C3%A3o%20linear%20m%
C3%BAltipla_07-08_.pdf.
[23] P. F. Dunn. Measurement and Data Analysis for Engineering and Science, chapter 9, page 355.
CRC Press, 2nd edition, 2010.
[24] O. K. Erdal Kayacan, Baris Ulutas. Grey system theory-based models in time series prediction.
Expert Systems with Applications, page 1784–1789, 2009.
[25] J. R. Daube and D. I. Rubin. Clinical Neurophysiology, chapter 1, page 64. Oxford University Press,
3rd edition, 2009.
[26] J. A. V. Sousa. Aplicacao de Redes Neuronais na Previsao de Vendas para Retalho. Master’s
thesis, Faculdade de Engenharia da Universidade do Porto, 2011.
67
[27] A. K. Palit and D. Popovic. Computational Intelligence in Time Series Forecasting: Theory And
Engineering Applications, chapter 3, pages 79–116. Springer, 1st edition, 2005. ISBN: 1-85233-
948-9.
[28] M. Negnevitsky. Artificial Intelligence A Guide to Intelligent Systems, chapter 6, pages 165–177.
Addison Wesley, 2nd edition, 2002. ISBN: 0-321-20466-2.
[29] L. M. S. Fernandes. Modelacao da digestao anaerobia da ETAR da Guia com Redes Neuronais
Artificiais. Master’s thesis, Instituto Superior Tecnico, 2014.
[30] J. Matos. Utilizacao de redes neuronais artificiais para a modelacao da degradacao de sistemas
de distribuicao de Agua. Master’s thesis, Instituto Superior Tecnico, 2008.
[31] X. Gao, A. Gaspar-Cunha, M. Koeppen, J. Wang, and G. Schaefer. Soft Computing in Industrial
Applications: Algorithms, Integration, and Success Stories, chapter IV, page 160. Advances in In-
telligent and Soft Computing. Springer Berlin Heidelberg, 1st edition, 2010. ISBN: 9783642112829.
[32] T. N. M. Machado. Modelacao de series temporais: Metodos lineares e nao lineares. Master’s
thesis, Escola Superior de Tecnologia e de Gestao de Braganca, 2009.
[33] J. L. Deng. Introduction to grey system theory. The Journal of Grey System, pages 1–24, 1989.
[34] S. Liu and Y. Lin. Grey Information, chapter 7, pages 191–235. Springer, 1st edition, 2006. ISBN:1-
85233-995-0.
[35] J. Pinho. Previsao de vendas no setor do retalho sob o efeito de acoes promocionais. Master’s
thesis, Faculdade de Economia Universidade do Porto, 2015.
68
Apendice A
Anexos
Figura A.1: PME da Industria Metalurgica - Previsoes do consumo de energia eletrica, registado em perıodos de15 minutos no perıodo de treino - modelo de Regressao Multipla.
Figura A.2: PME da Industria da Ceramica e do Vidro - Previsoes do consumo de energia eletrica, registado emperıodos de 15 minutos no perıodo de treino - modelo de Regressao Multipla.
Tabela A.1: PME Industria Metalurgica - Informacoes sobre os parametro do modelo de Regressao Multipla -Consumo de energia eletrica, registado em perıodos de 15 minutos.
Variaveisdummy
Valoresdos parametros
Desviopadrao
t-value Pr(>|t|)
(X1) Termos Fourier (sazonalidade) 30.25 0.809 37.419 0.000(X3) Consumo dia anterior -0.034 0.010 -3.541 0.000(X2) Indicador de feriados -151.5 2.203 -68.789 0.000
69
Tabela A.2: PME Industria da Ceramica e do Vidro - Informacoes sobre cada parametro do modelo deRegressao Multipla - Consumo de energia eletrica, registado em perıodos de 15 minutos.
Variaveisdummy
Valoresdos parametros
Desviopadrao
t-value Pr(>|t|)
(X1) Termos Fourier (sazonalidade) 6.808 0.263 25.901 0.000(X3) Consumo dia anterior -31.13 0.630 -49.457 0.000(X2) Indicador de feriados 0.101 0.011 9.231 0.000
Tabela A.3: Caso de Estudo PME Industria Metalurgica - Informacoes sobre cada parametro do modelo deRegressao Multipla - Consumo de energia eletrica, registado em perıodos diarios.
Variaveisdummy
Valoresdos parametros
Desviopadrao
t-value Pr(>|t|)
(X1) Indicador do dia da semana 22200 589.9 37.644 0.000(X2) Indicador do dia da semana 22780 684.7 33.273 0.000(X3) Indicador do dia da semana 22890 714.3 32.050 0.000(X4) Indicador do dia da semana 22700 764.4 29.697 0.000(X5) Indicador do dia da semana 20600 779.2 26.441 0.000(X6) Indicador do dia da semana 5127 724.6 7.075 0.000
(X7) Indicador de feriados -1399 647.0 -2.162 0.034(X8) Indicador do mes -161.4 389.1 -0.415 0.679(X9) Indicador do mes -684.2 378.7 -1.807 0.076
(X10) Consumo dia anterior 0.07198 0.02892 2.489 0.016
Tabela A.4: PME Industria Metalurgica - Erros percentuais (MAPE) nos diferentes dias do perıodo de teste naprevisao do consumo de energia eletrica, registado em perıodos diarios, Modelo de regressao multipla.
Perıodode Teste
Dados Observados(kWh)
Dados Previstos(kWh)
MAPE
17-04-2013 26758 28181 5.318%18-04-2013 28481 28181 1.054%19-04-2013 26544 26076 1.762%20-04-2013 10660 10456 1.915%21-04-2013 4279 4168 2.597%22-04-2013 25689 25947 1.005%23-04-2013 27854 27951 0.346%24-04-2013 27727 28181 1.638%25-04-2013 2880 2880 0.000%26-04-2013 2880 2880 0.000%27-04-2013 5556 10456 88.191%28-04-2013 4206 4168 0.906%29-04-2013 26682 25947 2.754%30-04-2013 30636 27951 8.766%
Total (MAPE) - - 8.304%
70
Tabela A.5: PME Industria da Ceramica e do Vidro - Informacoes sobre os parametros do modelo de RegressaoMultipla - Consumo de energia eletrica, registado em perıodos diarios.
Variaveisdummy
Valoresdos parametros
Desviopadrao
t-value Pr(>|t|)
(X1) Indicador do dia da semana 5128.037 324.163 15.819 0.000(X2) Indicador do dia da semana 5908.292 335.373 17.617 0.000(X3) Indicador do dia da semana 5915.283 355.354 16.646 0.000(X4) Indicador do dia da semana 6103.543 379.016 16.104 0.000(X5) Indicador do dia da semana 5575.299 392.087 14.220 0.000(X6) Indicador do dia da semana 1787.648 387.176 4.617 0.000
(X7) Indicador de feriados -233.869 320.167 -0.730 0.468(X8) Indicador do mes -31.367 202.417 -0.155 0.877(X9) Indicador do mes -9.704 193.185 -0.050 0.960
(X10) Consumo dia anterior 0.092 0.059 1.559 0.124
Figura A.3: PME da Industria Metalurgica - Previsoes do consumo de energia eletrica, registado em perıodos de15 minutos no perıodo de treino - Modelo de Regressao Multipla.
Figura A.4: PME da Industria da Ceramica e do Vidro - Previsoes do consumo de energia eletrica, registado emperıodos de 15 minutos no perıodo de treino - Modelo de Regressao Multipla.
71
Tabela A.6: PME Industria da Ceramica e do Vidro - Erros percentuais (MAPE) nos diferentes dias do perıodo deteste na previsao do consumo de energia eletrica, registado em perıodos diarios, Modelo de Regressao Multipla.
Perıodode Teste
Dados Observados(kWh)
Dados Previstos(kWh)
MAPE
17-04-2013 6620 6743 1.864%18-04-2013 6800 6994 2.853%19-04-2013 7717 6488 15.920%20-04-2013 3376 2689 20.359%21-04-2013 1104 527 52.253%22-04-2013 5327 5444 2.194%23-04-2013 6931 6682 3.587%24-04-2013 6734 6743 0.140%25-04-2013 192 204 6.250%26-04-2013 192 204 6.250%27-04-2013 748 2689 259.447%28-04-2013 626 527 15.794%29-04-2013 5617 5444 3.082%30-04-2013 6714 6682 0.471%
Total (MAPE) - - 27.890%
Figura A.5: PME da Industria Metalurgica - Previsoes do consumo de energia eletrica, registado diariamente noperıodo de treino - Rede Neuronal.
Figura A.6: PME da Industria Metalurgica - Previsoes do consumo de energia eletrica, registado em perıodos de15 minutos no perıodo de treino - Rede Neuronal.
72
Tabela A.7: PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica, registadodiariamente no perıodo de treino - Redes neuronais (inclusao do consumo do dia anterior e algoritmo Resilient
Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Resilient Backpropagation(10%)
Resilient Backpropagation(1%)
MAPE RMSE MAPE RMSE4 20.778% 3500.886 6.327% 1118.3198 19.158% 3507.489 4.036% 929.843
4-4 19.988% 3224.373 6.006% 1014.5484-8 22.325% 3078.714 5.350% 1087.4268-4 19.633% 2964.064 4.387% 975.7178-8 24.455% 3535.945 5.018% 1006.786
4-4-4 18.287% 2966.979 5.641% 1081.5584-4-8 20.752% 3353.314 5.738% 1196.7764-8-4 23.627% 3245.670 5.101% 940.9884-8-8 24.072% 3830.331 6.873% 1077.8108-4-4 22.093% 2962.315 5.154% 1057.2788-4-8 17.896% 3311.588 5.993% 1012.9428-8-4 21.093% 3225.437 5.734% 1075.8818-8-8 21.183% 3621.633 4.812% 962.913
4-4-4-4 15.895% 2427.189 5.612% 1317.6914-4-4-8 18.692% 2615.196 6.426% 1264.1614-4-8-4 21.834% 3105.776 5.001% 1010.6614-4-8-8 21.574% 3371.904 4.942% 1042.2504-8-4-4 18.346% 3000.919 4.626% 937.5054-8-4-8 14.711% 2426.871 4.097% 976.7944-8-8-4 20.939% 2885.986 4.653% 1015.7104-8-8-8 19.833% 2986.467 5.535% 1285.9478-4-4-4 16.877% 2708.261 6.939% 1332.2518-4-4-8 11.313% 1935.856 4.814% 1002.8228-4-8-4 14.935% 2531.475 5.802% 1264.0808-4-8-8 20.536% 3335.371 5.312% 1035.4068-8-4-4 17.345% 2942.076 4.807% 1010.7478-8-4-8 22.031% 3091.003 6.087% 1065.3828-8-8-4 19.385% 3017.028 6.713% 1059.1478-8-8-8 16.248% 2941.561 5.640% 1088.385
Media (MAPE) 19.528% - 5.439% -
Figura A.7: PME da Industria da Ceramica e do Vidro - Previsoes desenvolvidas do consumo de energia eletrica,registado diariamente, no perıodo de treino - Rede Neuronal.
73
Tabela A.8: PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica, registadodiariamente no perıodo de teste - Redes neuronais (inclusao do consumo do dia anterior e algoritmo Resilient
Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Resilient Backpropagation(10%)
Resilient Backpropagation(1%)
MAPE RMSE MAPE RMSE4 24.250% 3107.467 12.727% 1253.1958 20.700% 2595.414 10.866% 1627.033
4-4 15.817% 2196.552 13.633% 1258.8444-8 14.134% 2170.106 7.499% 838.6398-4 14.762% 2275.187 7.304% 1095.5268-8 17.735% 2665.662 11.153% 1194.789
4-4-4 16.198% 2115.784 10.855% 1465.8174-4-8 15.943% 2478.049 7.433% 1204.2094-8-4 19.368% 2542.646 9.373% 1355.1994-8-8 20.008% 3073.223 8.664% 822.3548-4-4 14.097% 2123.691 8.569% 1085.8018-4-8 15.491% 2477.958 10.203% 1110.3158-8-4 15.211% 2300.823 7.185% 936.9928-8-8 15.844% 2555.527 6.799% 823.579
4-4-4-4 18.168% 2026.444 5.790% 1135.8294-4-4-8 18.409% 1956.792 7.561% 1146.3914-4-8-4 19.292% 2271.929 6.748% 968.9764-4-8-8 21.447% 2300.360 4.956% 873.0684-8-4-4 14.446% 2013.758 5.418% 942.3364-8-4-8 15.996% 2037.547 4.500% 921.9674-8-8-4 19.569% 2352.604 6.462% 1121.3704-8-8-8 17.954% 2142.535 4.704% 1091.9838-4-4-4 14.996% 1962.093 6.831% 1148.7588-4-4-8 10.951% 1570.356 4.443% 824.6428-4-8-4 13.280% 1894.939 4.225% 1052.9118-4-8-8 17.934% 2334.139 4.972% 842.8868-8-4-4 14.699% 2011.114 5.512% 869.5348-8-4-8 17.156% 2324.346 6.043% 903.4028-8-8-4 15.298% 2357.313 5.355% 797.7718-8-8-8 13.271% 1925.612 6.302% 933.164
Media (MAPE) 16.748% - 7.403% -
Figura A.8: PME da Industria da Ceramica e do Vidro - Previsoes desenvolvidas do consumo de energia eletrica,registado em perıodos de 15 minutos, no perıodo de treino - Rede Neuronal.
74
Tabela A.9: PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica, registadodiariamente no perıodo de teste - Redes neuronais (inclusao do consumo do dia anterior e algoritmo
Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Backpropagation(10%)
Backpropagation(1%)
MAPE RMSE MAPE RMSE4 38.465% 3426.525 33.602% 4181.9418 33.796% 2475.233 32.923% 2499.318
4-4 38.932% 3275.042 32.029% 2790.2244-8 42.616% 3642.515 33.999% 3541.5448-4 36.864% 3060.524 22.915% 1770.8618-8 38.102% 3705.688 13.975% 1583.725
4-4-4 35.328% 2990.893 12.684% 1269.2304-4-8 28.092% 2676.982 13.639% 1401.4424-8-4 24.521% 2660.172 10.278% 1154.8564-8-8 23.922% 2478.995 16.944% 1454.7718-4-4 30.415% 3046.660 13.673% 1344.1018-4-8 28.453% 2718.354 13.246% 1481.4748-8-4 29.672% 2516.916 16.774% 1494.6028-8-8 29.554% 2710.566 11.482% 1228.951
4-4-4-4 30.253% 2744.566 10.956% 1241.1184-4-4-8 26.293% 2581.849 13.967% 1369.0464-4-8-4 29.995% 2517.893 13.286% 1562.0034-4-8-8 29.569% 2810.572 12.519% 1379.2114-8-4-4 28.616% 2360.997 9.398% 1170.0514-8-4-8 21.438% 2364.582 11.283% 1278.7164-8-8-4 25.807% 2326.548 13.265% 1456.3514-8-8-8 26.454% 2645.084 10.123% 1272.4458-4-4-4 23.506% 2665.529 11.969% 1367.5248-4-4-8 24.558% 2435.904 10.749% 1288.8908-4-8-4 24.295% 2497.544 11.222% 1303.3658-4-8-8 26.416% 2579.682 12.857% 1372.1188-8-4-4 28.369% 2420.668 11.673% 1390.6078-8-4-8 23.873% 2485.523 10.419% 1155.5278-8-8-4 23.499% 2906.093 9.086% 1306.3898-8-8-8 31.422% 2700.129 9.633% 1244.753
Media (MAPE) 29.437% - 15.352% -
75
Tabela A.10: PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica, registadodiariamente no perıodo de teste - Redes neuronais (exclusao do consumo do dia anterior e algoritmo Resilient
Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Resilient Backpropagation(10%)
Resilient Backpropagation(1%)
MAPE RMSE MAPE RMSE4 20.448% 2883.502 29.705% 2448.1258 25.323% 3303.613 21.958% 2172.159
4-4 21.845% 2440.050 15.684% 2265.5024-8 21.482% 2080.461 13.055% 1800.0078-4 18.554% 2562.408 12.454% 1760.2888-8 19.091% 2741.864 12.259% 1834.281
4-4-4 19.966% 3069.823 12.027% 1818.5584-4-8 20.829% 2894.995 9.737% 1643.1144-8-4 21.659% 2844.756 11.269% 1849.4344-8-8 22.972% 2985.302 10.275% 1671.6378-4-4 21.579% 2913.549 10.892% 1816.1168-4-8 24.240% 2743.360 12.955% 1661.7688-8-4 26.622% 3231.357 11.834% 1774.4848-8-8 20.230% 2998.371 12.092% 1785.187
4-4-4-4 20.759% 2416.008 9.212% 1701.2844-4-4-8 21.852% 2823.730 10.258% 1688.2834-4-8-4 20.754% 2370.120 9.537% 1748.1154-4-8-8 25.933% 2526.349 9.438% 1620.4334-8-4-4 24.048% 2338.940 11.202% 1722.7514-8-4-8 19.133% 2743.121 11.053% 1807.8564-8-8-4 19.937% 2377.591 9.954% 1680.1894-8-8-8 21.313% 3112.907 10.675% 1711.1228-4-4-4 18.997% 2116.831 9.813% 1749.3128-4-4-8 25.022% 2203.265 9.102% 1684.8168-4-8-4 26.259% 2416.548 10.255% 1748.6098-4-8-8 31.923% 3313.454 10.979% 1731.3688-8-4-4 26.507% 2681.167 10.463% 1546.0198-8-4-8 19.920% 2894.342 9.654% 1760.3378-8-8-4 19.971% 2466.872 9.426% 1707.5898-8-8-8 22.347% 2165.333 10.814% 1722.423
Media (MAPE) 22.317% - 11.928% -
76
Tabela A.11: PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica, registadodiariamente no perıodo de teste - Redes neuronais (exclusao do consumo do dia anterior e algoritmo
Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Backpropagation(10%)
Backpropagation(1%)
MAPE RMSE MAPE RMSE4 54.165% 5441.395 35.760% 3018.0928 57.774% 5550.139 22.918% 2911.164
4-4 56.913% 3807.006 17.499% 2027.8304-8 54.449% 4942.028 16.480% 2111.4588-4 54.878% 5118.543 20.921% 2132.5018-8 43.288% 4215.824 18.843% 2201.762
4-4-4 48.342% 4574.666 22.185% 2030.4154-4-8 33.491% 3693.742 14.839% 1827.0774-8-4 43.702% 4135.421 13.979% 1846.2394-8-8 49.818% 3517.824 13.401% 1920.8018-4-4 53.078% 4623.762 13.657% 2087.7968-4-8 40.802% 3535.484 13.747% 1947.9058-8-4 32.519% 3588.801 11.521% 1834.1748-8-8 41.175% 4245.999 13.547% 1888.219
4-4-4-4 51.246% 3948.448 11.192% 1730.9684-4-4-8 53.920% 4376.001 14.887% 1785.8554-4-8-4 54.952% 4179.658 10.795% 1678.7364-4-8-8 47.669% 3770.661 10.789% 1665.8994-8-4-4 50.433% 4368.459 14.091% 1763.3294-8-4-8 51.539% 3878.509 11.863% 1765.2104-8-8-4 50.493% 4983.976 12.966% 1916.4844-8-8-8 43.971% 3689.229 13.824% 1849.4608-4-4-4 53.711% 4051.460 12.748% 1748.0018-4-4-8 51.365% 4335.483 13.214% 1774.8688-4-8-4 46.316% 4290.225 16.008% 1861.7628-4-8-8 40.861% 3962.916 10.886% 1651.9398-8-4-4 38.415% 3899.808 14.556% 1876.7038-8-4-8 48.023% 4051.922 16.220% 1931.2378-8-8-4 47.419% 3687.575 16.334% 1968.2378-8-8-8 44.951% 3648.716 14.311% 1844.219
Media (MAPE) 47.889% - 15.466% -
77
Tabela A.12: PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica, registado emperıodos de 15 minutos no perıodo de teste - Redes neuronais (exclusao do consumo do dia anterior e algoritmo
Resilient Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Resilient Backpropagation(10%)
Resilient Backpropagation(5%)
MAPE RMSE MAPE RMSE4 32.580% 46.701 36.023% 46.9028 22.180% 34.305 17.797% 33.935
4-4 17.936% 32.981 17.392% 32.6754-8 18.067% 33.261 16.913% 32.6658-4 18.217% 32.085 16.577% 33.4668-8 16.755% 33.409 16.488% 33.109
4-4-4 14.257% 30.371 15.789% 31.5254-4-8 16.059% 31.455 16.781% 34.2894-8-4 15.349% 31.637 14.352% 29.6624-8-8 15.218% 32.641 15.351% 29.5758-4-4 16.627% 33.405 16.208% 33.3238-4-8 16.965% 33.749 15.508% 33.2968-8-4 16.674% 34.288 16.417% 32.7628-8-8 16.671% 31.754 16.339% 33.503
4-4-4-4 15.072% 30.709 15.515% 31.7324-4-4-8 15.580% 32.829 15.878% 32.2814-4-8-4 15.639% 31.595 15.005% 29.8804-4-8-8 15.808% 33.449 13.967% 29.2934-8-4-4 15.460% 34.849 16.465% 29.1474-8-4-8 14.996% 30.804 16.010% 29.1994-8-8-4 16.322% 32.831 15.550% 31.2644-8-8-8 14.144% 29.431 14.127% 29.3128-4-4-4 16.237% 31.005 14.661% 32.5468-4-4-8 15.143% 31.841 16.549% 32.6858-4-8-4 16.026% 33.805 16.834% 32.5808-4-8-8 16.178% 31.954 16.812% 33.3488-8-4-4 16.348% 33.758 16.073% 33.2688-8-4-8 16.339% 35.421 16.254% 33.0228-8-8-4 15.618% 32.311 15.747% 32.7958-8-8-8 15.672% 32.714 16.113% 32.464
Media (MAPE) 16.805% - 16.650% -
78
Tabela A.13: PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica, registado emperıodos de 15 minutos no perıodo de treino - Redes neuronais (inclusao do consumo do dia anterior e algoritmo
Resilient Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Resilient Backpropagation(10%)
Resilient Backpropagation(5%)
MAPE RMSE MAPE RMSE4 33.612% 45.955 30.066% 50.0868 17.442% 32.213 22.641% 32.798
4-4 14.066% 31.177 13.803% 30.0944-8 13.179% 27.571 15.878% 29.6678-4 13.422% 27.353 11.954% 27.2988-8 10.706% 24.738 12.815% 29.647
4-4-4 14.760% 26.923 15.051% 30.6114-4-8 12.713% 27.221 12.593% 29.1034-8-4 9.606% 23.012 12.480% 28.0764-8-8 10.744% 25.759 11.636% 26.2838-4-4 11.437% 25.418 12.101% 27.1158-4-8 11.876% 26.868 12.341% 25.1318-8-4 10.371% 23.338 9.675% 23.5598-8-8 9.973% 23.007 11.218% 24.618
4-4-4-4 12.605% 26.017 12.534% 27.6964-4-4-8 12.009% 26.328 11.893% 26.3484-4-8-4 11.039% 24.729 15.908% 29.5634-4-8-8 10.095% 23.939 12.667% 24.8894-8-4-4 9.768% 22.706 12.094% 26.6864-8-4-8 11.197% 24.418 11.881% 25.3294-8-8-4 10.604% 24.215 12.252% 27.1654-8-8-8 9.543% 22.246 12.130% 23.9068-4-4-4 11.209% 25.553 12.262% 29.2798-4-4-8 11.741% 27.369 12.618% 29.4638-4-8-4 11.361% 24.694 12.837% 28.3178-4-8-8 10.329% 23.360 12.111% 27.3188-8-4-4 10.517% 25.642 11.855% 26.6798-8-4-8 10.565% 23.950 11.483% 26.4788-8-8-4 9.842% 24.236 10.831% 24.9838-8-8-8 9.479% 27.294 9.429% 22.484
Media (MAPE) 12.194% - 13.301% -
79
Tabela A.14: PME Industria Metalurgica - Resultados da previsao do consumo de energia eletrica, registado emperıodos de 15 minutos no perıodo de teste - Redes neuronais (inclusao do consumo do dia anterior e algoritmo
Resilient Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Resilient Backpropagation(10%)
Resilient Backpropagation(5%)
MAPE RMSE MAPE RMSE4 36.251% 44.389 37.509% 75.4388 34.703% 39.951 40.207% 76.132
4-4 28.486% 37.100 13.321% 29.7944-8 12.445% 28.344 13.073% 27.4348-4 15.723% 30.220 11.359% 28.2568-8 16.579% 34.692 15.194% 28.558
4-4-4 16.094% 27.786 16.489% 34.1694-4-8 15.648% 31.794 12.107% 30.9724-8-4 14.352% 30.888 12.406% 27.3384-8-8 14.067% 29.103 10.955% 26.5798-4-4 15.138% 30.858 15.174% 28.4598-4-8 12.688% 26.002 14.239% 26.0958-8-4 13.303% 28.363 11.980% 30.9508-8-8 14.957% 28.209 14.799% 28.189
4-4-4-4 11.914% 26.322 11.250% 28.1564-4-4-8 10.203% 26.617 10.166% 25.1274-4-8-4 10.754% 25.960 13.509% 29.0134-4-8-8 13.749% 29.562 13.429% 30.7374-8-4-4 15.265% 30.401 13.940% 30.3924-8-4-8 11.422% 24.454 10.246% 24.4234-8-8-4 11.091% 25.296 12.296% 28.8594-8-8-8 9.842% 25.136 10.609% 25.1578-4-4-4 11.796% 26.727 13.453% 30.4538-4-4-8 12.912% 27.060 10.889% 28.6608-4-8-4 11.307% 26.679 11.881% 26.4308-4-8-8 11.714% 25.705 11.777% 26.7958-8-4-4 12.259% 26.782 9.195% 22.7108-8-4-8 13.829% 27.370 12.754% 28.0668-8-8-4 9.903% 26.291 11.674% 27.2298-8-8-8 12.839% 28.551 10.817% 25.086
Media (MAPE) 15.041% - 14.223% -
80
Tabela A.15: PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de energia eletrica,registado em perıodos de 15 minutos no perıodo de teste - Redes neuronais (exclusao do consumo do dia anterior
e algoritmo Resilient Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Resilient Backpropagation(10%)
Resilient Backpropagation(5%)
MAPE RMSE MAPE RMSE4 48.039% 12.288 42.446% 12.1698 52.631% 13.097 40.604% 11.959
4-4 49.058% 11.867 38.578% 11.4774-8 41.212% 11.760 38.486% 11.7718-4 40.823% 11.801 36.399% 11.7578-8 40.725% 12.086 36.149% 11.214
4-4-4 39.591% 11.747 36.939% 10.8594-4-8 36.424% 11.096 37.483% 10.7874-8-4 35.566% 10.727 37.876% 10.9384-8-8 35.983% 11.356 35.290% 11.1148-4-4 34.248% 10.912 33.503% 10.9698-4-8 36.046% 10.625 36.223% 10.7378-8-4 36.698% 11.118 36.442% 10.9558-8-8 36.582% 10.814 36.104% 11.200
4-4-4-4 35.723% 11.076 34.533% 10.7894-4-4-8 36.116% 10.838 36.915% 11.0534-4-8-4 36.919% 11.208 36.533% 10.8024-4-8-8 36.983% 11.051 38.065% 11.0064-8-4-4 37.609% 11.319 37.194% 11.6964-8-4-8 34.979% 10.982 36.629% 10.7674-8-8-4 36.446% 11.163 35.395% 11.0154-8-8-8 35.292% 10.988 37.662% 10.9018-4-4-4 34.332% 11.049 35.673% 11.1858-4-4-8 36.548% 11.066 35.367% 10.8658-4-8-4 35.670% 10.885 33.313% 10.8198-4-8-8 36.508% 10.971 34.684% 11.0158-8-4-4 36.763% 11.031 34.811% 11.1048-8-4-8 35.566% 11.001 36.476% 10.8338-8-8-4 34.908% 10.929 37.317% 11.1498-8-8-8 36.912% 11.090 35.427% 11.121
Media (MAPE) 38.030% - 36.617% -
81
Tabela A.16: PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de energia eletrica,registado em perıodos de 15 minutos no perıodo de treino - Redes neuronais (inclusao do consumo do dia
anterior e algoritmo Resilient Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Resilient Backpropagation(10%)
Resilient Backpropagation(5%)
MAPE RMSE MAPE RMSE4 40.937% 13.319 36.049% 12.8698 37.487% 10.598 28.464% 11.831
4-4 31.329% 10.578 26.944% 10.3014-8 19.761% 9.661 26.719% 10.5178-4 21.315% 9.555 21.991% 9.6158-8 20.639% 9.434 19.955% 8.846
4-4-4 25.659% 10.459 20.239% 10.2324-4-8 25.839% 11.729 19.679% 8.9884-8-4 19.923% 9.496 21.783% 9.9494-8-8 21.444% 9.968 21.609% 10.2068-4-4 21.829% 10.187 22.804% 9.7458-4-8 19.461% 9.236 20.537% 8.8318-8-4 19.333% 9.376 20.101% 8.9838-8-8 18.104% 9.036 17.119% 7.724
4-4-4-4 21.518% 10.137 20.944% 9.4114-4-4-8 23.107% 9.832 21.684% 10.0254-4-8-4 20.804% 10.109 22.268% 9.4784-4-8-8 20.465% 9.919 19.453% 9.2224-8-4-4 20.122% 10.166 18.951% 9.0714-8-4-8 20.925% 9.434 19.182% 9.2914-8-8-4 19.301% 9.192 19.234% 8.9964-8-8-8 21.046% 9.867 16.789% 7.9398-4-4-4 22.250% 9.871 20.097% 8.8878-4-4-8 21.112% 10.018 21.100% 9.1258-4-8-4 22.153% 9.046 18.150% 8.3788-4-8-8 20.038% 8.804 19.256% 8.8258-8-4-4 21.741% 9.095 18.175% 7.7728-8-4-8 21.544% 9.702 18.145% 9.0998-8-8-4 20.195% 9.965 18.225% 8.7478-8-8-8 19.951% 10.767 15.884% 7.836
Media (MAPE) 22.644% - 21.051% -
82
Tabela A.17: PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de energia eletrica,registado em perıodos de 15 minutos no perıodo de teste - Redes neuronais (inclusao do consumo do dia anterior
e algoritmo Resilient Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Resilient Backpropagation(10%)
Resilient Backpropagation(5%)
MAPE RMSE MAPE RMSE4 54.597% 13.719 35.460% 14.1168 45.492% 13.775 34.097% 12.008
4-4 35.661% 9.740 34.657% 11.3074-8 37.559% 11.461 33.012% 12.0808-4 42.212% 11.596 30.096% 9.8258-8 37.627% 17.805 31.804% 9.928
4-4-4 25.127% 9.542 22.852% 10.3754-4-8 28.160% 11.305 25.447% 11.5584-8-4 26.155% 10.169 26.712% 10.9044-8-8 23.235% 9.429 27.394% 11.4078-4-4 24.819% 9.690 27.069% 12.0068-4-8 24.325% 9.837 27.153% 11.0368-8-4 23.885% 10.907 23.630% 11.8898-8-8 25.471% 11.507 26.482% 11.457
4-4-4-4 24.380% 9.182 24.639% 9.6754-4-4-8 27.794% 11.002 20.296% 9.1474-4-8-4 25.990% 9.675 23.178% 12.2244-4-8-8 26.538% 9.759 23.415% 11.7154-8-4-4 23.449% 8.885 18.990% 9.4104-8-4-8 19.706% 8.826 22.748% 10.6674-8-8-4 20.302% 11.321 21.817% 10.1324-8-8-8 23.454% 9.892 21.791% 10.0598-4-4-4 20.724% 9.822 20.743% 8.9448-4-4-8 21.305% 10.798 21.645% 9.1518-4-8-4 23.984% 11.297 22.438% 10.0998-4-8-8 22.332% 9.147 23.817% 12.4248-8-4-4 23.272% 11.508 20.200% 9.7638-8-4-8 24.324% 9.608 22.993% 12.2068-8-8-4 25.834% 10.442 21.204% 9.2788-8-8-8 24.380% 9.904 21.614% 10.126
Media (MAPE) 27.736% - 25.246% -
83
Tabela A.18: PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de energia eletrica,registado diariamente no perıodo de treino - Redes neuronais (inclusao do consumo do dia anterior e algoritmo
Resilient Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Resilient Backpropagation(10%)
Resilient Backpropagation(1%)
MAPE RMSE MAPE RMSE4 82.540% 1088.091 14.736% 624.0338 77.966% 1023.697 18.102% 536.182
4-4 62.216% 980.720 14.526% 536.3444-8 60.634% 1012.345 12.056% 538.1248-4 52.551% 1019.427 13.147% 488.2918-8 43.389% 963.887 11.157% 479.188
4-4-4 32.785% 898.561 13.381% 608.6354-4-8 42.221% 985.768 12.121% 497.3814-8-4 43.002% 693.787 12.971% 508.7164-8-8 43.951% 1104.982 12.214% 525.0578-4-4 30.731% 902.715 11.971% 533.0368-4-8 34.874% 932.779 10.890% 471.4608-8-4 34.813% 904.776 14.923% 487.2888-8-8 33.096% 973.738 12.627% 465.644
4-4-4-4 25.633% 866.345 9.509% 467.8754-4-4-8 40.435% 989.918 11.164% 524.7184-4-8-4 37.928% 938.317 12.613% 469.5934-4-8-8 41.399% 988.264 10.399% 492.5974-8-4-4 38.830% 960.854 14.187% 510.8314-8-4-8 27.153% 926.812 11.729% 501.9604-8-8-4 42.917% 985.867 13.291% 519.3844-8-8-8 39.214% 867.473 10.214% 515.7728-4-4-4 24.508% 903.596 9.258% 419.7988-4-4-8 21.867% 906.326 10.787% 571.4378-4-8-4 29.395% 900.587 9.366% 466.3428-4-8-8 38.201% 939.571 12.461% 522.5918-8-4-4 25.447% 829.023 10.933% 475.6018-8-4-8 35.753% 888.546 11.782% 494.7658-8-8-4 40.090% 909.179 12.108% 484.4998-8-8-8 40.665% 921.834 10.872% 498.095
Media (MAPE) 40.807% - 12.183% -
84
Tabela A.19: PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de energia eletrica,registado diariamente no perıodo de teste - Redes neuronais (inclusao do consumo do dia anterior e algoritmo
Resilient Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Resilient Backpropagation(10%)
Resilient Backpropagation(5%)
MAPE RMSE MAPE RMSE4 112.556% 1170.759 28.646% 537.0388 101.734% 1002.834 25.316% 630.615
4-4 62.216% 980.720 26.792% 403.1604-8 68.026% 992.018 24.479% 465.4048-4 57.690% 941.326 24.202% 482.8508-8 48.708% 962.501 24.894% 453.043
4-4-4 36.673% 846.087 19.975% 525.8714-4-8 41.142% 828.129 18.469% 488.3534-8-4 33.812% 610.439 19.766% 392.4894-8-8 31.113% 931.731 17.094% 429.8298-4-4 32.276% 854.921 19.553% 400.2148-4-8 33.877% 867.223 20.547% 570.8938-8-4 42.267% 946.265 19.353% 376.3518-8-8 30.199% 965.014 21.781% 537.131
4-4-4-4 30.317% 873.020 11.569% 402.5054-4-4-8 36.667% 905.174 12.154% 418.4664-4-8-4 37.855% 791.842 12.356% 404.4094-4-8-8 28.009% 1003.884 11.821% 361.2464-8-4-4 32.643% 902.372 11.740% 365.7974-8-4-8 34.931% 993.211 11.852% 399.7064-8-8-4 28.145% 869.677 12.123% 390.7354-8-8-8 36.013% 821.923 11.142% 431.4468-4-4-4 27.010% 806.680 10.643% 473.1868-4-4-8 31.139% 777.092 12.749% 421.0888-4-8-4 31.534% 945.822 13.905% 457.5348-4-8-8 36.328% 931.405 12.475% 398.8898-8-4-4 31.416% 851.281 11.758% 348.0718-8-4-8 29.096% 958.492 13.031% 367.6928-8-8-4 34.996% 890.593 11.259% 300.6888-8-8-8 36.301% 940.378 12.191% 376.648
Media (MAPE) 41.823% - 16.788% -
85
Tabela A.20: PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de energia eletrica,registado diariamente no perıodo de teste - Redes neuronais (inclusao do consumo do dia anterior e algoritmo
Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Backpropagation(10%)
Backpropagation(1%)
MAPE RMSE MAPE RMSE4 107.008% 1062.321 74.493% 682.7268 126.576% 1146.191 55.233% 605.924
4-4 83.249% 1022.923 25.219% 467.0994-8 136.621% 1205.839 32.066% 584.3818-4 99.012% 974.482 29.944% 497.4398-8 96.527% 1139.481 26.442% 528.445
4-4-4 83.647% 1035.806 24.889% 690.9034-4-8 106.957% 1025.499 30.526% 596.1084-8-4 109.159% 1055.491 29.358% 577.1964-8-8 90.155% 990.718 20.799% 676.4098-4-4 108.303% 1110.966 24.057% 501.6728-4-8 105.784% 1211.663 20.438% 632.9718-8-4 91.554% 949.231 24.519% 496.2338-8-8 96.032% 974.996 24.905% 377.404
4-4-4-4 95.455% 977.258 22.634% 627.4704-4-4-8 96.535% 939.961 19.582% 535.9614-4-8-4 112.377% 1117.557 24.398% 549.1034-4-8-8 100.392% 987.803 27.051% 690.2274-8-4-4 90.546% 925.104 29.250% 598.4774-8-4-8 113.998% 1044.414 22.058% 661.6364-8-8-4 118.981% 1011.581 23.212% 604.0994-8-8-8 125.486% 1170.354 18.666% 461.1228-4-4-4 90.228% 956.575 24.158% 542.3968-4-4-8 79.827% 909.405 21.303% 671.6598-4-8-4 88.304% 1022.734 26.090% 535.3178-4-8-8 94.539% 1001.361 21.796% 596.3628-8-4-4 112.842% 1010.423 28.548% 574.5188-8-4-8 81.784% 937.811 28.449% 587.2728-8-8-4 109.686% 1060.600 27.714% 619.6328-8-8-8 88.229% 1049.223 22.636% 415.584
Media (MAPE) 101.326% - 27.681% -
86
Tabela A.21: PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de energia eletrica,registado diariamente no perıodo de teste - Redes neuronais (exclusao do consumo do dia anterior e algoritmo
Resilient Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Resilient Backpropagation(10%)
Resilient Backpropagation(1%)
MAPE RMSE MAPE RMSE4 61.708% 930.306 45.404% 939.3968 53.628% 1019.587 43.161% 918.375
4-4 38.815% 856.469 33.433% 833.5034-8 43.890% 956.786 34.075% 758.8268-4 35.234% 782.389 37.155% 738.2818-8 39.499% 889.246 32.121% 758.594
4-4-4 46.973% 920.563 30.058% 731.2554-4-8 47.564% 1075.092 27.673% 708.5764-8-4 40.716% 953.297 30.485% 758.2794-8-8 44.038% 939.207 32.108% 761.7048-4-4 34.498% 851.260 33.039% 710.6548-4-8 41.124% 895.169 32.110% 769.9188-8-4 37.886% 833.425 32.542% 736.2548-8-8 39.054% 937.414 29.955% 671.778
4-4-4-4 48.092% 1029.820 30.505% 743.8344-4-4-8 44.088% 978.181 31.096% 731.8044-4-8-4 41.611% 1072.023 32.121% 784.3554-4-8-8 45.561% 880.339 30.949% 748.4814-8-4-4 49.669% 1042.186 27.822% 643.5604-8-4-8 46.056% 1139.734 26.877% 675.0094-8-8-4 35.083% 874.428 30.513% 727.5614-8-8-8 34.191% 816.261 26.741% 649.8988-4-4-4 43.015% 1007.740 30.711% 721.4338-4-4-8 45.345% 1071.751 30.265% 760.5568-4-8-4 47.314% 1067.072 27.418% 645.3978-4-8-8 39.471% 1062.267 29.273% 725.7228-8-4-4 46.489% 917.891 30.749% 751.6958-8-4-8 38.843% 877.686 30.331% 677.3668-8-8-4 46.464% 778.289 28.312% 641.3788-8-8-8 46.167% 955.838 29.672% 724.482
Media (MAPE) 43.428% - 31.556% -
87
Tabela A.22: PME Industria da Ceramica e do Vidro - Resultados da previsao do consumo de energia eletrica,registado diariamente no perıodo de teste - Redes neuronais (exclusao do consumo do dia anterior e algoritmo
Backpropagation)
Arquitetura de Rede
Algoritmo de treino /(Criterio convergencia)
Backpropagation(10%)
Backpropagation(1%)
MAPE RMSE MAPE RMSE4 121.022% 1640.792 50.205% 978.1618 116.050% 1826.818 52.261% 943.361
4-4 113.749% 1565.883 34.785% 798.1594-8 144.427% 1675.075 32.517% 881.0578-4 102.278% 1618.598 33.363% 857.9458-8 133.852% 1682.470 40.358% 786.295
4-4-4 108.576% 1558.624 44.133% 794.8644-4-8 97.175% 1683.350 42.170% 750.2524-8-4 118.626% 1635.852 42.049% 793.0194-8-8 107.459% 1643.177 34.043% 763.8098-4-4 103.397% 1678.487 38.643% 776.3798-4-8 110.616% 1586.119 35.327% 798.2768-8-4 184.308% 1593.047 42.541% 809.5978-8-8 97.086% 1626.848 35.226% 742.211
4-4-4-4 459.502% 2910.038 34.568% 818.4464-4-4-8 461.288% 2916.920 32.015% 723.2284-4-8-4 465.055% 2943.121 38.739% 709.5974-4-8-8 463.104% 2924.698 35.332% 797.6464-8-4-4 459.557% 2914.205 38.649% 715.1954-8-4-8 460.889% 2919.154 44.224% 757.5724-8-8-4 464.164% 2923.544 41.855% 733.8584-8-8-8 459.738% 2913.718 38.676% 716.8118-4-4-4 462.176% 2920.606 42.577% 750.0298-4-4-8 460.968% 2929.072 46.064% 795.4818-4-8-4 461.471% 2914.190 44.904% 744.8038-4-8-8 459.421% 2913.471 43.454% 782.1888-8-4-4 460.457% 2914.818 46.196% 810.2298-8-4-8 461.279% 2916.021 37.717% 777.8468-8-8-4 460.062% 2925.977 35.447% 742.2358-8-8-8 464.924% 2930.015 36.962% 757.951
Media (MAPE) 301.422% - 39.833% -
88