Valor em Risco VaR utilizando modelos de previsão de volatilidade
Aplicação de Modelos de Redes Neuronais para Previsão de...
Transcript of Aplicação de Modelos de Redes Neuronais para Previsão de...
Aplicação de Modelos de Redes Neuronais para Previsão de
Consumos de Energia
Rita Sereno Serrão da Veiga Alves
Dissertação para obtenção do Grau de Mestre em
Engenharia Mecânica
Orientadores: Prof. Miguel Afonso Dias de Ayala Botto
Prof. Tânia Alexandra dos Santos Costa e Sousa
Júri
Presidente: Prof. João Rogério Caldas Pinto
Orientador: Prof. Miguel Afonso Dias Ayala Botto
Vogal: Carlos Augusto Santos Silva
Junho 2016
Agradecimentos
Gostaria de expressar a minha gratidão e agradecimento a todos aqueles que fizeram a realização desta tese possível
e, também os que contribuíram para me tornar a pessoa que sou hoje. Particularmente:
Aos meus orientadores, Professor Miguel Ayala Botto e Professora Tânia Sousa, pela oportunidade de participar
neste projeto, pela orientação, apoio, motivação e disponibilidade prestada durante toda a realização da tese de
mestrado e, pelas inúmeras revisões de texto.
A todas as pessoas que incorporam a Secção de Meio Ambiente e Energia do Departamento de Engenharia
Mecânica por tornarem o ambiente bastante gratificante para o desenvolvimento do trabalho.
À minha irmã, à minha família e aos meus amigos e colegas que me acompanharam nesta jornada, expresso o meu
profundo reconhecimento por sempre estarem presentes.
A meus pais o mais profundo agradecimento pela confiança, valores, disciplina e dedicação que me incutiram,
pois sem eles este percurso não teria sido possível.
Finalmente, um especial agradecimento a meu pai por toda a força, motivação e ajuda prestada nesta longa jornada.
Resumo
As redes neuronais artificiais (RNA) podem ser utilizadas na modelação e previsão da dinâmica de problemas
complexos que não podem ser tratados de forma eficaz com soluções convencionais. O presente estudo torna-se
inovador, pois utiliza a exergia útil para previsão de consumos de energia. Utiliza ainda as RNA como uma técnica
de modelação e previsão do consumo de energia em Portugal e compara essa modelação com outras,
nomeadamente, regressão linear múltipla e regressão linear multivariada. Os dados do período de 1960 a 2009
relativamente ao Valor Acrescentado Bruto (GVA) e à exergia útil, designadamente a High Temperature Heat
(HTH), Medium Temperature Heat (MTH), Low Temperature Heat (LTH), Mechanical Drive (MD) e Other
Electric Uses + Light (Ele) foram disponibilizados, analisados e utilizados na construção do modelo dinâmico de
predição. Antes da construção do modelo dinâmico foram selecionadas as variáveis com maior impacto no
processo de predição, através da análise de correlações e da análise de componentes principais (PCA).
Posteriormente o modelo de RNA não linear foi testado. Para o estudo descrito foi utilizada a Neural Network
Toolbox™ através do software de cálculo numérico, MATLAB.
A rede foi “treinada” através do algoritmo de backpropagation utilizando o método de otimização Levenberg-
Marquardt, após terem sido testadas várias combinações de dados de entrada, no sentido de se procurar o modelo
que melhor se ajustava aos dados. O treino, teste e validação do modelo foram efetuados com dados relativos aos
registos da evolução das variáveis entre os anos 1960 a 1999, sendo os dados relativos à década de 2000 a 2009
usados apenas como dados de teste das capacidades de previsão da RNA.
Comparativamente à regressão linear múltipla e à regressão multivariada a RNA demonstrou uma capacidade de
aproximação bastante superior, pelo que se confirmou a adaptabilidade das RNA na modelação e predição de
problemas dinâmicos complexos face a métodos convencionais.
Palavras-chave: Valor Acrescentado Bruto, Exergia, Predição, Modelação, Análise Multivariada de Dados,
Redes Neuronais Artificiais
Abstract
Artificial neural networks (ANN) can be used in the modelling and prediction of the dynamic complex problems,
which cannot be treated using conventional solutions. This study is innovative, because it uses the useful exergy
concept to predict the energy consumption. It also makes uses of ANN to model and predict the energy
consumption in Portugal and compares this value with others obtained from different modelling techniques,
namely, multiple linear regression and multivariate linear regression. Available data from 1960 to 2009 of Gross
Value Added (GVA) and useful exergy, namely High Temperature Heat (HTH), Medium Temperature Heat
(MTH), Low Temperature Heat (LTH), Mechanical Drive (MD) e Other Electric Uses + Light (Ele) was analyzed
and used to build the dynamic prediction model. Prior to the construction of the dynamic model, the variables with
the greatest impact on the process were selected using correlation analysis and principal component analysis (PCA)
and then the nonlinear ANN model was tested. For this study, the Neural Network Toolbox ™ from MATLAB
was used.
The dynamic neural network has been trained through the backpropagation algorithm using the Levenberg-
Marquardt optimization method with various combinations of input data, in order to search for the model that best
fits the data. The training, testing and validation of the model construction were performed using the data evolution
between the years 1960-1999 while the data from decade 2000-2009 was only used to validate the ANN prediction
capabilities.
Compared to multiple linear regression and multivariate linear regression, the ANN demonstrated a far superior
approach capacity. This supports the adaptability of ANN for modelling and predicting complex dynamical
problems compared to conventional methods.
Keywords: Gross Value Added, Exergy, Prediction, Modeling, Multivariate Data Analysis, Artificial Neural
Networks
Índice
1. Introdução ...................................................................................................................................... 1
1.1 Motivação e Objetivos do Trabalho ........................................................................................ 2
1.2 Estrutura da Dissertação .......................................................................................................... 3
2. Análise da energia ......................................................................................................................... 4
2.1 Exergia primária, final e útil .................................................................................................... 4
Definições de energia ........................................................................................................................ 4
Definições de exergia ........................................................................................................................ 5
Conversão de dados energéticos em exergia ..................................................................................... 6
Eficiência Energética......................................................................................................................... 7
Exergia útil: definição e contabilização ............................................................................................ 8
Perfil energético de Portugal ........................................................................................................... 10
2.2 Previsões de procura de energia ............................................................................................ 11
Uso de exergia útil para fazer previsões para a China ..................................................................... 13
3. Modelação por métodos estatísticos ........................................................................................... 19
3.1 Pré-tratamento de dados ........................................................................................................ 19
Análise estatística de 1ª ordem ........................................................................................................ 19
Análise de correlações ..................................................................................................................... 20
3.2 Análise de componentes principais (PCA) ............................................................................ 21
Definição do método de PCA .......................................................................................................... 21
Contribuição e interpretação de cada componente principal ........................................................... 22
Representação gráfica dos componentes principais ........................................................................ 23
Scores Plot e Loadings Plot ............................................................................................................. 24
3.3 Modelos de Regressão Linear ............................................................................................... 25
Regressão Linear Múltipla .............................................................................................................. 25
Regressão Linear Multivariada ....................................................................................................... 26
4. Modelação com Redes Neuronais ............................................................................................... 27
4.1 Benefícios das redes neuronais artificiais .............................................................................. 27
4.2 Neurónio artificial ................................................................................................................. 28
4.3 Topologia de redes ................................................................................................................ 31
4.4 Aprendizagem ....................................................................................................................... 32
4.5 Redes Perceptron ................................................................................................................... 33
4.6 Algoritmo backpropagation ................................................................................................... 35
4.7 Redes Neuronais Dinâmicas .................................................................................................. 36
4.8 Uso de Redes Neuronais para previsão do consumo de energia ........................................... 37
Caso de estudo: Grécia .................................................................................................................... 37
Caso de estudo: Coreia do Sul ......................................................................................................... 39
5. Dados e Metodologia ................................................................................................................... 44
5.1 Dados disponibilizados .......................................................................................................... 44
5.2 Metodologia........................................................................................................................... 47
Análise prévia dos dados ................................................................................................................. 48
Modelação com Redes Neuronais Artificiais .................................................................................. 48
6. Resultados e Discussão ................................................................................................................ 53
6.1 Boxplots ................................................................................................................................ 53
6.2 Mapa de correlações .............................................................................................................. 54
6.3 Análise de Componentes Principais (PCA) ........................................................................... 55
6.4 Modelos de Previsão ............................................................................................................. 58
Modelos dinâmicos de Redes Neuronais Artificiais ........................................................................ 58
Regressão Linear Múltipla .............................................................................................................. 63
Regressão Linear Multivariada ....................................................................................................... 66
6.5 Comparação entre os três métodos de previsão ..................................................................... 69
7. Conclusões e Trabalho Futuro ................................................................................................... 73
Referências ........................................................................................................................................... 75
Lista de Figuras
Figura 1 - Fluxos de energia e exergia presentes num sistema global económico. Fonte: Guevara et al. (2014) ... 5
Figura 2 – Valores de exergia por categorias de trabalho útil: exergia final (esquerda) e exergia útil (direita)
Fonte: Miguel Palma, 2014 ................................................................................................................................... 10
Figura 3 – Estrutura de exergia útil em Portugal, valores absolutos (esquerda) e valores relativos (direita). Fonte:
Miguel Palma, 2014 .............................................................................................................................................. 11
Figura 4 - Diagrama conceptual de exergia primária para trabalho útil (Brockway et al., 2014) ......................... 13
Figura 5 - Diagrama E-Sankey da China – 1971 (Brockway et al., 2014) ............................................................ 14
Figura 6 - Diagrama E-Sankey da China – 2010 (Brockway et al., 2014) ............................................................ 15
Figura 7 - Fluxograma de análise de trabalho útil (Brockway et al., 2014) .......................................................... 15
Figura 8 - Comparação das intensidades de exergia primária e exergia útil da China (Brockway et al., 2014) ... 17
Figura 9 - China - Projeções de trabalho útil para 2030 (Brockway et al., 2014) ................................................. 18
Figura 10 - China - Previsões de energia primária (TPES/GDP) para 2030 (Brockway et al., 2014) ................... 18
Figura 11 - Exemplo gráfico da definição de IQR, adaptado de for Disease Control and Division [2006]. ......... 20
Figura 12 - Representação das partes de um boxplot, adaptado de Friendly and Institute [1991] ........................ 20
Figura 13 - Esquema do princípio da técnica PCA retirado de Böhm et al., 2013 ................................................ 22
Figura 14 - Representação geométrica dos loadings num modelo de PCA (Eriksson et al., 2006)....................... 23
Figura 15 - Representação de scores (a) e loadings (b) (Eriksson, 1999) ............................................................. 24
Figura 16 - Interpretação geométrica dos valores loading e score (Eriksson, 1999) ............................................. 25
Figura 17 - Modelo do neurónio (S. Haykin, 1999) .............................................................................................. 30
Figura 18 - (a) Função limiar; (b) Função linear; (c) Função sigmóide com diferentes declives (S. Haykin, 1999)
.............................................................................................................................................................................. 30
Figura 19 - Rede de única camada (esquerda) e rede de duas camadas (direita) (S. Haykin, 1999) ..................... 31
Figura 20 - Arquiteturas de RNAs (S. Haykin, 1999) ........................................................................................... 32
Figura 21 - Rede Perceptron (Zhang, 1998) .......................................................................................................... 33
Figura 22 - Rede Perceptron com várias camadas intermédias (Zhang, 1998) ..................................................... 34
Figura 23 - Rede neuronal com realimentação do output como novo input (Demuth, H. et al., 2015) ................. 36
Figura 24 - Definição do critério de paragem ....................................................................................................... 37
Figura 25 – Rede MLP feedforward (L. Ekonomou, 2009) .................................................................................. 37
Figura 26 - Comparação do consumo previsto de energia para a Grécia através de RNA, modelo de regressão e
modelo de support vector com o real (L. Ekonomou, 2009) ................................................................................. 39
Figura 27 - Esquema do modelo de feedforward multilayer perceptron (Zong Woo Geem, William E. Roper,
2009) ..................................................................................................................................................................... 40
Figura 28 - Procura de energia e correspondente indicador da Coreia do Sul (Zong Woo Geem, William E.
Roper, 2009) ......................................................................................................................................................... 40
Figura 29 - Estimação da procura de energia por meio de regressão linear múltipla (Zong Woo Geem, William E.
Roper, 2009) ......................................................................................................................................................... 41
Figura 30 - Estimação da procura de energia utilizando modelo exponencial modificado (Zong Woo Geem,
William E. Roper, 2009) ....................................................................................................................................... 42
Figura 31 - Estimação da procura de energia utilizando o modelo FF-BP-ANN (Zong Woo Geem, William E.
Roper, 2009) ......................................................................................................................................................... 42
Figura 32 - Comparação entre os três modelos de previsão da procura de energia (Zong Woo Geem, William E.
Roper, 2009) ......................................................................................................................................................... 43
Figura 33 - Gráfico representativo da evolução das variáveis............................................................................... 46
Figura 34 - Gráfico representativo da evolução do GVA ...................................................................................... 46
Figura 35 - Diagrama das etapas que compuseram o tratamento de dados e a construção dos modelos de previsão
.............................................................................................................................................................................. 47
Figura 36 – 1-step-ahead-prediction ..................................................................................................................... 49
Figura 37 - 2-step-ahead-prediction ...................................................................................................................... 49
Figura 38 - Rede neuronal dinâmica em closed loop ............................................................................................ 50
Figura 39 - Gráfico de desempenho, obtido através da ferramenta Neural Network Toolbox (Demuth, H. et al.,
2015) ..................................................................................................................................................................... 51
Figura 40 - Gráfico com as várias regressões (treino, validação e teste), obtido através da ferramenta Neural
Network Toolbox (Demuth, H. et al., 2015) ......................................................................................................... 52
Figura 41 - Representação boxplot das variáveis, nomeadamente, 1-HTH, 2-MTH, 3-LTH, 4-MD, 5-Ele, 6-GVA
.............................................................................................................................................................................. 54
Figura 42 - Correlação segundo Pearson com nível de significância de 10e-36 ................................................... 55
Figura 43 - Componente 1 versus Componente 2 ................................................................................................. 57
Figura 44 - Gráfico ScreePlot ............................................................................................................................... 57
Figura 45 - Estrutura da rede retirada do software MATLAB .............................................................................. 58
Figura 46 – Representação de HTH segundo a RNA ............................................................................................ 59
Figura 47 - Representação de MTH segundo a RNA ............................................................................................ 59
Figura 48 - Representação de LTH segundo a RNA ............................................................................................. 60
Figura 49 - Representação de MD segundo a RNA .............................................................................................. 60
Figura 50 - Representação de Ele segundo a RNA ............................................................................................... 61
Figura 51 - Erro global das variáveis .................................................................................................................... 62
Figura 52 - Representação de HTH segundo a Regressão Linear Múltipla .......................................................... 63
Figura 53 - Representação de MTH segundo a Regressão Linear Múltipla .......................................................... 64
Figura 54 - Representação de LTH segundo a Regressão Linear Múltipla ........................................................... 64
Figura 55 - Representação de MD segundo a Regressão Linear Múltipla ............................................................ 65
Figura 56 - Representação de Ele segundo a Regressão Linear Múltipla ............................................................. 65
Figura 57 - Gráfico dos resíduos da regressão linear múltipla .............................................................................. 66
Figura 58 - Representação de HTH segundo a Regressão Linear Multivariada .................................................... 66
Figura 59 - Representação de MTH segundo a Regressão Linear Multivariada ................................................... 67
Figura 60 - Representação de LTH segundo a Regressão Linear Multivariada .................................................... 67
Figura 61 - Representação de MD segundo a Regressão Linear Multivariada ..................................................... 68
Figura 62 - Representação de Ele segundo a Regressão Linear Multivariada....................................................... 68
Figura 63 - Gráfico dos resíduos da regressão linear multivariada ....................................................................... 69
Figura 64 - Evolução do erro das variáveis no ano de 2000 e 2001 para as três análises de previsão .................. 70
Figura 65 - Evolução do erro das variáveis no ano de 2002 e 2003 para as três análises de previsão .................. 71
Figura 66 - Evolução do erro das variáveis no ano de 2004 e 2005 para as três análises de previsão .................. 71
Figura 67 - Evolução do erro das variáveis no ano de 2006 e 2007 para as três análises de previsão .................. 71
Figura 68 - Evolução do erro das variáveis no ano de 2008 e 2009 para as três análises de previsão .................. 72
Lista de Tabelas
Tabela 1 - Categorias de trabalho útil para cálculo de trabalho útil (adaptada de Serrenho et al., 2014) ................ 6
Tabela 2 - Factores de exergia considerados (adaptada de Wall et al., 1994, Serrenho et al., 2014) ...................... 7
Tabela 3 - Estudos para a contabilização das conversões de energia numa sociedade ........................................... 9
Tabela 4 - Contabilidade de outputs de trabalho útil: China - 1971, 2010 (Brockway et al., 2014) ..................... 16
Tabela 5 - Sumário da análise de resultados de trabalho útil, 1971-2010 (Brockway et al., 2014)....................... 17
Tabela 6 - Exemplo de uma matriz de correlações, adaptada de Ernesto F. L. Amaral, 2011 .............................. 21
Tabela 7 - Rede MLP - variáveis de input e output (L. Ekonomou, 2009) ........................................................... 38
Tabela 8 - Resultados do modelo MPL (L. Ekonomou, 2009) ............................................................................. 38
Tabela 9 - Demanda de energia e indicador de dados da Coreia do Sul (Zong Woo Geem, William E. Roper,
2009) ..................................................................................................................................................................... 41
Tabela 10 - Comparação dos resultados dos vários modelos utilizados para previsão da demanda de energia
(Zong Woo Geem, William E. Roper, 2009) ........................................................................................................ 42
Tabela 11 - Dados disponibilizados ...................................................................................................................... 45
Tabela 12 - Matriz de correlações das variáveis disponibilizadas ......................................................................... 54
Tabela 13 - Componentes principais do PCA ....................................................................................................... 56
Tabela 14 - Valores próprios de cada componente principal ................................................................................ 56
Tabela 15 – Erro quadrático médio da RNA ......................................................................................................... 61
Tabela 16 - P-value da regressão para cada variável ............................................................................................. 63
Tabela 17 - Erros da regressão linear múltipla ...................................................................................................... 65
Tabela 18 - Erros da regressão linear multivariada ............................................................................................... 69
Tabela 19 - Comparação de erros ao longo dos 50 anos ....................................................................................... 70
Tabela 20 - Comparação de erros ao longo dos 10 anos de previsão .................................................................... 70
Abreviações
ANN Artificial neural networks
BP British Petroleum
CHP Combined Heat and Power
Ele Other Electric Uses + Light
𝑬𝒖 Exergias úteis
EUA Estados Unidos da América
FF-BP-ANN Feed Forward BackPropagation Artificial Neural Network
GDP Gross Domestic Product
GVA Gross Added Value (Valor Acrescentado Bruto)
HTH High Temperature Heat
IDA Index Decomposition Analysis (Método de decomposição do índex)
IEA International Energy Agency (Agência Internacional de Energia)
IIASA International Institute for Applied Systems Analysis
INE Instituto Nacional de Estatística
IQR Interquartile Range (Distância inter-quartis)
L Light
LDMI Logarithmic Mean Divisia Index
LNG Gás Natural Liquefeito
LPG Liquified Petroleum Gases
LTH Low Temperature Heat
MD Mechanical Drive
MLP Multi-layer Perceptron (Rede Perceptron de multicamadas)
MSE Mean Squared Error (Erro Quadrático Médio)
MTH Medium Temperature Heat
NARX Nonlinear AutoRegressive with exogenous input (Não linear auto regressiva com entrada exógena)
OE Other electric uses
PC Principal Component (Componente Principal)
PCA Principal Component Analysis (Análise de Componente Principal)
PIB Produto Interno Bruto
RNA Rede Neuronal Artificial
SMD Stationary Mechanical Drive
T Transport
TPES Total primary energy supply
USEIA US Energy Information Administration
1
1. Introdução
A dinâmica do consumo energético em todo o mundo tem-se demonstrado genericamente bastante variável
concorrendo diversos fatores para a necessidade de conhecimento aprofundado da sua evolução (Miguel Palma,
2014).
É incontornável a forte dependência da utilização de energia gerada a partir de combustíveis fósseis, cujas variáveis
de mercado, quer na perspetiva da oferta quer da procura, se têm mostrado bastante voláteis. Esta dependência é
tanto mais sensível quanto maiores forem as variações na taxa de crescimento económico dos grandes
consumidores mundiais e do papel da estratégia geopolítica dos grandes produtores de petróleo. Este facto
condiciona o controlo dessas mesmas variáveis, sendo que é cada vez mais necessário que os países desenvolvidos
tenham a sua situação financeira e orçamental equilibrada.
Esta necessidade leva a que o planeamento financeiro e a afetação de recursos dedicados ao sector energético,
veículo central no crescimento económico dos países, deva ser feito com extremo rigor e detalhe permitindo uma
gestão eficiente dos referidos recursos financeiros. Este facto deverá garantir a capacidade para fazer face às
necessidades energéticas, mas ao mesmo tempo, não poderá esgotar estes recursos. Deverá, isso sim, libertá-los,
quando supérfluos para áreas em que são criticamente requeridos, nomeadamente para o desenvolvimento social
e saúde das populações.
Os países consumidores de energia, elemento fundamental nas suas políticas de desenvolvimento, devem assim
garantir que têm fontes seguras de fornecimento, que consomem a energia de modo eficiente e que garantem a
proteção do meio ambiente, mas que, ao mesmo tempo, desenvolvem modelos de flexibilização e de redução de
dependência da energia gerada a partir de combustíveis fósseis.
A análise e estudo de eficiência da utilização e consumo energético são fundamentais e alguns modelos e conceitos
têm sido utilizados, nomeadamente os de energia e de exergia. A exergia analisa a qualidade do consumo e da
utilização da energia, ou seja a sua capacidade de produzir trabalho, medindo também o grau de eficiência de um
processo de utilização de energia. Consegue levar a cabo este estudo focando-se nos processos propriamente ditos,
independentemente do modo de utilização de energia, e calculando assim qual o seu desvio da performance ideal.
A utilização do conceito de exergia permite calcular qual o valor mínimo de energia a fornecer para um
determinado trabalho gerado (Miguel Palma, 2014).
2
1.1 Motivação e Objetivos do Trabalho
No decorrer desta dissertação apresenta-se um novo estudo que combina a abordagem das Redes Neuronais
Artificiais (RNA) com a evolução temporal da exergia útil com o intuito de fazer previsões de consumos
energéticos.
Exemplos da utilização de RNA para fazer previsões do consumo de energia usando dados de energia final podem
ser encontrados na literatura, por exemplo, nos casos da Grécia e Coreia do Sul, apresentados nas secções 4.8.1 e
4.8.2, e o caso da China que utiliza a exergia útil para fazer essa mesma previsão, apresentado na secção 2.2.1.
Igualmente, no trabalho de Percebois (1979) suportado por Serrenho et al. (2014) sugere-se que a intensidade
energética (consumo energético em função do PIB) era mais bem calculada no último patamar da cadeia energética
pelo facto de calcular as necessidades para satisfazer os diferentes utilizadores finais. Esta dissertação proporciona
conhecimentos adicionais sobre este assunto, pois aborda de forma pioneira a utilização de RNA para fazer
previsões de exergia útil por tipo de uso.
Utiliza-se ao longo deste trabalho o valor da exergia em vez de energia, pois a exergia permite contabilizar um
aspeto quantitativo da energia, mas também contabiliza a qualidade das diferentes formas de energia. Esta
qualidade é medida como a capacidade de transformar uma dada forma de energia em trabalho.
A análise de exergia apresenta algumas vantagens, tais como:
Permite contabilizar e analisar as fontes de energia pela sua capacidade de produzir trabalho (Serrenho,
2013);
Permite avaliar o potencial termodinâmico sempre pela mesma referência, o que a torna indiferente do
fator de conversão aplicado ao mecanismo ou à fonte de energia, permitindo fazer uma análise
comparativa entre eles, tendo como limite o valor de 100%.
Com base nos pontos anteriores, conclui-se que a análise exergética é preferível para realizar o estudo da utilização
final de energia num sistema, por exemplo, o sistema económico de um país.
É também de referir que, apesar de haver três estágios de exergia, primário, final e útil, os dados que são utilizados
são os de exergia útil. A energia primária pretende quantificar o conteúdo energético dos recursos utilizados,
enquanto que a energia (exergia) útil quantifica as necessidades de trabalho dos utilizadores finais da energia.
Assim, representa as necessidades reais de um país e permite ter uma perceção da relação direta com a
produtividade e nível económico.
O objetivo deste trabalho é, desta forma, projetar um sistema que permita efetuar a previsão dos consumos de
energia ao longo dos anos, através dos seguintes passos:
1. Análise das curvas da evolução de trabalho (exergia) útil em Portugal no período compreendido entre
1960 e 2009;
2. Criação de uma ferramenta computacional que, baseada em modelos de redes neuronais artificiais, seja
capaz de projetar os níveis de exergia útil por tipo de uso;
3. Verificação da importância de uma correta definição dos dados de entrada e de saída da rede neuronal,
comparando os resultados deste estudo com os resultados de outros estudos competitivos;
3
4. Estudo de análise de sensibilidade que permita encontrar os parâmetros mais importantes na previsão.
Para a elaboração deste trabalho, foi consultada vasta bibliografia, a qual permitiu obter dados, processos, métodos
e também otimizações e estimativas que foram integradas no estudo.
A ferramenta computacional desenvolvida permite a sua potencial utilização por interessados em explorar e
desenvolver os resultados.
1.2 Estrutura da Dissertação
A estrutura do documento é a seguinte:
(a) A secção 2: “Análise de energia” apresenta os conceitos gerais necessários para a compreensão de
conceitos, tais como os conceitos de energia e de exergia. A apresentação é feita através de trabalhos
anteriormente desenvolvidos sobre eficiências e trabalho útil, assim como, o caso de estudo realizado
para a China.
(b) A secção 3: “Descrição dos métodos” descreve os principais métodos que vão ser primeiramente usados
na análise das variáveis e métodos de comparação às redes neuronais.
(c) A secção 4: “Modelação com Redes Neuronais” descreve conceitos de redes neuronais artificiais e casos
de estudo em que redes neuronais foram utilizadas.
(d) A secção 5: “Dados e Metodologia”, descreve os principais métodos que vão ser usados na tentativa de
alcançar o objetivo pretendido neste trabalho.
(e) A secção 6: “Resultados e discussão”, apresenta os resultados do trabalho bem como uma discussão do
método aplicado.
(f) Por fim, na secção 7: “Conclusão e Trabalho Futuro” são retiradas as principais conclusões do trabalho e
indicadas sugestões para trabalhos futuros.
4
2. Análise da energia
O presente capítulo tem por objetivo introduzir conceitos que serão importantes para se poder acompanhar o
desenvolvimento do trabalho. São definidos os conceitos de fluxos de utilização e consumo de energia e exergia
e, de eficiência energética e exergética à escala nacional.
2.1 Exergia primária, final e útil
Antes de mais, devem ser definidos alguns conceitos utilizados na análise de energia. Conceitos como os fluxos
de energia e exergia primário, final e útil são importantes definições quando se analisa a cadeia energética.
Definições de energia
Em condições normais, a cadeia energética compreende, desde a sua origem até à sua utilização final, três estágios:
energia inicial, energia final e energia útil, relacionando-se todas elas por vários processos de conversão.
A energia inicial (ou primária) é a primeira fase da cadeia de energia e está relacionada com a forma em que esta
se encontra na natureza, sem qualquer processo de conversão ou transformação (Boyle e al., 2003).
A segunda fase de energia na cadeia energética é designada por energia final. A energia final é a energia que está
disponível para consumo por qualquer utilizador final. É a energia que se obtém da energia primária, depois de
deduzidas todas as perdas originadas na transformação, transporte e distribuição. É uma fase (ou estágio) mais
fácil de quantificar, uma vez que se trata da energia disponibilizada para consumo, como eletricidade ou gás
disponíveis para uso doméstico ou industrial.
Na primeira fase da cadeia energética (fase inicial ou primária), quantifica-se a energia pela entalpia da fonte de
energia disponibilizada na natureza (petróleo, carvão); na segunda fase, ela é quantificada pela entalpia da energia
que é fornecida para consumo (eletricidade, combustíveis, etc.) (Serrenho, 2013).
A energia final fornecida para uma qualquer utilização não é consumida na sua totalidade, devido às perdas que
se geram nos mecanismos de utilização final (exemplo de uma lâmpada em que parte da energia fornecida é perdida
em calor e não em iluminação gerada). A energia que o mecanismo ou consumidor utiliza para o fim pretendido é
a energia útil.
A transição de energia final para energia útil é obtida através de fatores de conversão de eficiência de uma forma
de energia para outra e depende do processo de conversão e também do mecanismo final que usa a energia.
5
Definições de exergia
Para se poder avaliar o trabalho produzido pela energia útil, é necessário definir o conceito de exergia.
Exergia é uma propriedade termodinâmica que quantifica a capacidade de produzir trabalho (Moran et al., 2010),
ou seja, a capacidade para gerar trabalho mecânico a partir de energia. A exergia é sempre quantificada
relativamente a um referencial, ou ambiente de referência. Uma ilustração para se perceber o conceito de exergia
pode ser dada com um bloco de gelo: se este bloco de gelo for usado na Antártida, o seu potencial para produzir
trabalho é muito inferior ao caso em que o bloco de gelo é colocado num deserto (devido à diferença entre as
temperaturas do ambiente e do bloco de gelo de ambos os locais: quase nula na Antártida e significativa no
deserto), logo a sua exergia é superior no segundo caso (Moran e Shapiro, 2006).
Assim, a exergia é um método muito mais eficaz para analisar e estudar o processo de utilização de energia (Ayres
and Warr, 2010, Serrenho et al., 2014, Guevara et al., 2014). Aplica-se o conceito de exergia a todos os tipos de
utilização de energia e às fontes energéticas, avaliando-se pela capacidade máxima de extrair trabalho. Permite a
aplicação de segunda lei de eficiência aos mecanismos de utilização final de energia. À semelhança da energia, na
análise da exergia à escala da sociedade também se podem definir os mesmos estágios, exergia primária (ou
primitiva), exergia final e exergia útil, como observado na Figura 1.
Figura 1 - Fluxos de energia e exergia presentes num sistema global económico. Fonte: Guevara et al. (2014)
O estudo e análise da exergia versus energia tem algumas vantagens, tais como:
Permite contabilizar e analisar as fontes de energia pela sua capacidade de produzir trabalho (Serrenho
2013)
Avalia o potencial termodinâmico sempre pela mesma referência, o que a torna indiferente do fator de
conversão aplicado ao mecanismo ou à fonte de energia, permitindo fazer uma análise comparativa entre
eles, tendo como limite o valor de 100%.
Com base nos pontos anteriores, conclui-se que a análise exergética é preferível para realizar o estudo da utilização
final de energia num sistema, como o sistema económico de um país.
6
Conversão de dados energéticos em exergia
Serrenho et al. (2013) quantificou as seguintes categorias de exergia útil: calor, trabalho mecânico que se divide
em transporte e em trabalho mecânico estacionário, luz e uso de eletricidade.
Para se compreender o estudo da primeira e da segunda lei de eficiência, para a conversão de energia final em
energia útil, os usos finais de energia têm de ser caracterizados e desagregados. Isto deve-se ao facto de não haver
dados para energia ou exergia útil, dependendo esta última do uso que é dado à energia final, que varia conforme
o fim e a categoria para que é usada.
Para que os valores finais de energia útil possam ser calculados, a conversão de eficiências de energia/exergia final
para útil têm que ser caracterizadas, a fim de se obter uma eficiência global de energia/exergia final para útil. A
Tabela 1 baseada nos estudos de Warr et al. (2010) e Serrenho et al. (2014), na coluna central, apresenta a
desagregação das categorias acima mencionadas.
Tabela 1 - Categorias de trabalho útil para cálculo de trabalho útil (adaptada de Serrenho et al., 2014)
Categorias de trabalho útil
(agregadas)
Categorias de trabalho útil
(desagregadas)
Temperatura de serviço
Calor
Calor a altas temperaturas
Calor a médias temperaturas
Calor a baixas temperaturas
500°C
150°C
80°C
Trabalho mecânico
estacionário
Petróleo
Carvão
Transporte
Locomotivas a vapor
Veículos a diesel
Veículos a gasolina/LPG
Aviação
Navegação
Veículos a gás natural
Diesel-eléctrico
Luz Carvão/Petróleo luz
Electricidade Tratada separadamente
Cálculo da Exergia Útil
Para se realizar o cálculo dos valores de trabalho útil é aplicado o método de Ayres et al. (2003) que envolve os
seguintes passos:
Conversão de dados de energia final em exergia final;
Atribuição do consumo de exergia final às categorias de trabalho útil;
Conversão de exergia final em exergia útil usando dados finais da segunda lei de eficiência para dados
úteis;
Cálculo da exergia útil agregada.
A grande generalidade dos países têm elementos estatísticos a nível energético. A partir destes dados, podem obter-
se dados de exergia pela conversão dos dados de energia. Tal conversão é obtida através de um factor de exergia
(Tabela 2), que é função da quantidade de trabalho que se obtém a partir de um determinado tipo de energia, seja
7
o tipo de energia (energia mecânica, energia química) como o veículo energético (petróleo e carvão) (Wall, 1977).
A título de exemplo, o factor 1 pode aplicar-se tanto à energia mecânica como ao veículo energético electricidade,
pois ambos podem ser convertidos totalmente em trabalho.
Tabela 2 - Factores de exergia considerados (adaptada de Wall et al., 1994, Serrenho et al., 2014)
Vectores de energia Factores de exergia
Carvão e produtos de carvão 1,06
Produtos de petróleo 1,06
Carvão Coke 1,05
Gás natural 1,04
Combustíveis renováveis 1,11
Electricidade 1,00
CHP e calor geotérmico 0,60
Para o carvão, petróleo, gás natural e outros combustíveis pode verificar-se que o factor exergético é superior a 1,
embora o conteúdo exergético de um recurso seja sempre mais baixo ou igual ao conteúdo energético. Isto ocorre,
porque os valores apresentados nos balanços de energia do IEA é a entalpia de combustão (calor libertado durante
a combustão), enquanto o conteúdo exergético também inclui a energia química do recurso (Cullen e Allwood,
2010b).
Eficiência Energética
O conceito de eficiência energética de uma determinada economia é o que estabelece a relação entre os diferentes
estágios energéticos (primário – final – útil). Podem determinar-se vários agrupamentos de eficiência, como da
primária para final, da primária para útil ou da final para útil, sendo necessário calcular primeiro a eficiência
específica de cada processo ou veículo energético para depois se determinar a eficiência energética de qualquer
agrupamento referido acima.
O cálculo da eficiência energética específica é efetuado através das duas leis de eficiência termodinâmica, a
primeira lei (eficiência energética) e a segunda lei (eficiência exergética). Apresenta-se de seguida uma explicação
sobre as mesmas.
Eficiência Energética
A 1ª lei refere-se à eficiência como uma medida do desempenho (performance) quantitativo de um sistema e, é
representada pela Equação (2.1):
𝜂 =
𝑝𝑟𝑜𝑑𝑢çã𝑜 𝑑𝑒 𝑒𝑛𝑒𝑟𝑔𝑖𝑎 (𝑑𝑒𝑠𝑒𝑗𝑎𝑑𝑜)
𝑒𝑛𝑡𝑟𝑎𝑑𝑎 𝑑𝑒 𝑒𝑛𝑒𝑟𝑔𝑖𝑎
(2.1)
Esta fórmula de eficiência é útil quando se comparam os mesmos mecanismos de conversão. Mas por este facto
ela torna-se desadequada quando se comparam diferentes mecanismos de conversão, devido ao facto de ser
dependente do mecanismo (Moran et al., 2010). Algumas das limitações são referidas por Cullen e Allwood
8
(2010b), tais como: i) permitir uma eficiência > 1 não permitindo assim a comparação entre diferentes mecanismos
e ii) não considerar a qualidade do output energético, apenas a sua quantificação.
Eficiência exergética
A segunda lei considera exergia em vez de energia. Através desta é possível quantificar a qualidade de energia
usada, sendo o limite de eficiência ≤ 1.
É representada pela Equação (2.2):
𝛾 =
𝑝𝑟𝑜𝑑𝑢çã𝑜 𝑑𝑒 𝑒𝑥𝑒𝑟𝑔𝑖𝑎 ú𝑡𝑖𝑙
𝑝𝑟𝑜𝑑𝑢çã𝑜 𝑚á𝑥𝑖𝑚𝑎 𝑝𝑜𝑠𝑠í𝑣𝑒𝑙 𝑑𝑒 𝑒𝑥𝑒𝑟𝑔𝑖𝑎 ú𝑡𝑖𝑙
(2.2)
Esta fórmula (Cullen and Allwood, 2010b) permite quantificar o desvio da conversão relativamente a um
desempenho perfeito (o trabalho máximo que poderia ser obtido).
Exergia útil: definição e contabilização
Para a gestão equilibrada dos orçamentos financeiros de um país é fundamental ter-se um conhecimento das
necessidades energéticas num prazo alargado de tempo, alocando os recursos financeiros necessários para a
implantação e melhoria dos sistemas de distribuição, consumo e utilização da energia e libertar outras verbas para
áreas úteis necessárias ao desenvolvimento económico. Nesse sentido, o estudo do consumo e previsões
energéticas merece um especial destaque.
Ao longo do tempo, diferentes formas e métodos de análise de energia e exergia foram utilizados para se
contabilizar o fluxo de consumo energético, desde a sua origem até à utilização final. A Tabela 3 seguinte enumera
algumas referências conhecidas sobre o estudo e análise de exergia e energia (Serrenho et al., 2014) à escala
nacional.
9
Tabela 3 - Estudos para a contabilização das conversões de energia numa sociedade
10
Da análise da tabela constata-se que existem dois métodos de avaliação temporal, seja a que é efetuada no período
de um ano ou a que cobre um período mais alargado de anos. Tal está relacionado com o objetivo do estudo, pois
um período de análise curto permite avaliar a eficiência do consumo energético, facilitando o planeamento futuro
a curto prazo, enquanto que a análise por um período longo permite avaliar o desenvolvimento e progresso
económico de um país.
Da análise da exergia depende o método utilizado para se contabilizar e calcular o trabalho útil. Segundo Ertesv�̈�g
(2005), existem duas formas de abordagem quando se analisa a utilização de energia e o cálculo de trabalho útil.
Estas são o estudo feito por Reistad (1975) sobre a sociedade dos Estados Unidos da América (EUA) e a outra é a
análise utilizada por Wall (1987) sobre a sociedade da Suécia. A diferença principal é a inclusão dos fluxos de
matéria no estudo de Wall, segundo Utlu e Hepbasli (2007).
Perfil energético de Portugal
O território português, incluindo os arquipélagos, tem uma população de cerca de 10,5 milhões de habitantes e
uma área de cerca 9,2 milhões de hectares o que significa uma densidade populacional de 114 habitantes por km
quadrado (INE, 2012).
Portugal é actualmente dependente da importação de energia, especialmente energia derivada de hidrocarbonetos,
estando a produção de energia primária cingida à produção por fontes renováveis.
A principal fonte ou veículo energético é o petróleo, importado de países Africanos e do Médio Oriente, sendo
posteriormente refinado em produtos finais nas duas refinarias existentes, em Matosinhos e Sines. Parte dos
produtos finais derivados da refinação são exportados, nomeadamente para os EUA.
Figura 2 – Valores de exergia por categorias de trabalho útil: exergia final (esquerda) e exergia útil (direita) Fonte: Miguel
Palma, 2014
A extração de carvão terminou em Portugal em 1994, tendo sido inicialmente usada para a locomoção
(locomotivas) e produção energética, como alternativa à produção hidroelétrica em anos ou períodos de fraca
pluviosidade. Na Figura 2 podemos observar os valores de exergia por categorias de trabalho útil (other electric
uses: OE, light: L, transporte: T, stationary mechanical drive: SMD, high temperature heat: HTH, medium
temperature heat: MTH e low temperature heat: LTH)
A importação e consumo de gás natural (LNG) tem vindo a crescer desde 1997, sendo essencialmente importado
por pipeline do norte de África ou por via marítima (LNG tanker´s) da Nigéria. A sua utilização na produção de
eletricidade ganha cada vez maior relevância, como se verifica na Figura 3 seguinte:
11
Figura 3 – Estrutura de exergia útil em Portugal, valores absolutos (esquerda) e valores relativos (direita). Fonte: Miguel
Palma, 2014
2.2 Previsões de procura de energia
A energia é considerada um fator importante para o desenvolvimento económico e social de um país e,
consequentemente, a riqueza do povo.
O peso da componente energética nos orçamentos de cada país, principalmente nos dos Estados importadores de
energia fóssil ou elétrica, assim como a sua importância no domínio geopolítico e estratégico de cada nação levam
a que seja crucial dispor de um conhecimento tão rigoroso quanto possível das suas reais necessidades de consumo
de energia. Este conhecimento traduz-se nas vertentes de valor, de tipo de energia (fóssil, elétrica, renovável,
nuclear, etc.), tudo num horizonte de tempo de tão longo quanto possível, em geral um horizonte temporal de vinte
anos.
Tal previsão pode ser efetuada através de vários processos e assentar em pressupostos diversos, fazendo assim face
à necessidade de gestão das incertezas, fator que se agrava num período de tempo longo, como incertezas no
evoluir das sociedades, nos desenvolvimentos tecnológicos que podem influenciar essas mesmas previsões e
incertezas geopolíticas.
As previsões têm também um papel fundamental no comportamento e no desenvolvimento das sociedades,
principalmente pelo facto de evidenciarem o futuro e, assim permitirem que as sociedades se adequem e ajustem
ao resultado dessas mesmas previsões.
Como referido anteriormente, a previsão permite aos países e seus governos ter um conhecimento antecipado sobre
os recursos financeiros necessários, quer ao nível de importação de produtos energéticos, quer no que respeita aos
investimentos necessários no desenvolvimento e melhoramento das infraestruturas que permitem fazer face às
necessidades energéticas futuras dos países.
As previsões sobre as necessidades futuras são úteis para os responsáveis de planeamento atual, mas menos
importantes para os responsáveis e utilizadores futuros.
Tipos de previsão
Nos diferentes modelos de previsão de necessidades energéticas, os pressupostos têm em consideração o
comportamento humano e também o fator de inovação.
Os outputs dos modelos de previsão podem ter uma importância direta no comportamento das sociedades e os seus
resultados podem ser utilizados para a mudança de comportamento das mesmas, como por exemplo, no caso do
12
efeito de estufa e aquecimento global, que impulsionam fortemente o fator eficiência energética (P.P. Craig et al.,
2002).
Existem alguns modelos de previsão, tendo as técnicas de previsão sido amplamente descritas por Armstrong na
década de 90. (P.P. Craig et al., 2002)
Foi definido que as metodologias utilizadas se resumem a seis categorias (P.P. Craig et al., 2002):
1. Em termos simples pensa-se que o futuro será uma leve extensão do passado com a sua força e
a sua fraqueza, uma vez que, as projeções de tendências baseiam-se em correlações empíricas. A aproximação
pode resultar na falta de uma mudança estrutural (por exemplo para previsões a curto prazo) e é também útil para
previsões para negócio, previsões essas que geralmente vêem o futuro como uma leve continuação de taxas de
crescimentos históricos. A maior fraqueza nas aproximações baseadas em projeções de tendências é que elas
desencorajam a identificação dos fatores que são relevantes. Geralmente estes modelos não incluem a causalidade
e não conseguem identificar as contradições que possam surgir e, estas podem ser críticas na compreensão futura;
2. As projeções econométricas são uma extensão alargada das projeções de tendências. As
projeções econométricas obtidas computacionalmente permitem explorar as relações entre muitas variáveis causais
hipotéticas. As variáveis dependentes, tais como, a energia consumida ou emissões de carbono podem estar ligadas
com variáveis independentes, tais como, o preço e o poder monetário. A projeção econométrica reside na análise
regressiva de dados históricos e, assim, assume uma rigidez estrutural na economia. Quanto às projeções de
tendências, a força das técnicas econométricas reside nas previsões a curto prazo, enquanto que as modificações
estruturais e as tecnologias adotadas são limitadas nos seus efeitos em virtude das falhas na produção. Assim as
projeções econométricas tornam-se menos úteis a longo prazo, porque a maior experiência que o passado mostrou,
nos quais os parâmetros econométricos se baseiam, foi que não refletiu durante muito tempo as condições futuras;
3. A análise de utilização final divide o sector da energia em distintos subsectores tecnológicos.
As projeções totais são construídas a partir de análises sectoriais de vários end-uses (iluminação, arrefecimento,
refrigeração, aquecimento). Esta aproximação começa por perguntar, “Quem usa mais energia para esses fins?”
assim, isto foca-se nos serviços que usam a energia e nas características tecnológicas dos aparelhos que fornecem
esses serviços. Como estes modelos representam explicitamente a utilização final e as tecnologias a si associadas
é relativamente fácil incorporar modificações antecipadas na tecnologia e na sua política (autonomização,
refrigeração, níveis eficientes de iluminação);
4. A análise combinada emprega métodos regressivos, quando as tendências parecem ser robustas
e quando são mais fracas utiliza a análise de utilização final. Esta espécie de análise está a ser mais usada tanto na
indústria como no governo. As análises combinadas juntam engenheiros e economistas permitindo-lhes combinar
as ferramentas mais analíticas de cada grupo;
5. A dinâmica de sistemas aproxima modelos de engenharia, modelos sociais e sistemas
económicos como uma combinação de reservatórios que podem acumular e descarregar quantidades interessantes
de energia, população e dinheiro. As aproximações da dinâmica de sistemas a modelos de energia não têm sido
amplamente usados na política do trabalho, embora tenham sido extensivamente usados em estudos universitários.
Os modeladores da dinâmica de sistemas no campo da energia não têm, geralmente, incorporado a riqueza da
engenharia e da economia, e os dados demográficos têm sido desenvolvidos por outros estudos. A referida
13
dinâmica tem sido muito usada noutras áreas, tais como, a escassez das pescas e das relações entre o predador e a
presa.
6. A análise de cenários. O termo cenário foi introduzido por Herman Kahn. Os cenários são
conceções descritivas de possíveis energias futuras. As descrições podem ser elevadas a qualquer grau, incluindo
análises numéricas. Uma análise de cenário ajuda a tornar as conclusões mais explícitas. No seu melhor, a análise
de cenário pode levar os seus utilizadores a considerar hipóteses que não tinham concebido anteriormente. A
qualidade dos cenários depende criticamente da experiência e da sabedoria da equipa que o constrói. Os melhores
cenários mostram a possibilidade de modificações estruturais, enquanto que, os fracos assumem, sem uma reflexão
cuidadosa, que os resultados da análise continuarão imutáveis indefinidamente.
Uso de exergia útil para fazer previsões para a China
São escassas as análises de exergia útil para a China, apesar de este ser o maior consumidor mundial de energia.
Assim torna-se de vital importância para este país ter uma análise de necessidades energéticas no futuro baseada
em elementos e dados que permitam ter uma previsão correta e realista dessas necessidades.
Para tal é fundamental ter-se uma análise baseada na exergia útil pelo facto de a mesma ter em consideração mais
componentes da cadeia de fornecimento energético comparativamente a uma análise tradicional de necessidades
energéticas, por ser o último patamar em que se quantifica a energia antes de ser transformada em serviço
produzido, Figura 4.
Figura 4 - Diagrama conceptual de exergia primária para trabalho útil (Brockway et al., 2014)
Percebois (1979) sugeriu (e suportado por Serrenho et al., 2014) que a intensidade energética (consumo energético
em função do PIB) era mais bem calculada no último patamar da cadeia energética por calcular as necessidades
para satisfazer os diferentes utilizadores finais.
No caso da China existem muito poucas análises exergéticas que examinem resultados numa base temporal. Para
combater este gap o estudo desenvolvido por Brockway et al. (2014) propõe um método de três análises distintas,
mas interligadas entre si, que consiste nos seguintes passos:
1. Analisar os dados existentes sobre eficiência exergética e trabalho útil para o período de 1971 a 2010;
2. De seguida utilizar o método de decomposição de índex (IDA) para identificar os parâmetros principais
para análise das alterações de exergia útil;
14
3. Utilizar um método de cálculo para projetar as necessidades energéticas da China até 2030 e também
testar as implicações da redução da eficiência exergética no futuro, derivada do facto de a eficiência
exergética obtida pela evolução de uma sociedade principalmente agrícola para industrial ser diluída pela
utilização de processos menos eficientes, como ar-condicionado por exemplo (dilution factor).
Nas figuras seguintes estão representados os Diagramas E-Sankey da China para o ano de 1971 (Figura 5) e 2010
(Figura 6).
Figura 5 - Diagrama E-Sankey da China – 1971 (Brockway et al., 2014)
15
Figura 6 - Diagrama E-Sankey da China – 2010 (Brockway et al., 2014)
No caso da China, a relação entre as tarefas energéticas, trabalho útil, eficiência exergética e exergia inicial é
representada pelo fluxograma da Figura 7:
Figura 7 - Fluxograma de análise de trabalho útil (Brockway et al., 2014)
16
Utilizando os dados da Agência Internacional de Energia (IEA) obtém-se os valores de exergia útil, exergia
primária e eficiência exergética apresentados na Tabela 4:
Tabela 4 - Contabilidade de outputs de trabalho útil: China - 1971, 2010 (Brockway et al., 2014)
Estes valores, mapeados em quatro classes principais, são a base de input para o método de cálculo de
decomposição analítica Logarithmic Mean Divisia Index (LDMI). Este método foi utilizado para se obter a
contribuição relativa da eficiência energética e exergética na exergia útil a nível das classes principais.
Após a análise histórica e decomposição analítica desenvolveu-se um método baseado no trabalho útil para se
fazer a previsão energética até 2030, baseado na extrapolação do PIB e na extrapolação da eficiência das “tarefas
exergéticas”, num cenário de eficiência constante e, também, num cenário de redução da eficiência exergética
devido ao efeito da diluição (Brockway et al., 2015, pg. 895).
17
Os resultados da exergia útil, exergia primária e eficiência exergética entre 1971 e 2010 são apresentados na Tabela
5:
Tabela 5 - Sumário da análise de resultados de trabalho útil, 1971-2010 (Brockway et al., 2014)
Da análise da mesma constata-se que a eficiência exergética agregada cresceu de 5,3% para 12,5%, devido
fundamentalmente à mudança social de trabalho intenso para uma sociedade mais industrializada. O crescimento
de eficiência exergética coloca a China como tendo melhor performance que os EUA. Tal facto deve-se somente
a que o crescimento acelerado da economia chinesa utiliza mais processos industriais e temperaturas de calor mais
elevadas do que uma sociedade americana cujo desenvolvimento e progresso está mais amadurecido. Aplicando
este princípio de amadurecimento das sociedades ao caso da China é de prever uma diluição de eficiência
exergética e, por conseguinte um abaixamento neste fator.
O trabalho útil e intensidade energética primária estão representados na Figura 8:
Figura 8 - Comparação das intensidades de exergia primária e exergia útil da China (Brockway et al., 2014)
A maior estabilidade da intensidade da exergia útil versus energia primária sugere que esta está mais diretamente
ligada ao GDP, sendo o seu crescimento até 2030 representado pela Figura 9:
18
Figura 9 - China - Projeções de trabalho útil para 2030 (Brockway et al., 2014)
Da Figura 9 verifica-se que o crescimento de exergia útil até 2030 é quase linear, isso é devido a dois efeitos se
cancelarem mutuamente: a desaceleração do crescimento do GDP e a redução de intensidade de trabalho útil.
A energia primária estimada (TPES/GDP) é calculada assumindo o cenário das eficiências. O resultado obtido é
comparado com cinco cenários publicados por agências diferentes (Fridley et al., 2012; IEA, 2013; USEIA, 2014;
BP, 2014 e IIASA, 2014), apresentado na Figura 10.
Figura 10 - China - Previsões de energia primária (TPES/GDP) para 2030 (Brockway et al., 2014)
Constata-se que o resultado obtido por este estudo é significativamente superior aos das agências referidas,
demonstrando que as análises tradicionais revelam valores mais conservadores. Demonstra-se a correlação direta
de uma menor eficiência se traduzir num menor crescimento económico e, consequentemente, menores requisitos
no trabalho útil. Também pela aplicação do método de LMDI se verifica que a eficiência energética da China
comparativamente à dos EUA se deve a uma maior intensidade de utilização de intensidade energética e não a um
desenvolvimento tecnológico maior, tendo o fator diluição um importante papel no decrescimento da eficiência
exergética.
19
3. Modelação por métodos estatísticos
3.1 Pré-tratamento de dados
Previamente à identificação de qualquer modelo dinâmico a partir de um registo de dados, é necessário ter em
conta que é indispensável uma fase de pré-tratamento de dados. Os métodos aplicados podem ser, nomeadamente,
os boxplots, os mapas de correlações e a análise dos componentes principais (PCA).
Análise estatística de 1ª ordem
Um boxplot, ou diagrama de caixa, é a representação gráfica de uma amostra que exibe a sua forma, tendência
central e variabilidade, sendo uma maneira rápida de resumir e interpretar dados. Os boxplots são úteis para
compreender a distribuição de uma amostra e fazer comparações de diversas distribuições.
Na estatística descritiva, um gráfico de caixa é uma maneira conveniente de representar graficamente grupos de
dados numéricos através dos seus quartis. Assim, o boxplot é essencialmente representado por cinco partes
(Wickham and Stryjewski, 2011): a mediana; o primeiro e o terceiro quartil que formam a “caixa”; os dados que
se encontram entre o mínimo da distribuição normal dos dados e o primeiro quartil, e os dados que se encontram
entre o terceiro quartil e o máximo da distribuição normal dos dados; o limite superior que é calculado por (𝑄3 +
1,5𝑥𝐼𝑄𝑅) e o limite inferior que é calculado por (𝑄1 − 1,5𝑥𝐼𝑄𝑅); e os outliers, ou valores discrepantes, que são
pontos que estão acima do limite superior e/ou abaixo do limite inferior.
O 𝐼𝑄𝑅 corresponde à distância inter-quartis (Interquartile Range) e no seu cálculo, 𝑄3 e 𝑄1, correspondem aos
valores do terceiro quartil e do primeiro quartil, respectivamente, de uma distribuição normal, como se pode
observar na Figura 11. As equações matemáticas que descrevem a distribuição normal podem ser encontradas em
Dixon et al. (1969).
Em suma, o diagrama de caixa (Figura 12) oferece a medida da posição central dos dados através da mediana. O
gráfico boxplot também dá uma ideia da dispersão, ou contrariamente, da concentração dos valores, através da
distância interquartílica (75% (𝑄3) − 25% (𝑄1)).
20
Figura 11 - Exemplo gráfico da definição de IQR,
adaptado de for Disease Control and Division [2006].
Figura 12 - Representação das partes de um boxplot,
adaptado de Friendly and Institute [1991]
Análise de correlações
A análise de correlações é uma ferramenta importante com aplicação em diferentes áreas do conhecimento, não só
como resultado final, mas como uma das etapas para a utilização de outras técnicas de análise. Este é um método
estatístico utilizado para estudar o grau de relacionamento entre variáveis, medindo a intensidade e a direção da
relação linear ou não-linear entre duas variáveis (Kimura, H. et al., 2009)
A medida do grau de associação linear entre variáveis é denominada por coeficiente de correlação. Este coeficiente
é representado pela letra r, e mede a força e a direção da relação linear entre duas variáveis, ou seja, se as variáveis
se encontram diretamente ou inversamente relacionadas. Contudo, há três pressupostos básicos para o uso deste
coeficiente:
- as variáveis devem estar relacionadas de forma linear. Caso contrário, o valor do coeficiente de
correlação será zero ou próximo de zero;
- as variáveis envolvidas devem ser aleatórias e ser medidas com o mínimo intervalo possível entre
cada ponto. Este coeficiente não se aplica a variáveis em escala nominal ou ordinal ou quando uma
das variáveis é manipulada experimentalmente, pois neste caso, a escolha dos valores experimentais
vai influenciar o valor de r obtido;
- para cada x dado a variável y é normalmente distribuída, ou seja, duas variáveis têm uma distribuição
conjunta normal.
Apesar de existirem várias abordagens para calcular o coeficiente de correlação entre duas variáveis, x e y, nesta
dissertação é utilizado o coeficiente de correlação de Pearson, que segundo Egghe and Leydesdor [2009] é dado
pela Equação (3.1):
𝑟 =
𝑛 ∑ 𝑥𝑖𝑦𝑖 − (∑ 𝑥𝑖𝑛𝑖=1 )(∑ 𝑦𝑖
𝑛𝑖=1 )𝑛
𝑖=1
√𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖
𝑛𝑖=1 )2𝑛
𝑖=1 √𝑛 ∑ 𝑦𝑖2 − (∑ 𝑦𝑖
𝑛𝑖=1 )2𝑛
𝑖=1
(3.1)
21
Interpreta-se então que os limites de r se encontram no intervalo [-1;1] com 1 a significar uma correlação perfeita
e 0 a significar que não existe correlação entre as variáveis (a inexistência de uma relação linear entre x e y não
exclui a possibilidade de existir uma relação não-linear entre elas). Se 𝑟 > 0 então as duas variáveis tendem a
variar no mesmo sentido, em média um aumento da variável x provoca um aumento da variável y. Se 𝑟 < 0 então
as duas variáveis tendem a variar em sentido negativo, apresentando uma relação inversa (Kimura, H. et al., 2009)
Para uma análise estatística dos dados históricos de diversos universos é utilizada a matriz de correlações, que
identifica visualmente as variáveis envolvidas no estudo que se relacionam entre si. A matriz de correlações é,
deste modo, uma matriz quadrada que apresenta as correlações entre todos os pares de variáveis. Na diagonal
principal todos os elementos são iguais a 1, visto que cada variável é totalmente correlacionada com ela mesma.
A matriz de correlação é sempre simétrica com os valores à esquerda da diagonal a serem um espelho dos valores
acima da diagonal (Yeh et al., 2007). Na Tabela 6, pode-se observar um exemplo de uma matriz de correlações.
Nesta tabela, observa-se por exemplo, que o termo “terpro” e o termo “escoarg” estão inversamente relacionadas
e que o termo “terpro” e o termo “aguarg” têm um coeficiente de correlação mais próximo de zero, ou seja, não
têm uma correlação muito forte (Ernesto F. L. Amaral, 2011).
Tabela 6 - Exemplo de uma matriz de correlações, adaptada de Ernesto F. L. Amaral, 2011
terpro aguarg escoarg lixod eletrica
terpro 1,0000
aguarg 0,0021 1,0000
escoarg -0,0192 0,2343 1,0000
lixod 0,1246 0,4393 0,5296 1,0000
eletrica 0,1214 0,2126 0,1253 0,1435 1,0000
3.2 Análise de componentes principais (PCA)
Definição do método de PCA
A análise de componentes principais (PCA) é um dos métodos da estatística multivariada mais utilizado e
reconhecido pela sua capacidade de redução de dados, eliminação de sobreposições e escolha das formas mais
representativas de dados, a partir de combinações lineares das variáveis originais. O objetivo principal da PCA é
encontrar combinações lineares das variáveis iniciais que expliquem o máximo possível da variação existente nos
dados e os permitam descrever, através de um modelo matemático concreto bem definido e, conduz geralmente a
uma única solução. A análise pelo método PCA é utilizada em várias indústrias e com diferentes fins, como por
exemplo, análise sensorial, desenvolvimento de novos produtos e controlo de qualidade, estudos de foro
psicológico, entre outros (Eriksson et al., 2006).
A ideia fundamental desta análise é a redução da dimensionalidade de um conjunto de dados que é composto por
um número considerável de variáveis, perdendo o mínimo de informação possível. Isto é obtido através de técnicas
de redução de dados que examinam as correlações entre as variáveis originais e transformam-nas num menor
conjunto de variáveis, designado por componentes principais (Principal Component - PC). Cada componente
principal é uma combinação linear de todas as variáveis originais. Estas são linearmente independentes entre si e
estimadas com o propósito de reter o máximo de informação, em termos da variância total contida nos dados. O
22
processo de transformação das variáveis originais em componentes principais, também visa eliminar algumas
variáveis originais que possuam informação redundante (Varella, 2008).
Cabe frisar que a PCA é mais apropriada se as variáveis estiverem interrelacionadas, pois só assim é possível
reduzir o número de variáveis a um número menor de componentes principais, sem perda significativa de
informação. Quanto maior for a correlação entre as variáveis maior redução de dados e vice-versa, isto é: se as
variáveis não estão correlacionadas entre si, então cada componente principal explicará a mesma quantidade de
variância, não sendo possível atingir o objetivo de redução de dados; por outro lado, se as variáveis estão
perfeitamente correlacionadas entre si então a primeira componente principal explicará toda a variância dos dados
(Eriksson et al., 2006).
A transformação dos dados originais (matriz X) para um novo sistema de coordenadas pode ser descrito pelas
matrizes: matriz dos scores (T), matriz dos loadings (P) e matriz E que contém o ruído presente nos dados originais,
Figura 13. A matriz dos scores ilustra a estrutura nos dados e a matriz dos loadings ilustra a influência das
diferentes variáveis na estrutura dos dados (Böhm et al., 2013).
Figura 13 - Esquema do princípio da técnica PCA retirado de Böhm et al., 2013
Contribuição e interpretação de cada componente principal
Quando aplicamos a análise de componentes principais com o objetivo de reduzir o número de variáveis em estudo,
esperamos que as primeiras componentes expliquem uma proporção significativa da variância total dos dados.
Desta forma, é esperado que os dados possam ser representados por um pequeno número de componentes
principais sem que haja uma perda significativa de informação. A contribuição de cada componente principal é
expressa em percentagem.
As componentes principais são calculadas por ordem decrescente de importância, ou melhor, a primeira explica o
máximo possível da variância dos dados originais, a segunda explica o máximo possível da variância ainda não
explicada, e assim por diante. A última componente principal será a que menor contribuição dará para a explicação
da variância total dos dados originais. Ou seja, cada combinação linear explica o máximo possível da variância
não explicada e terá de ser ortogonal a qualquer outra combinação já definida. Geralmente, o conjunto de todas as
combinações encontradas constitui uma solução única.
A interpretação de cada componente principal é realizada verificando o grau de influência que cada variável da
matriz X tem sobre cada componente principal. O grau de influência é dado pela correlação entre cada variável de
X e o componente principal que está a ser interpretado. Para comparar a influência de cada uma das variáveis de
X sobre, por exemplo, o primeiro PC, analisa-se o loading de cada variável sobre esse componente (Varella, 2008).
23
Em relação ao número de componentes principais a reter numa análise, este depende da quantidade de informação
que estamos dispostos a perder, o que se traduz na quantidade de variância não explicada que se pode admitir. Não
existe um modelo estatístico que ajude nesta decisão. No entanto, para aplicação em diversas áreas do
conhecimento o número de componentes utilizadas tem sido aquele que acumula 70% ou mais de proporção da
variância total.
Representação gráfica dos componentes principais
A ideia básica da análise de componentes principais é sumarizar dados que contêm muitas variáveis (𝑝) num
conjunto menor de (𝑘) variáveis compostas, derivadas a partir do conjunto original. Esta análise utiliza um
conjunto de dados representado por uma matriz de 𝑛 registos por 𝑝 atributos, que podem estar correlacionados, e
sumariza esse conjunto por eixos não correlacionados (componentes principais) que são uma combinação linear
das 𝑝 variáveis originais. Tal como descrito no ponto acima, as primeiras k componentes contêm a maior
quantidade de variação dos dados.
Geometricamente, os objetos são representados por uma nuvem de n pontos num espaço multidimensional, com
um eixo para cada um dos p atributos. O objetivo da PCA é transformar os eixos desse espaço p-dimensional para
novas posições, eixos principais (PC), em que são ordenados de tal maneira que o PC1 tem a maior variância, o
PC2 tem a próxima maior variância, e assim em diante, até que o último eixo tem a menor variância.
Abaixo, na Figura 14, observa-se um conjunto de dados representados pelos seus dois primeiros componentes
principais, PC1 e PC2. O PC1, primeiro PC, é a linha que melhor descreve a forma da nuvem de pontos que se
observam nestas figuras. O PC1 representa a direção onde existe maior variância nos dados. O segundo PC, PC2,
é orientado de modo a que reflita a segunda maior fonte de variância nos dados, mas de forma a ser ortogonal ao
primeiro PC. Estes dois PCs definem assim um plano num espaço em k-dimensões, possibilitando visualizar a
estrutura dos dados, em observação (Eriksson et al., 2006).
Figura 14 - Representação geométrica dos loadings num modelo de PCA (Eriksson et al., 2006)
Para generalizar para p-dimensões tem que se tomar as primeiras k componentes, pois estas definem um hiperplano
k-dimensional que “melhor se ajusta” à nuvem de pontos. Todavia, não é tão interessante projetar graficamente
mais de dois componentes, uma vez que estar-se-ia a projetar dados para k dimensões, eliminando um dos
principais objetivos do uso das PCA – a redução de dimensão dos dados.
24
Scores Plot e Loadings Plot
Na análise de componentes principais, o agrupamento das amostras define a estrutura dos dados através de gráficos
de scores e loadings, cujos eixos são componentes principais (PCs) nos quais os dados são projetados. Os scores
fornecem a composição dos PCs em relação às amostras, enquanto os loadings fornecem essa mesma composição
em relação às variáveis (Eriksson, 1999).
Como os PCs são ortogonais, é possível examinar (e identificar) as relações entre amostras e variáveis através dos
gráficos dos scores e dos loadings. O estudo conjunto de scores e loadings ainda permite estimar a influência de
cada variável em cada amostra.
Da forma mais simplificada, os gráficos scores e loadings são representados conforme a Figura 15:
É possível deduzir algumas interpretações destas representações, tais como, as variáveis que estão perto têm
elevada correlação; as amostras que estão perto são semelhantes; e variáveis no lado oposto de origem têm
correlação negativa.
A Figura 16 abaixo fornece a interpretação geométrica dos valores loading e score para a observação “1”, num
gráfico a duas dimensões com duas variáveis 𝑥1 e 𝑥2. A direção de maior variabilidade das amostras é indicada
pela recta que representa um componente principal. Os scores são as projecções das amostras na direcção dos
componentes principais e os loadings são os ângulos entre cada componente principal e cada variável (Eriksson,
1999).
(a) (b) Figura 15 - Representação de scores (a) e loadings (b) (Eriksson, 1999)
25
Figura 16 - Interpretação geométrica dos valores loading e score (Eriksson, 1999)
3.3 Modelos de Regressão Linear
Um modelo de regressão representa o relacionamento entre uma variável dependente e uma ou mais variáveis
independentes. Se a variável independente for única a regressão linear é simples, caso existam mais variáveis
independentes (como no presente trabalho) o modelo passa a denominar-se por modelo de regressão linear múltipla
ou modelo de regressão linear multivariada, descritos em seguida (Carla Henriques, 2010/2011).
Este modelo é geralmente utilizado em situações onde uma reta ajustada não descreve bem o comportamento a
estudar, motivo pelo qual se adicionam outras variáveis independentes. Outro dos objetivos da sua aplicação é
reduzir um grande número de variáveis com o mínimo de perda de informação, permitindo encontrar os principais
padrões de similaridade, associação e correlação entre as variáveis independentes (Sassi et al., 2011).
Regressão Linear Múltipla
Esta técnica de regressão linear múltipla é representada por uma equação que descreve a relação entre um conjunto
de variáveis quantitativas independentes 𝑥𝑖 e uma variável dependente também quantitativa 𝑦𝑖 . O objetivo é assim
determinar o conjunto de parâmetros 𝛽𝑘 que relacionam a resposta 𝑦𝑖 , neste caso as exergias úteis ou o GVA, com
as variáveis de regressão 𝑥𝑖. A equação linear que traduz o modelo é a Equação (3.2) (Coelho-Barros et al., 2008):
𝑦𝑖 = 𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + ⋯ + 𝛽𝑘𝑥𝑘𝑖 + 𝜀𝑖, 𝑖 = 1,2, … 𝑁
(3.2)
Nesta expressão 𝑘 representa o número de variáveis quantitativas independentes, 𝑖 o índice da observação, 𝑁 o
número de observações. Os parâmetros 𝛽𝑘 denominam-se coeficientes de regressão e traduzem a dependência da
resposta do sistema face à respectiva variável de regressão 𝑥𝑖 e 𝜀 representa um erro aleatório associado ao valor
observado 𝑦𝑖 . De notar que a designação de “linear” indica que o modelo é linear em relação aos parâmetros 𝛽𝑘 e,
não porque 𝑦𝑖 é uma função linear dos 𝑥𝑖.
26
Em notação matricial tem-se:
O modelo de regressão linear múltipla baseia-se nos seguintes pressupostos:
• Os valores de 𝑥𝑘𝑖 são constantes predeterminadas, sem erro;
• Os erros 𝜀 são mutuamente independentes, têm valor esperado nulo e são normalmente distribuídos.
De forma a poderem ser estimados os coeficientes de regressão 𝛽𝑘 é necessário que o número de observações seja
superior ou igual ao número de coeficientes de regressão que se pretende estimar.
Regressão Linear Multivariada
A regressão linear multivariada é baseada nos mesmos pressupostos que a regressão linear múltipla com as
seguintes diferenças:
é composta por um conjunto de variáveis dependentes quantitativas 𝑦𝑖;
a equação linear que traduz o modelo é a Equação (3.3) (Graybill, 1976):
𝑦𝑖 = 𝛽𝑘𝑥𝑘𝑖 + 𝜀𝑖, 𝑖 = 1,2, … 𝑁
(3.3)
em notação matricial tem-se:
27
4. Modelação com Redes Neuronais
As redes neuronais artificiais fundamentam-se em estudos sobre a estrutura do cérebro humano, na tentativa de
reproduzir a sua forma inteligente de processar informação (Baughman & Liu, 1995). De acordo com o
Investigador Teuvo Kohonen, da Universidade de Helsinki, uma rede neuronal artificial é "uma rede massivamente
paralela de elementos interconectados e as suas organizações hierárquicas que estão preparadas para conjugar
objetos do mundo real, da mesma maneira que um sistema nervoso biológico faz" (Teuvo Kohonen, 2014). Por
outras palavras, as redes neuronais artificiais (RNA) são sistemas adaptativos desenhados com o intuito de simular
a forma como os neurónios humanos estão ligados, sendo geralmente referidas como “redes neuronais”. Estes
sistemas, além de complexos, não-lineares e paralelos tal como é o processamento humano de informação, fazem
lembrar o cérebro de duas formas:
a) O conhecimento é adquirido pela rede através de um processo de aprendizagem;
b) O conhecimento adquirido é armazenado pelas forças de ligação interneuronais.
Uma RNA é composta por várias unidades de processamento: os nós e as conexões que ligam os nós. O
comportamento inteligente de uma RNA provém das interações entre as unidades de processamento da rede. Na
sua maioria as RNA visam solucionar problemas de inteligência artificial, delineando sistemas através de circuitos
(conexões/ ligações) que tal como o cérebro humano, detêm um processo de aprendizagem realizado através do
algoritmo de aprendizagem – função que permite alterar as forças de conexão interneuronais da rede, permitindo
chegar ao objetivo final. Assim, à semelhança do cérebro humano, as RNA detêm a capacidade de aprender e agir
perante as mais adversas situações apresentadas, bem como adquirir informação através da experiência e da
observação. As RNA podem ainda modificar a sua própria tipologia tal qual como os neurónios no cérebro (S.
Haykin, 1999).
4.1 Benefícios das redes neuronais artificiais
O poder de abstração das RNA deve-se à sua estrutura paralela e à capacidade de aprendizagem das mesmas. A
estrutura paralela advém da existência de muitos neurónios ligados numa estrutura de pesos de conexão e com
facilidade de adaptação. A estrutura paralela é desejável uma vez que permite a tolerância à falha, pois se algum
neurónio (ou neurónios) falhar, os efeitos na rede como um todo não serão significativos para o desempenho da
rede, dado que existe outro caminho de ligação entre os neurónios que pode iludir a falha.
Uma das principais características das RNA é a capacidade de aprender através de exemplos e de generalizar, ou
seja reconhecer similaridades em elementos que não foram apresentados antes, possibilitando a produção de
resultado aceitável oriundo de um input, que lhes é novo (S. Haykin, 1999).
As redes neuronais são uma ferramenta eficiente para a classificação de padrões não-lineares, tal como é a maioria
da natureza dos fenómenos do mundo real, apresentando propriedades e capacidades importantes que levam à sua
escolha.
28
Propriedades e capacidades potenciadas pelo uso das RNA (S. Haykin, 1999):
a) Não-linearidade: um neurónio artificial pode ser linear ou não linear. Se existir pelo menos um neurónio
não linear, a rede neuronal poderá ter a capacidade de mapear uma função não-linear. Uma RNA feita de
uma interconexão de neurónios não-lineares, é em si não-linear.
b) Mapeamento de entrada-saída: ilustra o que acontece no método de aprendizagem supervisionada
(explicado em 4.4), em que a rede é treinada repetidamente. Este treino consiste na apresentação de
exemplos à rede, em que cada exemplo corresponde a um sinal de entrada, e detém uma resposta desejada
correspondente. Este treino é replicado até que a diferença entre a resposta desejada e a resposta real dada
pela rede seja mínima. Logo, a rede aprende dos exemplos ao construir um mapeamento de entrada-saída
para o problema considerado. Por isso, a rede neuronal pode funcionar como um gerador de função
genérica.
c) Adaptabilidade: as redes neuronais têm a capacidade interna de adaptarem as suas forças de ligação às
mudanças em seu redor. Mesmo uma rede que esteja habituada a funcionar em determinado ambiente,
consegue facilmente ser treinada e lidar com alterações do mesmo. Além disso, uma RNA pode modificar
as suas ligações interneuronais em tempo real, caso opere num ambiente não-estacionário, ou seja, um
ambiente onde as estatísticas possam mudar com o tempo.
d) Resposta a evidências: em relação à classificação de padrões, uma rede neuronal pode indicar qual padrão
escolher, bem como o nível de confiança nesta escolha. A confiança na tomada de decisão pode ser usada
para rejeitar padrões ambíguos, melhorando o desempenho da classificação da rede.
e) Tolerância a falhas: um estrago num neurónio não causa uma falha na rede toda.
Em termos reais, alguns exemplos da utilização das redes neuronais encontram-se no reconhecimento de
caracteres, como matrículas de carros, e classificação de padrões, como o diagnóstico do cancro da próstata. A
organização científica Kaman de Ciências (Colorado Springs, CO) criou uma rede neuronal que consegue prever
este tipo de cancro. A rede foi treinada para prognosticar resultados baseados em testes de PSA (“Prostate Specific
Antigen”), exibindo a recorrência do cancro após o tratamento (Télvio Orrú, 2003).
4.2 Neurónio artificial
Para o funcionamento da rede neuronal é essencial uma unidade de processamento de informação, denominada
por neurónio. O neurónio artificial é o componente básico das RNAs. Tal como o neurónio biológico, o neurónio
artificial possui um ou mais sinais de entrada e apenas um sinal de saída. Os sinais de entrada (estímulos) devem
chegar até ao neurónio simultaneamente, isto é, todas as informações devem chegar ao núcleo do neurónio artificial
ao mesmo tempo (S. Haykin, 1999).
Um dos atributos de grande importância do neurónio artificial é o vetor com os pesos das entradas. O peso é
representado pela letra w (weight) e representa o grau de importância que determinada entrada possui em relação
àquele determinado neurónio. O valor do peso é alterado em função da intensidade do sinal de entrada, e dessa
forma, o peso muda o seu valor representativo para a rede (processo de aprendizagem). Deduz-se que, quanto mais
estimulada for uma entrada, mais estimulado será o peso correspondente, e quanto mais for estimulado um peso,
mais significante e influente o mesmo será para o resultado do sinal de saída do respetivo neurónio.
29
Matematicamente, os pesos são vistos como um vetor de valores [w1, w2, ..., wn] para um neurónio, ou uma
matriz de pesos, colecção de vectores, para um conjunto de neurónios.
A Figura 17 representa o modelo do neurónio, um diagrama de blocos que constitui a base para gerar as redes
neuronais artificiais, onde se identificam três elementos básicos do mesmo:
a) Um conjunto de elos de ligação, cada um caracterizado por um peso próprio. Especificamente, um 𝑥𝑗
sinal de entrada do elo ligação de 𝑗, conectado ao neurónio 𝑘, é multiplicado pelo peso do elo 𝑤𝑘𝑗 .
Relativamente ao significado do peso 𝑤𝑘𝑗, 𝑘 refere-se ao neurónio em causa e o segundo subscrito refere-
se à extremidade da entrada do elo de ligação.
b) Um somatório para adicionar os sinais de entrada, ponderados pelos respectivos elos de ligação do
neurónio, constituindo uma combinação linear. O neurónio verifica então se o valor resultante da soma
entre os produtos dos sinais de entrada pelos respectivos pesos atingiu ou não um valor pré-determinado,
designado de limiar. Se o valor calculado atingiu o limiar, o mesmo é passado avante através da saída.
Caso contrário, se o valor não atingiu o limiar, o sinal não será transferido. Este processo de verificação
é denominado como função de transferência.
c) Uma função de activação através da qual o neurónio decide o que fazer com o resultado da soma das
entradas (activar ou não), limitando a amplitude do sinal de saída de um neurónio. Caracteristicamente,
o intervalo de amplitude normalizada da saída de um neurónio é de [0,1] ou [-1,1].
O modelo neuronal da Figura 17 também inclui um enviesamento aplicado externamente, denotado por 𝑏𝑘. Este
enviesamento pode aumentar ou diminuir o input líquido da função de activação, dependendo se é positivo ou
negativo, respectivamente (S. Haykin, 1999).
Em termos matemáticos, as Equações (4.1) e (4.2) (S. Haykin, 1999) abaixo descrevem o neurónio 𝑘:
𝑣𝑘 = ∑ 𝑤𝑘𝑗𝑥𝑗
𝑚
𝑗=0
(4.1)
𝑦𝑘 = 𝜑(𝑣𝑘)
(4.2)
30
Figura 17 - Modelo do neurónio (S. Haykin, 1999)
As funções de activação podem ter a forma de função limiar (threshold function), linear e sigmóide (Figura 18).
Figura 18 - (a) Função limiar; (b) Função linear; (c) Função sigmóide com diferentes declives (S. Haykin, 1999)
31
4.3 Topologia de redes
Acima foram apresentadas as vantagens do uso das redes neuronais artificias, bem como as características do
neurónio, definido como a unidade básica do processamento de uma RNA. Contudo, interessa ainda apresentar
como os neurónios artificiais podem ser agrupados, de acordo com as conexões entre eles e a disseminação de
dados.
Numa conexão de neurónios estes estão organizados em forma de camadas, onde existe sempre uma entrada e uma
saída. Usualmente, as camadas são classificadas em três grupos: camadas de entrada onde os padrões são
apresentados à rede; camadas intermédias ou escondidas onde é feita a maior parte do processamento através das
conexões ponderadas; camada de saída onde o resultado final é concluído e apresentado.
Uma rede neuronal pode ter uma ou várias camadas. As redes que possuem uma única camada são as redes que
possuem apenas uma camada entre uma entrada e uma saída da rede. Em contraste, as redes de multicamadas
possuem mais de uma camada, entre as existentes camadas de entrada e saída. Todavia no meio destas camadas
podem estar uma ou mais camadas escondidas, Figura 19. Assim, existe uma relação direta entre o número de
camadas e o número de neurónios em cada camada e a complexidade da rede (S. Haykin, 1999).
Figura 19 - Rede de única camada (esquerda) e rede de duas camadas (direita) (S. Haykin, 1999)
A classificação das redes neuronais (Figura 20) de acordo com a forma como os neurónios estão ligados entre as
diversas camadas pode ser encontrada em (B. Krose et al., 1996):
Rede feedforward: rede onde os dados circulam numa única direção, partindo da camada de entrada para a camada
de saída. Estas redes são um mapeamento estático entre as entradas e saídas, que permitem refletir uma relação
linear simples ou uma relação não-linear. Uma aplicação típica para as redes neuronais artificiais feedforward é o
desenvolvimento de modelos não-lineares usados para o reconhecimento e classificação de padrões.
Rede feedback (cíclica, recorrente ou realimentada): utilizam as suas saídas para alimentar as próprias entradas,
em que os níveis de ativação da rede formam um sistema dinâmico. Uma vez que esta rede cíclica pode admitir
memória de curto prazo, torna-se mais interessante como modelo de cérebro.
32
Figura 20 - Arquiteturas de RNAs (S. Haykin, 1999)
4.4 Aprendizagem
Como referido acima, o comportamento inteligente das redes neuronais resulta das interações entre as suas
unidades de processamento. Estas possuem a capacidade de aprender por exemplos e são capazes de extrair regras
básicas a partir de dados reais, diferindo da programação computacional. A aprendizagem ocorre quando é atingida
uma solução generalizada para uma classe de problemas, isto é, a rede procura extrair informações relevantes de
padrões de informação, moldando uma representação própria. Logo, um conjunto de procedimentos definidos para
ajustar os parâmetros de uma RNA, com a finalidade da mesma aprender uma determinada função, é chamado de
algoritmo de aprendizagem (B. Krose et al., 1996).
O processo de aprendizagem pode ser categorizado em dois métodos distintos (B. Krose et al., 1996):
Aprendizagem supervisionada: a rede é treinada apresentando-lhe sinais de entrada e de saída. O treino está
completo quando a rede neuronal alcança uma determinada precisão na estimação das saídas para uma dada
sequência de entradas. Em caso de erro, a rede tenta corrigi-lo até que a mesma forneça uma saída igual à saída
desejada. Neste método de aprendizagem o fluxo corrente de erros de todos os elementos em processamento é
minimizado, pois os pesos das conexões são ajustados continuamente até que a rede alcance uma certa precisão.
Esses ajustes podem ser feitos através do algoritmo de retropropagação (backpropagation), que será explicado
adiante.
Aprendizagem não supervisionada: a rede aprende sem a necessidade de treino prévio, por isso, a saída desejada
é obtida através de entradas repetitivas até que a RNA retenha o conhecimento. Neste modelo, a rede não suporta
influências externas para ajustar o peso de cada variável, possuindo informações próprias de como se organizar
internamente. É então suposto que exista a redundância de dados, para que a rede encontre padrões ou
características dos dados. Um sinónimo para aprendizagem não-supervisionada é aglomeração (clustering).
33
4.5 Redes Perceptron
Em 1958, Rosenblatt estudou as redes neuronais artificiais com função de ativação, às quais chamou de
Perceptrons. A rede Perceptron foi composta por uma camada de entrada, onde cada elemento pertencente a esta
camada fazia a distribuição do sinal recebido por todas as unidades de processamento. Esta é constituída por
unidades binárias, que aprendem a classificar padrões através da aprendizagem supervisionada (Zhang, 1998).
Os neurónios eram essencialmente compostos por unidades sigma e de funções de transferência, sendo que estas
eram responsáveis pela soma ponderada dos sinais oriundos das conexões com os dados de entrada. À camada
de entrada foi adicionado o enviesamento, que possui um sinal de valor sempre um. A conexão entre o
enviesamento e a unidade sigma tem peso 𝑤0, que por sua vez é ajustado da mesma maneira com que os demais
pesos o são. O nível de ativação de uma rede Perceptron é dado pela soma ponderada dos pesos com os valores
de entrada, ∑ 𝑥𝑖 . 𝑤𝑖 (Zhang, 1998).
Estas redes usam uma função de transferência do tipo hard-limiter (limite ríspido), onde a ativação do limiar
resulta num valor de saída 1, ou, –1 caso contrário. Dados os valores de entrada 𝑥𝑖, os pesos 𝑤𝑖 , e um limiar t,
o perceptron calcula os valores de saída da seguinte maneira:
{1 𝑠𝑒 ∑ 𝑥𝑖𝑤𝑖 ≥ 𝑡
−1 𝑠𝑒 ∑ 𝑥𝑖𝑤𝑖 < 𝑡
As redes Perceptron foram desenvolvidas utilizando o algoritmo de aprendizagem em que os pesos da rede são
ajustados para minimizar o erro num treino (treino pertence à aprendizagem supervisionada, como mencionado
anteriormente) (Zhang, 1998).
Figura 21 - Rede Perceptron (Zhang, 1998)
pesos
34
Tal como as redes neuronais artificiais, existe uma rede Perceptron (Figura 21) de única camada, em que as
unidades de saída são independentes, o que significa que podem ser estudadas separadamente e que cada peso
apenas influencia uma única saída. Contudo, a eliminação de erros através do algoritmo de aprendizagem apenas
funciona num plano linearmente separável. Sendo assim, os perceptrons não são adequados para resolver uma
certa classe de problemas, denominados por não linearmente separáveis.
Os problemas não linearmente separáveis podem ser resolvidos através de redes com uma ou mais camadas
intermédias. A transformação de camada única para uma rede Perceptron de multicamadas (MLP – Multi-layer
Perceptron) dá-se com a inserção de camadas ocultas e/ou do aumento de neurónios. Teoricamente, redes com
mais de uma camada podem implementar qualquer função (até um limite de precisão), seja ela linearmente
separável ou não.
Figura 22 - Rede Perceptron com várias camadas intermédias (Zhang, 1998)
A MLP (Figura 22) apenas oferece vantagem sobre a rede Perceptron de única camada se existir uma função de
ativação não linear entre as camadas. A rede Perceptron de múltiplas camadas apresenta um poder computacional
muito superior ao das redes sem camadas intermédias.
O processamento atribuído a cada neurónio da MLP é resultante da combinação do processamento realizado pelos
neurónios da camada anterior, que por sua vez estão atribuídos a um nó da próxima camada. Logo, cada neurónio
que compõe uma rede Multilayer Perceptron contribui para a deteção de características dos dados apresentados.
O número de camadas a ser utilizado influência de forma crucial a aprendizagem da rede. O uso de um grande
número de camadas intermédias não é recomendado, visto que o erro ocorrido numa camada é propagado a
camadas anteriores da rede. Porém, são necessárias no mínimo duas camadas intermédias, com um número
suficiente de unidades por camada, para se produzir quaisquer mapeamentos.
A determinação do número de neurónios pertencentes às camadas intermédias é definida de forma empírica, e
normalmente depende da distribuição dos padrões de treino e validação da rede. Um uso excessivo de neurónios
35
levará a rede a moldar-se ao conjunto de treino, ao invés de extrair as suas características gerais (generalizar)
(Zhang, 1998).
4.6 Algoritmo backpropagation
O algoritmo de aprendizagem mais utilizado no treino das redes neuronais multicamadas é o backpropagation.
O algoritmo backpropagation consiste numa propagação positiva do sinal funcional e numa retropropagação do
erro. Quando se dá a propagação positiva do sinal funcional, os pesos da rede são mantidos fixos e o seu efeito
propaga-se através da rede, camada por camada, até produzir o conjunto de saída (resposta real da rede). Quando
se dá a retropropagação do erro, os pesos da rede são ajustados de acordo com uma regra de correção de erro e o
sinal é propagado para trás através da rede. (D. J. C. MacKay, 1991).
Durante o treino com o algoritmo backpropagation, a rede opera numa sequência de dois passos:
1. Um padrão é apresentado à camada de entrada da rede. A atividade resultante flui através da rede, camada
por camada, até que a resposta seja produzida pela camada de saída;
2. A saída obtida é comparada com a saída desejada. O algoritmo consiste em calcular o erro na saída da
rede e retropropagá-lo pela rede, modificando os pesos para minimizar o erro da próxima saída. Sendo
que o sinal de erro é propagado em sentido oposto ao de propagação do sinal funcional, dá-se o nome de
retropropagação do erro.
É importante assinalar que cada padrão de entrada é apresentado à rede em turnos, ajustando aos poucos os pesos
da rede, antes de passar para o próximo padrão de entrada. Se a rede corrigir perfeitamente os erros antes de lhe
ser apresentada o próximo padrão de entrada, a rede neuronal perderá a capacidade de generalização a fim de
encontrar uma solução que satisfaça todo o conjunto de dados de entrada (D. J. C. MacKay, 1991).
O algoritmo backpropagation também é chamado de regra delta generalizada, pois é baseado na regra delta
apresentada por Widrow e Hoff.
36
4.7 Redes Neuronais Dinâmicas
As redes neuronais podem ser classificadas como estáticas ou dinâmicas. As redes neuronais estáticas não têm
elementos de feedback, ou seja, o output é calculado diretamente a partir do input. No caso das redes neuronais
dinâmicas o output depende ainda de inputs, outputs ou estados anteriores da rede. Estas redes caracterizam-se
pela utilização de variáveis de entrada sequenciais, podendo também ser definido um certo atraso, tanto nas
variáveis de entrada como nas de saída (Demuth, H. et al. 2015), no caso da modelação de dados representativos
de um sistema dinâmico.
Figura 23 - Rede neuronal com realimentação do output como novo input (Demuth, H. et al., 2015)
Na rede neuronal da Figura 23, a função de ativação da camada exterior é linear, garantindo que o output não é
limitado, enquanto a camada interior é caracterizada por uma função não linear (sigmoide), permitindo que a rede
identifique as relações existentes entre as variáveis de entrada e de saída. A realimentação é feita da última camada
para a primeira, apesar de também haver redes em que é feita de camadas intermédias para a primeira camada.
O algoritmo de treino de redes neuronais pode ser de dois tipos diferentes: o incremental e o batch. No treino
incremental os pesos da rede são atualizados cada vez que o novo input é introduzido na rede; no treino batch os
pesos são atualizados apenas depois de todos os inputs terem sido introduzidos (Demuth, H. et al., 2015).
As redes neuronais dinâmicas são geralmente mais robustas que as estáticas, no entanto requerem mais trabalho
no que diz respeito à fase de treino. Como as redes neuronais dinâmicas têm memória, podem ser treinadas de
forma a aprender padrões sequenciais ou que variam no tempo. O treino de redes neuronais é de extrema
importância, na medida em que garante a eficácia e coerência da previsão, independentemente da diversidade dos
inputs, através da criação de uma cadeia de pesos e de uma malha de relações que vão sendo ajustadas até se atingir
o resultado desejado. Os dados utilizados para o treino da rede devem representar uma amostra credível no caso
estudado para que o desempenho da rede seja otimizado (Demuth, H. et al., 2015).
No processo do treino tem que se ter em atenção o overtraining, ou seja, impedir que se atinja um número de
iterações demasiado elevado que “vicie” a rede nos dados de treino, afetando a sua capacidade de generalização.
37
Figura 24 - Definição do critério de paragem
O overtraining (Figura 24) ocorre quando o modelo ajusta os pesos em demasia ao conjunto de dados de treino,
perdendo capacidade de generalização. Nestas situações verifica-se que a linha que descreve o erro de
aprendizagem dos dados de teste aumenta enquanto o erro de aprendizagem dos dados de treino vai diminuindo.
Para evitar tal situação os dados fornecidos devem ser o mais variados possível e contemplar um vasto domínio
para que a rede não perca representatividade.
4.8 Uso de Redes Neuronais para previsão do consumo de energia
Entre os vários modelos de RNA, o MLP (Multi Layer Perceptron) e o FF-BP-ANN (feed forward multilayer
perceptron ANN model with back-propagation error algorithm) são modelos que foram utilizados para cálculo
das estimativas de consumo energético na Grécia (MLP) (L. Ekonomou, 2009) e na Coreia do Sul (FF-BP-ANN)
(Zong Woo Geem, William E. Roper, 2009).
Caso de estudo: Grécia
No caso da Grécia, o modelo MLP utilizado tem a estrutura da Figura 25:
Figura 25 – Rede MLP feedforward (L. Ekonomou, 2009)
38
As vantagens de utilização deste modelo são as seguintes: a velocidade de cálculo que permite analisar grandes
quantidades de inputs; generalização automática de conhecimento permitindo o reconhecimento de conjuntos de
dados; minimização do erro quadrático médio agregado em todos os conjuntos de dados de treino; aprendizagem
supervisionada e a redução do “ruído” das variáveis.
No período de 1992 a 2004, as variáveis consideradas para input e output foram as apresentadas na Tabela 7:
Tabela 7 - Rede MLP - variáveis de input e output (L. Ekonomou, 2009)
Foram selecionadas apenas estas variáveis de input, podendo no entanto ter-se selecionado outras mais, como o
preço da eletricidade, o número de instalações de ar-condicionado, que afetam o consumo de energia, mas tais
dados não estavam disponíveis na altura do estudo.
A ferramenta utilizada para realizar este estudo foi o MATLAB. Os dados de input de treze anos (1992 a 2004)
foram usados para treino e validação do modelo.
O resultado obtido está representado na Tabela 8 abaixo:
Tabela 8 - Resultados do modelo MPL (L. Ekonomou, 2009)
O modelo de RNA foi testado, tendo como objetivo estabelecer as necessidades energéticas da Grécia para os anos
de 2005 a 2008, 2010, 2012 e 2015, e comparou-se o resultado com os dados reais registados para os períodos
referidos e com os resultados obtidos, respetivamente, pelo método de regressão linear e pelo método de support
vector (Vapnik) realizado através do software C++. Usando este modelo os dados são mapeados por computação
não linear numa estrutura dimensional maior procedendo-se seguidamente à regressão nesta estrutura.
39
Os diferentes resultados estão representados no gráfico da Figura 26:
Figura 26 - Comparação do consumo previsto de energia para a Grécia através de RNA, modelo de regressão e modelo de
support vector com o real (L. Ekonomou, 2009)
O erro percentual obtido entre o método RNA e os dados reais é de apenas 2%, significando que o modelo da rede
utilizado é bastante fiável e credível.
Este método pode ser bastante útil no cálculo das previsões de consumo energético, ou seja das necessidades
energéticas daí decorrentes, pois as mesmas têm significativo impacto nas verbas orçamentais para investimento
em estruturas e fontes energéticas, no impacto ambiental, garantindo ao mesmo tempo segurança no contínuo
abastecimento do país.
Caso de estudo: Coreia do Sul
Devido às indústrias da Coreia do Sul dependerem fortemente de fontes de energia importadas (de acordo com a
Energy Information Administration (2007), o país é o quinto maior importador de petróleo e o segundo maior
importador de gás natural liquefeito do mundo), a estimativa precisa da sua procura de energia é fundamental para
a formulação de políticas de energia.
Neste estudo de previsões energéticas foram utilizados três modelos: o modelo de regressão linear múltipla, o
modelo exponencial modificado e o modelo de FF-BP-ANN. A FF-BP-ANN (feed forward multilayer perceptron
ANN model with back-propagation error algorithm) é o modelo mais utilizado para previsão (Gibbs et al., 2006).
É constituída normalmente por três camadas, a de input, a escondida (hidden) e a de output.
40
O modelo pode ser representado pelo esquema da Figura 27:
Figura 27 - Esquema do modelo de feedforward multilayer perceptron (Zong Woo Geem, William E. Roper, 2009)
As variáveis de input utilizadas nos diferentes modelos, obtidas de diversas fontes nacionais e internacionais (Zong
Woo Geem, William E. Roper, 2009), foram as seguintes: produto interno bruto (GPD), população, importações
e exportações. A variável de output, ou seja, a que se pretende prever é a procura de energia (Figura 28 e Tabela
9).
Figura 28 - Procura de energia e correspondente indicador da Coreia do Sul (Zong Woo Geem, William E. Roper, 2009)
41
Tabela 9 - Procura de energia e indicador de dados da Coreia do Sul (Zong Woo Geem, William E. Roper, 2009)
Para validação dos modelos os dados foram divididos em dois grupos: dados para treino do modelo (1980 a 2000)
e dados para verificação do modelo (2001 a 2007). De seguida observam-se os diferentes resultados obtidos nas
Figura 29Figura 30 Figura 31:
Figura 29 - Estimação da procura de energia por meio de regressão linear múltipla (Zong Woo Geem, William E. Roper,
2009)
42
Figura 30 - Estimação da procura de energia utilizando modelo exponencial modificado (Zong Woo Geem, William E.
Roper, 2009)
Figura 31 - Estimação da procura de energia utilizando o modelo FF-BP-ANN (Zong Woo Geem, William E. Roper, 2009)
e podem ser resumidos na seguinte Tabela 10:
Tabela 10 - Comparação dos resultados dos vários modelos utilizados para previsão da procura de energia (Zong Woo Geem,
William E. Roper, 2009)
Em conclusão, o uso do modelo FF-BP-ANN como ferramenta de cálculo das necessidades energéticas da Coreia
do Sul mostra-se bastante credível e fiável, Figura 32, conduzindo a estimativas de necessidades mais rigorosas
do que os modelos de regressão linear múltipla ou de modificação exponencial.
43
Figura 32 - Comparação entre os três modelos de previsão da procura de energia (Zong Woo Geem, William E. Roper, 2009)
44
5. Dados e Metodologia
Este capítulo descreve o método utilizado para resolver o problema apresentado no início da dissertação. Em
primeiro lugar, as aproximações e estudos efetuados antes de desenvolver o programa computacional e a descrição
da construção do programa automatizado para o cálculo de todos os valores requeridos. A amostra de dados usados
na construção do modelo de previsão tem a duração de quarenta anos, compreendidos entre 1960 e 1999, com
período de amostragem de um ano. Os anos de 2000 e 2009 não foram usados na construção do modelo preditivo.
Estes dez anos só foram usados, no final, como conjunto de validação dos resultados, para fazer as respetivas
previsões e aferir o erro de previsão do modelo.
5.1 Dados disponibilizados
Para a realização deste trabalho foram disponibilizados dados de fontes distintas. Os relativos ao GVA entre os
anos de 1960 e 1995 foram retirados de um documento do Banco de Portugal (Pinheiro, 1997) e as séries do
Instituto Nacional de Estatística (INE) completam para o período de 1995 a 2009 (INE, 2015). Para os dados de
exergia útil recorreu-se a um artigo de Serrenho et al. (2015). Após a análise dos inúmeros dados existentes foi
elaborado um ficheiro Excel para organização dos mesmos, de modo a facilitar a sua introdução na ferramenta
computacional desenvolvida em MATLAB.
Os dados disponibilizados são então:
Heat (TJ) (Serrenho et al.,2015): processo de calor, onde o HTH e o MTH são principalmente usados na indústria
(exemplo: vidro) e o LTH é usado em todos os sectores, mas principalmente no sector de serviços e residencial
para aquecimento de espaços.
Hight Temperature Heat: 500ºC;
Medium Temperature Heat: 150ºC;
Low Temperature Heat: 50-120ºC.
Mechanical Drive (TJ) (Serrenho et al.,2015): sector dos transportes e indústria estacionária: trabalho dos motores
a gasolina e a diesel, locomotivas a vapor, locomotivas diesel-elétricas, motores de aviação, motores de barcos e
motores elétricos.
Other electric uses (Serrenho et al.,2015): sector residencial e serviços: comunicação, eletrónica, dispositivos
elétricos e indústria eletroquímica.
Light (TJ) (Serrenho et al.,2015): refere-se ao uso de eletricidade para iluminação em todos os sectores.
Other electric uses e Light foram agrupadas tornando-se uma única variável denominada Ele.
Gross Value Added (GVA – Valor acrescentado bruto, Mrd EURO_PTE) (Pinheiro, 1997 e INE, 2015): é o
resultado final da atividade produtiva no decurso de um período determinado. Resulta da diferença entre o valor
da produção e o valor do consumo intermédio, originando excedentes.
45
Na Tabela 11 são apresentados os dados usados neste trabalho:
Tabela 11 - Dados disponibilizados
Ano High Temp.
Heat (TJ)
Medium
Temp. Heat
(TJ)
Low Temp.
Heat (TJ)
Mechanical
Drive (TJ)
OE + L
(TJ) = Ele
GVA (Mrd
EURO-
PTE)
1960 4 516,05 3 830,60 10 293,46 7 779,00 526,85 26,50
1961 5 662,02 4 178,19 10 698,33 8 338,29 591,46 27,23
1962 5 106,93 4 048,10 10 695,75 9 290,31 668,78 30,16
1963 6 442,24 4 873,18 10 988,27 9 759,49 736,01 31,21
1964 7 116,24 4 960,94 11 541,09 10 189,45 832,10 32,80
1965 7 759,19 5 063,34 12 000,14 10 665,91 888,66 36,03
1966 7 738,55 5 193,26 12 083,56 11 808,95 987,42 37,55
1967 8 398,01 5 484,79 12 676,48 12 507,43 1 061,89 39,03
1968 8 314,94 5 155,72 12 980,80 13 053,17 1 148,62 40,94
1969 9 413,02 6 273,27 13 331,70 13 965,56 1 277,09 41,76
1970 8 420,63 6 594,78 16 086,56 16 445,97 1 455,94 45,12
1971 9 216,30 7 581,00 16 384,20 17 920,77 1 606,57 50,20
1972 9 458,13 7 810,85 16 993,57 19 392,29 1 768,30 55,45
1973 10 733,89 8 292,41 17 508,03 21 595,45 1 929,81 57,93
1974 11 066,36 9 096,88 18 290,69 21 893,76 2 155,57 60,09
1975 11 854,05 8 378,17 18 217,39 23 324,90 2 269,67 57,15
1976 12 916,69 9 037,90 18 837,72 23 918,48 2 462,01 58,57
1977 14 104,59 9 019,33 19 781,34 26 113,36 2 728,54 62,88
1978 15 103,06 10 064,29 20 061,98 28 022,82 2 969,87 67.19
1979 15 798,61 10 699,94 20 603,92 30 637,99 3 275,97 72,14
1980 16 427,40 10 805,83 20 159,38 33 052,86 3 515,85 75,50
1981 15 777,77 12 143,72 19 906,06 33 652,21 3 530,26 78,99
1982 16 708,60 12 028,60 20 604,51 35 201,56 3 692,37 78,01
1983 15 746,67 12 092,68 21 046,11 36 862,83 3 809,53 78,03
1984 16 098,03 10 509,63 21 555,40 36 586,04 3 885,58 79,58
1985 17 721,49 9 189,42 22 176,28 36 491,47 4 044,35 78,15
1986 17 414,43 8 244,62 22 886,73 38 730,74 4 202,33 78,24
1987 18 253,47 7 520,86 24 096,38 41 136,85 4 297,58 84,28
1988 20 482,54 8 669,60 24 600,78 43 939,72 4 549,66 87,96
1989 21 589,87 10 346,03 22 229,91 46 914,95 4 788,04 93,95
1990 21 263,93 10 056,16 27 411,41 50 468,13 4 999,29 100,59
1991 21 740,89 9 460,84 27 876,79 53 385,27 5 154,19 104,10
1992 21 796,67 10 337,78 27 671,11 56 121,57 5 272,64 107,35
1993 20 375,28 10 680,93 28 341,53 56 671,51 5 223,55 106,64
1994 22 208,07 13 968,34 29 278,07 58 957,16 5 303,56 108,57
1995 21 533,56 13 521,71 29 488,26 62 518,69 5 657,81 111,82
1996 22 202,03 13 129,93 33 296,69 65 866,77 5 836,94 117,78
1997 21 735,39 14 754,99 33 889,47 68 768,85 6 085,63 123,01
1998 24 907,68 15 719,54 34 183,22 74 247,03 6 357,36 128,31
1999 25 225,24 18 623,92 34 748,36 78 839,05 6 638,53 133,20
2000 26 892,05 17 730,83 35 509,20 84 784,05 6 834,36 138,29
2001 24 250,55 19 935,89 36 277,41 85 767,79 6 969,26 141,22
2002 24 961,79 19 788,25 36 798,97 89 014,66 7 144,45 141,59
2003 21 313,84 19 252,77 36 743,07 91 266,01 7 208,15 139,60
2004 20 152,18 18 437,15 35 845,11 94 854,05 7 348,57 142,91
2005 19 437,84 20 672,82 36 577,77 95 093,60 7 436,29 142,88
2006 19 188,04 14 831,77 36 078,02 96 069,55 7 530,56 144,22
2007 22 102,75 19 663,50 36 785,00 98 904,95 7 509,22 148,02
2008 18 909,48 17 454,06 35 731,74 98 040,51 7 263,00 147,07
2009 16 104,59 18 682,44 35 150,08 96 761,80 7 522,43 144,19
46
Na Figura 33 Figura 34 podemos observar a evolução das várias variáveis.
Figura 33 - Gráfico representativo da evolução das variáveis
Figura 34 - Gráfico representativo da evolução do GVA
-
20 000,00
40 000,00
60 000,00
80 000,00
100 000,00
120 000,00
Categorias Trabalho Útil (TJ)
High Temp. Heat (TJ) Medium Temp. Heat (TJ) Low Temp. Heat (TJ)
Mechanical Drive (TJ) Other Electric Uses (TJ) Light (TJ)
-
20,00
40,00
60,00
80,00
100,00
120,00
140,00
160,00
196
0
196
2
196
4
196
6
196
8
197
0
197
2
197
4
197
6
197
8
198
0
198
2
198
4
198
6
198
8
199
0
199
2
199
4
199
6
199
8
200
0
200
2
200
4
200
6
200
8
GVA (Mrd EURO-PTE)
47
5.2 Metodologia
Este estudo engloba a construção de mapa de correlações, boxplots, análise de componentes principais, regressão
linear múltipla e multivariada e a construção da rede neuronal mais adequada ao problema em estudo, de acordo
com as etapas indicadas na Figura 35. A análise das regressões foi apenas utilizada para método de comparação
com os resultados da rede neuronal.
Figura 35 - Diagrama das etapas que compuseram o tratamento de dados e a construção dos modelos de previsão
48
Análise prévia dos dados
Os métodos foram implementados através do software MATLAB. Com o objetivo de analisar a distribuição
empírica dos dados verificou-se, através dos boxplots, a existência de outliers e, caso necessário, recorrer-se-ia à
eliminação destes.
De modo a compreender melhor as relações entre cada uma das variáveis, construiu-se um mapa de correlações
com todas as variáveis. O coeficiente utilizado foi o coeficiente de correlação de Pearson, Equação (3.1), o qual é
obtido dividindo a covariância de duas variáveis pelo produto dos seus desvios padrão.
Seguidamente procedeu-se à análise PCA onde se analisa o número de componentes principais a utilizar na
construção do modelo, o score plot e o loading plot. Com a análise PCA obtém-se uma matriz de correlações que
permitirá selecionar as variáveis que mais contribuem para a descrição de cada uma das componentes. A
informação obtida desta análise leva-nos a selecionar as variáveis mais relacionadas com as variáveis que
queremos prever.
Por último, foram efetuadas como símbolo de comparação com os resultados obtidos através da rede, ambas as
regressões lineares (múltipla e multivariada) para cada uma das variáveis, com o objetivo de determinar qual o
peso que cada variável tem na definição das restantes variáveis. Para cada variável obteve-se uma equação do tipo
da Equação (3.2) e do tipo da Equação (3.3), em que 𝑥𝑖 representa as exergias úteis (HTH, MTH, LTH, MD, Ele)
e/ou o GVA dependendo da variável que estiver a ser calculada.
Modelação com Redes Neuronais Artificiais
Treino
Para as redes neuronais dinâmicas foi utilizado o treino em batch, com o algoritmo de otimização Levenberg-
Marquardt e uma aprendizagem supervisionada, uma vez que se dispunha de dados de cinquenta anos
consecutivos. O desempenho da rede é avaliado com base na medida do erro quadrático médio (MSE), que resulta
da diferença entre o output real e o calculado pela RNA de acordo com a Equação (5.1).
(5.1)
Para a seleção dos grupos de treino, teste e validação foram utilizados os primeiros quarenta anos dos dados
disponibilizados (de 1960 a 1999) tendo sido pré-definida uma divisão de 70% para o subconjunto de treino (1962-
1965, 1967, 1968, 1971, 1974-1977, 1979-1981, 1983-1987, 1990, 1992, 1994-1998) e de 15% para cada um dos
restantes subconjuntos – teste (1966, 1969, 1970, 1972, 1989, 1991) e validação (1973, 1978, 1982, 1988, 1993,
1999).
Para se proceder ao treino da rede apenas se usaram os dados relativos aos primeiros quarenta anos registados
(1960 a 1999).
49
1-step-ahead-prediction
onde, 𝑈 representa os valores reais da tabela de dados fornecida (Tabela 11) e �̂� os valores estimados pela RNA.
No treino foi utilizada a configuração da Figura 36, em que o objetivo foi comparar os valores estimados com os
valores reais. Numa primeira análise foi selecionada a rede neuronal que melhor reproduz os dados para cada uma
das exergias. Cada variável ou agrupamento de variáveis foi tido em conta na construção da rede final para a
previsão de todas as exergias simultaneamente.
Figura 36 – 1-step-ahead-prediction
Simulação
No sentido de encontrar uma simulação da rede que melhor se ajusta aos dados e que produza as melhores
previsões, procedeu-se ao uso de dois tipos de modelos de previsão:
1-step-ahead-prediction
2-step-ahead-prediction
Além disso, considerou-se que apenas se conheciam quarenta anos dos cinquenta disponíveis (período de 1960-
1999). Esta assunção obrigou à utilização de um terceiro tipo de rede, a chamada closed-loop, em que os últimos
dez anos são realimentados na rede.
2-step-ahead-prediction
A estrutura de um modelo de previsão 2-step-ahead-prediction é descrita na Figura 37 seguinte,
Figura 37 - 2-step-ahead-prediction
50
Para modelos com step-ahead superiores é frequente não se obter bons resultados (Parlos et al., 2000). Assim,
procurou-se proceder à análise deste tipo de redes antes de testar modelos de previsão de ordens superiores.
Neste caso é primeiramente estimado o �̂�𝑢(𝑘 + 1) e reintroduzido na rede, seguindo-se a estimativa do �̂�𝑢(𝑘 + 2)
que é posteriormente comparado com o 𝐸𝑢(𝑘 + 2) real, e assim sucessivamente para o intervalo de anos testado.
Closed-loop
Durante a fase de aprendizagem não foram utilizados os registos da evolução dos dados correspondentes aos
últimos dez anos (2000 a 2009). Estes foram usados para testar a capacidade da RNA de previsão destes dados.
Assim, utilizou-se a simulação em closed-loop apresentada na Figura 38.
Figura 38 - Rede neuronal dinâmica em closed loop
Rede neuronal usada
Após terem sido atingidos resultados satisfatórios da previsão para os anos de 2000 a 2009, avaliados por
observação dos gráficos gerados pelo MATLAB e pela evolução do erro quadrático médio (MSE), a rede neuronal
pretendida foi obtida.
No presente trabalho a rede neuronal dinâmica utilizada foi do tipo não-linear auto-regressiva com entrada exógena
(NARX), definida pela Equação (5.2),
𝑦(𝑡) = 𝑓(𝑦(𝑡 − 1), 𝑦(𝑡 − 2), … , 𝑦(𝑡 − 𝑛𝑦), 𝑢(𝑡), 𝑢(𝑡 − 1), … , 𝑢(𝑡 − 𝑛𝑢))
(5.2)
onde o próximo valor do output 𝑦(𝑡) é calculado por regressão dos valores anteriores de output e de uma variável
de entrada independente (exógena), 𝑢(𝑡). Estas são caracterizadas por ligações de feedback que englobam várias
camadas da rede.
Após a construção de um código que permitisse de forma sistemática treinar redes com diferentes números de
layers e diferentes números de anos de atraso foram treinadas quarenta redes em cada uma das configurações (num
total de 640 treinos) apresentadas no sentido de procurar a rede que melhor se ajustava aos dados. Esta procura
sistemática da melhor rede é necessária, visto que, devido ao facto da atribuição dos valores dos pesos da rede ser
aleatória, não é garantida à priori a obtenção da rede que melhor aproxima os dados.
51
Seguidamente, procurou-se identificar a rede que apresentava o melhor comportamento na modelação dinâmica
do problema. Para isso identificou-se a rede com menor MSE na aproximação dos dados. Não obstante, a análise
é acompanhada de uma leitura do gráfico de desempenho, que mostra o valor de MSE versus o número de iterações
(Figura 39), podendo analisar-se o desempenho da validação, do treino e do teste. Esta análise deve ser feita, pois
caso a curva de teste aumente significativamente antes da curva de validação aumentar, então é possível que alguns
sobreajustes (overtraining) possam ter ocorrido e é aí considerado o critério de paragem.
Figura 39 - Gráfico de desempenho, obtido através da ferramenta Neural Network Toolbox (Demuth, H. et al., 2015)
Por outro lado é também possível avaliar a qualidade da rede através dos gráficos de regressão, ao analisar a relação
entre os outputs e os valores reais (Figura 40).
52
Figura 40 - Gráfico com as várias regressões (treino, validação e teste), obtido através da ferramenta Neural Network Toolbox
(Demuth, H. et al., 2015)
Os três gráficos representam os dados de treino, validação e teste. A linha a tracejado representa em cada parcela
o resultado ideal: outputs = alvos. A linha sólida representa a melhor linha de regressão de ajuste linear entre os
resultados e os valores alvo. O valor de R é uma indicação da relação entre os outputs e os alvos. Se R = 1, isso
indica que há uma relação linear exata entre os outputs e os valores alvo. Se R é próximo de zero, então não há
uma relação linear entre os dados (Demuth, H. et al. 2015).
Por último, analisa-se os resíduos da variável prevista em relação aos valores experimentais.
53
6. Resultados e Discussão
Este capítulo apresenta os principais resultados da dissertação. Inicialmente faz-se uma análise dos dados para se
identificar os outliers e assim separar os dados dispares dos restantes dados. Seguidamente procede-se à análise
de correlações dos dados. Dessa análise procura-se perceber a relação entre as variáveis e qual o contributo de
cada uma delas para a descrição da evolução da exergia útil por tipo de uso em Portugal.
Como esta análise é limitada à correlação entre pares de variáveis, complementa-se com uma análise de
componentes principais no sentido de encontrar as variáveis que têm maior influência na explicação das exergias.
Com base nessas conclusões é então possível encontrar um modelo de previsão a 10 anos.
6.1 Boxplots
No sentido de trabalhar os dados com dimensões semelhantes, procedeu-se inicialmente à sua standardização de
forma a que os dados tivessem média nula e desvio padrão unitário.
Sem perda de generalidade, uma variável aleatória 𝑥, com média µ e desvio padrão σ, a standardização é dada pela
Equação (6.1):
𝑧 =
(𝑥 − µ)
𝜎
(6.1)
Dado que cada variável tem dimensões bastante distintas é importante proceder a essa normalização. Este
procedimento é amplamente recomendado na bibliografia no sentido de minimizar problemas numéricos
subsequentes.
Seguidamente, por uma questão de organização, define-se uma variável vars onde se organizam, por colunas,
cada uma das variáveis.
𝑣𝑎𝑟𝑠 = [HTH, MTH, LTH, MD, Ele, GVA]
Numa análise de valores que se afastem do panorama geral, de forma expedita, verifica-se a presença de outliers
através de um boxplot.
54
Figura 41 - Representação boxplot das variáveis, nomeadamente, 1-HTH, 2-MTH, 3-LTH, 4-MD, 5-Ele, 6-GVA
Do gráfico (Figura 41) apresentado verifica-se que não são identificados outliers.
6.2 Mapa de correlações
Um dos métodos mais usados para investigar a relação entre cada par de variáveis é através de diagramas de
dispersão cartesianos. Esta representação é uma ferramenta que permite verificar se existe alguma ocorrência de
tendências e de extrair grandezas que quantifiquem essa relação. Implementando essas conclusões para cada
variável tem-se na Tabela 12 e na Figura 42 a correlação entre cada variável segundo Pearson.
Tabela 12 - Matriz de correlações das variáveis disponibilizadas
HTH MTH LTH MD Ele GVA
HTH 1,00 0,81 0,90 0,84 0,91 0,90
MTH 0,81 1,00 0,94 0,95 0,93 0,94
LTH 0,90 0,94 1,00 0,98 0,99 0,99
MD 0,84 0,95 0,98 1,00 0,98 0,99
Ele 0,91 0,93 0,99 0,98 1,00 1,00
GVA 0,90 0,94 0,99 0,99 1,00 1,00
55
Figura 42 - Correlação segundo Pearson com nível de significância de 10e-36
Da análise da Figura 42 identifica-se a existência de fortes correlações entre variáveis, já que a maior parte
apresenta valores de correlação perto da unidade. Há, no entanto, variáveis como o HTH e o MTH que, apesar de
o coeficiente de Pearson ser relativamente mais baixo, têm dispersões significativas com todas as variáveis quando
comparadas com as restantes. Isto é indicativo que estas variáveis serão preponderantes na descrição do problema,
pois apresentam comportamento não linear e, portanto, acrescentarão informação adicional para a previsão.
No entanto, esta análise apenas correlaciona cada par de variáveis, procedendo-se a uma nova análise que se
apresenta em seguida.
6.3 Análise de Componentes Principais (PCA)
Devido à standardização dos dados, quando se procede à análise PCA a matriz obtida é, automaticamente, a matriz
de correlação.
Seguidamente aplicou-se a análise das componentes principais aos dados do problema e observou-se a
significância de cada variável em cada uma das componentes. A Tabela 13 abaixo demonstra a matriz de
covariância que explana essa relação.
56
Tabela 13 - Componentes principais do PCA
1ªComp 2ªComp 3ªComp 4ªComp 5ªComp 6ªComp
HTH 0,3840 0,8418 0,2741 -0.0753 -0,2400 -0,0740
MTH 0,3999 -0,4364 0,8023 -0,0386 0,0507 -0,0423
LTH 0,4168 -0,0173 -0,1960 0,8536 0,1683 -0,1747
MD 0,4122 -0,3098 -0,3604 -0,2271 -0,6653 -0.3318
Ele 0,4171 0,0286 -0,2719 -0,4563 0,6844 -0.2730
GVA 0,4183 -0,0614 -0,1971 -0,0658 -0,0228 0,8818
Como se pode confirmar através dos valores próprios da matriz de covariância apresentados na Tabela 14 verifica-
se que a primeira componente tem um valor próprio de 5,6853, e, portanto descreve 94,75% da amostra. A segunda
componente já só apresenta um valor próprio de 0,2197, sendo inferior à unidade, pelo que, segundo Elizabeth
Reis (2001) já poderia não ser usada na análise. Não obstante, quanto mais componentes forem utilizadas mais
informação se encontrará disponível para a modelação.
Para se proceder à seleção das variáveis que descrevem a primeira componente deve-se analisar, por linha, o maior
elemento e/ou o menor. Neste caso, como a coluna apresenta valores muito próximos, optar-se-á por selecionar o
maior, ou seja, o elemento correspondente à variável GVA.
Na segunda coluna identificam-se 3 situações:
HTH com uma forte correlação positiva;
Correlações negativas MTH e MD opta-se pelo mais negativo, MTH;
As restantes têm uma correlação baixa.
Assim, para a segunda componente selecionam-se as variáveis HTH e MTH.
Na terceira componente seleciona-se a variável mais negativa, ou seja, o termo referente a MD. O elemento maior,
por estar relacionado com a variável MTH, e já ter sido selecionado, não será contemplado nesta componente.
Assim, visto todos os outros termos serem em torno do valor de MD, estes não serão escolhidos.
Relativamente à quarta componente, seleciona-se novamente o maior termo, portanto a variável LTH. Finalmente,
em última escolha surge o Ele com o valor mais negativo.
Assim, em termos de prioridade de escolha na seleção das variáveis para a descrição do problema, tem-se GVA,
HTH, MTH, MD, LTH e o Ele.
Tabela 14 - Valores próprios de cada componente principal
Componentes Valores
próprios
Explicação da
variância (%)
Variáveis
selecionadas
1ª 5,6853 94,7551 GVA
2ª 0,2197 3,6621 HTH e MTH
3ª 0,0758 1,2636 MD
4ª 0,0123 0,2042 LTH e Ele
5ª 0,0049 0,0814 -
6ª 0,0020 0,0336 -
57
À semelhança do que foi feito na escolha através da matriz de correlações analisa-se o gráfico biplot em que se
apresentam as componentes num sistema de eixos e os vetores de cada uma das variáveis descritas nessas
componentes. A título de exemplo apresentam-se as primeiras duas componentes na Figura 43. Desta forma pode-
se visualizar a dimensão e orientação das variáveis descritas nessas componentes principais, além de reforçar a
seleção feita relativamente a GVA, HTH, MTH e MD.
Figura 43 - Componente 1 versus Componente 2
Pode-se ainda observar o gráfico ScreePlot (Figura 44) onde, uma forma de exclusão dos dados tem por base
analisar os valores próprios. Quando estes se tornam inferiores à unidade é porque o seu contributo já se encontra
reduzido o suficiente e, assim podem ser excluídas todas as variáveis que lhes estão associadas (Elizabeth Reis,
2001).
Figura 44 - Gráfico ScreePlot
58
Esta análise permite concluir quais as variáveis mais preponderantes na descrição do problema e, portanto, na
definição dos inputs da rede que permitam obter previsões sem perda de informação importante para tal.
6.4 Modelos de Previsão
Modelos dinâmicos de Redes Neuronais Artificiais
Finalmente procedeu-se à identificação de um modelo tendo por base as redes neuronais dinâmicas.
Quando se procede ao treino da rede os valores dos pesos são definidos aleatoriamente então, por isso, a qualidade
da rede para a previsão terá também uma aleatoriedade inerente. Assim procedeu-se ao treino de 640 redes onde
se testaram múltiplas vezes várias combinações de variáveis de entrada com um e dois anos de atraso nas variáveis
de exergia. Este processo foi bastante longo tendo demorado, para cada simulação, cerca de 24h. Verificou-se que
a simulação com step-ahead superiores a um, assim como, atrasar as variáveis de entrada mais do que um ano não
se obtinham melhores resultados.
Após essa análise, identificou-se a estrutura da rede (Figura 45) que produzia os melhores resultados de MSE e,
assim, passou a ser a considerada para modelar e descrever o problema. A rede é composta por 6 camadas
escondidas com 85 neurónios por camada escondida e pelas variáveis de entrada: GVA, HTH, MTH, LTH, MD e
Ele, também, as últimas cinco atrasadas um ano.
Figura 45 - Estrutura da rede retirada do software MATLAB
Da estrutura da rede apresentada observa-se que a rede recebe 6 variáveis de entrada (em x(t)), onde 5 dessas
variáveis (em y(t)) entram também com um ano anterior à previsão:
x(t) = [matriz com as variáveis GVA, HTH, MTH, LTH, MD, Ele] sem atraso (representado pelo 0 do “relógio”
em hidden) e y(t) = [matriz com as varáveis HTH, MTH, LTH, MD, Ele]. Esta variável corresponde às variáveis
que se encontram com um ano de atraso, já que estes dados permanecem um (representado pelo 1 do “relógio” em
hidden) ciclo à espera para entrar na rede.
A rede é composta por seis camadas escondidas (número 6 em hidden) em que os neurónios são modelados por
funções sigmoides e desta são previstas as cinco variáveis pretendidas (número 5 em output).
Na Figura 46, Figura 47, Figura 48, Figura 49 e Figura 50 apresentam-se os resultados da previsão que resultaram
de uma rede. Assinalado a preto encontra-se a previsão dos primeiros 40 anos que foram usados no treino,
validação e teste das redes (1-step-ahead-prediction), e a verde a previsão a 10 anos em modo closed loop, sendo
que os pontos a vermelho representam os dados conhecidos e que se pretendem prever.
59
Figura 46 – Representação de HTH segundo a RNA
Figura 47 - Representação de MTH segundo a RNA
60
Figura 48 - Representação de LTH segundo a RNA
Figura 49 - Representação de MD segundo a RNA
61
Figura 50 - Representação de Ele segundo a RNA
Dos gráficos da Figura 46, Figura 47, Figura 48, Figura 49 e Figura 50 verifica-se que foram atingidas boas
aproximações nos dados utilizados para treino e validação da rede (primeiros 40 anos) apresentando uma previsão
satisfatória para os 10 anos seguintes. Observa-se que os maiores erros absolutos de previsão não ultrapassam os
5% nalguns anos (exemplo: previsão de LTH em 2007), um valor perfeitamente aceitável.
Dado que os 40 primeiros anos foram os usados no treino e validação da rede era expectável que o modelo se
aproximasse bastante desses, no entanto, os últimos 10 anos mais dificilmente terão essa aproximação já que a
rede não teve informação sobre esses durante a fase de aprendizagem. Além disso, nesses 10 anos, dado que cada
previsão feita é encontrada com base em anos que já tinham sido estimados, existe uma acumulação de erro a cada
novo ano. Tanto a Tabela 15 como a Figura 51 apresentadas consolidam as expectativas anteriores.
Outra dificuldade intimamente ligada aos anos de previsão está a variação brusca dos dados das variáveis HTH e
MTH, que poderão introduzir oscilações indesejáveis nas restantes.
A Tabela 15 fundamenta essa aproximação com erros relativamente baixos. Nela consta o erro respetivo para cada
uma das variáveis durante os 40 anos usados na identificação do modelo, bem como, o erro dos últimos 10 anos a
serem previstos e um erro global relativo aos 50 anos.
Tabela 15 – Erro quadrático médio da RNA
Anos HTH MTH LTH MD Ele
1960-1999 1,23 × 10−7 2,01 × 10−7 2,30 × 10−7 1,80 × 10−7 2,25 × 10−7
2000-2009 4,10 × 10−4 1,46 × 10−4 3,86 × 10−4 5,12 × 10−4 8,25 × 10−4
1960-2009 8,37 × 10−5 2,99 × 10−5 7,90 × 10−5 1,05 × 10−4 1,69 × 10−4
62
Figura 51 - Erro global das variáveis
No sentido de perceber se em termos globais de cada variável existia alguma tendência de erro anual procedeu-se
à determinação do erro de todas as variáveis e à sua representação ao longo dos anos, Figura 51.
Da análise do gráfico concluiu-se que o erro, em valor absoluto, apresenta um comportamento aleatório e que as
variáveis que mais contribuem para o erro de previsão são o MTH, MD e Ele, não obstante, das Figura 47, Figura
49 e Figura 50 o comportamento das variáveis seguir a tendência dos dados.
63
Regressão Linear Múltipla
Um outro modelo que seria útil na previsão da exergia é o modelo de regressão linear múltipla que tem a forma da
Equação (3.2). Para se proceder à previsão dos últimos dez anos, utilizar-se-ão os dados previstos e realimentar-
se-ão esses resultados nas equações para a previsão do ano seguinte.
Neste modelo, no entanto, há a necessidade de se verificarem condições estatísticas que garantam a
reprodutibilidade dos dados. Nesse sentido estimam-se os parâmetros associados ao modelo e verifica-se a
significância de cada variável na explicação do modelo. Por fim são descritos os resultados obtidos e retiradas
conclusões.
Inicialmente foi construída uma tabela (Tabela 16) para perceber a relação entre as variáveis, onde são
apresentados os p-values de regressão. Esta observação tem como objetivo perceber quais os coeficientes que têm
uma significância maior de 5%, ou seja, são esses os considerados relevantes para a análise de cada variável.
Tabela 16 - P-value da regressão para cada variável
HTH
MTH LTH MD Ele GVA
HTH 0,0002 0,5048 0,2049 0,0116 3,2165 × 10−7 0,0794
MTH 0,5048 0,5150 0,5594 0,3708 0,4555 0,0050
LTH 0,2049 0,5594 0,0362 0,4269 0,7689 0,0037
MD 0,0116 0,3708 0,4269 0,0909 0,0726 0,0005
Ele 3,2165 × 10−7 0,4555 0,7689 0,0726 0,0206 0,1468
GVA 0,0794 0,0050 0,0037 0,0005 0,1468 0,8842
Após esta tabela são demonstrados os gráficos, Figura 52, Figura 53, Figura 54, Figura 55 e Figura 56, relacionados
com cada variável, onde se verifica a capacidade descritiva do modelo.
Figura 52 - Representação de HTH segundo a Regressão Linear Múltipla
64
Figura 53 - Representação de MTH segundo a Regressão Linear Múltipla
Figura 54 - Representação de LTH segundo a Regressão Linear Múltipla
65
Figura 55 - Representação de MD segundo a Regressão Linear Múltipla
Figura 56 - Representação de Ele segundo a Regressão Linear Múltipla
Além de, visualmente, os resultados se aproximarem dos dados objetivo, o erro alcançado por este modelo é o
apresentado na Tabela 17. Esta apresenta a mesma lógica de erros que a Tabela 15 para a RNA.
Tabela 17 - Erros da regressão linear múltipla
Anos HTH MTH LTH MD Ele
1960-1999 1,33 × 10−2 7,27 × 10−2 1,12 × 10−2 0,45 × 10−2 0,37 × 10−2
2000-2009 8,17 × 10−1 2,48 × 10−1 1,99 × 10−1 4,53 × 10−2 1,11 × 10−1
1960-2009 1,74 × 10−1 1,08 × 10−1 4,88 × 10−2 1,27 × 10−2 2,51 × 10−2
Apresenta-se ainda na Figura 57 um gráfico de resíduos, já que é importante para a validação do modelo que o
resíduo tenha média nula. O significado de se ter resíduo aleatório pressupõe que não existe mais informação
66
quantificável nos dados, isto é, a informação restante é apenas ruído. Existe, no entanto, um comportanto não linear
no resíduo pelo que se conclui que este modelo não é capaz de captar alguns comportamentos presentes nos dados.
Figura 57 - Gráfico dos resíduos da regressão linear múltipla
Regressão Linear Multivariada
Seguidamente procede-se à análise multivariada baseada na Equação (3.3), no sentido de se determinar se este
modelo apresenta melhores resultados. Sendo um modelo multivariado, espera-se que, no caso de existir um
acoplamento entre as variáveis, os resultados tenham um bom comportamento. Na Figura 58, Figura 59, Figura
60, Figura 61 e Figura 62 são apresentados os resultados obtidos com o modelo desenvolvido.
Figura 58 - Representação de HTH segundo a Regressão Linear Multivariada
67
Figura 59 - Representação de MTH segundo a Regressão Linear Multivariada
Figura 60 - Representação de LTH segundo a Regressão Linear Multivariada
68
Figura 61 - Representação de MD segundo a Regressão Linear Multivariada
Figura 62 - Representação de Ele segundo a Regressão Linear Multivariada
À semelhança do efetuado com o modelo de regressão múltipla também se apresenta o gráfico dos resíduos na
Figura 63. Neste caso são representadas as curvas de nível de uma superfície gaussiana no sentido de melhor
visualização da dispersão do erro.
69
Figura 63 - Gráfico dos resíduos da regressão linear multivariada
Analogamente ao caso da RNA e da regressão linear múltipla, apresentam-se na Tabela 18 os erros obtidos deste
modelo.
Tabela 18 - Erros da regressão linear multivariada
Anos HTH MTH LTH MD Ele
1960-1999 0,98 × 10−1 0,78 × 10−1 0,68 × 10−1 3,98 × 10−2 5,58 × 10−2
2000-2009 2,74 × 10−1 3,17 × 10−1 1,58 × 10−1 0,65 × 10−2 0,57 × 10−2
1960-2009 1,33 × 10−1 1,26 × 10−1 8,63 × 10−2 3,32 × 10−2 4,57 × 10−2
6.5 Comparação entre os três métodos de previsão
Da análise dos vários métodos pode-se verificar que as redes neuronais permitiram alcançar valores de erro de
previsão inferiores. Na Tabela 19 identificou-se ainda um erro acumulado das variáveis, isto é, procedeu-se ao
cálculo do erro quadrático médio dos erros de cada uma das variáveis tendo em conta que a referência neste caso
era zero, Equação (6.1):
𝛴 =
(𝑀𝑆𝐸_𝐻𝑇𝐻2 + 𝑀𝑆𝐸_𝑀𝑇𝐻2 + 𝑀𝑆𝐸_𝐿𝑇𝐻2 + 𝑀𝑆𝐸_𝑀𝐷2 + 𝑀𝑆𝐸_𝐸𝑙𝑒2)
5
(6.1)
70
Tabela 19 - Comparação de erros ao longo dos 50 anos
HTH MTH LTH MD Ele Erro Global
Múltipla 1,74 × 10−1 1,08 × 10−1 4,88 × 10−2 1,27 × 10−2 2,51 × 10−2 9,01 × 10−3
Multivariada 1,33 × 10−1 1,26 × 10−1 8,63 × 10−2 3,32 × 10−2 4,57 × 10−2 8,84 × 10−3
RNA 8,37 × 10−5 2,99 × 10−5 7,90 × 10−5 1,05 × 10−4 1,69 × 10−4 3,37 × 10−5
Dessa tabela verifica-se ainda que a regressão linear multivariada permitiu alcançar um erro inferior à regressão
linear múltipla, no entanto a ordem de grandeza não é muito diferente o que dá indícios de que, apesar de existir
acoplamento entre as variáveis, como visto da análise de PCA (matriz de covariância), descrever o problema como
sendo linear é insuficiente para se conseguirem resultados satisfatórios.
Por outro lado, a rede neuronal obteve o melhor resultado das três análises em estudo. Este facto deve-se
essencialmente à descrição não linear fornecida pela função sigmoide dos neurónios. Além disso, o facto de a rede
ter uma sobre-definição de parâmetros na sua estrutura permite a flexibilidade característica das RNA e, portanto
foi possível obter previsões com uma ordem de grandeza três vezes inferior no caso das RNA, observado na Tabela
20.
Tabela 20 - Comparação de erros ao longo dos 10 anos de previsão
HTH MTH LTH MD Ele Erro Global
Múltipla 8,17 × 10−1 2,48 × 10−1 1,99 × 10−1 4,53 × 10−2 1,11 × 10−1 1,57 × 10−1
Multivariada 2,74 × 10−1 3,17 × 10−1 1,58 × 10−1 0,65 × 10−2 0,57 × 10−2 0,40 × 10−1
RNA 4,10 × 10−4 1,46 × 10−4 3,86 × 10−4 5,12 × 10−4 8,25 × 10−4 1,65 × 10−4
Por último são apresentados gráficos (Figura 64, Figura 65, Figura 66, Figura 67, Figura 68) dos erros dos dez
anos de previsão para cada análise. Concluiu-se que em termos genéricos olhando para o somatório dos erros, que
apesar de haver uns anos melhores que outros, os gráficos individualmente aproximam bem aos dados reais. É de
notar que quanto maior for a “teia” maior será o erro nesse ano, caso a “teia” seja pequena o erro é menor.
Concluiu-se, por observação gráfica, que a rede neuronal foi o modelo de previsão que melhor se adaptou aos
dados dando uma informação muito útil sobre a previsão das variáveis individualmente.
Figura 64 - Evolução do erro das variáveis no ano de 2000 e 2001 para as três análises de previsão
71
Figura 65 - Evolução do erro das variáveis no ano de 2002 e 2003 para as três análises de previsão
Figura 66 - Evolução do erro das variáveis no ano de 2004 e 2005 para as três análises de previsão
Figura 67 - Evolução do erro das variáveis no ano de 2006 e 2007 para as três análises de previsão
72
Figura 68 - Evolução do erro das variáveis no ano de 2008 e 2009 para as três análises de previsão
73
7. Conclusões e Trabalho Futuro
Conclusões
O objetivo deste trabalho foi fazer um novo estudo que combina a abordagem das Redes Neuronais Artificiais
(RNA) com a evolução temporal da exergia útil com o intuito de fazer previsões de consumos energéticos em
Portugal no período de 2000 a 2009. Dispunha-se de informação sobre Valor Acrescentado Bruto (GVA) e da
exergia útil, nomeadamente, High Temperature Heat (HTH), Medium Temperature Heat (MTH), Low
Temperature Heat (LTH), Mechanical Drive (MD) e Other Electric Uses + Light (Ele) relativos a 50 anos (período
de1960 a 2009).
Como foi referido anteriormente já existem exemplos da utilização de RNA para fazer previsões do consumo de
energia usando dados de energia final, por exemplo, caso da Grécia e Coreia do Sul, apresentados nas secções
4.8.1 e 4.8.2, e o caso da China que utiliza a exergia útil para fazer essa mesma previsão, apresentado na secção
2.2.1. Igualmente, no trabalho de Percebois (1979) suportado por Serrenho et al. (2014) onde se sugere que a
intensidade energética (consumo energético em função do PIB) era mais bem calculada no último patamar da
cadeira energética por calcular as necessidades para satisfazer os diferentes utilizadores finais. Com esta
dissertação adquirem-se conhecimentos adicionais sobre este assunto, pois aborda de forma pioneira a utilização
de RNA para fazer previsões de exergia útil por tipo de uso.
Realizou-se uma pesquisa de tipos de previsão (Secção 2.2) existentes. Pode-se considerar que este presente estudo
se enquadra nos tipos de previsão de: i) análise de utilização final, por se focar nos serviços que usam energia e
por representar explicitamente a utilização final sendo relativamente fácil incorporar modificações na sua política;
ii) análise combinada, por empregar métodos regressivos quando as tendências parecem ser robustas e, quando são
mais fracas utiliza a análise de utilização final; iii) análise de cenários, por poderem ser elevadas a qualquer grau,
incluindo análises numéricas e poder levar os seus utilizadores a considerar hipóteses que não tinham concebido
anteriormente.
Com os dados disponibilizados pretendeu-se modelar e prever informação relativa às exergias úteis por tipo de
uso. No entanto, esta tarefa é um fenómeno complexo: assim as redes neuronais, devido à aptidão que têm para
distinguir as relações existentes num determinado conjunto de dados, demonstraram ser uma ferramenta com boa
capacidade para este processo face a métodos mais convencionais como a regressão linear múltipla e a regressão
linear multivariada.
Antes da construção dos vários modelos fez-se um pré-tratamento de dados e efetuaram-se análises de correlações
de modo a aferir as variáveis que contribuem com mais informação para a descrição das exergias úteis a prever e,
proceder a uma redução do número de variáveis, no caso de se verificar necessário. Para tal procedeu-se à análise
de componentes principais (PCA). Essa análise foi bastante útil para o início do trabalho, enquanto ainda não se
sabia de onde partir, pois foi possível encontrar um conjunto de variáveis com maior influência no processo de
previsão, as quais foram definidas como inputs da rede. As variáveis eleitas são, por ordem decrescente de
contribuição - GVA, HTH, MTH, MD, LTH, Ele.
74
Neste caso de estudo, optou-se por aplicar o algoritmo de otimização Levenberg-Marquardt para o treino da RNA.
Através desta metodologia foi possível obter um ajuste aos dados reais para o período compreendido entre 1960 e
2009. A rede que apresentou os melhores resultados de previsão é composta por 6 camadas escondidas e 85
neurónios na camada escondida onde, das variáveis de entrada GVA, HTH, MTH, LTH, MD e Ele, as últimas cinco
entram com informação de um ano anterior à previsão.
Os dados dos primeiros quarenta anos foram usados no conjunto de treino, teste e validação da rede e, os últimos
dez anos foram apenas para verificação da previsão, tendo sido aplicada nestes a rede em closed loop. Com esta
rede obteve-se um valor de MSE de 1,65 × 10−4 relativo aos dez anos de previsão.
No sentido de verificar a qualidade da rede compararam-se os resultados com modelos obtidos pela regressão
linear múltipla e pela regressão linear multivariada. Estes demonstraram ter qualidade inferior comparativamente
à RNA.
Em todos os casos verificou-se dificuldade na extrapolação devido à discrepância comportamental dos dados de
treino (primeiros quarenta anos) e de previsão (últimos dez anos). Aparecendo essas dificuldades na falta de
flexibilidade às variações bruscas no caso das regressões lineares.
Trabalho Futuro
Como trabalho futuro, é importante avaliar a relação com outras variáveis de input e testar uma nova estrutura de
rede. As redes neuronais são um método que necessita de bastantes dados para ser obtido um modelo que se ajuste
bem a cada caso de estudo e, por isso se utilizam várias variáveis de input.
Ainda como sugestão para desenvolvimentos futuros, seria importante analisar amostras para mais anos destas
variáveis, já que um aumento do número de dados disponíveis poderá contribuir para a obtenção de melhores
desempenhos na modelação do processo de previsão de exergia.
Com este estudo, pode-se considerar que a utilização de redes neuronais dinâmicas para a modelação do processo
de previsão de exergias é um modelo vantajoso e que, eventualmente, poderá ser adaptado a outros países.
Outra sugestão surge no sentido de se adaptar estas redes neuronais dinâmicas na utilização da previsão de outros
tipos de consumo sem ser apenas energia.
Como nota final e baseando-nos no artigo desenvolvido para a China (Brockway et al., 2015) seria interessante
desenvolver um estudo de previsão de consumos de energia para o horizonte de 2030-2050 para Portugal, usando
cenários de GVA e comparar com os cenários existentes.
75
Referências Ayres, R. and Warr, B. (2010). The Economic Growth Engine: How Energy and Work Drive Material Prosperity.
Edward Elgar Publishing.
B. Krose and P. Van Der Smagt (1996), An introduction to Neural Networks, 8th ed., November, University of
Amsterdam.
Baughman, D.R.; Liu, Y.A. (1995), Neural Networks in Bioprocessing and Chemical Engineering, Dissertation
submitted to the Faculty of the Virginia Polytechnic Institute and State University in partial fulfillment of the
requirements for the degree of Doctor of Philosophy in Chemical Engineering.
Böhm, K., Smidt, E., andTintner, J. (2013). Application of multivariate data analysis in waste management.
Disponível em: http://www.intechopen.com/books/multivariate-analysis-in-management-engineering-and-the-
sciences/application-of-multivariate-data-analyses-in-waste-management
Boyle, G., Everett, B., Ramage, J., and University, O. (2003). Energy Systems and Sustainability: Block I. Energy
for a sustainable future. Oxford University Press, Oxford.
British Petroleum (BP) Ltd (2014). World Energy Outlook 2035 – Excel Tables. World Energy Outlook 2035.
Disponível em: <http://www.bp.com/en/global/corporate/about-bp/energy-economics/energy-outlook/energy-
outlookdownloads.html>.
Brockway, P. E., Steinberger, J. K., Barrett, J. R. and Foxon, T. J. (2015). Understanding China´s past and future
energy demand: An exergy efficiency and decomposition analysis. Applied Energy, 155:892–903.
Brockway, P. E., Steinberger, J. K., Barrett, J. R. and Foxon (2014). Divergence of trends in US and UK aggregate
exergy efficiencies 1960–2010. Environ Sci Technol;48:9874–81.
Carla Henriques (2010/2011), Análise de Regressão Linear Simples e Múltipla, Departamento de Matemática
Escola Superior de Tecnologia de Viseu, Disponível em:
http://www.estgv.ipv.pt/PaginasPessoais/psarabando/Ambiente%202010-2011/Slides/Regressaoalunos.pdf
Carnahan W, Ford KW, Prosperetti A, et al. (1975). Technical aspects of the more efficient utilization of energy:
Chapter 2 – Second law efficiency: the role of the second law of thermodynamics in assessing the efficiency of
energy use. Am Inst Phys Conf Ser;25:25–51.
Coelho-Barros, E.A., Simões, P.A., Achcar, J.A., Martinez, E.Z. e Shimano, A.C. (2008), Métodos de estimação
em regressão linear múltipla: aplicação a dados clínicos, Revista Colombiana de Estadística, 31 (1): 111-129,
Disponível em: http://www.emis.de/journals/RCE/body/v31n1a07CoelhoEtAl.pdf
Cullen, J. M. and Allwood, J. M. (2010a). The efficient use of energy: Tracing the global flow of energy from fuel
to service. Energy Policy, 38(1):75 – 81.
76
Cullen, J. M. and Allwood, J. M. (2010b). Theoretical efficiency limits for energy conversion devices. Energy, 35
(5): 2059 – 2069.
D. J. C. MacKay (1991), “Bayesian Interpolation,” Computation and Neural Systems, May 18.
Demuth, H.; Beale, M.; Hagan, M., (2015). Neural Network ToolboxTM User’s Guide (R2015a). Natick,
Massachusetts: The MathWorks, Inc.
Dixon, W. J., Massey, F. J., et al. (1969). Introduction to statistical analysis, volume 344. McGraw-Hill New York.
Egghe, L. and Leydesdorff, L. (2009). The relation between pearson's correlation coefficient r and salton's cosine
measure. Journal of the American Society for Information Science and Technology, 60(5):1027-1036.
Elizabeth Reis (2001). Estatística Multivariada Aplicada. Edições Sílabo.
Energy Information Administration (2007). Official Energy Statistics from the US Government, Disponível
em:http://www.eia.doe.gov/emeu/cabs/index.htmlS.
Eriksson, L. (1999). Introduction to multi-and megavariate data analysis using projection methods (PCA & PLS).
Umetrics AB.
Eriksson, L.; Johansson, E.; Kettaneh-Wold, N.; Trygg, J.; Wikström; Wold, S.; (2006). Multi- and Megavariate
Data Analysis, Part I: Basic Principals and Applications, 2ª Edição, Umetrics Academy.
Ertesv�̈�g, I. S. (2005). Energy, exergy, and extended-exergy analysis of the Norwegian society 2000. Energy,
30(5):649 – 675.
for Disease Control, C. and Division, P. U. C. D. (2006). Principles of Epidemiology in Public Health Practice:
An Introduction to Applied Epidemiology and Biostatistics. U.S. Department of Health and Human Services,
Centers for Disease Control and Prevention (CDC), O-ce of Workforce and Career Development.
Friendly, M. and Institute, S. (1991). Macro Programs from The SAS system for statistical graphics. First Edition
by SAS Institute Inc., Cary, NC, USA.
Fridley D, Zheng N, Zhou N, Ke J, Hasanbeigi A, Price L. (2012) China energy and emissions paths to 2030 (2nd
Edition). Lawrence Berkeley National Laboratory (LBNL).
Gibbs, M.S., Morgan, N., Maier, H.R., Dandy, G.C., Nixon, J.B., Holmes, M. (2006). Investigation into the
relationship between chlorine decay and water distribution parameters using data driven methods. Mathematical
and Computer Modelling 44 (5-6), 485-498.
Graybill, F.A. (1976), Theory and Application of Linear Model. North Scituate Massachussets: Duxbury Press.
Guevara, Z., Serrenho, A., Sousa, T., and Domingos, T. (2014). Insights on energy transitions in Mexico from the
analysis of useful work from 1971 to 2009.
77
IIASA (2014). MESSAGE LIMITS-base (RCP 8.5) Total Primary Energy Consumption data. LIMITS Scenar.
Database (version 1.0.0). Disponível em:
<https://tntcat.iiasa.ac.at/LIMITSPUBLICDB/dsd?Action=htmlpage&page=series>.
INE (2012). Anuário Estatístico de Portugal 2012. Relatório Técnico, Instituto Nacional de Estatística.
INE (2015). Anuário Estatístico de Portugal 2012. Relatório Técnico, Instituto Nacional de Estatística.
International Energy Agency (IEA) (2013). World energy outlook 2013. Paris, France.
Kimura, H.; Huo, G.; Rasin, A.; Madden, S.; Zdonik,S. (2009) Correlation maps: a compressed access method for
exploiting soft functional dependencies. Journal Proceedings of the VLDB Endowment, Digital Library.
L. Ekonomou (2009). Greek long-term energy consumption prediction using artificial neural networks. Energy 35
512-517.
Marziye Yousefi, Mahmoud Omid, S. F. Ghaderi (2013). Strategic planning for minimizing 𝐶𝑂2 emissions using
LP model based on forecasted energy demand by PSO Algorithm and ANN. International Journal of Energy,
Environment and Economics.
Miguel Mesquita Palma (2014), Evolution of Aggregated Exergy Efficiencies per end-use in the period 1960-2009.
Master thesis, Instituto Superior Técnico, Universidade de Lisboa
Moran, M., Shapiro, H., Boettner, D., and Bailey, M. (2010). Fundamentals of Engineering Thermodynamics.
John Wiley & Sons, 5th Edition.
P. J. S. Gil, A. F. C. Relvas (2015). O pequeno livro da dissertação, IST; vs. 1.1.
Parlos, A.G., Rais, O.T., Atiya, A.F. (2000). Multi-step-ahead prediction using dynamic recurrent neural networks.
Neural Networks 13 765-786.
Paul P. Craig, Ashok Gadgil, and Jonathan G. Koomey (2002). What Can History Teach Us? A Retrospective
Examination of Long-Term Energy Forecasts for the United States.
Percebois J. (1979). Is the concept of energy intensity meaningful? Energy Economic.
Pinheiro, M. (ed.) (1997). Séries Longas para a Economia Portuguesa. Pós II Guerra Mundial, vol. I - Séries
Estatísticas. Lisbon, Banco de Portugal.
R. Guimarães, J. Cabral (1997), Estatística, Mc Graw Hill.
Reistad, G. M. (1975). Available Energy Conversion and Utilization in the United States. J. Eng. Gas Turbines
Power, 97(3):429–434.
S. Haykin (1999), Neural Networks - A Comprehensive Foundation, 9th ed. Pearson Education.
78
Sassi, C.P., Perez, F.G., Myazato, L., Ye, X., Ferreira-Silva, P.H. e Louzada, F. (2011), Modelos de Regressão
Linear Múltipla Utilizando os Softwares R e Statistica: Uma Aplicação a Dados de Conservação de Frutas,
Disponível em: http://www.icmc.usp.br/CMS/Arquivos/arquivos_enviados/BIBLIOTECA_113_RT_377.pdf
Serrenho, A. (2013). Useful Work as an Energy End-Use Accounting Method: Historical and Economic
Transitions and European Patterns. PhD thesis, Instituto Superior Técnico, Universidade de Lisboa.
Serrenho, A., Sousa, T., Warr, B., Ayres, R., Domingos, T. (2014). Decomposition of useful work intensity: The
EU (European Union)-15 countries from 1960 to 2009. Energy 76 704-715.
Serrenho, A., Warr, B., Sousa, T., Ayres, R., Domingos, T. (2015). Structure and dynamics of useful work along
the agriculture-industry-services transition: Portugal from 1856 to 2009. Structural Change and Economic
Dynamics 36 1-21.
Télvio Orrú (2003), Redes Neurais Artificiais para Reconhecimento e Classificação de Padrões. Faculdade de
Engenharia Eléctrica e de Computação. DCA/FEEC/Unicamp.
Teuvo Kohonen (2014): MATLAB Implementations and Applications of the Self-Organizing Map. Aalto
University, School of Science, Helsinki, Finland.
Tsungnan Lin, Bill G. Horne, Member, IEEE, Peter Tiiio, and C. Lee Giles, Senior Member, IEEE (1996).
Learning Long-Term Dependencies in NARX Recurrent Neural Networks. JEEE TRANSACTIONS ON
NElJRAL NETWORKS, VOL. I, NO. 6, NOVEMBER.
US Energy Information Administration (USEIA) (2014). World primary energy consumption. Int Energy
Outlook 2014; Disponível em: <http://www.eia.gov/oiaf/aeo/tablebrowser/#release=IEO2013&subject=1-
IEO2013&
table=1-IEO2013®ion=0-0&cases=Reference-d041117>.
Utlu, Z. and Hepbasli, A. (2007). A review on analyzing and evaluating the energy utilization efficiency of
countries. Renewable and Sustainable Energy Reviews, 11(1):1–29.
Varella, C. A. A. (2008). Análise de componentes principais. Universidade Federal Rural do Rio de Janeiro,
Disponível em: http://www.ufrrj.br/institutos/it/deng/varella/Downloads
Wall, G. (1977). Exergy - a useful concept within resource accounting. Technical Report 77-42, Gotland
University, School of Culture, Energy and Environment.
Wall, G. (1987). Exergy conversion in the Swedish society. Resources and Energy, 9(1):55 – 73.
Wickham, H. and Stryjewski, L. (2011). 40 years of boxplots. November 29. Disponível em:
http://vita.had.co.nz/papers/boxplots.pdf
Yeh, S.-T., GlaxoSmithKline, and King of Prussia, P. (2007). Exploratory visualization of correlation matrices. In
NorthEast SAS Users Group (NESUG) conference 2007.
Zhang, G., Eddy Patuwo, B., and Y Hu, M. (1998). Forecasting with artificial neural networks: The state of the
art. International journal of forecasting, 14 (1): 35-62.
79
Zong Woo Geem, Z.W. e Roper, W.E. (2009). Energy demand estimation of South Korea using artificial neural
network. Energy Policy 37 4049 – 4054.