Aplicação de Modelos de Redes Neuronais para Previsão de...

Aplicação de Modelos de Redes Neuronais para Previsão de

Consumos de Energia

Rita Sereno Serrão da Veiga Alves

Dissertação para obtenção do Grau de Mestre em

Engenharia Mecânica

Orientadores: Prof. Miguel Afonso Dias de Ayala Botto

Prof. Tânia Alexandra dos Santos Costa e Sousa

Júri

Presidente: Prof. João Rogério Caldas Pinto

Orientador: Prof. Miguel Afonso Dias Ayala Botto

Vogal: Carlos Augusto Santos Silva

Junho 2016

Agradecimentos

Gostaria de expressar a minha gratidão e agradecimento a todos aqueles que fizeram a realização desta tese possível

e, também os que contribuíram para me tornar a pessoa que sou hoje. Particularmente:

Aos meus orientadores, Professor Miguel Ayala Botto e Professora Tânia Sousa, pela oportunidade de participar

neste projeto, pela orientação, apoio, motivação e disponibilidade prestada durante toda a realização da tese de

mestrado e, pelas inúmeras revisões de texto.

A todas as pessoas que incorporam a Secção de Meio Ambiente e Energia do Departamento de Engenharia

Mecânica por tornarem o ambiente bastante gratificante para o desenvolvimento do trabalho.

À minha irmã, à minha família e aos meus amigos e colegas que me acompanharam nesta jornada, expresso o meu

profundo reconhecimento por sempre estarem presentes.

A meus pais o mais profundo agradecimento pela confiança, valores, disciplina e dedicação que me incutiram,

pois sem eles este percurso não teria sido possível.

Finalmente, um especial agradecimento a meu pai por toda a força, motivação e ajuda prestada nesta longa jornada.

Resumo

As redes neuronais artificiais (RNA) podem ser utilizadas na modelação e previsão da dinâmica de problemas

complexos que não podem ser tratados de forma eficaz com soluções convencionais. O presente estudo torna-se

inovador, pois utiliza a exergia útil para previsão de consumos de energia. Utiliza ainda as RNA como uma técnica

de modelação e previsão do consumo de energia em Portugal e compara essa modelação com outras,

nomeadamente, regressão linear múltipla e regressão linear multivariada. Os dados do período de 1960 a 2009

relativamente ao Valor Acrescentado Bruto (GVA) e à exergia útil, designadamente a High Temperature Heat

(HTH), Medium Temperature Heat (MTH), Low Temperature Heat (LTH), Mechanical Drive (MD) e Other

Electric Uses + Light (Ele) foram disponibilizados, analisados e utilizados na construção do modelo dinâmico de

predição. Antes da construção do modelo dinâmico foram selecionadas as variáveis com maior impacto no

processo de predição, através da análise de correlações e da análise de componentes principais (PCA).

Posteriormente o modelo de RNA não linear foi testado. Para o estudo descrito foi utilizada a Neural Network

Toolbox™ através do software de cálculo numérico, MATLAB.

A rede foi “treinada” através do algoritmo de backpropagation utilizando o método de otimização Levenberg-

Marquardt, após terem sido testadas várias combinações de dados de entrada, no sentido de se procurar o modelo

que melhor se ajustava aos dados. O treino, teste e validação do modelo foram efetuados com dados relativos aos

registos da evolução das variáveis entre os anos 1960 a 1999, sendo os dados relativos à década de 2000 a 2009

usados apenas como dados de teste das capacidades de previsão da RNA.

Comparativamente à regressão linear múltipla e à regressão multivariada a RNA demonstrou uma capacidade de

aproximação bastante superior, pelo que se confirmou a adaptabilidade das RNA na modelação e predição de

problemas dinâmicos complexos face a métodos convencionais.

Palavras-chave: Valor Acrescentado Bruto, Exergia, Predição, Modelação, Análise Multivariada de Dados,

Redes Neuronais Artificiais

Abstract

Artificial neural networks (ANN) can be used in the modelling and prediction of the dynamic complex problems,

which cannot be treated using conventional solutions. This study is innovative, because it uses the useful exergy

concept to predict the energy consumption. It also makes uses of ANN to model and predict the energy

consumption in Portugal and compares this value with others obtained from different modelling techniques,

namely, multiple linear regression and multivariate linear regression. Available data from 1960 to 2009 of Gross

Value Added (GVA) and useful exergy, namely High Temperature Heat (HTH), Medium Temperature Heat

(MTH), Low Temperature Heat (LTH), Mechanical Drive (MD) e Other Electric Uses + Light (Ele) was analyzed

and used to build the dynamic prediction model. Prior to the construction of the dynamic model, the variables with

the greatest impact on the process were selected using correlation analysis and principal component analysis (PCA)

and then the nonlinear ANN model was tested. For this study, the Neural Network Toolbox ™ from MATLAB

was used.

The dynamic neural network has been trained through the backpropagation algorithm using the Levenberg-

Marquardt optimization method with various combinations of input data, in order to search for the model that best

fits the data. The training, testing and validation of the model construction were performed using the data evolution

between the years 1960-1999 while the data from decade 2000-2009 was only used to validate the ANN prediction

capabilities.

Compared to multiple linear regression and multivariate linear regression, the ANN demonstrated a far superior

approach capacity. This supports the adaptability of ANN for modelling and predicting complex dynamical

problems compared to conventional methods.

Keywords: Gross Value Added, Exergy, Prediction, Modeling, Multivariate Data Analysis, Artificial Neural

Networks

Índice

1. Introdução ...................................................................................................................................... 1

1.1 Motivação e Objetivos do Trabalho ........................................................................................ 2

1.2 Estrutura da Dissertação .......................................................................................................... 3

2. Análise da energia ......................................................................................................................... 4

2.1 Exergia primária, final e útil .................................................................................................... 4

Definições de energia ........................................................................................................................ 4

Definições de exergia ........................................................................................................................ 5

Conversão de dados energéticos em exergia ..................................................................................... 6

Eficiência Energética......................................................................................................................... 7

Exergia útil: definição e contabilização ............................................................................................ 8

Perfil energético de Portugal ........................................................................................................... 10

2.2 Previsões de procura de energia ............................................................................................ 11

Uso de exergia útil para fazer previsões para a China ..................................................................... 13

3. Modelação por métodos estatísticos ........................................................................................... 19

3.1 Pré-tratamento de dados ........................................................................................................ 19

Análise estatística de 1ª ordem ........................................................................................................ 19

Análise de correlações ..................................................................................................................... 20

3.2 Análise de componentes principais (PCA) ............................................................................ 21

Definição do método de PCA .......................................................................................................... 21

Contribuição e interpretação de cada componente principal ........................................................... 22

Representação gráfica dos componentes principais ........................................................................ 23

Scores Plot e Loadings Plot ............................................................................................................. 24

3.3 Modelos de Regressão Linear ............................................................................................... 25

Regressão Linear Múltipla .............................................................................................................. 25

Regressão Linear Multivariada ....................................................................................................... 26

4. Modelação com Redes Neuronais ............................................................................................... 27

4.1 Benefícios das redes neuronais artificiais .............................................................................. 27

4.2 Neurónio artificial ................................................................................................................. 28

4.3 Topologia de redes ................................................................................................................ 31

4.4 Aprendizagem ....................................................................................................................... 32

4.5 Redes Perceptron ................................................................................................................... 33

4.6 Algoritmo backpropagation ................................................................................................... 35

4.7 Redes Neuronais Dinâmicas .................................................................................................. 36

4.8 Uso de Redes Neuronais para previsão do consumo de energia ........................................... 37

Caso de estudo: Grécia .................................................................................................................... 37

Caso de estudo: Coreia do Sul ......................................................................................................... 39

5. Dados e Metodologia ................................................................................................................... 44

5.1 Dados disponibilizados .......................................................................................................... 44

5.2 Metodologia........................................................................................................................... 47

Análise prévia dos dados ................................................................................................................. 48

Modelação com Redes Neuronais Artificiais .................................................................................. 48

6. Resultados e Discussão ................................................................................................................ 53

6.1 Boxplots ................................................................................................................................ 53

6.2 Mapa de correlações .............................................................................................................. 54

6.3 Análise de Componentes Principais (PCA) ........................................................................... 55

6.4 Modelos de Previsão ............................................................................................................. 58

Modelos dinâmicos de Redes Neuronais Artificiais ........................................................................ 58

Regressão Linear Múltipla .............................................................................................................. 63

Regressão Linear Multivariada ....................................................................................................... 66

6.5 Comparação entre os três métodos de previsão ..................................................................... 69

7. Conclusões e Trabalho Futuro ................................................................................................... 73

Referências ........................................................................................................................................... 75

Lista de Figuras

Figura 1 - Fluxos de energia e exergia presentes num sistema global económico. Fonte: Guevara et al. (2014) ... 5

Figura 2 – Valores de exergia por categorias de trabalho útil: exergia final (esquerda) e exergia útil (direita)

Fonte: Miguel Palma, 2014 ................................................................................................................................... 10

Figura 3 – Estrutura de exergia útil em Portugal, valores absolutos (esquerda) e valores relativos (direita). Fonte:

Miguel Palma, 2014 .............................................................................................................................................. 11

Figura 4 - Diagrama conceptual de exergia primária para trabalho útil (Brockway et al., 2014) ......................... 13

Figura 5 - Diagrama E-Sankey da China – 1971 (Brockway et al., 2014) ............................................................ 14

Figura 6 - Diagrama E-Sankey da China – 2010 (Brockway et al., 2014) ............................................................ 15

Figura 7 - Fluxograma de análise de trabalho útil (Brockway et al., 2014) .......................................................... 15

Figura 8 - Comparação das intensidades de exergia primária e exergia útil da China (Brockway et al., 2014) ... 17

Figura 9 - China - Projeções de trabalho útil para 2030 (Brockway et al., 2014) ................................................. 18

Figura 10 - China - Previsões de energia primária (TPES/GDP) para 2030 (Brockway et al., 2014) ................... 18

Figura 11 - Exemplo gráfico da definição de IQR, adaptado de for Disease Control and Division [2006]. ......... 20

Figura 12 - Representação das partes de um boxplot, adaptado de Friendly and Institute [1991] ........................ 20

Figura 13 - Esquema do princípio da técnica PCA retirado de Böhm et al., 2013 ................................................ 22

Figura 14 - Representação geométrica dos loadings num modelo de PCA (Eriksson et al., 2006)....................... 23

Figura 15 - Representação de scores (a) e loadings (b) (Eriksson, 1999) ............................................................. 24

Figura 16 - Interpretação geométrica dos valores loading e score (Eriksson, 1999) ............................................. 25

Figura 17 - Modelo do neurónio (S. Haykin, 1999) .............................................................................................. 30

Figura 18 - (a) Função limiar; (b) Função linear; (c) Função sigmóide com diferentes declives (S. Haykin, 1999)

.............................................................................................................................................................................. 30

Figura 19 - Rede de única camada (esquerda) e rede de duas camadas (direita) (S. Haykin, 1999) ..................... 31

Figura 20 - Arquiteturas de RNAs (S. Haykin, 1999) ........................................................................................... 32

Figura 21 - Rede Perceptron (Zhang, 1998) .......................................................................................................... 33

Figura 22 - Rede Perceptron com várias camadas intermédias (Zhang, 1998) ..................................................... 34

Figura 23 - Rede neuronal com realimentação do output como novo input (Demuth, H. et al., 2015) ................. 36

Figura 24 - Definição do critério de paragem ....................................................................................................... 37

Figura 25 – Rede MLP feedforward (L. Ekonomou, 2009) .................................................................................. 37

Figura 26 - Comparação do consumo previsto de energia para a Grécia através de RNA, modelo de regressão e

modelo de support vector com o real (L. Ekonomou, 2009) ................................................................................. 39

Figura 27 - Esquema do modelo de feedforward multilayer perceptron (Zong Woo Geem, William E. Roper,

2009) ..................................................................................................................................................................... 40

Figura 28 - Procura de energia e correspondente indicador da Coreia do Sul (Zong Woo Geem, William E.

Roper, 2009) ......................................................................................................................................................... 40

Figura 29 - Estimação da procura de energia por meio de regressão linear múltipla (Zong Woo Geem, William E.

Roper, 2009) ......................................................................................................................................................... 41

Figura 30 - Estimação da procura de energia utilizando modelo exponencial modificado (Zong Woo Geem,

William E. Roper, 2009) ....................................................................................................................................... 42

Figura 31 - Estimação da procura de energia utilizando o modelo FF-BP-ANN (Zong Woo Geem, William E.

Roper, 2009) ......................................................................................................................................................... 42

Figura 32 - Comparação entre os três modelos de previsão da procura de energia (Zong Woo Geem, William E.

Roper, 2009) ......................................................................................................................................................... 43

Figura 33 - Gráfico representativo da evolução das variáveis............................................................................... 46

Figura 34 - Gráfico representativo da evolução do GVA ...................................................................................... 46

Figura 35 - Diagrama das etapas que compuseram o tratamento de dados e a construção dos modelos de previsão

.............................................................................................................................................................................. 47

Figura 36 – 1-step-ahead-prediction ..................................................................................................................... 49

Figura 37 - 2-step-ahead-prediction ...................................................................................................................... 49

Figura 38 - Rede neuronal dinâmica em closed loop ............................................................................................ 50

Figura 39 - Gráfico de desempenho, obtido através da ferramenta Neural Network Toolbox (Demuth, H. et al.,

2015) ..................................................................................................................................................................... 51

Figura 40 - Gráfico com as várias regressões (treino, validação e teste), obtido através da ferramenta Neural

Network Toolbox (Demuth, H. et al., 2015) ......................................................................................................... 52

Figura 41 - Representação boxplot das variáveis, nomeadamente, 1-HTH, 2-MTH, 3-LTH, 4-MD, 5-Ele, 6-GVA

.............................................................................................................................................................................. 54

Figura 42 - Correlação segundo Pearson com nível de significância de 10e-36 ................................................... 55

Figura 43 - Componente 1 versus Componente 2 ................................................................................................. 57

Figura 44 - Gráfico ScreePlot ............................................................................................................................... 57

Figura 45 - Estrutura da rede retirada do software MATLAB .............................................................................. 58

Figura 46 – Representação de HTH segundo a RNA ............................................................................................ 59

Figura 47 - Representação de MTH segundo a RNA ............................................................................................ 59

Figura 48 - Representação de LTH segundo a RNA ............................................................................................. 60

Figura 49 - Representação de MD segundo a RNA .............................................................................................. 60

Figura 50 - Representação de Ele segundo a RNA ............................................................................................... 61

Figura 51 - Erro global das variáveis .................................................................................................................... 62

Figura 52 - Representação de HTH segundo a Regressão Linear Múltipla .......................................................... 63

Figura 53 - Representação de MTH segundo a Regressão Linear Múltipla .......................................................... 64

Figura 54 - Representação de LTH segundo a Regressão Linear Múltipla ........................................................... 64

Figura 55 - Representação de MD segundo a Regressão Linear Múltipla ............................................................ 65

Figura 56 - Representação de Ele segundo a Regressão Linear Múltipla ............................................................. 65

Figura 57 - Gráfico dos resíduos da regressão linear múltipla .............................................................................. 66

Figura 58 - Representação de HTH segundo a Regressão Linear Multivariada .................................................... 66

Figura 59 - Representação de MTH segundo a Regressão Linear Multivariada ................................................... 67

Figura 60 - Representação de LTH segundo a Regressão Linear Multivariada .................................................... 67

Figura 61 - Representação de MD segundo a Regressão Linear Multivariada ..................................................... 68

Figura 62 - Representação de Ele segundo a Regressão Linear Multivariada....................................................... 68

Figura 63 - Gráfico dos resíduos da regressão linear multivariada ....................................................................... 69

Figura 64 - Evolução do erro das variáveis no ano de 2000 e 2001 para as três análises de previsão .................. 70





Lista de Tabelas

Tabela 1 - Categorias de trabalho útil para cálculo de trabalho útil (adaptada de Serrenho et al., 2014) ................ 6

Tabela 2 - Factores de exergia considerados (adaptada de Wall et al., 1994, Serrenho et al., 2014) ...................... 7

Tabela 3 - Estudos para a contabilização das conversões de energia numa sociedade ........................................... 9

Tabela 4 - Contabilidade de outputs de trabalho útil: China - 1971, 2010 (Brockway et al., 2014) ..................... 16

Tabela 5 - Sumário da análise de resultados de trabalho útil, 1971-2010 (Brockway et al., 2014)....................... 17

Tabela 6 - Exemplo de uma matriz de correlações, adaptada de Ernesto F. L. Amaral, 2011 .............................. 21

Tabela 7 - Rede MLP - variáveis de input e output (L. Ekonomou, 2009) ........................................................... 38

Tabela 8 - Resultados do modelo MPL (L. Ekonomou, 2009) ............................................................................. 38

Tabela 9 - Demanda de energia e indicador de dados da Coreia do Sul (Zong Woo Geem, William E. Roper,

2009) ..................................................................................................................................................................... 41

Tabela 10 - Comparação dos resultados dos vários modelos utilizados para previsão da demanda de energia

(Zong Woo Geem, William E. Roper, 2009) ........................................................................................................ 42

Tabela 11 - Dados disponibilizados ...................................................................................................................... 45

Tabela 12 - Matriz de correlações das variáveis disponibilizadas ......................................................................... 54

Tabela 13 - Componentes principais do PCA ....................................................................................................... 56

Tabela 14 - Valores próprios de cada componente principal ................................................................................ 56

Tabela 15 – Erro quadrático médio da RNA ......................................................................................................... 61

Tabela 16 - P-value da regressão para cada variável ............................................................................................. 63

Tabela 17 - Erros da regressão linear múltipla ...................................................................................................... 65

Tabela 18 - Erros da regressão linear multivariada ............................................................................................... 69

Tabela 19 - Comparação de erros ao longo dos 50 anos ....................................................................................... 70

Tabela 20 - Comparação de erros ao longo dos 10 anos de previsão .................................................................... 70

Abreviações

ANN Artificial neural networks

BP British Petroleum

CHP Combined Heat and Power

Ele Other Electric Uses + Light

𝑬𝒖 Exergias úteis

EUA Estados Unidos da América

FF-BP-ANN Feed Forward BackPropagation Artificial Neural Network

GDP Gross Domestic Product

GVA Gross Added Value (Valor Acrescentado Bruto)

HTH High Temperature Heat

IDA Index Decomposition Analysis (Método de decomposição do índex)

IEA International Energy Agency (Agência Internacional de Energia)

IIASA International Institute for Applied Systems Analysis

INE Instituto Nacional de Estatística

IQR Interquartile Range (Distância inter-quartis)

L Light

LDMI Logarithmic Mean Divisia Index

LNG Gás Natural Liquefeito

LPG Liquified Petroleum Gases

LTH Low Temperature Heat

MD Mechanical Drive

MLP Multi-layer Perceptron (Rede Perceptron de multicamadas)

MSE Mean Squared Error (Erro Quadrático Médio)

MTH Medium Temperature Heat

NARX Nonlinear AutoRegressive with exogenous input (Não linear auto regressiva com entrada exógena)

OE Other electric uses

PC Principal Component (Componente Principal)

PCA Principal Component Analysis (Análise de Componente Principal)

PIB Produto Interno Bruto

RNA Rede Neuronal Artificial

SMD Stationary Mechanical Drive

T Transport

TPES Total primary energy supply

USEIA US Energy Information Administration

1

1. Introdução

A dinâmica do consumo energético em todo o mundo tem-se demonstrado genericamente bastante variável

concorrendo diversos fatores para a necessidade de conhecimento aprofundado da sua evolução (Miguel Palma,

2014).

É incontornável a forte dependência da utilização de energia gerada a partir de combustíveis fósseis, cujas variáveis

de mercado, quer na perspetiva da oferta quer da procura, se têm mostrado bastante voláteis. Esta dependência é

tanto mais sensível quanto maiores forem as variações na taxa de crescimento económico dos grandes

consumidores mundiais e do papel da estratégia geopolítica dos grandes produtores de petróleo. Este facto

condiciona o controlo dessas mesmas variáveis, sendo que é cada vez mais necessário que os países desenvolvidos

tenham a sua situação financeira e orçamental equilibrada.

Esta necessidade leva a que o planeamento financeiro e a afetação de recursos dedicados ao sector energético,

veículo central no crescimento económico dos países, deva ser feito com extremo rigor e detalhe permitindo uma

gestão eficiente dos referidos recursos financeiros. Este facto deverá garantir a capacidade para fazer face às

necessidades energéticas, mas ao mesmo tempo, não poderá esgotar estes recursos. Deverá, isso sim, libertá-los,

quando supérfluos para áreas em que são criticamente requeridos, nomeadamente para o desenvolvimento social

e saúde das populações.

Os países consumidores de energia, elemento fundamental nas suas políticas de desenvolvimento, devem assim

garantir que têm fontes seguras de fornecimento, que consomem a energia de modo eficiente e que garantem a

proteção do meio ambiente, mas que, ao mesmo tempo, desenvolvem modelos de flexibilização e de redução de

dependência da energia gerada a partir de combustíveis fósseis.

A análise e estudo de eficiência da utilização e consumo energético são fundamentais e alguns modelos e conceitos

têm sido utilizados, nomeadamente os de energia e de exergia. A exergia analisa a qualidade do consumo e da

utilização da energia, ou seja a sua capacidade de produzir trabalho, medindo também o grau de eficiência de um

processo de utilização de energia. Consegue levar a cabo este estudo focando-se nos processos propriamente ditos,

independentemente do modo de utilização de energia, e calculando assim qual o seu desvio da performance ideal.

A utilização do conceito de exergia permite calcular qual o valor mínimo de energia a fornecer para um

determinado trabalho gerado (Miguel Palma, 2014).

2

1.1 Motivação e Objetivos do Trabalho

No decorrer desta dissertação apresenta-se um novo estudo que combina a abordagem das Redes Neuronais

Artificiais (RNA) com a evolução temporal da exergia útil com o intuito de fazer previsões de consumos

energéticos.

Exemplos da utilização de RNA para fazer previsões do consumo de energia usando dados de energia final podem

ser encontrados na literatura, por exemplo, nos casos da Grécia e Coreia do Sul, apresentados nas secções 4.8.1 e

4.8.2, e o caso da China que utiliza a exergia útil para fazer essa mesma previsão, apresentado na secção 2.2.1.

Igualmente, no trabalho de Percebois (1979) suportado por Serrenho et al. (2014) sugere-se que a intensidade

energética (consumo energético em função do PIB) era mais bem calculada no último patamar da cadeia energética

pelo facto de calcular as necessidades para satisfazer os diferentes utilizadores finais. Esta dissertação proporciona

conhecimentos adicionais sobre este assunto, pois aborda de forma pioneira a utilização de RNA para fazer

previsões de exergia útil por tipo de uso.

Utiliza-se ao longo deste trabalho o valor da exergia em vez de energia, pois a exergia permite contabilizar um

aspeto quantitativo da energia, mas também contabiliza a qualidade das diferentes formas de energia. Esta

qualidade é medida como a capacidade de transformar uma dada forma de energia em trabalho.

A análise de exergia apresenta algumas vantagens, tais como:

Permite contabilizar e analisar as fontes de energia pela sua capacidade de produzir trabalho (Serrenho,

2013);

Permite avaliar o potencial termodinâmico sempre pela mesma referência, o que a torna indiferente do

fator de conversão aplicado ao mecanismo ou à fonte de energia, permitindo fazer uma análise

comparativa entre eles, tendo como limite o valor de 100%.

Com base nos pontos anteriores, conclui-se que a análise exergética é preferível para realizar o estudo da utilização

final de energia num sistema, por exemplo, o sistema económico de um país.

É também de referir que, apesar de haver três estágios de exergia, primário, final e útil, os dados que são utilizados

são os de exergia útil. A energia primária pretende quantificar o conteúdo energético dos recursos utilizados,

enquanto que a energia (exergia) útil quantifica as necessidades de trabalho dos utilizadores finais da energia.

Assim, representa as necessidades reais de um país e permite ter uma perceção da relação direta com a

produtividade e nível económico.

O objetivo deste trabalho é, desta forma, projetar um sistema que permita efetuar a previsão dos consumos de

energia ao longo dos anos, através dos seguintes passos:

1. Análise das curvas da evolução de trabalho (exergia) útil em Portugal no período compreendido entre

1960 e 2009;

2. Criação de uma ferramenta computacional que, baseada em modelos de redes neuronais artificiais, seja

capaz de projetar os níveis de exergia útil por tipo de uso;

3. Verificação da importância de uma correta definição dos dados de entrada e de saída da rede neuronal,

comparando os resultados deste estudo com os resultados de outros estudos competitivos;

3

4. Estudo de análise de sensibilidade que permita encontrar os parâmetros mais importantes na previsão.

Para a elaboração deste trabalho, foi consultada vasta bibliografia, a qual permitiu obter dados, processos, métodos

e também otimizações e estimativas que foram integradas no estudo.

A ferramenta computacional desenvolvida permite a sua potencial utilização por interessados em explorar e

desenvolver os resultados.

1.2 Estrutura da Dissertação

A estrutura do documento é a seguinte:

(a) A secção 2: “Análise de energia” apresenta os conceitos gerais necessários para a compreensão de

conceitos, tais como os conceitos de energia e de exergia. A apresentação é feita através de trabalhos

anteriormente desenvolvidos sobre eficiências e trabalho útil, assim como, o caso de estudo realizado

para a China.

(b) A secção 3: “Descrição dos métodos” descreve os principais métodos que vão ser primeiramente usados

na análise das variáveis e métodos de comparação às redes neuronais.

(c) A secção 4: “Modelação com Redes Neuronais” descreve conceitos de redes neuronais artificiais e casos

de estudo em que redes neuronais foram utilizadas.

(d) A secção 5: “Dados e Metodologia”, descreve os principais métodos que vão ser usados na tentativa de

alcançar o objetivo pretendido neste trabalho.

(e) A secção 6: “Resultados e discussão”, apresenta os resultados do trabalho bem como uma discussão do

método aplicado.

(f) Por fim, na secção 7: “Conclusão e Trabalho Futuro” são retiradas as principais conclusões do trabalho e

indicadas sugestões para trabalhos futuros.

4

2. Análise da energia

O presente capítulo tem por objetivo introduzir conceitos que serão importantes para se poder acompanhar o

desenvolvimento do trabalho. São definidos os conceitos de fluxos de utilização e consumo de energia e exergia

e, de eficiência energética e exergética à escala nacional.

2.1 Exergia primária, final e útil

Antes de mais, devem ser definidos alguns conceitos utilizados na análise de energia. Conceitos como os fluxos

de energia e exergia primário, final e útil são importantes definições quando se analisa a cadeia energética.

Definições de energia

Em condições normais, a cadeia energética compreende, desde a sua origem até à sua utilização final, três estágios:

energia inicial, energia final e energia útil, relacionando-se todas elas por vários processos de conversão.

A energia inicial (ou primária) é a primeira fase da cadeia de energia e está relacionada com a forma em que esta

se encontra na natureza, sem qualquer processo de conversão ou transformação (Boyle e al., 2003).

A segunda fase de energia na cadeia energética é designada por energia final. A energia final é a energia que está

disponível para consumo por qualquer utilizador final. É a energia que se obtém da energia primária, depois de

deduzidas todas as perdas originadas na transformação, transporte e distribuição. É uma fase (ou estágio) mais

fácil de quantificar, uma vez que se trata da energia disponibilizada para consumo, como eletricidade ou gás

disponíveis para uso doméstico ou industrial.

Na primeira fase da cadeia energética (fase inicial ou primária), quantifica-se a energia pela entalpia da fonte de

energia disponibilizada na natureza (petróleo, carvão); na segunda fase, ela é quantificada pela entalpia da energia

que é fornecida para consumo (eletricidade, combustíveis, etc.) (Serrenho, 2013).

A energia final fornecida para uma qualquer utilização não é consumida na sua totalidade, devido às perdas que

se geram nos mecanismos de utilização final (exemplo de uma lâmpada em que parte da energia fornecida é perdida

em calor e não em iluminação gerada). A energia que o mecanismo ou consumidor utiliza para o fim pretendido é

a energia útil.

A transição de energia final para energia útil é obtida através de fatores de conversão de eficiência de uma forma

de energia para outra e depende do processo de conversão e também do mecanismo final que usa a energia.

5

Definições de exergia

Para se poder avaliar o trabalho produzido pela energia útil, é necessário definir o conceito de exergia.

Exergia é uma propriedade termodinâmica que quantifica a capacidade de produzir trabalho (Moran et al., 2010),

ou seja, a capacidade para gerar trabalho mecânico a partir de energia. A exergia é sempre quantificada

relativamente a um referencial, ou ambiente de referência. Uma ilustração para se perceber o conceito de exergia

pode ser dada com um bloco de gelo: se este bloco de gelo for usado na Antártida, o seu potencial para produzir

trabalho é muito inferior ao caso em que o bloco de gelo é colocado num deserto (devido à diferença entre as

temperaturas do ambiente e do bloco de gelo de ambos os locais: quase nula na Antártida e significativa no

deserto), logo a sua exergia é superior no segundo caso (Moran e Shapiro, 2006).

Assim, a exergia é um método muito mais eficaz para analisar e estudar o processo de utilização de energia (Ayres

and Warr, 2010, Serrenho et al., 2014, Guevara et al., 2014). Aplica-se o conceito de exergia a todos os tipos de

utilização de energia e às fontes energéticas, avaliando-se pela capacidade máxima de extrair trabalho. Permite a

aplicação de segunda lei de eficiência aos mecanismos de utilização final de energia. À semelhança da energia, na

análise da exergia à escala da sociedade também se podem definir os mesmos estágios, exergia primária (ou

primitiva), exergia final e exergia útil, como observado na Figura 1.

Figura 1 - Fluxos de energia e exergia presentes num sistema global económico. Fonte: Guevara et al. (2014)

O estudo e análise da exergia versus energia tem algumas vantagens, tais como:

Permite contabilizar e analisar as fontes de energia pela sua capacidade de produzir trabalho (Serrenho

2013)

Avalia o potencial termodinâmico sempre pela mesma referência, o que a torna indiferente do fator de

conversão aplicado ao mecanismo ou à fonte de energia, permitindo fazer uma análise comparativa entre

eles, tendo como limite o valor de 100%.

Com base nos pontos anteriores, conclui-se que a análise exergética é preferível para realizar o estudo da utilização

final de energia num sistema, como o sistema económico de um país.

6

Conversão de dados energéticos em exergia

Serrenho et al. (2013) quantificou as seguintes categorias de exergia útil: calor, trabalho mecânico que se divide

em transporte e em trabalho mecânico estacionário, luz e uso de eletricidade.

Para se compreender o estudo da primeira e da segunda lei de eficiência, para a conversão de energia final em

energia útil, os usos finais de energia têm de ser caracterizados e desagregados. Isto deve-se ao facto de não haver

dados para energia ou exergia útil, dependendo esta última do uso que é dado à energia final, que varia conforme

o fim e a categoria para que é usada.

Para que os valores finais de energia útil possam ser calculados, a conversão de eficiências de energia/exergia final

para útil têm que ser caracterizadas, a fim de se obter uma eficiência global de energia/exergia final para útil. A

Tabela 1 baseada nos estudos de Warr et al. (2010) e Serrenho et al. (2014), na coluna central, apresenta a

desagregação das categorias acima mencionadas.

Tabela 1 - Categorias de trabalho útil para cálculo de trabalho útil (adaptada de Serrenho et al., 2014)

Categorias de trabalho útil

(agregadas)

Categorias de trabalho útil

(desagregadas)

Temperatura de serviço

Calor

Calor a altas temperaturas

Calor a médias temperaturas

Calor a baixas temperaturas

500°C

150°C

80°C

Trabalho mecânico

estacionário

Petróleo

Carvão

Transporte

Locomotivas a vapor

Veículos a diesel

Veículos a gasolina/LPG

Aviação

Navegação

Veículos a gás natural

Diesel-eléctrico

Luz Carvão/Petróleo luz

Electricidade Tratada separadamente

Cálculo da Exergia Útil

Para se realizar o cálculo dos valores de trabalho útil é aplicado o método de Ayres et al. (2003) que envolve os

seguintes passos:

Conversão de dados de energia final em exergia final;

Atribuição do consumo de exergia final às categorias de trabalho útil;

Conversão de exergia final em exergia útil usando dados finais da segunda lei de eficiência para dados

úteis;

Cálculo da exergia útil agregada.

A grande generalidade dos países têm elementos estatísticos a nível energético. A partir destes dados, podem obter-

se dados de exergia pela conversão dos dados de energia. Tal conversão é obtida através de um factor de exergia

(Tabela 2), que é função da quantidade de trabalho que se obtém a partir de um determinado tipo de energia, seja

7

o tipo de energia (energia mecânica, energia química) como o veículo energético (petróleo e carvão) (Wall, 1977).

A título de exemplo, o factor 1 pode aplicar-se tanto à energia mecânica como ao veículo energético electricidade,

pois ambos podem ser convertidos totalmente em trabalho.

Tabela 2 - Factores de exergia considerados (adaptada de Wall et al., 1994, Serrenho et al., 2014)

Vectores de energia Factores de exergia

Carvão e produtos de carvão 1,06

Produtos de petróleo 1,06

Carvão Coke 1,05

Gás natural 1,04

Combustíveis renováveis 1,11

Electricidade 1,00

CHP e calor geotérmico 0,60

Para o carvão, petróleo, gás natural e outros combustíveis pode verificar-se que o factor exergético é superior a 1,

embora o conteúdo exergético de um recurso seja sempre mais baixo ou igual ao conteúdo energético. Isto ocorre,

porque os valores apresentados nos balanços de energia do IEA é a entalpia de combustão (calor libertado durante

a combustão), enquanto o conteúdo exergético também inclui a energia química do recurso (Cullen e Allwood,

2010b).

Eficiência Energética

O conceito de eficiência energética de uma determinada economia é o que estabelece a relação entre os diferentes

estágios energéticos (primário – final – útil). Podem determinar-se vários agrupamentos de eficiência, como da

primária para final, da primária para útil ou da final para útil, sendo necessário calcular primeiro a eficiência

específica de cada processo ou veículo energético para depois se determinar a eficiência energética de qualquer

agrupamento referido acima.

O cálculo da eficiência energética específica é efetuado através das duas leis de eficiência termodinâmica, a

primeira lei (eficiência energética) e a segunda lei (eficiência exergética). Apresenta-se de seguida uma explicação

sobre as mesmas.

Eficiência Energética

A 1ª lei refere-se à eficiência como uma medida do desempenho (performance) quantitativo de um sistema e, é

representada pela Equação (2.1):

𝜂 =

𝑝𝑟𝑜𝑑𝑢çã𝑜 𝑑𝑒 𝑒𝑛𝑒𝑟𝑔𝑖𝑎 (𝑑𝑒𝑠𝑒𝑗𝑎𝑑𝑜)

𝑒𝑛𝑡𝑟𝑎𝑑𝑎 𝑑𝑒 𝑒𝑛𝑒𝑟𝑔𝑖𝑎

(2.1)

Esta fórmula de eficiência é útil quando se comparam os mesmos mecanismos de conversão. Mas por este facto

ela torna-se desadequada quando se comparam diferentes mecanismos de conversão, devido ao facto de ser

dependente do mecanismo (Moran et al., 2010). Algumas das limitações são referidas por Cullen e Allwood

8

(2010b), tais como: i) permitir uma eficiência > 1 não permitindo assim a comparação entre diferentes mecanismos

e ii) não considerar a qualidade do output energético, apenas a sua quantificação.

Eficiência exergética

A segunda lei considera exergia em vez de energia. Através desta é possível quantificar a qualidade de energia

usada, sendo o limite de eficiência ≤ 1.

É representada pela Equação (2.2):

𝛾 =

𝑝𝑟𝑜𝑑𝑢çã𝑜 𝑑𝑒 𝑒𝑥𝑒𝑟𝑔𝑖𝑎 ú𝑡𝑖𝑙

𝑝𝑟𝑜𝑑𝑢çã𝑜 𝑚á𝑥𝑖𝑚𝑎 𝑝𝑜𝑠𝑠í𝑣𝑒𝑙 𝑑𝑒 𝑒𝑥𝑒𝑟𝑔𝑖𝑎 ú𝑡𝑖𝑙

(2.2)

Esta fórmula (Cullen and Allwood, 2010b) permite quantificar o desvio da conversão relativamente a um

desempenho perfeito (o trabalho máximo que poderia ser obtido).

Exergia útil: definição e contabilização

Para a gestão equilibrada dos orçamentos financeiros de um país é fundamental ter-se um conhecimento das

necessidades energéticas num prazo alargado de tempo, alocando os recursos financeiros necessários para a

implantação e melhoria dos sistemas de distribuição, consumo e utilização da energia e libertar outras verbas para

áreas úteis necessárias ao desenvolvimento económico. Nesse sentido, o estudo do consumo e previsões

energéticas merece um especial destaque.

Ao longo do tempo, diferentes formas e métodos de análise de energia e exergia foram utilizados para se

contabilizar o fluxo de consumo energético, desde a sua origem até à utilização final. A Tabela 3 seguinte enumera

algumas referências conhecidas sobre o estudo e análise de exergia e energia (Serrenho et al., 2014) à escala

nacional.

9

Tabela 3 - Estudos para a contabilização das conversões de energia numa sociedade

10

Da análise da tabela constata-se que existem dois métodos de avaliação temporal, seja a que é efetuada no período

de um ano ou a que cobre um período mais alargado de anos. Tal está relacionado com o objetivo do estudo, pois

um período de análise curto permite avaliar a eficiência do consumo energético, facilitando o planeamento futuro

a curto prazo, enquanto que a análise por um período longo permite avaliar o desenvolvimento e progresso

económico de um país.

Da análise da exergia depende o método utilizado para se contabilizar e calcular o trabalho útil. Segundo Ertesv�̈�g

(2005), existem duas formas de abordagem quando se analisa a utilização de energia e o cálculo de trabalho útil.

Estas são o estudo feito por Reistad (1975) sobre a sociedade dos Estados Unidos da América (EUA) e a outra é a

análise utilizada por Wall (1987) sobre a sociedade da Suécia. A diferença principal é a inclusão dos fluxos de

matéria no estudo de Wall, segundo Utlu e Hepbasli (2007).

Perfil energético de Portugal

O território português, incluindo os arquipélagos, tem uma população de cerca de 10,5 milhões de habitantes e

uma área de cerca 9,2 milhões de hectares o que significa uma densidade populacional de 114 habitantes por km

quadrado (INE, 2012).

Portugal é actualmente dependente da importação de energia, especialmente energia derivada de hidrocarbonetos,

estando a produção de energia primária cingida à produção por fontes renováveis.

A principal fonte ou veículo energético é o petróleo, importado de países Africanos e do Médio Oriente, sendo

posteriormente refinado em produtos finais nas duas refinarias existentes, em Matosinhos e Sines. Parte dos

produtos finais derivados da refinação são exportados, nomeadamente para os EUA.

Figura 2 – Valores de exergia por categorias de trabalho útil: exergia final (esquerda) e exergia útil (direita) Fonte: Miguel

Palma, 2014

A extração de carvão terminou em Portugal em 1994, tendo sido inicialmente usada para a locomoção

(locomotivas) e produção energética, como alternativa à produção hidroelétrica em anos ou períodos de fraca

pluviosidade. Na Figura 2 podemos observar os valores de exergia por categorias de trabalho útil (other electric

uses: OE, light: L, transporte: T, stationary mechanical drive: SMD, high temperature heat: HTH, medium

temperature heat: MTH e low temperature heat: LTH)

A importação e consumo de gás natural (LNG) tem vindo a crescer desde 1997, sendo essencialmente importado

por pipeline do norte de África ou por via marítima (LNG tanker´s) da Nigéria. A sua utilização na produção de

eletricidade ganha cada vez maior relevância, como se verifica na Figura 3 seguinte:

11

Figura 3 – Estrutura de exergia útil em Portugal, valores absolutos (esquerda) e valores relativos (direita). Fonte: Miguel

Palma, 2014

2.2 Previsões de procura de energia

A energia é considerada um fator importante para o desenvolvimento económico e social de um país e,

consequentemente, a riqueza do povo.

O peso da componente energética nos orçamentos de cada país, principalmente nos dos Estados importadores de

energia fóssil ou elétrica, assim como a sua importância no domínio geopolítico e estratégico de cada nação levam

a que seja crucial dispor de um conhecimento tão rigoroso quanto possível das suas reais necessidades de consumo

de energia. Este conhecimento traduz-se nas vertentes de valor, de tipo de energia (fóssil, elétrica, renovável,

nuclear, etc.), tudo num horizonte de tempo de tão longo quanto possível, em geral um horizonte temporal de vinte

anos.

Tal previsão pode ser efetuada através de vários processos e assentar em pressupostos diversos, fazendo assim face

à necessidade de gestão das incertezas, fator que se agrava num período de tempo longo, como incertezas no

evoluir das sociedades, nos desenvolvimentos tecnológicos que podem influenciar essas mesmas previsões e

incertezas geopolíticas.

As previsões têm também um papel fundamental no comportamento e no desenvolvimento das sociedades,

principalmente pelo facto de evidenciarem o futuro e, assim permitirem que as sociedades se adequem e ajustem

ao resultado dessas mesmas previsões.

Como referido anteriormente, a previsão permite aos países e seus governos ter um conhecimento antecipado sobre

os recursos financeiros necessários, quer ao nível de importação de produtos energéticos, quer no que respeita aos

investimentos necessários no desenvolvimento e melhoramento das infraestruturas que permitem fazer face às

necessidades energéticas futuras dos países.

As previsões sobre as necessidades futuras são úteis para os responsáveis de planeamento atual, mas menos

importantes para os responsáveis e utilizadores futuros.

Tipos de previsão

Nos diferentes modelos de previsão de necessidades energéticas, os pressupostos têm em consideração o

comportamento humano e também o fator de inovação.

Os outputs dos modelos de previsão podem ter uma importância direta no comportamento das sociedades e os seus

resultados podem ser utilizados para a mudança de comportamento das mesmas, como por exemplo, no caso do

12

efeito de estufa e aquecimento global, que impulsionam fortemente o fator eficiência energética (P.P. Craig et al.,

2002).

Existem alguns modelos de previsão, tendo as técnicas de previsão sido amplamente descritas por Armstrong na

década de 90. (P.P. Craig et al., 2002)

Foi definido que as metodologias utilizadas se resumem a seis categorias (P.P. Craig et al., 2002):

1. Em termos simples pensa-se que o futuro será uma leve extensão do passado com a sua força e

a sua fraqueza, uma vez que, as projeções de tendências baseiam-se em correlações empíricas. A aproximação

pode resultar na falta de uma mudança estrutural (por exemplo para previsões a curto prazo) e é também útil para

previsões para negócio, previsões essas que geralmente vêem o futuro como uma leve continuação de taxas de

crescimentos históricos. A maior fraqueza nas aproximações baseadas em projeções de tendências é que elas

desencorajam a identificação dos fatores que são relevantes. Geralmente estes modelos não incluem a causalidade

e não conseguem identificar as contradições que possam surgir e, estas podem ser críticas na compreensão futura;

2. As projeções econométricas são uma extensão alargada das projeções de tendências. As

projeções econométricas obtidas computacionalmente permitem explorar as relações entre muitas variáveis causais

hipotéticas. As variáveis dependentes, tais como, a energia consumida ou emissões de carbono podem estar ligadas

com variáveis independentes, tais como, o preço e o poder monetário. A projeção econométrica reside na análise

regressiva de dados históricos e, assim, assume uma rigidez estrutural na economia. Quanto às projeções de

tendências, a força das técnicas econométricas reside nas previsões a curto prazo, enquanto que as modificações

estruturais e as tecnologias adotadas são limitadas nos seus efeitos em virtude das falhas na produção. Assim as

projeções econométricas tornam-se menos úteis a longo prazo, porque a maior experiência que o passado mostrou,

nos quais os parâmetros econométricos se baseiam, foi que não refletiu durante muito tempo as condições futuras;

3. A análise de utilização final divide o sector da energia em distintos subsectores tecnológicos.

As projeções totais são construídas a partir de análises sectoriais de vários end-uses (iluminação, arrefecimento,

refrigeração, aquecimento). Esta aproximação começa por perguntar, “Quem usa mais energia para esses fins?”

assim, isto foca-se nos serviços que usam a energia e nas características tecnológicas dos aparelhos que fornecem

esses serviços. Como estes modelos representam explicitamente a utilização final e as tecnologias a si associadas

é relativamente fácil incorporar modificações antecipadas na tecnologia e na sua política (autonomização,

refrigeração, níveis eficientes de iluminação);

4. A análise combinada emprega métodos regressivos, quando as tendências parecem ser robustas

e quando são mais fracas utiliza a análise de utilização final. Esta espécie de análise está a ser mais usada tanto na

indústria como no governo. As análises combinadas juntam engenheiros e economistas permitindo-lhes combinar

as ferramentas mais analíticas de cada grupo;

5. A dinâmica de sistemas aproxima modelos de engenharia, modelos sociais e sistemas

económicos como uma combinação de reservatórios que podem acumular e descarregar quantidades interessantes

de energia, população e dinheiro. As aproximações da dinâmica de sistemas a modelos de energia não têm sido

amplamente usados na política do trabalho, embora tenham sido extensivamente usados em estudos universitários.

Os modeladores da dinâmica de sistemas no campo da energia não têm, geralmente, incorporado a riqueza da

engenharia e da economia, e os dados demográficos têm sido desenvolvidos por outros estudos. A referida

13

dinâmica tem sido muito usada noutras áreas, tais como, a escassez das pescas e das relações entre o predador e a

presa.

6. A análise de cenários. O termo cenário foi introduzido por Herman Kahn. Os cenários são

conceções descritivas de possíveis energias futuras. As descrições podem ser elevadas a qualquer grau, incluindo

análises numéricas. Uma análise de cenário ajuda a tornar as conclusões mais explícitas. No seu melhor, a análise

de cenário pode levar os seus utilizadores a considerar hipóteses que não tinham concebido anteriormente. A

qualidade dos cenários depende criticamente da experiência e da sabedoria da equipa que o constrói. Os melhores

cenários mostram a possibilidade de modificações estruturais, enquanto que, os fracos assumem, sem uma reflexão

cuidadosa, que os resultados da análise continuarão imutáveis indefinidamente.

Uso de exergia útil para fazer previsões para a China

São escassas as análises de exergia útil para a China, apesar de este ser o maior consumidor mundial de energia.

Assim torna-se de vital importância para este país ter uma análise de necessidades energéticas no futuro baseada

em elementos e dados que permitam ter uma previsão correta e realista dessas necessidades.

Para tal é fundamental ter-se uma análise baseada na exergia útil pelo facto de a mesma ter em consideração mais

componentes da cadeia de fornecimento energético comparativamente a uma análise tradicional de necessidades

energéticas, por ser o último patamar em que se quantifica a energia antes de ser transformada em serviço

produzido, Figura 4.

Figura 4 - Diagrama conceptual de exergia primária para trabalho útil (Brockway et al., 2014)

Percebois (1979) sugeriu (e suportado por Serrenho et al., 2014) que a intensidade energética (consumo energético

em função do PIB) era mais bem calculada no último patamar da cadeia energética por calcular as necessidades

para satisfazer os diferentes utilizadores finais.

No caso da China existem muito poucas análises exergéticas que examinem resultados numa base temporal. Para

combater este gap o estudo desenvolvido por Brockway et al. (2014) propõe um método de três análises distintas,

mas interligadas entre si, que consiste nos seguintes passos:

1. Analisar os dados existentes sobre eficiência exergética e trabalho útil para o período de 1971 a 2010;

2. De seguida utilizar o método de decomposição de índex (IDA) para identificar os parâmetros principais

para análise das alterações de exergia útil;

14

3. Utilizar um método de cálculo para projetar as necessidades energéticas da China até 2030 e também

testar as implicações da redução da eficiência exergética no futuro, derivada do facto de a eficiência

exergética obtida pela evolução de uma sociedade principalmente agrícola para industrial ser diluída pela

utilização de processos menos eficientes, como ar-condicionado por exemplo (dilution factor).

Nas figuras seguintes estão representados os Diagramas E-Sankey da China para o ano de 1971 (Figura 5) e 2010

(Figura 6).

Figura 5 - Diagrama E-Sankey da China – 1971 (Brockway et al., 2014)

15

Figura 6 - Diagrama E-Sankey da China – 2010 (Brockway et al., 2014)

No caso da China, a relação entre as tarefas energéticas, trabalho útil, eficiência exergética e exergia inicial é

representada pelo fluxograma da Figura 7:

Figura 7 - Fluxograma de análise de trabalho útil (Brockway et al., 2014)

16

Utilizando os dados da Agência Internacional de Energia (IEA) obtém-se os valores de exergia útil, exergia

primária e eficiência exergética apresentados na Tabela 4:

Tabela 4 - Contabilidade de outputs de trabalho útil: China - 1971, 2010 (Brockway et al., 2014)

Estes valores, mapeados em quatro classes principais, são a base de input para o método de cálculo de

decomposição analítica Logarithmic Mean Divisia Index (LDMI). Este método foi utilizado para se obter a

contribuição relativa da eficiência energética e exergética na exergia útil a nível das classes principais.

Após a análise histórica e decomposição analítica desenvolveu-se um método baseado no trabalho útil para se

fazer a previsão energética até 2030, baseado na extrapolação do PIB e na extrapolação da eficiência das “tarefas

exergéticas”, num cenário de eficiência constante e, também, num cenário de redução da eficiência exergética

devido ao efeito da diluição (Brockway et al., 2015, pg. 895).

17

Os resultados da exergia útil, exergia primária e eficiência exergética entre 1971 e 2010 são apresentados na Tabela

5:

Tabela 5 - Sumário da análise de resultados de trabalho útil, 1971-2010 (Brockway et al., 2014)

Da análise da mesma constata-se que a eficiência exergética agregada cresceu de 5,3% para 12,5%, devido

fundamentalmente à mudança social de trabalho intenso para uma sociedade mais industrializada. O crescimento

de eficiência exergética coloca a China como tendo melhor performance que os EUA. Tal facto deve-se somente

a que o crescimento acelerado da economia chinesa utiliza mais processos industriais e temperaturas de calor mais

elevadas do que uma sociedade americana cujo desenvolvimento e progresso está mais amadurecido. Aplicando

este princípio de amadurecimento das sociedades ao caso da China é de prever uma diluição de eficiência

exergética e, por conseguinte um abaixamento neste fator.

O trabalho útil e intensidade energética primária estão representados na Figura 8:

Figura 8 - Comparação das intensidades de exergia primária e exergia útil da China (Brockway et al., 2014)

A maior estabilidade da intensidade da exergia útil versus energia primária sugere que esta está mais diretamente

ligada ao GDP, sendo o seu crescimento até 2030 representado pela Figura 9:

18

Figura 9 - China - Projeções de trabalho útil para 2030 (Brockway et al., 2014)

Da Figura 9 verifica-se que o crescimento de exergia útil até 2030 é quase linear, isso é devido a dois efeitos se

cancelarem mutuamente: a desaceleração do crescimento do GDP e a redução de intensidade de trabalho útil.

A energia primária estimada (TPES/GDP) é calculada assumindo o cenário das eficiências. O resultado obtido é

comparado com cinco cenários publicados por agências diferentes (Fridley et al., 2012; IEA, 2013; USEIA, 2014;

BP, 2014 e IIASA, 2014), apresentado na Figura 10.

Figura 10 - China - Previsões de energia primária (TPES/GDP) para 2030 (Brockway et al., 2014)

Constata-se que o resultado obtido por este estudo é significativamente superior aos das agências referidas,

demonstrando que as análises tradicionais revelam valores mais conservadores. Demonstra-se a correlação direta

de uma menor eficiência se traduzir num menor crescimento económico e, consequentemente, menores requisitos

no trabalho útil. Também pela aplicação do método de LMDI se verifica que a eficiência energética da China

comparativamente à dos EUA se deve a uma maior intensidade de utilização de intensidade energética e não a um

desenvolvimento tecnológico maior, tendo o fator diluição um importante papel no decrescimento da eficiência

exergética.

19

3. Modelação por métodos estatísticos

3.1 Pré-tratamento de dados

Previamente à identificação de qualquer modelo dinâmico a partir de um registo de dados, é necessário ter em

conta que é indispensável uma fase de pré-tratamento de dados. Os métodos aplicados podem ser, nomeadamente,

os boxplots, os mapas de correlações e a análise dos componentes principais (PCA).

Análise estatística de 1ª ordem

Um boxplot, ou diagrama de caixa, é a representação gráfica de uma amostra que exibe a sua forma, tendência

central e variabilidade, sendo uma maneira rápida de resumir e interpretar dados. Os boxplots são úteis para

compreender a distribuição de uma amostra e fazer comparações de diversas distribuições.

Na estatística descritiva, um gráfico de caixa é uma maneira conveniente de representar graficamente grupos de

dados numéricos através dos seus quartis. Assim, o boxplot é essencialmente representado por cinco partes

(Wickham and Stryjewski, 2011): a mediana; o primeiro e o terceiro quartil que formam a “caixa”; os dados que

se encontram entre o mínimo da distribuição normal dos dados e o primeiro quartil, e os dados que se encontram

entre o terceiro quartil e o máximo da distribuição normal dos dados; o limite superior que é calculado por (𝑄3 +

1,5𝑥𝐼𝑄𝑅) e o limite inferior que é calculado por (𝑄1 − 1,5𝑥𝐼𝑄𝑅); e os outliers, ou valores discrepantes, que são

pontos que estão acima do limite superior e/ou abaixo do limite inferior.

O 𝐼𝑄𝑅 corresponde à distância inter-quartis (Interquartile Range) e no seu cálculo, 𝑄3 e 𝑄1, correspondem aos

valores do terceiro quartil e do primeiro quartil, respectivamente, de uma distribuição normal, como se pode

observar na Figura 11. As equações matemáticas que descrevem a distribuição normal podem ser encontradas em

Dixon et al. (1969).

Em suma, o diagrama de caixa (Figura 12) oferece a medida da posição central dos dados através da mediana. O

gráfico boxplot também dá uma ideia da dispersão, ou contrariamente, da concentração dos valores, através da

distância interquartílica (75% (𝑄3) − 25% (𝑄1)).

20

Figura 11 - Exemplo gráfico da definição de IQR,

adaptado de for Disease Control and Division [2006].

Figura 12 - Representação das partes de um boxplot,

adaptado de Friendly and Institute [1991]

Análise de correlações

A análise de correlações é uma ferramenta importante com aplicação em diferentes áreas do conhecimento, não só

como resultado final, mas como uma das etapas para a utilização de outras técnicas de análise. Este é um método

estatístico utilizado para estudar o grau de relacionamento entre variáveis, medindo a intensidade e a direção da

relação linear ou não-linear entre duas variáveis (Kimura, H. et al., 2009)

A medida do grau de associação linear entre variáveis é denominada por coeficiente de correlação. Este coeficiente

é representado pela letra r, e mede a força e a direção da relação linear entre duas variáveis, ou seja, se as variáveis

se encontram diretamente ou inversamente relacionadas. Contudo, há três pressupostos básicos para o uso deste

coeficiente:

- as variáveis devem estar relacionadas de forma linear. Caso contrário, o valor do coeficiente de

correlação será zero ou próximo de zero;

- as variáveis envolvidas devem ser aleatórias e ser medidas com o mínimo intervalo possível entre

cada ponto. Este coeficiente não se aplica a variáveis em escala nominal ou ordinal ou quando uma

das variáveis é manipulada experimentalmente, pois neste caso, a escolha dos valores experimentais

vai influenciar o valor de r obtido;

- para cada x dado a variável y é normalmente distribuída, ou seja, duas variáveis têm uma distribuição

conjunta normal.

Apesar de existirem várias abordagens para calcular o coeficiente de correlação entre duas variáveis, x e y, nesta

dissertação é utilizado o coeficiente de correlação de Pearson, que segundo Egghe and Leydesdor [2009] é dado

pela Equação (3.1):

𝑟 =

𝑛 ∑ 𝑥𝑖𝑦𝑖 − (∑ 𝑥𝑖𝑛𝑖=1 )(∑ 𝑦𝑖

𝑛𝑖=1 )𝑛

𝑖=1

√𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖

𝑛𝑖=1 )2𝑛

𝑖=1 √𝑛 ∑ 𝑦𝑖2 − (∑ 𝑦𝑖

𝑛𝑖=1 )2𝑛

𝑖=1

(3.1)

21

Interpreta-se então que os limites de r se encontram no intervalo [-1;1] com 1 a significar uma correlação perfeita

e 0 a significar que não existe correlação entre as variáveis (a inexistência de uma relação linear entre x e y não

exclui a possibilidade de existir uma relação não-linear entre elas). Se 𝑟 > 0 então as duas variáveis tendem a

variar no mesmo sentido, em média um aumento da variável x provoca um aumento da variável y. Se 𝑟 < 0 então

as duas variáveis tendem a variar em sentido negativo, apresentando uma relação inversa (Kimura, H. et al., 2009)

Para uma análise estatística dos dados históricos de diversos universos é utilizada a matriz de correlações, que

identifica visualmente as variáveis envolvidas no estudo que se relacionam entre si. A matriz de correlações é,

deste modo, uma matriz quadrada que apresenta as correlações entre todos os pares de variáveis. Na diagonal

principal todos os elementos são iguais a 1, visto que cada variável é totalmente correlacionada com ela mesma.

A matriz de correlação é sempre simétrica com os valores à esquerda da diagonal a serem um espelho dos valores

acima da diagonal (Yeh et al., 2007). Na Tabela 6, pode-se observar um exemplo de uma matriz de correlações.

Nesta tabela, observa-se por exemplo, que o termo “terpro” e o termo “escoarg” estão inversamente relacionadas

e que o termo “terpro” e o termo “aguarg” têm um coeficiente de correlação mais próximo de zero, ou seja, não

têm uma correlação muito forte (Ernesto F. L. Amaral, 2011).

Tabela 6 - Exemplo de uma matriz de correlações, adaptada de Ernesto F. L. Amaral, 2011

terpro aguarg escoarg lixod eletrica

terpro 1,0000

aguarg 0,0021 1,0000

escoarg -0,0192 0,2343 1,0000

lixod 0,1246 0,4393 0,5296 1,0000

eletrica 0,1214 0,2126 0,1253 0,1435 1,0000

3.2 Análise de componentes principais (PCA)

Definição do método de PCA

A análise de componentes principais (PCA) é um dos métodos da estatística multivariada mais utilizado e

reconhecido pela sua capacidade de redução de dados, eliminação de sobreposições e escolha das formas mais

representativas de dados, a partir de combinações lineares das variáveis originais. O objetivo principal da PCA é

encontrar combinações lineares das variáveis iniciais que expliquem o máximo possível da variação existente nos

dados e os permitam descrever, através de um modelo matemático concreto bem definido e, conduz geralmente a

uma única solução. A análise pelo método PCA é utilizada em várias indústrias e com diferentes fins, como por

exemplo, análise sensorial, desenvolvimento de novos produtos e controlo de qualidade, estudos de foro

psicológico, entre outros (Eriksson et al., 2006).

A ideia fundamental desta análise é a redução da dimensionalidade de um conjunto de dados que é composto por

um número considerável de variáveis, perdendo o mínimo de informação possível. Isto é obtido através de técnicas

de redução de dados que examinam as correlações entre as variáveis originais e transformam-nas num menor

conjunto de variáveis, designado por componentes principais (Principal Component - PC). Cada componente

principal é uma combinação linear de todas as variáveis originais. Estas são linearmente independentes entre si e

estimadas com o propósito de reter o máximo de informação, em termos da variância total contida nos dados. O

22

processo de transformação das variáveis originais em componentes principais, também visa eliminar algumas

variáveis originais que possuam informação redundante (Varella, 2008).

Cabe frisar que a PCA é mais apropriada se as variáveis estiverem interrelacionadas, pois só assim é possível

reduzir o número de variáveis a um número menor de componentes principais, sem perda significativa de

informação. Quanto maior for a correlação entre as variáveis maior redução de dados e vice-versa, isto é: se as

variáveis não estão correlacionadas entre si, então cada componente principal explicará a mesma quantidade de

variância, não sendo possível atingir o objetivo de redução de dados; por outro lado, se as variáveis estão

perfeitamente correlacionadas entre si então a primeira componente principal explicará toda a variância dos dados

(Eriksson et al., 2006).

A transformação dos dados originais (matriz X) para um novo sistema de coordenadas pode ser descrito pelas

matrizes: matriz dos scores (T), matriz dos loadings (P) e matriz E que contém o ruído presente nos dados originais,

Figura 13. A matriz dos scores ilustra a estrutura nos dados e a matriz dos loadings ilustra a influência das

diferentes variáveis na estrutura dos dados (Böhm et al., 2013).

Figura 13 - Esquema do princípio da técnica PCA retirado de Böhm et al., 2013

Contribuição e interpretação de cada componente principal

Quando aplicamos a análise de componentes principais com o objetivo de reduzir o número de variáveis em estudo,

esperamos que as primeiras componentes expliquem uma proporção significativa da variância total dos dados.

Desta forma, é esperado que os dados possam ser representados por um pequeno número de componentes

principais sem que haja uma perda significativa de informação. A contribuição de cada componente principal é

expressa em percentagem.

As componentes principais são calculadas por ordem decrescente de importância, ou melhor, a primeira explica o

máximo possível da variância dos dados originais, a segunda explica o máximo possível da variância ainda não

explicada, e assim por diante. A última componente principal será a que menor contribuição dará para a explicação

da variância total dos dados originais. Ou seja, cada combinação linear explica o máximo possível da variância

não explicada e terá de ser ortogonal a qualquer outra combinação já definida. Geralmente, o conjunto de todas as

combinações encontradas constitui uma solução única.

A interpretação de cada componente principal é realizada verificando o grau de influência que cada variável da

matriz X tem sobre cada componente principal. O grau de influência é dado pela correlação entre cada variável de

X e o componente principal que está a ser interpretado. Para comparar a influência de cada uma das variáveis de

X sobre, por exemplo, o primeiro PC, analisa-se o loading de cada variável sobre esse componente (Varella, 2008).

23

Em relação ao número de componentes principais a reter numa análise, este depende da quantidade de informação

que estamos dispostos a perder, o que se traduz na quantidade de variância não explicada que se pode admitir. Não

existe um modelo estatístico que ajude nesta decisão. No entanto, para aplicação em diversas áreas do

conhecimento o número de componentes utilizadas tem sido aquele que acumula 70% ou mais de proporção da

variância total.

Representação gráfica dos componentes principais

A ideia básica da análise de componentes principais é sumarizar dados que contêm muitas variáveis (𝑝) num

conjunto menor de (𝑘) variáveis compostas, derivadas a partir do conjunto original. Esta análise utiliza um

conjunto de dados representado por uma matriz de 𝑛 registos por 𝑝 atributos, que podem estar correlacionados, e

sumariza esse conjunto por eixos não correlacionados (componentes principais) que são uma combinação linear

das 𝑝 variáveis originais. Tal como descrito no ponto acima, as primeiras k componentes contêm a maior

quantidade de variação dos dados.

Geometricamente, os objetos são representados por uma nuvem de n pontos num espaço multidimensional, com

um eixo para cada um dos p atributos. O objetivo da PCA é transformar os eixos desse espaço p-dimensional para

novas posições, eixos principais (PC), em que são ordenados de tal maneira que o PC1 tem a maior variância, o

PC2 tem a próxima maior variância, e assim em diante, até que o último eixo tem a menor variância.

Abaixo, na Figura 14, observa-se um conjunto de dados representados pelos seus dois primeiros componentes

principais, PC1 e PC2. O PC1, primeiro PC, é a linha que melhor descreve a forma da nuvem de pontos que se

observam nestas figuras. O PC1 representa a direção onde existe maior variância nos dados. O segundo PC, PC2,

é orientado de modo a que reflita a segunda maior fonte de variância nos dados, mas de forma a ser ortogonal ao

primeiro PC. Estes dois PCs definem assim um plano num espaço em k-dimensões, possibilitando visualizar a

estrutura dos dados, em observação (Eriksson et al., 2006).

Figura 14 - Representação geométrica dos loadings num modelo de PCA (Eriksson et al., 2006)

Para generalizar para p-dimensões tem que se tomar as primeiras k componentes, pois estas definem um hiperplano

k-dimensional que “melhor se ajusta” à nuvem de pontos. Todavia, não é tão interessante projetar graficamente

mais de dois componentes, uma vez que estar-se-ia a projetar dados para k dimensões, eliminando um dos

principais objetivos do uso das PCA – a redução de dimensão dos dados.

24

Scores Plot e Loadings Plot

Na análise de componentes principais, o agrupamento das amostras define a estrutura dos dados através de gráficos

de scores e loadings, cujos eixos são componentes principais (PCs) nos quais os dados são projetados. Os scores

fornecem a composição dos PCs em relação às amostras, enquanto os loadings fornecem essa mesma composição

em relação às variáveis (Eriksson, 1999).

Como os PCs são ortogonais, é possível examinar (e identificar) as relações entre amostras e variáveis através dos

gráficos dos scores e dos loadings. O estudo conjunto de scores e loadings ainda permite estimar a influência de

cada variável em cada amostra.

Da forma mais simplificada, os gráficos scores e loadings são representados conforme a Figura 15:

É possível deduzir algumas interpretações destas representações, tais como, as variáveis que estão perto têm

elevada correlação; as amostras que estão perto são semelhantes; e variáveis no lado oposto de origem têm

correlação negativa.

A Figura 16 abaixo fornece a interpretação geométrica dos valores loading e score para a observação “1”, num

gráfico a duas dimensões com duas variáveis 𝑥1 e 𝑥2. A direção de maior variabilidade das amostras é indicada

pela recta que representa um componente principal. Os scores são as projecções das amostras na direcção dos

componentes principais e os loadings são os ângulos entre cada componente principal e cada variável (Eriksson,

1999).

(a) (b) Figura 15 - Representação de scores (a) e loadings (b) (Eriksson, 1999)

25

Figura 16 - Interpretação geométrica dos valores loading e score (Eriksson, 1999)

3.3 Modelos de Regressão Linear

Um modelo de regressão representa o relacionamento entre uma variável dependente e uma ou mais variáveis

independentes. Se a variável independente for única a regressão linear é simples, caso existam mais variáveis

independentes (como no presente trabalho) o modelo passa a denominar-se por modelo de regressão linear múltipla

ou modelo de regressão linear multivariada, descritos em seguida (Carla Henriques, 2010/2011).

Este modelo é geralmente utilizado em situações onde uma reta ajustada não descreve bem o comportamento a

estudar, motivo pelo qual se adicionam outras variáveis independentes. Outro dos objetivos da sua aplicação é

reduzir um grande número de variáveis com o mínimo de perda de informação, permitindo encontrar os principais

padrões de similaridade, associação e correlação entre as variáveis independentes (Sassi et al., 2011).

Regressão Linear Múltipla

Esta técnica de regressão linear múltipla é representada por uma equação que descreve a relação entre um conjunto

de variáveis quantitativas independentes 𝑥𝑖 e uma variável dependente também quantitativa 𝑦𝑖 . O objetivo é assim

determinar o conjunto de parâmetros 𝛽𝑘 que relacionam a resposta 𝑦𝑖 , neste caso as exergias úteis ou o GVA, com

as variáveis de regressão 𝑥𝑖. A equação linear que traduz o modelo é a Equação (3.2) (Coelho-Barros et al., 2008):

𝑦𝑖 = 𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + ⋯ + 𝛽𝑘𝑥𝑘𝑖 + 𝜀𝑖, 𝑖 = 1,2, … 𝑁

(3.2)

Nesta expressão 𝑘 representa o número de variáveis quantitativas independentes, 𝑖 o índice da observação, 𝑁 o

número de observações. Os parâmetros 𝛽𝑘 denominam-se coeficientes de regressão e traduzem a dependência da

resposta do sistema face à respectiva variável de regressão 𝑥𝑖 e 𝜀 representa um erro aleatório associado ao valor

observado 𝑦𝑖 . De notar que a designação de “linear” indica que o modelo é linear em relação aos parâmetros 𝛽𝑘 e,

não porque 𝑦𝑖 é uma função linear dos 𝑥𝑖.

26

Em notação matricial tem-se:

O modelo de regressão linear múltipla baseia-se nos seguintes pressupostos:

• Os valores de 𝑥𝑘𝑖 são constantes predeterminadas, sem erro;

• Os erros 𝜀 são mutuamente independentes, têm valor esperado nulo e são normalmente distribuídos.

De forma a poderem ser estimados os coeficientes de regressão 𝛽𝑘 é necessário que o número de observações seja

superior ou igual ao número de coeficientes de regressão que se pretende estimar.

Regressão Linear Multivariada

A regressão linear multivariada é baseada nos mesmos pressupostos que a regressão linear múltipla com as

seguintes diferenças:

é composta por um conjunto de variáveis dependentes quantitativas 𝑦𝑖;

a equação linear que traduz o modelo é a Equação (3.3) (Graybill, 1976):

𝑦𝑖 = 𝛽𝑘𝑥𝑘𝑖 + 𝜀𝑖, 𝑖 = 1,2, … 𝑁

(3.3)

em notação matricial tem-se:

27

4. Modelação com Redes Neuronais

As redes neuronais artificiais fundamentam-se em estudos sobre a estrutura do cérebro humano, na tentativa de

reproduzir a sua forma inteligente de processar informação (Baughman & Liu, 1995). De acordo com o

Investigador Teuvo Kohonen, da Universidade de Helsinki, uma rede neuronal artificial é "uma rede massivamente

paralela de elementos interconectados e as suas organizações hierárquicas que estão preparadas para conjugar

objetos do mundo real, da mesma maneira que um sistema nervoso biológico faz" (Teuvo Kohonen, 2014). Por

outras palavras, as redes neuronais artificiais (RNA) são sistemas adaptativos desenhados com o intuito de simular

a forma como os neurónios humanos estão ligados, sendo geralmente referidas como “redes neuronais”. Estes

sistemas, além de complexos, não-lineares e paralelos tal como é o processamento humano de informação, fazem

lembrar o cérebro de duas formas:

a) O conhecimento é adquirido pela rede através de um processo de aprendizagem;

b) O conhecimento adquirido é armazenado pelas forças de ligação interneuronais.

Uma RNA é composta por várias unidades de processamento: os nós e as conexões que ligam os nós. O

comportamento inteligente de uma RNA provém das interações entre as unidades de processamento da rede. Na

sua maioria as RNA visam solucionar problemas de inteligência artificial, delineando sistemas através de circuitos

(conexões/ ligações) que tal como o cérebro humano, detêm um processo de aprendizagem realizado através do

algoritmo de aprendizagem – função que permite alterar as forças de conexão interneuronais da rede, permitindo

chegar ao objetivo final. Assim, à semelhança do cérebro humano, as RNA detêm a capacidade de aprender e agir

perante as mais adversas situações apresentadas, bem como adquirir informação através da experiência e da

observação. As RNA podem ainda modificar a sua própria tipologia tal qual como os neurónios no cérebro (S.

Haykin, 1999).

4.1 Benefícios das redes neuronais artificiais

O poder de abstração das RNA deve-se à sua estrutura paralela e à capacidade de aprendizagem das mesmas. A

estrutura paralela advém da existência de muitos neurónios ligados numa estrutura de pesos de conexão e com

facilidade de adaptação. A estrutura paralela é desejável uma vez que permite a tolerância à falha, pois se algum

neurónio (ou neurónios) falhar, os efeitos na rede como um todo não serão significativos para o desempenho da

rede, dado que existe outro caminho de ligação entre os neurónios que pode iludir a falha.

Uma das principais características das RNA é a capacidade de aprender através de exemplos e de generalizar, ou

seja reconhecer similaridades em elementos que não foram apresentados antes, possibilitando a produção de

resultado aceitável oriundo de um input, que lhes é novo (S. Haykin, 1999).

As redes neuronais são uma ferramenta eficiente para a classificação de padrões não-lineares, tal como é a maioria

da natureza dos fenómenos do mundo real, apresentando propriedades e capacidades importantes que levam à sua

escolha.

28

Propriedades e capacidades potenciadas pelo uso das RNA (S. Haykin, 1999):

a) Não-linearidade: um neurónio artificial pode ser linear ou não linear. Se existir pelo menos um neurónio

não linear, a rede neuronal poderá ter a capacidade de mapear uma função não-linear. Uma RNA feita de

uma interconexão de neurónios não-lineares, é em si não-linear.

b) Mapeamento de entrada-saída: ilustra o que acontece no método de aprendizagem supervisionada

(explicado em 4.4), em que a rede é treinada repetidamente. Este treino consiste na apresentação de

exemplos à rede, em que cada exemplo corresponde a um sinal de entrada, e detém uma resposta desejada

correspondente. Este treino é replicado até que a diferença entre a resposta desejada e a resposta real dada

pela rede seja mínima. Logo, a rede aprende dos exemplos ao construir um mapeamento de entrada-saída

para o problema considerado. Por isso, a rede neuronal pode funcionar como um gerador de função

genérica.

c) Adaptabilidade: as redes neuronais têm a capacidade interna de adaptarem as suas forças de ligação às

mudanças em seu redor. Mesmo uma rede que esteja habituada a funcionar em determinado ambiente,

consegue facilmente ser treinada e lidar com alterações do mesmo. Além disso, uma RNA pode modificar

as suas ligações interneuronais em tempo real, caso opere num ambiente não-estacionário, ou seja, um

ambiente onde as estatísticas possam mudar com o tempo.

d) Resposta a evidências: em relação à classificação de padrões, uma rede neuronal pode indicar qual padrão

escolher, bem como o nível de confiança nesta escolha. A confiança na tomada de decisão pode ser usada

para rejeitar padrões ambíguos, melhorando o desempenho da classificação da rede.

e) Tolerância a falhas: um estrago num neurónio não causa uma falha na rede toda.

Em termos reais, alguns exemplos da utilização das redes neuronais encontram-se no reconhecimento de

caracteres, como matrículas de carros, e classificação de padrões, como o diagnóstico do cancro da próstata. A

organização científica Kaman de Ciências (Colorado Springs, CO) criou uma rede neuronal que consegue prever

este tipo de cancro. A rede foi treinada para prognosticar resultados baseados em testes de PSA (“Prostate Specific

Antigen”), exibindo a recorrência do cancro após o tratamento (Télvio Orrú, 2003).

4.2 Neurónio artificial

Para o funcionamento da rede neuronal é essencial uma unidade de processamento de informação, denominada

por neurónio. O neurónio artificial é o componente básico das RNAs. Tal como o neurónio biológico, o neurónio

artificial possui um ou mais sinais de entrada e apenas um sinal de saída. Os sinais de entrada (estímulos) devem

chegar até ao neurónio simultaneamente, isto é, todas as informações devem chegar ao núcleo do neurónio artificial

ao mesmo tempo (S. Haykin, 1999).

Um dos atributos de grande importância do neurónio artificial é o vetor com os pesos das entradas. O peso é

representado pela letra w (weight) e representa o grau de importância que determinada entrada possui em relação

àquele determinado neurónio. O valor do peso é alterado em função da intensidade do sinal de entrada, e dessa

forma, o peso muda o seu valor representativo para a rede (processo de aprendizagem). Deduz-se que, quanto mais

estimulada for uma entrada, mais estimulado será o peso correspondente, e quanto mais for estimulado um peso,

mais significante e influente o mesmo será para o resultado do sinal de saída do respetivo neurónio.

29

Matematicamente, os pesos são vistos como um vetor de valores [w1, w2, ..., wn] para um neurónio, ou uma

matriz de pesos, colecção de vectores, para um conjunto de neurónios.

A Figura 17 representa o modelo do neurónio, um diagrama de blocos que constitui a base para gerar as redes

neuronais artificiais, onde se identificam três elementos básicos do mesmo:

a) Um conjunto de elos de ligação, cada um caracterizado por um peso próprio. Especificamente, um 𝑥𝑗

sinal de entrada do elo ligação de 𝑗, conectado ao neurónio 𝑘, é multiplicado pelo peso do elo 𝑤𝑘𝑗 .

Relativamente ao significado do peso 𝑤𝑘𝑗, 𝑘 refere-se ao neurónio em causa e o segundo subscrito refere-

se à extremidade da entrada do elo de ligação.

b) Um somatório para adicionar os sinais de entrada, ponderados pelos respectivos elos de ligação do

neurónio, constituindo uma combinação linear. O neurónio verifica então se o valor resultante da soma

entre os produtos dos sinais de entrada pelos respectivos pesos atingiu ou não um valor pré-determinado,

designado de limiar. Se o valor calculado atingiu o limiar, o mesmo é passado avante através da saída.

Caso contrário, se o valor não atingiu o limiar, o sinal não será transferido. Este processo de verificação

é denominado como função de transferência.

c) Uma função de activação através da qual o neurónio decide o que fazer com o resultado da soma das

entradas (activar ou não), limitando a amplitude do sinal de saída de um neurónio. Caracteristicamente,

o intervalo de amplitude normalizada da saída de um neurónio é de [0,1] ou [-1,1].

O modelo neuronal da Figura 17 também inclui um enviesamento aplicado externamente, denotado por 𝑏𝑘. Este

enviesamento pode aumentar ou diminuir o input líquido da função de activação, dependendo se é positivo ou

negativo, respectivamente (S. Haykin, 1999).

Em termos matemáticos, as Equações (4.1) e (4.2) (S. Haykin, 1999) abaixo descrevem o neurónio 𝑘:

𝑣𝑘 = ∑ 𝑤𝑘𝑗𝑥𝑗

𝑚

𝑗=0

(4.1)

𝑦𝑘 = 𝜑(𝑣𝑘)

(4.2)

30

Figura 17 - Modelo do neurónio (S. Haykin, 1999)

As funções de activação podem ter a forma de função limiar (threshold function), linear e sigmóide (Figura 18).

Figura 18 - (a) Função limiar; (b) Função linear; (c) Função sigmóide com diferentes declives (S. Haykin, 1999)

31

4.3 Topologia de redes

Acima foram apresentadas as vantagens do uso das redes neuronais artificias, bem como as características do

neurónio, definido como a unidade básica do processamento de uma RNA. Contudo, interessa ainda apresentar

como os neurónios artificiais podem ser agrupados, de acordo com as conexões entre eles e a disseminação de

dados.

Numa conexão de neurónios estes estão organizados em forma de camadas, onde existe sempre uma entrada e uma

saída. Usualmente, as camadas são classificadas em três grupos: camadas de entrada onde os padrões são

apresentados à rede; camadas intermédias ou escondidas onde é feita a maior parte do processamento através das

conexões ponderadas; camada de saída onde o resultado final é concluído e apresentado.

Uma rede neuronal pode ter uma ou várias camadas. As redes que possuem uma única camada são as redes que

possuem apenas uma camada entre uma entrada e uma saída da rede. Em contraste, as redes de multicamadas

possuem mais de uma camada, entre as existentes camadas de entrada e saída. Todavia no meio destas camadas

podem estar uma ou mais camadas escondidas, Figura 19. Assim, existe uma relação direta entre o número de

camadas e o número de neurónios em cada camada e a complexidade da rede (S. Haykin, 1999).

Figura 19 - Rede de única camada (esquerda) e rede de duas camadas (direita) (S. Haykin, 1999)

A classificação das redes neuronais (Figura 20) de acordo com a forma como os neurónios estão ligados entre as

diversas camadas pode ser encontrada em (B. Krose et al., 1996):

Rede feedforward: rede onde os dados circulam numa única direção, partindo da camada de entrada para a camada

de saída. Estas redes são um mapeamento estático entre as entradas e saídas, que permitem refletir uma relação

linear simples ou uma relação não-linear. Uma aplicação típica para as redes neuronais artificiais feedforward é o

desenvolvimento de modelos não-lineares usados para o reconhecimento e classificação de padrões.

Rede feedback (cíclica, recorrente ou realimentada): utilizam as suas saídas para alimentar as próprias entradas,

em que os níveis de ativação da rede formam um sistema dinâmico. Uma vez que esta rede cíclica pode admitir

memória de curto prazo, torna-se mais interessante como modelo de cérebro.

32

Figura 20 - Arquiteturas de RNAs (S. Haykin, 1999)

4.4 Aprendizagem

Como referido acima, o comportamento inteligente das redes neuronais resulta das interações entre as suas

unidades de processamento. Estas possuem a capacidade de aprender por exemplos e são capazes de extrair regras

básicas a partir de dados reais, diferindo da programação computacional. A aprendizagem ocorre quando é atingida

uma solução generalizada para uma classe de problemas, isto é, a rede procura extrair informações relevantes de

padrões de informação, moldando uma representação própria. Logo, um conjunto de procedimentos definidos para

ajustar os parâmetros de uma RNA, com a finalidade da mesma aprender uma determinada função, é chamado de

algoritmo de aprendizagem (B. Krose et al., 1996).

O processo de aprendizagem pode ser categorizado em dois métodos distintos (B. Krose et al., 1996):

Aprendizagem supervisionada: a rede é treinada apresentando-lhe sinais de entrada e de saída. O treino está

completo quando a rede neuronal alcança uma determinada precisão na estimação das saídas para uma dada

sequência de entradas. Em caso de erro, a rede tenta corrigi-lo até que a mesma forneça uma saída igual à saída

desejada. Neste método de aprendizagem o fluxo corrente de erros de todos os elementos em processamento é

minimizado, pois os pesos das conexões são ajustados continuamente até que a rede alcance uma certa precisão.

Esses ajustes podem ser feitos através do algoritmo de retropropagação (backpropagation), que será explicado

adiante.

Aprendizagem não supervisionada: a rede aprende sem a necessidade de treino prévio, por isso, a saída desejada

é obtida através de entradas repetitivas até que a RNA retenha o conhecimento. Neste modelo, a rede não suporta

influências externas para ajustar o peso de cada variável, possuindo informações próprias de como se organizar

internamente. É então suposto que exista a redundância de dados, para que a rede encontre padrões ou

características dos dados. Um sinónimo para aprendizagem não-supervisionada é aglomeração (clustering).

33

4.5 Redes Perceptron

Em 1958, Rosenblatt estudou as redes neuronais artificiais com função de ativação, às quais chamou de

Perceptrons. A rede Perceptron foi composta por uma camada de entrada, onde cada elemento pertencente a esta

camada fazia a distribuição do sinal recebido por todas as unidades de processamento. Esta é constituída por

unidades binárias, que aprendem a classificar padrões através da aprendizagem supervisionada (Zhang, 1998).

Os neurónios eram essencialmente compostos por unidades sigma e de funções de transferência, sendo que estas

eram responsáveis pela soma ponderada dos sinais oriundos das conexões com os dados de entrada. À camada

de entrada foi adicionado o enviesamento, que possui um sinal de valor sempre um. A conexão entre o

enviesamento e a unidade sigma tem peso 𝑤0, que por sua vez é ajustado da mesma maneira com que os demais

pesos o são. O nível de ativação de uma rede Perceptron é dado pela soma ponderada dos pesos com os valores

de entrada, ∑ 𝑥𝑖 . 𝑤𝑖 (Zhang, 1998).

Estas redes usam uma função de transferência do tipo hard-limiter (limite ríspido), onde a ativação do limiar

resulta num valor de saída 1, ou, –1 caso contrário. Dados os valores de entrada 𝑥𝑖, os pesos 𝑤𝑖 , e um limiar t,

o perceptron calcula os valores de saída da seguinte maneira:

{1 𝑠𝑒 ∑ 𝑥𝑖𝑤𝑖 ≥ 𝑡

−1 𝑠𝑒 ∑ 𝑥𝑖𝑤𝑖 < 𝑡

As redes Perceptron foram desenvolvidas utilizando o algoritmo de aprendizagem em que os pesos da rede são

ajustados para minimizar o erro num treino (treino pertence à aprendizagem supervisionada, como mencionado

anteriormente) (Zhang, 1998).

Figura 21 - Rede Perceptron (Zhang, 1998)

pesos

34

Tal como as redes neuronais artificiais, existe uma rede Perceptron (Figura 21) de única camada, em que as

unidades de saída são independentes, o que significa que podem ser estudadas separadamente e que cada peso

apenas influencia uma única saída. Contudo, a eliminação de erros através do algoritmo de aprendizagem apenas

funciona num plano linearmente separável. Sendo assim, os perceptrons não são adequados para resolver uma

certa classe de problemas, denominados por não linearmente separáveis.

Os problemas não linearmente separáveis podem ser resolvidos através de redes com uma ou mais camadas

intermédias. A transformação de camada única para uma rede Perceptron de multicamadas (MLP – Multi-layer

Perceptron) dá-se com a inserção de camadas ocultas e/ou do aumento de neurónios. Teoricamente, redes com

mais de uma camada podem implementar qualquer função (até um limite de precisão), seja ela linearmente

separável ou não.

Figura 22 - Rede Perceptron com várias camadas intermédias (Zhang, 1998)

A MLP (Figura 22) apenas oferece vantagem sobre a rede Perceptron de única camada se existir uma função de

ativação não linear entre as camadas. A rede Perceptron de múltiplas camadas apresenta um poder computacional

muito superior ao das redes sem camadas intermédias.

O processamento atribuído a cada neurónio da MLP é resultante da combinação do processamento realizado pelos

neurónios da camada anterior, que por sua vez estão atribuídos a um nó da próxima camada. Logo, cada neurónio

que compõe uma rede Multilayer Perceptron contribui para a deteção de características dos dados apresentados.

O número de camadas a ser utilizado influência de forma crucial a aprendizagem da rede. O uso de um grande

número de camadas intermédias não é recomendado, visto que o erro ocorrido numa camada é propagado a

camadas anteriores da rede. Porém, são necessárias no mínimo duas camadas intermédias, com um número

suficiente de unidades por camada, para se produzir quaisquer mapeamentos.

A determinação do número de neurónios pertencentes às camadas intermédias é definida de forma empírica, e

normalmente depende da distribuição dos padrões de treino e validação da rede. Um uso excessivo de neurónios

35

levará a rede a moldar-se ao conjunto de treino, ao invés de extrair as suas características gerais (generalizar)

(Zhang, 1998).

4.6 Algoritmo backpropagation

O algoritmo de aprendizagem mais utilizado no treino das redes neuronais multicamadas é o backpropagation.

O algoritmo backpropagation consiste numa propagação positiva do sinal funcional e numa retropropagação do

erro. Quando se dá a propagação positiva do sinal funcional, os pesos da rede são mantidos fixos e o seu efeito

propaga-se através da rede, camada por camada, até produzir o conjunto de saída (resposta real da rede). Quando

se dá a retropropagação do erro, os pesos da rede são ajustados de acordo com uma regra de correção de erro e o

sinal é propagado para trás através da rede. (D. J. C. MacKay, 1991).

Durante o treino com o algoritmo backpropagation, a rede opera numa sequência de dois passos:

1. Um padrão é apresentado à camada de entrada da rede. A atividade resultante flui através da rede, camada

por camada, até que a resposta seja produzida pela camada de saída;

2. A saída obtida é comparada com a saída desejada. O algoritmo consiste em calcular o erro na saída da

rede e retropropagá-lo pela rede, modificando os pesos para minimizar o erro da próxima saída. Sendo

que o sinal de erro é propagado em sentido oposto ao de propagação do sinal funcional, dá-se o nome de

retropropagação do erro.

É importante assinalar que cada padrão de entrada é apresentado à rede em turnos, ajustando aos poucos os pesos

da rede, antes de passar para o próximo padrão de entrada. Se a rede corrigir perfeitamente os erros antes de lhe

ser apresentada o próximo padrão de entrada, a rede neuronal perderá a capacidade de generalização a fim de

encontrar uma solução que satisfaça todo o conjunto de dados de entrada (D. J. C. MacKay, 1991).

O algoritmo backpropagation também é chamado de regra delta generalizada, pois é baseado na regra delta

apresentada por Widrow e Hoff.

36

4.7 Redes Neuronais Dinâmicas

As redes neuronais podem ser classificadas como estáticas ou dinâmicas. As redes neuronais estáticas não têm

elementos de feedback, ou seja, o output é calculado diretamente a partir do input. No caso das redes neuronais

dinâmicas o output depende ainda de inputs, outputs ou estados anteriores da rede. Estas redes caracterizam-se

pela utilização de variáveis de entrada sequenciais, podendo também ser definido um certo atraso, tanto nas

variáveis de entrada como nas de saída (Demuth, H. et al. 2015), no caso da modelação de dados representativos

de um sistema dinâmico.

Figura 23 - Rede neuronal com realimentação do output como novo input (Demuth, H. et al., 2015)

Na rede neuronal da Figura 23, a função de ativação da camada exterior é linear, garantindo que o output não é

limitado, enquanto a camada interior é caracterizada por uma função não linear (sigmoide), permitindo que a rede

identifique as relações existentes entre as variáveis de entrada e de saída. A realimentação é feita da última camada

para a primeira, apesar de também haver redes em que é feita de camadas intermédias para a primeira camada.

O algoritmo de treino de redes neuronais pode ser de dois tipos diferentes: o incremental e o batch. No treino

incremental os pesos da rede são atualizados cada vez que o novo input é introduzido na rede; no treino batch os

pesos são atualizados apenas depois de todos os inputs terem sido introduzidos (Demuth, H. et al., 2015).

As redes neuronais dinâmicas são geralmente mais robustas que as estáticas, no entanto requerem mais trabalho

no que diz respeito à fase de treino. Como as redes neuronais dinâmicas têm memória, podem ser treinadas de

forma a aprender padrões sequenciais ou que variam no tempo. O treino de redes neuronais é de extrema

importância, na medida em que garante a eficácia e coerência da previsão, independentemente da diversidade dos

inputs, através da criação de uma cadeia de pesos e de uma malha de relações que vão sendo ajustadas até se atingir

o resultado desejado. Os dados utilizados para o treino da rede devem representar uma amostra credível no caso

estudado para que o desempenho da rede seja otimizado (Demuth, H. et al., 2015).

No processo do treino tem que se ter em atenção o overtraining, ou seja, impedir que se atinja um número de

iterações demasiado elevado que “vicie” a rede nos dados de treino, afetando a sua capacidade de generalização.

37

Figura 24 - Definição do critério de paragem

O overtraining (Figura 24) ocorre quando o modelo ajusta os pesos em demasia ao conjunto de dados de treino,

perdendo capacidade de generalização. Nestas situações verifica-se que a linha que descreve o erro de

aprendizagem dos dados de teste aumenta enquanto o erro de aprendizagem dos dados de treino vai diminuindo.

Para evitar tal situação os dados fornecidos devem ser o mais variados possível e contemplar um vasto domínio

para que a rede não perca representatividade.

4.8 Uso de Redes Neuronais para previsão do consumo de energia

Entre os vários modelos de RNA, o MLP (Multi Layer Perceptron) e o FF-BP-ANN (feed forward multilayer

perceptron ANN model with back-propagation error algorithm) são modelos que foram utilizados para cálculo

das estimativas de consumo energético na Grécia (MLP) (L. Ekonomou, 2009) e na Coreia do Sul (FF-BP-ANN)

(Zong Woo Geem, William E. Roper, 2009).

Caso de estudo: Grécia

No caso da Grécia, o modelo MLP utilizado tem a estrutura da Figura 25:

Figura 25 – Rede MLP feedforward (L. Ekonomou, 2009)

38

As vantagens de utilização deste modelo são as seguintes: a velocidade de cálculo que permite analisar grandes

quantidades de inputs; generalização automática de conhecimento permitindo o reconhecimento de conjuntos de

dados; minimização do erro quadrático médio agregado em todos os conjuntos de dados de treino; aprendizagem

supervisionada e a redução do “ruído” das variáveis.

No período de 1992 a 2004, as variáveis consideradas para input e output foram as apresentadas na Tabela 7:

Tabela 7 - Rede MLP - variáveis de input e output (L. Ekonomou, 2009)

Foram selecionadas apenas estas variáveis de input, podendo no entanto ter-se selecionado outras mais, como o

preço da eletricidade, o número de instalações de ar-condicionado, que afetam o consumo de energia, mas tais

dados não estavam disponíveis na altura do estudo.

A ferramenta utilizada para realizar este estudo foi o MATLAB. Os dados de input de treze anos (1992 a 2004)

foram usados para treino e validação do modelo.

O resultado obtido está representado na Tabela 8 abaixo:

Tabela 8 - Resultados do modelo MPL (L. Ekonomou, 2009)

O modelo de RNA foi testado, tendo como objetivo estabelecer as necessidades energéticas da Grécia para os anos

de 2005 a 2008, 2010, 2012 e 2015, e comparou-se o resultado com os dados reais registados para os períodos

referidos e com os resultados obtidos, respetivamente, pelo método de regressão linear e pelo método de support

vector (Vapnik) realizado através do software C++. Usando este modelo os dados são mapeados por computação

não linear numa estrutura dimensional maior procedendo-se seguidamente à regressão nesta estrutura.

39

Os diferentes resultados estão representados no gráfico da Figura 26:

Figura 26 - Comparação do consumo previsto de energia para a Grécia através de RNA, modelo de regressão e modelo de

support vector com o real (L. Ekonomou, 2009)

O erro percentual obtido entre o método RNA e os dados reais é de apenas 2%, significando que o modelo da rede

utilizado é bastante fiável e credível.

Este método pode ser bastante útil no cálculo das previsões de consumo energético, ou seja das necessidades

energéticas daí decorrentes, pois as mesmas têm significativo impacto nas verbas orçamentais para investimento

em estruturas e fontes energéticas, no impacto ambiental, garantindo ao mesmo tempo segurança no contínuo

abastecimento do país.

Caso de estudo: Coreia do Sul

Devido às indústrias da Coreia do Sul dependerem fortemente de fontes de energia importadas (de acordo com a

Energy Information Administration (2007), o país é o quinto maior importador de petróleo e o segundo maior

importador de gás natural liquefeito do mundo), a estimativa precisa da sua procura de energia é fundamental para

a formulação de políticas de energia.

Neste estudo de previsões energéticas foram utilizados três modelos: o modelo de regressão linear múltipla, o

modelo exponencial modificado e o modelo de FF-BP-ANN. A FF-BP-ANN (feed forward multilayer perceptron

ANN model with back-propagation error algorithm) é o modelo mais utilizado para previsão (Gibbs et al., 2006).

É constituída normalmente por três camadas, a de input, a escondida (hidden) e a de output.

40

O modelo pode ser representado pelo esquema da Figura 27:

Figura 27 - Esquema do modelo de feedforward multilayer perceptron (Zong Woo Geem, William E. Roper, 2009)

As variáveis de input utilizadas nos diferentes modelos, obtidas de diversas fontes nacionais e internacionais (Zong

Woo Geem, William E. Roper, 2009), foram as seguintes: produto interno bruto (GPD), população, importações

e exportações. A variável de output, ou seja, a que se pretende prever é a procura de energia (Figura 28 e Tabela

9).

Figura 28 - Procura de energia e correspondente indicador da Coreia do Sul (Zong Woo Geem, William E. Roper, 2009)

41

Tabela 9 - Procura de energia e indicador de dados da Coreia do Sul (Zong Woo Geem, William E. Roper, 2009)

Para validação dos modelos os dados foram divididos em dois grupos: dados para treino do modelo (1980 a 2000)

e dados para verificação do modelo (2001 a 2007). De seguida observam-se os diferentes resultados obtidos nas

Figura 29Figura 30 Figura 31:

Figura 29 - Estimação da procura de energia por meio de regressão linear múltipla (Zong Woo Geem, William E. Roper,

2009)

42

Figura 30 - Estimação da procura de energia utilizando modelo exponencial modificado (Zong Woo Geem, William E.

Roper, 2009)

Figura 31 - Estimação da procura de energia utilizando o modelo FF-BP-ANN (Zong Woo Geem, William E. Roper, 2009)

e podem ser resumidos na seguinte Tabela 10:

Tabela 10 - Comparação dos resultados dos vários modelos utilizados para previsão da procura de energia (Zong Woo Geem,

William E. Roper, 2009)

Em conclusão, o uso do modelo FF-BP-ANN como ferramenta de cálculo das necessidades energéticas da Coreia

do Sul mostra-se bastante credível e fiável, Figura 32, conduzindo a estimativas de necessidades mais rigorosas

do que os modelos de regressão linear múltipla ou de modificação exponencial.

43

Figura 32 - Comparação entre os três modelos de previsão da procura de energia (Zong Woo Geem, William E. Roper, 2009)

44

5. Dados e Metodologia

Este capítulo descreve o método utilizado para resolver o problema apresentado no início da dissertação. Em

primeiro lugar, as aproximações e estudos efetuados antes de desenvolver o programa computacional e a descrição

da construção do programa automatizado para o cálculo de todos os valores requeridos. A amostra de dados usados

na construção do modelo de previsão tem a duração de quarenta anos, compreendidos entre 1960 e 1999, com

período de amostragem de um ano. Os anos de 2000 e 2009 não foram usados na construção do modelo preditivo.

Estes dez anos só foram usados, no final, como conjunto de validação dos resultados, para fazer as respetivas

previsões e aferir o erro de previsão do modelo.

5.1 Dados disponibilizados

Para a realização deste trabalho foram disponibilizados dados de fontes distintas. Os relativos ao GVA entre os

anos de 1960 e 1995 foram retirados de um documento do Banco de Portugal (Pinheiro, 1997) e as séries do

Instituto Nacional de Estatística (INE) completam para o período de 1995 a 2009 (INE, 2015). Para os dados de

exergia útil recorreu-se a um artigo de Serrenho et al. (2015). Após a análise dos inúmeros dados existentes foi

elaborado um ficheiro Excel para organização dos mesmos, de modo a facilitar a sua introdução na ferramenta

computacional desenvolvida em MATLAB.

Os dados disponibilizados são então:

Heat (TJ) (Serrenho et al.,2015): processo de calor, onde o HTH e o MTH são principalmente usados na indústria

(exemplo: vidro) e o LTH é usado em todos os sectores, mas principalmente no sector de serviços e residencial

para aquecimento de espaços.

Hight Temperature Heat: 500ºC;

Medium Temperature Heat: 150ºC;

Low Temperature Heat: 50-120ºC.

Mechanical Drive (TJ) (Serrenho et al.,2015): sector dos transportes e indústria estacionária: trabalho dos motores

a gasolina e a diesel, locomotivas a vapor, locomotivas diesel-elétricas, motores de aviação, motores de barcos e

motores elétricos.

Other electric uses (Serrenho et al.,2015): sector residencial e serviços: comunicação, eletrónica, dispositivos

elétricos e indústria eletroquímica.

Light (TJ) (Serrenho et al.,2015): refere-se ao uso de eletricidade para iluminação em todos os sectores.

Other electric uses e Light foram agrupadas tornando-se uma única variável denominada Ele.

Gross Value Added (GVA – Valor acrescentado bruto, Mrd EURO_PTE) (Pinheiro, 1997 e INE, 2015): é o

resultado final da atividade produtiva no decurso de um período determinado. Resulta da diferença entre o valor

da produção e o valor do consumo intermédio, originando excedentes.

45

Na Tabela 11 são apresentados os dados usados neste trabalho:

Tabela 11 - Dados disponibilizados

Ano High Temp.

Heat (TJ)

Medium

Temp. Heat

(TJ)

Low Temp.

Heat (TJ)

Mechanical

Drive (TJ)

OE + L

(TJ) = Ele

GVA (Mrd

EURO-

PTE)

1960 4 516,05 3 830,60 10 293,46 7 779,00 526,85 26,50

1961 5 662,02 4 178,19 10 698,33 8 338,29 591,46 27,23

1962 5 106,93 4 048,10 10 695,75 9 290,31 668,78 30,16

1963 6 442,24 4 873,18 10 988,27 9 759,49 736,01 31,21

1964 7 116,24 4 960,94 11 541,09 10 189,45 832,10 32,80

1965 7 759,19 5 063,34 12 000,14 10 665,91 888,66 36,03

1966 7 738,55 5 193,26 12 083,56 11 808,95 987,42 37,55

1967 8 398,01 5 484,79 12 676,48 12 507,43 1 061,89 39,03

1968 8 314,94 5 155,72 12 980,80 13 053,17 1 148,62 40,94

1969 9 413,02 6 273,27 13 331,70 13 965,56 1 277,09 41,76

1970 8 420,63 6 594,78 16 086,56 16 445,97 1 455,94 45,12

1971 9 216,30 7 581,00 16 384,20 17 920,77 1 606,57 50,20

1972 9 458,13 7 810,85 16 993,57 19 392,29 1 768,30 55,45

1973 10 733,89 8 292,41 17 508,03 21 595,45 1 929,81 57,93

1974 11 066,36 9 096,88 18 290,69 21 893,76 2 155,57 60,09

1975 11 854,05 8 378,17 18 217,39 23 324,90 2 269,67 57,15

1976 12 916,69 9 037,90 18 837,72 23 918,48 2 462,01 58,57

1977 14 104,59 9 019,33 19 781,34 26 113,36 2 728,54 62,88

1978 15 103,06 10 064,29 20 061,98 28 022,82 2 969,87 67.19

1979 15 798,61 10 699,94 20 603,92 30 637,99 3 275,97 72,14

1980 16 427,40 10 805,83 20 159,38 33 052,86 3 515,85 75,50

1981 15 777,77 12 143,72 19 906,06 33 652,21 3 530,26 78,99

1982 16 708,60 12 028,60 20 604,51 35 201,56 3 692,37 78,01

1983 15 746,67 12 092,68 21 046,11 36 862,83 3 809,53 78,03

1984 16 098,03 10 509,63 21 555,40 36 586,04 3 885,58 79,58

1985 17 721,49 9 189,42 22 176,28 36 491,47 4 044,35 78,15

1986 17 414,43 8 244,62 22 886,73 38 730,74 4 202,33 78,24

1987 18 253,47 7 520,86 24 096,38 41 136,85 4 297,58 84,28

1988 20 482,54 8 669,60 24 600,78 43 939,72 4 549,66 87,96

1989 21 589,87 10 346,03 22 229,91 46 914,95 4 788,04 93,95

1990 21 263,93 10 056,16 27 411,41 50 468,13 4 999,29 100,59

1991 21 740,89 9 460,84 27 876,79 53 385,27 5 154,19 104,10

1992 21 796,67 10 337,78 27 671,11 56 121,57 5 272,64 107,35

1993 20 375,28 10 680,93 28 341,53 56 671,51 5 223,55 106,64

1994 22 208,07 13 968,34 29 278,07 58 957,16 5 303,56 108,57

1995 21 533,56 13 521,71 29 488,26 62 518,69 5 657,81 111,82

1996 22 202,03 13 129,93 33 296,69 65 866,77 5 836,94 117,78

1997 21 735,39 14 754,99 33 889,47 68 768,85 6 085,63 123,01

1998 24 907,68 15 719,54 34 183,22 74 247,03 6 357,36 128,31

1999 25 225,24 18 623,92 34 748,36 78 839,05 6 638,53 133,20

2000 26 892,05 17 730,83 35 509,20 84 784,05 6 834,36 138,29

2001 24 250,55 19 935,89 36 277,41 85 767,79 6 969,26 141,22

2002 24 961,79 19 788,25 36 798,97 89 014,66 7 144,45 141,59

2003 21 313,84 19 252,77 36 743,07 91 266,01 7 208,15 139,60

2004 20 152,18 18 437,15 35 845,11 94 854,05 7 348,57 142,91

2005 19 437,84 20 672,82 36 577,77 95 093,60 7 436,29 142,88

2006 19 188,04 14 831,77 36 078,02 96 069,55 7 530,56 144,22

2007 22 102,75 19 663,50 36 785,00 98 904,95 7 509,22 148,02

2008 18 909,48 17 454,06 35 731,74 98 040,51 7 263,00 147,07

2009 16 104,59 18 682,44 35 150,08 96 761,80 7 522,43 144,19

46

Na Figura 33 Figura 34 podemos observar a evolução das várias variáveis.

Figura 33 - Gráfico representativo da evolução das variáveis

Figura 34 - Gráfico representativo da evolução do GVA

-

20 000,00

40 000,00

60 000,00

80 000,00

100 000,00

120 000,00

Categorias Trabalho Útil (TJ)

High Temp. Heat (TJ) Medium Temp. Heat (TJ) Low Temp. Heat (TJ)

Mechanical Drive (TJ) Other Electric Uses (TJ) Light (TJ)

-

20,00

40,00

60,00

80,00

100,00

120,00

140,00

160,00

196

0

196

2

196

4

196

6

196

8

197

0

197

2

197

4

197

6

197

8

198

0

198

2

198

4

198

6

198

8

199

0

199

2

199

4

199

6

199

8

200

0

200

2

200

4

200

6

200

8

GVA (Mrd EURO-PTE)

47

5.2 Metodologia

Este estudo engloba a construção de mapa de correlações, boxplots, análise de componentes principais, regressão

linear múltipla e multivariada e a construção da rede neuronal mais adequada ao problema em estudo, de acordo

com as etapas indicadas na Figura 35. A análise das regressões foi apenas utilizada para método de comparação

com os resultados da rede neuronal.

Figura 35 - Diagrama das etapas que compuseram o tratamento de dados e a construção dos modelos de previsão

48

Análise prévia dos dados

Os métodos foram implementados através do software MATLAB. Com o objetivo de analisar a distribuição

empírica dos dados verificou-se, através dos boxplots, a existência de outliers e, caso necessário, recorrer-se-ia à

eliminação destes.

De modo a compreender melhor as relações entre cada uma das variáveis, construiu-se um mapa de correlações

com todas as variáveis. O coeficiente utilizado foi o coeficiente de correlação de Pearson, Equação (3.1), o qual é

obtido dividindo a covariância de duas variáveis pelo produto dos seus desvios padrão.

Seguidamente procedeu-se à análise PCA onde se analisa o número de componentes principais a utilizar na

construção do modelo, o score plot e o loading plot. Com a análise PCA obtém-se uma matriz de correlações que

permitirá selecionar as variáveis que mais contribuem para a descrição de cada uma das componentes. A

informação obtida desta análise leva-nos a selecionar as variáveis mais relacionadas com as variáveis que

queremos prever.

Por último, foram efetuadas como símbolo de comparação com os resultados obtidos através da rede, ambas as

regressões lineares (múltipla e multivariada) para cada uma das variáveis, com o objetivo de determinar qual o

peso que cada variável tem na definição das restantes variáveis. Para cada variável obteve-se uma equação do tipo

da Equação (3.2) e do tipo da Equação (3.3), em que 𝑥𝑖 representa as exergias úteis (HTH, MTH, LTH, MD, Ele)

e/ou o GVA dependendo da variável que estiver a ser calculada.

Modelação com Redes Neuronais Artificiais

Treino

Para as redes neuronais dinâmicas foi utilizado o treino em batch, com o algoritmo de otimização Levenberg-

Marquardt e uma aprendizagem supervisionada, uma vez que se dispunha de dados de cinquenta anos

consecutivos. O desempenho da rede é avaliado com base na medida do erro quadrático médio (MSE), que resulta

da diferença entre o output real e o calculado pela RNA de acordo com a Equação (5.1).

(5.1)

Para a seleção dos grupos de treino, teste e validação foram utilizados os primeiros quarenta anos dos dados

disponibilizados (de 1960 a 1999) tendo sido pré-definida uma divisão de 70% para o subconjunto de treino (1962-

1965, 1967, 1968, 1971, 1974-1977, 1979-1981, 1983-1987, 1990, 1992, 1994-1998) e de 15% para cada um dos

restantes subconjuntos – teste (1966, 1969, 1970, 1972, 1989, 1991) e validação (1973, 1978, 1982, 1988, 1993,

1999).

Para se proceder ao treino da rede apenas se usaram os dados relativos aos primeiros quarenta anos registados

(1960 a 1999).

49

1-step-ahead-prediction

onde, 𝑈 representa os valores reais da tabela de dados fornecida (Tabela 11) e �̂� os valores estimados pela RNA.

No treino foi utilizada a configuração da Figura 36, em que o objetivo foi comparar os valores estimados com os

valores reais. Numa primeira análise foi selecionada a rede neuronal que melhor reproduz os dados para cada uma

das exergias. Cada variável ou agrupamento de variáveis foi tido em conta na construção da rede final para a

previsão de todas as exergias simultaneamente.

Figura 36 – 1-step-ahead-prediction

Simulação

No sentido de encontrar uma simulação da rede que melhor se ajusta aos dados e que produza as melhores

previsões, procedeu-se ao uso de dois tipos de modelos de previsão:



Além disso, considerou-se que apenas se conheciam quarenta anos dos cinquenta disponíveis (período de 1960-

1999). Esta assunção obrigou à utilização de um terceiro tipo de rede, a chamada closed-loop, em que os últimos

dez anos são realimentados na rede.


A estrutura de um modelo de previsão 2-step-ahead-prediction é descrita na Figura 37 seguinte,

Figura 37 - 2-step-ahead-prediction

50

Para modelos com step-ahead superiores é frequente não se obter bons resultados (Parlos et al., 2000). Assim,

procurou-se proceder à análise deste tipo de redes antes de testar modelos de previsão de ordens superiores.

Neste caso é primeiramente estimado o �̂�𝑢(𝑘 + 1) e reintroduzido na rede, seguindo-se a estimativa do �̂�𝑢(𝑘 + 2)

que é posteriormente comparado com o 𝐸𝑢(𝑘 + 2) real, e assim sucessivamente para o intervalo de anos testado.

Closed-loop

Durante a fase de aprendizagem não foram utilizados os registos da evolução dos dados correspondentes aos

últimos dez anos (2000 a 2009). Estes foram usados para testar a capacidade da RNA de previsão destes dados.

Assim, utilizou-se a simulação em closed-loop apresentada na Figura 38.

Figura 38 - Rede neuronal dinâmica em closed loop

Rede neuronal usada

Após terem sido atingidos resultados satisfatórios da previsão para os anos de 2000 a 2009, avaliados por

observação dos gráficos gerados pelo MATLAB e pela evolução do erro quadrático médio (MSE), a rede neuronal

pretendida foi obtida.

No presente trabalho a rede neuronal dinâmica utilizada foi do tipo não-linear auto-regressiva com entrada exógena

(NARX), definida pela Equação (5.2),

𝑦(𝑡) = 𝑓(𝑦(𝑡 − 1), 𝑦(𝑡 − 2), … , 𝑦(𝑡 − 𝑛𝑦), 𝑢(𝑡), 𝑢(𝑡 − 1), … , 𝑢(𝑡 − 𝑛𝑢))

(5.2)

onde o próximo valor do output 𝑦(𝑡) é calculado por regressão dos valores anteriores de output e de uma variável

de entrada independente (exógena), 𝑢(𝑡). Estas são caracterizadas por ligações de feedback que englobam várias

camadas da rede.

Após a construção de um código que permitisse de forma sistemática treinar redes com diferentes números de

layers e diferentes números de anos de atraso foram treinadas quarenta redes em cada uma das configurações (num

total de 640 treinos) apresentadas no sentido de procurar a rede que melhor se ajustava aos dados. Esta procura

sistemática da melhor rede é necessária, visto que, devido ao facto da atribuição dos valores dos pesos da rede ser

aleatória, não é garantida à priori a obtenção da rede que melhor aproxima os dados.

51

Seguidamente, procurou-se identificar a rede que apresentava o melhor comportamento na modelação dinâmica

do problema. Para isso identificou-se a rede com menor MSE na aproximação dos dados. Não obstante, a análise

é acompanhada de uma leitura do gráfico de desempenho, que mostra o valor de MSE versus o número de iterações

(Figura 39), podendo analisar-se o desempenho da validação, do treino e do teste. Esta análise deve ser feita, pois

caso a curva de teste aumente significativamente antes da curva de validação aumentar, então é possível que alguns

sobreajustes (overtraining) possam ter ocorrido e é aí considerado o critério de paragem.

Figura 39 - Gráfico de desempenho, obtido através da ferramenta Neural Network Toolbox (Demuth, H. et al., 2015)

Por outro lado é também possível avaliar a qualidade da rede através dos gráficos de regressão, ao analisar a relação

entre os outputs e os valores reais (Figura 40).

52

Figura 40 - Gráfico com as várias regressões (treino, validação e teste), obtido através da ferramenta Neural Network Toolbox

(Demuth, H. et al., 2015)

Os três gráficos representam os dados de treino, validação e teste. A linha a tracejado representa em cada parcela

o resultado ideal: outputs = alvos. A linha sólida representa a melhor linha de regressão de ajuste linear entre os

resultados e os valores alvo. O valor de R é uma indicação da relação entre os outputs e os alvos. Se R = 1, isso

indica que há uma relação linear exata entre os outputs e os valores alvo. Se R é próximo de zero, então não há

uma relação linear entre os dados (Demuth, H. et al. 2015).

Por último, analisa-se os resíduos da variável prevista em relação aos valores experimentais.

53

6. Resultados e Discussão

Este capítulo apresenta os principais resultados da dissertação. Inicialmente faz-se uma análise dos dados para se

identificar os outliers e assim separar os dados dispares dos restantes dados. Seguidamente procede-se à análise

de correlações dos dados. Dessa análise procura-se perceber a relação entre as variáveis e qual o contributo de

cada uma delas para a descrição da evolução da exergia útil por tipo de uso em Portugal.

Como esta análise é limitada à correlação entre pares de variáveis, complementa-se com uma análise de

componentes principais no sentido de encontrar as variáveis que têm maior influência na explicação das exergias.

Com base nessas conclusões é então possível encontrar um modelo de previsão a 10 anos.

6.1 Boxplots

No sentido de trabalhar os dados com dimensões semelhantes, procedeu-se inicialmente à sua standardização de

forma a que os dados tivessem média nula e desvio padrão unitário.

Sem perda de generalidade, uma variável aleatória 𝑥, com média µ e desvio padrão σ, a standardização é dada pela

Equação (6.1):

𝑧 =

(𝑥 − µ)

𝜎

(6.1)

Dado que cada variável tem dimensões bastante distintas é importante proceder a essa normalização. Este

procedimento é amplamente recomendado na bibliografia no sentido de minimizar problemas numéricos

subsequentes.

Seguidamente, por uma questão de organização, define-se uma variável vars onde se organizam, por colunas,

cada uma das variáveis.

𝑣𝑎𝑟𝑠 = [HTH, MTH, LTH, MD, Ele, GVA]

Numa análise de valores que se afastem do panorama geral, de forma expedita, verifica-se a presença de outliers

através de um boxplot.

54

Figura 41 - Representação boxplot das variáveis, nomeadamente, 1-HTH, 2-MTH, 3-LTH, 4-MD, 5-Ele, 6-GVA

Do gráfico (Figura 41) apresentado verifica-se que não são identificados outliers.

6.2 Mapa de correlações

Um dos métodos mais usados para investigar a relação entre cada par de variáveis é através de diagramas de

dispersão cartesianos. Esta representação é uma ferramenta que permite verificar se existe alguma ocorrência de

tendências e de extrair grandezas que quantifiquem essa relação. Implementando essas conclusões para cada

variável tem-se na Tabela 12 e na Figura 42 a correlação entre cada variável segundo Pearson.

Tabela 12 - Matriz de correlações das variáveis disponibilizadas

HTH MTH LTH MD Ele GVA

HTH 1,00 0,81 0,90 0,84 0,91 0,90

MTH 0,81 1,00 0,94 0,95 0,93 0,94

LTH 0,90 0,94 1,00 0,98 0,99 0,99

MD 0,84 0,95 0,98 1,00 0,98 0,99

Ele 0,91 0,93 0,99 0,98 1,00 1,00

GVA 0,90 0,94 0,99 0,99 1,00 1,00

55

Figura 42 - Correlação segundo Pearson com nível de significância de 10e-36

Da análise da Figura 42 identifica-se a existência de fortes correlações entre variáveis, já que a maior parte

apresenta valores de correlação perto da unidade. Há, no entanto, variáveis como o HTH e o MTH que, apesar de

o coeficiente de Pearson ser relativamente mais baixo, têm dispersões significativas com todas as variáveis quando

comparadas com as restantes. Isto é indicativo que estas variáveis serão preponderantes na descrição do problema,

pois apresentam comportamento não linear e, portanto, acrescentarão informação adicional para a previsão.

No entanto, esta análise apenas correlaciona cada par de variáveis, procedendo-se a uma nova análise que se

apresenta em seguida.

6.3 Análise de Componentes Principais (PCA)

Devido à standardização dos dados, quando se procede à análise PCA a matriz obtida é, automaticamente, a matriz

de correlação.

Seguidamente aplicou-se a análise das componentes principais aos dados do problema e observou-se a

significância de cada variável em cada uma das componentes. A Tabela 13 abaixo demonstra a matriz de

covariância que explana essa relação.

56

Tabela 13 - Componentes principais do PCA

1ªComp 2ªComp 3ªComp 4ªComp 5ªComp 6ªComp

HTH 0,3840 0,8418 0,2741 -0.0753 -0,2400 -0,0740

MTH 0,3999 -0,4364 0,8023 -0,0386 0,0507 -0,0423

LTH 0,4168 -0,0173 -0,1960 0,8536 0,1683 -0,1747

MD 0,4122 -0,3098 -0,3604 -0,2271 -0,6653 -0.3318

Ele 0,4171 0,0286 -0,2719 -0,4563 0,6844 -0.2730

GVA 0,4183 -0,0614 -0,1971 -0,0658 -0,0228 0,8818

Como se pode confirmar através dos valores próprios da matriz de covariância apresentados na Tabela 14 verifica-

se que a primeira componente tem um valor próprio de 5,6853, e, portanto descreve 94,75% da amostra. A segunda

componente já só apresenta um valor próprio de 0,2197, sendo inferior à unidade, pelo que, segundo Elizabeth

Reis (2001) já poderia não ser usada na análise. Não obstante, quanto mais componentes forem utilizadas mais

informação se encontrará disponível para a modelação.

Para se proceder à seleção das variáveis que descrevem a primeira componente deve-se analisar, por linha, o maior

elemento e/ou o menor. Neste caso, como a coluna apresenta valores muito próximos, optar-se-á por selecionar o

maior, ou seja, o elemento correspondente à variável GVA.

Na segunda coluna identificam-se 3 situações:

HTH com uma forte correlação positiva;

Correlações negativas MTH e MD opta-se pelo mais negativo, MTH;

As restantes têm uma correlação baixa.

Assim, para a segunda componente selecionam-se as variáveis HTH e MTH.

Na terceira componente seleciona-se a variável mais negativa, ou seja, o termo referente a MD. O elemento maior,

por estar relacionado com a variável MTH, e já ter sido selecionado, não será contemplado nesta componente.

Assim, visto todos os outros termos serem em torno do valor de MD, estes não serão escolhidos.

Relativamente à quarta componente, seleciona-se novamente o maior termo, portanto a variável LTH. Finalmente,

em última escolha surge o Ele com o valor mais negativo.

Assim, em termos de prioridade de escolha na seleção das variáveis para a descrição do problema, tem-se GVA,

HTH, MTH, MD, LTH e o Ele.

Tabela 14 - Valores próprios de cada componente principal

Componentes Valores

próprios

Explicação da

variância (%)

Variáveis

selecionadas

1ª 5,6853 94,7551 GVA

2ª 0,2197 3,6621 HTH e MTH

3ª 0,0758 1,2636 MD

4ª 0,0123 0,2042 LTH e Ele

5ª 0,0049 0,0814 -

6ª 0,0020 0,0336 -

57

À semelhança do que foi feito na escolha através da matriz de correlações analisa-se o gráfico biplot em que se

apresentam as componentes num sistema de eixos e os vetores de cada uma das variáveis descritas nessas

componentes. A título de exemplo apresentam-se as primeiras duas componentes na Figura 43. Desta forma pode-

se visualizar a dimensão e orientação das variáveis descritas nessas componentes principais, além de reforçar a

seleção feita relativamente a GVA, HTH, MTH e MD.

Figura 43 - Componente 1 versus Componente 2

Pode-se ainda observar o gráfico ScreePlot (Figura 44) onde, uma forma de exclusão dos dados tem por base

analisar os valores próprios. Quando estes se tornam inferiores à unidade é porque o seu contributo já se encontra

reduzido o suficiente e, assim podem ser excluídas todas as variáveis que lhes estão associadas (Elizabeth Reis,

2001).

Figura 44 - Gráfico ScreePlot

58

Esta análise permite concluir quais as variáveis mais preponderantes na descrição do problema e, portanto, na

definição dos inputs da rede que permitam obter previsões sem perda de informação importante para tal.

6.4 Modelos de Previsão

Modelos dinâmicos de Redes Neuronais Artificiais

Finalmente procedeu-se à identificação de um modelo tendo por base as redes neuronais dinâmicas.

Quando se procede ao treino da rede os valores dos pesos são definidos aleatoriamente então, por isso, a qualidade

da rede para a previsão terá também uma aleatoriedade inerente. Assim procedeu-se ao treino de 640 redes onde

se testaram múltiplas vezes várias combinações de variáveis de entrada com um e dois anos de atraso nas variáveis

de exergia. Este processo foi bastante longo tendo demorado, para cada simulação, cerca de 24h. Verificou-se que

a simulação com step-ahead superiores a um, assim como, atrasar as variáveis de entrada mais do que um ano não

se obtinham melhores resultados.

Após essa análise, identificou-se a estrutura da rede (Figura 45) que produzia os melhores resultados de MSE e,

assim, passou a ser a considerada para modelar e descrever o problema. A rede é composta por 6 camadas

escondidas com 85 neurónios por camada escondida e pelas variáveis de entrada: GVA, HTH, MTH, LTH, MD e

Ele, também, as últimas cinco atrasadas um ano.

Figura 45 - Estrutura da rede retirada do software MATLAB

Da estrutura da rede apresentada observa-se que a rede recebe 6 variáveis de entrada (em x(t)), onde 5 dessas

variáveis (em y(t)) entram também com um ano anterior à previsão:

x(t) = [matriz com as variáveis GVA, HTH, MTH, LTH, MD, Ele] sem atraso (representado pelo 0 do “relógio”

em hidden) e y(t) = [matriz com as varáveis HTH, MTH, LTH, MD, Ele]. Esta variável corresponde às variáveis

que se encontram com um ano de atraso, já que estes dados permanecem um (representado pelo 1 do “relógio” em

hidden) ciclo à espera para entrar na rede.

A rede é composta por seis camadas escondidas (número 6 em hidden) em que os neurónios são modelados por

funções sigmoides e desta são previstas as cinco variáveis pretendidas (número 5 em output).

Na Figura 46, Figura 47, Figura 48, Figura 49 e Figura 50 apresentam-se os resultados da previsão que resultaram

de uma rede. Assinalado a preto encontra-se a previsão dos primeiros 40 anos que foram usados no treino,

validação e teste das redes (1-step-ahead-prediction), e a verde a previsão a 10 anos em modo closed loop, sendo

que os pontos a vermelho representam os dados conhecidos e que se pretendem prever.

59

Figura 46 – Representação de HTH segundo a RNA

Figura 47 - Representação de MTH segundo a RNA

60

Figura 48 - Representação de LTH segundo a RNA

Figura 49 - Representação de MD segundo a RNA

61

Figura 50 - Representação de Ele segundo a RNA

Dos gráficos da Figura 46, Figura 47, Figura 48, Figura 49 e Figura 50 verifica-se que foram atingidas boas

aproximações nos dados utilizados para treino e validação da rede (primeiros 40 anos) apresentando uma previsão

satisfatória para os 10 anos seguintes. Observa-se que os maiores erros absolutos de previsão não ultrapassam os

5% nalguns anos (exemplo: previsão de LTH em 2007), um valor perfeitamente aceitável.

Dado que os 40 primeiros anos foram os usados no treino e validação da rede era expectável que o modelo se

aproximasse bastante desses, no entanto, os últimos 10 anos mais dificilmente terão essa aproximação já que a

rede não teve informação sobre esses durante a fase de aprendizagem. Além disso, nesses 10 anos, dado que cada

previsão feita é encontrada com base em anos que já tinham sido estimados, existe uma acumulação de erro a cada

novo ano. Tanto a Tabela 15 como a Figura 51 apresentadas consolidam as expectativas anteriores.

Outra dificuldade intimamente ligada aos anos de previsão está a variação brusca dos dados das variáveis HTH e

MTH, que poderão introduzir oscilações indesejáveis nas restantes.

A Tabela 15 fundamenta essa aproximação com erros relativamente baixos. Nela consta o erro respetivo para cada

uma das variáveis durante os 40 anos usados na identificação do modelo, bem como, o erro dos últimos 10 anos a

serem previstos e um erro global relativo aos 50 anos.

Tabela 15 – Erro quadrático médio da RNA

Anos HTH MTH LTH MD Ele

1960-1999 1,23 × 10−7 2,01 × 10−7 2,30 × 10−7 1,80 × 10−7 2,25 × 10−7

2000-2009 4,10 × 10−4 1,46 × 10−4 3,86 × 10−4 5,12 × 10−4 8,25 × 10−4

1960-2009 8,37 × 10−5 2,99 × 10−5 7,90 × 10−5 1,05 × 10−4 1,69 × 10−4

62

Figura 51 - Erro global das variáveis

No sentido de perceber se em termos globais de cada variável existia alguma tendência de erro anual procedeu-se

à determinação do erro de todas as variáveis e à sua representação ao longo dos anos, Figura 51.

Da análise do gráfico concluiu-se que o erro, em valor absoluto, apresenta um comportamento aleatório e que as

variáveis que mais contribuem para o erro de previsão são o MTH, MD e Ele, não obstante, das Figura 47, Figura

49 e Figura 50 o comportamento das variáveis seguir a tendência dos dados.

63

Regressão Linear Múltipla

Um outro modelo que seria útil na previsão da exergia é o modelo de regressão linear múltipla que tem a forma da

Equação (3.2). Para se proceder à previsão dos últimos dez anos, utilizar-se-ão os dados previstos e realimentar-

se-ão esses resultados nas equações para a previsão do ano seguinte.

Neste modelo, no entanto, há a necessidade de se verificarem condições estatísticas que garantam a

reprodutibilidade dos dados. Nesse sentido estimam-se os parâmetros associados ao modelo e verifica-se a

significância de cada variável na explicação do modelo. Por fim são descritos os resultados obtidos e retiradas

conclusões.

Inicialmente foi construída uma tabela (Tabela 16) para perceber a relação entre as variáveis, onde são

apresentados os p-values de regressão. Esta observação tem como objetivo perceber quais os coeficientes que têm

uma significância maior de 5%, ou seja, são esses os considerados relevantes para a análise de cada variável.

Tabela 16 - P-value da regressão para cada variável

HTH

MTH LTH MD Ele GVA

HTH 0,0002 0,5048 0,2049 0,0116 3,2165 × 10−7 0,0794

MTH 0,5048 0,5150 0,5594 0,3708 0,4555 0,0050

LTH 0,2049 0,5594 0,0362 0,4269 0,7689 0,0037

MD 0,0116 0,3708 0,4269 0,0909 0,0726 0,0005

Ele 3,2165 × 10−7 0,4555 0,7689 0,0726 0,0206 0,1468

GVA 0,0794 0,0050 0,0037 0,0005 0,1468 0,8842

Após esta tabela são demonstrados os gráficos, Figura 52, Figura 53, Figura 54, Figura 55 e Figura 56, relacionados

com cada variável, onde se verifica a capacidade descritiva do modelo.

Figura 52 - Representação de HTH segundo a Regressão Linear Múltipla

64

Figura 53 - Representação de MTH segundo a Regressão Linear Múltipla

Figura 54 - Representação de LTH segundo a Regressão Linear Múltipla

65

Figura 55 - Representação de MD segundo a Regressão Linear Múltipla

Figura 56 - Representação de Ele segundo a Regressão Linear Múltipla

Além de, visualmente, os resultados se aproximarem dos dados objetivo, o erro alcançado por este modelo é o

apresentado na Tabela 17. Esta apresenta a mesma lógica de erros que a Tabela 15 para a RNA.

Tabela 17 - Erros da regressão linear múltipla


1960-1999 1,33 × 10−2 7,27 × 10−2 1,12 × 10−2 0,45 × 10−2 0,37 × 10−2

2000-2009 8,17 × 10−1 2,48 × 10−1 1,99 × 10−1 4,53 × 10−2 1,11 × 10−1

1960-2009 1,74 × 10−1 1,08 × 10−1 4,88 × 10−2 1,27 × 10−2 2,51 × 10−2

Apresenta-se ainda na Figura 57 um gráfico de resíduos, já que é importante para a validação do modelo que o

resíduo tenha média nula. O significado de se ter resíduo aleatório pressupõe que não existe mais informação

66

quantificável nos dados, isto é, a informação restante é apenas ruído. Existe, no entanto, um comportanto não linear

no resíduo pelo que se conclui que este modelo não é capaz de captar alguns comportamentos presentes nos dados.

Figura 57 - Gráfico dos resíduos da regressão linear múltipla

Regressão Linear Multivariada

Seguidamente procede-se à análise multivariada baseada na Equação (3.3), no sentido de se determinar se este

modelo apresenta melhores resultados. Sendo um modelo multivariado, espera-se que, no caso de existir um

acoplamento entre as variáveis, os resultados tenham um bom comportamento. Na Figura 58, Figura 59, Figura

60, Figura 61 e Figura 62 são apresentados os resultados obtidos com o modelo desenvolvido.

Figura 58 - Representação de HTH segundo a Regressão Linear Multivariada

67

Figura 59 - Representação de MTH segundo a Regressão Linear Multivariada

Figura 60 - Representação de LTH segundo a Regressão Linear Multivariada

68

Figura 61 - Representação de MD segundo a Regressão Linear Multivariada

Figura 62 - Representação de Ele segundo a Regressão Linear Multivariada

À semelhança do efetuado com o modelo de regressão múltipla também se apresenta o gráfico dos resíduos na

Figura 63. Neste caso são representadas as curvas de nível de uma superfície gaussiana no sentido de melhor

visualização da dispersão do erro.

69

Figura 63 - Gráfico dos resíduos da regressão linear multivariada

Analogamente ao caso da RNA e da regressão linear múltipla, apresentam-se na Tabela 18 os erros obtidos deste

modelo.

Tabela 18 - Erros da regressão linear multivariada


1960-1999 0,98 × 10−1 0,78 × 10−1 0,68 × 10−1 3,98 × 10−2 5,58 × 10−2

2000-2009 2,74 × 10−1 3,17 × 10−1 1,58 × 10−1 0,65 × 10−2 0,57 × 10−2

1960-2009 1,33 × 10−1 1,26 × 10−1 8,63 × 10−2 3,32 × 10−2 4,57 × 10−2

6.5 Comparação entre os três métodos de previsão

Da análise dos vários métodos pode-se verificar que as redes neuronais permitiram alcançar valores de erro de

previsão inferiores. Na Tabela 19 identificou-se ainda um erro acumulado das variáveis, isto é, procedeu-se ao

cálculo do erro quadrático médio dos erros de cada uma das variáveis tendo em conta que a referência neste caso

era zero, Equação (6.1):

𝛴 =

(𝑀𝑆𝐸_𝐻𝑇𝐻2 + 𝑀𝑆𝐸_𝑀𝑇𝐻2 + 𝑀𝑆𝐸_𝐿𝑇𝐻2 + 𝑀𝑆𝐸_𝑀𝐷2 + 𝑀𝑆𝐸_𝐸𝑙𝑒2)

5

(6.1)

70

Tabela 19 - Comparação de erros ao longo dos 50 anos

HTH MTH LTH MD Ele Erro Global

Múltipla 1,74 × 10−1 1,08 × 10−1 4,88 × 10−2 1,27 × 10−2 2,51 × 10−2 9,01 × 10−3

Multivariada 1,33 × 10−1 1,26 × 10−1 8,63 × 10−2 3,32 × 10−2 4,57 × 10−2 8,84 × 10−3

RNA 8,37 × 10−5 2,99 × 10−5 7,90 × 10−5 1,05 × 10−4 1,69 × 10−4 3,37 × 10−5

Dessa tabela verifica-se ainda que a regressão linear multivariada permitiu alcançar um erro inferior à regressão

linear múltipla, no entanto a ordem de grandeza não é muito diferente o que dá indícios de que, apesar de existir

acoplamento entre as variáveis, como visto da análise de PCA (matriz de covariância), descrever o problema como

sendo linear é insuficiente para se conseguirem resultados satisfatórios.

Por outro lado, a rede neuronal obteve o melhor resultado das três análises em estudo. Este facto deve-se

essencialmente à descrição não linear fornecida pela função sigmoide dos neurónios. Além disso, o facto de a rede

ter uma sobre-definição de parâmetros na sua estrutura permite a flexibilidade característica das RNA e, portanto

foi possível obter previsões com uma ordem de grandeza três vezes inferior no caso das RNA, observado na Tabela

20.

Tabela 20 - Comparação de erros ao longo dos 10 anos de previsão

HTH MTH LTH MD Ele Erro Global

Múltipla 8,17 × 10−1 2,48 × 10−1 1,99 × 10−1 4,53 × 10−2 1,11 × 10−1 1,57 × 10−1

Multivariada 2,74 × 10−1 3,17 × 10−1 1,58 × 10−1 0,65 × 10−2 0,57 × 10−2 0,40 × 10−1

RNA 4,10 × 10−4 1,46 × 10−4 3,86 × 10−4 5,12 × 10−4 8,25 × 10−4 1,65 × 10−4

Por último são apresentados gráficos (Figura 64, Figura 65, Figura 66, Figura 67, Figura 68) dos erros dos dez

anos de previsão para cada análise. Concluiu-se que em termos genéricos olhando para o somatório dos erros, que

apesar de haver uns anos melhores que outros, os gráficos individualmente aproximam bem aos dados reais. É de

notar que quanto maior for a “teia” maior será o erro nesse ano, caso a “teia” seja pequena o erro é menor.

Concluiu-se, por observação gráfica, que a rede neuronal foi o modelo de previsão que melhor se adaptou aos

dados dando uma informação muito útil sobre a previsão das variáveis individualmente.

Figura 64 - Evolução do erro das variáveis no ano de 2000 e 2001 para as três análises de previsão

71




72


73

7. Conclusões e Trabalho Futuro

Conclusões

O objetivo deste trabalho foi fazer um novo estudo que combina a abordagem das Redes Neuronais Artificiais

(RNA) com a evolução temporal da exergia útil com o intuito de fazer previsões de consumos energéticos em

Portugal no período de 2000 a 2009. Dispunha-se de informação sobre Valor Acrescentado Bruto (GVA) e da

exergia útil, nomeadamente, High Temperature Heat (HTH), Medium Temperature Heat (MTH), Low

Temperature Heat (LTH), Mechanical Drive (MD) e Other Electric Uses + Light (Ele) relativos a 50 anos (período

de1960 a 2009).

Como foi referido anteriormente já existem exemplos da utilização de RNA para fazer previsões do consumo de

energia usando dados de energia final, por exemplo, caso da Grécia e Coreia do Sul, apresentados nas secções

4.8.1 e 4.8.2, e o caso da China que utiliza a exergia útil para fazer essa mesma previsão, apresentado na secção

2.2.1. Igualmente, no trabalho de Percebois (1979) suportado por Serrenho et al. (2014) onde se sugere que a

intensidade energética (consumo energético em função do PIB) era mais bem calculada no último patamar da

cadeira energética por calcular as necessidades para satisfazer os diferentes utilizadores finais. Com esta

dissertação adquirem-se conhecimentos adicionais sobre este assunto, pois aborda de forma pioneira a utilização

de RNA para fazer previsões de exergia útil por tipo de uso.

Realizou-se uma pesquisa de tipos de previsão (Secção 2.2) existentes. Pode-se considerar que este presente estudo

se enquadra nos tipos de previsão de: i) análise de utilização final, por se focar nos serviços que usam energia e

por representar explicitamente a utilização final sendo relativamente fácil incorporar modificações na sua política;

ii) análise combinada, por empregar métodos regressivos quando as tendências parecem ser robustas e, quando são

mais fracas utiliza a análise de utilização final; iii) análise de cenários, por poderem ser elevadas a qualquer grau,

incluindo análises numéricas e poder levar os seus utilizadores a considerar hipóteses que não tinham concebido

anteriormente.

Com os dados disponibilizados pretendeu-se modelar e prever informação relativa às exergias úteis por tipo de

uso. No entanto, esta tarefa é um fenómeno complexo: assim as redes neuronais, devido à aptidão que têm para

distinguir as relações existentes num determinado conjunto de dados, demonstraram ser uma ferramenta com boa

capacidade para este processo face a métodos mais convencionais como a regressão linear múltipla e a regressão

linear multivariada.

Antes da construção dos vários modelos fez-se um pré-tratamento de dados e efetuaram-se análises de correlações

de modo a aferir as variáveis que contribuem com mais informação para a descrição das exergias úteis a prever e,

proceder a uma redução do número de variáveis, no caso de se verificar necessário. Para tal procedeu-se à análise

de componentes principais (PCA). Essa análise foi bastante útil para o início do trabalho, enquanto ainda não se

sabia de onde partir, pois foi possível encontrar um conjunto de variáveis com maior influência no processo de

previsão, as quais foram definidas como inputs da rede. As variáveis eleitas são, por ordem decrescente de

contribuição - GVA, HTH, MTH, MD, LTH, Ele.

74

Neste caso de estudo, optou-se por aplicar o algoritmo de otimização Levenberg-Marquardt para o treino da RNA.

Através desta metodologia foi possível obter um ajuste aos dados reais para o período compreendido entre 1960 e

2009. A rede que apresentou os melhores resultados de previsão é composta por 6 camadas escondidas e 85

neurónios na camada escondida onde, das variáveis de entrada GVA, HTH, MTH, LTH, MD e Ele, as últimas cinco

entram com informação de um ano anterior à previsão.

Os dados dos primeiros quarenta anos foram usados no conjunto de treino, teste e validação da rede e, os últimos

dez anos foram apenas para verificação da previsão, tendo sido aplicada nestes a rede em closed loop. Com esta

rede obteve-se um valor de MSE de 1,65 × 10−4 relativo aos dez anos de previsão.

No sentido de verificar a qualidade da rede compararam-se os resultados com modelos obtidos pela regressão

linear múltipla e pela regressão linear multivariada. Estes demonstraram ter qualidade inferior comparativamente

à RNA.

Em todos os casos verificou-se dificuldade na extrapolação devido à discrepância comportamental dos dados de

treino (primeiros quarenta anos) e de previsão (últimos dez anos). Aparecendo essas dificuldades na falta de

flexibilidade às variações bruscas no caso das regressões lineares.

Trabalho Futuro

Como trabalho futuro, é importante avaliar a relação com outras variáveis de input e testar uma nova estrutura de

rede. As redes neuronais são um método que necessita de bastantes dados para ser obtido um modelo que se ajuste

bem a cada caso de estudo e, por isso se utilizam várias variáveis de input.

Ainda como sugestão para desenvolvimentos futuros, seria importante analisar amostras para mais anos destas

variáveis, já que um aumento do número de dados disponíveis poderá contribuir para a obtenção de melhores

desempenhos na modelação do processo de previsão de exergia.

Com este estudo, pode-se considerar que a utilização de redes neuronais dinâmicas para a modelação do processo

de previsão de exergias é um modelo vantajoso e que, eventualmente, poderá ser adaptado a outros países.

Outra sugestão surge no sentido de se adaptar estas redes neuronais dinâmicas na utilização da previsão de outros

tipos de consumo sem ser apenas energia.

Como nota final e baseando-nos no artigo desenvolvido para a China (Brockway et al., 2015) seria interessante

desenvolver um estudo de previsão de consumos de energia para o horizonte de 2030-2050 para Portugal, usando

cenários de GVA e comparar com os cenários existentes.

75

Referências Ayres, R. and Warr, B. (2010). The Economic Growth Engine: How Energy and Work Drive Material Prosperity.

Edward Elgar Publishing.

B. Krose and P. Van Der Smagt (1996), An introduction to Neural Networks, 8th ed., November, University of

Amsterdam.

Baughman, D.R.; Liu, Y.A. (1995), Neural Networks in Bioprocessing and Chemical Engineering, Dissertation

submitted to the Faculty of the Virginia Polytechnic Institute and State University in partial fulfillment of the

requirements for the degree of Doctor of Philosophy in Chemical Engineering.

Böhm, K., Smidt, E., andTintner, J. (2013). Application of multivariate data analysis in waste management.

Disponível em: http://www.intechopen.com/books/multivariate-analysis-in-management-engineering-and-the-

sciences/application-of-multivariate-data-analyses-in-waste-management

Boyle, G., Everett, B., Ramage, J., and University, O. (2003). Energy Systems and Sustainability: Block I. Energy

for a sustainable future. Oxford University Press, Oxford.

British Petroleum (BP) Ltd (2014). World Energy Outlook 2035 – Excel Tables. World Energy Outlook 2035.

Disponível em: <http://www.bp.com/en/global/corporate/about-bp/energy-economics/energy-outlook/energy-

outlookdownloads.html>.

Brockway, P. E., Steinberger, J. K., Barrett, J. R. and Foxon, T. J. (2015). Understanding China´s past and future

energy demand: An exergy efficiency and decomposition analysis. Applied Energy, 155:892–903.

Brockway, P. E., Steinberger, J. K., Barrett, J. R. and Foxon (2014). Divergence of trends in US and UK aggregate

exergy efficiencies 1960–2010. Environ Sci Technol;48:9874–81.

Carla Henriques (2010/2011), Análise de Regressão Linear Simples e Múltipla, Departamento de Matemática

Escola Superior de Tecnologia de Viseu, Disponível em:

http://www.estgv.ipv.pt/PaginasPessoais/psarabando/Ambiente%202010-2011/Slides/Regressaoalunos.pdf

Carnahan W, Ford KW, Prosperetti A, et al. (1975). Technical aspects of the more efficient utilization of energy:

Chapter 2 – Second law efficiency: the role of the second law of thermodynamics in assessing the efficiency of

energy use. Am Inst Phys Conf Ser;25:25–51.

Coelho-Barros, E.A., Simões, P.A., Achcar, J.A., Martinez, E.Z. e Shimano, A.C. (2008), Métodos de estimação

em regressão linear múltipla: aplicação a dados clínicos, Revista Colombiana de Estadística, 31 (1): 111-129,

Disponível em: http://www.emis.de/journals/RCE/body/v31n1a07CoelhoEtAl.pdf

Cullen, J. M. and Allwood, J. M. (2010a). The efficient use of energy: Tracing the global flow of energy from fuel

to service. Energy Policy, 38(1):75 – 81.

76

Cullen, J. M. and Allwood, J. M. (2010b). Theoretical efficiency limits for energy conversion devices. Energy, 35

(5): 2059 – 2069.

D. J. C. MacKay (1991), “Bayesian Interpolation,” Computation and Neural Systems, May 18.

Demuth, H.; Beale, M.; Hagan, M., (2015). Neural Network ToolboxTM User’s Guide (R2015a). Natick,

Massachusetts: The MathWorks, Inc.

Dixon, W. J., Massey, F. J., et al. (1969). Introduction to statistical analysis, volume 344. McGraw-Hill New York.

Egghe, L. and Leydesdorff, L. (2009). The relation between pearson's correlation coefficient r and salton's cosine

measure. Journal of the American Society for Information Science and Technology, 60(5):1027-1036.

Elizabeth Reis (2001). Estatística Multivariada Aplicada. Edições Sílabo.

Energy Information Administration (2007). Official Energy Statistics from the US Government, Disponível

em:http://www.eia.doe.gov/emeu/cabs/index.htmlS.

Eriksson, L. (1999). Introduction to multi-and megavariate data analysis using projection methods (PCA & PLS).

Umetrics AB.

Eriksson, L.; Johansson, E.; Kettaneh-Wold, N.; Trygg, J.; Wikström; Wold, S.; (2006). Multi- and Megavariate

Data Analysis, Part I: Basic Principals and Applications, 2ª Edição, Umetrics Academy.

Ertesv�̈�g, I. S. (2005). Energy, exergy, and extended-exergy analysis of the Norwegian society 2000. Energy,

30(5):649 – 675.

for Disease Control, C. and Division, P. U. C. D. (2006). Principles of Epidemiology in Public Health Practice:

An Introduction to Applied Epidemiology and Biostatistics. U.S. Department of Health and Human Services,

Centers for Disease Control and Prevention (CDC), O-ce of Workforce and Career Development.

Friendly, M. and Institute, S. (1991). Macro Programs from The SAS system for statistical graphics. First Edition

by SAS Institute Inc., Cary, NC, USA.

Fridley D, Zheng N, Zhou N, Ke J, Hasanbeigi A, Price L. (2012) China energy and emissions paths to 2030 (2nd

Edition). Lawrence Berkeley National Laboratory (LBNL).

Gibbs, M.S., Morgan, N., Maier, H.R., Dandy, G.C., Nixon, J.B., Holmes, M. (2006). Investigation into the

relationship between chlorine decay and water distribution parameters using data driven methods. Mathematical

and Computer Modelling 44 (5-6), 485-498.

Graybill, F.A. (1976), Theory and Application of Linear Model. North Scituate Massachussets: Duxbury Press.

Guevara, Z., Serrenho, A., Sousa, T., and Domingos, T. (2014). Insights on energy transitions in Mexico from the

analysis of useful work from 1971 to 2009.

77

IIASA (2014). MESSAGE LIMITS-base (RCP 8.5) Total Primary Energy Consumption data. LIMITS Scenar.

Database (version 1.0.0). Disponível em:

<https://tntcat.iiasa.ac.at/LIMITSPUBLICDB/dsd?Action=htmlpage&page=series>.

INE (2012). Anuário Estatístico de Portugal 2012. Relatório Técnico, Instituto Nacional de Estatística.

INE (2015). Anuário Estatístico de Portugal 2012. Relatório Técnico, Instituto Nacional de Estatística.

International Energy Agency (IEA) (2013). World energy outlook 2013. Paris, France.

Kimura, H.; Huo, G.; Rasin, A.; Madden, S.; Zdonik,S. (2009) Correlation maps: a compressed access method for

exploiting soft functional dependencies. Journal Proceedings of the VLDB Endowment, Digital Library.

L. Ekonomou (2009). Greek long-term energy consumption prediction using artificial neural networks. Energy 35

512-517.

Marziye Yousefi, Mahmoud Omid, S. F. Ghaderi (2013). Strategic planning for minimizing 𝐶𝑂2 emissions using

LP model based on forecasted energy demand by PSO Algorithm and ANN. International Journal of Energy,

Environment and Economics.

Miguel Mesquita Palma (2014), Evolution of Aggregated Exergy Efficiencies per end-use in the period 1960-2009.

Master thesis, Instituto Superior Técnico, Universidade de Lisboa

Moran, M., Shapiro, H., Boettner, D., and Bailey, M. (2010). Fundamentals of Engineering Thermodynamics.

John Wiley & Sons, 5th Edition.

P. J. S. Gil, A. F. C. Relvas (2015). O pequeno livro da dissertação, IST; vs. 1.1.

Parlos, A.G., Rais, O.T., Atiya, A.F. (2000). Multi-step-ahead prediction using dynamic recurrent neural networks.

Neural Networks 13 765-786.

Paul P. Craig, Ashok Gadgil, and Jonathan G. Koomey (2002). What Can History Teach Us? A Retrospective

Examination of Long-Term Energy Forecasts for the United States.

Percebois J. (1979). Is the concept of energy intensity meaningful? Energy Economic.

Pinheiro, M. (ed.) (1997). Séries Longas para a Economia Portuguesa. Pós II Guerra Mundial, vol. I - Séries

Estatísticas. Lisbon, Banco de Portugal.

R. Guimarães, J. Cabral (1997), Estatística, Mc Graw Hill.

Reistad, G. M. (1975). Available Energy Conversion and Utilization in the United States. J. Eng. Gas Turbines

Power, 97(3):429–434.

S. Haykin (1999), Neural Networks - A Comprehensive Foundation, 9th ed. Pearson Education.

78

Sassi, C.P., Perez, F.G., Myazato, L., Ye, X., Ferreira-Silva, P.H. e Louzada, F. (2011), Modelos de Regressão

Linear Múltipla Utilizando os Softwares R e Statistica: Uma Aplicação a Dados de Conservação de Frutas,

Disponível em: http://www.icmc.usp.br/CMS/Arquivos/arquivos_enviados/BIBLIOTECA_113_RT_377.pdf

Serrenho, A. (2013). Useful Work as an Energy End-Use Accounting Method: Historical and Economic

Transitions and European Patterns. PhD thesis, Instituto Superior Técnico, Universidade de Lisboa.

Serrenho, A., Sousa, T., Warr, B., Ayres, R., Domingos, T. (2014). Decomposition of useful work intensity: The

EU (European Union)-15 countries from 1960 to 2009. Energy 76 704-715.

Serrenho, A., Warr, B., Sousa, T., Ayres, R., Domingos, T. (2015). Structure and dynamics of useful work along

the agriculture-industry-services transition: Portugal from 1856 to 2009. Structural Change and Economic

Dynamics 36 1-21.

Télvio Orrú (2003), Redes Neurais Artificiais para Reconhecimento e Classificação de Padrões. Faculdade de

Engenharia Eléctrica e de Computação. DCA/FEEC/Unicamp.

Teuvo Kohonen (2014): MATLAB Implementations and Applications of the Self-Organizing Map. Aalto

University, School of Science, Helsinki, Finland.

Tsungnan Lin, Bill G. Horne, Member, IEEE, Peter Tiiio, and C. Lee Giles, Senior Member, IEEE (1996).

Learning Long-Term Dependencies in NARX Recurrent Neural Networks. JEEE TRANSACTIONS ON

NElJRAL NETWORKS, VOL. I, NO. 6, NOVEMBER.

US Energy Information Administration (USEIA) (2014). World primary energy consumption. Int Energy

Outlook 2014; Disponível em: <http://www.eia.gov/oiaf/aeo/tablebrowser/#release=IEO2013&subject=1-

IEO2013&

table=1-IEO2013&region=0-0&cases=Reference-d041117>.

Utlu, Z. and Hepbasli, A. (2007). A review on analyzing and evaluating the energy utilization efficiency of

countries. Renewable and Sustainable Energy Reviews, 11(1):1–29.

Varella, C. A. A. (2008). Análise de componentes principais. Universidade Federal Rural do Rio de Janeiro,

Disponível em: http://www.ufrrj.br/institutos/it/deng/varella/Downloads

Wall, G. (1977). Exergy - a useful concept within resource accounting. Technical Report 77-42, Gotland

University, School of Culture, Energy and Environment.

Wall, G. (1987). Exergy conversion in the Swedish society. Resources and Energy, 9(1):55 – 73.

Wickham, H. and Stryjewski, L. (2011). 40 years of boxplots. November 29. Disponível em:

http://vita.had.co.nz/papers/boxplots.pdf

Yeh, S.-T., GlaxoSmithKline, and King of Prussia, P. (2007). Exploratory visualization of correlation matrices. In

NorthEast SAS Users Group (NESUG) conference 2007.

Zhang, G., Eddy Patuwo, B., and Y Hu, M. (1998). Forecasting with artificial neural networks: The state of the

art. International journal of forecasting, 14 (1): 35-62.

79

Zong Woo Geem, Z.W. e Roper, W.E. (2009). Energy demand estimation of South Korea using artificial neural

network. Energy Policy 37 4049 – 4054.

Aplicação de Modelos de Redes Neuronais para Previsão de...

Documents

Transcript of Aplicação de Modelos de Redes Neuronais para Previsão de...