Estimativa da geração de energia eléctrica em sistemas de ...€¦ · ii ABSTRACT A model to...
Transcript of Estimativa da geração de energia eléctrica em sistemas de ...€¦ · ii ABSTRACT A model to...
Estimativa da geração de energia eléctrica em sistemas de
micro-geração baseado em previsões meteorológicas
Bernardo Filipe Maceira Fonseca
Dissertação para obtenção do Grau de Mestre em:
Engenharia Mecânica
Orientador: Prof. Carlos Augusto Santos Silva
Júri
Presidente: Prof. Mário Manuel Gonçalves da Costa
Orientador: Prof. Carlos Augusto Santos Silva
Vogal: Prof. Susana Margarida da Silva Vieira
Junho 2016
i
AGRADECIMENTOS
Este espaço é dedicado àqueles que deram a sua contribuição para que esta dissertação fosse
realizada.
Em primeiro lugar, quero agradecer ao meu orientador, Professor Carlos Augusto Santos Silva, pelo
acompanhamento oferecido e apoio ao longo desta dissertação. Agradeço especialmente toda a
motivação, que se revelou essencial.
Agradeço aos meus colegas e amigos pela amizade, disponibilidade, paciência, ajuda e por todos os
bons momentos ao longo destes anos. Um especial agradecimento ao meu amigo Luís Almeida, pela
sua disponibilidade e entusiasmo, e à minha colega Mafalda Morais, por toda a paciência e apoio na
partilha de conhecimentos.
Quero também agradecer ao Grupo de Previsão Numérica do Tempo, em especial ao Eng.º Jorge
Palma, por todos os esclarecimentos e por todo o apoio no desenvolvimento desta dissertação
Finalmente, aos meus pais, irmã e restante família pelo apoio constante, ajuda, disponibilidade, pelos
valores incutidos e por fazerem de mim quem sou.
ii
ABSTRACT
A model to estimate the future power generation of a PV-wind hybrid microgeneration system was
developed, for forecast horizons between 12 hours and 3 days ahead. The starting point is getting
irradiance, temperature and relative humidity forecasts, provided by the MM5 mesoscale model, a
numerical weather prediction model (NWP). In an attempt to correct systematic errors in these forecasts,
an artificial neural network (ANN) was developed. This network uses the forecasted variables, along
with their respective forecast horizon, and computes a new forecast for the global horizontal irradiance.
With this value, the total irradiance for the tilted PV panels is then calculated using the Reindl et al. [1]
anisotropic model. Finally, using an equivalent model for the PV panels, the power generation is
estimated.
The models developed were assessed in terms of their root mean square errors (RMSE), by comparing
the forecasted values with irradiance measurements and approximated power measurements.
The obtained results indicate the presence of large forecasting errors in the MM5 predicted values, as
the mean irradiance RMSE was 273.28 W/m2. By using the artificial neural network, this error was
reduced to 221.47 W/m2, which is still a large error. The equivalent model was partially validated,
considering the existence of experimental errors related to the estimation of real power measurements.
As such, it is estimated that the developed model will be able to forecast the system’s future power
production, with nRMSE values ranging from 50% to 120%, an error that may be disproportionately
higher in particular cases.
Key-words: Power generation estimation, irradiance forecast, ANN, NWP, post-processing, MM5.
iii
RESUMO
Nesta dissertação desenvolveu-se um modelo para a estimação da produção eléctrica futura de um
sistema de micro-geração híbrido (fotovoltaico e eólico), para horizontes temporais de 12 horas até 3
dias adiante. Partiu-se de previsões numéricas da irradiância, temperatura e humidade relativa,
provenientes do modelo de mesoescala MM5. De modo a tentar corrigir erros sistemáticos destas
previsões, desenvolveu-se uma rede neuronal artificial, que processa os parâmetros previstos,
juntamente com seu o respectivo horizonte temporal, para fornecer previsões da irradiância horizontal
global. Com este valor, utilizou-se o modelo anisotrópico de Reindl et al. [1] para calcular a irradiância
global no plano dos painéis fotovoltaicos do sistema, e aplicou-se um modelo equivalente para estimar
a produção eléctrica correspondente dos painéis.
O desempenho dos modelos foi avaliado com base na raiz do erro quadrático médio (RMSE),
comparando as previsões com medições de irradiância e medições aproximadas de potência.
Os resultados obtidos indicam a existência de erros consideráveis nas previsões do MM5, cujo RMSE
médio na previsão da irradiância foi 273,28 W/m2. Com a utilização da rede neuronal, este erro diminuiu
para 221,47 W/m2, valor que é, mesmo assim, bastante significativo. A utilização do modelo equivalente
para o cálculo da produção eléctrica foi parcialmente validada, tendo em conta que existiram erros
experimentais associados à estimação dos valores reais. Assim, estima-se que o modelo desenvolvido
consiga prever a produção futura com um nRMSE entre 50% e 120%, erro que poderá ser
desproporcionalmente superior em situações pontuais.
Palavras-chave: Estimação da produção eléctrica, previsão da irradiância, rede neuronal artificial,
modelo numérico de previsão, pós-processamento, MM5.
iv
ÍNDICE
Agradecimentos ...................................................................................................................................... i
Abstract .................................................................................................................................................. ii
Resumo ................................................................................................................................................. iii
Lista de tabelas ..................................................................................................................................... vi
Lista de figuras ..................................................................................................................................... vii
Lista de acrónimos e abreviaturas ......................................................................................................... ix
1 Introdução....................................................................................................................................... 1
1.1 Motivação e enquadramento ..................................................................................................... 1
1.2 Objectivo .................................................................................................................................... 2
1.3 Estrutura da dissertação ............................................................................................................ 2
2 Estado da arte ................................................................................................................................ 4
2.1 Métodos de previsão ................................................................................................................. 4
2.1.1 Persistência .......................................................................................................................... 4
2.1.2 Sky imagery .......................................................................................................................... 4
2.1.3 Imagens de satélite............................................................................................................... 6
2.1.4 Métodos físicos de previsão numérica (NWP) ...................................................................... 7
2.1.5 Outros modelos numéricos ................................................................................................... 8
2.1.6 Métodos híbridos ................................................................................................................ 11
2.1.7 Resumo dos métodos de previsão da irradiância ............................................................... 12
2.2 Avaliação do desempenho do método de previsão ................................................................. 13
3 Metodologia .................................................................................................................................. 17
3.1 Descrição do sistema .............................................................................................................. 17
3.2 Previsão da irradiância ............................................................................................................ 19
3.2.1 Modelo de previsão numérica ............................................................................................. 19
3.2.2 Rede neuronal artificial ....................................................................................................... 22
3.3 Estimativa da produção eléctrica ............................................................................................. 31
3.3.1 Irradiância incidente no plano do painel fotovoltaico .......................................................... 31
3.3.2 Temperatura da célula ........................................................................................................ 36
3.3.3 Características técnicas do painel fotovoltaico ................................................................... 36
3.3.4 Modelo equivalente – modelo de um díodo e três parâmetros ........................................... 37
v
3.4 Cálculo da produção eléctrica.................................................................................................. 41
4 Resultados obtidos ....................................................................................................................... 42
4.1 Previsão da irradiância ............................................................................................................ 42
4.1.1 Modelo de previsão numérica ............................................................................................. 43
4.1.2 Rede neuronal artificial ....................................................................................................... 45
4.1.3 Resultados do pós-processamento .................................................................................... 50
4.1.4 Previsão da irradiância diária ............................................................................................. 52
4.2 Estimativa da produção eléctrica ............................................................................................. 61
5 Conclusão..................................................................................................................................... 66
Referências .......................................................................................................................................... 69
Anexos ................................................................................................................................................. 76
vi
LISTA DE TABELAS
Tabela 2.1 - Resumo das principais características dos métodos de previsão para a irradiância........ 13
Tabela 3.1 - Características técnicas dos equipamentos principais existentes no PEC (Adaptado de
[66]) ...................................................................................................................................................... 18
Tabela 3.2 – Parâmetros previstos pelos GPNT .................................................................................. 20
Tabela 3.3 - Funções de activação ...................................................................................................... 28
Tabela 3.4 - Características técnicas necessárias dos painéis fotovoltaicos ....................................... 37
Tabela 4.1 – Redes neuronais testadas na análise preliminar ............................................................. 49
Tabela 4.2 – Erros obtidos com os vários modelos de pós-processamento......................................... 50
Tabela 4.3 – Comparação de resultados para as melhores redes neuronais ...................................... 52
Tabela 4.4 – Comparação dos erros obtidos com e sem pós-processamento para dias seleccionados
............................................................................................................................................................. 59
Tabela 4.5 – Comparação dos erros obtidos na estimação da potência .............................................. 64
vii
LISTA DE FIGURAS
Figura 2.1 – SI [14] ................................................................................................................................. 5
Figura 2.2 – Formação da malha do modelo GME ................................................................................. 7
Figura 2.3 – Esquema de uma ANN feedforward (Adaptado de [43]) .................................................... 9
Figura 3.1 – PEC no Taguspark [66] .................................................................................................... 17
Figura 3.2 – Esquema das ligações do PEC (Adaptado de [66]) ......................................................... 18
Figura 3.3 – Interacção entre as parametrizações no MM5 [70] .......................................................... 20
Figura 3.4 – Malhas executadas pelo GPNT com o modelo MM5 [69] ................................................ 21
Figura 3.5 – Rede recorrente (Adaptado de [74]) ................................................................................. 23
Figura 3.6 – Estrutura de um neurónio (Adaptado de [7]) .................................................................... 24
Figura 3.7 – Funções de activação (Adaptado de [83]) ........................................................................ 28
Figura 3.8 – Geometria solar (Adaptado de [92]) ................................................................................. 33
Figura 3.9 – Mapa global de albedo [98] .............................................................................................. 35
Figura 3.10 – Circuito eléctrico equivalente de uma célula fotovoltaica (modelo de um díodo e três
parâmetros) [89] ................................................................................................................................... 37
Figura 4.1 – Distribuição do erro absoluto do modelo MM5 para os dados do conjunto de teste ........ 43
Figura 4.2 – Distribuição do erro relativo do modelo MM5 para os dados do conjunto de teste .......... 43
Figura 4.3 – Distribuição do erro absoluto do modelo MM5 para o conjunto total de dados utilizados 44
Figura 4.4 – Variação do RMSE da irradiância com o número de neurónios ....................................... 45
Figura 4.5 – Análise da influência dos parâmetros de input no RMSE do índice de claridade ............. 46
Figura 4.6 – Análise da inclusão de dados sem valor objectivo e da utilização de uma função sigmóide
logística da camada de output no RMSE do índice de claridade ......................................................... 46
Figura 4.7 – Análise da influência do rácio de divisão na fase de aprendizagem no RMSE do índice de
claridade ............................................................................................................................................... 47
Figura 4.8 – Comparação do RMSE da irradiância pós-processada com as previsões do MM5 ......... 47
Figura 4.9 – Comparação do RMSE do índice de claridade entre as redes desenvolvidas e redes padrão
............................................................................................................................................................. 48
Figura 4.10 – Irradiância prevista para o dia 11 de Agosto de 2015, 1 dia adiante .............................. 53
Figura 4.11 – Irradiância prevista para o dia 31 de Outubro de 2015, 2 dias adiante .......................... 54
Figura 4.12 – Irradiância prevista para o dia 29 de Setembro de 2015, 3 dias adiante ........................ 54
Figura 4.13 – Irradiância prevista para o dia 8 de Agosto de 2015, 1 dia adiante ................................ 54
Figura 4.14 – Irradiância prevista para o dia 8 de Agosto de 2015, 2 dias adiante .............................. 55
Figura 4.15 – Irradiância prevista para o dia 8 de Agosto de 2015, 3 dias adiante .............................. 55
Figura 4.16 – Irradiância prevista para o dia 18 de Janeiro de 2016, 1 dia adiante ............................. 55
viii
Figura 4.17 – Irradiância prevista para o dia 18 de Janeiro de 2016, 2 dias adiante ........................... 56
Figura 4.18 – Irradiância prevista para o dia 18 de Janeiro de 2016, 3 dias adiante ........................... 56
Figura 4.19 – Potência produzida para o dia 8 de Agosto de 2015, com previsões 1 dia adiante ....... 61
Figura 4.20 – Potência produzida para o dia 8 de Agosto de 2015, com previsões 2 dias adiante...... 62
Figura 4.21 – Potência produzida para o dia 8 de Agosto de 2015, com previsões 3 dias adiante...... 62
Figura 4.22 – Potência produzida para o dia 15 de Agosto de 2015, com previsões 2 dias adiante.... 62
Figura 4.23 – Potência produzida para o dia 26 de Setembro de 2015, com previsões 2 dias adiante
............................................................................................................................................................. 63
ix
LISTA DE ACRÓNIMOS E ABREVIATURAS
ADF Augmented Dickey-Fuller
AM Air Mass
ANN Artificial Neural Network
AR Auto-Regressão
ARIMA Auto-Regressive Integrated Moving Average
ARMA Auto-Regressive Moving Average
COSMO-CLM Consortium for Small-scale Modeling - Climate Limited-Area Modeling
ECMWF European Centre for Medium-Range Weather Forecasts
FL Fuzzy Logic
GA Genetic Algorithm
GEM Global Environmental Multiscale
GFS Global Forecast System
GHI Global Horizontal Irradiance
GME Global Modell Ersatz
GPNT Grupo de Previsão Numérica do Tempo
LST Local Standard Time
MA Moving Average
MAE Mean Absolute Error
MBE Mean Bias Error
MC Markov Chains
MLP Multilayer Perceptron
MM5 Fifth-Generation Penn State/NCAR Mesoscale Model
MOS Model Output Statistics
MTM Markov Transition Matrix
NEO NASA Earth Observations
nMAE Normalized Mean Absolute Error
NOCT Nominal Operating Cell Temperature
nRMSE Normalized Root Mean Square Error
NWP Numerical Weather Predictions
NWS/NOAA National Weather Service/National Oceanic and Atmospheric Administration
PEC Polygeneration Energy Container
RBD Red Blue Difference
RBR Red Blue Ratio
RMSE Root Mean Square Error
SDE Standard Deviation of the Error
SI Sky Imager
STC Standard Test Conditions
SVL Support Vector Machine
TDNN Time Delay Neural Network
UTC Coodinated Universal Time
WRF Weather Research Forecast
WT Wavelet Transform
1
1 INTRODUÇÃO
1.1 Motivação e enquadramento
Nos últimos anos, a produção de energia eléctrica com recurso à utilização de painéis fotovoltaicos tem
crescido rapidamente, decorrente do aumento da sua eficiência e da diminuição dos custos associados
a esta tecnologia. De facto, enquanto que em 2007 a capacidade fotovoltaica instalada em Portugal era
residual, com apenas 15 MW instalados, entre 2010 e 2015 esta verificou um aumento superior a 340%,
tendo crescido de 134 MW para 456 MW [2]. Destes 456 MW instalados, 101 MW eram de micro-
geração (a nível residencial), 73 MW de mini-geração (telhados de superfícies comerciais) e os
restantes 282 MW estavam associados a centrais fotovoltaicas [3].
Os painéis fotovoltaicos utilizam a irradiância emitida pelo Sol, uma fonte de energia renovável, para
gerar energia de forma não poluente. Com o aumento da penetração fotovoltaica nos sistemas de
produção electricidade, novos desafios associados à sua integração vão ganhando relevância. Os dois
maiores desafios a superar por forma a não limitar o aumento da taxa de penetração desta tecnologia
são a variabilidade e incerteza na sua produção eléctrica. Isto é, o recurso solar, e consequentemente
a produção eléctrica a este associada, apresenta variabilidade em todas as escalas temporais (de
segundos a anos), sendo essa variabilidade incerta e difícil de prever [4].
A variabilidade na produção fotovoltaica está directamente associada à variabilidade na irradiância
incidente, por sua vez relacionada com diversos factores, como a posição da Terra relativamente ao
Sol ou a cobertura do céu num dado instante. Por um lado, a quantificação da irradiância que chega ao
topo da atmosfera está bem definida e é simples de efectuar. Por outro lado, a irradiância que chega
aos painéis está altamente dependente de fenómenos atmosféricos complexos de modelar [5]. Numa
primeira abordagem, o grau de cobertura do céu é o principal factor meteorológico que influencia a
variabilidade da produção solar, principalmente em horizontes temporais mais curtos, sendo que a
passagem de nuvens pode resultar em variações abruptas de irradiância, denominadas de rampas [6].
Como referido, a incerteza da variabilidade da produção é um dos factores mais críticos para a
integração da energia fotovoltaica nos sistemas de produção eléctrica, uma vez que levanta obstáculos
às entidades geradoras de electricidade. De um ponto de vista operacional, o equilíbrio entre o consumo
e o fornecimento de electricidade requer que se consiga quantificar a produção de cada uma das fontes
utilizadas, tomando em consideração que a produção de centrais que geram electricidade a partir de
combustíveis fósseis é directa. Nesse sentido, a previsão da produção renovável é importante para a
gestão da rede eléctrica e para o agendamento da utilização das centrais convencionais.
Considerando também que o aumento da penetração solar está associado à redução do seu custo, é
importante ter em conta que uma das formas de reduzir o custo da energia fotovoltaica é o
desenvolvimento de modelos fiáveis de previsão da sua produção, uma vez que deste modo se podem
reduzir os custos relacionados com os sistemas de produção de auxiliares (reserva girante), mantidos
para assegurar a continuidade de produção eléctrica [6].
Para além da sua importância para as entidades produtoras e distribuidoras de electricidade, a previsão
da produção fotovoltaica toma relevo para casos em que a produção de energia é descentralizada,
2
nomeadamente em localizações remotas onde não existe ligação à rede. É comum que, principalmente
em países em desenvolvimento, a ligação de uma região à rede eléctrica nacional seja demasiado
dispendiosa, pelo que o acesso à electricidade pode ser fornecido através de mini-redes, ou seja, redes
locais de produção e distribuição de electricidade. Geradores a diesel são frequentemente utilizados
para a produção de energia, o que implica elevados custos de operação e manutenção, bem como
pode criar problemas na segurança do abastecimento, caso a localização seja de difícil acesso.
Assim, os sistemas de produção renováveis têm especial interesse, como sistemas que utilizem painéis
fotovoltaicos, que não necessitam de combustível. A utilização de um sistema com diferentes fontes de
produção é denominado de sistema híbrido, como sistemas fotovoltaicos e eólicos, por exemplo,
sistemas esses que podem ser complementados com a utilização de baterias para o armazenamento
da energia em excesso [7].
À semelhança dos sistemas de produção centralizada, também a qualidade no fornecimento de energia
de sistemas descentralizados deve ser garantida através de uma gestão de rede eficiente, que por sua
vez precisa de quantificar a energia produzida das diversas fontes de geração. Porém, tendo em conta
que o acesso a fontes de electricidade fiáveis é um factor de extrema importância para o
desenvolvimento de uma região/população, modelos de previsão da produção eléctrica têm particular
importância [8], [9].
1.2 Objectivo
O objectivo da presente dissertação consiste no desenvolvimento de um método para a estimação da
produção eléctrica futura, para um horizonte temporal até 3 dias, de um conjunto de 6 painéis
fotovoltaicos, que fazem parte de um sistema de micro-geração situado no campus do Instituto Superior
Técnico no Taguspark. Para tal, pretendem-se utilizar previsões meteorológicas já existentes para o
local em questão, que serão pós-processadas através de uma rede neuronal artificial a desenvolver,
por forma a reduzir o grau de incerteza associado às previsões. Finalmente, com recurso às previsões
efectuadas e às características técnicas dos painéis fotovoltaicos, ambiciona-se implementar um
algoritmo que consiga estimar a produção eléctrica do sistema existente, que será validado através de
dados experimentais provenientes da instalação no Taguspark.
1.3 Estrutura da dissertação
A presente dissertação encontra-se estruturada em cinco capítulos.
No Capítulo 1 é feita uma abordagem geral à envolvente do tema tratado nesta dissertação, incluindo
o seu enquadramento e os seus objectivos.
No Capítulo 2 é revista a literatura relacionada com o tema da presente dissertação, incidindo
especialmente nos métodos de previsão da irradiância solar. São descritos sucintamente os vários
métodos e fazem-se comparações entre eles. São apresentadas também métricas para avaliar o
desempenho dos métodos de previsão.
No Capítulo 3 o sistema instalado no Taguspark é sumariamente descrito, apresentando-se os dados
relevantes do sistema de produção e armazenamento de energia, bem como dos equipamentos de
3
medição e registo de dados. É seleccionado o método de previsão a desenvolver, definindo-se a
metodologia a aplicar, incluindo os dados utilizados e os algoritmos desenvolvidos para a estimação da
produção eléctrica do sistema de micro-geração.
No Capítulo 4 apresentam-se e analisam-se os resultados obtidos com os algoritmos desenvolvidos,
validando-se experimentalmente o modelo final com o sistema de micro-geração presente no campus
do Instituto Superior Técnico no Taguspark.
No Capítulo 5 são apresentadas as principais conclusões relativas ao trabalho realizado e aos
resultados obtidos, abordando-se também possíveis futuros desenvolvimentos e trabalhos associados.
4
2 ESTADO DA ARTE
2.1 Métodos de previsão
Nesta secção são descritos e comparados os actuais métodos de previsão da irradiância solar. Estes
métodos podem ser divididos pelo seu tipo em métodos de imagens, que prevêem a irradiância com
base nas futuras posições das nuvens, métodos físicos, que utilizam equações cujo objectivo é
descrever a propagação da radiação pela atmosfera, e métodos numéricos não-físicos, que tentam
prever valores futuros da irradiância com recurso a históricos de dados.
Alguns factores relevantes na selecção de um método de previsão são, entre outros:
A resolução espacial, que, quando aplicável, define a esparsidade da malha utilizada para
o cálculo dos valores previstos;
A resolução temporal, dada pelo período entre previsões;
A extensão espacial, correspondente à área para a qual são fornecidas as previsões;
O horizonte temporal, um dos factores com maior importância, que define até quanto tempo
adiante um determinado método é apropriado.
Outros factores, como o custo, a incerteza da previsão, a carga computacional do modelo e a facilidade
de utilização e/ou implementação podem também influenciar a escolha do método a utilizar.
2.1.1 Persistência
O método mais simples de previsão da irradiância solar, 𝐺, é uma abordagem estatística que consiste
em assumir que, dentro do horizonte da previsão, o último valor conhecido da irradiância persiste
(matematicamente, 𝐺𝑡+1 = 𝐺𝑡). É um método cuja precisão diminui significativamente com o aumento
do horizonte da previsão, sendo especialmente robusto para dias de céu totalmente limpo ou totalmente
coberto, em que a variabilidade solar é mais reduzida. O seu horizonte de previsão é apenas de alguns
minutos [4], [10].
O modelo de persistência é frequentemente utilizado como métrica de referência para a avaliação de
outros modelos de previsão, sendo o erro associado a este modelo o valor a superar, uma vez que é
desnecessário implementar um modelo complexo se os seus resultados são equiparados aos de um
modelo trivial [11], [12].
2.1.2 Sky imagery
Uma abordagem possível para prever a irradiância consiste em observações a partir do solo com
recurso a Sky Imagers (SIs, Figura 2.1 (a)), dispositivos que, através da aquisição e análise de imagens
do céu no local da previsão, identificam as nuvens existente em cada imagem, estimando assim o
movimento das mesmas. Com recurso aos valores previstos de irradiância para céu limpo e à estimativa
da cobertura do céu futura, é assim prevista a irradiância [13]. A identificação de nuvens pode passar
5
pelo cálculo do rácio entre as magnitudes do vermelho e do azul (RBR1) de cada pixel [14] (Figura 2.1
(b) e (c)), ou, alternativamente, pela diferença entre a magnitude dessas mesmas cores (RBD2) [15],
sabendo-se se cada pixel corresponde a parte de uma nuvem ou a céu limpo após comparar o valor
obtido com valores existentes numa base de dados (Clear Sky Library).
(a) Exemplo de um SI (b) Imagem obtida por um SI (c) Imagem do céu com RBR
Figura 2.1 – SI [14]
Este tipo de abordagem tem como principais vantagens a sua elevada resolução temporal e espacial,
o que permite obter informação detalhada sobre as nuvens existentes no momento da previsão, sendo
especialmente útil na previsão de rampas da irradiação [16]. A resolução temporal é quase
exclusivamente limitada pela capacidade de armazenamento e processamento de dados, podendo
chegar a ser de 30 segundos – ou seja, é adquirida uma imagem a cada 30 segundos [14], sendo que
a resolução espacial pode atingir os 10 m.
Por outro lado, a extensão espacial das imagens obtidas está limitada ao campo de visão do SI que,
no geral, dificilmente ultrapassa os 8 km de raio, não sendo contabilizadas as nuvens fora do mesmo.
Apesar do campo de visão poder ser aumentado com recurso a vários SIs, a aquisição de múltiplos
dispositivos pode ser dispendiosa, limitando a sua utilização para áreas maiores [17].
Deste modo, considera-se a previsão da irradiância através de SIs uma boa alternativa para previsões
intra-horárias, uma vez que dificilmente são tidos em conta factores como o desenvolvimento e
dissipação das nuvens, cuja influência na previsão aumenta para horizontes temporais mais longos.
Outro dos erros associados a este tipo de previsão são múltiplas camadas de nuvens com diferentes
características ou velocidades, visto que as nuvens a maior altitude podem ser obstruídas pelas nuvens
mais próximas do solo [4], [18].
Considera-se que este método tem um horizonte temporal geralmente compreendido entre os 5 e os
30 minutos, sendo que estes valores variam significativamente com a velocidade e altitude das
nuvens [4].
1 Red Blue Ratio 2 Red Blue Difference
6
2.1.3 Imagens de satélite
Analogamente aos SIs, é possível fazer a detecção e previsão da posição das nuvens utilizando-se
sucessivas imagens obtidas via satélite, calculando-se os vectores de velocidade das nuvens através
da variação da posição das mesmas em cada imagem [6].
As nuvens são detectadas através da reflexão da radiação visível e/ou infravermelha que é medida por
sensores existentes em cada satélite. Calcula-se então o índice de nebulosidade (Cloud Index), que
varia entre 0 e 1 e é definido como sendo a razão de cobertura das nuvens numa dada área, para cada
pixel e para o horizonte temporal em questão, assumindo-se que este é proporcional à espessura óptica
das nuvens [19]. O índice de nebulosidade e o coeficiente de transmissividade da atmosfera estão
linearmente relacionados, excepto para latitudes elevadas [20]. Este tipo de abordagem está já bastante
maturada e é extensamente utilizada para o mapeamento do recurso solar [4], [21], [22].
A prática mais comum de previsão da irradiância com imagens de satélite utiliza apenas o espectro de
radiação visível. Tendo em conta que a incerteza associada às previsões aumenta significativamente
com a presença de neve (ou com solo mais reflector que o habitual), um modelo que faça uso da
integração de sensores infravermelhos torna-se especialmente útil. Outra vantagem associada a este
modelo é o aumento da precisão das previsões matinais, quando ainda não existe histórico de imagens
obtidas com radiação visível [23], [10], [24].
Face aos SIs, as principais diferenças das previsões por imagens de satélites são as resoluções
temporais e espaciais, bem como a extensão espacial. Por um lado, devido à existência de satélites
geoestacionários, que monitorizam o estado da atmosfera terrestre de modo contínuo, é criado um
mapa global da irradiância terrestre, cuja extensão espacial está compreendida entre as latitudes 65ºS
e 65ºN. Tal extensão espacial permite identificar nuvens mais distantes do ponto da previsão,
aumentando assim a precisão da previsão [22], [4]. Por outro lado, a aquisição de imagens acontece,
no mínimo, a cada 15 minutos e a resolução espacial pode variar entre 1 km e 10 km, o que apenas
possibilita a localização exacta de grandes nuvens, uma vez que, para as restantes, é impossível saber
a sua localização exacta dentro de um pixel [25].
A diminuição das resoluções espacial e temporal, relativamente aos SIs, faz com que este método seja
menos preciso para horizontes temporais muito curtos, sendo que a identificação de nuvens fora do
campo de visão de um SI torna as imagens de satélite uma abordagem mais precisa para horizontes
temporais superiores (>30 min), especialmente para conjuntos de nuvens estáticos ou bastante
desenvolvidos [26], [16].
O horizonte temporal deste método estende-se a até algumas horas (3 a 5 horas), uma vez que este
está limitado à hipótese de invariância da forma e propriedades das nuvens, hipótese essa que perde
a validade com o aumento do horizonte temporal [6], [4].
7
2.1.4 Métodos físicos de previsão numérica (NWP3)
Ao invés de métodos baseados em observações, podem ser utilizados métodos numéricos de previsão
(NWP3). Tais abordagens são consideradas físicas, quando baseadas em equações que tentam simular
a propagação da radiação pela atmosfera, descrevendo todos os processos físicos (pressão, vento,
temperatura, condensação e evaporação da água, radiação solar, etc.) através de modelos físicos, o
que inclui os fenómenos termodinâmicos responsáveis pela formação e dissipação de nuvens [10].
Estes modelos são inicializados por uma combinação de dados obtidos de observações e por modelos
numéricos de maior escala. Assim, as equações do movimento e da energia são resolvidas numa malha
tridimensional, calculando-se a temperatura, pressão, velocidade e constituintes da atmosfera, sendo
que outras variáveis como a irradiância e fluxos de calor são calculados por modelos secundários [16].
Os NWP podem ser globais, caso abranjam todo o planeta, ou de mesoescala, se forem usados em
áreas geográficas limitadas.
Os modelos globais são computacionalmente intensivos, existindo apenas 14 a serem corridos
actualmente [27]. Exemplos de modelos globais são o GFS4, o ECMWF5 e o GME6, entre outros, já
tendo sido realizados alguns estudos comparativos entre eles [28], [29]. Este tipo de modelo é, no geral,
corrido entre duas a quatro vezes por dia, com uma distância entre pontos da malha no plano de 40 a
90 km, como exemplificado na Figura 2.2, sendo que a atmosfera é dividida verticalmente em 30 a 50
camadas [27]. A resolução temporal deste tipo de modelos é superior a uma hora, podendo chegar a 6
horas. Diferentes técnicas de interpolação espacial e temporal podem ser utilizadas para se obterem
previsões em locais e horas específicas [30], [16], [31].
Figura 2.2 – Formação da malha do modelo GME
Modelos de mesoescala são modelos NWP que apenas abrangem uma dada área geográfica, de modo
a que se possa obter resultados com maior resolução sem se aumentar a carga computacional. Este
tipo de modelos possibilita a utilização de parametrizações mais adequadas a cada local para diversos
processos, como turbulência ou modelação da qualidade do ar, de modo a melhorar os resultados [32],
[10], [33]. Existem inúmeros modelos de mesoescala, como o MM57, o WRF8 (sucessor do MM5) ou o
3 Numerical Weather Prediction 4 Global Forecast System
5 European Centre for Medium-Range Weather Forecasts
6 Global Modell Ersatz
7 Fifth-Generation Penn State/NCAR Mesoscale Model
8 Weather Research Forecast
8
COSMO-CLM9 [27], [16], [34]. Estes modelos são inicializados com dados obtidos por modelos globais,
que providenciam assim as condições iniciais e de fronteira. A sua extensão espacial vai influenciar a
sua resolução ou a sua carga computacional, sendo que pode cobrir áreas bastante significativas (por
exemplo, 1500 km x 1500 km). A resolução espacial horizontal é, no geral, acima de 1 km,
significativamente mais elevada do que a resolução espacial de modelos globais. À semelhança dos
modelos globais, também interpolações espácio-temporais podem aumentar a resolução dos modelos
de mesoescala. Este tipo de modelos corre, no geral, de uma em uma hora [4], [16].
Devido à baixa resolução espacial dos NWP, algo que é especialmente acentuado em modelos globais,
não é possível calcular a grande maioria das nuvens, ou seja, localizá-las exactamente. No entanto,
mesmo que a malha fosse mais fina, a resolução temporal não é suficiente para conseguir descrever a
variabilidade da cobertura do céu por nuvens, importante para a previsão de rampas de irradiância [12],
[16].
Modelos NWP são a melhor abordagem para horizontes de previsão superiores a 6h, sendo
especialmente úteis quando usados em conjunto com dados de observações ou técnicas de
pós-processamento [26], [10].
2.1.5 Outros modelos numéricos
Uma alternativa numérica aos modelos NWP são os modelos numéricos não-físicos. Estes podem ser
divididos em três grupos [7]:
1. Métodos de auto-regressão (AR), que utilizam combinações lineares de observações
recentes para prever valores futuros de séries temporais, i.e. um conjunto de observações
ordenadas cronologicamente, podendo ser aplicados à irradiância. Podem ser
implementados com uma componente de média móvel (MA10), como ARMA, que utiliza a
metodologia de Box-Jenkins [35]. Um dos requisitos principais desta abordagem é a
estacionariedade da série temporal, o que não acontece para a irradiância, requerendo
assim a remoção de sazonalidades e outras tendências [12]. Testes de estacionariedade,
como o teste de Dickey-Fuller aumentado (ADF11), permitem verificar quão bem resultou o
método utilizado para remover as tendências [36].
Por outro lado, o método ARIMA12, outro modelo de Box-Jenkins, tem um grau de liberdade
extra que permite efectuar diferenciação na série temporal, de modo a lidar com séries não-
estacionárias [35], [37].
Este género de abordagens está já maturada para a previsão do recurso eólico, sendo que
também já foi alvo de diversos estudos para previsões solares [38], [39], [37], [40].
2. Métodos de aprendizagem ou inteligência artificial, que são técnicas mais complexas,
podendo ser utilizadas em problemas não lineares. Podem estimar a irradiância solar com
9 Consortium for Small-scale Modeling - Climate Limited-Area Modeling 10 Moving Average 11 Augmented Dickey-Fuller 12 Auto-Regressive Integrated Moving Average
9
base em parâmetros físicos/meteorológicos (𝐺𝑡 = 𝑓(𝑇, 𝜙, 𝜃, … )), com base em valores
passados de irradiância incidente no local (𝐺𝑡 = 𝑓(𝐺𝑡−1, 𝐺𝑡−2, … , 𝐺𝑡−𝑛)), ou utilizando ambos
(𝐺𝑡 = 𝑓(𝑇, 𝜙, 𝜃, … , 𝐺𝑡−1, 𝐺𝑡−2, … , 𝐺𝑡−𝑛)). Nesta categoria encontram-se métodos como, por
exemplo, redes neuronais artificiais (ANN13), cadeias de Markov e matrizes de transição de
Markov (MC14 e MTM15, respectivamente) e técnicas de lógica difusa (FL16). Existem ainda
métodos que apenas recentemente foram estudados neste campo, como máquinas de
vectores de suporte (SVL17) [41]. Dentro desta categoria, as ANNs destacam-se
incontestavelmente, tendo sido alvo do maior número de testes e aplicações relativamente
às previsões meteorológicas [7], [33].
ANNs são múltiplas unidades de processamento interligadas, com o objectivo de
reconhecer padrões em séries temporais de dados, tendo sido já utilizadas para previsões
solares [12]. O nome rede neuronal artificial deriva do facto de a sua arquitectura ser
inspirada no pensamento humano, feito através de redes neuronais biológicas. Existem
diferentes tipos de arquitecturas possíveis, sendo que a arquitectura de rede mais popular
é a feedforward, como é exemplo a rede Perceptrão Multicamada (MLP18), esquematizada
na Figura 2.3. Independentemente do tipo de arquitectura da rede neuronal, pode-se
generalizar que o processo é descrito pela entrada de informação numa camada de
entrada, da qual segue para uma ou mais camadas sucessivas de processamento
(denominadas camadas escondidas), de onde saem valores associados a um ou mais
outputs, na última camada. Estas redes precisam de ser treinadas, ou seja, é necessário
uma fase onde se ajustam os factores de ponderação e as constantes, comparando-se o
resultado obtido com o valor que se tenta prever, proveniente de medições [7], [42].
Figura 2.3 – Esquema de uma ANN feedforward (Adaptado de [43])
É possível combinar dois ou mais destes métodos, como ANN/MTM, onde o primeiro
interpreta os dados de input e gera previsões mensais e o segundo, a partir das previsões
13 Artificial Neural Network 14 Markov Chains 15 Markov Transition Matrix 16 Fuzzy Logic 17 Support Vector Machine 18 Multilayer Perceptron
10
mensais, fornece as previsões diárias [44], ou mesmo utilizar ANNs com vários estágios,
onde outputs de uma rede neuronal são inputs de uma seguinte [45]. Uma combinação
bastante promissora consiste em utilizar um algoritmo genético (GA19) para seleccionar
quais as variáveis de input que devem ser utilizados na ANN e a qual deve ser estrutura
da mesma [5], [46].
3. Métodos híbridos, que resultam de combinações entre métodos lineares e métodos de
aprendizagem. Por exemplo, Voyant et al. [47] consideraram que a irradiância tem um
comportamento linear para dias com pouca nebulosidade e não linear para dias com muita,
utilizando um método híbrido ARMA/ANN, onde se usa ARMA para o primeiro caso e ANN
para o segundo. Noutro estudo, Ji e Chee [36] utilizaram uma rede neuronal com atraso
temporal (TDNN20), dividindo a irradiação numa componente linear, calculada recorrendo
a ARMA, usando a TDNN para o resíduo não-linear.
Comparando métodos lineares com métodos não-lineares, pode-se dizer os primeiros são mais simples
de implementar, dão resultados rapidamente sem necessitar de recursos computacionais significativos
e não necessitam de uma fase de aprendizagem. São também mais estáveis [12]. Por outro lado, uma
limitação típica destes modelos é a previsão de valores extremos, uma vez que este tipo de métodos
está projectado para lidar com valores distribuídos de forma regular, o que muitas vezes não é o caso
da radiação solar. Hassan [48] constatou isso mesmo com ARIMA, ou seja, uma boa concordância
entre os valores medidos e os previstos, excepto quando os valores eram ou muito elevados ou muito
baixos.
Considera-se então que, no geral, os métodos de aprendizagem são mais adequados para a previsão
da irradiância, principalmente úteis para situações pouco lineares, como dias mais nublados, sendo
que os métodos lineares podem ser utilizados em dias com menos nuvens [36], [47], [49].
Relativamente aos métodos híbridos, é necessário ter em consideração que um esquema híbrido
bem-sucedido é aquele que melhora a previsão comparativamente aos métodos que o compõem
separadamente, uma vez que aproveita os pontos fortes de cada um deles. Este é o caso dos métodos
mencionados anteriormente, entre outros, considerando-se portanto que esquemas híbridos superam
os métodos convencionais de regressão (ARMA, ARIMA, etc.) e de aprendizagem (ANN, FL, etc.),
conseguindo modelar o comportamento estocástico dos processos físicos que determinam a irradiância
solar ao nível do solo [50], [17].
Os métodos numéricos não-físicos são mais aplicáveis a horizontes temporais a partir de uns minutos
e até de algumas horas a um dia, dependendo do método. De qualquer forma, são mais competitivos
para horizontes até 3 horas, uma vez que a partir daí a previsão não é tão dominada por dados
históricos [26]. A sua resolução espacial está dependente da resolução espacial dos dados de entrada
e a resolução temporal pode ser de apenas alguns segundos, uma vez que estes métodos podem estar
arquitectados de modo a serem pouco intensivos computacionalmente [37].
19 Genetic Algorithm 20 Time Delay Neural Network
11
2.1.6 Métodos híbridos
Entre os dois extremos de métodos de previsão, os modelos puramente físicos e os modelos baseados
em históricos de dados, há espaço para metodologias híbridas, com o objectivo de aproveitar os pontos
fortes e minimizar as limitações de cada um. É necessário distinguir um método híbrido, e.g. NWP +
ANN, onde os métodos trabalham em conjunto, de utilizar diferentes técnicas para diferentes horizontes
de previsão, e.g. imagens de satélite até 5h e NWP de 5h a 3 dias.
Um método híbrido habitualmente usado une os dados de observações via satélite com a previsão
numérica de NWP [10], [51]. Estes recorrem a sensores integrados nos satélites para medir a radiação
visível e/ou infravermelha que é reflectida, calculando a partir daí a transmissividade da atmosfera e
posteriormente o índice de nebulosidade. Esse cálculo é efectuado através de modelos numéricos de
transferência radiativa, que contabilizam as interacções da radiação solar com a atmosfera e os seus
componentes (principalmente nuvens, aerossóis, vapor de água e ozono). A parametrização dos efeitos
de extinção atmosféricos é efectuada com recurso às propriedades da superfície terreste, ao estado da
atmosfera e à transmissividade das nuvens [25], [38]. Em suma, dados obtidos por satélite são
frequentemente utilizados como inputs para métodos numéricos.
Também os métodos de imagens podem ser usados em conjunto com ANNs, podendo-se utilizar os
índices de nebulosidade obtidos como um dos inputs para uma ANN [52], [53].
2.1.6.1 Processamento de dados
De forma a aumentar a precisão e/ou a resolução das previsões de um dado modelo, podem ser usados
métodos de processamento de dados, tanto antes da previsão (pré-processamento), como já depois
da previsão (pós-processamento).
O método mais simples de pós-processamento são as interpolações espácio-temporais e suavizações
das previsões. As previsões dos NWP são dadas para pontos numa malha, logo é necessário utilizar
interpolações para obter valores em pontos específicos. Uma maneira eficaz é utilizar os pontos na
vizinhança da localização de interesse. Lorenz et al. [54] obtiveram melhores resultados para as
previsões dos modelos globais ECMWF e GFS com médias em áreas de 100x100 km, enquanto que
Pelland et al. [29] chegaram aos melhores resultados com áreas de 300x300 km com o modelo GEM21.
Interpolações temporais podem ser usadas com modelos cuja resolução temporal não é suficiente,
como é o caso da maioria dos NWP.
Também a ocorrência de erros sistemáticos nas previsões motiva a utilização de técnicas de
processamento, de modo a aumentar a precisão dos valores obtidos. Por exemplo, Shimose et al. [55]
identificaram uma sobrestimação da irradiância global prevista no Inverno e uma subestimação da
mesma no Verão, utilizando o modelo numérico MSM22. Problemas de sobrestimação também são
frequentes no WRF [51].
21 Global Environmental Multiscale
22 Meso-Scale Model
12
Modelos que corrijam erros sistemáticos têm o nome generalizado MOS23, utilizando para tal medições
no local e tendo por base regressões multilineares ou não-lineares. Este tipo de modelos permite obter
previsões mais precisas para locais onde haja um histórico de dados [56], [57]. Já foram realizados
vários estudos onde o pós-processamento é feito com recurso a ANNs, uma vez que são algoritmos
treinados para reconhecer padrões, conseguindo assim identificar e corrigir parte dos erros
sistemáticos [56], [58].
Outra abordagem para corrigir este tipo de erros é utilizar um filtro de Kalman [59]. Este tipo de filtro é
utilizado para extrair um sinal de um conjunto de dados com ruído, tendo já sido utilizado para a previsão
da irradiância, no processamento de outputs de modelos numéricos [29], [60].
Uma outra possibilidade é utilizar a transformada de wavelet (WT24), que pode ser utilizada para isolar
os picos e outros tipos de não-estacionariedades de um sinal. Mandal et al. [61] utilizaram a WT para
decompor os dados da potência de um sistema fotovoltaico, para que estes, juntamente com outros
parâmetros, servissem de input para uma ANN, após a qual o sinal voltava a ser reconstruído, obtendo-
se assim a previsão da potência. Também Cao e Cao [62] utilizaram a WT para pré-processar dados,
dividindo a série de irradiância em domínios de tempo e frequência, entrando cada um desses domínios
numa ANN, sendo a previsão igual ao somatório do output de todas elas.
2.1.7 Resumo dos métodos de previsão da irradiância
Pretende-se que os métodos de previsão da irradiância sejam o mais precisos possível, sendo que o
erro está associado ao horizonte temporal da previsão. Em geral, pode-se dizer que para horizontes
até 6 horas após, métodos com base em observações, de satélites, de sky imagers ou de estações
meteorológicas, tendem a dar resultados mais precisos. Por outro lado, obtêm-se melhores resultados
para horizontes temporais superiores a 6 horas e até alguns dias com recurso a abordagens físicas
através de modelos numéricos de previsão [31]. Modelos híbridos, compostos por diferentes métodos,
são aqueles que geralmente fornecem as melhores previsões. A Tabela 2.1 resume as características
dos diferentes métodos (excluindo híbridos).
23 Model Output Statistics 24 Wavelet Transform
13
Tabela 2.1 - Resumo das principais características dos métodos de previsão para a irradiância
Método
Resolução
temporal
máxima
Resolução
espacial Extensão espacial
Horizonte
temporal máximo
Persistência < 1 segundo Pontual Pontual Minutos
Sky Imagers 30 segundos 10 – 100 m Raio de 3 - 8 km 30 minutos
Imagens de satélite 15 minutos 1 – 10 km 65º S – 65º N 5 horas
NWP 1 hora 2 – 50 km Global 10 dias
Numéricos não-físicos < 1 segundo Pontual Pontual 3 horas
Schroedter-Homscheidt et al. [63] sugerem a utilização das seguintes metodologias, de acordo com os
vários horizontes temporais:
Medições do solo, como as obtidas por SIs, para previsões intra-horárias;
Previsão da irradiância e de nuvens com base em imagens de satélites, entre 1h a 5h
Conjuntos de NWPs com pós-processamento a partir de 6h adiante e para o dia seguinte
Utilização de satélites com canais infravermelhos para previsões matinais
2.2 Avaliação do desempenho do método de previsão
Para avaliar o desempenho dos modelos de previsão, é necessário decidir que parâmetros se vão
utilizar. Tendo em conta que a variabilidade da irradiação tem uma componente determinística,
correspondente ao percurso do sol ao longo de um determinado dia, e uma componente estocástica,
relacionada maioritariamente com a cobertura do céu por nuvens, pode ser útil normalizar a variável
em estudo, retirando as tendências da componente determinística. Essa normalização pode ser feita
através do índice de céu limpo, que compara o valor da variável em estudo (neste caso, a irradiância),
com o valor que teria em condições de céu limpo [10]:
𝑘𝐼 =𝐼(𝑡)
𝐼𝑐𝑠(𝑡) (2.1)
Outros factores a ter em conta para a avaliação de modelos que prevêem a irradiância, bem como as
métricas a utilizar, estão sucintamente descritos em Beyer et al. [11].
Um desses factores é a validade dos pares de valores que se comparam (medição e previsão). Para
um par de dados ser válido é necessário que a elevação solar seja superior a zero (excluindo assim o
período nocturno), que o valor previsto seja superior a zero e que o valor medido seja superior a zero
e razoável. Hoyer-Klick et al. [64] sugerem métodos de controlo de qualidade dos valores medidos, de
modo que a avaliação da previsão reflicta a precisão da mesma e não a precisão das observações.
14
É também necessário que os dados utilizados para desenvolver e melhorar um determinado modelo,
os dados de treino, não façam parte do conjunto de dados para avaliar a performance do mesmo, os
dados de teste. Incluir dados de treino no conjunto de teste iria levar a uma sobrestimação da precisão
do modelo.
Para avaliar quantitativamente a precisão de um método de previsão podem ser usadas medidas
estatísticas. À semelhança da Madsen et al. [65] para a previsão da potência eólica, também
Beyer et al. [11] sugerem a utilização de métricas estandardizadas, como o RMSE25, o MBE26, o MAE27
e o SDE28. Utilizou-se a terminologia inglesa dos termos, que correspondem à raiz quadrada do erro
quadrático médio, ao erro médio, ao erro médio absoluto e ao desvio padrão corrigido do erro,
respectivamente. O erro de uma única previsão é dado por:
𝜖𝑖 = 𝑥𝑝𝑟𝑒𝑣𝑖𝑠ã𝑜,𝑖 − 𝑥𝑚𝑒𝑑𝑖çã𝑜,𝑖 (2.2)
Podem-se então definir as métricas mencionadas anteriormente como:
𝑅𝑀𝑆𝐸 =1
√𝑁√∑ 휀𝑖
2
𝑁
𝑖=1
(2.3)
𝑀𝐵𝐸 =1
𝑁∑ 휀𝑖
𝑁
𝑖=1
(2.4)
𝑀𝐴𝐸 =1
𝑁∑|휀𝑖|
𝑁
𝑖=1
(2.5)
𝑆𝐷𝐸 = √1
𝑁 − 1∑(휀𝑖 − 휀�̅�)2
𝑁
𝑖=1
(2.6)
onde 𝑥𝑝𝑟𝑒𝑣𝑖𝑠ã𝑜,𝑖 e 𝑥𝑚𝑒𝑑𝑖çã𝑜,𝑖 são os i-ésimos termos do parâmetro previsto e medido, respectivamente, de
um conjunto de 𝑁 pares. Estatisticamente, o MBE e o MAE estão associados ao momento de primeira
ordem do erro de previsão, ou seja, directamente relacionados com a variável em estudo, enquanto
que o RMSE e o SDE estão associados ao momento de segunda ordem, e portanto ligados à variância
do erro. O RMSE, o MBE e o SDE estão relacionados através de:
𝑅𝑀𝑆𝐸 = √𝑀𝐵𝐸2 + 𝑆𝐷𝐸2 (2.7)
25 Root Mean Square Error 26 Mean Bias Error 27 Mean Absolute Error 28 Standard Deviation of the Error
15
Ou seja, o MBE corresponde à parte do RMSE que é sistemática, enquanto o SDE indica o valor do
RMSE que pode ser alcançado com a eliminação dos erros sistemáticos (através do
pós-processamento das previsões, por exemplo).
A escolha da métrica a utilizar depende também do objectivo a atingir. O RMSE é mais sensível a erros
elevados, sendo relevante em situações em que pequenos erros são tolerados e em que grandes erros
causam custos desproporcionais, como para fornecedores de energia. O MAE, por outro lado, é mais
apropriado para aplicações onde o custo é directamente proporcional ao erro.
De modo a se poder avaliar melhor as consequências económicas dos erros, estes podem ser
normalizados, dividindo-se por uma quantidade de referência, como a quantidade medida (como é o
caso da irradiância) ou a capacidade do sistema (caso se esteja a calcular o erro da potência). Como
exemplo, a normalização do RMSE (nRMSE29) poderia ser:
𝑛𝑅𝑀𝑆𝐸 =𝑅𝑀𝑆𝐸
1𝑁
∑ 𝑥𝑚𝑒𝑑𝑁𝑖=1
(2.8)
Estas métricas permitem também criar intervalos de confiança para as previsões. Lorenz et al. [54]
assumiram, por simplicidade, uma distribuição normal dos erros de previsão, criando intervalos de
confiança em função de múltiplos do desvio padrão.
É importante referir que os erros associados às previsões não são independentes do local nem das
condições climáticas. Utilizando modelos semelhantes, foram obtidos nRMSE entre os 40% e os 60%
para a Europa central (estações na Alemanha, Suíça e Áustria) e entre os 20% e os 35% para
Espanha [31]. Nesse sentido, a comparação com modelos de referência pode também ser usada para
avaliar a performance de um determinado método de previsão, também porque apenas é útil
implementar um modelo complexo quando os seus resultados superam os de um modelo trivial.
O modelo de referência mais utilizado é a persistência. Uma abordagem simples é assumir que a
irradiância do dia anterior a uma dada hora persiste para o dia seguinte a essa mesma hora.
Alternativamente, pode-se assumir persistência do índice de céu limpo.
A qualidade de uma previsão comparativamente à dada por um modelo de referência é obtida através
do seu skill score, dado por:
𝑠𝑘𝑖𝑙𝑙 𝑠𝑐𝑜𝑟𝑒 =𝑠𝑐𝑜𝑟𝑒𝑝𝑟𝑒𝑣𝑖𝑠ã𝑜 − 𝑠𝑐𝑜𝑟𝑒𝑟𝑒𝑓𝑒𝑟ê𝑛𝑐𝑖𝑎
𝑠𝑐𝑜𝑟𝑒𝑝𝑟𝑒𝑣𝑖𝑠ã𝑜 𝑝𝑒𝑟𝑓𝑒𝑖𝑡𝑎 − 𝑠𝑐𝑜𝑟𝑒𝑟𝑒𝑓𝑒𝑟ê𝑛𝑐𝑖𝑎 (2.9)
O skill score toma o valor de um para uma previsão perfeita e de zero para a previsão do modelo de
referência. O valor a utilizar para cada score pode, por exemplo, ser o RMSE ou outro tipo de erro.
Em suma, várias métricas podem ser utilizadas, separadamente ou em conjunto, para se avaliar a
precisão de um determinado método de previsão. A escolha da métrica depende fundamentalmente do
objectivo da previsão, sendo que uma análise detalhada dos erros pode permitir o desenvolvimento de
29 Normalized Root Mean Square Error
16
métodos mais precisos. Devido à dependência da precisão do local, do momento da previsão e das
condições meteorológicas, comparações entre casos distintos não permitem tirar muitas conclusões.
17
3 METODOLOGIA
3.1 Descrição do sistema
A presente dissertação tem em vista a aplicação do algoritmo de previsão desenvolvido no sistema de
6 painéis fotovoltaicos existentes no campus do Instituto Superior Técnico no Taguspark. Esses painéis
fazem parte de um projecto denominado PEC30, desenvolvido por Paleta et al. [66], que consistiu no
estudo de uma instalação experimental piloto para a produção descentralizada de energia eléctrica,
através de um sistema de produção renovável híbrido. Essa instalação, ligada directamente a um
laboratório que consome a energia produzida, tem como infra-estrutura base um contentor, onde estão
montados no seu exterior 6 painéis fotovoltaicos e uma turbina eólica de pequena escala, juntamente
com equipamentos de medição, como se vê na Figura 3.1.
Figura 3.1 – PEC no Taguspark [66]
No interior do contentor está o sistema de armazenamento de energia, composto por 3 conjuntos de
baterias, assim como os equipamentos necessários ao funcionamento do sistema, como o inversor,
controladores de carga, ligações eléctricas e outros componentes. A Tabela 3.1 contém as
especificações dos equipamentos principais, sendo apresentado na Figura 3.2 o esquema que
representa a forma como estes se encontram ligados. Apesar de no interior do contentor também existir
um gerador de backup a diesel, este não foi considerado, uma vez que não está ligado ao sistema, não
estando a ser utilizado.
30 Polygeneration Energy Container
18
Tabela 3.1 - Características técnicas dos equipamentos principais existentes no PEC (Adaptado de [66])
Tipo de equipamento Modelo Potência/capacidade total
Turbina eólica Southwest Windpower Air 40 400 W
Painéis fotovoltaicos
2 x LDK 230-20
1400 W
4 x LDK 235-20
Baterias 3 x Autosil EC3 240 Ah/5h 720 Ah/5h
Inversor SMA Sunny Island SI 2224 230 V; 2200 W
Controladores de carga Stecca PR2020 24 V; 20 A
Figura 3.2 – Esquema das ligações do PEC (Adaptado de [66])
No topo do contentor estão colocados aparelhos de medição, incluindo um sensor Sunny
SensorBox [67], que mede a irradiância global no plano dos painéis fotovoltaicos, e um anemómetro,
que regista a velocidade horizontal do vento. O valor da irradiância medida tem especial relevância,
sendo que este é armazenado em intervalos de 15 minutos. No entanto, verificou-se que o sistema
nem sempre esteve operacional, existindo apenas registos para uma quantidade relativamente limitada
de dias completos.
Para além das medições existentes no exterior, o inversor utilizado monitoriza e guarda registo de
diversos parâmetros, como a temperatura das baterias e as tensões e intensidades de corrente de
entrada e saída, entre outros. Através do esquema na Figura 3.2 é possível perceber que, para além
de não existir uma medição directa da potência instantânea que o sistema de geração está a produzir,
uma vez que a electricidade produzida vai primeiro para o conjunto de baterias também não é possível
distinguir a parte da energia armazenada que provém dos painéis fotovoltaicos da que é produzida pela
turbina eólica.
19
3.2 Previsão da irradiância
Após a revisão da literatura existente sobre a previsão da irradiância, tomou-se a decisão de utilizar
uma abordagem híbrida. Tal abordagem é composta por uma previsão inicial dada pelo modelo de
mesoescala MM5 [68], inicializado com o modelo global GFS, utilizando-se posteriormente uma rede
neuronal artificial para pós-processar as previsões, com o objectivo de reduzir o erro associado às
mesmas e incluir alguns efeitos microclimáticos.
A decisão de utilizar NWP foi baseada na precisão deste tipo de método e pelo seu horizonte temporal
bastante elevado, e prende-se pelo facto de existir um grupo dedicado à disponibilização de previsões
meteorológicas de alta resolução, o Grupo de Previsão Numérica do Tempo (GPNT) [69], que foi
fundado em 1999 e faz parte do centro de investigação MARETEC do Instituto Superior Técnico. O
GPNT efectua previsões meteorológicas diárias para Portugal Continental, que são disponibilizadas
gratuitamente. Além disso, o GPNT fornece acesso a previsões para o local onde está instalado o PEC
(Latitude: 38.7364N; Longitude: 9.3026W).
A escolha de uma rede neuronal artificial para pós-processamento das previsões numéricas está
relacionada com sua vasta utilização nesta tarefa e à sua comprovada eficiência [56], [58].
3.2.1 Modelo de previsão numérica
O objectivo da presente dissertação passa pelo pós-processamento de previsões meteorológicas já
existentes, por forma a diminuir o grau de incerteza a elas associado. Essas previsões são fornecidas
pelo GNPT para o local da instalação em estudo.
O modelo numérico utilizado para fornecer as previsões meteorológicas é o MM5, tendo este sido
calibrado pelo GPNT para a sua utilização em Portugal Continental. Muito resumidamente, o MM5 é
um modelo de mesoescala não-hidrostático (considera acelerações verticais na atmosfera) constituído
por cinco programas de pré-processamento, por um programa de processamento e por um programa
de pós-processamento.
A previsão numérica do tempo é efectuada através da resolução das equações de Navier-Stokes em
três dimensões, da equação da conservação da energia e da equação de conservação da água. A
parametrização dos processos físicos, nuvens, precipitação, camada limite e radiação são também
definidas no MM5 [70]. Um esquema da interacção entre as parametrizações é apresentado na
Figura 3.3. É importante mencionar que as previsões são efectuadas em coordenadas sigma, ou seja,
a malha acompanha a topografia verticalmente, de modo a se evitarem intersecções entre a malha e o
solo. O espaçamento vertical da malha não é linear, sendo mais reduzido junto ao solo, uma vez que é
a zona onde o terreno tem mais influência.
20
Figura 3.3 – Interacção entre as parametrizações no MM5 [70]
As previsões são efectuadas com resolução temporal horária e num horizonte até 7 dias adiante
(168 horas), sendo que o modelo numérico utilizado para as previsões é corrido à meia-noite de cada
dia, fornecendo previsões a partir do meio-dia desse mesmo dia. São previstos um total de 11
parâmetros, detalhados na Tabela 3.2. Exceptuando a velocidade do vento, que é prevista a 10 m do
solo, os restantes parâmetros são calculados a uma distância de 2 m do solo.
Tabela 3.2 – Parâmetros previstos pelos GPNT
Designação (Unidade) Parâmetro
𝑻 (°𝐂) Temperatura ambiente
𝑯𝑹 (%) Humidade relativa
𝑽𝒆𝒏 (𝐦/𝐬) Velocidade do vento
𝑫𝒊𝒓 (°𝐍) Direcção do vento relativamente ao sentido Norte-Sul
𝒔𝒘𝒅 (𝐖/𝐦𝟐) Fluxo de radiação descendente de comprimento de onda curto
𝒔𝒘𝒐 (𝐖/𝐦𝟐) Fluxo de radiação ascendente de comprimento de onda curto
𝒍𝒘𝒅 (𝐖/𝐦𝟐) Fluxo de radiação descendente de comprimento de onda longo
𝒍𝒘𝒐 (𝐖/𝐦𝟐) Fluxo de radiação ascendente de comprimento de onda longo
𝑷𝒔𝒍𝒗 (𝐦𝐛𝐚𝐫) Pressão ao nível do mar
𝑷𝒄𝒑 (𝐦𝐦) Precipitação
𝑷𝒓𝒆𝒔𝒔𝟎 (𝐦𝐛𝐚𝐫) Pressão à superfície
Dos parâmetros previstos pelo GPNT, destaca-se a importância do fluxo de radiação descendente de
comprimento de onda curto, que corresponde à irradiância horizontal global para o local em questão.
O fluxo de radiação ascendente de comprimento de onda curto está associado à porção da radiação
solar reflectida, enquanto que os fluxos de radiação de comprimento de onda longo, ascendente e
21
descendente, correspondem à radiação infravermelha emitida da Terra para os espaço e à incidente
na Terra, respectivamente.
O processo de previsão dos parâmetros acima mencionados é o seguinte:
1. São recolhidos dados meteorológicos relevantes para múltiplos locais no mundo,
provenientes de imagens de satélites e estações meteorológicas, entre outros;
2. Esses dados são compilados, servindo de condições iniciais e de condições de fronteira
para se executar o modelo numérico global GFS, pelas 0h de cada dia e com um horizonte
temporal de 14 dias, cujas previsões são disponibilizadas pelo NWS/NOAA31 [71];
3. O GPNT utiliza as previsões dos primeiros 7 dias do modelo GFS como condições iniciais
e condições de fronteira para executar o modelo de mesoescala MM5, que contém dados
da topografia e do coberto vegetal da área de aplicação. Primeiro é executado o modelo
com uma malha cuja resolução é de 27 x 27 km e, em seguida, para uma extensão espacial
menor, é executado o mesmo modelo com uma resolução espacial de 9x9 km, como
representado na Figura 3.4. As primeiras 12h de previsões são desprezadas, por forma a
garantir que as variáveis do modelo estão estabilizadas;
4. Através de uma interpolação bilinear ponderada com as previsões das células vizinhas na
malha mais fina do MM5, o GPNT fornece a previsão dos parâmetros para as coordenadas
do PEC.
Figura 3.4 – Malhas executadas pelo GPNT com o modelo MM5 [69]
Refere-se ainda que o processo descrito anteriormente apenas se refere às previsões que são
disponibilizadas para o Taguspark, isto é, apesar de os modelos numéricos mencionados serem
executados 4 vezes por dia, apenas a primeira dessas vezes é utilizada para efectuar as previsões
utilizadas nesta dissertação.
31 National Weather Service/National Oceanic and Atmospheric Administration
22
Apesar de os modelos numéricos de previsão apresentarem vantagens, principalmente para horizontes
temporais maiores, estes têm erros associados. Mathiesen [16] identifica que estes erros podem ter
origem em três fontes: resolução insuficiente do modelo, parametrizações físicas pouco precisas e
condições iniciais ou de fronteira inadequadas. O mesmo autor aponta que a utilização de MOS pode
reduzir as magnitudes dos erros, algo que é sugerido repetidamente na literatura, sendo uma das
possibilidades a utilização de redes neuronais artificiais para o pós-processamento das previsões
numéricas [56], [58]. Assim sendo, implementar-se-á uma rede artificial neuronal com o objectivo de
diminuir o erro associado às previsões obtidas pelo MM5, como descrito na secção seguinte.
3.2.2 Rede neuronal artificial
Redes neuronais artificiais são redes inspiradas em redes neuronais biológicas, sendo compostas por
várias camadas com diferentes tipologias possíveis, nas quais existem os chamados neurónios. Estes
têm como função o processamento do sinal de entrada, transmitindo posteriormente um sinal de saída.
As redes neuronais podem ser utilizadas em diferentes tipos de problemas, como aproximação de
funções ou reconhecimento de padrões, sendo utilizadas em diversas áreas, como engenharia,
economia, medicina, entre outras, incluindo na resolução de problemas relacionados com previsões
meteorológicas e dimensionamento, modelação e controlo de sistemas fotovoltaicos [7].
Sendo um método de aprendizagem, uma rede neuronal precisa de ser treinada. Deste modo, utilizando
dados de input para os quais se conhecem os valores de output, os valores objectivo, os parâmetros
da rede são ajustados iterativamente de forma a minimizar o erro. A fase de aprendizagem divide-se
em três etapas distintas, que utilizam conjuntos de dados independentes: treino, validação e teste. O
objectivo da fase de aprendizagem é encontrar o valor apropriado para cada parâmetro, de modo a que
para um dado conjunto de inputs, se obtenham os outputs pretendidos.
Na construção de uma rede neuronal existem diversas considerações que precisam de ser feitas,
nomeadamente ao nível do tipo de rede ou arquitectura, da sua topologia e do tipo de funções de
transferência utilizadas, do método de treino, e dos parâmetros de entrada e processamento dos
mesmos. Discute-se em seguida cada uma das considerações relevantes, tendo em consideração que
todas as redes foram construídas com recurso à Neural Network Toolbox do software MATLAB,
versão 8.5. Partiu-se de uma rede de aproximação de funções, que utiliza a função fitnet, criada através
do GUI da toolbox, tendo-se posteriormente alterado o código gerado para modificar a rede e os seus
parâmetros.
3.2.2.1 Tipo de rede
Existem diferentes tipos de redes neuronais artificiais. As redes mais simples e mais populares são as
redes feedforward, existindo também redes de base radial e redes recorrentes, entre outras [7].
Redes neuronais feedforward, como redes do tipo perceptrão multicamada, consistem em redes cujas
unidades (neurónios) estão organizadas em múltiplas camadas com ligações apenas para as camadas
seguintes, como representado na Figura 2.3. Cada sinal que passa numa ligação é multiplicado por um
factor de ponderação associado e pode ser-lhe somado uma constante (designada por bias). Os inputs
entram na primeira camada, a camada de entrada, passam por uma ou várias camadas escondidas,
23
onde os sinais são transformados através de funções activação nos neurónios, chegando por fim à
camada de saída, cujos neurónios contêm também funções de activação, e de onde saem os outputs
pretendidos [7]. Deve ser mencionado que, apesar de ter o nome de camada de entrada, o mais comum
é não existir processamento nesta camada (como acontece nas redes neuronais implementadas em
MATLAB).
As redes feedforward têm a característica de serem treinadas através de algoritmos de retropropagação
de erros [72], ou seja, os factores de ponderação e as constantes são ajustadas iterativamente de forma
a minimizar o erro entre os valores de saída da rede e os valores objectivo.
As redes de base radial, cuja estrutura é semelhante à das redes feedforward com uma camada
escondida, têm a particularidade de utilizar funções de activação de base radial nos seus neurónios. A
principal diferença entre estas arquitecturas consiste no método pelo qual os factores de ponderação
são actualizados durante o treino: enquanto que as redes feedforward utilizam um algoritmo de
retropropagação de erros, as redes de base radial actualizam os factores de ponderação em duas fases
distintas: uma primeira fase, não-supervisionada, onde são determinados os factores de ponderação
da primeira camada e os coeficientes das funções de activação, e uma segunda fase, supervisionada,
onde são treinados os factores de ponderação da segunda camada [49].
As redes recorrentes fazem uso de um bloco adicional, denominado de bloco de atraso (delay). Nestas
redes existe uma ligação entre alguns dos outputs da rede e os alguns dos seus inputs, sendo essa
ligação denominada de feedback [73]. Nesse sentido, ao contrário das redes feedforward, que só têm
ligações para as camadas seguintes, as redes recorrentes têm ligações para camadas anteriores, como
pode ser observado na Figura 3.5.
Figura 3.5 – Rede recorrente (Adaptado de [74])
Apesar de existirem na literatura estudos que utilizam redes neuronais de base radial [75] e redes
neuronais recorrentes [62] para a previsão da irradiância, as redes feedforward são as mais utilizadas
para esse objectivo [7], [47]. Um estudo que comparou o desempenho de redes feedforward, redes de
base radial e redes recorrentes, obteve melhores resultados na previsão horária da irradiância com
uma rede feedforward [49]. Considerando estes factores, optou-se por se implementar uma rede
feedforward para o pós-processamento da irradiância na presente dissertação.
3.2.2.2 Topologia da rede
Um dos parâmetros que mais influencia a qualidade dos resultados numa ANN é o seu número de
neurónios [43]. A estrutura de um neurónio simples está representada na Figura 3.6, onde os 𝑥𝑖
representam os inputs, os 𝑤𝑖 representam os factores de ponderação associados a esses inputs, 𝜃
representa o bias, que é uma constante de correcção, 𝑧 é a função de activação, discutida numa
24
subsecção seguinte, e 𝑦 representa o output do neurónio. É de referir que apesar da inclusão do bias
ser opcional, a sua utilização é recomendável, uma vez que permite corrigir inputs nulos, isto é, se
todos os inputs forem nulos, o único factor de correcção possível é o bias.
Figura 3.6 – Estrutura de um neurónio (Adaptado de [7])
O neurónio é a base de uma rede neuronal, sendo a sua unidade de processamento. Redes com mais
neurónios têm maior capacidade de generalização e conseguem resolver problemas mais complexos,
devendo-se no entanto limitar a sua quantidade a fim de evitar overfitting, isto é, quando a rede
aprendeu os exemplos de treino, mas não consegue generalizar para novas situações. Existe portanto
um compromisso no número de neurónios a utilizar nas camadas escondidas: uma quantidade
insuficiente não consegue aprender novos padrões para resolver o problema, e uma quantidade em
excesso não consegue generalizar fora do treino, pois memorizou o problema [43].
Outro dos parâmetros de projecto de uma rede é o número de camadas escondidas, camadas nas
quais estão os neurónios. Com o aumento do número de camadas escondidas de uma rede torna-se
possível a resolução de problemas mais complexos, à custa de um aumento exponencial do tempo
computacional.
Em geral, apenas problemas extremamente complexos requerem redes neuronais com mais do que
duas camadas escondidas [76]. Além disso, para a previsão da irradiância a literatura indica que apenas
uma camada escondida é suficiente [77], [78], pelo que se definiu uma rede com uma camada
escondida. Assim sendo, a rede tem no total três camadas: uma de entrada, uma escondida e uma de
saída. De modo a se chegar a uma topologia eficiente para o problema em questão, a metodologia
adoptada para seleccionar o número de neurónios na camada escondida baseou-se no seguinte
algoritmo:
1. Definir uma rede com uma camada escondida e um neurónio;
2. Treinar a rede 15 vezes, extraindo resultados indicadores do desempenho de cada treino
(nomeadamente o RMSE da rede neuronal na fase de teste);
3. Aumentar a dimensão da rede em um neurónio;
4. Repetir os passos 2 e 3 até se atingir os 100 neurónios.
Assim sendo, treinaram-se um total de 1500 redes. Optou-se por se treinar cada tipo de rede 15 vezes,
uma vez que os resultados variam para cada uma delas, dado que a inicialização dos factores de
ponderação e biases é aleatória, fazendo com que cada treino resulte numa rede com parâmetros
25
diferentes. Além disso, é indicado na literatura que treinar uma rede entre 5 a 10 vezes é suficiente
para superar problemas associados à rede ter ficado presa num mínimo local [76]. Deste modo, para
cada dimensão de rede analisaram-se os valores médios do RMSE na fase de teste, tendo-se
observado a influência do aumento do número de neurónios neste indicador. Foi assim possível definir-
se a topologia da rede neuronal preliminar.
Para a camada de saída utilizou-se apenas um neurónio, considerando o tipo de problema a resolver
e a existência de apenas uma variável de saída [76].
3.2.2.3 Selecção dos parâmetros de entrada
Como mencionado anteriormente, a rede neuronal implementada tem como função aumentar a
precisão das previsões já existentes para o local. Assim sendo, os dados de entrada provêm do MM5,
que fornece previsões horárias até sete dias adiante de onze parâmetros: quatro fluxos de radiação,
um dos quais é a irradiância relevante para o presente modelo, a temperatura ambiente, a humidade
relativa, a velocidade e direcção do vento, a pressão atmosférica ao nível do mar, a precipitação e a
pressão atmosférica à superfície.
A selecção das variáveis de input a incluir está relacionada com o tipo de problema a resolver e
influencia significativamente o desempenho da rede. Esta escolha não é óbvia, existindo estudos que
utilizam algoritmos genéticos ou testes estatísticos para avaliar a relevância de cada parâmetro [5],
[46]. Estudos semelhantes encontrados na literatura indicam que, para além da irradiância prevista,
incluir a temperatura e a humidade relativa melhora os resultados obtidos, sendo que os benefícios da
inclusão de outros parâmetros nem sempre é consensual [5], [79], [80], [81]. Além disso, num estudo
que avaliou a previsão da irradiância solar com o modelo MM5, é sugerido que a temperatura ambiente
e a humidade relativa são variáveis relacionadas com a irradiância, devendo ser tidas em conta na
previsão da mesma [82]. A relevância da humidade relativa na previsão da irradiância solar está
associada ao facto de esta ser uma variável que é função da pressão de vapor de água na atmosfera,
associada à quantidade de vapor presente, que por sua vez está associada à presença de nuvens. Isto
é adicionalmente suportado pelo facto de o bloco do MM5 que processa a radiação ser precedido por
blocos associados às nuvens (ver Figura 3.3). Finalmente, uma vez que o erro da previsão aumenta
significativamente com o aumento do seu horizonte temporal, decidiu incluir-se também como input o
número de horas adiante de cada previsão.
Como tal, e tendo em conta que aumentar o número de parâmetros de entrada não é necessariamente
positivo, avaliou-se a influência da topologia da rede neuronal utilizando-se a irradiância, a temperatura
ambiente, a humidade relativa e o número de horas adiante como inputs, recorrendo ao algoritmo
descrito na subsecção 3.2.2.2. A análise aos resultados obtidos permitiu definir o número máximo
significativo de neurónios na camada escondida, isto é, a dimensão a partir da qual não se justifica
continuar a testar o aumento do número de neurónios.
A definição de um novo valor máximo, inferior aos 100 neurónios do algoritmo original, tem como
objectivo reduzir o tempo computacional em testes. Assim sendo, foi analisada a influência da inclusão
das variáveis utilizadas na rede preliminar, aplicando o algoritmo de avaliação da topologia da rede a
redes neuronais com diferentes combinações de parâmetros de entrada.
26
3.2.2.4 Dados de entrada e de valores objectivo
Foram disponibilizadas pelo GPNT previsões para o local da instalação em estudo desde 2012. Dado
o objectivo do problema, utilizaram-se apenas dados referentes a previsões até 3 dias adiante, tendo-se
excluído as restantes. Além disso, às previsões disponíveis excluíram-se as do período nocturno.
Aquando da comparação entre modelos é importante considerar se estes incluem ou não dados
nocturnos, uma vez que o desempenho geral de um modelo aumenta caso este faça previsões triviais,
isto é, prever irradiância nula quando está de noite.
Quanto às medições da irradiância, importantes na fase de aprendizagem da rede, estavam disponíveis
124 dias completos, entre 28 de Julho de 2015 e 17 de Janeiro de 2016, aos quais se excluíram também
os valores nocturnos.
Apesar de não existirem tantas medições quantas previsões, verificou-se que a gama de valores
existentes nos dados cobria quase totalmente a gama pretendida, ou seja, os valores normalizados de
entrada e saída variavam entre 0 e aproximadamente 1. Tal facto é favorável ao desempenho da rede,
uma vez que não é garantido que uma rede neuronal consiga extrapolar suficientemente bem, quando
os inputs fornecidos estão fora da gama dos inputs apresentados durante o treino [76]. Para tal, a
utilização de previsões para as quais não existe o valor objectivo também pode melhorar o desempenho
da rede, associado também ao facto de se estar a expandir a gama de valores possíveis, isto é, não se
estar a limitar os máximos e mínimos dos inputs aos dos dias em que existem medições. A inclusão
destes valores seria de maior interesse nos casos em que, para redes com mais de um parâmetro de
saída, se têm algumas medições onde não existem medições de todos os parâmetros, não se
desperdiçando assim dados úteis.
Assim sendo, e tomando em consideração que a utilização em excesso de dados redundantes pode
levar ao overfiting da rede, optou-se por se considerar todas as previsões disponíveis desde dia 1 de
Janeiro de 2015 até dia 30 de Março de 2016, tendo-se testado posteriormente se esta era benéfica.
Em MATLAB, o vector com os objectivos deve conter “NaN32” nas células para quais não existe medição
correspondente à previsão [83].
De modo a melhorar os resultados obtidos e acelerar a aprendizagem da rede, optou-se por se
normalizar os dados de entrada e os valores objectivo, sendo que os benefícios da normalização já
foram demonstrados em estudos anteriores [84]. Esta normalização evita também a saturação das
funções de activação dos neurónios. A normalização da irradiância foi feita através do índice de
claridade, 𝑘𝑡, com recurso ao cálculo da irradiância extraterrestre, 𝐺0,𝑛, normalizando-se assim a
irradiância entre valores de 0 a 1 [20]. Os cálculos da irradiância extraterrestre e do índice de claridade
encontram-se detalhados na subsecção 3.3.1, salientando-se que para os valores objectivo, cujo valor
da irradiância é no plano dos painéis, se utiliza as equações numa ordem inversa, resolvidas de modo
iterativo. Alguns valores de previsões e medições resultaram em valores de 𝑘𝑡 superiores a um, tendo
estes sido desconsiderados.
32 Not a Number
27
𝑘𝑡 =𝐺
𝐺0,𝑛 (3.1)
Dada a normalização da irradiância, pode-se dizer que a previsão da irradiância é feita através da
previsão do índice de claridade.
A temperatura ambiente, a humidade relativa e as restantes variáveis foram normalizadas através dos
seus valores mínimos e máximos, como sugerido na literatura, pela expressão [5], [85]:
𝑦 = 𝑦𝑚𝑖𝑛 +𝑥 − 𝑥𝑚𝑖𝑛
𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛(𝑦𝑚𝑎𝑥 − 𝑦𝑚𝑖𝑛) (3.2)
onde 𝑦 é a variável normalizada, 𝑥 é o valor a normalizar, 𝑥𝑚𝑎𝑥 e 𝑥𝑚𝑖𝑛 são os extremos da variável a
normalizar, e 𝑦𝑚𝑎𝑥 e 𝑦𝑚𝑖𝑛 os extremos do intervalo de normalização pretendido. Optou-se por se
normalizar as variáveis entre 0 e 1, o mesmo intervalo do índice de claridade, sendo estes os valores
de 𝑦𝑚𝑖𝑛 e 𝑦𝑚𝑎𝑥, respectivamente, simplificando-se assim a Equação 3.2 em:
𝑦 =𝑥 − 𝑥𝑚𝑖𝑛
𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 (3.3)
Uma alternativa possível à normalização acima seria o ajustamento dos dados de modo a que estes
ficassem com média e variância específicas – tipicamente 0 e 1, respectivamente.
Por defeito, o MATLAB utiliza duas funções de pré-processamento de dados:
removeconstantrows – que elimina linhas compostas por valores repetidos;
mapminmax – que normaliza os dados de entrada e saída (por defeito, entre -1 e 1).
Uma vez que os dados da rede já foram normalizados, optou-se por se manter apenas a primeira função
de pré-processamento, evitando assim deste modo que os dados fossem transformados num intervalo
que não é coerente com os parâmetros em questão, pois a irradiância é um sinal não negativo.
3.2.2.5 Função de inicialização
A função de inicialização de uma rede é a função que define a forma como os factores de ponderação
e biases são inicializados, isto é, como são calculados os seus valores iniciais. Para as redes
feedforward com algoritmos de retropropagação de erros, é utilizada a função de inicialização initnw,
que calcula os valores iniciais dos pesos e bias através do algoritmo de Nguyen-Widrow [86]. Este
algoritmo surge como alternativa à inicialização através de valores aleatórios simétricos, tendo sido já
provada a sua eficiência no desempenho das redes e na diminuição do tempo de aprendizagem das
mesmas [87].
3.2.2.6 Funções de entrada e de activação
Cada neurónio, como representado anteriormente na Figura 3.6, é composto por duas partes: uma
função de entrada e uma função de activação. A função de entrada está relacionada com o modo como
os inputs são combinados dentro do neurónio. O tipo de função de entrada mais comum é a combinação
28
linear dos inputs ponderados, através do uso da Equação 3.4, tendo sido esta a função de entrada
adoptada na presente dissertação [73].
𝑧 = ∑ 𝑤𝑖𝑥𝑖 + 𝜃
𝑁
𝑖=1
(3.4)
Nesta expressão, 𝑧 é o parâmetro resultante da combinação dos 𝑁 inputs 𝑥𝑖, multiplicados pelos
respectivos factores de ponderação 𝑤𝑖, à qual é adicionada uma constante 𝜃, que representa o bias.
A função de activação corresponde à forma como se obtém o output do neurónio, 𝑦, através do
parâmetro 𝑧 resultante da função de entrada, existindo nos neurónios das camadas escondidas e no
neurónio da camada de saída. Esta função pode ser linear ou não-linear e deve ter em conta o tipo de
variáveis de entrada. Para o tipo de problema em questão as funções de activação a considerar
encontram-se descritas na Tabela 3.3 e representadas na Figura 3.7, existindo, no entanto, a
possibilidade de utilizar qualquer tipo de função como função de activação.
Tabela 3.3 - Funções de activação
Função de activação Fórmula Função MATLAB
Linear 𝑦 = 𝑧 purelin
Sigmóide logística 𝑦 =1
1 + 𝑒−𝑧 logsig
Tangente hiperbólica sigmóide 𝑦 = tanh (𝑧) tansig
(a) Linear (b) Sigmóide logística (c) Tangente hiperbólica sigmóide
Figura 3.7 – Funções de activação (Adaptado de [83])
As funções de activação sigmóides são as mais comuns nos neurónios das camadas escondidas, uma
vez que são diferenciáveis, algo que é relevante devido à utilização do algoritmo de retropropagação
dos erros, sendo que se utilizou como função de activação dos neurónios nas camadas escondidas a
função sigmóide logística, dado que esta apresenta outputs na mesma gama de valores em que se
encontram os dados de entrada e saída, ou seja, entre 0 e 1, considerando também que a irradiância
é um sinal não negativo. Para a camada de saída utilizou-se uma função de activação linear, como
sugerido na literatura, tendo sido analisado também o desempenho de uma rede com uma função
sigmóide logística na camada de saída [56], [73].
29
3.2.2.7 Aprendizagem
Como já referido, antes da aplicação de uma rede neuronal existe a fase de aprendizagem. De uma
forma simplista, esta fase começa após a inicialização dos factores de ponderação e biases, quando a
rede neuronal utiliza os dados de entrada, obtendo valores de saída. Esses valores são comparados
com os valores objectivo, calculando-se assim o erro e ajustando-se os factores de ponderação e
biases de acordo. O processo de comparação e ajuste é realizado iterativamente até se atingir um dos
critérios de paragem. O algoritmo de aprendizagem define como são efectuados os cálculos dos erros
e de actualização dos coeficientes. O tipo de erro a ser calculado é definido pela função de performance.
O algoritmo de aprendizagem utilizado na rede neuronal a desenvolver é um algoritmo de
retropropagação de erros. O algoritmo de retropropagação de erros padrão (o primeiro a ser
amplamente difundido) tornou-se bastante popular em aplicações para redes multicamada, ajustando
os factores de ponderação e as constantes através da retropropagação dos erros da camada de saída
até à camada de entrada. Contudo, a forma como o processo de cálculo e ajuste era efectuado no
algoritmo original implicava frequentemente processos de aprendizagem demorados e
computacionalmente exigentes. Como tal, surgiram alternativas mais eficientes, que incluem
modificações heurísticas ao algoritmo original ou utilizam técnicas numéricas de optimização. A análise
detalhada de algoritmos de aprendizagem está fora do âmbito da presente dissertação.
No entanto, considerando a literatura existente e o problema em questão, o algoritmo seleccionado foi
o algoritmo de Levenberg-Marquardt, que pertence ao segundo grupo de alternativas, com a utilização
de técnicas numéricas de optimização [76], [73]. Como foi mencionado, este algoritmo é também de
retropropagação de erros, sendo que a principal diferença relativamente ao algoritmo de
retropropagação de erros padrão reside na forma como é calculada a matriz Jacobiana, permitindo
reduzir significativamente o tempo de aprendizagem. Adicionalmente, um estudo de Zisos et al. [88]
sobre a previsão da irradiância e temperatura identificou que o algoritmo de Levenberg-Marquardt
apresentava melhor desempenho quando comparado com outros 12 algoritmos de aprendizagem,
verificando-se que mesmo nos casos em que os resultados eram semelhantes, o algoritmo de
Levenberg-Marquardt convergia mais rapidamente.
A principal desvantagem deste algoritmo está associada aos requisitos de espaço, uma vez que este
precisa de guardar uma matriz 𝑛 × 𝑛, enquanto a maioria das alternativas necessita apenas de guardar
um vector de dimensão 𝑛 (onde 𝑛 é o número de parâmetros – factores de ponderação e biases).
Apesar disto, tal factor apenas se torna relevante para problemas de grandes dimensões, com alguns
milhares de parâmetros, não sendo esse o caso do problema em questão [76].
Apesar de existirem dois tipos de aprendizagem, incremental e em grupo (batch), estando estas
relacionadas com o facto de os parâmetros serem actualizados para cada par saída-objectivo ou
apenas no final de uma iteração, o algoritmo de Levenberg-Marquardt implica a aprendizagem em
grupo, não sendo portanto o tipo de aprendizagem um factor modificável.
30
3.2.2.8 Outros parâmetros
Para além do algoritmo de aprendizagem, é necessário definir a função de performance, ou seja, o tipo
de erro a ser calculado. Neste caso, utilizou-se a função por defeito no MATLAB, que recorre ao cálculo
do RMSE, sendo esta a função de performance mais habitual [5].
Seguidamente, aquando da fase de aprendizagem da rede é importante definir a divisão dos dados,
isto é, em que proporções se dividem os dados para as etapas de treino, validação e teste, e de que
modo é feita essa divisão. Os dados de treino são utilizados para actualizar os factores de ponderação
e biases, os dados de validação servem para verificar se o treino da rede está de facto a melhorar o
desempenho da rede e os dados de teste têm como função avaliar o desempenho da rede fora do
processo de aprendizagem. Relativamente às proporções, por defeito os rácios entre treino, validação
e teste são 70/15/15, respectivamente, pelo que se manteve essa divisão. Literatura existente indica
também a utilização de outras divisões, como 60/20/20 ou 80/10/10 [77], tendo sido analisada a
influência das proporções da divisão de dados após definida a rede a utilizar. Quanto à forma como é
feita essa divisão, utilizou-se a função divideint, que divide os dados sequencialmente. Por exemplo,
utilizar esta função para uma divisão de 60/20/20 de uma série de 10 dados, significa que os dados das
entradas 1, 2, 3, 6, 7 e 8 são usados no treino, os das entradas 4 e 9 para validação e os das entradas
5 e 10 são utilizados na fase de teste. Optou-se por uma divisão sequencial, em oposição à função
utilizada por defeito que divide os dados aleatoriamente, de modo a garantir uma divisão equilibrada
dos dados relativamente aos dias do ano (evitando assim, num caso extremo, a utilização de dados de
um único mês na fase de teste) e também de forma a que o conjunto de dados de teste seja sempre o
mesmo, facilitando assim a comparação do desempenho entre redes.
Por fim, é importante definir qual o critério de paragem da aprendizagem. Este pode ser definido pelo
número de iterações, pelo valor do gradiente e pelo número de validações. O primeiro factor é utilizado
para impedir processos de aprendizagem demasiado longos, não sendo um indicador do desempenho
da rede. Antes de abordar os dois factores restantes, é relevante introduzir o conceito de superfície de
erro: enquanto que para uma rede neuronal linear de uma camada a função de erro é quadrática com
curvatura constante, tendo apenas um mínimo, para redes neuronais multicamada (multilineares ou
não-lineares) o erro é representado por uma superfície, cuja curvatura pode variar consideravelmente
e na qual podem existir vários valores mínimos. O valor do gradiente indica a aproximação de um
desses valores mínimos, uma vez que um valor nulo do gradiente é uma condição necessária (mas não
suficiente) para se estar num ponto que seja mínimo local. Finalmente, o número de validações tem
como objectivo evitar o overfitting da rede neuronal, uma vez que o processo de aprendizagem é
interrompido quando se verifica que o gradiente não diminuiu num determinado número de iterações,
devendo esse valor ser suficientemente alto para evitar que a rede fique “presa” num mínimo local.
Para a análise da topologia da rede, utilizaram-se valores ajustados através de testes preliminares: um
limite de 1000 iterações, suportado pelo facto de não se ter como objectivo parar o processo de
aprendizagem prematuramente, um gradiente igual a 10−7 e um limite de 10 validações sucessivas,
valores que se verificaram adequados no decorrer do desenvolvimento das redes neuronais testadas.
31
3.3 Estimativa da produção eléctrica
O modelo de previsão fornece, entre outras grandezas, a irradiância global horizontal e a temperatura
ambiente. No entanto, o modelo que estima a produção eléctrica do sistema de painéis fotovoltaicos
(descrito na subsecção 3.3.4) necessita de três tipos de inputs:
1) Irradiância incidente no plano do painel fotovoltaico – Subsecção 3.3.1
2) Temperatura da célula – Subsecção 3.3.2
3) Características técnicas do painel fotovoltaico – Subsecção 3.3.3
3.3.1 Irradiância incidente no plano do painel fotovoltaico
O primeiro passo para se poder estimar a produção eléctrica dos módulos fotovoltaicos a partir da
irradiância e temperatura previstas para o local é a transformação da irradiância global prevista nas
várias componentes da irradiância no plano dos módulos em questão.
A irradiância solar na superfície terrestre pode ser decomposta em irradiância directa (𝐺𝑏), associada
aos raios que vêm directamente do disco solar, e irradiância difusa (𝐺𝑑), relacionada com a irradiância
resultante da dispersão da mesma ao atravessar a atmosfera. A irradiância difusa contém uma
componente adicional, contabilizada separadamente, correspondente à irradiância reflectida pelo solo
(𝐺𝑟), tida em conta quando a superfície receptora está inclinada em relação à horizontal, como é o caso
dos módulos fotovoltaicos em questão. À soma da irradiância directa, da irradiância difusa e da
irradiância reflectida pelo solo dá-se o nome de irradiância total (𝐺𝑡) [89].
𝐺𝑡 = 𝐺𝑏 + 𝐺𝑑 + 𝐺𝑟 (3.5)
De modo a se distinguir a irradiância incidente numa superfície horizontal da incidente numa superfície
inclinada, utilizam-se os índices 𝑛 e 𝑡, respectivamente. É frequentemente encontrado na literatura o
termo “Irradiância Horizontal Global” (GHI33), que corresponde à irradiância total incidente numa
superfície horizontal, não existindo a componente da irradiância reflectida no solo (𝐺𝑟,𝑛 = 0). Aplicando
os respectivos índices à Equação (3.5) fica-se com:
𝐺𝑡,𝑛 = 𝐺𝑏,𝑛 + 𝐺𝑑,𝑛 (3.6)
𝐺𝑡,𝑡 = 𝐺𝑏,𝑡 + 𝐺𝑑,𝑡 + 𝐺𝑟,𝑡 (3.7)
Como visto anteriormente, o output do MM5 que é pós-processado pela rede artificial neuronal
desenvolvida é a irradiância total no plano horizontal, para o local da instalação dos painéis
fotovoltaicos.
33 Global Horizontal Irradiance
32
Através da correlação empírica na Equação 3.8, é possível calcular-se a irradiância extraterrestre
incidente num plano horizontal paralelo à superfície da Terra (𝐺0,𝑛):
𝐺0,𝑛 = 𝐺0 cos(𝜃𝑧) = 𝑆𝑐 [1 + 0,033cos (360𝑛
365,25)] cos(𝜃𝑧) (3.8)
onde 𝐺0 é a irradiância extraterrestre num plano normal aos raios solares; 𝑆𝑐 é a constante solar,
correspondente à irradiância extraterrestre média, incidente numa superfície normal aos raios solares,
à distância média entre o Sol e a Terra (segundo a norma ASTM E-490 [90], 𝑆𝑐 = 1366,1 W/m2); 𝜃𝑧 é
o ângulo de zénite solar; e 𝑛 é o número do dia do ano (𝑛 = 1 para 1 de Janeiro). O cálculo de 𝜃𝑧 é
efectuado através da Equação 3.9.
cos 𝜃𝑧 = sin 𝜙 sin 𝛿 + cos 𝜙 cos 𝛿 cos 𝜔 (3.9)
em que 𝜙 é a latitude do local, 𝛿 é o ângulo de declinação solar e 𝜔 é designado por ângulo horário. O
ângulo de declinação solar pode ser aproximado por [91]:
𝛿 = 23,45 sin (360 ×284 + 𝑛
365) (3.10)
O ângulo horário, 𝜔, que se calcula através da Equação 3.11, implica o cálculo de outros parâmetros,
definidos entre a Equação 3.12 e a Equação 3.14.
𝜔 = 15(𝑡𝑠 − 12) (3.11)
onde 𝑡𝑠 é a hora solar, calculada através de:
𝑡𝑠 = 𝑡𝐿𝑆𝑇 +𝑙𝑚𝑒𝑟𝑖𝑑𝑖𝑎𝑛 − 𝑙𝑙𝑜𝑐𝑎𝑙
15+ 𝐸𝑇 (3.12)
Na equação acima, 𝑡𝐿𝑆𝑇 corresponde à hora local padrão (LST34), ou seja, à hora associada ao fuso
horário da zona em questão, à qual se deve subtrair uma hora quando em horário de Verão (no entanto,
tanto as previsões do MM5, como as medições do Sunny SensorBox, registam as medições em UTC35,
pelo que não existe alteração da hora); 𝑙𝑚𝑒𝑟𝑖𝑑𝑖𝑎𝑛 é a longitude do meridiano de referência em relação
ao meridiano de Greenwich, sendo que para Portugal temos 𝑙𝑚𝑒𝑟𝑖𝑑𝑖𝑎𝑛 = 0, uma vez que o meridiano de
referência utilizado é o meridiano de Greenwich; 𝑙𝑙𝑜𝑐𝑎𝑙 é a longitude do local (positiva para Oeste de
Greenwich); e 𝐸𝑇 é a equação do tempo, sendo um factor de correcção que toma em consideração a
obliquidade do eixo da Terra e a excentricidade da sua órbita, podendo ser calculada pela Equação
3.13:
34 Local Standard Time
35 Coordinated Universal Time
33
𝐸𝑇 =9,87 sin(2𝐵) − 7,53 cos 𝐵 − 1,5 sin 𝐵
60 (3.13)
sendo 𝐵 definido através de:
𝐵 =360(𝑛 − 81)
365 (3.14)
Definindo-se agora a inclinação dos módulos de painéis fotovoltaicos em relação à horizontal através
do ângulo 𝛽, pode-se calcular o ângulo de incidência da irradiância directa nessa superfície, 𝜃, através
da Equação 3.15. Chama-se à atenção para o facto de a Equação 3.9 ser um caso particular desta
equação para 𝛽 = 0.
cos θ = sin 𝜙 sin 𝛿 cos 𝛽 − cos 𝜙 sin 𝛿 sin 𝛽 cos 𝛾 + cos 𝜙 cos 𝛿 cos 𝜔 cos 𝛽 +
+ sin 𝜙 cos 𝛿 sin 𝛽 cos 𝛾 cos 𝜔 + cos 𝛿 sin 𝛽 sin 𝛾 sin 𝜔 (3.15)
onde 𝛾 é o ângulo azimutal da superfície, definido como o ângulo entre a linha Norte-Sul e a linha da
normal à superfície projectada no plano horizontal (tendo-se 𝛾 = 0 para superfícies orientadas a Sul).
É importante referir que, quando o ângulo de incidência excede os 90°, o Sol se encontra por trás do
painel, implicando que este está a fazer sombra a si próprio. É também necessário garantir que o ângulo
horário está entre o nascer do sol e o pôr-do-sol, ou seja, que a Terra não está a obstruir o Sol [92].
Alguns dos ângulos mencionados encontram-se representados na Figura 3.8, juntamente com o ângulo
de altitude solar, 𝛼, e o ângulo azimutal solar, 𝛾𝑠.
Figura 3.8 – Geometria solar (Adaptado de [92])
34
A normalização da irradiância incidente com a irradiância extraterrestre define o índice de claridade, 𝑘𝑡,
que é uma medida de quantificar a redução da irradiância devido à turbidez atmosférica e à presença
de nuvens [93].
𝑘𝑡 =𝐺𝑡,𝑛
𝐺0,𝑛 (3.16)
Para se conseguir quantificar as diversas componentes da irradiância é necessário calcular a fracção
de irradiância difusa, 𝑘𝑑, definida como o rácio entre a irradiância difusa e a irradiância total incidente.
𝑘𝑑 =𝐺𝑑,𝑛
𝐺𝑡,𝑛 (3.17)
Existem diversos métodos para a estimação da fracção de irradiância difusa. A comparação detalhada
de modelos para o cálculo de 𝑘𝑑 está fora do âmbito da presente dissertação, tendo sido analisada,
porém, literatura sobre este tema [94], [95]. Tapakis et al. [94] identificam o modelo utilizado por
Miguel et al. [96] como um dos três modelos com melhores resultados. Miguel et al. [96], utilizando
dados de 11 cidades de Portugal (Lisboa, Coimbra, Évora, Faro e Porto), Grécia, França e Espanha,
desenvolveram uma expressão que calcula 𝑘𝑑 em função do valor de 𝑘𝑡, aplicável a países na região
do Mediterrâneo, tendo demonstrado que esta representava uma melhoria relativamente a expressões
alternativas para a região.
𝑘𝑑 = {
0,995 − 0,081𝑘𝑡
0,724 + 2,738𝑘𝑡 − 8,32𝑘𝑡2 + 4,967𝑘𝑡
3
0,180
𝑘𝑡 ≤ 0,21 0,21 < 𝑘𝑡 ≤ 0,76
𝑘𝑡 > 0,76
(3.18)
Através da definição de 𝑘𝑑 (Equação 3.17) é possível calcular 𝐺𝑑,𝑛, a partir da qual se pode então
calcular 𝐺𝑏,𝑛 pela Equação 3.6. Ficam assim quantificadas ambas as componentes da irradiância
incidente numa superfície horizontal.
Como mencionado anteriormente, a irradiância total numa superfície inclinada tem uma componente
associada à reflexão da irradiância no solo. O índice de reflectividade, 𝜌, também designado por albedo,
é definido como a razão entre a irradiância reflectida pelo solo e a irradiância incidente no mesmo,
sendo principalmente dependente do tipo de superfície do solo. Uma das abordagens para a estimação
do albedo de um local é o desenvolvimento de correlações empíricas, em função de variáveis como a
o ângulo de altitude solar. Existem na literatura correlações desenvolvidas para locais específicos, não
existindo no entanto nenhuma para o local em questão [97]. Assim sendo, e uma vez que o
desenvolvimento de uma correlação para o cálculo do albedo está fora do âmbito da presente
dissertação, utilizaram-se dados de imagens de satélite. O albedo mensal encontra-se mapeado á
escala global com uma resolução de 0,1° x 0,1°, sendo disponibilizado gratuitamente pela NEO36 [98],
como representado na Figura 3.9.
36 NASA Earth Observations
35
O valor de albedo a utilizar foi definido tomando-se tomado a média dos valores mensais para o ano
de 2015 e para o local da instalação, tendo-se obtido um valor de 𝜌 = 0,155, ou seja, uma reflectividade
constante de 15,5%.
Figura 3.9 – Mapa global de albedo [98]
Para o cálculo da irradiância total incidente nos painéis fotovoltaicos existem inúmeras expressões, que
podem ser isotrópicas ou anisotrópicas. Modelos isotrópicos assumem que a intensidade da irradiância
difusa é uniforme ao longo da esfera celeste. Por outro lado, modelos anisotrópicos consideram a
existência de anisotropia da propagação da irradiância difusa na região circunsolar, isto é, a zona do
céu mais próxima do disco solar, tratando a irradiância difusa na restante esfera celeste como
isotrópica, inclusive a irradiância reflectida pelo solo [79], [99]. Literatura existente sobre a comparação
entre diversos modelos sugere que o modelo anisotrópico desenvolvido por Reindl et al. [1] é o que
melhor se adequa ao cálculo da irradiância total incidente numa superfície inclinada, especialmente na
zona do Mediterrâneo, utilizando a Equação 3.19 [79], [100], [101]:
𝐺𝑡,𝑡 = 𝐺𝑏,𝑛𝑅𝑏 + 𝐺𝑑,𝑛 [(1 − 𝐴𝐼) (1 + cos 𝛽
2) (1 + 𝑓 sin3
𝛽
2) + 𝐴𝐼𝑅𝑏] + 𝐺𝑡,𝑛𝜌
1 − cos 𝛽
2 (3.19)
onde 𝑅𝑏 é o factor geométrico de inclinação da irradiância solar directa, 𝐴𝐼 é o índice anisotrópico,
definido por Hay e Davies [102], e 𝑓 é o factor correctivo da irradiância difusa associada ao clarear do
horizonte (horizon brightening), definido por Reindl et al. [1], podendo estes parâmetros ser calculados
através da Equação 3.20, da Equação 3.21 e da Equação 3.22, respectivamente:
𝑅𝑏 =cos 𝜃
cos 𝜃𝑧 (3.20)
𝐴𝐼 =𝐺𝑏,𝑛
𝐺0,𝑛 (3.21)
36
𝑓 = √𝐺𝑏,𝑛
𝐺𝑡,𝑛 (3.22)
É assim calculada irradiância total incidente no plano dos painéis fotovoltaicos, 𝐺𝑡,𝑡, que, por uma
questão de simplicidade de nomenclatura, será designada por 𝐺 nas secções subsequentes.
3.3.2 Temperatura da célula
As previsões meteorológicas fornecem a temperatura ambiente, sendo que o modelo matemático para
estimar a produção eléctrica dos painéis fotovoltaicos necessita da temperatura das células. Um modelo
simplificado para estimar a temperatura de operação do módulo, 𝜃𝑚 (℃), consiste em admitir que a sua
variação relativamente à temperatura ambiente, 𝜃𝑎 (℃), é directamente proporcional à irradiância
incidente, G (W/m2). A constante de proporcionalidade, k (℃ m2/W), é denominada por constante de
Ross [103].
𝜃𝑚 = 𝜃𝑎 + 𝑘𝐺 (3.23)
O valor da constate de Ross pode ser obtido através da temperatura de funcionamento da célula em
condições normalizadas de funcionamento (NOCT37 [104]), 𝜃𝑁𝑂𝐶𝑇 , definidas por valores de temperatura
ambiente, irradiância e velocidade do vento correspondentes a 𝜃𝑎𝑁𝑂𝐶𝑇 = 20 ℃, 𝐺𝑁𝑂𝐶𝑇 = 800 𝑊/𝑚2 e
𝑈𝑁𝑂𝐶𝑇 = 1 𝑚/𝑠, respectivamente. O valor de 𝜃𝑁𝑂𝐶𝑇 é característico de cada célula e deverá ser indicado
pelo fabricante.
𝜃𝑚 = 𝜃𝑎 +𝐺(𝜃𝑁𝑂𝐶𝑇 − 20)
800 (3.24)
Assim sendo, calculou-se a temperatura da célula utilizando os valores de irradiância resultantes da
aplicação da rede neuronal às previsões e os valores previstos de temperatura pelo MM5. Uma vez
que as previsões têm uma resolução horária, recorreu-se a interpolações lineares para calcular valores
de temperatura ambiente com resolução temporal de 15 minutos, de forma a se estimar a produção
eléctrica do sistema de acordo com a irradiância medida pelo Sunny SensorBox.
3.3.3 Características técnicas do painel fotovoltaico
As características técnicas dos painéis fotovoltaicos que são necessárias ao modelo, incluindo a
temperatura de funcionamento da célula em condições NOCT, estão definidas nas especificações
dadas pelo fabricante e são as apresentadas da Tabela 3.4 juntamente com os seus valores para os
dois modelos de painéis fotovoltaicos existentes na instalação do Taguspark. As grandezas
referenciadas pelo índice superior r consideram-se medidas nas condições de referência (STC38),
definidas mais adiante.
37 Nominal Operating Cell Temperature 38 Standard Test Conditions
37
Tabela 3.4 - Características técnicas necessárias dos painéis fotovoltaicos
Designação Parâmetro (Unidade) LDK-230P-20 [105] LDK-235P-20 [105]
Potência nominal de referência 𝑃𝑀𝑎𝑥𝑟 (W) 230 235
Corrente de máxima potência de
referência 𝐼𝑀𝑃
𝑟 (A) 7,88 7,98
Tensão de máxima potência de
referência 𝑉𝑀𝑃
𝑟 (V) 29,3 29,5
Corrente de curto-circuito de
referência 𝐼𝑐𝑐
𝑟 (A) 8,43 8,5
Tensão de circuito aberto de
referência 𝑉𝑐𝑎
𝑟 (V) 36,9 37,1
Temperatura normalizada de
funcionamento 𝜃𝑁𝑂𝐶𝑇 (℃) 45 45
Número de células em série 𝑁𝑠 60 60
3.3.4 Modelo equivalente – modelo de um díodo e três parâmetros
O modelo matemático equivalente utilizado para se calcular a produção eléctrica de um conjunto de
painéis fotovoltaicos é um modelo relativamente simplificado, denominado modelo de um díodo e três
parâmetros [89]. O modelo parte da descrição de uma célula fotovoltaica através do circuito eléctrico
equivalente apresentado na Figura 3.10, onde está representada a corrente eléctrica gerada pelo efeito
fotoeléctrico na superfície da célula, 𝐼𝑆, quando esta é atingida por um feixe de radiação. Esta corrente
unidireccional considera-se constante para um dado valor de irradiância incidente. A junção p-n do
painel fotovoltaico funciona como um díodo, atravessado por uma corrente interna unidireccional, 𝐼𝐷,
dependente da tensão 𝑉 aos terminais da célula.
Figura 3.10 – Circuito eléctrico equivalente de uma célula fotovoltaica (modelo de um díodo e três parâmetros) [89]
38
É possível definir a corrente 𝐼𝐷 que passa no díodo através de:
𝐼𝐷 = 𝐼0(𝑒𝑉
𝑚𝑉𝑇 − 1) (3.25)
em que 𝐼0 é a corrente inversa de saturação do díodo, 𝑉 a tensão aos terminais da célula, 𝑚 o factor
de idealidade do díodo, cujo cálculo se apresenta mais à frente, na Equação 3.38, e 𝑉𝑇 é o potencial
térmico, dado por:
𝑉𝑇 =𝐾𝑇
𝑞 (3.26)
onde 𝐾 é a constante de Boltzmann (𝐾 = 1,38 × 10−23 J/K), 𝑇 é a temperatura absoluta da célula (em
K) e 𝑞 é a carga eléctrica do electrão (𝑞 = 1,6 × 10−19 C).
Pode-se assim obter a corrente 𝐼 do circuito equivalente:
𝐼 = 𝐼𝑆 − 𝐼𝐷 = 𝐼𝑆 − 𝐼0(𝑒𝑉
𝑚𝑉𝑇 − 1) (3.27)
De modo a se prosseguir com a análise, existem dois pontos de operação da célula relevantes de se
considerarem – curto-circuito exterior e circuito aberto. Em seguida, após se considerar o
funcionamento da célula em condições de referência e em condições reais, é possível calcular a
potência de saída dos módulos.
Curto-circuito exterior
Este ponto é caracterizado por:
𝑉 = 0 (3.28)
𝐼𝐷 = 0 (3.29)
Obtém-se assim a corrente de curto-circuito, 𝐼𝑐𝑐:
𝐼 = 𝐼𝑆 = 𝐼𝑐𝑐 (3.30)
A corrente de curto-circuito corresponde ao valor máximo da corrente de carga, sendo o seu valor uma
característica da célula, devendo ser fornecido pelo fabricante para determinadas condições de
funcionamento.
Circuito aberto
Este ponto define-se por:
𝐼 = 0 (3.31)
39
Obtém-se assim a tensão de circuito aberto (ou em vazio), 𝑉𝑐𝑎:
𝑉 = 𝑉𝑐𝑎 = 𝑚𝑉𝑇ln (1 +𝐼𝑆
𝐼0) (3.32)
A tensão de circuito aberto é o valor máximo da tensão aos terminais da célula, que ocorre quando esta
está em vazio, sendo também uma característica da célula. Assim, com as equações 3.30 e 3.32, é
possível obter-se a corrente inversa de saturação do díodo, 𝐼0:
𝐼0 =𝐼𝑐𝑐
𝑒𝑉𝑐𝑎
𝑚𝑉𝑇 − 1
(3.33)
Como foi referido anteriormente, os parâmetros característicos da célula são fornecidos pelo fabricante.
Estes parâmetros verificam-se para condições denominadas de condições de referência.
Condições de referência
De modo a uniformizar as condições de realização das medidas dos parâmetros característicos das
células fotovoltaicas, determinadas condições nominais de teste [106] foram acordadas entre os
fabricantes:
Temperatura da célula, 𝜃𝑟 = 25 ℃ ≡ 𝑇𝑟 = 298,16 K
Irradiância incidente na célula, 𝐺𝑟 = 1000 W/m2
Distribuição espectral padrão da radiação solar AM 1,539 [107]
Nas condições de referência supra mencionadas, surge uma outra grandeza de referência relevante:
𝑉𝑇𝑟 =
𝐾𝑇𝑟
𝑞= 0,0257 V (3.34)
em que 𝑉𝑇𝑟 é o potencial térmico nas condições de referência.
Aplicando as equações válidas nos pontos de circuito aberto e de curto-circuito às condições de
referência, obtém-se:
0 = 𝐼𝑆𝑟 − 𝐼𝑜
𝑟 (𝑒𝑉𝑐𝑎
𝑟
𝑚𝑉𝑇𝑟
− 1) (3.35)
𝐼𝑐𝑐𝑟 = 𝐼𝑆
𝑟 (3.36)
Combinando as duas equações anteriores e resolvendo em ordem a 𝐼0𝑟, é possível obter-se a corrente
inversa de saturação em condições de referência:
𝐼𝑜𝑟 =
𝐼𝑐𝑐𝑟
𝑒𝑉𝑐𝑎
𝑟
𝑚𝑉𝑇𝑟
− 1
(3.37)
39Esta condição refere-se a um conjunto de condições atmosféricas específicas para caracterizar a radiação solar incidente, onde AM é a abreviatura de Air Mass.
40
Por fim, o factor de idealidade, 𝑚, é calculado com os parâmetros definidos em condições de referência,
de acordo com a Equação 3.38.
𝑚 =
𝑉𝑀𝑃𝑟 − 𝑉𝑐𝑎
𝑟
𝑉𝑇𝑟 ln (1 −
𝐼𝑀𝑃𝑟
𝐼𝑐𝑐𝑟 )
(3.38)
Operação em condições reais
Os parâmetros fornecidos pelo fabricante correspondem a valores em condições de referência, que
variam quando as condições de operação diferem das de referência. Como tal, o modelo considera a
influência das condições reais de operação nestes parâmetros, fazendo-o de modo simplificado,
assumindo que a temperatura afecta a corrente de saturação inversa, 𝐼0, e que a irradiância incidente
influencia a corrente de curto-circuito, 𝐼𝑐𝑐, de acordo com as equações 3.39 e 3.40, respectivamente.
𝐼0 = 𝐼0𝑟 (
𝑇𝑚
𝑇𝑟)
3
𝑒𝑁𝑠𝜀𝑚
(1
𝑉𝑇𝑟−
1𝑉𝑇
) (3.39)
𝐼𝑐𝑐 = 𝐼𝑐𝑐𝑟
𝐺
𝐺𝑟 (3.40)
onde 휀 é o hiato do semicondutor (para o caso do silício, 휀 = 1,12 eV) e 𝑁𝑠 o número de células ligadas
em série.
Cálculo da potência
Tendo em conta a definição das variáveis anteriores, pode-se proceder ao cálculo da potência de saída
para uma dada irradiância e temperatura da célula através de:
𝑃 = 𝑉𝐼 = 𝑉 [𝐼𝑐𝑐 − 𝐼0 (𝑒𝑉
𝑚𝑉𝑇 − 1)] (3.41)
A potência máxima é obtida igualando-se a derivada da equação anterior a zero:
𝑑𝑃
𝑑𝑉= 𝐼𝑐𝑐 + 𝐼0 (1 − 𝑒
𝑉𝑚𝑉𝑇 −
𝑉
𝑚𝑉𝑇𝑒
𝑉𝑚𝑉𝑇) = 0 ⇔
⇔ 𝑒𝑉
𝑚𝑉𝑇 =
𝐼𝑐𝑐
𝐼0+ 1
𝑉𝑚𝑉𝑇
+ 1
(3.42)
É agora possível obter a tensão e a corrente, 𝑉 = 𝑉𝑀𝑃 e 𝐼 = 𝐼𝑀𝑃 que são soluções da equação:
𝑉𝑀𝑃 = 𝑚𝑉𝑇 ln (
𝐼𝑐𝑐
𝐼0+ 1
𝑉𝑀𝑃
𝑚𝑉𝑇+ 1
) (3.43)
𝐼𝑀𝑃 = 𝐼𝑐𝑐 − 𝐼0 (𝑒𝑉𝑀𝑃𝑚𝑉𝑇 − 1) (3.44)
41
A Equação 3.43 pode ser resolvida numericamente de modo a se calcular 𝑉𝑀𝑃, calculando-se 𝐼𝑀𝑃 em
seguida, com a Equação 3.44. Obtém-se então a potência de saída, 𝑃𝑀𝑃:
𝑃𝑀𝑃 = 𝑉𝑀𝑃𝐼𝑀𝑃 (3.45)
As equações acima explicam, teoricamente, como é possível chegar à potência do painel para
determinadas condições de irradiância e temperatura, após o cálculo da irradiância no plano do painel.
Foi assim possível desenvolver um código em MATLAB que, dados os inputs necessários, estima a
produção dos módulos fotovoltaicos, tendo em consideração que existem dois painéis do modelo
LDK-230P-20 e quatro painéis do modelo LDK-235P-20.
3.4 Cálculo da produção eléctrica
De modo a avaliar o desempenho do algoritmo de estimação da produção eléctrica descrito na secção
anterior é necessário comparar os valores estimados com os valores efectivamente produzidos. Apesar
de não existir uma medição directa da electricidade produzida pelos painéis fotovoltaicos, o inversor do
sistema armazena uma grande quantidade de dados operacionais para cada minuto de operação.
Seguindo o método de Paleta et al. [66], é possível estimar a produção eléctrica do sistema de
micro-geração através da Equação 3.46:
𝑃 = 𝐷 − 𝑉𝐵 × 𝐼𝐵 (3.46)
onde 𝐷 (W) é o consumo, que já inclui perdas na distribuição, e 𝑉𝐵 (V) e 𝐼𝐵 (A) são a tensão e
intensidade de corrente das baterias, respectivamente, que já consideram as perdas na conversão
DC/AC no inversor e a eficiência global do sistema de baterias. A expressão acima é apenas uma
aproximação, sendo necessário ter em conta as seguintes limitações: por exemplo, quando não existe
consumo, a potência calculada vai ser nula (pois não há passagem de corrente nas baterias), mesmo
que os painéis estejam a produzir e a carregar as baterias. Como tal, aquando da comparação de
resultados, é necessário uma análise prévia aos valores medidos, por forma a assegurar que estes são
realistas.
Finalmente, tendo em conta que as medições são registadas no inversor, à saída do conjunto de
baterias (Figura 3.2), não é possível distinguir que parte da produção tem origem nos painéis
fotovoltaicos. No entanto, a análise ao PEC revelou que a produção eléctrica da turbina eólica era,
como esperado, bastante reduzida [66]. Tal é suportado pelos valores observados da produção
eléctrica durante o período nocturno, onde toda a produção é da turbina eólica. Assim sendo,
considera-se que apesar de esta aproximação não ser ideal, é uma alternativa viável.
42
4 RESULTADOS OBTIDOS
4.1 Previsão da irradiância
Já existem previsões de irradiância para o local da instalação do PEC, provenientes do modelo MM5,
executado pelo GPNT. O objectivo do desenvolvimento de uma rede neuronal artificial para
pós-processamento das previsões já existentes é diminuir o erro a elas associado. Como tal,
começou-se por analisar o erro das previsões do MM5 sem pós-processamento e, em seguida,
analisou-se a variação desse erro com a utilização de diferentes redes neuronais para
pós-processamento. Deste modo, pretende-se não só quantificar a influência do pós-processamento,
mas também a maneira como os parâmetros da rede neuronal implementada afectam o desempenho
da mesma.
A métrica de comparação utilizada é o RMSE, tal como definido na secção 2.2. A escolha da utilização
desta métrica está relacionada com o facto de esta ser a que melhor representa os custos associados
aos operadores de sistema. Adicionalmente, para algumas comparações também irá ser calculado o
valor do MAE, utilizando a expressão presente na mesma secção.
Visto que os valores de irradiância são normalizados através do índice de claridade, a rede neuronal
está, numa primeira abordagem, a pós-processar previsões do índice de claridade. No entanto, uma
vez que o denominador do índice de claridade muda de caso para caso, comparar erros entre valores
de irradiância e entre valores de índices de claridade tem significados diferentes. Assim sendo, a
análise da influência de diversos parâmetros no desenvolvimento da rede neuronal implementada foi
efectuada com recurso a comparações de previsões do índice de claridade, de modo a reduzir o tempo
despendido em processamento computacional, tendo as análises mais importantes sido feitas com
recurso à comparação da irradiância prevista.
Finalmente, como explicado na metodologia, uma parte dos dados utilizados para o desenvolvimento
da rede neuronal foi utilizada nas etapas de treino e validação. Assim sendo, não se pode recorrer a
estes dados para testar o desempenho da rede, uma vez que foram utilizados no cálculo dos factores
de ponderação e constantes. Por outro lado, os valores pertencentes ao conjunto de dados utilizados
na etapa de teste não afectaram os parâmetros da mesma. Deste modo, todas as comparações
efectuadas e erros calculados cingem-se aos dados de teste. Importa referir que se utilizaram sempre
os mesmos dados de teste, excepto quando mencionado o contrário, de modo a permitir comparações
válidas (nas redes neuronais, tal é garantido pela utilização da função divideint), tendo esses mesmos
dados sido utilizados na análise das previsões sem pós-processamento.
Para as redes neuronais com divisões de dados nas proporções 70/15/15 na fase aprendizagem, dos
2087 pares previsão-medição utilizados na fase de teste, 462 correspondem a pares cujo valor da
medição existe (relembra-se que se incluíram dados de entrada para os quais não existe valor
objectivo), sendo para estes possível calcular o erro obtido.
43
4.1.1 Modelo de previsão numérica
Relativamente às previsões da irradiância do modelo MM5, a distribuição do erro absoluto associado
aos dados utilizados na fase de teste está representada no histograma da Figura 4.1:
Figura 4.1 – Distribuição do erro absoluto do modelo MM5 para os dados do conjunto de teste
Foi também representada a distribuição do erro relativo na previsão numérica da irradiância, como
mostrado na Figura 4.2, calculado através da seguinte expressão:
𝑒𝑟𝑟𝑜 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑜𝑖 =𝐺𝑝𝑟𝑒𝑣𝑖𝑠ã𝑜,𝑖 − 𝐺𝑚𝑒𝑑𝑖çã𝑜,𝑖
𝐺𝑚𝑒𝑑𝑖çã𝑜,𝑖× 100% (4.1)
Como tal, quando apenas a medição ou apenas a previsão são nulas, obtêm-se um erro relativo de +∞
ou de -100%, respectivamente. A coluna mais à direita do histograma, mais larga, representa todos os
erros superiores a 800%, incluindo os erros com medições nulas e previsões não-nulas. Por sua vez,
a coluna mais à esquerda representa os erros para os quais houve uma previsão de irradiância nula
que não se verificou nas medições. Dado que a irradiância é um valor não-negativo, não existem erros
superiores a -100%.
Figura 4.2 – Distribuição do erro relativo do modelo MM5 para os dados do conjunto de teste
44
Através de uma análise aos valores obtidos, constatou-se que o MM5 sobrestimou 312 vezes o valor
da irradiância incidente, tendo subestimado apenas 150 vezes, ou seja, houve um rácio de
sobrestimações para subestimações de aproximadamente 2 para 1. Tal facto tinha sido já mencionado
na literatura acerca do modelo WRF, modelo esse que foi concebido como sucessor do MM5, pelo que
era esperado que esta tendência se verificasse. Além disso, e como pode ser observado na Figura 4.1,
existe uma maior dispersão nos valores sobrestimados: enquanto que o erro absoluto médio das
subestimações é aproximadamente 90,68 W/m2, o das sobrestimações atinge os 283,14 W/m2.
Contudo, deve ser tido em conta que o sensor utilizado para medir a irradiância tem uma incerteza
associada às suas medições.
Avaliou-se em seguida o erro médio das previsões com o conjunto de dados de teste, tendo-se obtido
para o RMSE e para o MAE erros de 291,28 W/m2 e 220,65 W/m2, respectivamente. Através da
normalização destes valores com recurso à irradiância medida média, quantificou-se o nRMSE e o
nMAE, cujos valores foram aproximadamente 101% e 77%, respectivamente.
De modo a avaliar se a amostra utilizada na etapa de teste é uma amostra representativa do conjunto
de total de dados, representou-se na Figura 4.3 a distribuição do erro absoluto das previsões do modelo
MM5 para o conjunto total dos dados utilizados, ou seja, de 1 de Janeiro de 2015 a 30 de Março de
2016.
Figura 4.3 – Distribuição do erro absoluto do modelo MM5 para o conjunto total de dados utilizados
Através da comparação das duas figuras, observou-se que a distribuição é bastante semelhante. Além
disso, os valores dos erros obtidos para o RMSE e para o MAE foram 279,63 W/m2 e 212,43 W/m2,
respectivamente. A normalização destes valores resultou na obtenção de um nRMSE de
aproximadamente 100% e de um nMAE de 76%. A semelhança entre as duas distribuições e entre os
erros calculados apoiou a utilização do conjunto de dados de teste utilizado para avaliar o desempenho
da rede neuronal desenvolvida, validando deste modo a função de divisão de dados escolhida. Por fim,
verificou-se mais uma vez a tendência do MM5 em sobrestimar o valor da irradiância medida, com 2128
sobrestimações e 1089 subestimações, resultando num rácio de aproximadamente 2 para 1, como
constatado no conjunto de dados de teste.
45
4.1.2 Rede neuronal artificial
Utilizando uma rede neuronal com previsões da irradiância, temperatura e humidade relativa, incluindo
também o número de horas adiante de cada previsão, aplicou-se o algoritmo para analisar a influência
do número de neurónios na camada escondida no desempenho da rede. A variação do RMSE da
irradiância prevista com a dimensão da camada escondida está representada na Figura 4.4.
Figura 4.4 – Variação do RMSE da irradiância com o número de neurónios
Por observação da curva na figura acima, pode-se inferir que apesar do erro decrescer
significativamente com o aumento da dimensão da camada escondida para camadas com poucos
neurónios, o seu valor permanece aproximadamente constante a partir dos 20 neurónios. No entanto,
observou-se uma ligeira subida no valor do erro com o aumento do número de neurónios a partir dos
30. Uma análise mais detalhada permitiu concluir que os menores valores médios do RMSE se
encontram concentrados entre os 12 e os 26 neurónios, estando nesse intervalo 7 dos 10 valores
médios de erro mais reduzidos. Como tal, para a análise preliminar da influência dos parâmetros de
entrada, aplicou-se o algoritmo de selecção da topologia da rede até 60 neurónios na camada
escondida. Como referido, as comparações entre o desempenho destas redes foi avaliado comparando
os valores do índice de claridade, ao invés dos valores da irradiância.
Relativamente aos parâmetros de input, foram comparadas 4 redes:
ANN_1 – previsões da irradiância;
ANN_2 – previsões da irradiância e temperatura ambiente;
ANN_3 – previsões da irradiância, temperatura ambiente e humidade relativa;
ANN_4 – previsões da irradiância, temperatura ambiente e humidade relativa e horas adiante
da previsão (rede preliminar, como definido na metodologia).
Os resultados obtidos encontram-se na Figura 4.5, onde se observa que a inclusão progressiva de
parâmetros resulta em erros menores – a rede ANN_1 é a que apresenta pior desempenho, sendo a
rede com menor erro a ANN_4. Tais resultados validam a escolha dos parâmetros utilizados na rede
preliminar. Verificou-se também que não se justifica testar redes neuronais de maiores dimensões, não
existindo variações significativas nos erros a partir dos 14 neurónios.
46
Figura 4.5 – Análise da influência dos parâmetros de input no RMSE do índice de claridade
Utilizando os parâmetros de input que forneceram os melhores resultados (rede ANN_4), analisou-se
a influência da inclusão de previsões para as quais não existem medições, bem como a utilização de
uma função de activação sigmóide na camada de output e outros rácios de divisão de dados na fase
de aprendizagem. Assim sendo, comparou-se a rede ANN_4 com outras 4 redes baseadas nesta:
ANN_5 – utilização exclusiva de valores para os quais existem medições;
ANN_6 – utilização de uma função de activação sigmóide logística na camada de saída;
ANN_7 – divisão dos dados na aprendizagem com rácio de 60/20/20;
ANN_8 – divisão dos dados na aprendizagem com rácio de 80/10/10.
Os resultados obtidos para o desempenho das redes acima mencionadas são apresentados na
Figura 4.6 e na Figura 4.7. A comparação com as redes ANN_7 e ANN_8 não é tão directa como com
as comparações anteriores, uma vez que os dados que pertencem ao conjunto de testes variam,
dado que se alterou os rácios da divisão de dados na fase de aprendizagem.
Figura 4.6 – Análise da inclusão de dados sem valor objectivo e da utilização de uma função sigmóide logística da
camada de output no RMSE do índice de claridade
Verificou-se que a utilização a inclusão dos valores sem medições foi benéfica, uma vez que o
desempenho da rede ANN_4 é ligeiramente superior ao da rede ANN_5. Além disso, é possível
47
constatar que a utilização de uma função de activação sigmóide logística na camada de saída não
altera significativamente os resultados, sendo que o desempenho da rede ANN_6 é semelhante ao da
ANN_4. Analisando as redes ANN_7 e ANN_8, verificou-se que os valores obtidos de erro foram
ligeiramente superiores para a rede ANN_7 e inferiores para a rede ANN_8.
Figura 4.7 – Análise da influência do rácio de divisão na fase de aprendizagem no RMSE do índice de claridade
Considerando que a rede ANN_8 aparentou ter melhor desempenho que a rede ANN_4, calculou-se a
variação do RMSE da irradiância prevista com a dimensão da camada escondida para a rede ANN_8.
Deste modo, foi possível comparar o desempenho das duas redes relativamente ao erro na irradiância
prevista. No entanto, relembra-se que a comparação não é directa, uma vez que os dados utilizados
em cada etapa da fase de testes são diferentes. Na Figura 4.8 apresentam-se os resultados obtidos
para as redes ANN_4 e ANN_8, comparativamente aos valores do RMSE das previsões do MM5 sem
pós-processamento, para ambos os conjuntos de dados de teste: MM5_1 corresponde ao conjunto com
rácio de divisão 70/15/15 e MM5_2 ao conjunto com rácio de divisão 80/10/10 (estes valores são
representados apenas para comparação, sendo constantes e não estando associados à utilização de
redes neuronais).
Figura 4.8 – Comparação do RMSE da irradiância pós-processada com as previsões do MM5
48
Na figura acima fica explícito que o pós-processamento utilizado reduz o erro das previsões.
Quantitativamente, a melhor rede ANN_4 reduziu o erro do MM5_1 em aproximadamente 50,84 W/m2,
correspondente a 17,5% do valor sem pós-processamento, sendo que a melhor rede ANN_8 representa
uma diminuição de 51,81 W/m2 do erro do MM5_2, correspondente a 19,0%. Assim sendo, os
resultados indicam que a utilização de uma rede neuronal para pós-processamento consegue de facto
reduzir o erro associado às previsões originais.
Finalmente, de modo a se analisar o impacto no desempenho das alterações efectuadas relativamente
a uma rede padrão, executaram-se redes com todas as definições padrão do MATLAB. No então, por
uma questão de comparação, dividiram-se os dados na fase de aprendizagem com a função divideint,
por forma a garantir que os dados do conjunto de teste são os mesmos.
Foram criadas então duas redes, ANN_9 e ANN_10, com rácios de divisão na fase de aprendizagem
de 70/15/15 e 80/10/10, respectivamente, por forma a comparar os resultados destas redes com os
resultados obtidos pelas redes ANN_4 e ANN_8. A variação do RMSE obtido para cada uma das redes
neuronais está representado na Figura 4.9.
Figura 4.9 – Comparação do RMSE do índice de claridade entre as redes desenvolvidas e redes padrão
Através da comparação com redes neuronais cujas funções são maioritariamente as funções padrão,
é possível quantificar quão relevantes se tornam as modificações efectuadas. As curvas acima
demonstram que, apesar de se terem obtido erros menores com as redes modificadas, a diminuição
não é significativa. Isto é, as redes ANN_4 e ANN_8 têm um desempenho marginalmente superior ao
das redes ANN_9 e ANN_10, respectivamente. É ainda importante referir que, apesar de as variáveis
de entrada para as redes serem normalizadas, nas redes ANN_9 e ANN_10 estas são de novo
normalizadas por defeito no intervalo de -1 a 1. Isto torna a sua gama coerente com a função de
activação utilizada por defeito nas camadas escondidas, que é a função tangente hiperbólica sigmóide.
Um resumo dos parâmetros e funções utilizadas em cada rede, assim como o seu melhor resultado,
apresentam-se em seguida na Tabela 4.1. Refere-se que os parâmetros em que foram mantidas as
definições padrão não são apresentados na tabela; destes, destaca-se o algoritmo de aprendizagem
utilizado – o algoritmo de Levenberg-Marquardt – e a função de performance – que se define com o
cálculo do RMSE.
49
Tabela 4.1 – Redes neuronais testadas na análise preliminar
Modelo Inputs1 Dados sem
medição Normalização
Funções de
activação2
Função de
divisão
Rácio de
divisão
Nº de
validações
Nº de
neurónios3
RMSE médio do
índice de claridade3
MM5 + ANN_1 𝐺 Incluídos 𝑘𝑡 CE: logsig
CO: purelin divideint 70/15/15 10 52 0,1354
MM5 + ANN_2 𝐺, 𝑇 Incluídos 𝑘𝑡 para 𝐺
0 a 1 para 𝑇
CE: logsig
CO: purelin divideint 70/15/15 10 14 0,1294
MM5 + ANN_3 𝐺, 𝑇, 𝐻𝑅 Incluídos 𝑘𝑡 para 𝐺
0 a 1 para as restantes
CE: logsig
CO: purelin divideint 70/15/15 10 33 0,1271
MM5 + ANN_4 𝐺, 𝑇. 𝐻𝑅, 𝐻𝐴 Incluídos 𝑘𝑡 para 𝐺
0 a 1 para as restantes
CE: logsig
CO: purelin divideint 70/15/15 10 19 0,1106
MM5 + ANN_5 𝐺, 𝑇. 𝐻𝑅, 𝐻𝐴 Não incluídos 𝑘𝑡 para 𝐺
0 a 1 para as restantes
CE: logsig
CO: purelin divideint 70/15/15 10 15 0,1131
MM5 + ANN_6 𝐺, 𝑇. 𝐻𝑅, 𝐻𝐴 Incluídos 𝑘𝑡 para 𝐺
0 a 1 para as restantes
CE: logsig
CO: logsig divideint 70/15/15 10 18 0,1109
MM5 + ANN_7 𝐺, 𝑇. 𝐻𝑅, 𝐻𝐴 Incluídos 𝑘𝑡 para 𝐺
0 a 1 para as restantes
CE: logsig
CO: purelin divideint 60/20/20 10 18 0,1136
MM5 + ANN_8 𝐺, 𝑇. 𝐻𝑅, 𝐻𝐴 Incluídos 𝑘𝑡 para 𝐺
0 a 1 para as restantes
CE: logsig
CO: purelin divideint 80/10/10 10 21 0,1042
MM5 + ANN_9 𝐺, 𝑇. 𝐻𝑅, 𝐻𝐴 Incluídos
𝑘𝑡 para 𝐺
0 a 1 para as restantes
-1 a 1 (mapminmax)
CE: tansig
CO: purelin divideint 70/15/15 6 16 0,1130
MM5 + ANN_10 𝐺, 𝑇. 𝐻𝑅, 𝐻𝐴 Incluídos
𝑘𝑡 para 𝐺
0 a 1 para as restantes
-1 a 1 (mapminmax)
CE: tansig
CO: purelin divideint 80/10/10 6 41 0,1061
1 𝑮 – Irradiância; 𝑻 – Temperatura; 𝑯𝑹 – Humidade Relativa; 𝑯𝑨 – Horas Adiante 2 CE – Camada Escondida; CO – Camada de output 3 Para a rede com melhor desempenho
50
4.1.3 Resultados do pós-processamento
Considerando que o principal objectivo do pós-processamento é diminuir o erro associado às previsões
da irradiância, esse é o principal parâmetro de comparação. Assim, apresentam-se os valores do RMSE
e do MAE da irradiância obtidos para as previsões do MM5, que são constantes, e os melhores
resultados médios das previsões do MM5 processadas com duas redes neuronais diferentes. No
entanto, no desenvolvimento da rede neuronal a implementar, recorreram-se a algumas comparações
do erro na previsão do índice de claridade. Por forma a comparar o desempenho de todas as redes
testadas com as previsões do MM5, calculou-se também o erro na previsão do índice de claridade do
MM5. Os resultados de ambos os erros obtidos encontram-se na Tabela 4.2. Os resultados de modelos
com pós-processamento apresentados correspondem aos valores médios obtidos com a rede neuronal
de melhor desempenho médio. Além disso, excepto quando indicado em contrário, os resultados
obtidos foram calculados utilizando os dados de teste com rácio de divisão de dados 70/15/15.
Tabela 4.2 – Erros obtidos com os vários modelos de pós-processamento
Modelo RMSE da
irradiância (W/m2)
MAE da irradiância
(W/m2)
RMSE do índice de
claridade
Redução do
RMSE do índice
de claridade (%)
MM5 291,28 / 273,281 220,65 / 209,511 0,2038 / 0,19491/ 0,20432 -
MM5 + ANN_1 - - 0,1354 33,6
MM5 + ANN_2 - - 0,1294 36,5
MM5 + ANN_3 - - 0,1271 37,6
MM5 + ANN_4 240,44 207,78 0,1106 45,7
MM5 + ANN_5 - - 0,1131 44,5
MM5 + ANN_6 - - 0,1109 45,6
MM5 + ANN_7 - - 0,11362 44,42
MM5 + ANN_8 221,471 184,551 0,10421 46,51
MM5 + ANN_9 - - 0,1130 44,5
MM5 + ANN_10 - - 0,10611 45,61
1Dados de teste com divisão 80/10/10 2Dados de teste com divisão 60/20/20
O resultado mais relevante obtido pela análise feita às diversas redes neuronais de pós-processamento
é que o parâmetro mais importante a tomar em consideração é a selecção das variáveis de entradas,
uma vez que é entre as redes ANN_1, ANN_2, ANN_3 e ANN_4 que se observa maior diminuição no
RMSE do índice de claridade. Além disso, deve ser salientado que a inclusão do número de horas
adiante de cada previsão contribuiu para reduzir o erro na previsão do índice de claridade em
aproximadamente 8,1%. Verificou-se que a inclusão de dados de entrada para os quais não existem
51
valores objectivo tem uma ligeira influência no erro obtido, existindo uma variação de 1,2% na redução
do RMSE do índice de claridade entre a utilização das redes ANN_4 e ANN_5. Observou-se também
que a utilização de uma função sigmóide logística na camada de saída (ANN_6), em vez de uma função
linear, não afectou os resultados obtidos.
Adicionalmente, é possível apontar que a variação do rácio de divisão de dados na fase de
aprendizagem afecta o valor do erro obtido. No entanto, relembra-se que a alteração deste parâmetro
impede uma comparação directa entre redes, uma vez que os dados utilizados na fase de teste não
são os mesmos. Neste sentido, a redução no RMSE foi calculada com base nos diferentes valores
obtidos pelo modelo MM5 sem pós-processamento, por forma a facilitar a comparação. Verificou-se
que esta redução era tanto maior quanto menor fosse a percentagem de dados utilizados na etapa de
teste, ou seja, quanto maior fosse a percentagem de dados utilizados na etapa de treino, dado que o
desempenho da rede ANN_4 foi superior ao da ANN_7, mas inferior ao da ANN_8. Assim sendo, tanto
a ANN_4, como a rede ANN_8, foram analisadas em maior detalhe.
Finalmente, verificou-se que o pós-processamento das previsões com recurso a redes neuronais com
as funções utilizadas por defeito teve um erro associado semelhante ao pós-processamento resultante
das redes neuronais alteradas. Tal é suportado pelo desempenho semelhante entre as redes ANN_4 e
ANN_9, e entre as redes ANN_8 e ANN_10, onde as redes customizadas tiveram um desempenho
superior por apenas 0,2% e 0,1%, respectivamente, face às redes padrão correspondentes.
Por um lado, os resultados obtidos indicam que o pós-processamento de previsões do índice de
claridade pode ser efectuado com recurso a redes neuronais que utilizam as funções por defeito do
MATLAB, dado que as alterações às funções de transferência, às funções de pré-processamento e ao
número de validações não tiveram impacto significativo na redução do RMSE associado. Por outro
lado, é necessário referir que, caso se opte por alterar estas funções, terá que se ser coerente. Isto é,
a utilização da função de pré-processamento por defeito, mapminmax, normaliza os dados de entrada
na gama de valores de -1 a 1, sendo esta gama coerente com a função de transferência por defeito
utilizada nos neurónios da camada escondida, a tangente hiperbólica sigmóide. Uma normalização de
-1 a 1, juntamente com a utilização de uma função logística sigmóide, não seria coerente e poderia
resultar em erros superiores.
Como foi mencionado, as redes neuronais com melhor desempenho na análise preliminar do
pós-processamento de previsões do índice de claridade foram as redes ANN_4 e ANN_8, utilizando 19
e 21 neurónios na camada escondida, respectivamente. Como tal, analisou-se o erro obtido no
pós-processamento de previsões de irradiância para estas duas redes, onde os menores valores
médios obtidos foram para redes neuronais com 25 e 24 neurónios na camada escondida,
respectivamente. Utilizaram-se essas dimensões para se calcularem os erros no pós-processamento
da irradiância e do índice de claridade para estas duas redes, estando os resultados apresentados na
Tabela 4.3.
Analisando o RMSE e o MAE obtidos nas previsões do MM5 sem pós-processamento, verificou-se que
o RMSE era consideravelmente superior ao MAE, o que indica a presença de alguns erros bastante
superiores à média. Tal também tinha sido constatado na análise à Figura 4.1.
52
Uma das conclusões mais importantes prende-se com as diferenças entre a análise aos erros da
irradiância e aos erros do índice de claridade, uma vez que se verificou que as reduções eram
significativamente diferentes, ou seja, enquanto que o RMSE da irradiância diminuiu entre 17,3% a
19,4%, o RMSE do índice de claridade diminuiu quase 50%.
Tabela 4.3 – Comparação de resultados para as melhores redes neuronais
Modelo MM5 MM5 + ANN_4 MM5 + ANN_81
RMSE da irradiância (W/m2) 291,28 / 273,281 240,88 220,32
Redução no RMSE (%) 0 17,3 19,4
MAE da irradiância (W/m2) 220,65 / 209,511 201,39 182,74
Redução no MAE (%) 0 8,73 12,8
RMSE do índice de claridade 0,2038 / 0,19491 0,1090 0,1034
Redução do RMSE do índice de claridade (%) 0 46,5 47,0
1Dados de teste com divisão 80/10/10
Verificou-se que a rede definida com os parâmetros da ANN_8 foi a apresentou melhores resultados,
tanto na redução do RMSE e MAE da irradiância, como na redução do RMSE do índice de claridade,
tendo-se portanto implementado esta rede, sendo que se utilizou o código da rede com a qual os
resultados tabelados foram obtidos.
A rede neuronal artificial implementada tem como entrada 4 variáveis: a previsão da irradiância, da
temperatura ambiente e da humidade relativa, e o número de horas adiante da previsão, todas estas
devidamente normalizadas. Esses inputs são ponderados e processados numa única camada
escondida, composta por 24 neurónios que utilizam a função logística sigmóide como função de
transferência. Os valores de saída de cada neurónio são ponderados e fornecidos ao neurónio na
camada de saída, que os processa com recurso a uma função de transferência linear, fornecendo assim
um único parâmetro de saída, correspondente à previsão pós-processada do índice de claridade, a
partir do qual se calcula o valor da irradiância horizontal global incidente. Os factores de ponderação
(𝑤) e constantes (𝑏) associados a cada camada da rede desenvolvida são apresentados em anexo.
4.1.4 Previsão da irradiância diária
Para avaliar a influência do pós-processamento nas previsões ao longo de um dia, avaliaram-se alguns
dias completos, comparando assim as previsões para um, dois e três dias adiante do MM5 com e sem
pós-processamento com os valores de irradiância medidos. Importa salientar que os dias apresentados
não fizeram parte dos dias utilizados na fase de aprendizagem, por forma a não comprometer os
resultados. Porém, como foi referido, não existiam medições para muitos dias completos, sendo que
se tentou aproveitar a maioria destes para o desenvolvimento da rede neuronal. Relembra-se que as
medições têm uma resolução temporal de 15 minutos e as previsões de uma hora, e que para o primeiro
dia adiante as previsões começam a partir das 12 horas.
53
Começaram por se comparar três dias diferentes, cada dia para um horizonte temporal diferente.
Apresentam-se os dias 11 de Agosto, 31 de Outubro e 29 de Setembro de 2015, para 1, 2 e 3 dias
adiante, na Figura 4.10, na Figura 4.11 e na Figura 4.12, respectivamente.
Adicionalmente, para se tentar avaliar a influência do horizonte temporal nas previsões efectuadas,
compararam-se os resultados obtidos para o mesmo dia para os três horizontes considerados. Devido
à esperada variação de desempenho dos modelos de previsão para condições de céu diferentes, esta
avaliação foi feita para um dia de céu limpo, 8 de Agosto de 2015 (Figura 4.13, Figura 4.14 e Figura
4.15), e para um dia de céu parcialmente coberto, com condições de nebulosidade variáveis, dia 18 de
Janeiro de 2016 (Figura 4.16, Figura 4.17 e Figura 4.18).
A irradiância comparada nas figuras é a irradiância global no plano dos painéis fotovoltaicos, cujo
cálculo foi efectuado aplicando a metodologia descrita na subsecção 3.3.1 às previsões da irradiância
horizontal global.
É importante mencionar que, aquando da comparação entre valores de irradiância previstos e valores
de irradiância medidos, se deve ter em consideração duas fontes de incerteza não associadas ao erro
do modelo previsão: uma delas relacionada com a incerteza de medição da irradiância global no plano
dos painéis, pelo Sunny SensorBox, e a outra decorrente da utilização de equações aproximadas, no
cálculo da irradiância global no plano dos painéis com base na irradiância global horizontal prevista.
Apesar disso, a fonte de erro predominante é a associada à incerteza nos valores previstos, com e sem
pós-processamento.
Figura 4.10 – Irradiância prevista para o dia 11 de Agosto de 2015, 1 dia adiante
54
Figura 4.11 – Irradiância prevista para o dia 31 de Outubro de 2015, 2 dias adiante
Figura 4.12 – Irradiância prevista para o dia 29 de Setembro de 2015, 3 dias adiante
Figura 4.13 – Irradiância prevista para o dia 8 de Agosto de 2015, 1 dia adiante
55
Figura 4.14 – Irradiância prevista para o dia 8 de Agosto de 2015, 2 dias adiante
Figura 4.15 – Irradiância prevista para o dia 8 de Agosto de 2015, 3 dias adiante
Figura 4.16 – Irradiância prevista para o dia 18 de Janeiro de 2016, 1 dia adiante
56
Figura 4.17 – Irradiância prevista para o dia 18 de Janeiro de 2016, 2 dias adiante
Figura 4.18 – Irradiância prevista para o dia 18 de Janeiro de 2016, 3 dias adiante
Antes de se analisarem as previsões nas figuras acima, constatou-se por observação da irradiância
medida em cada dia que todos os dias tiveram uma distribuição relativamente uniforme da irradiância,
excepto os dias 31 de Outubro de 2015 e 18 de Janeiro de 2016. Estes dias apresentam curvas com
várias inflexões e variações abruptas, que podem ser explicadas pela passagem de nuvens no céu, por
exemplo. Uma vez que as previsões do MM5 não apresentavam grande parte destas variações, muito
dificilmente estas seriam estimadas com a rede neuronal artificial, tendo em conta que o
pós-processamento utilizado tem como principal vantagem a redução de erros sistemáticos, não sendo
esse o caso em questão. Além disso, o facto de a resolução temporal das previsões ser horária limita
a capacidade de acompanhamento da curva de irradiância quando esta varia abruptamente. Tal facto
deve ser tido em conta na análise de dias cuja variabilidade é elevada. Mesmo assim, analisando as
previsões a 2 dias adiante para 18 de Janeiro de 2016, verificou-se que a previsão do MM5 conseguiu
capturar o primeiro pico, tendo subestimado os valores seguintes. Contrariamente, o modelo com
pós-processamento subestimou o primeiro pico, tendo no entanto sobrestimado o segundo.
Decorrente da análise das figuras anteriores, observaram-se certas tendências, ou seja,
comportamentos semelhantes em vários dias. Nomeadamente, verificou-se que nos dias em que há
57
previsões matinais o MM5 sobrestimou consideravelmente a irradiância nesse período, algo
especialmente notório nas previsões para dia 8 de Agosto de 2015, tendência essa que foi parcialmente
corrigida com a utilização da rede neuronal. Porém, nesses mesmos casos, constatou-se que a
previsão pós-processada reduziu o valor sobrestimado em demasia, resultando assim numa
subestimação do valor medido, sendo essa subestimação mais próxima da medição do que a previsão
original para a maioria dos casos.
A outra tendência mais evidente é a sobrestimação do pico da irradiância por parte do modelo com
pós-processamento. Observou-se, no entanto, que apenas em três dos casos analisados é que a
sobrestimação do modelo com pós-processamento é expressivamente superior à do MM5. Este
comportamento está especialmente acentuado na Figura 4.16, onde a previsão pós-processada é
claramente pior do que a previsão do MM5. Verificou-se ainda que o pós-processamento teve a
tendência de desviar para a direita a previsão do pico da irradiância, isto é, prevendo valores máximos
a ocorrerem mais tarde do que nas previsões do MM5.
Quanto à parte final do dia, constatou-se que, no geral, tanto as previsões do MM5, como as previsões
processadas pela rede neuronal seguem razoavelmente os valores medidos, sendo que o modelo com
melhor aproximação aparente varia de caso para caso. Destacam-se as previsões para 2 e 3 dias
adiante, no dia 8 de Agosto, onde as previsões processadas pela rede neuronal são praticamente
coincidentes com os valores medidos.
Adicionalmente, verificou-se a existência de erros pontuais na irradiância pós-processada,
nomeadamente às 10h do dia 29 de Setembro, onde o valor obtido foi nulo, apesar do valor previso
pelo MM5 ter sido de aproximadamente 400 W/m2. Porém, é importante salientar que não se devem
tirar conclusões directas, dado que o valor previsto com recurso à rede neuronal tem em conta outros
parâmetros para além da irradiância prevista. Mesmo assim, considerou-se que o erro apontado está
associado a limitações particulares do modelo, relacionadas com a normalização da irradiância prevista
através do índice de claridade, uma vez que se verificou a existência alguns valores superiores à
unidade, apesar de tal situação não ter acontecido com frequência significativa. Esta limitação
verificou-se mais frequente para dias com valores de irradiância elevados, por exemplo no Verão, sendo
que pode estar também associado à sobrestimação dos valores máximos da irradiância.
Por fim, analisando as previsões para os dias 8 de Agosto de 2015 e 18 de Janeiro de 2016, foi difícil
tirar conclusões quanto à influência do horizonte temporal das previsões. Verificou-se que os valores
pós-processados aparentam estar mais próximo dos reais para o horizonte temporal de 1 dia adiante
no dia 8 de Agosto. Apesar destes não seguirem tão bem as medições no final da tarde, relativamente
aos outros dois horizontes, o pico da irradiância é significativamente mais bem previsto. Além disso,
mesmo não se tendo os valores matinais, os valores previstos no início da tarde estão bastante mais
próximos dos medidos, não existindo uma subestimação tão acentuada como a verificada nos outros
horizontes. Observou-se ainda uma diferença significativa na incerteza das previsões do MM5 para o
dia 18 de Janeiro, entre as previsões para um dia adiante e as restantes, sendo que as primeiras estão
claramente mais próximas dos valores de irradiância medidos. Para este dia, as previsões
pós-processadas apresentam pior desempenho para o horizonte temporal mais curto, devido à
excessiva sobrestimação relativamente aos valores medidos.
58
De forma se quantificar a influência do pós-processamento nas previsões da irradiância, calcularam-se
os valores do RMSE e MAE para os todos os horizontes temporais das previsões para os dias
apresentados, bem como os seus valores normalizados com a irradiância média medida nesse dia,
nRMSE e nMAE, respectivamente. Os resultados obtidos encontram-se apresentados na Tabela 4.4.
Estes erros foram calculados utilizando apenas as horas para as quais a irradiância tinha valores
não-nulos.
A análise aos valores obtidos permitiu tirar algumas conclusões:
Para as previsões 1 dia adiante, o modelo com pós-processamento diminui em 2 casos o
nRMSE, e em 1 o nMAE, implicando isto que para os 5 dias estudados o modelo MM5 previu
melhor a irradiância para um horizonte temporal de 1 dia adiante;
O valor médio do nRMSE para este horizonte temporal foi de 68,4% e 123,9%, para os modelos
MM5 e MM5 + ANN, respectivamente. No entanto, caso se exclua do modelo com
pós-processamento o dia 18 de Janeiro de 2016, em que a irradiância foi extremamente
sobrestimada, o valor médio do nRMSE é de 84,0%. Os valores médios do nMAE foram 51,2%
e 85,5%, para os modelos sem e com pós-processamento, respectivamente. Mais uma vez,
excluindo o valor extremo para o modelo MM5 + ANN, o nMAE médio obtido é 60,0%;
Nos casos com previsões 2 dias adiante, o nRMSE diminui 3 vezes e o nMAE diminui 4 vezes,
comparando o modelo com pós-processamento com o modelo MM5;
Os valores médios obtidos para 2 dias adiante do nRMSE e nMAE para o modelo MM5 foram
82,9% e 60,7%, respectivamente, sendo que para o modelo MM5 + ANN os valores médios
obtidos foram 68,5% e 44,4%, respectivamente;
Para o horizonte temporal de 3 dias adiante, os dias estudados foram sempre mais bem
previstos pelo modelo MM5 + ANN, tanto relativamente ao nRMSE, como ao nMAE;
Considerando este horizonte temporal, os valores médios do nRMSE e nMAE para o modelo
MM5 foram 85,1% e 61%, respectivamente, e 58,0% e 50,5% para o modelo MM5 + ANN;
Relativamente aos valores médios para os 3 horizontes temporais estudados, obteve-se um
nRMSE e um nMAE médio de 78,8% e 57,6% para o modelo MM5, tendo esses valores sido
reduzidos para 69,2% e 47,4% no modelo MM5 + ANN, respectivamente, caso se exclua para
este modelo a previsão com erro desproporcional;
Considerando os dias 31 de Outubro de 2015 e 18 de Janeiro de 2016 como dias encobertos
e os restantes dias como dias com céu limpo, observou-se que o modelo MM5 + ANN reduziu
o nRMSE em 3 dos 6 casos em dias encobertos, e em 7 dos 9 casos para dias de céu limpo,
Em suma, para os 5 dias analisados, a utilização da rede neuronal para processar as previsões do
modelo MM5 verificou-se benéfica para os horizontes temporais maiores, de 2 e 3 dias adiante, sendo
que as previsões do modelo MM5 para 1 dia adiante foram, em média, melhores. Além disso,
verificou-se que para os casos de previsões 1 dia adiante em que o pós-processamento diminuiu o
erro, esta diminuição não foi significativa. Finalmente, o modelo com pós-processamento revelou-se
especialmente útil para dias de céu limpo. Apesar de se ter dito que métodos de aprendizagem são
particularmente úteis para situações pouco lineares, como a previsão da irradiância em dias nublados,
59
o seu melhor desempenho em dias de céu limpo era expectável, pois é nestes dias que, dada a
distribuição mais uniforme da irradiância, a sua previsão tem erros associados menores.
Tabela 4.4 – Comparação dos erros obtidos com e sem pós-processamento para dias seleccionados
Dia Horizonte
temporal1 Modelo
RMSE da
irradiância (W/m2)
nRMSE
(%)
MAE da
irradiância (W/m2)
nMAE
(%)
11/08/2015
1 DA MM5 171,06 47,22 128,45 35,46
MM5 + ANN 268,71 74,18 203,48 56,17
2 DA MM5 307,05 84,76 225,24 62,18
MM5 + ANN 138,99 38,37 109,63 30,26
3 DA MM5 303,74 83,85 222,48 61,42
MM5 + ANN 210,10 58,00 160,70 44,36
31/10/2015
1 DA MM5 349,37 147,34 264,03 111,35
MM5 + ANN 314,97 132,83 211,87 89,35
2 DA MM5 199,65 84,20 141,76 59,79
MM5 + ANN 209,35 88,29 129,41 54,58
3 DA MM5 257,55 108,62 173,91 73,34
MM5 + ANN 207,06 87,32 141,51 59,68
29/09/2015
1 DA MM5 234,52 77,69 167,33 55,43
MM5 + ANN 289,71 95,97 198,21 65,66
2 DA MM5 272,90 90,40 202,07 66,94
MM5 + ANN 162,99 53,99 117,04 38,77
3 DA MM5 274,32 90,87 203,28 67,34
MM5 + ANN 183,73 60,87 128,99 42,73
08/08/2015
1 DA MM5 143,01 33,57 113,32 28,18
MM5 + ANN 133,01 33,08 115,86 28,81
2 DA MM5 256,29 63,73 204,07 50,75
MM5 + ANN 140,41 34,92 121,41 30,19
3 DA MM5 245,10 60,95 195,29 48,57
MM5 + ANN 158,91 39,52 105,19 26,16
18/01/2016
1 DA MM5 81,33 36,10 57,55 25,54
MM5 + ANN 638,93 283,58 442,79 187,64
2 DA MM5 205,38 91,16 143,49 63,69
MM5 + ANN 285,54 126,73 153,38 68,08
3 DA MM5 182,66 81,07 122,11 54,20
MM5 + ANN 99,51 44,17 66,16 29,36
1 DA – Dia(s) Adiante
Analisando o nRMSE associado às previsões do modelo MM5, bem como as figuras respectivas,
aferiu-se que para apenas uma das previsões de céu limpo é que o nRMSE foi inferior aos 40%
60
sugeridos na literatura como um valor máximo expectável. Além disso, também apenas uma das
previsões em dias de céu nublado se enquadrou na gama de valores pretendida. Considerando os
valores obtidos, bem como analisando as figuras respectivas, verificou-se que as previsões do modelo
MM5 têm erros, na sua maioria, excessivamente elevados. Tal é suportado pelos valores médios do
nRMSE e do nMAE calculados para o conjunto total de dados utilizados, de 100% e 76%,
respectivamente. A magnitude destes erros é indicadora de limitações no desempenho do modelo
MM5, frequentemente associado às sobrestimações da irradiância matinal.
Relativamente às previsões do modelo MM5 + ANN para os dias de céu limpo estudados, verificou-se
que o nRMSE se situa entre 33,1% e 96,0%. Apesar desta gama de valores contemplar erros
excessivamente elevados para dias de céu limpo, verificou-se na análise às figuras que estes são
devidos à sobrestimação do pico da irradiância. Considerou-se que, excepto quando tal acontece, as
previsões estão bastante próximas dos valores medidos, com um erro que se enquadra com os valores
encontrados na literatura [38]. Dado que o problema da sobrestimação do pico da irradiância se
verificou em todos os dias apresentados, uma análise cuidada às suas causas ou uma afinação nos
valores de saída da rede neuronal poderá trazer previsões menos incertas. Para os dois dias nublados
que foram analisados, este modelo teve um nRMSE que variou entre 44,2% e 283,6%. Excluindo mais
uma vez a previsão para 1 dia adiante de 18 de Janeiro de 2016, o nRMSE máximo verificado foi de
132,8%. De qualquer das formas, consideram-se os valores obtidos excessivos, uma vez que é
indicado na literatura que erros na ordem dos 40% a 80% em dias nublados são expectáveis. Assim
sendo, constatou-se que o modelo MM5 + ANN não teve bom desempenho na maioria das previsões
em dias nublados.
Verificou-se então que, apesar de numa perspectiva global a utilização da rede neuronal desenvolvida
para pós-processamento de previsões de irradiância do modelo MM5 diminuir o erro associado a estas,
uma vez que o RMSE médio calculado para o conjunto de dados de teste diminui em 19,4%, tal não
acontece para todas as situações. Os erros excessivamente grandes encontrados estão, em parte,
associados às limitações das previsões do modelo MM5. A análise aos valores do nRMSE para o MM5
confirmou o observado nas figuras apresentadas, isto é, a existência de erros significativamente
elevados nas previsões de irradiância do MM5, inclusive em dias de céu limpo. Este modelo apresentou
erros persistentes e sistemáticos, que, contrariamente ao esperado, a rede neuronal não conseguiu
corrigir. Não seria expectável, no entanto, que a utilização de pós-processamento conseguisse reduzir
o erro associado a todas as previsões, até porque uma das tendências observadas nas previsões do
modelo MM5 foi parcialmente corrigida. Porém, a existência de tendências no modelo MM5 + ANN nos
dias analisados, como a sobrestimação do pico da irradiância, são indicadores que o seu desempenho
não é o ideal. A inclusão de mais valores objectivo na fase de aprendizagem da rede, ou seja, medições
da irradiância no plano dos painéis, poderá ajudar a melhorar o desempenho da rede neuronal no
pós-processamento de previsões, mesmo considerando o facto de se ter garantido que a gama dos
valores existente era aceitável. Por fim, é importante ter em conta que existe uma incerteza não
quantificada no valor das medições da irradiância, o que implica que todos os erros foram calculados
relativamente a um valor que difere do real.
61
4.2 Estimativa da produção eléctrica
Após se obter a irradiância prevista, é então possível estimar a produção eléctrica do sistema de
micro-geração existente, utilizando a metodologia descrita na secção 3.3. Por forma a avaliar o
desempenho da metodologia utilizada, recorreu-se a uma aproximação através de valores medidos
pelo inversor do sistema, tendo-se aplicado a equação apresentada na secção 3.4.
Para além das fontes de incerteza relacionadas com a previsão da irradiância global no plano dos
painéis, mencionadas anteriormente, apontam-se quatro fontes principais de incerteza na estimação
da produção eléctrica do sistema analisado:
1. Incerteza na estimação da produção eléctrica, relacionada com a utilização de um modelo
simplificado, o modelo de um díodo e três parâmetros;
2. Incerteza da medição dos parâmetros medidos pelo inversor;
3. Incerteza na estimação da potência medida, resultante do uso de uma expressão aproximada
com recurso aos parâmetros medidos pelo inversor e que engloba a energia produzida pela
turbina eólica;
4. Utilização de temperaturas previstas, uma vez que não existem medições da mesma.
Nesta secção pretendeu-se avaliar a precisão no cálculo da potência produzida pelo sistema com base
em valores de irradiância e temperatura. Assim, de forma se conseguir quantificar a incerteza associada
a este cálculo, aplicou-se a metodologia previamente descrita à irradiância medida (relembra-se que é
medida com o Sunny SensorBox), eliminando assim a incerteza associada à previsão da irradiância
global no plano dos painéis. De qualquer modo, apresentam-se também as curvas da potência
estimada com base nos valores da irradiância previstos.
Apresentam-se então os valores de potência estimados para três dias diferentes: 8 de Agosto de 2015,
para os 3 horizontes temporais (Figura 4.19, Figura 4.20 e Figura 4.21), de modo a se comparar com
as curvas da irradiância apresentadas anteriormente, 15 de Agosto de 2015 (Figura 4.22), por ter sido
um dia com elevada variabilidade na irradiância, e 26 de Setembro de 2015 (Figura 4.23), onde se
verificou uma grande discrepância nos valores estimados.
Figura 4.19 – Potência produzida para o dia 8 de Agosto de 2015, com previsões 1 dia adiante
62
Figura 4.20 – Potência produzida para o dia 8 de Agosto de 2015, com previsões 2 dias adiante
Figura 4.21 – Potência produzida para o dia 8 de Agosto de 2015, com previsões 3 dias adiante
Figura 4.22 – Potência produzida para o dia 15 de Agosto de 2015, com previsões 2 dias adiante
63
Figura 4.23 – Potência produzida para o dia 26 de Setembro de 2015, com previsões 2 dias adiante
Observou-se em todas as figuras apresentadas que a potência estimada com base em medições no
inversor segue uma distribuição semelhante à da irradiância incidente medida pela Sunny SensorBox,
exceptuando para o dia 26 de Setembro de 2015.
Primeiramente, a forma da distribuição da potência, aliada ao facto de não se ter verificado produção
eléctrica significativa no período nocturno, ajuda a validar a hipótese de se desprezar a influência da
turbina eólica na produção total do sistema. No entanto, tal facto pode ser devido ao perfil de consumo
do laboratório durante a noite, ou seja, não é garantido que estivessem efectivamente equipamentos
ligados a consumir electricidade, algo que é necessário para a estimação da potência.
Em segundo, observando-se as curvas para o dia 8 de Agosto, com enfoque nas curvas relacionadas
com o modelo MM5 + ANN (por ser a que apresenta mais variações), verificou-se que a distribuição da
potência acompanha a distribuição da irradiância em todas as suas inflexões, como era esperado.
Comparando os valores estimados através de parâmetros medidos pelo inversor com a aplicação do
modelo de um díodo e 3 parâmetros à irradiância medida, para os dias 8 e 15 de Agosto, verificou-se
que as curvas estão bastante próximas. Estes dois dias representam duas condições de nebulosidade
diferentes, sendo que no segundo se observou que a potência medida acompanha aproximadamente
as variações da potência estimada pela irradiância medida. Uma vez que se tratam as duas curvas de
medições, não se esperava que as condições de nebulosidade afectassem os resultados.
Na Tabela 4.5 apresentam-se os erros associados a cada uma das curvas anteriores. Os valores do
RMSE e do MAE foram normalizados com recurso à potência média medida pelo inversor, de modo a
se calcularem o nRMSE e o nMAE, respectivamente. Relembra-se que o objectivo do cálculo destes
erros não é comparar os diferentes modelos, mas sim quantificar a incerteza na estimação da produção
eléctrica. Assim, apesar de terem sido incluídos os erros para as previsões dos modelos MM5 e
MM5 + ANN, estes não têm especial relevância.
64
Tabela 4.5 – Comparação dos erros obtidos na estimação da potência
Dia Modelo/sensor1 RMSE (W) nRMSE (%) MAE (W) nMAE (%)
08/08/2015
SensorBox 118,97 29,27 115,66 22,99
MM5 (1 DA) 201,11 49,47 158,50 38,99
MM5 + ANN (1 DA) 215,61 63,04 179,09 44,06
MM5 (2 DA) 305,02 75,03 257,79 63,34
MM5 + ANN (2 DA) 217,61 53,53 178,25 43,85
MM5 (3 DA) 288,91 71,07 244,64 60,18
MM5 + ANN (3 DA) 187,33 46,08 149,04 36,66
15/08/2015
SensorBox 93,60 34,69 70,97 26,30
MM5 (2 DA) 428,24 158,70 315,88 117,06
MM5 + ANN (2 DA) 204,04 75,61 158,72 58,82
26/09/2015
SensorBox 202,89 139,91 155,56 107,27
MM5 (2 DA) 568,06 391,72 451,95 311,65
MM5 + ANN (2 DA) 451,95 267,58 234,74 161,87
1DA – Dia(s) Adiante
Como era esperado, os valores estimados com base na irradiância medida foram os mais próximos
dos valores de potência calculados com os parâmetros do inversor. Contudo, os nRMSE para os três
dias analisados foram aproximadamente 29%, 35% e 140%, que são valores consideravelmente
elevados.
Considerando que o modelo de um díodo e três parâmetros é linear, dependendo apenas dos inputs a
irradiância e a temperatura, variações tão significativas nos valores dos erros não podem ser
relacionadas a limitações no modelo utilizado. Assim sendo, apontam-se como principais fontes de erro
as incertezas nas medições, tanto da irradiância, como dos parâmetros do inversor e as limitações da
expressão para estimar a potência com base nestes últimos.
Relativamente à incerteza dos parâmetros medidos pelo inversor, é importante referir a precisão destes:
a tensão e a corrente são medidas com uma casa decimal, em V e A, respectivamente, sendo que a
potência consumida é apresentada na ordem das centenas de W (ou seja, com uma casa decimal em
kW), correspondendo a um erro de arredondamento de até 50 W na potência consumida. Assim sendo,
considerou-se que o erro de arredondamento destes valores é um dos factores relevantes para a
incerteza da potência estimada.
Adicionalmente, é necessário tomar em consideração que a expressão utilizada para se estimar a
potência produzida está intrinsecamente dependente da existência de consumo adequado à produção
de energia, o que nem sempre se verifica.
Finalmente, dificuldades técnicas associadas aos equipamentos de produção são também apontadas
como possíveis causas. Nomeadamente, verificou-se que para certos períodos de tempo nem todos os
painéis fotovoltaicos estiveram a produzir, devido a problemas na ligação entre os painéis e o sistema
de baterias, sendo necessária a intervenção no local para a resolução da situação.
65
Apesar da existência de diversas fontes de erro possíveis dificultar a validação do modelo desenvolvido,
agravada pela falta de dados para análise, considera-se que o modelo de um díodo e três parâmetros
se apresenta como uma solução adequada, tendo em conta os valores diminutos do nRMSE e do nMAE
para os dois primeiros dias analisados (considera-se que o erro do terceiro dia não é representativo
dos erros associados ao modelo implementado).
66
5 CONCLUSÃO
Foi desenvolvido um modelo para estimar a produção eléctrica futura de um sistema de micro-geração,
para horizontes temporais de 12 horas até 3 dias adiante. O sistema considerado é um sistema híbrido,
está instalado no campus do Instituto Superior Técnico no Taguspark e produz energia através de 6
painéis fotovoltaicos, que totalizam 1400 W de potência-pico, e uma turbina eólica de pequena escala,
com potência nominal de 400 W.
Para se estimar a produção eléctrica futura do sistema para o horizonte temporal pretendido, é
necessário recorrer-se a modelos numéricos de previsão da irradiância. Utilizaram-se as previsões
existentes para o local do modelo de mesoescala MM5, tendo-se desenvolvido uma rede neuronal
artificial do tipo feedforward para pós-processamento dessas previsões, de forma a tentar corrigir erros
sistemáticos. A rede foi treinada com a utilização de medições de irradiância no local, registados pelo
Sunny SensorBox. Os principais resultados obtidos na análise ao estudo dos parâmetros da rede foram:
Para o problema em questão, a combinação de previsões de irradiância, temperatura e
humidade relativa, bem como do horizonte temporal de cada previsão, como parâmetros de
entrada na rede, forneceu melhores resultados do que os obtidos com utilização de apenas
parte dessas quatro variáveis;
O tamanho ideal da rede neuronal aplicada, ou seja, o número de neurónios existentes na sua
camada escondida, situou-se entre 12 e 26 neurónios;
A inclusão de dados para os quais não existe valor objectivo foi benéfica para o desempenho
da rede neuronal;
O desempenho de uma rede com uma função sigmóide logística na camada de saída foi
semelhante à de uma rede com uma função linear nessa camada;
Um rácio de divisão de dados na fase de aprendizagem de 80/10/10 para treino, validação e
teste, respectivamente, forneceu os melhores resultados;
A rede desenvolvida apresentou um desempenho apenas ligeiramente superior à de uma rede
que utilizasse as funções utilizadas por defeito;
A selecção das variáveis de input foi o único parâmetro de construção estudado que influenciou
significativamente o desempenho da rede neuronal.
Desenvolveu-se uma rede neuronal do tipo feedforward, com 25 neurónios na camada escondida que
utilizam como função de activação uma função sigmóide logística, e 1 neurónio na camada de saída
que utiliza uma função de activação linear. Esta rede tem como inputs as previsões de irradiância,
temperatura e humidade relativa e o horizonte temporal de cada previsão, sendo todos parâmetros
normalizados antes de serem processados. A rede neuronal fornece assim o valor previsto da
irradiância normalizada, ou seja, o índice de claridade, a partir do qual se calcula a irradiância horizontal
global prevista através da irradiância extraterrestre incidente no plano horizontal paralelo à superfície.
Após a previsão da irradiância horizontal global, aplica-se o modelo anisotrópico de Reindl et al. [1]
para a estimação da irradiância global incidente no plano dos painéis fotovoltaicos, a partir da qual,
67
através da aplicação de um modelo equivalente, o modelo de um díodo e três parâmetros, se estima a
produção eléctrica correspondente do sistema.
Para avaliar o desempenho da rede neuronal desenvolvida, compararam-se o RMSE e MAE das
previsões com e sem pós-processamento. Verificou-se que as previsões do modelo MM5 + ANN
obtiveram, em média, um RMSE 19,4% menor que o do modelo MM5, sendo que a redução no MAE
foi, em média, de 12,8%. No entanto, na análise a dias específicos, constatou-se que a magnitude
destes erros normalizados, nRMSE e nMAE, respectivamente, era por vezes excessivamente
acentuada. Além disso, o RMSE médio calculado para o conjunto de dados de teste da rede neuronal
foi de 221,47 W/m2, valor esse que se considerou demasiado elevado.
Verificaram-se a existência de erros persistentes e sistemáticos nas previsões do modelo MM5, que a
rede neuronal não conseguiu corrigir. Além disso, as previsões com o modelo MM5 + ANN
apresentaram também tendências, nomeadamente a sobrestimação do pico da irradiância. Não
obstante, verificou-se também a correcção parcial de algumas tendências do modelo MM5, tendo-se
confirmado para os dias analisados que o modelo MM5 + ANN apresentou melhor desempenho.
Comparando a aplicação do modelo de um díodo e três parâmetros às medições de irradiância do
Sunny SensorBox com a potência estimada através de parâmetros registados pelo inversor, foi
verificado que também existiam discrepâncias, tendo-se analisado dias com nRMSE de 29%, 35% e
140%.
A incerteza na estimação da produção eléctrica está principalmente associada aos erros de previsão
da irradiância. Tais erros são, na maioria das situações, parcialmente diminuídos com a utilização da
rede neuronal para pós-processamento das previsões. Contudo, o desempenho do modelo
MM5 + ANN não é considerado satisfatório, devido às limitações do MM5, cujas previsões têm erros
significativos, no geral, mesmo para dias de céu limpo. Além disso, apontam-se como possíveis
agravantes a limitada quantidade de medições de irradiância existentes e limitações no cálculo do
índice de claridade, através da estimação da irradiância extraterrestre. É também necessário ter em
conta que as medições da irradiância têm uma incerteza associada, afectando assim a aprendizagem
da rede neuronal.
Por fim, os erros encontrados na estimação da produção eléctrica do sistema estão, muito
provavelmente, relacionados com a utilização de uma expressão aproximada para o cálculo dos valores
reais, expressão essa que apresenta algumas limitações na sua aplicação. Adicionalmente, a incerteza
na medição da irradiância é uma agravante que também limita a validação do modelo de um díodo e
três parâmetros. Não obstante, considera-se que esse modelo se apresenta como uma alternativa
adequada, e que, apesar de ser um modelo simplificado, não está na origem dos erros elevados
encontrados.
Considerando os resultados obtidos e apresentados, concluiu-se que a estimação da produção
eléctrica futura com base em previsões de irradiância tem, em geral, uma grande incerteza associada,
maioritariamente devido à incerteza na previsão da irradiância. Apesar desta incerteza poder ser
reduzida com a utilização de uma rede neuronal para pós-processamento, os resultados obtidos não
foram, na sua maioria, satisfatórios, pelo que valores de nRMSE elevados são esperados na estimação
68
da produção eléctrica futura – entre os 50% e os 120%, em média, podendo ser desproporcionalmente
elevados em situações pontuais.
Como trabalho futuro, recomenda-se a utilização de técnicas de selecção dos parâmetros da rede
neuronal artificial, como algoritmos genéticos, uma vez que a escolha dos inputs da rede se verificou
ser o principal influenciador do desempenho da mesma. Dentro de possíveis parâmetros adicionais,
salienta-se a análise à inclusão do ângulo de zénite. Além disso, a obtenção de uma quantidade maior
de medições, para serem usadas como valores objectivo na fase de aprendizagem da rede, poderá
melhorar os resultados obtidos. Sugere-se também a análise da utilização de diferentes redes
neuronais, consoante o horizonte temporal da previsão, ou seja, redes neuronais diferentes a processar
as previsões para 1, 2 e 3 dias adiante. Finalmente, quanto à estimação da produção eléctrica,
recomenda-se a utilização de medições directas da potência de saída dos painéis fotovoltaicos, de
modo se superar as limitações da expressão aproximada utilizada.
69
REFERÊNCIAS
[1] D. T. Reindl, W. A. Beckman, e J. A. Duffie, «Evaluation of hourly tilted surface radiation
models», Solar Energy, 1990.
[2] Direção-Geral de Energia e Geologia, «Estatísticas rápidas: renováveis», 2016.
[3] International Energy Agency (IEA), «PVPS annual report 2015», 2015.
[4] International Energy Agency (IEA), «Photovoltaic and solar forecasting», 2013.
[5] R. Marquez e C. F. M. Coimbra, «Forecasting of global and direct solar irradiance using
stochastic learning methods, ground experiments and the NWS database», Solar Energy, 2011.
[6] S. D. Miller, A. K. Heidinger, e M. Sengupta, «Physically based satellite methods», em Solar
Energy Forecasting and Resource Assessment, J. Kleissl, Ed. Mlawer: Elsevier, 2013.
[7] A. Mellit e S. A. Kalogirou, «Artificial intelligence techniques for photovoltaic applications: A
review», Progress in Energy and Combustion Science, 2008.
[8] M. Karatayev e M. L. Clarke, «Current energy resources in Kazakhstan and the future potential
of renewables: A review», Energy Procedia, 2014.
[9] E. Kuznetsova, C. Ruiz, Y. Li, e E. Zio, «Analysis of robust optimization for decentralized
microgrid energy management under uncertainty», International Journal of Electrical Power and
Energy Systems, 2015.
[10] C. F. M. Coimbra, J. Kleissl, e R. Marquez, «Overview of solar-forecasting methods and a metric
for accuracy evaluation», em Solar Energy Forecasting and Resource Assessment, 2013.
[11] H. G. Beyer, J. P. Martinez, M. Suri, J. L. Torres, E. Lorenz, S. C. Müller, C. Hoyer-klick, e P.
Ineichen, «Report on Benchmarking of Radiation Products», 2009.
[12] H. M. Diagne, M. David, P. Lauret, e J. Boland, «Solar irradiation forecasting: state-of-the-art
and proposition for future developments for small-scale insular grids», em World Renewable
Energy Forum, 2012.
[13] M. G. Lopes, «Desenvolvimento de um sistema de baixo custo para a previsão da irradiância
solar a curto prazo», Instituto Superior Técnico, 2015.
[14] C. W. Chow, B. Urquhart, M. Lave, A. Dominguez, J. Kleissl, J. Shields, e B. Washom, «Intra-
hour forecasting with a total sky imager at the UC San Diego solar energy testbed», Solar
Energy, 2011.
[15] A. Heinle, A. Macke, e A. Srivastav, «Automatic cloud classification of whole sky images»,
Atmospheric Measurement Techniques, 2010.
[16] P. J. Mathiesen, «Advanced numerical weather prediction techniques for solar irradiance
forecasting: Statistical, data-assimilation, and ensemble forecasting», 2013.
[17] R. Marquez, V. G. Gueorguiev, e C. F. M. Coimbra, «Forecasting of global horizontal irradiance
using sky cover indices», Journal of Solar Energy Engineering, 2012.
[18] S. M. I. Gohari, B. Urquhart, H. Yang, B. Kurtz, D. Nguyen, C. W. Chow, M. Ghonima, e J. Kleissl,
70
«Comparison of solar power output forecasting performance of the Total Sky Imager and the
University of California, San Diego Sky Imager», Energy Procedia, 2013.
[19] D. Cano, J. M. Monget, M. Albuisson, H. Guillard, N. Regas, e L. Wald, «A method for the
determination of the global solar radiation from meteorological satellite data», Solar Energy,
1986.
[20] P. Ineichen e R. Perez, «Derivation of cloud index from geostationary satellites and application
to the production of solar irradiance and daylight illumiannce data», Theoretical and Applied
Climatology, 1999.
[21] T. Cebecauer, M. Šúri, e R. Perez, «High performance msg satellite model for operational solar
energy applications», em Proceedings of American Solar Energy Society Annual Conference,
2010.
[22] R. Perez, P. Ineichen, K. Moore, M. Kmiecik, C. Chain, R. George, e F. Vignola, «A new
operational satellite-to-irradiance model - Description and validation», Solar Energy, 2002.
[23] R. Perez, S. Kivalov, J. Schlemmer, K. J. Hemker, e A. Zelenka, «Improving the performance of
satellite-to-irradiance models using the satellite’s infrared sensors», Proc. of American Solar
Energy Society Annual Conference, 2010.
[24] R. Perez, P. Ineichen, M. Kmiecik, K. Moore, D. Renne, e R. George, «Producing satellite-
derived irradiances in complex arid terrain», Solar Energy, 2004.
[25] T. Cebecauer, Š. Marcel, e C. a Gueymard, «Uncertainty sources in satellite-derived direct
normal irradiance: how can prediction accuracy be improved globally?», em Proceedings of the
SolarPACES Conference, 2011.
[26] R. Perez, S. Kvalov, J. Schlemmer, K. Hemker Jr., D. Renne, e T. E. Hoff, «Validation of short
and medium term operational solar radiation forecasts in the US», Solar Energy, 2010.
[27] W. Tranmüller e G. Steinmaurer, «Solar irradiance forecasting, benchmarking of different
techniques and applications of energy meteorology», em Eurosun 2010, 2010.
[28] P. Mathiesen e J. Kleissl, «Evaluation of numerical weather prediction for intra-day solar
forecasting in the continental United States», Solar Energy, 2011.
[29] S. Pelland, G. Galannis, e G. Kallos, «Solar and photovoltaic forecasting through post-
processing of the global environmental multiscale numerical weather prediction model»,
Progress in Photovoltaics: Research and Applications, 2011.
[30] E. Lorenz, D. Heinemann, H. Wickramarathne, H. G. Beyer, e S. Bofinger, «Forecast of
ensemble power production by grid-connected PV systems», em 20th European Photovoltaic
Solar Energy Conference.
[31] E. Lorenz, J. Remund, S. C. Müller, W. Traunmüller, G. Steinmaurer, D. Pozo, J. Antonio, V. L.
Fanego, L. Ramirez, M. G. Romeo, C. Kurz, L. M. Pomares, e C. G. Guerrero, «Benchmarking
of different approaches to forecast solar irradiance», em 24th European Photovoltaic Solar
Energy Conference, 2009.
[32] W. C. Skamarock, J. B. Klemp, J. Dudhi, D. O. Gill, D. M. Barker, M. G. Duda, X.-Y. Huang, W.
71
Wang, e J. G. Powers, «A Description of the advanced research WRF version 3», 2008.
[33] B. Espinar, J. L. Aznarte, R. Girard, a. M. Moussa, e G. Kariniotakis, «Photovoltaic forecasting:
A state of the art», em 5th European PV-Hybrid and Mini-Gird Conference, 2010.
[34] E. Lorenz, J. Kühnert, e D. Heinemann, «Short term forecasting of solar irradiance by combining
satellite data and numerical weather predictions», em 27th European Photovoltaic Solar Energy
Conference and Exhibition, 2012.
[35] G. E. Box, G. M. Jenkins, e G. C. Reinsel, Time series analysis: forecasting and control. 2011.
[36] W. Ji e K. C. Chee, «Prediction of hourly solar radiation using a novel hybrid model of ARMA
and TDNN», Solar Energy, 2011.
[37] S. Chattopadhyay, D. Jhajharia, e G. Chattopadhyay, «Trend estimation and univariate forecast
of the sunspot numbers: Development and comparison of ARMA, ARIMA and Autoregressive
Neural Network models», Comptes Rendus - Geoscience, 2011.
[38] W. Glassley, J. Kleissl, C. van Dam, H. Shiu, J. Huang, G. Braun, e R. Holland, «California
renewable energy forecasting, resource data and mapping. Appendix A: Solar forecasting»,
2010.
[39] W. Chang, «A literature review of wind forecasting methods», Journal of Power and Energy
Engineering, 2014.
[40] S. Hokoi, M. Matsumoto, e T. Ihara, «Statistical time series models of solar radiation and outdoor
temperature-identification of seasonal models by Kalman filter», Energy and Buildings, 1990.
[41] J. G. S. Fonseca, T. Oozeki, T. Takashima, G. Koshimizu, Y. Uchida, e K. Ogimoto, «Use of
support vector regression and numerically predicted cloudiness to forecast power output of a
photovoltaic power plant in Kitakyushu, Japan», Progress in Photovoltaics: Research and
Applications, 2011.
[42] R. A. Calvo, H. A. Ceccato, e R. D. Piacentini, «Neural network prediction of solar activity», The
Astrophysical Journal, 1995.
[43] S. A. Kalogirou, «Artificial neural networks in renewable energy systems applications: a review»,
Renewable & Sustainable Energy Reviews, 2001.
[44] A. Mellit, M. Benghanem, A. H. Arab, e A. Guessoum, «A simplified model for generating
sequences of global solar radiation data for isolated sites: Using artificial neural network and a
library of Markov transition matrices approach», Solar Energy, 2005.
[45] Y. Kemmoku, S. Orita, S. Nakagawa, e T. Sakakibara, «Daily insolation forecasting using a multi-
stage neural network», Solar Energy, 1999.
[46] P. Koehn, «Combining genetic algorithms and neural networks: The encoding problem», 1994.
[47] C. Voyant, M. Muselli, C. Paoli, e M. L. Nivet, «Numerical weather prediction (NWP) and hybrid
ARMA/ANN model to predict global radiation», Energy, 2012.
[48] J. Hassan, «ARIMA and regression models for prediction of daily and monthly clearness index»,
Renewable Energy, 2014.
72
[49] Y. Zhang, «Forecasting PV Solar Power in Electricity Systems», 2013.
[50] H. T. C. Pedro e C. F. M. Coimbra, «Assessment of forecasting techniques for solar power
production with no exogenous inputs», Solar Energy, 2012.
[51] V. Lara-Fanego, J. A. Ruiz-Arias, D. Pozo-Vázquez, F. J. Santos-Alamillos, e J. Tovar-Pescador,
«Evaluation of the WRF model solar irradiance forecasts in Andalusia (southern Spain)», Solar
Energy, 2012.
[52] E. M. Crispim, P. M. Ferreira, e a E. Ruano, «Prediction of the solar radiation evolution using
computational intelligence techniques and cloudiness indices», International Journal of
Innovative Computing, Information and Control, 2008.
[53] P. Ferreira, J. Gomes, I. Martins, e A. Ruano, «A neural network based intelligent predictive
sensor for cloudiness, solar radiation and air temperature», Sensors, 2012.
[54] E. Lorenz, J. Hurka, D. Heinemann, e H. G. Beyer, «Irradiance forecasting for the power
prediction of grid-connected photovoltaic systems», IEEE Journal of Selected Topics in Applied
Earth Observations and Remote Sensing, 2009.
[55] K. Shimose, H. Ohtake, J. G. D. S. Fonseca, T. Takashima, T. Oozeki, e Y. Yamada,
«Improvement of the Japan meteorological agency meso-scale model for the forecasting the
photovoltaic power production: Modification of the cloud scheme», Energy Procedia, 2014.
[56] B. Baructu, S. T. Tanriover, S. Sakarya, S. Incecik, F. M. Sayinta, E. Caliskan, A. Kahraman, B.
Aksoy, C. Kahya, e S. Topcu, «Improving WRF GHI forecasts with Model Output Statistics», em
Progress in Clean Energy, Volume 1, n. October, 2015.
[57] R. Marujo, P. Costa, A. Estanqueiro, e C. Pires, «MOS - Model Output Statistics - Aplicação da
metodologia para correcção das previsões de vento obtidas para Portugal Continental», em
XXXI Jornadas da Associação Espanhola de Meteorologia, 2010.
[58] P. Lauret, M. Diagne, e M. David, «A neural network post-processing approach to improving
NWP solar radiation forecasts», Energy Procedia, 2014.
[59] R. E. Kalman, «A new approach to linear filtering and prediction problems», Journal of Basic
Engineering, 1960.
[60] M. Diagne, M. David, J. Boland, N. Schmutz, e P. Lauret, «Post-processing of solar irradiance
forecasts from WRF model at Reunion Island», Solar Energy, 2014.
[61] P. Mandal, S. T. S. Madhira, A. Ul haque, J. Meng, e R. L. Pineda, «Forecasting power output
of solar photovoltaic system using wavelet transform and artificial intelligence techniques»,
Procedia Computer Science, 2012.
[62] S. Cao e J. Cao, «Forecast of solar irradiance using recurrent neural networks combined with
wavelet analysis», Applied Thermal Engineering, 2005.
[63] M. Schroedter-Homscheidt, C. Hoyer-Klick, E. Rikos, S. Tselepsis, e B. Pulvermüller,
«Nowcasting and forecasting of solar irradiance for solar energy electricity grid integration», em
SolarPaces, 2009.
[64] C. Hoyer-Klick, C. Schillings, M. Schroedter-Homscheidt, H.-G. Beyer, D. Dumortier, L. Wald, e
73
M. Lionel, «Management and exploitation of solar resource knowledge», em 1st International
Conference on Solar Heating, Cooling and Buildings, 2008.
[65] H. Madsen, P. Pinson, e G. Kariniotakis, «Standardizing the performance evaluation of shortterm
wind power prediction models», Wind Energy, vol. 29, n. 6, pp. 475–489, 2005.
[66] R. Paleta, A. Pina, e C. a. Santos Silva, «Polygeneration energy container: Designing and testing
energy services for remote developing communities», IEEE Transactions on Sustainable
Energy, 2014.
[67] SMA, «Sunny SensorBox Datasheet». [Online]. Disponível em:
http://files.sma.de/dl/4148/SENSORBOX-DAU103131W.pdf. [Acedido: 11-Mar-2016].
[68] Pennsylvania State University/National Center for Atmospheric Research, «MM5». [Online].
Disponível em: http://www2.mmm.ucar.edu/mm5/mm5-home.html. [Acedido: 21-Mar-2016].
[69] «Grupo de Previsão Numérica do Tempo», Grupo de Previsão Numérica do Tempo. [Online].
Disponível em: http://meteo.tecnico.ulisboa.pt/. [Acedido: 12-Jan-2016].
[70] T. A. dos S. C. e Sousa, «Previsão Meteorológica em Portugal Continental utilizando o modelo
operacional e de investigação MM5», 2002.
[71] NWS/NOAA, «Global Forecast System (GFS)». [Online]. Disponível em:
http://www.emc.ncep.noaa.gov/index.php?branch=GFS. [Acedido: 21-Mar-2016].
[72] T. T. Rogers e J. L. Mcclelland, Parallel distributed processing: explorations in the microstructure
of cognition. 1986.
[73] Y. H. Hu e J.-N. Hwang, Handbook of neural network signal processing. 2001.
[74] A. Ahmad, T. N. Anderson, e T. T. Lie, «Hourly global solar irradiation forecasting for New
Zealand», Solar Energy, 2015.
[75] A. Sfetsos e A. H. Coonick, «Univariate and multivariate forecasting of hourly solar radiation with
artificial intelligence techniques», Solar Energy, 2000.
[76] M. T. Hagan, H. B. Demuth, e M. H. Beale, Neural network design. 1995.
[77] C. Paoli, C. Voyant, M. Muselli, e M.-L. Nivet, «Forecasting of preprocessed daily solar radiation
time series using neural networks», Solar Energy, 2010.
[78] M. Gulin, M. Vasak, e M. Baotic, «Estimation of the global solar irradiance on tilted surfaces»,
17th International Conference on Electrical Drives and Power Electronics (EDPE 2013), 2013.
[79] S. Kalogirou, Solar energy engineering: processes and systems. 2009.
[80] A. Mellit e A. M. Pavan, «A 24-h forecast of solar irradiance using artificial neural network:
Application for performance prediction of a grid-connected PV plant at Trieste, Italy», Solar
Energy, 2010.
[81] C. Kalogirou, S., Neocleous, C., Paschiardis, S. and Schizas, «Wind Speed Prediction Using
Artificial Neural Networks», Proceedings of the European Symposium on Intelligent Techniques
ESIT’99, n. JANUARY, 1999.
[82] M. A. Armstrong, «Comparison of MM5 forecast shortwave radiation with data obtained from the
74
atmospheric radiation measurement program», Master of Science Schorlarly Paper, 2000.
[83] M. H. B. M. T. H. H. B. Demuth, «Neural network toolbox - User’s guide», MathWorks, 2015.
[84] C. Paoli, C. Voyant, M. Muselli, e M.-L. Nivet, «Solar radiation forecasting using ad-hoc time
series preprocessing and neural networks», em Emerging Intelligent Computing Technology and
Applications: 5th International Conference on Intelligent Computing, 2009.
[85] A. Mellit, H. Eleuch, M. Benghanem, C. Elaoun, e A. M. Pavan, «An adaptive model for predicting
of global, direct and diffuse hourly solar irradiance», Energy Conversion and Management, 2010.
[86] D. Nguyen e B. Widrown, «Improving the learning speed of 2-layer neural networks by choosing
initial values of the adaptive weights», em International Joint Conference on Neural Networks.
[87] A. Pavelka e A. Procházka, «Algorithms for initialization of neural network weights», em
Conference Technical Computing, 2004.
[88] J. Zisos, A. Dounis, T. Nikolaou, G. Stavrakakis, e D. Tseles, «Forecasting Temperature and
Solar Radiation: An Application of Neural Networks and Neuro-Fuzzy Techniques», Scientific
Conference ERA, n. 1, 2006.
[89] R. M. G. Castro, Uma introdução às energias renováveis: eólica, fotovoltaica e mini-hídrica.
2012.
[90] American Standards for Testing and Materials, «2000 ASTM Standard Extraterrestrial Spectrum
Reference E-490-00», 2000. .
[91] P. I. Cooper, «The absorption of radiation in solar stills», Solar Energy, 1969.
[92] J. A. Duffie, W. A. Beckman, e W. M. Worek, Solar engineering of thermal processes. 2003.
[93] D. D. K. Arachchige, «An approach to day ahead forecasting of solar irradiance with an
application to energy gain in solar thermal collectors», 2014.
[94] R. Tapakis, S. Michaelides, e A. G. Charalambides, «Computations of diffuse fraction of global
irradiance: Part 1 - Analytical modelling», Solar Energy, 2014.
[95] S. Dervishi e A. Mahdavi, «Computing diffuse fraction of global horizontal solar radiation: A
model comparison», Solar Energy, 2012.
[96] A. Miguel, J. Bilbao, R. Aguiar, H. Kambezidis, e E. Negro, «Diffuse solar irradiation model
evaluation in the North Mediterranean Belt area», Solar energy, 2001.
[97] B. E. Psiloglou e H. D. Kambezidis, «Estimation of the ground albedo for the Athens area,
Greece», Journal of Atmospheric and Solar-Terrestrial Physics, 2009.
[98] «NASA Earth Observations (NEO)», 2016. [Online]. Disponível em: http://neo.sci.gsfc.nasa.gov/.
[Acedido: 01-Abr-2016].
[99] A. M. Noorian, I. Moradi, e G. A. Kamali, «Evaluation of 12 models to estimate hourly diffuse
irradiation on inclined surfaces», Renewable Energy, 2008.
[100] G. A. Kamali, I. Moradi, e A. Khalili, «Estimating solar radiation on tilted surfaces with various
orientations: A study case in Karaj (Iran)», Theoretical and Applied Climatology, 2006.
[101] K. N. Shukla, S. Rangnekar, e K. Sudhakar, «Comparative study of isotropic and anisotropic sky
75
models to estimate solar radiation incident on tilted surface: A case study for Bhopal, India»,
Energy Reports, 2015.
[102] J. E. Hay e J. A. Davies, «Calculation of the solar radiation incident on an inclined surface», em
Proceedings First Canadian Solar Radiation Data Workshop, 1980.
[103] R. G. Ross, «Flat-plate photovoltaic array design optimization», em 14th IEEE Photovoltaic
Specialists Conference, 1980.
[104] «Internation Standard IEC 60904-3:2008». .
[105] LDK Solar, «LDK-230P-235P-20 Datasheet». [Online]. Disponível em:
http://www.ldksolar.com/uploadfiles/down/LDK_230P_235P_20_Ontario_DCC_EN_V1_12_120
229.pdf. [Acedido: 10-Mar-2016].
[106] «Internation Standard IEC 61215:2005». .
[107] Renewable Resource Data Center, «Reference Solar Spectral Irradiance: Air Mass 1.5».
[Online]. Disponível em: http://rredc.nrel.gov/solar/spectra/am1.5/. [Acedido: 09-Mar-2016].
76
ANEXOS
Figura A1 – Factores de ponderação e biases da camada escondida
77
Figura A2 – Factores de ponderação e bias da camada de output