Modelo de pronóstico de radiación solar basado en Machine...

124
Modelo de pronóstico de radiación solar basado en Machine Learning Edgar Darío Obando Paredes Universidad Nacional de Colombia Facultad de Ingeniería y Arquitectura Departamento de Ingeniería Eléctrica, Electrónica y Computación Manizales, Colombia 2018

Transcript of Modelo de pronóstico de radiación solar basado en Machine...

Page 1: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Modelo de pronóstico de radiación solar basado en Machine Learning

Edgar Darío Obando Paredes

Universidad Nacional de Colombia

Facultad de Ingeniería y Arquitectura

Departamento de Ingeniería Eléctrica, Electrónica y Computación

Manizales, Colombia

2018

Page 2: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Modelo de pronóstico de radiación solar basado en Machine Learning

Edgar Darío Obando Paredes Ingeniero Físico

Tesis de investigación presentada como requisito parcial para optar al título de:

Magíster en Ingeniería-Ingeniería Eléctrica

Directora:

PhD. Sandra Ximena Carvajal Quintero

Codirector:

MSc. Jairo Pineda Agudelo

Grupo de Investigación:

Environmental, Energy and Education Policy – E3P

Universidad Nacional de Colombia

Facultad de Ingeniería y Arquitectura

Departamento de Ingeniería Eléctrica, Electrónica y Computación

Manizales, Colombia

2018

Page 3: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Contenido III

Nota de aceptación

___________________________________

___________________________________

___________________________________

___________________________________

____________________________________

Directora tesis de investigación PhD. Ing. Sandra Ximena Carvajal Quintero.

____________________________________ Co-director Tesis de investigación

Msc. Jairo Pineda Agudelo.

____________________________________ Jurado de tesis

PhD. Ing. Adriana Arango Manrique.

____________________________________ Jurado de tesis

PhD. Ing. Jesus María López Lezama.

Fecha de sustentación: Manizales, 14 de Diciembre de 2018.

Page 4: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Dedicatoria.

A la memoria de Santiago Efraín Paredes y S. Hawking.

Faros que guían el barco que navega.

A mis padres, Edgar e Inés.

A mi hermana Daniela.

Por todo.

"Hacía muchos años que había aprendido que es preciso soportar algunos insultos, y

también sabía que en este mundo siempre llega el momento en que el más humilde de

los hombres, si mantiene los ojos bien abiertos, puede vengarse de los más poderosos".

Mario Puzo, El Padrino.

Page 5: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Agradecimientos

A mi directora profesora PhD. Sandra Ximena Carvajal, por su paciencia, su tiempo, su

ánimo, creer en mí, en este trabajo, su excelente dirección, comentarios y

recomendaciones.

A mi codirector MSc. Jairo Pineda A. Por su tiempo. Sus consejos, sus recomendaciones

y observaciones para llevar a buen recaudo esta tesis.

Al profesor César Arango, por su ánimo en todo el tiempo de mi formación.

A la Universidad Nacional de Colombia-Sede Manizales.

A los compañeros del grupo E3P, por el tiempo de vida que compartieron conmigo.

Page 6: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Resumen y Abstract VI

Resumen

En esta tesis de investigación se presenta el diseño de un modelo predictivo de recurso

solar. Se desarrolla en etapas, hace uso de conceptos propios del tratamiento de datos

históricos y sustenta su diseño en técnicas Machine Learning. Se describe el uso de gran

variedad de técnicas Machine Learning en la predicción de recurso primario alrededor del

mundo, se identifica sus fortalezas y retos. Luego, se sustentan criterios de selección de

técnicas según su aplicación dentro de las etapas del modelo. Se elabora y muestra una

síntesis del uso de estimación y predicción de recuso primario como elemento en la

planeación de sistemas fotovoltaicos a corto, mediano y largo plazo. Finalmente se

desarrolla el modelo y se proponen escenarios de simulación que se aplican al clima

colombiano.

El modelo presenta tres etapas en su diseño: agrupamiento-clasificación, estimación y

respuesta. Con una revisión de la literatura para cada fase se sintetizaron las fortalezas en

el tratamiento de datos y la aplicación de técnicas Machine Learning. Los criterios de

selección evalúan el comportamiento de la técnica o técnicas según sea la etapa de

aplicación. La escogencia de la base de datos donde se obtiene el histórico que hace de

entrada al modelo pasa por ámbitos de aplicación y uso.

La obtención de este modelo contribuye al desarrollo de una herramienta que aporta al

proceso de planeación para la diversificación de la matriz energética colombiana, lo que

hará posible que otros tipos de Fuentes No Convencionales de Energía Renovable, como

la solar Fotovoltaica, sean actores en la canasta energética.

Esta investigación aporta una herramienta en la estimación de potencial solar que puede

usarse en la identificación de nichos geográficos específicos de desarrollo y muestra una

visión de la importancia de los datos como elementos base en la toma de decisiones en

planeación de fuentes de energía cuyo recurso primario es variable.

Palabras clave: Machine Learning, Predicción, Radiación solar.

Page 7: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Contenido VII

Page 8: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

VIII Modelo de pronóstico de radiación solar basado en Machine Learning

Abstract

This thesis presents the design of predictive model using solar resource. It is developed in

stages, makes use of own concepts of historical data processing and supports its design in

Machine Learning techniques. The use of a wide variety of Machine Learning techniques

in the prediction of primary resources around the world is described, their strengths and

challenges are identified. Then, criteria of selection of techniques according to their

application are supported within the stages of the model. A synthesis of the use of

estimation and prediction of primary resource as an element in the planning of photovoltaic

systems in the short, medium and long term is elaborated and shown. Finally, the model is

developed and simulation scenarios are proposed that apply to the Colombian climate.

The model has three stages in its design: grouping-classification, estimation and output.

With a review of the literature for each phase, the strengths in data processing and the

application of Machine Learning techniques were synthesized. The selection criteria

evaluate the behavior of the technique or techniques according to the application stage.

The choice of the database where the historical data that enters the model is obtained

passes through areas of application and use. Obtaining this model contributes to the

development of a tool that contributes to the planning process for the diversification of the

Colombian energy matrix, which will make it possible for other types of Renewable Energy

Sources, such as solar photovoltaic, to be actors in the Electrical Wholesale Market.

This research provides a tool in the estimation of solar potential that can be used in the

identification of specific geographic potential and this shows a vision of the importance of

the data as base elements in the decision making in planning of energy resources whose

primary resource is variable.

Keywords: Machine Learning, Prediction, Solar radiation.

Model of solar radiation forecast based on machine learning

Page 9: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Contenido IX

Page 10: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Contenido X

CONTENIDO.

RESUMEN VI

ABSTRACT VIII

LISTA DE FIGURAS XIII

LISTA DE TABLAS XIV

LISTA DE SÍMBOLOS Y ABREVIATURAS XV

INTRODUCCIÓN 1

1 CAPÍTULO 1 3

1.1 Motivación. 4

1.2 Planteamiento del problema. 5

1.3 Objetivos. 6

1.3.1 Objetivo General. 6

1.3.2 Objetivos Específicos. 6

1.4 Estructura del documento. 7

2 CAPÍTULO 2. 8

2.1 Consideraciones previas a la revisión del estado del arte. 9

2.2 Aproximaciones para determinar radiación solar incidente. 10

2.2.1 Aproximaciones Numéricas. 11

2.2.2 Aproximaciones Analíticas. 12

2.3 Predicción de radiación solar. 14

2.3.1 Procesos de Markov. 17

2.3.2 Otros algoritmos. 17

2.3.3 Lógica Difusa (Fuzzy Logic). 19

2.3.4 Árboles de decisión (Decision tree). 19

2.3.5 Máquinas de vectores de soporte (Support vector Machine SVM). 20

2.3.6 K-nearest neighbors. 21

2.3.7 K-means. 21

Page 11: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Contenido XI

2.3.8 Redes neuronales (Neural Networks NN). 22

2.3.9 Modelos híbridos y consideraciones finales. 24

3 CAPÍTULO 3. 27

3.1 Integración de técnicas de predicción en la toma de decisiones y en escenarios de

planeación. 28

3.1.1 Estimación de recurso primario aplicado en escenarios de planeación. 28

3.2 Uso de la predicción y estimación de recurso solar primario como herramienta de

decisión en planeación: una visión mundial. 33

3.3 Estudio de caso: predicción de radiación solar en Colombia. 37

3.3.1 Elementos a considerar en el caso de sistemas FV. 37

3.3.2 Uso de datos históricos para toma de decisiones: escenario colombiano. 40

3.3.3 Predicción de radiación solar en Colombia mediante ML una propuesta al futuro. 41

4 CAPÍTULO 4. 43

4.1 Modelo de predicción de radiación solar basado en Machine Learning. 44

4.1.1 Generalidades en el diseño del modelo. 44

4.1.2 Estructura del modelo. 45

4.2 Bases de datos de recurso solar usadas en aplicaciones energéticas: aplicaciones y

conceptos generales. 50

4.2.1 Consideraciones a tener en cuenta en la escogencia de una base de datos. 50

4.2.2 Características y propiedades de bases de datos usadas en cuantificación de

recurso solar. 53

4.2.3 Base de datos a usar en el desarrollo del modelo. 55

4.3 Simulación y comportamiento del modelo. 57

4.3.1 Regiones de estudio. 57

4.3.2 Escenarios de simulación del modelo. 61

4.4 Validación del modelo. 66

4.4.1 Consideraciones iniciales en la validación del modelo. 66

4.4.2 Resultados de la validación del modelo propuesto. 69

4.5 Interpretabilidad del modelo. 73

5 CONCLUSIONES Y FUTUROS DESARROLLOS. 76

5.1 Conclusiones generales. 76

5.2 Futuros desarrollos. 77

5.3 Difusión académica. 79

BIBLIOGRAFÍA. 92

Page 12: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

XII Modelo de pronóstico de radiación solar basado en Machine Learning.

Page 13: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Contenido XIII

Lista de figuras

PÁG.

Figura 2-1: Clasificación de técnicas de estimación de radiación solar. 14

Figura 2-2: Evolución temporal del uso de técnicas para predicción y estimación de

radiación solar. 16

Figura 2-3: Tendencia en número de trabajos publicados que hacen uso de técnicas

ML en predicción y estimación de radiación solar. 23

Figura 2-4: Topología de prediccion de radiación solar tipo modelo híbrido. 25

Figura 3-1: Diagrama de flujo para planeación al tener en cuenta recurso primario. 29

Figura 3-2: Escalas espacio-temporales y tópicos de estudio en planeación. 32

Figura 3-3: Valoración por aspecto en la barrera identificada. 39

Figura 4-1: Modelo ML propuesto en el trabajo de investigación. 46

Figura 4-2: Componentes del clasificador Fuzzy Logic. 47

Figura 4-3: Componentes del predictor principal híbrido. 48

Figura 4-4: Descripción de la radiación solar horizontal en las ciudades de estudio. 58

Figura 4-5: Gráficas de correlación de radiación diaria y datos climáticos desde

01/01/2008 hasta 31/07/2018. 59

Figura 4-6: Comportamiento del clasificador Fuzzy en las ciudades de estudio. 63

Figura 4-7: Diagrama de dispersión del modelo en las ciudades evaluadas. 70

Figura 5-1: Diagrama de flujo como sugerencia de trabajos futuros. 78

Page 14: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Contenido XIV

Lista de tablas

PÁG.

Tabla 3–1: Trabajos desarrollados para estimar y predecir recurso solar primario 35

Tabla 3–2: Principales desafíos y propuesta a futuro en predicción de radiación

mediante ML en Colombia. 41

Tabla 4–1: Clasificación de predictores unitarios por medio de criterios establecidos. 44

Tabla 4–2: Requerimientos del dataset a usar según aplicación. 52

Tabla 4–3: Cumplimiento de requisitos de bases de datos. 55

Tabla 4–4: Características de los datos medidos en PowerViewer. 56

Tabla 4–5: Información geográfica de las ciudades de estudio. 57

Tabla 4–6: Coeficientes de correlación entre radiación solar incidente y parámetros

climáticos para las ciudades de estudio. 60

Tabla 4–7: Resumen de parámetros en la etapa de clasificación para todas las

ciudades de estudio. 63

Tabla 4–8: Resultados del modelo SVM en las ciudades evaluadas. 65

Tabla 4–9: Valores de métricas del modelo evaluado en ciudades. 71

Tabla A–1: Avances y desafíos en aproximaciones numéricas-Analíticas. 81

Tabla B–2: Lista de trabajos representativos relacionados con predicción de radiación

donde usan predictores ML unitarios. 84

Tabla C–3: Lista de trabajos representativos relacionados con predicción de radiación

que usa predictores ML híbridos. 86

Tabla D-4: Síntesis de trabajos que integran predicción y cuantificación de recurso

primario en procesos de planeación. 88

Tabla E–5: Lista simplificada de bases de datos usadas en aplicaciones de Energía

Solar. 91

Page 15: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Contenido XV

Lista de símbolos y abreviaturas

Símbolos con letras latinas

Símbolo Término Definición

𝑲 Función de activación. Ec. 4-1

𝒃 Parámetro independiente. Ec. 2-1

𝒌 Kernel. Ec. 4-1

𝒓 Coeficiente de correlación de Pearson. Ec. 4-2

Símbolos con letras griegas

Símbolo Término Definición

𝜶 Coeficiente de aprendizaje. Ec. 2-1

𝝓(𝒙) Función proyector de datos de entrada. Ec.4-1

𝝈 Desviación estándar. Sección 4-2

𝜺 Valor de tolerancia al error. Sección 4-2

Subíndices

Símbolo Término

𝒓𝒃𝒇 Función de activación mediante proceso radial.

𝒊 Índice de posición.

Page 16: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

XVI Modelo de pronóstico de radiación solar basado en Machine Learning.

Abreviaturas

Símbolo Término

AM Air mass.

ANFIS Adaptive Neuro-Based Fuzzy Inference System.

ARIMA autoregressive integrated moving average

ARMA autoregressive moving average

BP Back Propagation

CON Concejo nacional de operación

COP Coeficiente de desempeño

CREG Comisión de regulación de energía y gas

CSV Comma separated values

ENFICC Energía Firme para cargo por Confiabilidad

FNCER Fuentes no convencionales de energía renovable

FV Fotovoltaico(a)

GHI Global Horizontal irradiation

GP Proceso gausiano

IA Inteligencia Artificial

IC Índice de claridad

IEA International Energy Agency

IRENA International Renewable Energy Agency

LM Levenberg-Marquardt

LVQ Learning vector quantization

MAE Error absoluto

MAPE Error relativo medio

MBE Error de desviación estándar

ML Machine Learning

MLP Multilayer perceptron

MPE Modelos de planeación energética

NASA National Aeronautics and Space Administration

NN Neural Network

Page 17: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Contenido XVII

RBF Función de base radial

RMSE Error Cuadrático medio

SIG Sistemas de información geográfica

SIN Sistema interconectado nacional

SVM Support Vector Machine

TA Temperatura ambiente

TMY typical meteorological year

Page 18: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine
Page 19: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Introducción

El aumento de la población mundial está directamente relacionado con la demanda

energética que es cada vez mayor, las fuentes energéticas convencionales escasean y se

busca nuevas formas de energía que entren a suplir el déficit [1]. Como alternativa de

solución, se busca mayor promoción y utilización de fuentes energéticas ambientalmente

sostenibles, es decir, FNCER.

Dentro de este conjunto, se presenta la energía solar FV. Durante las últimas tres décadas,

la utilización del sol como fuente para la producción de electricidad ha pasado de tener

menos del 1 % de generación en 2010 a tener cerca del 5 % de generación eléctrica

mundial en 2017 [2].

En los sistemas FV, la capacidad de generación de electricidad solar está estrechamente

ligada a condiciones climáticas en la región donde se quiera implementar el sistema [3],

[4]. Para estimar generación existen modelos de desempeño entre los que destaca: el

modelo de desempeño Duffie & Beckman [5], modelo de desempeño King [6] y Modelo de

desempeño Masters [7], los que demuestran la relación directa entre datos climáticos

(radiación solar, temperatura ambiente, velocidad del viento) y la generación eléctrica de

una instalación solar. Estos modelos son una primera aproximación de cálculo, pero no

capturan en su totalidad el carácter variable y no lineal de la radiación [8], [9].

Page 20: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

2

Las fluctuaciones e intermitencias en los datos climáticos tienen una consecuencia en la

producción de energía y el índice de desempeño de sistemas fotovoltaicos [10], por lo que

se buscan soluciones que prevean y estimen estos cambios.

Dentro de estas soluciones esta la predicción de recurso primario como elemento primario

en el dimensionamiento de sistemas FV. Los modelos predictivos se centran en buscar

relaciones y patrones de tendencia por medio del análisis y tratamiento de datos.

Para desarrollar modelos predictivos se hace uso de modelos que pueden dividirse en dos

grupos. Los primeros usan elementos de estadística clásica y los segundos usan

elementos estocásticos: IA y ML [11], [12].

Los modelos ML, derivan sus conceptos de la Inteligencia Artificial. Generalmente el

modelo consta de tres etapas: agrupamiento, estimación y tratamiento de la desviación. A

la entrada hace uso de técnicas que encuentren tendencias y agrupen patrones, el

resultado de esta etapa se envía al predictor que se encarga de estimar valores numéricos

para finalmente compararlos con los valores medidos.

Para aplicaciones de ML en predicción de recurso solar primario, el número de etapas

cambia. Debido a la variabilidad del clima y la dependencia de datos climáticos con la

radiación, una etapa antes del agrupamiento se hace presente: la clasificación. El objetivo

de esta etapa es clasificar los datos de estudio en diversos tipos de clima según sea la

condición. El escoger la técnica o técnicas para estas etapas en primer lugar pasa por

establecer criterios que permitan evaluar sus fortalezas y debilidades en el tratamiento de

datos a fin de encontrar las que mejor se adapten a la base de datos a usar, a la región

climática en estudio, manejo de la no linealidad del recurso y horizonte a futuro.

El modelo ML pretende ser una herramienta en la planeación y dimensionamiento de

sistemas FV que ayuda a reducir la incertidumbre en generación derivada de la ubicación

geográfica y permite estimar la reserva energética a largo plazo a fin de que el sistema

eléctrico convencional esté preparado para integrar una nueva fuente de electricidad a su

matriz de generación.

Page 21: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

1 Capítulo 1

Una de las fuentes no convencionales de energía renovable de gran

proyección para la producción de electricidad es la energía solar. La

radiación como recurso primario se transforma en electricidad en los

sistemas Fotovoltaicos. Pero este recurso primario es geográficamente

variable y depende de otros datos climáticos. Esto presenta un reto a

la hora de poder transformar este recurso en electricidad y garantizar

el suministro sin interrupciones. Una solución conlleva el uso de

modelos de predicción a fin de cuantificar cambios y determinar perfiles

de radiación solar.

Page 22: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

4 Modelo de pronóstico de radiación solar basado en Machine Learning.

1.1 Motivación.

Hacer una transición a un uso intensivo de energía renovable proporciona beneficios

ambientales y económicos como lo plantea la Ley 1715 de mayo de 2014 [13]. Entre estos

beneficios se destacan: incentivos a la generación y disminución de impuestos asociados

a proyectos energéticos renovables. Se prevé que para 2050 las emisiones de dióxido de

carbono (𝐶𝑂2) global se reducirán al 75 % a condición de que se adopten energías

renovables no convencionales en la matriz energética [2]. Por esta razón se deben buscar

nuevas alternativas de generación de energía eléctrica. La energía solar fotovoltaica es

una de ellas, pero la generación de electricidad a partir del sol tiene retos, entre los que

destaca: predecir variabilidad en la generación por efectos asociados al clima y ubicación

geográfica [3], [9], [10].

Este reto, conlleva el poder cuantificar recurso primario en el futuro a fin de prever esta

variabilidad y tomar decisiones. Para esto se propone el uso de modelos predictivos para

determinar radiación incidente. En primer momento se debe analizar el efecto del clima en

la región geográfica donde se dimensionará el sistema. Seguidamente, se propone un

modelo de solución donde esté representado el clima local y prevea los cambios en recurso

primario. Este será un primer elemento en el desarrollo de documentos maestros y hojas

de ruta en la planeación de sistemas FV que se basen en un histórico de datos climáticos.

En Colombia, la integración de bases de datos y técnicas de predicción en el marco

regulatorio (Leyes y normas) del país para cuantificación-predicción de recurso primario es

escasa [14]. Un primer acercamiento se muestra en la resolución de la CREG 243 de 2016

[15]. En esta se define una metodología para calcular el cargo por confiabilidad

denominado ENFICC, de plantas solares fotovoltaicas. Usa un modelo en el que se

consideran la radiación solar horizontal y temperatura ambiente, ambos con un histórico

mayor o igual a 10 años, con registros horarios. Este modelo es una primera aproximación

que tiene en cuenta históricos para la toma de decisiones, pero no contempla en el diseño

del mismo una etapa o etapas que agrupen, clasifiquen y prevean tendencias en el futuro

que permitan dar como resultado un perfil de radiación que tenga en cuenta datos

climáticos y ubicación geográfica.

Page 23: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capitulo 1 5

Por este motivo se hace necesario diseñar e implementar estrategias de solución, que

proporcionen un pronóstico de cuantificación de radiación solar a fin de ser usado en la

planeación de soluciones para energía fotovoltaica, y dimensionamiento de la instalación

de un sistema de este tipo. Es importante estudiar el efecto asociado que tienen los datos

climáticos en el recurso solar, además de considerar técnicas de predicción como

instrumentos fiables en la toma de decisiones respecto a la viabilidad o no de un sistema

solar en una determinada región.

1.2 Planteamiento del problema.

Diferentes tipos de clima dan como resultado variación en los patrones de producción de

energía fotovoltaica. Datos como velocidad del viento y temperatura tienen incidencia en

la potencia de salida de un arreglo fotovoltaico [3]. En un día soleado, la potencia de salida

del sistema de generación fotovoltaica es alta y estable, pero en días nublados y lluviosos

el desempeño es bajo e inestable, es decir, tiene un comportamiento intermitente [16].

En la actualidad, para el dimensionamiento de un sistema FV en la etapa de diseño se

hace uso del atlas de radiación solar. Este documento de referencia presenta un valor

promedio diario, mensual y anual que se calcula mediante métodos numéricos en función

de la radiación incidente y extraterrestre. El uso de este atlas tiene varias debilidades

según [17], [18]: no captura la alta no-linealidad del recurso primario, no tiene en cuenta

otros datos climáticos, ni tampoco el tipo de clima que presenta la región.

Al dimensionar sistemas FV por medio del valor establecido en el atlas pueden presentarse

debilidades en el desempeño final lo que traduce en problemas de cuantificación en el

suministro de energía del sistema [9]. Lo anterior se suma a la alta incertidumbre en la

cantidad de recurso primario que se tenga en un determinado momento temporal y región

geográfica, datos climáticos que no se reconocen como importantes y de los que depende

el recurso primario. Al no tener en cuenta estos datos geolocalizados la información de

recurso primario es escasa lo que se traduce en una planeación deficiente de sistemas FV

al no explotar todas las capacidades de una determinada región.

Page 24: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

6 Modelo de pronóstico de radiación solar basado en Machine Learning.

1.3 Objetivos.

El trabajo que se presenta aborda una revisión de trabajos previos y discusiones que se

dan alrededor del uso del Machine Learning como herramienta de predicción de recurso

solar para generación eléctrica. Principalmente se estudian los conceptos, características

y elementos diferenciadores de esta nueva forma de cuantificar el perfil de recurso primario

y poder así generar un modelo de predicción aplicado al clima colombiano.

1.3.1 Objetivo General.

Diseñar un modelo de pronóstico de radiación solar basado en Machine Learning.

1.3.2 Objetivos Específicos.

1. Identificar mediante la elaboración del estado del arte la evolución del problema en

la predicción de recurso primario y su solución con el uso de técnicas ML.

2. Establecer criterios de selección de técnicas ML y reconocer características propias

de cada una en las etapas asociadas al modelo.

3. Evaluar mediante escenarios de simulación conceptos, técnicas y etapas usadas

en el diseño del modelo.

Page 25: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capitulo 1 7

1.4 Estructura del documento.

El capítulo 1, presenta la introducción general del trabajo, justificación, motivación, el

planteamiento del problema, los objetivos propuestos, y la composición del documento.

En el capítulo 2, se presenta el estado del arte de la aplicación de técnicas numéricas-

analíticas y Machine Learning a la predicción de radiación solar. Se identifican sus

fortalezas y retos.

El capítulo 3, muestra como la cuantificación de recurso primario se integra en los tópicos

de estudio para planeación en un sistema FV. Se muestran experiencias internacionales

al obtener esa información y la propuesta de aplicación del modelo ML al caso colombiano.

En el capítulo 4, se elabora el modelo y se proponen escenarios de simulación, evaluación

y validación. Los escenarios se presentan como ejemplos que muestran el funcionamiento

del modelo en diferentes regiones geográficas colombianas. La evaluación y validación

muestran el comportamiento bajo métricas estadísticas de la respuesta del modelo.

En el capítulo 5, se presenta las principales conclusiones de esta investigación y se

sugieren los trabajos futuros.

Page 26: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

2 Capítulo 2.

Las variadas técnicas Machine Learning como herramientas en la

predicción de recurso primario tienen un origen no mayor a 10 años.

Derivan parte de sus conceptos de la Inteligencia Artificial y redes

neuronales, conceptos pioneros en la cuantificación y predicción de

radiación. De ahí, las investigaciones apuntan a usar nuevas técnicas

que den a la luz nuevos predictores sean unitarios o híbridos. Dado la

diferencia en respuesta y estructura los predictores son evaluados en

términos de: tratamiento de la linealidad, comportamiento según el

número de entradas y su desviación en la respuesta. Al revisar la

literatura y encontrar estos criterios de evaluación, se propone un

modelo Machine Learning híbrido con etapas asociadas para el

tratamiento de datos climáticos.

Page 27: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 2 9

2.1 Consideraciones previas a la revisión del estado del arte.

En el presente capítulo se identifican y analizan técnicas para estimar y predecir radiación

solar. Su desarrollo fue evolutivo con el paso del tiempo, desde las relaciones empíricas

hasta llegar al ML.

Existen en la literatura varias técnicas para predecir radiación. Se pueden clasificar desde

los datos usados a la entrada. Modelos como híbridos, NN, y SVM, se usan con mucha

frecuencia, mientras que otros (fuzzy, k-means) y otros que raramente se utilizan (árboles,

Markov).

La tendencia en los últimos años es desarrollar predictores híbridos más que unitarios, lo

que permite abordar el problema de la predicción de radiación, no como un concepto

estocástico sino no como una suma de señales que deben ser analizadas en etapas y para

cada etapa se debe seleccionar el predictor más adecuado. A la entrada el modelo debe

ser capaz de capturar la no-linealidad de los datos de entrada, incluida radiación, para

después generar la clasificación-agrupamiento correspondiente sin descuidar la desviación

en estas dos etapas, para finalizar la estimación con una técnica que tenga en cuenta

relaciones entre el dataset de entrada y la salida de radiación que se predice. La respuesta

a la pregunta de cuál o cuáles son los mejores algoritmos para predecir radiación, no es

fácil de responder. Esto en gran parte a los pronósticos resultantes que difieren en muchos

puntos geográficos.

Así pues, para cada región en particular se debe escoger el modelo más apropiado el cual

debe seguir una tendencia de aplicación en regiones similares.

Page 28: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

10 Modelo de pronóstico de radiación solar basado en Machine Learning.

2.2 Aproximaciones para determinar radiación solar incidente.

La determinación de radiación solar se hace mediante varios métodos: numérico [19]–[21],

analíticos donde están: procesamiento de imágenes [22]–[24], estadístico [25]–[27] y

finalmente el uso de técnicas de ML [28]–[30]. Según los anteriores trabajos, el desarrollo

del modelo final depende de las relaciones que se presentan entre la radiación incidente y

parámetros climáticos. Se propone en este trabajo la clasificación de técnicas por el tipo

de datos que hacen de entrada al modelo. De acuerdo a [31] y [32] los modelos se

clasifican en:

-El modelo de radiación solar y los valores, en cualquier escala de tiempo, está basado en

parámetros meteorológicos: Temperatura de aire, 𝑇𝑎, humedad relativa 𝑅𝐻, índice de

claridad, 𝐶𝐼, velocidad del viento 𝑉𝑣, nubosidad, 𝐾𝑖 y presión, P. Además de las

coordenadas geográficas, longitud y latitud. Esta aproximación se presenta en la Ecuación

2-1:

(𝐺𝑖) = 𝑓(… 𝑇𝑎 − 2, 𝑇𝑎 − 1, 𝑇𝑎; … 𝑅𝐻 − 2; 𝑅𝐻 − 1; 𝑅𝐻, … 𝑉𝑣 − 2, 𝑉𝑣 − 1, 𝑉𝑣; … 𝐾𝑖 − 2, 𝐾𝑖 −1, 𝐾𝑖 , … 𝑃 − 2, 𝑃 − 1, 𝑃; … 𝐶𝐼 − 2, 𝐶𝐼 − 1, 𝐶𝐼; 𝐿𝑎𝑡; 𝐿𝑜𝑛𝑔) (2-1)

y se le denomina modelo con datos estructurados.

-Una segunda aproximación, denominada modelo con datos endógenos, utiliza valores

históricos de radiación para generación del modelo. Este método se formula en la Ecuación

2-2:

𝐺(𝑖 + 𝑝) = 𝑓(… , 𝐺𝑖+𝑝−2 , 𝐺𝑖+𝑝−1, … , 𝐺𝑖). (2-2)

Los datos futuros (𝑡 + 𝑝) están basados en datos históricos de la forma … (𝑡 + 𝑝 − 2, 𝑡 +

𝑝 − 1, … , 𝑡).

-Una última aproximación es una combinación de las dos primeras relaciones, se denomina

modelo con datos exógenos. Su formulación se muestra en la Ecuación 2-3:

𝐺(𝑖 + 𝑝) = 𝑓(𝐺𝑖+𝑝−1 , 𝐺𝑖+𝑝−2, … , 𝐺𝑖 , … 𝑇𝑎 − 2, 𝑇𝑎 − 1, 𝑇𝑎; … 𝑅𝐻 − 2; 𝑅𝐻 − 1; 𝑅𝐻, … 𝑉𝑣 − 2, 𝑉𝑣 −

1, 𝑉𝑣; … 𝐾𝑖 − 2, 𝐾𝑖 − 1, 𝐾𝑖 , … 𝑃 − 2, 𝑃 − 1, 𝑃; … 𝐶𝐼 − 2, 𝐶𝐼 − 1, 𝐶𝐼; 𝐿𝑎𝑡; 𝐿𝑜𝑛𝑔). (2-3)

Page 29: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 2 11

En este caso las entradas son datos de radiación solar históricos y otros parámetros

meteorológicos.

A continuación, se amplía la aplicación de aproximaciones numéricas-analíticas y se tiene

en cuenta el objetivo de predicción y las relaciones matemáticas a las que llegaron los

autores.

2.2.1 Aproximaciones Numéricas.

En las aproximaciones de tipo numérico se genera valores de radiación solar, con

resolución horaria, diaria, mensual y anual por medio de ecuaciones explícitas. En las

primeras aproximaciones, la radiación es la variable propia del modelo, y se define lo que

se denomina índice de claridad. En estos trabajos se propone un modelo empírico que usa

coeficientes de relación entre la radiación total y la radiación en día despejado [26], [33]–

[36]. En este tipo de aproximaciones no se muestra relación entre radiación y otros datos

climáticos [34]. Sin embargo, en otro estudio se establece un nuevo método para

determinar coeficientes que mejoren la precisión del modelo de radiación solar usado

anteriormente. Este método prueba, en diferentes localizaciones y estaciones, los

coeficientes que ajusten mejor a la radiación medida [33].

Una de las primeras aproximaciones numéricas es el modelo de Ángstrom, en el cual se

optimiza el cálculo del valor de los coeficientes por medio de una regresión lineal [34].

Además de asumir el carácter lineal de la radiación, se linealiza por periodos de tiempo.

En general, en estos trabajos se trata la radiación solar desde el punto de vista de

aproximaciones lineales y el modelo generado depende fuertemente de los coeficientes de

relación [36]. Existen modelos numéricos empíricos que empiezan a relacionar la radiación

solar incidente en el lugar con parámetros como temperatura, latitud, longitud entre otros

[37].

El problema de la estimación de radiación dependiente de datos climáticos se aborda

desde el concepto físico de radiación y su descomposición en tres tipos de radiación:

directa, difusa y albedo. Se encuentran relaciones entre la localización geográfica y las

Page 30: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

12 Modelo de pronóstico de radiación solar basado en Machine Learning.

condiciones topográficas de un área determinada [38]. En el modelo propuesto se calculan

coeficientes de relación a partir de la combinación de dos modelos preestablecidos.

En otros trabajos se desarrolla una relación matemática entre la radiación incidente, el

ángulo cenit, se tiene en cuenta la localización geográfica y variaciones del clima [39], [40].

Estas aproximaciones son de carácter lineal en las que coeficientes son calculados

mediante regresiones lineales y curvas de aproximación. En estos trabajos se presenta un

común denominador al usar datos endógenos para establecer modelos, lo que ocasiona

que cada modelo sea aplicado localmente donde se realizó el estudio.

En otro tipo de estudios se aborda el problema no lineal en la construcción de modelos de

radiación incidente. En estos trabajos se utiliza: ARIMA. Este está soportado por una

distribución gaussiana que establece relaciones entre la radiación y parámetros climáticos

externos [35], [41]. Este proceso se realiza mediante la aproximación por curvas suaves al

comportamiento real de la radiación.

En [42], se desarrolló una aproximación para determinar radiación solar media por horas.

Esta aproximación está basada en una metodología empírica en la cual implementa una

función denominada función de transferencia. Esta función es suave a trozos y se

caracteriza para 3 fases: ascenso, descenso y valor pico. El modelo presenta una ecuación

con coeficientes numéricos que son calibrados mediante la aplicación de datos medidos

en una ciudad.

2.2.2 Aproximaciones Analíticas.

Las primeras aproximaciones analíticas son las estadísticas seguidas por las que utilizan

procesamiento de imágenes. Se consideran analíticas puesto que tratan la radiación como

una señal que puede ser descompuesta y estudiada que será entrada para generar un

modelo similar al histórico. En [14], [15], los modelos desarrollados se caracterizan por

tratar los datos de radiación como una función de densidad de probabilidades. Esta se

calcula mediante datos históricos, con aproximaciones numéricas de tipo gaussiano para

estimar dicha función. Esto genera un modelo característico para cada mes de aplicación.

Un caso especial se presenta en [27] donde se evalúa el desempeño de un modelo híbrido.

Page 31: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 2 13

En este se usa una aproximación por medio de distribución gaussiana del índice de

claridad, para luego discretizar la señal en el dominio de la frecuencia con el uso de

wavelet. Esto hace que el modelo estadístico híbrido tenga un desempeño un 15 % mejor

con respecto al algoritmo simple [26], [27].

En las aproximaciones que usan procesamiento de imágenes, se estima la radiación

tratándola como un arreglo bidimensional que posee píxeles en filas y columnas. En

trabajos como [23] se desarrolla un modelo que predice radiación directa con base en

imágenes satelitales y movimiento de nubes, tratándolas como vectores de movimiento.

Este modelo se desarrolla sobre estaciones climáticas. En periodos futuros largos, meses

y años, la precisión del modelo es limitada, esto debido a píxeles de la imagen y resolución

satelital.

Ciertas aproximaciones desarrollan un modelo bidimensional de representación de la

radiación solar incidente [44]. Se genera una representación matricial con horas y días que

corresponden a las columnas y valores de radiaciones que corresponden a las filas. Para

determinar el comportamiento del modelo se desarrollan filtros lineales cuya función es

obtener la correlación necesaria entre el modelo y los valores predichos.

En el Anexo A se muestran los principales avances y los desafíos encontrados en estas

investigaciones (Tabla A–1) que sirven como hoja de ruta para descubrir particularidades

del uso de las aproximaciones para determinar radiación solar. En estos trabajos los

métodos de evaluación de precisión son diferentes. Algunos como R, coeficiente de

correlación cuadrado R2 y el error cuadrático medio RMSE se utilizan a menudo [42], [45],

[46]. Otro tipo son: MBE, MAE y error relativo medio MAPE usados no tan frecuentemente

[47].

Otra característica en estos trabajos es el tiempo de evaluación del modelo. Algunos de

ellos analizaron la precisión del modelo durante un periodo de uno o varios meses, incluso

años, además de tener presente las estaciones climáticas y la variabilidad asociada. En

estas condiciones es difícil hacer comparaciones. Existen documentos como [48] en el cual

se lleva a cabo una revisión de la literatura sobre la precisión de pronóstico y técnicas

aplicadas a sistemas de energía renovable, principalmente solar y eólica. En la siguiente

sección se presentan las diferentes metodologías utilizadas que tienen su base en el ML

Page 32: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

14 Modelo de pronóstico de radiación solar basado en Machine Learning.

usadas para predecir radiación global y los parámetros para estimar los rendimientos del

modelo. En la Figura 2-1, se muestran las técnicas para estimar radiación solar y algunos

trabajos clasificados.

Figura 2-1: Clasificación de técnicas de estimación de radiación solar.

Fuente: elaboración propia.

2.3 Predicción de radiación solar.

El Machine Learning, ML, es un subcampo de las ciencias de la computación y se clasifica

como un método propio de la inteligencia artificial IA. Este se usa en muchos dominios y

campos, entre los que destaca: energético, económico y biológico. La ventaja de este

método es la generación de un modelo que puede "tomar" decisiones que serían difíciles

de ser representadas por algoritmos explícitos, como las aproximaciones numéricas y

analíticas simples. Según [49] los modelos ML encuentran relaciones entre entradas y

salidas siempre que la representación sea posible.

En ML existen 3 etapas: la primera una etapa de pre procesamiento y clasificación de

datos, la segunda la entrada de datos y la última etapa está dada por el tratamiento de la

desviación entre el dato estimado y el dato medido.

Page 33: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 2 15

Además, para aplicar un modelo ML se debe tener en cuenta criterios como:

• Tratamiento de la no-linealidad,

• Comportamiento al usar múltiples entradas.

• Horizonte de predicción.

• Tratamiento de la desviación asociada a la predicción

• Flexibilidad.

Estos criterios dan pautas en el desarrollo del modelo al tener en cuenta que la desviación

y habilidades de pronóstico de los modelos no dependen solo de las condiciones climáticas

sino también del horizonte de predicción. Estos procesos, enmarcan la aplicación del

modelo de predicción en una región en particular.

Para aplicaciones en predicción de radiación solar, el uso de ML fue evolutivo al abordar

el problema de la alta no-linealidad de los datos y su fuerte variación. Las primeras técnicas

fueron las NN, su concepto y uso se ampliará más adelante y se trataban en su momento

como parte de la IA. En trabajos anteriores a [50], [51], no se utilizaba una etapa de pre-

procesamiento a la entrada del modelo NN. A partir de estos trabajos se encuentra una

correlación de entrada entre datos climáticos y la radiación. Este proceso es una primera

aproximación para seleccionar datos climáticos de entrada más adecuados al modelo a

desarrollar. En la Figura 2-2 se muestra la evolución temporal de las técnicas utilizadas en

predicción y estimación de radiación solar.

Page 34: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

16 Modelo de pronóstico de radiación solar basado en Machine Learning.

Figura 2-2: Evolución temporal del uso de técnicas para predicción y estimación de radiación solar.

Fuente: elaboración propia

Según como avanzaba el tiempo el problema de la predicción de un recurso altamente no

lineal presentaba desafíos. En un principio bastaba con generar una relación determinística

entre radiación extraterrestre/incidente (aproximación numérica), pero los resultados eran

fuertemente geolocalizados y la herramienta poco servía en aplicaciones de estimaciones

globales de recurso primario [34]–[36]. Estudios posteriores confirmaron que para

determinar y predecir un recurso primario variable y dependiente de otros datos climáticos

la mejor alternativa era generar modelos en base a históricos. Las primeras

aproximaciones fueron NN. Según [52] existen conceptos propios de NN e IA que fueron

heredados tiempo después por el ML.

El término ML propiamente dicho para predicción de radiación solar, no aparece en la

literatura sino hasta 2011 donde, en una primera aproximación se habla del aprendizaje

desde los datos de entrada [53]. En este trabajo se desarrolla un algoritmo NN con

entradas seleccionadas mediante técnicas que establecen relaciones entre los datos de la

entrada y la salida.

Page 35: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 2 17

En ML, se clasifica el modelo según el número de técnicas usadas. Si se usa una sola

técnica desde la entrada de datos hasta la etapa final, normalmente sin pre procesamiento,

se denomina modelo unitario. Si se usan dos o más técnicas por etapa, con procesamiento

de datos presente, se denomina modelo híbrido.

A continuación, se muestran diferentes predictores ML unitarios que la literatura presenta

para generar predicción de recurso primario. Los desafíos a los que se enfrentaron los

autores y los avances que mostraron.

2.3.1 Procesos de Markov.

Un proceso de Markov es un proceso estocástico con propiedades Markov, lo que significa

que, dado el estado actual, los estados futuros son independientes de los estados

anteriores. Es decir, la descripción del estado actual captura toda la información que podría

cambiar la evaluación de la función de valores futuros. En trabajos como [54], [55] los

valores predichos se alcanzan a través de un proceso probabilístico en lugar de uno

determinista. En esta aproximación los datos de radiación se convierten a un número

cuantificado entero de estados. Luego, pasan por una etapa de entrenamiento que forma

los valores de probabilidad, finalmente pasan por pruebas de parámetros ocultos. Las

pruebas se repiten para varios estados que dependen del número de predictores

probabilísticos que se desarrollan en cada etapa. La ventaja de estos algoritmos es

considerar las secuencias de eventos de entrada y construir dependencias transitorias

entre el dato a predecir y el dataset de entrada. Sin embargo, hay una falta del conteo

global para modelar y requiere una suposición inicial para generar las distribuciones, si no

se estiman con una etapa de pre procesamiento óptima puede dar lugar a errores.

2.3.2 Otros algoritmos.

Otros métodos se usan esporádicamente. Según los trabajos publicados los parámetros

que influyen en la predicción son muchos, entre ellos: datos de entrada, parámetros

Page 36: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

18 Modelo de pronóstico de radiación solar basado en Machine Learning.

específicos del modelo, coeficientes de relación, algoritmos de optimización, entre otros.

En ese contexto otros métodos que presenta la literatura son: ANFIS, ARIMA, ARMA.

En [56] se desarrolla un modelo ANFIS entrenado por MLP cuya principal ventaja es

modelar radiación con coordenadas geográficas, la cual hace las veces de entrada al

modelo. El desempeño según los autores es superior si se usa RBFN y Redes neuronales

de regresión (RNN), en gran parte a la combinación del MLP en la etapa de entrenamiento

que pondera y calcula la mejor combinación de entrada. Luego por el algoritmo Fuzzy se

clasifica y finalmente se da una respuesta.

En trabajos como [57], [58] se utiliza un algoritmo ARIMA para predecir radiación en 6

ciudades. Los resultados muestran que existen ventajas en el desempeño de ARIMA sobre

NN en el caso de timestep de datos superiores a 5 minutos, de lo contrario en resoluciones

de datos altas (entre 1 minuto y 4 minutos) NN presenta mejor comportamiento. Esto

conduce a concluir que la elección del modelo depende directamente del dataset de

entrada. ARIMA modela de mejor manera el ciclo de radiación diaria, en dataset de larga

duración. Lo anterior hace que no sea necesaria una etapa de entrenamiento debido al

comportamiento lineal de la radiación en la base de datos. El costo computacional también

es evaluado en estos trabajos. Se muestra que ARIMA tiene menor costo computacional,

en parte debido a las aproximaciones lineales con las que desarrolla la estimación.

En [59] usa ARMA como una parte del modelo. Modela la radiación incidente como una

superposición de componentes lineales y no lineales. Este modelo tiene desventajas

puesto que tiene un desempeño aceptable en intervalos donde la radiación es constante y

casi lineal, pero en cambios bruscos la desviación es superior al 30% del valor medido. En

[60]se hace un estudio comparativo donde se considera el horizonte de predicción. Según

el autor ARMA y MLP tienen un comportamiento similar para horizontes de día y hora

siguiente. Además, tienen valores de desviación similares en las etapas de validación y

prueba cuando se comparan con otros algoritmos.

En un estudio posterior [61], confirma lo que se muestra en estudios previos. La

metodología ARMA usada es una herramienta muy eficiente para generar pronósticos

puntuales a muy corto plazo. El modelo supera en aproximadamente un 20% a los

algoritmos estadísticos usados en la comparación.

Page 37: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 2 19

2.3.3 Lógica Difusa (Fuzzy Logic).

En lógica difusa lo primero que se hace es elegir el número de variables de entrada. Las

variables de entrada y salida pertenecen al mismo conjunto de datos. Es por eso que en

las primeras aplicaciones [22], [29], [55], [62], [63] se usó como una etapa de pre

procesamiento a la entrada. Debido a su gran precisión en la generación de las funciones

de membresía en estos trabajos se muestra la clasificación en días: soleado, soleado-

nuboso, nuboso, nuboso-lluvia, soleado-lluvia, entre otros. Los datos para poder clasificar

los días en estos escenarios se caracterizan por los mismos atributos en timestep y las

mismas funciones de pertenencia.

En otros trabajos como [64], [65] se desarrollan modelos basados en Fuzzy Logic. En

varias etapas como cálculo del componente de cielo abierto, y luego caracterización, del

día, que se basa en una correlación entre variables climáticas de entrada logran por medio

de reglas preestablecidas generar el modelo total. La desviación en estos trabajos respecto

de NN es mayor en aproximadamente un 5%.

Trabajos como [66], [67] ha comparado esta técnica con otros algoritmos. Se muestran

resultados aceptables cuyo desempeño es mayor. Sin embargo, en estos trabajos utilizan

etapas de Fuzzy con hibridación de otros algoritmos.

2.3.4 Árboles de decisión (Decision tree).

Se usa en trabajos como [68]. La idea básica en este algoritmo es muy simple. Se debe

pronosticar una respuesta 𝑦 a partir de las entradas 𝑥1, 𝑥2, . . . , 𝑥𝑝. Para esto se diseña un

árbol binario. En cada nodo del árbol se aplica una prueba a la entrada comparándola con

un valor determinado. Con este resultado se decide entre la subdivisión izquierda o

derecha. Este algoritmo es muy dependiente de los horizontes de predicción, los datos a

la entrada y varía los resultados entre uno y otro árbol.

Page 38: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

20 Modelo de pronóstico de radiación solar basado en Machine Learning.

2.3.5 Máquinas de vectores de soporte (Support vector

Machine SVM).

Usada en sus orígenes para solucionar problemas de clasificación, hoy en día son

aplicadas a problemas de regresión y reconocimiento de patrones.

La predicción calculada mediante una máquina de tipo SVM está dada como lo muestra la

Ecuación 2-4:

�� = ∑ 𝛼𝑖𝑘𝑟𝑏𝑓(𝑥𝑖 , 𝑥∗) + 𝑏𝑛𝑖=1 (2-4)

Donde 𝑥∗ es una entrada de prueba. 𝐾𝑟𝑏𝑓 es una función de activación definida mediante

un proceso GP´s. El parámetro 𝑏 o parámetro independiente se deriva de condiciones

específicas, además de la incertidumbre asociada con la estimación. En el caso de SVM

los coeficientes de aprendizaje 𝛼𝑖 , están relacionados con la solución de problemas de

programación cuadrática.

El punto fuerte de este algoritmo, según [69] es su capacidad de resolución de problemas

de alta complejidad y alta no-linealidad. Trabaja sobre regresión lineal múltiple y usa un

transformador predictivo de baja complejidad con filtrado de datos.

En trabajos como [70]–[72], se utiliza el algoritmo SVM como técnica de estimación de

radiación solar. En el primero de estos se introduce el concepto de ML en trabajos de este

tipo. Si se compara SVM con modelos numéricos se encuentra que la incertidumbre

asociada al valor estimado disminuye cerca de un 35% con el uso de SVM. Al ser un

algoritmo que aprende de los datos depende directamente del pre procesamiento, lo que

traduce en un desempeño aceptable pero que es computacionalmente demandante. En

estos trabajos se muestra que este tipo de algoritmo es muy dependiente de la función de

activación usada, lo que hace difícil comparar su desempeño entre ellos.

Page 39: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 2 21

2.3.6 K-nearest neighbors.

Esta técnica está basada en un algoritmo de reconocimiento de patrones el cual compara

el estado original con las muestras entrenadas. Según [32] este modelo predefine las

vecindades más próximas al dato que se busca. Este tipo de modelo es usado en casos

donde se tiene un número de días con radiación y perfil similar.

En [73] el horizonte de predicción comprende desde 5 hasta 30 min. a futuro y los

correspondientes intervalos de incertidumbre. Un algoritmo de optimización determina el

número de vecinos más cercanos. Los resultados de este trabajo muestran que los

cambios abruptos en el dataset de entrada no se capturan de forma eficiente por

pronósticos puntuales, esto principalmente porque esos eventos están sub representados,

por faltantes en la medida, en el conjunto de entrada, lo que genera que el cálculo del

vecino más cercano no sea el correcto.

2.3.7 K-means.

Es un método de cuantificación de vectores de entrada. Esta técnica usada en [59], [74],

[75] divide las observaciones de entrada de radiación en clústeres en los que cada

observación pertenece al clúster con la media más cercana, que sirve como prototipo de

clúster. Resalta la diversidad de respuesta al poder procesar datos lineales y no lineales a

la entrada. En estos trabajos se encuentran patrones de similitud entre la salida y la

entrada. Además, no están presentes datos climáticos diferentes a radiación. Con el uso

de diferentes técnicas (distancia euclidiana, método de inserción mínima) se encuentra el

valor vecino más óptimo para clasificación.

Page 40: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

22 Modelo de pronóstico de radiación solar basado en Machine Learning.

2.3.8 Redes neuronales (Neural Networks NN).

Las NN pueden aprender de los patrones de información dentro de un conjunto de datos.

Son tolerantes a desviaciones debido a la falta de datos en la entrada, una característica

frecuente con los datos de recurso primario: viento y radiación solar [76], [77].

En [78] se hace una revisión de aplicación de NN en el campo energético, aplicaciones en

la construcción de sistemas térmicos, predicción de demanda y tarificación de usuarios de

energía eléctrica, hasta la predicción de recurso primario.

Las NN fueron las primeras técnicas que se implementaron para predecir los eventos

asociados a aproximar variabilidad en recursos primarios de generación de energía [78]–

[80]. Esto se debe a que el algoritmo NN es capaz de capturar de manera confiable la

naturaleza no lineal de la radiación solar. Según [32] alrededor del 79% de las técnicas

usadas en predicción de radiación se basan en un enfoque de conexiones con red

neuronal. Aproximadamente el 20% restante se utilizan técnicas derivadas de redes

neuronales tales como lógica difusa, wavelength, RBFNN.

Una reseña de la utilización de este tipo de técnicas se presenta en trabajos [30], [31], [51],

[53], [71], [77], [80]–[104]. En estos trabajos se distinguen dos tipos de estudios: modelado

con multicapas MLP, y predicción con series temporales. De hecho, MLP se utiliza con

mucha más regularidad que otros algoritmos por su propiedad de "aproximación universal"

capaz de desarrollar predicción no lineal. Además, existen trabajos que utilizan diferentes

algoritmos de optimización en la etapa de entrenamiento del modelo, Back Propagation,

BP, gradiente descendente, LVQ, entre otros. En la etapa oculta, característica de este

modelo, el número de neuronas, por lo general, es determinado a partir de ensayo/error,

por lo que difiere significativamente entre uno y otro trabajo. Sin embargo, se encuentra

que a mayor número de neuronas en las etapas anteriores a la predicción la desviación

disminuye.

Los primeros trabajos se realizan entre 1998-1999. En [76], [105] usan un modelo NN con

algoritmo BP en la etapa de entrenamiento. Los autores encuentran correlaciones entre

datos climáticos (presión atmosférica) y radiación solar. En una primera aproximación se

Page 41: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 2 23

clasifica la radiación en alto, medio y bajo, que será una constante en los trabajos

subsiguientes. Los resultados en predicción muestran una desviación entre el 18% en

verano y 21% en invierno.

En los trabajos que usan NN [30], [31], [51], [53], [71], [77], [80]–[104], la desviación

asociada a la predicción, con horizontes variables: intra-horario, intra-diario, hora siguiente

y día siguiente están entre 7 % y 15 %. Se muestra una variación entre estudios debido a

que algunos usan etapas de pre procesamiento lo que hace que la desviación disminuya,

además que se debe tener en consideración la desviación producida al considerar la

variación estacional.

En el Anexo B se muestran los resultados de métodos ML unitarios usados en predicción

de radiación solar (Tabla B–2). En la Figura 2-3 se muestra la cantidad de trabajos

publicados que usan modelos ML para predicción de radiación solar.

Figura 2-3: Tendencia en número de trabajos publicados que hacen uso de técnicas ML

en predicción y estimación de radiación solar.

Fuente: elaboración propia.

Page 42: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

24 Modelo de pronóstico de radiación solar basado en Machine Learning.

La tendencia indica que a un mediano y corto plazo ya no es común trabajar con un

predictor unitario, sino con un predictor híbrido. Estos son diseñados mediante la

combinación de dos o más predictores con atributos superiores y aprovecha fortalezas

individuales. Estas fortalezas se ven reflejadas en las etapas de ML. Cada etapa tiene

combinación de dos o más técnicas, esto traduce en una mejor precisión (alrededor del

40%) en el modelo. Al comparar el resultado que entregan los modelos unitarios con el

entregado por modelos híbridos el rendimiento de estas últimas es superior [32].

2.3.9 Modelos híbridos y consideraciones finales.

Uno de los primeros trabajos que desarrollaron modelos híbridos fue [50]. Este modelo

consta de 2 etapas: la primera usa NN para predecir valores de radiación solar mensual.

La segunda etapa normaliza los valores de radiación los cuales hacen de entrada a la

matriz de Markov. La desviación en este trabajo es cercana al 8% versus los modelos

lineales y estadísticos con los que fue comparado. Este modelo es capaz de capturar el

carácter no lineal de la radiación y ponderar probabilidades de suceso para encontrar el

predictor.

En el Anexo C (Tabla C–3) se muestran soluciones que combinan métodos ML. Como se

observa, la técnica de hibridación da mejores resultados que usar predictores simples. Sin

embargo, la mejor combinación de predictores para generación de un modelo de

hibridación estándar no está definida. Se necesitan muchos más trabajos para proponer

una metodología robusta que englobe todas las situaciones presentadas en el tratamiento

de datos climáticos.

Bajo el concepto híbrido de predicción se define una topología por etapas, como lo muestra

la Figura 2-4. Ejemplos de predicción bajo esta topología son [106]–[108]. En estos trabajos

se tratan los datos de entrada como señales, las cuales deben pasar por tres procesos: el

primero es el pre procesamiento, en esta etapa se definen los tipos y categorías de datos,

su estructura y normalmente se usa técnicas asociadas para suplir el faltante de datos. El

segundo es el de agrupamiento en el cual se definen perfiles de clima y tendencias de

clasificación en los datos que conforman el clima, sea diario o mensual y finalmente la

Page 43: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 2 25

estimación, en este proceso se establecen relaciones entre entrada/salida a fin de

encontrar la mejor relación que defina un perfil de recurso primario.

Figura 2-4: Topología de prediccion de radiación solar tipo modelo híbrido.

Fuente: elaboración propia.

Además, existe realimentación, puesto que se debe comparar la estimación de salida con

datos de entrada y estimar la desviación e incertidumbre, a fin de determinar el desempeño

del modelo. Cada etapa, excepto los datos de entrada, está constituida por 2 o más

predictores unitarios. Es así como en [109] y [110] se usan predictores unitarios a la

entrada de los datos y en el agrupamiento. En el primer trabajo se usa NN como kernel de

SVM lo que hace que la desviación del modelo sea menor (< 2 %) respecto a los modelos

comparados. Mientras que en el segundo se usa SVM como criterio de comparación para

generar un ciclo de retroalimentación en la entrada del modelo.

Cabe resaltar que no existen algoritmos predefinidos para cada etapa, pero es posible

establecer una tendencia de uso. Así es como en el modelo para la etapa de pre

procesamiento se usan k-NN, Fuzzy y árboles de decisión. En la etapa de agrupamiento y

estimación NN y SVM [65], [101], [111]–[113].

Los modelos ML que se usan en predicción de recurso primario pueden integrarse como

herramientas de decisión en los procesos de planeación de sistemas FV y en cuantificación

de reservas energéticas. En el caso del primero, al poder predecir variabilidad de recurso

primario es posible agregar sistemas FV geográficamente distribuidos en regiones donde

el recurso sea alto. En el segundo aspecto, si existen reducciones de energía imprevistas

el sistema FV debe ser capaz de mantener el servicio al aumentar la reserva en días donde

el recurso primario sea alto y estable y establecer así planes de contingencia en periodos

donde el recurso sea menor. En la siguiente sección se amplía el uso de estas técnicas y

Page 44: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

26 Modelo de pronóstico de radiación solar basado en Machine Learning.

modelos como herramientas de soporte en la toma de decisiones y planeación de

tecnología solar FV a futuro.

Page 45: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

3 Capítulo 3.

El tener certeza y una cuantificación de recurso primario en una

determinada región geográfica permite establecer procesos futuros en

planeación para instalación de sistemas FV. Dentro de esos procesos

se debe contar con hojas de ruta que identifiquen zonas solares que

cuenten con los recursos primarios necesarios para garantizar el

servicio de electricidad en caso de imprevistos. Muchos países integran

herramientas de cuantificación de recurso y evalúan como la precisión

del modelo es clave para planear sistemas FV. En Colombia existen

acercamientos al uso de cuantificación de recurso primario en

planeación; sin embargo, son insuficientes [14] y es por eso que se

proponen elementos a futuro para la integración de estas herramientas

predictivas en planeación.

Page 46: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

28 Modelo de pronóstico de radiación solar basado en Machine Learning.

3.1 Integración de técnicas de predicción en la toma de decisiones y en escenarios de planeación.

3.1.1 Estimación de recurso primario aplicado en escenarios

de planeación.

La estimación de recurso primario solar se convierte en una herramienta en la planeación

del sector eléctrico. Los responsables de la toma de decisiones dependen cada vez más

de evaluaciones técnicas, tanto para cuantificar el recurso primario, como para informar el

desarrollo de políticas para establecer la hoja de ruta y programas en la promoción de

energía solar FV [114].

En el proceso de planeación de un sistema FV, según [115] existen 4 estados que deben

ser evaluados:

1. Planeación de generación a largo plazo, con un periodo de 10 a 40 años.

2. Planeación geo-espacial para transmisión, Un periodo de tiempo de 5-20 años.

3. Simulación de despacho, con un tiempo no mayor a semanas o meses.

4. Estudios técnicos de red, con un tiempo mayor a 5 años.

Según [115], [116] la predicción y estimación de radiación solar, está enmarcada en el

primer estado. El proceso de planeación debe empezar por cuantificar potenciales de

recurso primario de tal manera que las etapas subsiguientes sigan la línea de proceso. Los

modelos de predicción deben ser herramientas de decisión para generar un documento

maestro que brinde una hoja de ruta en la regulación, estabilidad y confianza de los

sistemas FV. Con la cuantificación de recurso primario entidades nacionales, empresas o

institutos académicos desarrollan escenarios a largo plazo para evaluar cuantitativamente

y cualitativamente la dirección que debe seguir el futuro energético renovable y las

implicaciones de tomar una vía de desarrollo en el sector de las FNCER en lugar de otras

[117].

En la Figura 3-1 se muestra la integración de la información de potencial de radiación solar

en la planeación del sector energético a largo plazo cuando se identifica una necesidad

energética. La necesidad energética de una región está presente y surge como un

problema a resolver. Para poder cubrir la necesidad de energía eléctrica, con base a

Page 47: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 3. 29

energía solar FV el primer reto es obtener información de potencial de recurso primario, a

fin de cuantificar la radiación incidente.

Figura 3-1: Diagrama de flujo para planeación al tener en cuenta recurso primario.

Fuente: adaptado de [118].

En la Figura 3-1 se hace énfasis en el proceso de obtener información del potencial de

recurso primario, existen etapas asociadas desde adquirir los datos hasta el análisis de

resultados. Luego de esto, se desarrollan escenarios de planeación más elaborados, con

la revisión/aprobación gubernamental, quien dicta las disposiciones y regulaciones para la

FNCER a fin de evaluar vías de inversión concretas para proporcionar electricidad

confiable y asequible. Todo lo anterior debe estar plasmado en un documento maestro

como respuesta a un requisito de energía para lograr la aspiración del uso de una FNCER.

Este documento debe ser un elemento en el que se resuelva, en el caso de energía solar

FV, cuestiones como: el tipo de infraestructura a usar, combinación apropiada de

tecnologías, mejor uso de recursos naturales y por supuesto la región geográfica donde

habrá un potencial solar de desarrollo mayor.

Page 48: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

30 Modelo de pronóstico de radiación solar basado en Machine Learning.

Para maximizar los beneficios de cuantificación y predicción de radiación incidente se

integra este proceso en planes de promoción de energía solar FV cuyos objetivos son:

contar con un concepto en el dimensionamiento de sistemas FV, promover la utilización de

fuentes descentralizadas de energía en zonas aisladas y cuantificar las reservas

operativas [117].

En la Tabla D-4 se muestra una síntesis de trabajos donde se desarrollan herramientas de

cuantificación de recurso y se integran como elementos activos en la planeación de

sistemas FV. Estos trabajos visibilizan el uso de la cuantificación por diferentes

aproximaciones y los insertan en programas cuya finalidad es conocer y resaltar recurso

solar distribuido geográficamente y poder trazar la política pública de integración de

energías solar FV con el sistema interconectado.

Trabajos como [119]–[122] usan SIG. En estos trabajos, se integra la herramienta como

parte de un programa energético estatal donde se tiene como objetivo promocionar e

insertar varios recursos naturales en la matriz energética. Se evalúan los aspectos según

sectorización geográfica, y se recomienda la fuente energética más viable de ser

implementada. En [120] el autor va más allá al plantear un escenario regulatorio según sea

la fuente que se implementará lo que genera hojas de ruta y planes a futuro sectorizados

por consumo. Mientras que [121] diferencia usuarios según su consumo y propone un

paquete de medidas: identifica la demanda de estos y propone la fuente energética más

recomendada. Los sistemas de información que se plantea en estos trabajos tienen por

objetivo descubrir lo que pasaría si determinadas decisiones energéticas se toman con los

recursos naturales disponibles.

La idea de adecuar planes maestros o MPE que hagan uso de modelos de predicción ML,

es reciente [118]. En este trabajo se expone por parte de los autores que estos planes

desempeñan un papel indispensable en la formulación de políticas y el desarrollo del sector

energético. Según este trabajo el corazón del MPE es poder cuantificar recurso ya que ahí

se desprenden las distintas etapas en el proceso de promoción de recursos naturales para

su uso como fuentes energéticas para producción de electricidad.

En [122], [123] se muestra como en base a técnicas de cuantificación de recurso primario

es posible determinar regiones geográficas óptimas donde las fuentes solares se

Page 49: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 3. 31

integrarían al sistema interconectado con reducidos impactos sobre la red. En [123] analiza

aspectos económicos derivados de la inserción de nuevas tecnologías en el sistema

interconectado y propone un esquema tarifario según sea la región geográfica de

aplicación.

A medida que la participación de energía solar FV aumenta en los sistemas de energía se

han expresado preocupaciones sobre la idoneidad de herramientas y metodologías

existentes para planificación eléctrica solar [9], puesto que usa un recurso primario

variable. Si bien se han llevado a cabo estudios de integración de energía solar FV [116],

[124]–[129] estos generalmente evalúan como se deben reforzar los sistemas de energía

eléctrica actuales, para lograr una mayor proporción de sistemas FV.

Según los autores[116], [129] para maximizar los beneficios del recurso solar, se debe

tener en cuenta en la estimación de recurso solar tanto las escalas espacio-temporales y

la planeación estratégica a gran escala. Proponen además que la generación de

electricidad solar debe considerarse en conjunto con los desafíos a la gestión para la

regulación y transmisión de energía eléctrica.

Existen trabajos donde se da valor agregado al análisis y predicción de recurso primario

con base a históricos y tomar decisiones al tener en cuenta estos datos [130]. Es así como

se promociona estas técnicas como una forma de evitar penalizaciones a los ojos de la

regulación existente. Si no se tiene una cuantificación de recurso primario se puede inducir

a la inseguridad del sistema eléctrico, lo que se traduce en riesgo y alta incertidumbre para

el usuario final.

Los modelos ML se pueden tener en consideración como herramientas en la cuantificación

de reservas potenciales operativas y de ahí derivar mayor capacidad de respaldo. Si se

considera la aplicación de técnicas ML en predicción se reduce la necesidad de que los

sistemas mantengan un nivel mayor de reservas. Con el fin de garantizar la prestación del

servicio, el modelo debe ser capaz de responder a reducciones imprevistas en la

generación convencional y poder asistir. La respuesta del modelo se debe analizar con

detenimiento para cuantificar la cantidad de reservas adicionales que se necesitan y poder

agregar recursos geográficamente distribuidos según sea la región con mejor perfil de

radiación [127].

Page 50: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

32 Modelo de pronóstico de radiación solar basado en Machine Learning.

La Figura 3-2 muestra los tópicos en planeación que se derivan de la precisión en el uso

de un modelo ML predictivo. La precisión en la resolución espacio-temporal determina que

tópico de la fuente energética se estudiará: planeación a largo plazo para transmisión -

generación y contratos de subasta energética, elementos que dependen de la respuesta

del modelo para poder implementarse. El ámbito regulatorio es un elemento que también

depende de la precisión del modelo. El implementar regulación depende de cuan alejado

este la fuente solar de los centros de carga que ocurren desde escalas de miles de

kilómetros a decenas de metros.

Figura 3-2: Escalas espacio-temporales y tópicos de estudio en planeación.

Fuente: adaptado de [129].

La Figura muestra que existe una relación directa entre la resolución espacio temporal, el

clima y las decisiones que se soporten en base al modelo que se desarrolla. Es así como

para una resolución diaria y de menos de 100km se necesita un perfil de datos climáticos

sintéticos, es decir, un modelo exógeno. Este modelo se integra para resolver problemas

para seguridad en el suministro de los sistemas FV, generar perfiles de radiación y

distribución de recurso primario en una región. Para estudios de otros tópicos como

variaciones en tensión, cambios de frecuencia, armónicos y criterios de interconexión se

´

Page 51: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 3. 33

necesita una respuesta más precisa por parte del modelo y un estudio geográfico más

preciso al considerar el movimiento de nubes bajas que causan efectos de sombra en

tiempos cortos.

En la siguiente sección, se muestran ejemplos del uso de la estimación de radiación solar

en un contexto internacional y la aplicación de un estudio de caso en Colombia.

En la primera parte, se muestra como varios países han puesto en marcha estudios e

investigaciones donde se pretende estimar en algunos casos y predecir en otros, recurso

primario para planear sistemas solares, ya sea térmicos o FV. En la segunda parte se

consideran y muestran elementos de planeación de sistemas FV en el país, las barreras

que se identifican para la promoción y desarrollo de la fuente solar y finalmente una

propuesta de predicción solar mediante ML.

3.2 Uso de la predicción y estimación de recurso solar primario como herramienta de decisión en planeación: una visión mundial.

Diferentes países apuestan por una transición energética cuyo objetivo es diversificar su

matriz de generación a fuentes renovables. En un primer escenario, estos países

desarrollan herramientas ya sea en forma de mapas, o vía web que evalúan y dan idea del

potencial de recurso primario presente. Con esta información los países generan un plan

de desarrollo donde está enmarcado su modelo de expansión de generación a largo plazo.

A continuación, se resumen los principales trabajos que se realizan para estimar y predecir

radiación solar, en algunos se desprenden elementos asociados a la planeación, en casos

como: Chile, México, Brasil, Alemania se amparan en legislación gubernamental.

Para el caso chileno, el modelo usa mediciones en tierra e imágenes satelitales de

radiación, con el fin de presentar una herramienta denominada Explorador Solar [131].

Esta herramienta permite visualizar, vía web, en tiempo real el recurso primario. Se basa

en un modelo numérico endógeno de transferencia radiactiva empírico, que usa históricos

de bases de datos e imágenes además de un calculador de índice de sombra.

Page 52: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

34 Modelo de pronóstico de radiación solar basado en Machine Learning.

Conjuntamente con este explorador, el Ministerio de Energía chileno presenta elementos

para el dimensionamiento del sistema fotovoltaico [132] según la región geográfica a

implementar y el proceso para su posterior integración al sistema eléctrico chileno.

En México, desarrollan un estudio donde evalúan el potencial del territorio mexicano en

recurso primario [133], en este trabajo se tiene en cuenta un modelo numérico que usa

como entrada, temperatura ambiente y coordenadas geográficas. Como resultado se

obtienen mapas de recurso solar sobre una superficie horizontal. Para cada estado se

identifica el valor mínimo y máximo del recurso solar y dichos valores se consideran para

elaborar el mapa que proporciona datos del recurso solar mexicano. En el mismo

documento con los perfiles por Estado, los autores realizan un análisis de implementación

de sistemas FV por sector: Industrial y residencial. Este análisis se basa en la tarifa del

servicio de electricidad y como al desplegar sistemas FV esta tarifa tendrá cambios,

también proponen en el momento de la instalación de sistemas solares elementos que

deben cambiar en la regulación actual mexicana para promocionar estos sistemas con

FNCER.

En Estados Unidos, con el desarrollo del modelo el objetivo es identificar áreas geográficas

donde el recurso primario sea alto y así poder instalar un sistema FV. Esta identificación

está sujeta al área disponible en techo [134]. Para calcular radiación se utiliza una base de

datos anuales e imágenes satelitales. Debido a que cada estado puede establecer sus

propios estudios de recurso primario [135], es difícil hacer una revisión de todos. Sin

embargo, en este estudio hacen la salvedad de ser aplicado en cualquier estado del país.

Los estudios realizados sugieren un esquema de tarificación que tenga en cuenta al área

del techo, la radiación promedio mensual y el tamaño del sistema.

En el caso de Brasil y Alemania los estudios realizados son muy similares en el modelo

que desarrollan para estimar radiación solar. En el primero, [136] con el uso de la

herramienta de cuantificación de recurso, se pretende generar una matriz energética

diversificada. La herramienta usa un modelo que se basa en análisis de imágenes y toma

de datos en tierra, después de un procesamiento genera los mapas de radiación el cual

considera latitud y longitud geográfica. En el segundo el trabajo [137] se enfoca en el uso

de METEOSTAT como herramienta, una combinación de aproximaciones numéricas y

analíticas que generan el mapa por ciudad Alemana. De este trabajo se derivan dos

Page 53: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 3. 35

herramientas: la primera evalúa el desempeño de sistemas FV instalados en una región,

su respuesta en la red y el segundo una herramienta para calcular el COP, de una planta

solar térmica. En ambos casos se sugiere un modelo de tarificación diferenciada que

depende de la radiación incidente en el lugar.

Trabajos en regiones del mundo como Arabia Saudita [138], Paraguay [139], [140],

Uruguay [141] y España [142], desarrollan atlas solares que cuantifican potencial solar en

una región. Estas herramientas permiten consultar valores por mes y año de la radiación

incidente en un lugar; sin embargo, no toman en cuenta más datos climáticos que tienen

influencia directa en la estimación de radiación.

En la Tabla 3–1 se muestra el nombre, el objetivo de la herramienta, el tipo de base de

datos y el tipo de aproximación. Existen países como Uruguay Paraguay y España que

usan su herramienta solamente para tener una referencia de cuantificación de recurso

primario En cambio, en Chile, México y Estados Unidos, van más allá de una referencia y

con el soporte de la herramienta generan elementos para el dimensionamiento de sistemas

FV y su posterior integración al Sistema Eléctrico. En Alemania y Arabia Saudita,

desarrollan planes energéticos de diversificación de la matriz de generación eléctrica con

base en la herramienta, además de determinar lugares geográficos óptimos y un esquema

de tarificación dependientes del recurso primario.

Tabla 3–1: Trabajos desarrollados para estimar y predecir recurso solar primario

País. Herramienta. Objetivos.

Datos

Climáticos

usados

Tipo de

aproximación.

Chile [131] Explorador

Solar.

-Estimar potenciales de recurso primario

chilenos.

-Calcular la contribución solar mínima

en el caso de sistemas solares térmicos.

Endógenos Numérica.

Page 54: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

36 Modelo de pronóstico de radiación solar basado en Machine Learning.

México [133]. Mapa de

recurso solar.

-Potencial por estado del uso de

sistemas FV interconectados para

diferentes sectores.

-Analizar el beneficio-costo derivado de

cada sector estudiado.

-Determinar impacto de la temperatura

sobre el desempeño del sistema FV.

-Revelar nichos de oportunidad que

tienen los sistemas FV por sector y

estado.

Estructurados. Numérica.

Estados

Unidos [134]. Solar Screening.

-Evaluación en techo del sistema FV

según la localización geográfica.

-Determinar incentivos para proyectos

que pueden tener una viabilidad

económica.

-Determinar la producción de

electricidad solar mediante simulación

de sistemas FV.

Estructurados. Series de tiempo.

Brasil [136]. BRASIL-SR

Potenciales regionales de radiación

solar.

-Propuesta de regulación en base a

radiación sectorizada.

Endógenos. Analítica.

Alemania

[137]. Heliostat.

-Determinar radiación solar por

ciudades.

-Elaborar esquemas de tarificación

dependientes del recurso.

Endógenos. Numérica/analítica.

Arabia

Saudita [138].

RRMM Solar

Measurement

Network

Determinar lugares geográficos óptimos

para instalación de sistemas FV. Endógeno. Numérica.

Paraguay

[140]

Mapa de

radiación solar.

-Determinar potenciales regionales de

recurso primario. Estructurados Numérica

Uruguay

[141]. Mapa solar.

-Evaluar el potencial solar térmico en

Uruguay

-Analizar la factibilidad de su utilización.

Endógenos. Numérica.

España [142].

MAGICSOL y

Mapas de

radiación solar.

Caracterizar regiones por su recurso

primario. Exógenos. Analítica.

Fuente: elaboración propia.

Page 55: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 3. 37

La Tabla 3–1 muestra que la tendencia de uso para el desarrollo del modelo son las

aproximaciones de tipo numérico. Usan principalmente relaciones polinómicas entre la

radiación extraterrestre y la radiación medida en tierra. En cuanto a la base de datos que

usan los modelos no hay un consenso. Mientras que en [131], [138], [140], [141] su base

de datos son estaciones meteorológicas en tierra a distintas ubicaciones geográficas, en

otros casos [133], [134], [142] usan bases de datos de Nasa u otros proveedores externos

alojados en la web. Otro tipo de modelo usa análisis de imágenes como en el caso de

[137]. Estos trabajos usan una base de datos de referencia llamada TMY sin considerar

otros datos climáticos diferentes a radiación promedio anual y temperatura. Estos datos

alimentan el modelo que se desarrolla como una función de la temperatura y localización

geográfica.

En la siguiente sección se muestra el caso de Colombia. Con una reglamentación desde

2014 y decretos en los siguientes años [13], [143]–[146], se busca la promoción de FNCER.

De aquí se derivan escenarios de planeación en sistemas FV. Lo primero que se debe

tener en cuenta es la identificación de elementos que permitan su promoción y sean

alternativas en toma de decisiones que se basen en análisis de datos. Una de las que

destaca es el poder cuantificar y predecir recurso primario con el uso de ML a fin de tener

información de potenciales de desarrollo regional.

3.3 Estudio de caso: predicción de radiación solar en Colombia.

3.3.1 Elementos a considerar en el caso de sistemas FV.

En Colombia la promoción desde el Estado de FNCER es reciente. En 2014 por medio de

la promulgación de la Ley 1715 se establece un marco legal de incentivos e instrumentos

para la promoción de energías renovables al Sistema Interconectado Nacional [13].

Si se considera las FNCER y específicamente la solar FV como alternativas energéticas

es deber considerar impactos en el largo plazo. Este escenario se relaciona con la

Page 56: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

38 Modelo de pronóstico de radiación solar basado en Machine Learning.

planeación del sistema para garantizar la atención de la demanda bajo condiciones de

disponibilidad del recurso primario.

En un primer momento en el proceso de adopción de energía solar FV como fuente que

diversifique la matriz colombiana, se hace necesario obtener información de potenciales

de recurso primario. Según [147] se presentan fallas, una de ellas es la insuficiente

información antes de instalar un sistema FV, además de la inexistencia de organismos de

apoyo y la no existencia de un documento maestro. Según este estudio existen tres actores

implicados en el desempeño de los sistemas FV: confiables, seguros y duraderos.

La primera, confiables significa que prestarán el servicio para el cual ha sido diseñados y

dimensionados. Para que esto se cumpla se debe contar con información de potenciales

de recurso primario a fin de determinar qué zona o zonas geográficas son las que

presentan mejor desempeño solar FV. El segundo, seguros, significa que no pondrán en

ningún riesgo ni a usuarios ni a viviendas. Y finalmente, duraderos, es decir que tendrán

el desempeño esperado por los fabricantes y los usuarios durante todo el periodo de vida

para el cual fueron fabricados.

Al igual que en otros países en Colombia existe un atlas de recurso solar [148]. En este

estudio el modelo de aproximación es de carácter lineal, y toma como base de datos la

medida de estaciones que dan valores simultáneos de radiación y brillo solar, es decir

datos endógenos. Además, el dataset usa la medida de estaciones que son

representativas para cada zona geográfica del país. El objetivo del atlas es mostrar el

resultado de la disponibilidad de la radiación global y del brillo solar en el territorio nacional.

Sin embargo, el atlas no considera la variación de recurso primario y la influencia de datos

climáticos en el cálculo de radiación incidente, esto genera una diferencia en los

potenciales que se pueden presentar en una región determinada a futuro. Se identifica una

barrera para el despliegue de sistemas solares FV al no tener certeza de los potenciales

solares, objetos de posible desarrollo, que se basen en patrones climáticos y poder

cuantificar recurso primario [14].

El estudio que se desarrolla en [14], hace énfasis en la identificación de barreras para la

integración de sistemas eléctricos a pequeña y mediana escala, que usen FNCER de

Page 57: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 3. 39

carácter variable a la matriz energética Colombiana. El estudio presenta un conjunto de

barreras identificadas para este nicho de oportunidad, dentro de la que resalta el poder

cuantificar potenciales de desarrollo a fin de obtener información de impactos sobre

regiones donde seria óptimo instalar sistemas FV.

La Figura 3-3 muestra la medida del porcentaje de impacto en los aspectos que se evalúan

al obtener información de potencial de recurso primario. El escenario de planeación ocupa

aproximadamente el 50 % del impacto, representado por los aspectos Beneficio y

Facilidad. El Beneficio hace referencia al grado de diversificación de la matriz energética

si se tienen información de potenciales de desarrollo solar y entrar poco a poco, a

reemplazar al generador convencional con la misma confiabilidad. Aquí es donde entra el

segundo aspecto: Facilidad, el cual hace referencia a la reglamentación que debe surgir

como respuesta a la información de recurso obtenido y la adaptación del sistema de

generación convencional a uno con generación que se basa en una fuente variable.

Figura 3-3: Valoración por aspecto en la barrera identificada.

Fuente: adaptado de [14].

La otra mitad se reparte entre: los costos, el impacto y la injerencia, que poseen un

porcentaje menor. El primer aspecto tiene una mayor proporción y un impacto bajo, según

el estudio, puesto que los costos requeridos para la implementación de soluciones que den

información de recurso primario, no son altos. En el segundo aspecto, el Impacto es

moderado, puesto que, si bien existe información de potencial solar, el atlas, no da idea de

Page 58: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

40 Modelo de pronóstico de radiación solar basado en Machine Learning.

potencial de recurso variable en periodos intra-horarios, intra-diarios y mensuales, lo que

refleja una disminución moderada en la viabilidad de implementar el sistema FV al

desconocer el comportamiento de estos a futuro. Mientras que el último, la Injerencia, hace

referencia al papel del Estado al obtener información del recurso, el cual es media al tener

en cuenta que la información de potencial depende de factores externos con alguna

injerencia del Estado, si bien en Colombia aún no se tiene una metodología que permita

decidir con base en datos históricos la entrada de una FNCER a la matriz energética

convencional.

A continuación, se presenta una serie de consideraciones en la integración de datos

históricos para la toma de decisiones. Colombia tiene este proceso reglamentado sin

embargo existen elementos que no están contemplados cuando los datos que se usan son

escasos o presentan una alta variabilidad.

3.3.2 Uso de datos históricos para toma de decisiones: escenario colombiano.

Un primer acercamiento del uso de datos históricos para tomar decisiones en sistemas FV

en Colombia lo realizo la CREG por medio de la Resolución 243 de 2016 [15].

Esta resolución establece que, para el cálculo de la energía generada por hora en un mes,

solo se tendrán en cuenta datos de irradiación horizontal y de temperatura ambiente, con

un histórico igual o mayor a diez años con un timestep mensual (Formatos 23 y 24),

derivados de una serie temporal que se podrá construir a partir de fuentes secundarias,

como bases satelitales o uso de imágenes. Estas fuentes secundarias se refieren a bases

de datos construidas a partir de modelos de aproximación numérica/analítica.

Actualmente existe un protocolo establecido por el CON [149], para la verificación de la

serie histórica de datos a usar en el cálculo del ENFICC. Sin embargo, en el protocolo de

verificación y la metodología presentada no se tiene en consideración el cálculo de

radiación como un modelo estructurado, su comportamiento no lineal y un horizonte de

predicción intra-diario. Lo que ocasiona una diferencia en el desempeño de la planta para

el cálculo de la energía total, en diferentes resoluciones temporales.

Page 59: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 3. 41

De aquí que surja la necesidad de cuantificar potenciales de radiación a futuro con el uso

de ML que tenga en cuenta datos climáticos que caracterizan una región geográfica, a fin

de poder establecer una metodología que tenga en cuenta variaciones a futuro y el sistema

esté preparado a estas. Esta propuesta se muestra en la siguiente sección y se desarrolla

con más detalle en el Capítulo 4.

3.3.3 Predicción de radiación solar en Colombia mediante ML una propuesta al futuro.

En el caso colombiano, para el despliegue de sistemas FV se tienen retos de carácter

técnico y regulatorio. Dentro de la primera barrera se tiene el cuantificar los potenciales de

recurso solar primario necesarios para la planeación de un sistema de potencia FV.

Las ciudades colombianas están ubicadas en diferentes climas, por lo que la radiación

incidente no es la misma y por ende la planeación de un sistema y los parámetros técnicos,

cambia. Al poder cuantificar y predecir la radiación es posible determinar la capacidad del

sistema a fin de dimensionar un sistema que considere elementos geográficos propios. Lo

anterior, sumado a una regulación que tenga en cuenta datos históricos a fin de generar

elementos de decisión y evaluación que determinen la variación dependiente del clima,

permitirá desarrollar una política que permita integrar sistemas FV al SIN.

La Tabla 3–2 muestra los desafíos que presenta determinar radiación solar en Colombia

al usar ML. En este análisis se describe cada ítem que se tiene en cuenta de forma general

propuesto por la literatura para el diseño y desarrollo de un modelo predictivo, además de

un ítem propio del país asociado con la planeación de sistemas solares FV.

Tabla 3–2: Principales desafíos y propuesta a futuro en predicción de radiación mediante ML en Colombia.

Ítem Desafío Sugerencia

Datos

climáticos de

entrada al

modelo.

La radiación solar es altamente dependiente de la

localización geográfica específica. Varía en

función de la longitud y la latitud incidente.

Además de ser sensible a cambios en el clima

(temperatura, nubosidad, humedad entre otros).

Para determinar que dato o datos son los que

tienen mayor peso en la determinación de

radiación y por lo tanto deben ser la entrada del

modelo. Se sugiere desarrollar una etapa de pre-

procesamiento con un algoritmo de aprendizaje

que identifique relaciones entre entrada/salida.

Page 60: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

42 Modelo de pronóstico de radiación solar basado en Machine Learning.

Tipo de

técnica o

técnicas ML a

desarrollar.

En la revisión de la literatura se encuentra que

existen variedad de algoritmos ML usados en

predicción. Pero estos dependen de varios

parámetros: región de aplicación, costo

computacional y recursos disponibles para

desarrollarlo. Se encuentran predictores unitarios

e híbridos, según sea el caso de aplicación.

Desarrollar un modelo híbrido, dividido en varias

etapas: pre-procesamiento, entrenamiento,

validación y prueba. Se busca identificar las

fortalezas de cada etapa para mejorar la

precisión de aplicación y hacer al modelo

sensitivo a cambios en la localización geográfica

colombiana.

Horizonte de

predicción.

La predicción se puede hacer de forma: intra-

horaria, 24-h, día siguiente, mes siguiente.

Depende en gran medida del dataset climático de

entrada y del timestep de toma de datos. La

variabilidad en el horizonte de predicción también

depende del esquema de mercado que se tenga

implementado en la región, pues este relaciona la

cantidad de energía que se puede despachar a

un determinado tiempo.

Verificar dataset de entrada y las bases de datos,

confiables. Si existen datos faltantes en el

periodo de tiempo es importante desarrollar una

etapa de preprocesamiento cuyo objetivo es

mejorar y refinar la entrada de datos al modelo.

Además se debe tener en consideración una

base de datos con tiempo de toma diaria u

horaria, para su aplicación al diseño del mercado

Colombiano.

Asociados a

la planeación.

1) Actualmente no existe en el país una

regulación o elementos de decisión

basados en datos históricos que permitan

planear y desarrollar sistemas FV.

2) El Ministerio de Minas, la Unidad de

planeacion Minero Energética (UPME)

deben adquirir el conocimiento y las

herramientas tecnológicas para realizar

pronósticos de radiación con una

resolución de minutos, horas, día, semanal

y mensual para que sean usados en la

planeación al tener en cuenta localización

geográfica.

1) Desarrollar una herramienta que permita

acoplar los resultados de predicción de

radiación solar la normatividad y regulacion.

Ademas, logre caracterizar las regiones

geográficas por la cantidad de radiación

incidente.

2) Colombia tiene ciudades ubicadas en climas

variados y es deber del Gobierno Nacional,

garantizar el suministro de energía a cada

ciudad. La alternativa para predecir

radiación con el uso de datos climáticos y

ML es en consideración a modelos

numéricos y las que usan procesamiento de

imágenes, más aceptable, dado las bases

de datos existentes donde se tiene en

cuenta localización geográfica.

Page 61: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

4 Capítulo 4.

El diseño del modelo ML híbrido es un proceso que pasa por la

construcción de cada etapa. Desde la etapa de clasificación-

agrupamiento, estimación-predicción y tratamiento del error, hasta la

escogencia de la base de datos que hará de entrada al modelo. En

cada etapa las técnicas ML escogidas están determinadas por criterios

previamente establecidos. El modelo se evalúa en escenarios de

simulación aplicados al clima colombiano al dar una predicción de

recurso primario que depende del clima y de la ubicación geográfica. El

modelo se valida al usar métricas propias del ML, con un especial

énfasis en las fuentes de error. La interpretabilidad del modelo se

aborda desde un punto de vista de generación de concepto a partir de

la respuesta del modelo.

Page 62: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

44 Modelo de pronóstico de radiación solar basado en Machine Learning.

4.1 Modelo de predicción de radiación solar basado en Machine Learning.

4.1.1 Generalidades en el diseño del modelo.

Estudios previos muestran que existen numerosas técnicas ML, que se usan en las

diferentes etapas del desarrollo de un modelo predictivo. Según estos estudios no existe

aún un estándar de aplicación de técnicas dentro de las etapas asociadas al modelo para

predicción de recurso primario debido en gran parte a la variabilidad geográfica del clima

y la divergencia de resultado entre una y otra. El uso de ML en el desarrollo del modelo

predictivo, conlleva el escoger la técnica o técnicas que serán implementadas en las etapas

del proceso de modelamiento, estos criterios y la evaluación de las técnicas se resumen

en la Tabla 4–1.

Tabla 4–1: Clasificación de predictores unitarios por medio de criterios establecidos.

Fuente: elaboración propia.

La Tabla 4–1 muestra los predictores simples que son mayormente usados en predicción

de recurso primario [32]. Los predictores son comparados en términos de su

comportamiento en manejo de datos de alta no linealidad, el uso de múltiples entradas,

menor incertidumbre, flexibilidad al cambio de entrada y desviación que presentan al

compararlos con sus similares. Además de eso se tiene en cuenta el horizonte de

predicción, definido como tiempo a futuro en el que se desarrollará la predicción, criterio

que también depende del dataset.

Si se desea aprovechar el alto desempeño de las técnicas en las diferentes etapas del

modelo se propone que sea de tipo híbrido. Este modelo surge como resultado de la

Page 63: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 45

combinación de dos o más predictores unitarios. Este modelo aprovecha las fortalezas en

comportamiento individual a la luz de los criterios establecidos y la baja desviación

asociada a la predicción [11], [74], [113], [150]. Con estos elementos, la siguiente sección

muestra la estructura del modelo híbrido que se propone desarrollar en el trabajo de

investigación.

4.1.2 Estructura del modelo.

El modelo híbrido que se propone en el trabajo de investigación debe ser consecuente con

la Figura 2-4. Debe ser capaz de procesar y agrupar el carácter no lineal y de alta

variabilidad que presenta el clima colombiano. A continuación, se presentan las etapas que

tiene el modelo que se desarrolla:

Pre procesamiento y agrupación: para esta etapa se escoge Fuzzy Logic. Su capacidad

para encontrar tendencias dentro de los datos, manejo de múltiples entradas y ser capaz

de clasificar la información climática del cielo y datos en tierra en diferentes tipos de día:

soleado, nuboso y lluvioso, y las combinaciones que se derivan de los mismos [65], [109]

hacen que sea una técnica idónea para clasificar el variante clima colombiano.

Estimación: Para esta etapa se consideran los predictores NN y SVM, en una

combinación. Ambos predictores son capaces de capturar la naturaleza de alta no

linealidad presente en la radiación y su baja desviación en la predicción. La flexibilidad de

la combinación hace posible tener en cuenta consideraciones geográficas (latitud, longitud)

dentro del modelo. En el caso de NN resulta primordial su capacidad de manejo de más

de 3 variables a la entrada, encuentra relaciones entre los datos climáticos y su ubicación

geográfica y luego inyecta ese perfil en SVM quien hace la predicción de recurso [77],

[109], [151].

En la Figura 4-1 se muestra la estructura del modelo propuesto. Se destacan tres

componentes principales que confirman el modelo. El primero es la etapa de clasificación

y agrupamiento, el segundo es la etapa de predicción y el tercero es la etapa de tratamiento

del error asociado a la predicción.

Page 64: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

46 Modelo de pronóstico de radiación solar basado en Machine Learning.

El modelo ML en una evaluación de los criterios establecidos, debe ser capaz de capturar

alta no linealidad, manejar más de 5 datos a la entrada y flexibilizar su respuesta según

sea la ciudad de estudio, esto al tener en cuenta la geografía de aplicación y su divergencia

en respuesta entre una y otra región de estudio. Adicional a lo anterior el modelo debe ser

preciso y exacto.

El primer aspecto está relacionado con el horizonte de predicción y la resolución espacio

temporal a la cual se da la respuesta a futuro, lo que brinda tópicos de estudio según sea

la precisión del modelo, para el modelo que se desarrolla en este trabajo. Según la Figura

3-2, se ubica en resoluciones espacio-temporales altas lo que permite abordar tópicos que

se relacionan con la cuantificación en generación, estabilidad del sistema y desarrollo de

documentos maestros. La exactitud, el segundo aspecto, está ligada con la desviación en

la respuesta y el grado de correlación entre la predicción y el dato medido.

Figura 4-1: Modelo ML propuesto en el trabajo de investigación.

Fuente: elaboración propia.

El modelo que se diseña tiene etapas. En la primera etapa agrupamiento y clasificación se

hace uso de un algoritmo Fuzzy. Este algoritmo tiene la capacidad de clasificar de mejor

Page 65: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 47

manera las variables de entrada cuando se presenta una alta variabilidad de los datos

climáticos, como es el caso del clima colombiano. La clasificación se realiza al definir

variables lingüísticas y reglas de tipo condicional "si-entonces". Las variables de tipo

lingüístico son: nuboso, lluvioso y soleado. Las reglas logran capturar las variaciones de

clima al tener en consideración la relación de datos climáticos e índice de claridad, como

precursora de la radiación total incidente. Se generan las funciones de membresía

necesarias donde se clasificarán los valores a medida que ingresen al modelo, y cambia

las reglas de acuerdo a entradas de datos nuevas. La Figura 4-2, ilustra los componentes

del clasificador Fuzzy que se usa en el modelo.

Figura 4-2: Componentes del clasificador Fuzzy Logic.

Fuente: adaptado de [152].

Este clasificador está basado en el modelo de Mamdani y el método Ishibuchi de factores

ponderados que se usan ampliamente en tareas de clasificación [152]. Este modelo se

denomina sistema lingüístico o descriptivo. Se construye a partir de etapas de fuzzificación,

conocimiento e inferencia. En la primera etapa se transforma las entradas en valores

lingüísticos. La etapa de conocimiento se compone de una base de datos y la base de

reglas. La etapa de inferencia realiza las operaciones de estimación de funciones de

membresía y las relaciones entre el dato de entrada, y la regla "si-entonces". La etapa final

de defuzzificación, produce valores numéricos a partir de los valores lingüísticos.

Page 66: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

48 Modelo de pronóstico de radiación solar basado en Machine Learning.

Para la etapa de predicción se combina las técnicas NN y SVM. El segundo se usó en un

principio como clasificador, pero la tendencia actual es usarlo como un predictor dada su

fuerte capacidad de generalización y tratar datos no lineales. En el trabajo de investigación

se desarrolla esta técnica debido a buena adaptación a los datos. También se tiene en

cuenta que se ha reportado ampliamente su utilización en la literatura como predictor de

recurso primario. El rendimiento de la técnica pasa por un parámetro importante el cual se

conoce como función kernel, constituyente central del modelo SVM.

El kernel es una característica en las SVM que permite asignar las variables de un espacio

de menor dimensión a uno de mayor dimensión. Para el modelo, el kernel que se desarrolla

es de NN con un componente geográfico. Este núcleo no lineal añade dimensiones

adicionales a los datos para crear una separación y poder predecir recurso primario. El

objetivo de NN es agregar nuevas características geográficas, latitud y longitud que tienen

correlaciones entre los datos climáticos medidos. En la Figura 4-3 se muestra esta etapa

del modelo, donde se considera el predictor SVM, el kernel asociado y la salida.

Figura 4-3: Componentes del predictor principal híbrido.

Fuente: elaboración propia.

La etapa de predicción con SVM inicia al estimar un mapeo (𝜙) de los datos de entrada

dentro de un espacio de mayor dimensión definido por la función kernel. Esta función

retorna el producto interno entre las imágenes de dos puntos de datos. El aprendizaje se

Page 67: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 49

lleva a cabo en el espacio de características y los puntos de datos solo aparecen dentro

de productos internos con otros puntos. Según la teoría si se utiliza una proyección 𝛷: 𝑋 →

𝐻. Donde 𝑋 es el vector de datos de entrada y 𝐻 el hiperplano de separación. El producto

interno de puntos ⟨𝛷(𝑥)|𝛷(𝑥′)⟩ se puede representar mediante una función kernel k, que

se muestra en la Ecuación 4-1 [153]:

𝑘(𝑥, 𝑥′) = ⟨𝛷(𝑥)|𝛷(𝑥′)⟩. (4-1)

Una vez que se establezca la función kernel tipo NN es posible trabajar en espacios de

cualquier dimensión sin volver a hacer el proceso de caracterización. Esto se sustenta en

la capacidad de las NN de capturar múltiples entradas que podrían aplicarse directamente

a otros datos sin la necesidad de un proceso de extracción de características.

Las redes neuronales, que se usan en el desarrollo del modelo son de tipo BP, con una

capa oculta para procesamiento de datos. Esta red recibe los datos de longitud y latitud,

de ahí que se denomine, kernel geográfico, conjuntamente con los seis datos climáticos

que se presentan en la Tabla 4–4. La máquina de soporte vectorial ha recibido previamente

los tipos de día clasificados por el algoritmo Fuzzy y encuentra una relación entre estos

tipos de día y los datos climáticos. Por medio de un algoritmo BP, la red calcula los pesos

de cada entrada, los pondera, relaciona en la capa oculta y establece una correspondencia

entre ellos. Los pasa a SVM el cual genera el hiperplano de separación y los vectores de

soporte mediante el producto interno entre los datos de menor dimensionalidad y mayor

dimensionalidad.

Al final determina valores de radiación total incidente como resultado de la predicción. A

continuación, se muestra escenarios de simulación y comportamiento del modelo al

considerar ciudades colombianas con un perfil de clima diferente.

Page 68: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

50 Modelo de pronóstico de radiación solar basado en Machine Learning.

4.2 Bases de datos de recurso solar usadas en aplicaciones energéticas: aplicaciones y conceptos generales.

El proceso de cuantificar y predecir recurso primario depende de los criterios que se

expusieron anteriormente y además de la base de datos climática que se utilice, puesto

que esta nutrirá el modelo. En esta sección se muestran elementos y consideraciones a

tener en cuenta en la escogencia de la base de datos ya que de ella y de la calidad de los

mismos dependen las etapas de entrenamiento, agrupamiento y prueba.

Para escoger el dataset se tienen en cuenta la calidad y seriedad del desarrollador de la

misma. Al usar una base de datos de calidad los valores de predicción tendrán una menor

incertidumbre asociada [135], [154], [155]. A continuación, se muestran los criterios que se

debe tener en cuenta para la escogencia de la base de datos que ingresaran al modelo.

4.2.1 Consideraciones a tener en cuenta en la escogencia de una base de datos.

Cada lugar geográfico tiene un único perfil de recurso solar que varía continuamente

según, la hora, el día, la estación y el año. Además, como se ha observado la radiación

depende de otros parámetros climáticos, lo que la hacen altamente variable y con un perfil

de alta no-linealidad [32].

Desafortunadamente, en Colombia no existe información de potenciales para desarrollar

plantas de energía solar FV [14] que considere el efecto del clima y referenciación

geográfica en el comportamiento del recurso primario. Si estos proyectos se planean lo

hacen bajo la base de un conjunto de datos publicados y distribuidos por agencias

gubernamentales o por agencias privadas en la proximidad del lugar geográfico donde se

quiera implementar el sistema FV.

Para los sistemas de energía solar FV la variabilidad de recurso primario representa la

mayor incertidumbre en la evaluación del rendimiento a futuro en una planta de electricidad

Page 69: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 51

FV. Para tratar de minimizar estos efectos se deben tener en cuenta tres aspectos que

relacionan los datos de recurso solar en el proceso de modelado y planeación de un

proyecto solar [156].

1) Datos de recurso primario con un histórico de 10 años para la selección del sitio

durante los estudios de factibilidad.

2) Cuantificación de potencia generada por la planta, valor que se usa en el diseño y

posteriormente en estudios económicos de la planta.

3) Medición en tiempo real y pronóstico de operación de planta FV aislada y red,

según sea el caso.

El trabajo de investigación se centra en el primer factor. Conlleva la selección del sitio y su

comportamiento en términos de cuantificación de recurso primario que depende de

variables climáticas propias. Al seleccionar el sitio de planeación se incluyen propiedades

geográficas, climáticas, uso de la tierra, acceso a la red y proximidad a los centros de

demanda. El histórico de información juega un papel crucial, los patrones climáticos

cambian de un año a otro y se requieren muchos años de datos para verificar que las

condiciones de irradiación y datos climáticos sean confiables. Para este propósito, los

conjuntos de datos climáticos que cubren más de 10 años se consideran necesarios para

la selección y estimación de comportamiento de radiación en el sitio [156]. Este periodo de

tiempo se justifica al tener en cuenta la actualización de normales meteorológicas dentro

de los datos medidos.

En Colombia la resolución CREG 243 de 2016 establece una metodología para el cálculo

de ENFICC para plantas de generación solar FV [15]. A partir de un estudio previo que se

desarrolla para esta resolución se concluye que un histórico temporal de 10 años, o mayor

duración en resolución horaria con datos de GHI y AT, es necesario para calcular Energía

en Firme a largo plazo. Este es un primer acercamiento al uso de series históricas para

toma de decisiones y calculo aplicado en planeación [157].

Según las etapas del proceso de planeación en un sistema FV, los requerimientos de

información y bases de datos pueden ser diferentes en términos de cantidad, incertidumbre

admisible y resolución temporal-espacial. Mediciones in situ resultan la mejor fuente de

Page 70: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

52 Modelo de pronóstico de radiación solar basado en Machine Learning.

información para caracterizar el clima local; sin embargo, debido a la existencia de vacíos

en la información a largo plazo y con el fin de cumplir con requerimientos de información

de calidad del recurso es posible combinar mediciones en sitio con fuentes secundarias de

información. Se define fuentes secundarias de información como fuentes de datos

construidas a partir de modelos observaciones satelitales o modelos numéricos [149].

Existe una serie de recomendaciones para la escogencia de la base de datos a usar.

Debido a la existencia de gran variedad de bases de datos reportadas en la literatura se

hace necesario que cumpla una serie de requerimientos, según sea el escenario de

aplicación. En la Tabla 4–2 se muestra un resumen de requerimientos que debe cumplir la

base de datos según sea el escenario de aplicación.

Tabla 4–2: Requerimientos del dataset a usar según aplicación.

Requerimiento / Aplicación Académico Política Información de

potencial Negocios

¿Es el dataset validado por mediciones in situ?

¿Con información y documentación pública? Si Si Si Si

¿Es el dataset validado independientemente o

su validación está basada en un protocolo

disponible?

No Si Si Si

¿Se hace necesario una resolución espacial de

10X10 km o mejor? No Si Si Si

¿Se hace necesario un histórico de 10 años o

mayor? No No Si Si

Fuente: adaptado de [158]

El término académico hace referencia al uso del dataset en actividades educativas y de

sensibilización, se excluye la toma de decisiones. Es por esto que solo se hace necesario

tener validaciones en tierra, debido a la recomendación de IRENA para validar y refinar la

información proveniente de fuentes secundarias [158].

El término política hace referencia a la base de datos que se usa en actividades que

implican toma de decisiones, pero sin tener en consideración compromisos financieros.

Estos conjuntos de datos se pueden utilizar para abrir el debate en políticas de alto nivel

(identificación de áreas de oportunidad, evaluación preliminar de potenciales técnicos) o

para realizar evaluaciones de mercado. En conjunto los términos Información de potencial

y negocio son las aplicaciones donde los dataset que se usen para estas actividades

necesitan que se cumplan mayor número de indicadores. Esto es debido a que las dos

Page 71: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 53

actividades se centran en toma de decisiones, la primera no toma a consideración

compromisos financieros, la segunda los tiene en cuenta para el desarrollo a futuro de

plantas solares que entran a operar en la red, de lo que se deriva los costos que incurrirá

la planta y derivados económicos que resulten [156].

Junto con estos requisitos se debe tener en cuenta elementos propios de la base de datos

a usar. Entre estos elementos se tiene: tiempo de histórico, resolución temporal, unidades

de medida, cubrimiento espacial, resolución espacial, elementos de datos y fuentes de los

mismos, timestep y disponibilidad. Estos elementos se evalúan en la siguiente sección

donde se muestran las bases de datos que se usan en dimensionamiento de sistemas FV

y cuantificación de recurso primario.

4.2.2 Características y propiedades de bases de datos

usadas en cuantificación de recurso solar.

Esta sección muestra las bases de datos disponibles que brindan información de recurso

solar y datos climáticos, además de los criterios de selección para el trabajo de

investigación desde el punto de vista de su conformación. Por simplificación se muestran

en la Tabla E–5 solo las que tienen una disponibilidad global.

Los datos de recurso solar y climáticos de diferentes fuentes deben tener en consideración

para su escogencia [156]:

Histórico: las normales climáticas se basan en 30 años de datos meteorológicos. Pero el

periodo promedio de 30 años se actualiza cada 10 años, de ahí que un periodo histórico

aceptable, al tener en cuenta esta variabilidad sea 10 años.

Resolución temporal (timestep): El timestep va desde segundo, minuto, hora, diario

promedio por año/hora que es el usado normalmente para cuantificar distribución de

recursos.

Unidades de medida: las unidades de medida de los datos preferiblemente deben darse

en el Sistema Internacional (SI).

Page 72: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

54 Modelo de pronóstico de radiación solar basado en Machine Learning.

Cubrimiento espacial: desde una estación única hasta una región geográfica de muestra

global (mundial).

Resolución espacial: Las mediciones en tierra son específicas del sitio, las estimaciones

de fuentes secundarias pueden ser representativas de una cuadricula de 10𝐾𝑚 𝑋 10𝐾𝑚.

Elementos de la base de datos y fuentes de medida: Se recomienda que la radiación

tenga disponibilidad de los 3 componentes de la misma, además que tenga detalle de la

forma como se modelaron, midieron o produjeron los datos.

Disponibilidad: Hace referencia a si la base de datos es de dominio público, de pago o

por licencia.

Las bases de datos que son reportadas por la literatura son diversas [156], [159]. Existen

bases de datos que se concentran solamente en datos de radiación, total o en sus

componentes, otras en cambio tienen un registro de variables climáticas de tipo

estructurado. Además la forma como miden las variables es un punto importante a

considerar, no se recomienda el uso de bases de datos que hagan uso de interpolaciones

para encontrar datos faltantes [160]. Según el reporte se recomiendan observaciones

satelitales y de entidades reconocidas como NASA, IRENA, IEA.

Existen estudios previos en Colombia donde plantean el tener en consideración un dataset

con histórico de radiación y temperatura ambiente [149], [157], [158], sin embargo en esta

investigación se optó por considerar una base de datos tipo estructurada y así determinar

relaciones entre datos climáticos y radiación en la entrada y posteriores etapas del modelo

ML. La base de datos será para aplicación académica y política en términos de obtener

información preliminar de recurso.

En la siguiente sección se analiza la base de datos a usar en el diseño del modelo, sus

características y metodología de medición de datos climáticos.

Page 73: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 55

4.2.3 Base de datos a usar en el desarrollo del modelo.

Como se ha mencionado en este documento, existen varias bases de datos reportadas en

la literatura por lo que la escogencia de una no es una tarea fácil. Conlleva la evaluación

de varios aspectos y el objetivo para el que será usada. Estas bases de datos son de

fuentes reconocidas, así pues la calidad del dataset ha pasado por un proceso de

evaluación bajo estándares establecidos para el manejo, recolección y medición de la

información [158], [161].

A los criterios de uso Académico y Política, se añaden los criterios: disponibilidad de

acceso libre a la base de datos y datos de modelo tipo estructurado. En la Tabla 4–3 se

muestra el comportamiento de las bases de datos frente a estos criterios de selección

establecidos.

Tabla 4–3: Cumplimiento de requisitos de bases de datos.

Base de

datos/ indicador

Validado por

mediciones

en tierra y

con

información

documentada

Validación

basada en

un

protocolo

disponible

Resolución

espacial de

10X10 km

Histórico

de 10

años o

mayor

para

Colombia

Datos de

medida tipo:

estructurados

Accesibilidad

libre

Unidades de

medida en

Sistema

Internacional

CERES SYN1deg. Sí Sí No No Sí Sí

(con registro) Sí

PowerViewer. Sí Sí No Sí Sí Sí Sí

Fuente: elaboración Propia

El principal argumento para la escogencia de una base de datos pasa por el tipo de datos

que se usarán en el modelo como entrada, el histórico necesario que cumpla con las

recomendaciones y el acceso libre.

Para el desarrollo del trabajo de investigación se ha escogido la base de datos

PowerViewer de NASA, si bien no tiene una resolución espacial de 10𝑥10𝑘𝑚, posee datos

estructurados validados por mediciones en tierra y documentación suficiente de su

desarrollo. La base de datos tiene cubrimiento en todo el territorio nacional y su interfaz

está pensada para integrarla con soluciones solares de tipo térmico, o de

dimensionamiento fotovoltaico. Posee un histórico desde 1980 al presente en todos los

Page 74: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

56 Modelo de pronóstico de radiación solar basado en Machine Learning.

datos. Esta base de datos es sucesora del proyecto MERRA 2 de la NASA. Además de lo

anterior la base de datos es libre y pensada específicamente para investigaciones

académicas del comportamiento de radiación [162]. En la Tabla 4–4 se muestran las

características de la base de datos para cada variable de medición.

Tabla 4–4: Características de los datos medidos en PowerViewer.

POWER Release 8.

Parámetros disponibles en una malla geográfica de 55𝑘𝑚𝑥55𝑘𝑚.

Parámetro Unidades RMSE (%) R2 Abreviatura

Radiación a cielo

abierto. 𝑊/𝑚2 5.44 0.95

ALLSKY_SFC_

SW_DWN

Temperatura media º𝐶 2.29 0.96 T2M

Temperatura mínima º𝐶 3.05 0.93 T2MMIN

Temperatura máxima º𝐶 3.16 0.95 T2MMAX

Humedad relativa % 12.06 0.61 RH2

Precipitación diaria 𝑚𝑚/𝑑í𝑎 6.81 0.23 PRECTOT

Presión atmosférica. 𝐾𝑃𝑎 2.82 1.00 PS

Velocidad del viento 𝑚/𝑠 1.65 0.55 WS10M

Fuente: adaptado de [162]

Se muestra que el RMSE en la medición, para todos los sitios el proveedor garantiza que

esta al rededor del 5%, una medida aceptable si se tiene en cuenta que será usada en un

ejercicio académico-político y se tiene en consideración que en Colombia los datos de este

tipo son escasos [156], [157]. En los demás datos se tiene en promedio un RMSE de

alrededor del 6 %. Se muestra también el coeficiente de correlación entre los datos

medidos en tierra y los datos satelitales, en algunas variables como Temperatura,

radiación, punto de rocío y humedad relativa los datos son altamente correlacionados,

según el reporte de desarrollo, debido a las mediciones en tierra históricas que se usaron

para cubrir los faltantes del satélite [162].

El tener la fuente de datos que alimentará el modelo, en la siguiente sección se presenta

el modelo ML, sus etapas, simulaciones realizadas y comportamiento en escenarios de

ejemplificación.

Page 75: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 57

4.3 Simulación y comportamiento del modelo.

4.3.1 Regiones de estudio.

Colombia, dada su posición geográfica tiene una gran variedad de climas y pisos térmicos

que van desde el nivel del mar hasta las nieves perpetuas. En este trabajo de investigación

al hacer uso de la base de datos climática PowerData [162] serán escenarios de simulación

y ejemplificación del desempeño del modelo. Bases de datos de seis ciudades localizadas

en Manizales (Caldas), Leticia (Amazonas), Puerto Gaitán (Meta), Tumaco (Nariño) y

Barranquilla (Atlántico). La información geográfica de cada ciudad escogida se presenta

en la siguiente tabla:

Tabla 4–5: Información geográfica de las ciudades de estudio.

Ciudad Departamento Latitud Longitud Elevación.

Manizales Caldas 5.06261º -75.50859º 2200 m.s.n.m

Leticia Amazonas -4.20989º -69.94039º 96 m.s.n.m

Puerto Gaitán Meta 4.25291º -71.64399º 149 m.s.n.m

Tumaco Nariño 1.80331º -78.77759º 2 m.s.n.m

Barranquilla Atlántico 11.00031º -74.81019. 18 m.s.n.m

Fuente: elaboración propia.

La elección de estas ciudades pasa por el hecho de encontrarse en diferentes regiones

geográficas. Es así como hay clima de montaña representado por Manizales, selva

amazónica representada por Leticia, el Llano Colombiano, Puerto Gaitán, y las costas

pacífica y atlántica, Tumaco-Barranquilla. Al cambiar la localización geográfica cambian

los datos climáticos y el perfil de día. El modelo debe ser capaz de capturar esta

variabilidad geográfica y climática y ser capaz de dar una predicción de recurso primario.

Para las ciudades mencionadas se cuenta con un total de 3865 observaciones

correspondientes al promedio diario de datos climáticos de la Tabla 4–4 en un periodo de

tiempo de más de 10 años, desde el 01/01/2008 hasta el 31/07/2018.

Page 76: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

58 Modelo de pronóstico de radiación solar basado en Machine Learning.

De este conjunto de datos, en todas las ciudades se usa aproximadamente el 70 % (2700)

para entrenamiento y el 30 % (1165) restante para prueba. De los datos de entrenamiento:

se reparte un 40 % para entrenar las reglas Fuzzy y un 60% para NN.

Para ejemplificar la diferencia de parámetros geográficos se muestra, en la Figura 4-4, la

radiación incidente horizontal en cada ciudad de estudio en el tiempo de muestreo.

Figura 4-4: Descripción de la radiación solar horizontal en las ciudades de estudio.

Fuente: elaboración propia.

El perfil de radiación de las ciudades de estudio es totalmente diferente como

consecuencia de su ubicación geográfica. El clima de Leticia presenta un valor promedio

menor de recurso primario que las otras ciudades debido a la temporada de lluvias que se

extiende más de lo normal en el tiempo, por lo general de 5 a 6 meses en el año. A pesar

de ser ciudades costeras Tumaco y Barranquilla presentan diferencias significativas debido

a los vientos de la corriente de Humboldt y corrientes frías que cruzan la costa pacífica.

Los vientos y cúmulos de aire caliente de la costa atlántica hacen que el perfil de radiación

cambie considerablemente [163].

´

Page 77: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 59

El estudio de las correlaciones entre la radiación solar horizontal y otros datos climáticos

es un elemento importante como etapa previa al desarrollo del modelo. Este estudio

permite una caracterización del clima por ciudad y muestra qué variables están más

correlacionadas que otras con la radiación solar. La Figura 4-5 presenta los diagramas de

correlación entre la radiación incidente y seis datos climáticos. Los representados en color

oscuro presentan una correlación positiva, mientras que los rojos representan una

correlación negativa.

Figura 4-5: Gráficas de correlación de radiación diaria y datos climáticos desde 01/01/2008 hasta 31/07/2018.

Fuente: elaboración propia.

El coeficiente de correlación refleja la asociación y el sentido de la asociación entre dos

variables mediante métodos cualitativos. En este trabajo se desarrolla la correlación

mediante el coeficiente de Pearson. Este coeficiente trabaja sobre la diferencia y la

covarianza de dos variables, como se muestra en la Ecuación 4-2.

𝑟 = 𝐶𝑜𝑟𝑟(𝑥, 𝑦) =𝐶𝑜𝑣(𝑥,𝑦)

𝜎𝑥𝜎𝑦 (4-2)

Page 78: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

60 Modelo de pronóstico de radiación solar basado en Machine Learning.

Donde 𝜎𝑥𝜎𝑦 indican la desviación estándar de los datos 𝑥, 𝑦. El coeficiente de correlación

maneja un intervalo de valores [-1,1]. Los valores extremos indican una correlación lineal

perfecta, mientras que valores cercanos a cero indican una baja correlación.

En la Figura 4-5 se muestra una tendencia en la cual el coeficiente de correlación no es

una herramienta de inferencia adecuada, debido a su variabilidad entre ciudades.

Los perfiles climáticos de selva (Leticia), Llanura (Puerto Gaitán) y Costa Atlántica

(Barranquilla) presentan una similitud al evaluar la correlación de la humedad con la

radiación incidente, el perfil de este dato es similar para los tres tipos de geografía. Sin

embargo, en los demás datos no es posible hacer ningún tipo de tendencia ni similitud

dado la variabilidad de perfil de ciudades. Este aspecto es evaluado por las reglas de la

etapa Fuzzy lo que permite inferir el tipo de día que depende de los datos climáticos y no

del coeficiente de correlación asociado a la ciudad de estudio.

El rango del coeficiente de correlación y los datos climáticos por ciudad se presenta en la

Tabla 4–6. La radiación solar presenta una alta correlación con el índice de claridad en

todas las ciudades, esto se debe a que por definición el índice de claridad es una medida

precursora de la radiación incidente en una superficie [21].

Tabla 4–6: Coeficientes de correlación entre radiación solar incidente y parámetros climáticos para las ciudades de estudio.

Datos

climáticos

Ciudades

Manizales Leticia Puerto

Gaitán Tumaco Barranquilla

PRECTOT -0,2608 -0,2368 -0,3450 -0,0332 -0,3260

RH2M -0,4992 -0,3745 -0,3962 -0,0345 -0,3648

PS 0,0576 -0,1553 -0,3092 -0,0361 -0,0214

T2M 0,4061 0,3159 0,2898 0,1981 0,0956

WS10M -0,0337 0,0406 0,3045 -0,3463 0,2797

KT 0,9431 0,9604 0,9643 0,9796 0,8742

Fuente: elaboración propia.

Page 79: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 61

La anterior tabla muestra que existen datos climáticos con una correlación positiva, caso

de Índice de Claridad y Temperatura a dos metros para todas las ciudades, en mayor grado

para la primera que para la segunda.

Al tener en cuenta los datos climáticos del proveedor se evalúan los valores de correlación.

El Índice de claridad (KT) para todas las ciudades al alto, lo que significa que el dato puede

usarse como seguidor confiable en la tendencia de valores de radiación solar. La

precipitación y humedad total se correlacionan fuertemente entre ellas. Estos datos

presentan un perfil similar al correlacionarlas con el recurso primario, el valor negativo en

correlación hace que ambas tengan una relación inversa en todas las ciudades, es decir,

a mayor precipitación y humedad, menor es el valor de radiación incidente.

Para el clima de montaña (Manizales) y costa pacífica (Tumaco), a diferencia de las otras

ciudades, la velocidad del viento tiene una relación inversa con la radiación. En la primera

ciudad, esto se debe al movimiento de masas de nubes, formadas en la cordillera, que son

desplazadas por el viento donde está ubicada la ciudad lo que interfiere con la radiación

incidente. En la segunda se debe al flujo de corrientes marinas que vienen desde el sur del

continente lo que hace que la AM sea de mayor valor lo que dispersa la radiación en las

longitudes de onda que la componen. Para otros datos, el coeficiente varía de tal manera

que no es posible hacer una generalización de los datos que son adecuados a la entrada

del modelo ni mucho menos inferir el tipo de día.

El comportamiento del modelo se ejemplifica en la siguiente sección que muestra el

comportamiento de las etapas al tener en cuenta datos de diferentes zonas geográficas.

4.3.2 Escenarios de simulación del modelo.

El modelo de predicción híbrido ML se aplica en las 5 ciudades mencionadas. En primer

lugar, se aplica el clasificador Fuzzy, luego la red neuronal y la máquina de soporte

vectorial combinadas. El dataset se trabaja previamente para no generar tendencias y

sobreajustes a un determinado perfil de día en los años de estudio. Es así como se toman

acciones antes que los datos entren al modelo:

Page 80: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

62 Modelo de pronóstico de radiación solar basado en Machine Learning.

• Se recomienda que el archivo de trabajo sea tipo CSV, dada su capacidad de

tratamiento y refinamiento.

• Se ordena de forma aleatoria las filas del dataset para una ciudad determinada.

• Se ordenan los datos climáticos por columnas en el orden de la Tabla 4–4.

• Si existiere datos faltantes, la sugerencia del proveedor es suplirlos con el promedio

diario según sea el caso [162].

• Se construye el modelo con el uso del Software R.

En la primera etapa, clasificación y agrupamiento, tipo Fuzzy. Se debe tener en cuenta

ciertas características propias de la etapa: que se hayan definido previamente variables de

tipo lingüístico, funciones de membresía, y peso de cada regla.

En esta etapa se excluye de la entrada a la radiación incidente en una superficie horizontal,

puesto que se quiere clasificar el día según el índice de claridad, este da información de la

nubosidad en un sitio determinado [21]. En la Figura 4-5 la correlación entre la radiación y

el índice de claridad es cercano a uno, lo que indica que es posible representar un dato en

términos de otro. La etapa Fuzzy implementa el método Ishibuchi (FRBCS.W) el cual se

basa en aproximaciones de división del espacio. Se divide el dataset en etapas de

entrenamiento y prueba. Un 85 % de los datos hacen las veces de entrenamiento y el 15%

restante es usado para prueba.

El método Fuzzy del modelo puede manejar diferentes formas de la función de membresía,

pero según la literatura la función triangular es la que mejores resultados muestra en

aplicaciones de predicción climáticas [11], [65], [164], [165]. Su fortaleza se debe a su

capacidad de capturar los elementos lingüísticos y combinarlos para crear el agrupamiento,

sin intervalos de confusión. La función triangular se representa por cuatro números. El

primero, representa la forma de la función: triangular y los tres últimos los puntos de corte

del triángulo. Las funciones 𝑡 − 𝑛𝑜𝑟𝑚 y 𝑠 − 𝑛𝑜𝑟𝑚 son propias del motor de inferencia, las

cuales representan valores mínimos y máximos estandarizados. En esta etapa no se

normaliza los valores de entrada puesto que el método Ishibuchi realiza esta acción.

ZADEH, hace referencia a la función de implicación para generar la consecuencia del

condicional "si-entonces". Esta es la función por defecto del paquete. La Tabla 4–7 resume

los parámetros de operación de la etapa de clasificación.

Page 81: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 63

Tabla 4–7: Resumen de parámetros en la etapa de clasificación para todas las ciudades de estudio.

Tipo de modelo

Fuzzy.

Tipo de función de

membresía.

Tipo de método

t-norm.

Tipo de método

S-norm.

Tipo de función de

implicación

FRBCS.W Triangular Standard t-norm. Standard s norm ZADEH

Fuente: elaboración propia.

La etapa divide los datos de entrenamiento (entrada) y la salida (índice de claridad) en

espacios iguales para conformar las regiones difusas lluvioso, nuboso y soleado. La

longitud de las regiones difusas depende en gran manera del número de variables

lingüísticas. Para generar las reglas "si-entonces" la etapa calcula para cada dato un valor

lingüístico y un valor máximo, luego calcula el ponderado de ese valor. El proceso se repite

para cada dato en el espacio de entrenamiento. En la Figura 4-6 se muestra la clasificación

realizada por la etapa Fuzzy.

Figura 4-6: Comportamiento del clasificador Fuzzy en las ciudades de estudio.

Fuente: elaboración propia.

Page 82: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

64 Modelo de pronóstico de radiación solar basado en Machine Learning.

Para ciudades como Manizales y Tumaco la combinación de reglas hace que la tendencia

de estas ciudades sea un clima lluvioso, mientras que para Puerto Gaitán y Leticia sea

nuboso con tendencia a lluvia. La ciudad de Barranquilla genera reglas que permiten inferir

que su tipo de clima es nuboso-soleado.

Para la siguiente etapa, la implementación del predictor. Lo primero es construir el kernel

que está conformado por una red NN, el algoritmo BP y capa oculta neuronal. En esta

etapa se requiere una normalización de los datos para evitar que la diferencia de medida

y rango interfiera con el cálculo de pesos y correlación de variables de entrada.

La red neuronal recibe seis datos climáticos de entrada, adicional a la longitud y la latitud

de la ciudad. La red neuronal, con perceptron y función de activación tipo sigmoide, calcula

los pesos de cada variable y da una respuesta. El número de capas ocultas que se escoge

pasa por el número que mayormente se encontró en la literatura, debido a que no hay un

consenso general, la capa tiene siete neuronas ocultas. La función de este kernel es

considerar la variación geográfica con la clasificación de tipo de día que se desarrolla

previamente y aumentar la dimensión del espacio de datos a consideración de la existencia

de escasez de los mismos. El kernel no lineal genera variables que se obtienen a través

de la inclusión de un hiperplano que separa los valores de entrada y desarrolla el producto

interno entre los vectores de soporte.

Los parámetros del modelo de regresión SVM, se representan en la Tabla 4–8. Se muestra

el valor 𝜀 de tolerancia a la penalización de errores, el cual depende de la función kernel

para dejar pasar o no un valor con una cota de error. Este valor cambia en todas las

ciudades, pero en Tumaco alcanza su mayor valor, esto se debe a que el modelo no logra

capturar del todo el perfil climático de la ciudad y por lo tanto debe permitirse un perfil con

error mayor. La máquina de soporte vectorial relaciona los tipos de día con los demás datos

climáticos. Al considerar un hiperplano no lineal de separación de datos es posible que el

modelo capture las variaciones geográficas del clima colombiano y dé una respuesta

predictiva un día al futuro como horizonte de predicción.

Page 83: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 65

Tabla 4–8: Resultados del modelo SVM en las ciudades evaluadas.

Ciudad

Parámetro

𝜺 Vectores de

soporte

Valor

Función

objetivo

Error de

entrenamiento

Manizales 0.3 1770 -367,481 0.1133

Puerto Gaitán 0.2 1439 -463,437 0,3014

Leticia 0.17 1646 -233,756 0,0472

Tumaco 0.5 1553 -1005,469 10.61

Barranquilla 0.21 2215 -743,441 0.2165

Fuente: elaboración propia.

En el caso de los vectores que soportan el hiperplano de regresión, no existe una tendencia

que permita concluir que el número de vectores dependa de uno u otro parámetro climático.

El cambio se debe principalmente a la ubicación geográfica variable que presenta

sensibilidad tanto en la tolerancia del error como en los vectores de soporte. Los valores

de la función objetivo son variables, esto se presenta debido a la divergencia entre los

vectores que soportan el hiperplano por ciudad y que son determinados por el kernel

geográfico. En Tumaco se presenta el menor valor de esta función asociado a un error

mayor, esto permite inferir que el modelo en región pacifico no captura adecuadamente las

variaciones de clima. Cabe aclarar que dos ejecuciones del modelo no dan los mismos

resultados, pero si una tendencia de valores por ciudad. Esto se debe a la etapa no lineal

de la red neuronal y cálculo de producto interno en el predictor SVM.

En la siguiente sección se presenta la validación del modelo. Este proceso se desarrolla al

tener en cuenta métricas estadísticas que evalúen el grado de cohesión entre los datos

que el modelo predice y los datos medidos.

Page 84: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

66 Modelo de pronóstico de radiación solar basado en Machine Learning.

4.4 Validación del modelo.

4.4.1 Consideraciones iniciales en la validación del modelo.

La validación de un modelo ML se puede considerar como un proceso asociado a los

resultados en la predicción. En general, el proceso, mide que tan bueno resulta el modelo

propuesto en la evaluación de su precisión y exactitud.

Una de las primeras aproximaciones para validar modelos de predicción de recurso

primario, hace referencia a la validación de predictores unitarios y su comportamiento

pueda ser utilizado como referencia [32]. En la validación de estos predictores se utiliza un

modelo de persistencia. En este modelo se compara el resultado de la predicción con el

último dato conocido y de ahí determinar el grado de desviación. Al aplicar el modelo de

persistencia a resultados de modelo ML híbrido se presentan retos debido al número de

etapas del modelo y persistencia en cuestión no es capaz de determinar la precisión de la

respuesta.

Debido la naturaleza del modelo ML (estocástico/estadístico) no se acepta solamente una

métrica de validación [166]. La respuesta del modelo depende en gran medida de las

etapas del modelo y las técnicas que las componen, ubicación, el timestep de la base de

datos, el horizonte de predicción, lo que hace difícil evaluar la calidad de un pronóstico a

partir de la aplicación de una sola métrica.

Según [167] para establecer parámetros de confiabilidad con objetivo de validar la

respuesta de pronóstico en modelos ML es necesario realizar más trabajo que utilice más

casos de prueba, datos y modelos a fin de lograr una visión más global y estándar de todas

las situaciones posibles. Lo anterior refleja el poco consenso que existe entre los autores

sobre las métricas que se usan en validación de modelos ML.

De estos retos surgen aportes para la validación de modelos que usen ML para predicción

[168], [169]. Según los autores el proceso de validación debe ser integral al evaluar

rendimiento en diferentes escenarios de pronóstico (p. Ej. cambiando posiciones

geográficas) con un conjunto común de datos de prueba y con el mismo número de

Page 85: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 67

entradas al modelo. Adicional a esto se propone el uso de métricas estadísticas como el

MSE, R, MBE, MAE y MAPE [99], [170]. Las tablas:Tabla B–2 y Tabla C–3 muestran la

utilización de estas métricas en la validación y evaluación de desempeño de modelos

reportados en la literatura. La primera tabla valida predictores unitarios lo que sirve como

referencia para la comparación con el modelo que los autores proponen. En la segunda

tabla, se compara el modelo que desarrollan los autores con predictores híbridos y

unitarios. En estos trabajos se evalúa el comportamiento entre uno y otro predictor. Las

tablas muestran el bajo consenso en la literatura que existe en la aplicación de una u otra

métrica. Sin embargo, la tendencia indica el uso de RMSE, MSE y coeficiente de

correlación.

Para este trabajo de investigación se utilizan en la validación del modelo las siguientes

métricas de tipo estadístico:

1. El Coeficiente de Pearson (𝑟) como encargado de establecer la correlación entre

el valor predicho y el valor observado, se mostró al lector anteriormente en la

Ecuación 4-2.

2. El error cuadrático medio (MSE) utiliza el cuadrado de la diferencia entre los

valores observados y predichos. Se muestra en la Ecuación 4-3. Donde 𝑁 es el

número de datos para el período considerado.

𝑀𝑆𝐸 =1

𝑁∑ (𝑅𝑎𝑑𝑖𝑎𝑐𝑖ó𝑛𝑝𝑟𝑒𝑑𝑖𝑐ℎ𝑎,𝑖 − 𝑅𝑎𝑑𝑖𝑎𝑐𝑖ó𝑛𝑚𝑒𝑑𝑖𝑑𝑎,𝑖)

2𝑛𝑖=1 (4-3)

Esta métrica penaliza en alto grado los datos faltantes y es el parámetro que busca

minimizarse con las etapas de preprocesamiento y entrenamiento.

El MSE puede ser descompuesto en la estadística de Theil [171] para ayudar a revelar las

fuentes del error. Estas fuentes se dan en términos de sesgo, varianza, 𝑦 covarianza.

El sesgo, 𝑈𝑀, mide que tanto difieren los valores promedio de los datos simulados y

medidos, se muestra en la Ecuación 4-4.

𝑈𝑀 =(𝑅𝑎𝑑𝑖𝑎𝑐𝑖ó𝑛𝑝𝑟𝑒𝑑𝑖𝑐ℎ𝑎

−𝑅𝑎𝑑𝑖𝑎𝑐𝑖ó𝑛𝑚𝑒𝑑𝑖𝑑𝑎 )

2

𝑀𝑆𝐸 (4-4)

Page 86: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

68 Modelo de pronóstico de radiación solar basado en Machine Learning.

La varianza, 𝑈𝑆 ,mide el grado de coincidencia entre la estimación del modelo y el grado de

variabilidad en el valor medido. Este parámetro puede ser un indicador de error sistemático,

se muestra en la Ecuación 4-5:

𝑈𝑆 =(𝑆𝑝𝑟𝑒𝑑𝑖𝑐ℎ𝑎−𝑆𝑚𝑒𝑑𝑖𝑑𝑎)

2

𝑀𝑆𝐸 (4-5)

La covarianza, 𝑈𝐶, mide el error no sistemático, es decir, el error que queda después de

evaluar las desviaciones del promedio y varianza. Según [171] esta porción de error es la

menos problemática de las tres. Un error no sistemático sugiere que un evento exógeno

influyo en el comportamiento del modelo y cambio su respuesta, se muestra en la Ecuación

4-6:

𝑈𝐶 =2(1−𝑟)(𝑆𝑝𝑟𝑒𝑑𝑖𝑐ℎ𝑎𝑆𝑚𝑒𝑑𝑖𝑑𝑎)

𝑀𝑆𝐸 (4-6)

Las cantidades 𝑈𝑀 , 𝑈𝑆 y 𝑈𝐶 representan la proporción de cada una dentro del error en el

MSE. Se debe cumplir que las sumas de las tres proporciones representen el MSE total,

como lo muestra la Ecuación 4-7.

𝑈𝑀 + 𝑈𝑆 + 𝑈𝐶 = 1 (4-7)

3. La raíz del error cuadrático medio (RMSE) es más sensible a las variaciones

bruscas en los resultados de la predicción y por lo tanto es adecuado para

aplicaciones donde los errores de menor valor son más tolerables y los errores más

grandes causan costos des proporcionadamente altos, según [28], [32] es la

métrica de confiabilidad más utilizada. Se muestra en la Ecuación 4-8.

𝑅𝑀𝑆𝐸 = √𝑀𝑆𝐸 = √1

𝑁∑ (𝑅𝑎𝑑𝑖𝑎𝑐𝑖𝑜𝑛𝑝𝑟𝑒𝑑𝑖𝑐ℎ𝑎,𝑖 − 𝑅𝑎𝑑𝑖𝑎𝑐𝑖𝑜𝑛𝑚𝑒𝑑𝑖𝑑𝑎,𝑖)

2𝑛𝑖=1 (4-8)

Las anteriores métricas son propicias para validar la respuesta del modelo al evaluar la

exactitud, debido a su capacidad de capturar desviaciones entre los datos de predicción y

prueba, calcular los pesos de cada error y poder así identificar las fuentes de desviación

en las ciudades evaluadas [170].

Page 87: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 69

4.4.2 Resultados de la validación del modelo propuesto.

Según [171] se considera que, en términos de probar la validez de un modelo, este debe

tener rendimiento predictivo y ser capaz de pronosticar en diferentes escenarios de prueba.

Lo que evalúa el rendimiento es el grado de exactitud. Si a mayor exactitud el modelo

conduce a conclusiones diferentes, es decir, la generación de un modelo sobre ajustado a

un determinado conjunto de datos refleja una disminución en la capacidad de encontrar

tendencias cuando sea evaluado en un conjunto diferente. Un caso paralelo se presenta

en una baja exactitud del modelo. Los resultados en este caso no pueden ser confiables y

no darán elementos de peso en las decisiones asociadas a los resultados del modelo lo

que se verá reflejado en malas decisiones e interpretaciones erróneas.

Para la validación del modelo propuesto se utilizan las métricas estadísticas descritas

anteriormente y la herramienta gráfica diagramas de dispersión. Según [32] es una

herramienta válida para la presentación de los resultados del modelo. Las fortalezas de

esta herramienta gráfica están enmarcadas en mostrar la correlación entre dato medido y

predicho, revelar sesgos y desviaciones sistemáticas según las condiciones de radiación,

además de mostrar el rango de las desviaciones que están relacionadas con los

pronósticos. Se resalta el hecho de que al ser un modelo híbrido se valida la respuesta

total del modelo y no por etapas individuales [32].

En la Figura 4-7 se muestra el diagrama de dispersión del modelo por ciudad.

Page 88: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

70 Modelo de pronóstico de radiación solar basado en Machine Learning.

Figura 4-7: Diagrama de dispersión del modelo en las ciudades evaluadas.

Fuente: elaboración propia.

En general, la figura muestra que el rendimiento del modelo es aceptable al lograr capturar

la no linealidad del recurso primario, manejar las entradas al modelo, y flexibilizar el

desempeño del mismo al ser evaluado en distintas ciudades con ubicación geográfica

diferente.

La etapa Fuzzy, funciona en todas las ciudades clasificando y aportando a SVM perfiles

de día que se traducirán en valores de radiación según sea el día. En Manizales y Puerto

Gaitán la tendencia es que los valores de radiación representen días lluviosos y soleados,

es así como valores de radiación intermedios que tienen directa relación con perfiles de

radiación medios no se representan En Barranquilla el perfil de radiación tiene valores altos

y el modelo es capaz de dar respuesta a una tendencia de día nuboso-soleado

característica de esta región. En Tumaco el comportamiento del modelo no es el mejor, la

correlación disminuye, lo que aumenta la dispersión, en parte debido al cambio de capa

de aire lo que hace que la radiación se descomponga en sus longitudes de onda y el

Page 89: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 71

modelo no pueda capturar esa variabilidad. La etapa de pre procesamiento y NN cumplen

el objetivo de segmentar el dataset y encontrar patrones para que SVM haga la predicción.

Para ciudades como Manizales, Leticia y Barranquilla se observa una fuerte correlación.

Las métricas de validación estadística para las ciudades evaluadas se muestran en la

Tabla 4–9. Se muestra el comportamiento del modelo en las ciudades a la luz de las

métricas estadísticas descritas anteriormente: coeficiente de Pearson, sesgo, varianza,

covarianza, RMSE y MSE.

Tabla 4–9: Valores de métricas del modelo evaluado en ciudades.

Ciudad 𝒓 𝑼𝑴 𝑼𝑺 𝑼𝑪 ∑ 𝑼𝑴 + 𝑼𝑺 + 𝑼𝑪 𝑹𝑴𝑺𝑬 𝑴𝑺𝑬

Manizales 0,937 0,00781082 0,00677162 0,986269 1,00085235 0.0480485 0.0023086

Leticia. 0,958 0,00708421 0,00214435 0,991624 1,00085297 0.0446628 0.0019947

Puerto

Gaitán. 0,963 0,03978723 0,00260174 0,958436 1,00082497 0,0987763 0,0097567

Tumaco. 0,481 0,02433792 0,68385410 0,292646 1,00083812 0,7167485 0,5137284

Barranquilla 0,913 0,07505674 0,01250164 0,913236 1,00079450 0,0686814 0,0047171

Fuente: elaboración propia.

En la medida de la correlación, el modelo se caracteriza por su robustez en la predicción

de recurso en las ciudades evaluadas, dado que está cercano a la unidad, lo que indica

una fuerte correlación, en la mayoría de estas. Salvo en Tumaco, según los valores de las

métricas el modelo tiene un desempeño menor en el clima pacífico, esto se debe a que no

es capaz de captar la fuerte variabilidad del recurso, relacionado con corrientes de aire

cálidas que vienen del sur, lo que se traduce en una baja correlación.

En relación con el sesgo, 𝑈𝑀, el valor en todas las ciudades es pequeño, lo que indica que

no existe error sistemático entre el modelo y los datos de prueba e indica que el parámetro

de predicción está correctamente reflejado en el modelo. Esto es positivo ya que evidencia

la no existencia de problemas internos en parámetros específicos al cálculo de pesos y

tendencias en las etapas que conforman el modelo.

Al evaluar, 𝑈𝑆, en las ciudades evaluadas, se encuentra un valor bajo. Se infiere que el

error no es sistemático en estas ciudades y el modelo puede predecir correctamente el

Page 90: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

72 Modelo de pronóstico de radiación solar basado en Machine Learning.

recurso primario. En Tumaco, en cambio, el valor es el más alto, lo que pone en

consideración un error sistemático del modelo al determinar perfil de radiación para la

ciudad y compromete la exactitud del mismo. Una baja correlación está relacionada, en

esta ciudad, con un alto error sistemático. Este tipo de error compromete el diseño del

modelo. De ahí se infiere que no es lo suficientemente robusto en la etapa de clasificación

y estimación para capturar la variabilidad de recurso de esta ciudad dado sus parámetros

geográficos, lo que se evidencia en el valor de error de entrenamiento que muestra la Tabla

4–8.

Si bien el valor de 𝑈𝐶 , es alto, este valor no sugiere que este comprometida la capacidad

del modelo para dar resultados de predicción de recurso. Este error es de tipo no

sistemático-aleatorio; es decir, sugiere que un evento exógeno (RMSE de medición del

dataset, histórico de base de datos) influyó en el comportamiento del modelo. Este tipo de

error no evidencia un modelo débil, por el contrario, no está dentro del alcance del modelo

el pronosticar basándose en parámetros externos de tipo aleatorio. Si lo hace se podría

anular el propósito para el que está destinado el modelo.

En la siguiente sección se aborda la Interpretabilidad del modelo, como un concepto

integrador y que conecta los resultados del modelo con el dominio en que el humano pueda

entender.

Page 91: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 73

4.5 Interpretabilidad del modelo.

"Cuando se crea un equipo humano + ML, la parte difícil no es el modelo ML. Ni siquiera

es el "humano". Es el +" adaptado de [172].

La anterior premisa pone en consideración el hecho en que el diseño y posterior desarrollo

de un modelo ML, la integración humano/máquina es un proceso difícil enmarcado en

encontrar la integración de una interpretación que conlleve a emitir un concepto de lo que

el modelo muestra como resultado.

Según [173] define interpretación de un modelo ML como el mapeo de un concepto

abstracto en un dominio que el humano puede entender.

Este concepto plantea que el dominio es un estadío del resultado del modelo ML que puede

o no ser fácilmente comprensible y manejable por el ser humano. Ejemplo de dominios que

se pueden interpretar son las imágenes o textos. Un humano puede mirarlos y leerlos

respectivamente. Pero existen otros que son difíciles de interpretar como los espacios de

vectores o dominios compuestos por entidades de entrada no documentadas. P.Ej.

Secuencias de palabras, valores de radiación, clasificación climática.

Lo anterior expuesto plantea que el ser humano debe ser capaz de establecer elementos

que se integren en pro del desarrollo de un concepto en el conocimiento derivado del

resultado de un modelo ML. Para el desarrollo de este concepto, [174] abre dos vertientes.

La primera es el concepto destinado a reemplazar a los humanos y la segunda destinado

a mejorar el desempeño humano en las tareas.

Es en este segundo punto de vista, que denomina ortopédico, es donde se ubica el modelo

que se diseñó y desarrolló en la tesis de investigación. El modelo de predicción de recurso

primario está destinado a colaborar con los humanos (planeadores solares, comunidad en

general), y como tal, deben ser competente tanto en la tarea en cuestión, predicción, como

en la comunicación con los humanos.

Al generar perfiles de radiación solar y tendencias en la medida de recurso primario el

modelo permite que sus resultados sean una herramienta en la identificación de

Page 92: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

74 Modelo de pronóstico de radiación solar basado en Machine Learning.

potenciales regiones geográficas donde se garantice capacidad de reservas energéticas y

la estabilidad del sistema al tener un recurso primario estimado al futuro al usar una fuente

energética variable.

Por lo tanto, para considerar que el modelo ML sea exitoso como elemento para el apoyo

a la planeación, debe proporcionar información relevante para la toma de decisiones, en

este caso zonas geográficas donde el recurso solar sea de mejor perfil que en otros, pero

también debe comunicarse a una velocidad adecuada y de una manera que permita a un

receptor humano acceder a sus fortalezas a partir de la intuición y el razonamiento.

Sin embargo, muchas veces acceder a las fortalezas del modelo e interpretarlo para traer

el concepto al caso práctico conlleva retos. Fuertes argumentos recientes [173], [175]–

[177], no encuentran consenso en la medida general de la Interpretabilidad de un modelo

ML híbrido. En estos trabajos el modelo que diseñan lo interpretan de forma ligada a

conceptos propios de los predictores unitarios. Los cuales, mediante un proceso de

abstracción matemática fundamentado desde las funciones de generación de los

predictores, intentan establecer técnicas para interpretar un modelo tipo NN, Fuzzy o SVM

unitario.

Surge entonces la cuestión de dar un concepto de medición en Interpretabilidad de un

modelo. Hasta ahora en lo que coinciden los autores como medida de Interpretabilidad es

en la representación gráfica de la respuesta que se obtiene del modelo y la descripción

analítica de los mediante el análisis de la desviación, análisis de errores y las limitaciones

en diseño del modelo al capturar o no ciertos eventos en las etapas que conforman el

mismo.

En el modelo que se diseña en el trabajo de investigación se desarrolló un análisis desde

métricas estadísticas para mostrar el desempeño y respuesta del modelo. Se muestran en

las tablas: Tabla 4–8 y Tabla 4–9 los resultados del estimador predicador y del desempeño

del modelo. La Figura 4-7 muestra los perfiles de radiación por ciudad en forma de mapeo

del valor predicho/medido, una figura válida en términos de interpretación puesto que de

esta figura el planeador puede generar un concepto de la medida de radiación (alta-media-

baja), tendencias al futuro sobre fluctuaciones del recurso y ser capaz de determinar los

perfiles de radiación por ciudad y tomar decisiones.

Page 93: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Capítulo 4. 75

Page 94: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

5 Conclusiones y futuros desarrollos.

5.1 Conclusiones generales.

• Se propuso un modelo que tuviera en cuenta las condiciones geográficas de

Colombia para cuantificar-predecir recurso primario, como una contribución al

desarrollo y visibilidad de técnicas computacionales, que serán tomadas como

herramientas de ayuda en la toma de decisiones. El reto es, es generar espacios

de visibilidad para el uso de ML en un clima tan variado como el colombiano.

• Se diseñó un modelo de pronóstico de radiación solar basado en Machine Learning

que presenta los siguientes atributos:

-Topología de predictor híbrido.

-Implementación de etapas de clasificación-agrupamiento (Fuzzy Logic) y

estimación (SVM+NN).

-Fuzzy Logic, es robusto al no ser excluyente y poder hacer intersecciones de las

funciones de membresía en clasificación.

-SVM presenta fortalezas en cuanto al manejo de datos a la entrada, alta no

linealidad y la posibilidad de geolocalizar la estimación al manejar componente

geográfico (kernel NN).

-Inclusión de una función kernel (NN) dinámica que aporta en la predicción de

recuso primario dependiente de la localización geográfica.

Page 95: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Conclusiones y futuros desarrollos. 77

• Se elaboró el estado del arte donde se identificó la evolución al abordar el problema

en la predicción de recurso primario y la solución que presenta la literatura con el

uso de predictores ML.

• Se estableció criterios de selección de técnicas los cuales están ligados a las

condiciones geográficas en particular. Estos criterios evalúan:

-Tratamiento de la no-linealidad del recurso.

-Comportamiento al usar múltiples entradas.

-Baja desviación e incertidumbre

-Horizonte de predicción variable.

-Flexibilidad del modelo.

5.2 Futuros desarrollos.

Son muchas las direcciones en las que este trabajo se puede continuar. Entre las que

destaca, la inserción en el modelo de aspectos de predicción a corto plazo: análisis y

comparación de rendimiento del modelo al considerar diferentes bases de datos para

comprobar su validez y la inserción en la planeación de estrategias computacionales en la

toma de decisiones.

La Figura 5-1 muestra los temas que se sugieren como trabajo futuro.

Page 96: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

78 Modelo de pronóstico de radiación solar basado en Machine Learning.

Figura 5-1: Diagrama de flujo como sugerencia de trabajos futuros.

Fuente: adaptado de [128].

Se sugiere incluir en el modelo variables de tipo económico en base al recurso primario

predicho. Para la variable económica el Costo Nivelado de Energía, LCOE, es la

herramienta sugerida para decidir si en base a su potencial energético una región

geográfica determinada podría a largo plazo producir electricidad solar y diversificar la

matriz eléctrica. En el aspecto del cálculo de energía en firme el modelo podría ser una

herramienta para insertar el comportamiento de la planta al tener en cuenta datos distintos

a radiación y temperatura y así caracterizar el país en regiones solares productivas, las

cuales darán una idea de potencial y brindaran información del comportamiento del recurso

primario.

El desarrollo de este trabajo de investigación presenta una oportunidad de acercamiento a

largo plazo para predecir recurso solar a través de los datos. El reto es aplicar técnicas ML

en corto plazo para analizar efectos en la red en corto tiempo. Las variaciones en tensión

y frecuencia del sistema FV dependen del clima con una resolución espacio-temporal fina

y deben ser analizados para proponer escenarios de previsión a fin de minimizar efectos

adversos en tensión y frecuencia del sistema al integrar fuentes variables no síncronas.

Page 97: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Conclusiones y futuros desarrollos. 79

Según [178, p. 70] los efectos adversos en tensión, corriente y frecuencia conllevan a retos

operativos en Colombia, ya que el sistema debe ser lo suficientemente flexible para atender

esta variabilidad y atender la demanda de forma segura, confiable y económica. Por estas

razones, se hace necesario contar con sistemas que permitan pronosticar la generación

de las plantas en diferentes horizontes del planeamiento operativo, así como determinar

la incertidumbre asociada con estos pronósticos.

La seguridad del sistema es un punto importante que debe integrar técnicas ML a fin de

minimizar la incertidumbre en la seguridad del sistema y prever la entrada de plantas FV

con el fin de garantizar el suministro eléctrico.

Las técnicas ML a corto plazo pueden ayudar en la predicción de la demanda a una escala

temporal de minutos lo que ayudaría en la toma de decisiones respecto a la viabilización

de sistemas FV en zonas aisladas o implementar sistemas híbridos de energía. Respecto

a este tópico otro aspecto en el que el ML sería una herramienta de soporte es el

desarrollar tendencias por regiones de demanda y de ahí se deriva la planeación

geográficamente distribuida de sistemas FV.

Por último, la inserción de técnicas ML en la toma de decisiones para planeación presenta

un reto en los planes de expansión de cobertura en Colombia. Conocer el histórico de una

región y determinar cuál es su potencial de recurso primario ayudará a tomar mejores

decisiones en aspectos económico, de inversión y social.

5.3 Difusión académica.

El trabajo de investigación se ha puesto en consideración de la comunidad académica

mediante:

• Primera Feria Exposolar, Medellín, Colombia, mayo, 2017. Ponencia:

"Comparación de desempeño de un sistema fotovoltaico autónomo teniendo en

cuenta datos climáticos y predicción de un perfil de recurso solar".

• XI Simposio Internacional de Calidad de la Energía Eléctrica, SICEL,

Bucaramanga, Colombia, noviembre, 2017. Ponencia: "Comparación metodología

Page 98: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

80 Modelo de pronóstico de radiación solar basado en Machine Learning.

para pronosticar capacidad de generación de energía fotovoltaica basado en datos

climáticos".

• XII Semana ambiental "Ciudades y territorios sostenibles", Popayán, Colombia,

abril, 2018. Ponencia: "Predicción de radiación solar mediante Machine Learning".

• Desarrollo del curso: “Machine Learning y sus aplicaciones”, Manizales, Caldas.

Julio, 2018. Curso impartido a estudiantes del semillero del grupo E3P de la

Universidad Nacional de Colombia Sede Manizales. Se aplicaron técnicas ML a

soluciones que ejemplificaban el uso de estos en determinadas situaciones.

• Publicación de artículo: “Comparación metodología para pronosticar capacidad de

generación de energía fotovoltaica basado en datos climáticos”. En la Revista

SICEL de la Universidad Nacional de Colombia, 2017 [179].

• Articulo: “Solar Radiation Prediction Using Machine Learning Techniques: A

Review”, enviado a la revista IEEE Transactions Latín América. En revisión, 2018.

Page 99: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

A. Tabla de avances y desafíos en aproximaciones numéricas-analíticas.

Tabla A–1: Avances y desafíos en aproximaciones numéricas-Analíticas.

Referencias Aportes Desafíos Tipo de datos de entrada

[25], [27]

Introducción de una

función de densidad que

hace las veces de

aproximación.

No determina el valor de las demás

entradas considera una sola (radiación) en

el modelo

Utiliza reconstrucción solar en intervalos

predefinidos.

Al usar la diferencia de radiación entre

cielo despejado y radiación actual, la

desviación aumenta en horizontes de

predicción largos.

Exógenos

[38]

Primera aproximación

para separar

componentes de

radiación.

Considera la topografía

del terreno como factor

que cambia el modelo

desarrollado.

Mejorar precisión en superficies irregulares.

Considerar nubes como cuerpos estáticos. Endógeno

[42]

A partir de históricos de

una ciudad predice

radiación en 4 ciudades.

Primeros trabajos donde

se hace pre

Desviación con datos medidos superior al

20% en la estimación por hora.

En predicción anual no estima de forma

precisa los valores de radiación.

Correlación entre datos muy baja,

aproximadamente del 60%

Estructurado

Page 100: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

82 Modelo de pronóstico de radiación solar basado en Machine Learning.

procesamiento a los

datos de entrada.

Aproxima el valor de

radiación por medio de

funciones.

[180]

Usa relación de

coeficientes para eliminar

el efecto de la elevación.

Clasificación de días:

Soleado o nuboso.

En la estimación horaria

desviación es alrededor

5%

Dataset limitado realiza pronósticos por

intervalos.

Usa percentiles que dividen el dataset en 2

subconjuntos.

Sin pre procesamiento de datos iniciales

Estimación anual desviación del 16%

Exógenos

[181][182]

Considera coeficientes

que relaciona

numéricamente la

energía incidente y la

localización geográfica.

Se amplía el modelo de

Angstrom.

Tiene en cuenta la altitud

de la localidad.

Comportamiento constante lineal.

Modelo Tierra-Sol, depende mucho de

ángulos astronómicos de difícil calculo

Endógeno

[183][184]

Tiene en consideración

el efecto de las nubes en

el desarrollo del modelo.

Investiga la frecuencia de

nubosidad en el cielo.

Modelo subestima valores en invierno y los

sobreestima en verano.

Basado en 22 modelos de banda óptica lo

que genera ruido en el modelo total.

Modela una región 3D que lo hace

computacionalmente demandante.

Endógeno

[154][47]

Evaluación de flujo

global de Sol, frecuencia

de distribución de

radiación local.

Muestra la variación

estacional del recurso

solar.

Permite modelar la

probabilidad anual para

estaciones.

Modelo solo aplicado localmente.

Coeficientes de relación calculados para la

misma ciudad de prueba

Endógeno

Page 101: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Anexos. 83

[22][23], [24]

Busca correlaciones

entre datos no

considerados en

modelos anteriores.

Considera las nubes

como datos que influyen

con su movimiento en la

radiación incidente.

Con grandes capas de nubes la precisión

del modelo decrece.

Modelo que depende 100% de la

localización.

Exógenos

[44][185]–[188]

Comienzo de modelos

híbridos.

Explora correlaciones

entre días.

Nubosidad como

parámetro de entrada.

Etapas de pre y post

procesamiento de

resultados.

Computacionalmente demandante.

En horizontes < 1h se presenta una

desviación mayor.

Mejorar precisión al mejorar pixeles de

resolución de imagen.

Page 102: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

B. Tabla de trabajos representativos que usan predictores ML unitarios.

Tabla B–2: Lista de trabajos representativos relacionados con predicción de radiación donde usan predictores ML unitarios.

Referencia Criterio de

evaluación

Tipo de datos de

entrada Resultado

[28] RMSE Exógeno NN>AR>GP>SVR>SC-

Persistencia>Pers

[29] RMSE Exógenos SVR RBFN>SVR poly>>Fuzzy

Linear Regression

[51] RMSE/MBE Estructurado

NN> modelos de regresión

lineal

[70] rRMSE Exógeno

SVM>modelos basados en

temperatura

[54] RMSE/MBE/M

APE Exógeno MLPNN>HMM-10>RBFNN

[75] RMSE Endógeno k-means>LR

[62] RMSE/MBE Endógeno NN>NWP

[64] RMSE/MBE Endógeno Fuzzy>Regresión Lineal >NWP

[66] RMSE-R Estructurados Fuzzy Genetic>ANN>ANFIS

[57] RMSE Endógeno NN>Regresión lineal > ARIMA

[58] MBE/RMSE Endógeno ARIMA> función GHi

[60] MBE/RMSE Exógenos

ARMA eq MLP >

Bayesian>Markov

[102] MAE Endógeno

BP-M>LVQ-U>LM-

M>ARIMA>NWP.

[80] RMSE Estructurado RBFN>ML

[83] MAPE Exógenos ANN>Angstrom

[86] rRMSE Endógeno NN>ANFIS>AR>CI

Page 103: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Anexo B. 85

[87] RMSE Endógeno NN>AR>Markov>Neighboor

[189] RMSE Endógeno EML>SVM>KNN>Persistencia

[190] RMSE Exógeno GPR>ELM>SVM

[108] RMSE Endógeno

NN>ARMA>ARMA(Box

Jenkings)

[191] FANOVA Endógeno

Modelo

propuesto>NAM>SREF

[192] RMSE -R Estructurado SVM>HMM>Sky image

[193] RMSE-R

Estructurado/Endóge

no NN(BP)>ANN(Bayesian)

[194] R Estructurado SVRPSO>SVRGA>SVR

[112] RMSE Exógeno. GRNN>NARX>MLP>ANFIS

Page 104: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

C. Tabla de trabajos relacionados con predicción de radiación que usan predictores ML híbridos.

Tabla C–3: Lista de trabajos representativos relacionados con predicción de radiación que usa predictores ML híbridos.

Referencia Criterio de

evaluación

Tipo de

datos de

entrada

Resultado

[43] RMSE Estructurados CRO-ELM>ELM>SVM

[50] RMSE Estructurado NN+MarkovMatrices>NN

[77] RMSE Estructurado NN+SCG>NN+PR>

[63] RMSE-MBE Endógeno DRWNN > CPR>BPnewtwork

[195] RMSE Exógeno WNN+GAO>NN+LVQ

[196] RMSE Exógeno WNN+PCA>NN(temporal)

[150] nRMSE Endógeno Híbrido>TDNN>ARMA

[197] MBE Exógeno ANN+MNLR>ANN(LVQ)

[198] RMSE Exógeno WNN>ANN

[199] Kolmogorov–

Smirnov. Endógeno CARDS>NN>ARMA

[200] RMSE Endógeno Propuesto>MLP>NN

[201] RMSE Exógenos Propuesto >SOM>Kmeans>NG

[107] RMSE Estructurado GSO-SVM-HARD>SVM-HARD

[164] R Estructurado. BS-SVM>SVM> modelo local

[202] RMSE/MBE Estructurado SVR+GBR+RFR>individuales>NWP

[106] R Estructurado Wavelent+SVM>SVM

[203] RMSE Endógeno K-means transformado>SOM> k

means_var

Page 105: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Anexo C. 87

[204] RMSE/R Endógeno Mycielski- Markov>Mycielski

method>ANN>ARIMA

[110] RMSE Estructurado ANN/SA>ANN>GP>SVM

[205] RMSE Endógeno SHBM>modelos basados en regresión

lineal

[113] RMSE/R Exógeno RF>ANN-RF>ANN>RF>RF-FFA

Page 106: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

D. Tabla de trabajos representativos del uso de cuantificación y predicción de recurso primario integrado en planeación.

Tabla D-4: Síntesis de trabajos que integran predicción y cuantificación de recurso primario en procesos de planeación.

Referencias Aporte. Desafíos.

[119]–[122],

[128]

• Herramienta integrada al

programa de desarrollo

energético de estados y

municipalidades geográficamente

identificadas.

• Promueve la utilización de

fuentes de energía

descentralizadas para auto

generadores de menos de 2MW.

• Complementa la oferta del

sistema energético visibilizando

recursos primarios

geográficamente dispuestos.

• Identifica consumo energético

diferenciado por sectores.

• Herramienta presenta

oportunidad de desarrollo en tres

frentes: calidad, cantidad y

accesibilidad de los recursos

primarios.

• Hacer un análisis en la

predicción de la demanda e

integrar esta cuantificación en

los planes de promoción de

Fuentes con recurso variable.

• Para determinado consumo

identificar la fuente o fuentes

energéticas que mejor se

adecuen a la demanda al tener

en cuenta tiempos coincidentes

en recurso solar y demanda.

• Comportamiento del modelo al

usar modelo estructurado en la

predicción.

• Estudiar la influencia del

horizonte de predicción en la

determinación de políticas

públicas.

Page 107: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Anexos. 89

• Entrega de un paquete regulatorio

aproximado según zona

geográfica.

• Herramienta da respuesta a sitios

óptimos de instalación de

sistemas FV interconectados a la

red con los menores impactos a

la red.

[118], [127].

• Evalúan y establecen criterios

para diferentes técnicas, en

términos de precisión que se

usan en la predicción de

demanda y de generación.

• Visibilizarían de modelos ML,

numéricos y analíticos integrados

en EPM.

• Estudiar la influencia del

horizonte de predicción en la

determinación de políticas

públicas.

[123].

• Visibiliza criterios que influencian

el diseño de sistemas de energía

con recurso primario variable

solar.

• Evalúa los impactos económicos

de la instalación de sistemas

Solares en la red.

• Propone un esquema tarifario en

base a la región geográfica a

implementar.

• No toma en consideración un

modelo estructurado en la

potencia de salida del sistema.

• Modelo muy local y no aplicado

a otra zona geográfica

[116], [129].

• Se aborda la precisión espacio –

temporal del modelo como un

aspecto de análisis dentro del

proceso de planeación.

• Muestra tópicos de estudio en

planeación según la precisión del

modelo.

• No presenta una metodología

económica según sea el caso

de estudio o técnica aplicada.

• En el caso de estudio no usa un

modelo estructurado o

nubosidad presente.

Page 108: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

90 Modelo de pronóstico de radiación solar basado en Machine Learning.

[126]

• Según los resultados de la

predicción de recurso primario,

calcula la potencia total entregada

por el sistema FV.

• Propone topología de

generadores agrupados para

cubrir demanda según ubicación

geográfica.

• Muestra una metodología que se

basa en cálculo de energía en

firme para integrar factores

económicos en planta FV.

• No toma en cuenta efectos

climáticos sobre el modelo.

• Modelo estadístico muy geo

localizado.

[130]

• Visibiliza las ventajas del uso de

predicción y cuantificación a la luz

de la regulación existente.

• Modelo propuesto integrado a

plan energético estatal como

herramienta destinada a brindar

información en procesos de

subasta de energía.

• Integrar una metodología

económica en el modelo.

• Tener en cuenta un dataset

estructurado en relación con

geografía diferenciada.

Page 109: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Anexos. 91

E. Tabla bases de datos disponibles para aplicaciones de radiación solar.

Tabla E–5: Lista simplificada de bases de datos usadas en aplicaciones de Energía Solar.

Base de datos Histórico Resolución

temporal

Cubrimiento

espacial

Resolución

Espacial (En

Colombia)

Elementos de datos y

fuentes de medida. Disponibilidad

3TIER (VAISALA) Enero 1997-

presente

30 minutos,

instantáneo; 1

hora

promediada

Global Aprox 3km

Componentes de

radiación estimadas por

satélite

Libre

BSRN (Baseline

Surface Radiation

Network)

1992-Presente 1 minuto Global

Interpola con

datos

históricos.

Componentes de

radiación, además de

infrarrojo y longitudes

de onda asociadas

estimadas por modelo

numérico

Libre Con

restricciones

faltantes par a

algunos países

CAMS MCCLEAR

SERVICE FOR

ESTIMATING

IRRADIATION

UNDER CLEAR-

SKY

2004-presente

1 minuto, 15

minutos, 1

hora, 1 día, 1

mes.

Global Aprox 50km

Componentes de

radiación obtenidas

mediante un modelo de

cielo abierto. Interpola

la resolución que

depende de la región

Libre

CERES SYN1deg 2002-presente 3 horas Global Aprox 100km

Componentes de

radiación medidos

satelitalmente y octas

de nubes.

Libre (Previo

registro)

Green PowerLabs:

SolarSatData 2000-presente 30 minutos. Global Aprox,4Km

Componentes de

radiación, y datos

estructurados

Licenciado

SolarGIS 1994-presente 1 hora Global Aprox 4km

Componentes de

radiación, temperatura y

velocidad del viento

Licenciado por

mapa

Powerviewer 1980-presente 1 día Global Aprox 55Km

Componentes de

radiación y datos

Estructurados

Libre.

Page 110: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Bibliografía.

[1] C. Mondial, D. E. L. É. Gie, Y. D. Kim, L. Birnbaum, G. Ward, and C. Frei, “Recursos energéticos globales,” World Energy Counc., p. 27, 2013.

[2] IRENA, “Renewable Energy Highlights,” no. July, pp. 1–2, 2017.

[3] E. Obando-Paredes and R. Vargas-Cañas, “Desempeño de un sistema fotovoltaico autónomo frente a condiciones medioambientales de una región en particular,” Rev. la Acad. Colomb. Ciencias Exactas, Físicas y Nat., vol. 40, no. 154, pp. 27–33, 2016.

[4] R. J. Davy and A. Troccoli, “Interannual variability of solar energy generation in Australia,” Sol. Energy, vol. 86, no. 12, pp. 3554–3560, 2012.

[5] D. & Beckman, Solar Engineering of Thermal Processes. .

[6] D. L. King, W. E. Boyson, and J. A. Kratochvil, “Photovoltaic array performance model,” Sandia Rep. No. 2004-3535, vol. 8, no. December, pp. 1–19, 2004.

[7] G. M. Masters, Renewable and Efficient Electric Power Systems. 2004.

[8] M. Mitchell, M. Campbell, K. Klement, and M. Sedighy, “Power variability analysis of megawatt-scale solar photovoltaic installations,” 2016 IEEE Electr. Power Energy Conf. EPEC 2016, pp. 1–4, 2016.

[9] E. Ghiani, F. Pilo, and S. Cossu, “Evaluation of photovoltaic installations performances in Sardinia,” Energy Convers. Manag., vol. 76, pp. 1134–1142, 2013.

[10] M.S. Mahmodian, R. Rahmani, E.Taslimi, and S. Mekhilef., “Step By Step Analyzing, Modeling and Simulation of Single and Double Array PV system in Different Environmental Variability,” 2012 Int. Conf. Futur. Environ. Energy IPCBEE, vol. 28, pp. 37–42, 2012.

[11] H. M. Diagne, M. David, P. Lauret, J. Boland, N. Schmutz, and M. Diagne, “Review of solar irradiance forecasting methods and a proposition for small-scale insular grids Review of solar irradiance forecasting methods and a proposition for small-scale insular grids. Renewable and Sustainable Energy Reviews Review of solar irradia,” vol. 27, pp. 65–76, 2013.

Page 111: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Bibliografía. 93

[12] L. Wang, O. Kisi, M. Zounemat-Kermani, G. A. Salazar, Z. Zhu, and W. Gong, “Solar radiation prediction using different techniques: Model evaluation and comparison,” Renew. Sustain. Energy Rev., vol. 61, pp. 384–397, 2016.

[13] Congreso De Colombia, “LEY 1715 Mayo de 2014,” in Presidencia de la Republica, no. May, 2014, p. 26.

[14] M. de M. de Colombia, Integración de las energías renovables no convencionales en Colombia. Bogota Colombia.

[15] C. Comision de Regulación de Energía y Gas (CREG), “Resolucion 243 de 2016.” .

[16] S. Verma and H. K. Verma, “Modeling & Analysis of Standalone Photovoltaic System,” Int. J. Res. Eng. Technol., vol. 2, no. 11, pp. 259–265, 2013.

[17] R. Perez, M. David, T. Hoff, S. Kivalov, and J. Kleissl, “Spatial and temporal variability of solar energy,” Asrc.Albany.Edu, no. figure 1, 2015.

[18] J. M. Vindel, A. A. Navarro, R. X. Valenzuela, and L. F. Zarzalejo, “Temporal variability patterns in solar radiation estimations,” J. Atmos. Solar-Terrestrial Phys., vol. 143–144, pp. 1–7, 2016.

[19] R. Perez et al., “Comparison of numerical weather prediction solar irradiance forecasts in the US, Canada and Europe,” Sol. Energy, vol. 94, pp. 305–326, 2013.

[20] F. Díaz, G. Montero, J. M. Escobar, E. Rodríguez, and R. Montenegro, “An adaptive solar radiation numerical model,” J. Comput. Appl. Math., vol. 236, no. 18, pp. 4611–4622, 2012.

[21] F. Díaz, G. Montero, J. M. Escobar, E. Rodríguez, and R. Montenegro, “A new predictive solar radiation numerical model,” Appl. Math. Comput., vol. 267, pp. 596–603, 2015.

[22] C. L. Fu and H. Y. Cheng, “Predicting solar irradiance with all-sky image features via regression,” Sol. Energy, vol. 97, pp. 537–550, 2013.

[23] R. Marquez and C. F. M. Coimbra, “Intra-hour DNI forecasting based on cloud tracking image analysis,” Sol. Energy, vol. 91, pp. 327–336, 2013.

[24] Z. Peng, D. Yu, D. Huang, J. Heiser, S. Yoo, and P. Kalb, “3D cloud detection and tracking system for solar forecast using multiple sky imagers,” Sol. Energy, vol. 118, pp. 496–519, 2015.

[25] X. Zhang, “A statistical approach for sub-hourly solar radiation reconstruction,” Renew. Energy, vol. 71, pp. 307–314, 2014.

[26] G. Oturanc, A. Hepbasli, and A. Genc, “Statistical Analysis of Solar Radiation Data,” no. January 2013, pp. 37–41.

[27] A. Peled and J. Appelbaum, “Evaluation of solar radiation properties by statistical tools and wavelet analysis,” Renew. Energy, vol. 59, pp. 30–38, 2013.

Page 112: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

94 Modelo de pronóstico de radiación solar basado en Machine Learning.

[28] P. Lauret, C. Voyant, T. Soubdhan, M. David, and P. Poggi, “A benchmarking of machine learning techniques for solar radiation forecastingin an insular context,” Sol. Energy, vol. 112, p. 0, 2015.

[29] Z. Ramedani, M. Omid, A. Keyhani, and B. Khoshnevisan, “A comparative study between fuzzy linear regression and support vector regression for global solar radiation prediction in Iran,” Sol. Energy, vol. 109, pp. 135–143, 2014.

[30] A. Alzahrani, P. Shamsi, C. Dagli, and M. Ferdowsi, “Solar Irradiance Forecasting Using Deep Neural Networks,” Procedia Comput. Sci., vol. 114, pp. 304–313, 2017.

[31] A. Mellit and A. Massi, “A 24-h forecast of solar irradiance using artificial neural network : Application for performance prediction of a grid-connected PV plant at Trieste , Italy,” Sol. Energy, vol. 84, no. 5, pp. 807–821, 2010.

[32] C. Voyant et al., “Machine learning methods for solar radiation forecasting: A review,” Renewable Energy, vol. 105. Elsevier Ltd, pp. 569–582, 2017.

[33] M. R. Rietveld, “A NEW METHOD FOR ESTIMATING THE REGRESSION COEFFICIENTS IN THE FORMULA RELATING SOLAR RADIATION TO SUNSHINE M,” vol. 19, pp. 243–252, 1978.

[34] A. Angstrom, “Solar and terrestrial radiation,” Rep. to Int. Com. Sol. Res. actiometric Investig. Sol. Atmos. Radiat., pp. 135–138, 1924.

[35] R. A. and M. COLLARES-PEREIRA, “A TIME-DEPENDENT , AUTOREGRESSIVE , GAUSSIAN MODEL FOR GENERATING SYNTHETIC HOURLY RADIATION,” vol. 49, pp. 167–174, 1992.

[36] R. D. LEMOINE, “CLASSIFICATION OF RADIATION SITES IN TERMS,” pp. 94–107, 1983.

[37] K. G. Krishnan, K. Schöller, and E. Uhl, “Application of a Compact High-Definition Exoscope for Illumination and Magnification in High-Precision Surgical Procedures,” World Neurosurg., vol. 97, no. 026, pp. 652–660, 2017.

[38] R. Chen, E. Kang, X. Ji, J. Yang, and J. Wang, “An hourly solar radiation model under actual weather and terrain conditions : A case study in Heihe river basin,” vol. 32, pp. 1148–1157, 2007.

[39] K. K. Gopinathan, “A new model for estimating total solar radiation,” vol. 5, no. L, pp. 107–109, 1988.

[40] F. J. Newland, “A STUDY OF SOLAR RADIATION MODELS FOR THE COASTAL REGION OF SOUTH CHINA,” vol. 43, no. 4, pp. 227–235, 1989.

[41] C. Mustacchi, V. Cena, M. Rocchi, C. Applicata, U. Roma, and R. Italia, “STOCHASTIC SIMULATION OF HOURLY GLOBAL RADIATION SEQUENCES,” vol. 23, no. 2, pp. 47–51, 1979.

[42] P. K. Pandey and M. L. Soupir, “A new method to estimate average hourly global

Page 113: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Bibliografía. 95

solar radiation on the horizontal surface,” Atmos. Res., vol. 114–115, pp. 83–90, 2012.

[43] S. Salcedo-Sanz, C. Casanova-Mateo, A. Pastor-Sánchez, and M. Sánchez-Girón, “Daily global solar radiation prediction based on a hybrid Coral Reefs Optimization - Extreme Learning Machine approach,” Sol. Energy, vol. 105, pp. 91–98, 2014.

[44] F. O. Hocaoǧlu, Ö. N. Gerek, and M. Kurban, “Hourly solar radiation forecasting using optimal coefficient 2-D linear filters and feed-forward neural networks,” Sol. Energy, vol. 82, no. 8, pp. 714–726, 2008.

[45] R. Perez, K. Moore, S. Wilcox, D. Renné, and A. Zelenka, “Forecasting solar radiation - Preliminary evaluation of an approach based upon the national forecast database,” Sol. Energy, vol. 81, no. 6, pp. 809–812, 2007.

[46] F. Nomiyama, J. Asai, T. Murakami, and J. Murata, “A study on global solar radiation forecasting using weather forecast data,” Circuits Syst. (MWSCAS), 2011 IEEE 54th Int. Midwest Symp., pp. 1–4, 2011.

[47] A. Ridha et al., “Experimental assessment of the solar energy potential in the gulf of Tunis, Tunisia,” Renew. Sustain. Energy Rev., vol. 20, pp. 155–168, 2013.

[48] Jan Kleissl, Solar Energy Forecasting and Resource Assessment. 2012.

[49] C. M. Bishop, Pattern Recognition and Machine Learning, vol. 4, no. 4. 2006.

[50] A. Mellit, M. Benghanem, A. H. Arab, and A. Guessoum, “A simplified model for generating sequences of global solar radiation data for isolated sites: Using artificial neural network and a library of Markov transition matrices approach,” Sol. Energy, vol. 79, no. 5, pp. 469–482, 2005.

[51] Y. Jiang, “Computation of monthly mean daily global solar radiation in China using artificial neural networks and comparison with other empirical models,” Energy, vol. 34, no. 9, pp. 1276–1283, 2009.

[52] A. Mellit, S. A. Kalogirou, L. Hontoria, and S. Shaari, “Artificial intelligence techniques for sizing photovoltaic systems: A review,” Renew. Sustain. Energy Rev., vol. 13, no. 2, pp. 406–419, 2009.

[53] R. Marquez and C. F. M. Coimbra, “Forecasting of global and direct solar irradiance using stochastic learning methods, ground experiments and the NWS database,” Sol. Energy, vol. 85, no. 5, pp. 746–756, 2011.

[54] F. O. Hocaoĝlu, “Stochastic approach for daily solar radiation modeling,” Sol. Energy, vol. 85, no. 2, pp. 278–287, 2011.

[55] S. Bhardwaj et al., “Estimation of solar radiation using a combination of Hidden Markov Model and generalized Fuzzy model,” Sol. Energy, vol. 93, pp. 43–54, 2013.

[56] A. Mellit, S. A. Kalogirou, S. Shaari, H. Salhi, and A. Hadj Arab, “Methodology for

Page 114: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

96 Modelo de pronóstico de radiación solar basado en Machine Learning.

predicting sequences of mean monthly clearness index and daily solar radiation data in remote areas: Application for sizing a stand-alone PV system,” Renew. Energy, vol. 33, no. 7, pp. 1570–1590, 2008.

[57] G. Reikard, “Predicting solar radiation at high resolutions: A comparison of time series forecasts,” Sol. Energy, vol. 83, no. 3, pp. 342–349, 2009.

[58] D. Yang, P. Jirutitijaroen, and W. M. Walsh, “Hourly solar irradiance time series forecasting using cloud cover index,” Sol. Energy, vol. 86, no. 12, pp. 3531–3543, 2012.

[59] J. Wu and C. K. Chan, “Prediction of hourly solar radiation with multi-model framework,” Energy Convers. Manag., vol. 76, pp. 347–355, 2013.

[60] C. Voyant, C. Paoli, M. Muselli, and M. L. Nivet, “Multi-horizon solar radiation forecasting for Mediterranean locations using time series models,” vol. 28, pp. 44–52, 2013.

[61] M. David, F. Ramahatana, P. J. Trombe, and P. Lauret, “Probabilistic forecasting of the solar irradiance with recursive ARMA and GARCH models,” Sol. Energy, vol. 133, pp. 55–72, 2016.

[62] M. Chaabene and M. Ben Ammar, “Neuro-fuzzy dynamic model with Kalman filter to forecast irradiance and temperature for solar energy systems,” Renew. Energy, vol. 33, no. 7, pp. 1435–1443, 2008.

[63] J. C. Ã and X. Lin, “Application of the diagonal recurrent wavelet neural network to solar irradiation forecast assisted with fuzzy technique,” vol. 21, pp. 1255–1263, 2008.

[64] R. S. Boata and P. Gravila, “Functional fuzzy approach for forecasting daily global solar irradiation,” Atmos. Res., vol. 112, pp. 79–88, 2012.

[65] B. Sivaneasan, C. Y. Yu, and K. P. Goh, “Solar Forecasting using ANN with Fuzzy Logic Pre-processing,” Energy Procedia, vol. 143, pp. 727–732, 2017.

[66] O. Kisi, “Modeling solar radiation of Mediterranean region in Turkey by using fuzzy genetic approach,” Energy, vol. 64, pp. 429–436, 2014.

[67] F. Baser and H. Demirhan, “A fuzzy regression with support vector machine approach to the estimation of horizontal global solar radiation,” Energy, vol. 123, pp. 229–240, 2017.

[68] T. C. McCandless, S. E. Haupt, and G. S. Young, “A model tree approach to forecasting solar irradiance variability,” Sol. Energy, vol. 120, pp. 514–524, 2015.

[69] J. Antonanzas, N. Osorio, R. Escobar, R. Urraca, F. J. Martinez-de-Pison, and F. Antonanzas-Torres, “Review of photovoltaic power forecasting,” Sol. Energy, vol. 136, pp. 78–111, 2016.

[70] J. L. Chen, H. Bin Liu, W. Wu, and D. T. Xie, “Estimation of monthly solar radiation

Page 115: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Bibliografía. 97

from measured temperatures using support vector machines - A case study,” Renew. Energy, vol. 36, no. 1, pp. 413–420, 2011.

[71] X. Yan, B. Francois, E. C. De Lille, C. Scientifique, and V. Ascq, “Solar Radiation Forecasting Using Artificial Neural Network for Local Power Reserve,” pp. 2–7, 2014.

[72] J. L. Chen, G. S. Li, and S. J. Wu, “Assessing the potential of support vector machine for estimating daily solar radiation using sunshine duration,” Energy Convers. Manag., vol. 75, pp. 311–318, 2013.

[73] H. T. C. Pedro and C. F. M. Coimbra, “Nearest-neighbor methodology for prediction of intra-hour global horizontal and direct normal irradiances,” Renew. Energy, vol. 80, pp. 770–782, 2015.

[74] K. Benmouiza and A. Cheknane, “Forecasting hourly global solar radiation using hybrid k -means and nonlinear autoregressive neural network models,” Energy Convers. Manag., vol. 75, pp. 561–569, 2013.

[75] M. Yesilbudak, I. Colak, and R. Bayindir, “K-means partition of monthly average insolation period data for Turkey,” Proc. - 2016 15th IEEE Int. Conf. Mach. Learn. Appl. ICMLA 2016, pp. 436–440, 2017.

[76] and T. O. H. M. Mohandes, S. Rehman, “Estimation of Global Solar Radiation Using Artificial Neural Networks in Abu Dhabi City, United Arab Emirates,” J. Sol. Energy Eng., 1998.

[77] A. Sözen, E. Arcaklioǧlu, M. Özalp, and N. Çaǧlar, “Forecasting based on neural network approach of solar potential in Turkey,” Renew. Energy, vol. 30, no. 7, pp. 1075–1090, 2005.

[78] S. a Kalogirou, “Artificial neural networks in renewable energy systems applications: a review,” Renew. Sustain. Energy Rev., vol. 5, no. 4, pp. 373–401, 2001.

[79] and T. O. H. M. Mohandes, S. Rehman, Y. Kemmoku, S. Orita, S. Nakagawa, T. Sakakibara, and E. Group, “Estimation of Global Solar Radiation Using Artificial Neural Networks in Abu Dhabi City, United Arab Emirates,” J. Sol. Energy Eng., vol. 66, no. 3, pp. 193–199, 1998.

[80] A. Dorvio, J. Jervase, and A. Al-Lawati, “Solar radiation estimation using artificial neural networks,” Appl. Energy, vol. 74, pp. 307–319, 2002.

[81] H. K. Elminir, F. F. Areed, and T. S. Elsayed, “Estimation of solar radiation components incident on Helwan site using neural networks,” Sol. Energy, vol. 79, no. 3, pp. 270–279, 2005.

[82] J. Mubiru and E. J. K. B. Banda, “Estimation of monthly average daily global solar irradiation using artificial neural networks,” Sol. Energy, vol. 82, no. 2, pp. 181–187, 2008.

[83] A. Azadeh, A. Maghsoudi, and S. Sohrabkhani, “An integrated artificial neural

Page 116: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

98 Modelo de pronóstico de radiación solar basado en Machine Learning.

networks approach for predicting global radiation,” Energy Convers. Manag., vol. 50, no. 6, pp. 1497–1505, 2009.

[84] M. Benghanem, A. Mellit, and S. N. Alamri, “ANN-based modelling and estimation of daily global solar radiation data : A case study,” Energy Convers. Manag., vol. 50, no. 7, pp. 1644–1655, 2009.

[85] D. A. Fadare, “Modelling of solar energy potential in Nigeria using an artificial neural network model,” Appl. Energy, vol. 86, no. 9, pp. 1410–1422, 2009.

[86] L. Martín, L. F. Zarzalejo, J. Polo, A. Navarro, R. Marchante, and M. Cony, “Prediction of global solar irradiance based on time series analysis: Application to solar thermal power plants energy production planning,” Sol. Energy, vol. 84, no. 10, pp. 1772–1781, 2010.

[87] C. Paoli, C. Voyant, M. Muselli, and M. L. Nivet, “Forecasting of preprocessed daily solar radiation time series using neural networks,” Sol. Energy, vol. 84, no. 12, pp. 2146–2160, 2010.

[88] A. Koca, H. F. Oztop, Y. Varol, and G. O. Koca, “Estimation of solar radiation using artificial neural networks with different input parameters for Mediterranean region of Anatolia in Turkey,” Expert Syst. Appl., vol. 38, no. 7, pp. 8756–8762, 2011.

[89] A. Linares-Rodríguez, J. A. Ruiz-Arias, D. Pozo-Vázquez, and J. Tovar-Pescador, “Generation of synthetic daily global solar radiation data based on ERA-Interim reanalysis and artificial neural networks,” Energy, vol. 36, no. 8, pp. 5356–5365, 2011.

[90] C. Voyant, M. Muselli, C. Paoli, and M. L. Nivet, “Optimization of an artificial neural network dedicated to the multivariate forecasting of daily global radiation,” Energy, vol. 36, no. 1, pp. 348–359, 2011.

[91] N. Zhang and P. K. Behera, “Solar radiation prediction based on recurrent neural networks trained by Levenberg-Marquardt backpropagation learning algorithm,” 2012 IEEE PES Innov. Smart Grid Technol. ISGT 2012, 2012.

[92] A. Ouammi, D. Zejli, H. Dagdougui, and R. Benchrifa, “Artificial neural network analysis of Moroccan solar potential,” Renew. Sustain. Energy Rev., vol. 16, no. 7, pp. 4876–4889, 2012.

[93] A. Hasni, A. Sehli, B. Draoui, A. Bassou, and B. Amieur, “Estimating global solar radiation using artificial neural network and climate data in the south-western region of Algeria,” Energy Procedia, vol. 18, pp. 531–537, 2012.

[94] M. Rumbayan, A. Abudureyimu, and K. Nagasaka, “Mapping of solar energy potential in Indonesia using artificial neural network and geographical information system,” Renew. Sustain. Energy Rev., vol. 16, no. 3, pp. 1437–1449, 2012.

[95] M. S. Islam, M. M. Kabir, and N. Kabir, “Artificial Neural Networks based Prediction of Insolation on Horizontal Surfaces for Bangladesh,” Procedia Technol., vol. 10, pp.

Page 117: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Bibliografía. 99

482–491, 2013.

[96] A. N. Celik and T. Muneer, “Neural network based method for conversion of solar radiation data,” Energy Convers. Manag., vol. 67, pp. 117–124, 2013.

[97] B. Amrouche and X. Le Pivert, “Artificial neural network based daily local forecasting for global solar radiation,” Appl. Energy, vol. 130, pp. 333–341, 2014.

[98] K. Kadirgama, A. K. Amirruddin, and R. A. Bakar, “Estimation of solar radiation by artificial networks: East coast Malaysia,” Energy Procedia, vol. 52, pp. 383–388, 2014.

[99] B. M. Alluhaidah, S. H. Shehadeh, and M. E. El-Hawary, “Most Influential Variables for Solar Radiation Forecasting Using Artificial Neural Networks,” 2014 IEEE Electr. Power Energy Conf., pp. 71–75, 2014.

[100] L. Ma, N. Yorino, and K. Khorasani, “Solar radiation (insolation) forecasting using constructive neural networks,” Proc. Int. Jt. Conf. Neural Networks, vol. 2016–Octob, no. 3, pp. 4991–4998, 2016.

[101] S. Çevik, “A Day Ahead Hourly Solar Radiation Forecasting by Artificial Neural Networks : A Case Study for Trabzon Province Yapay Sinir A ÷ lar Õ ile Gün Öncesi Saatlik Güne ú Radyasyonu Tahmini : Trabzon ø li Örne ÷ i,” 2017.

[102] A. Sfetsos and A. H. Coonick, “Univariate and multivariate forecasting of hourly solar radiation with artificial intelligence techniques,” Sol. Energy, vol. 68, no. 2, pp. 169–178, 2000.

[103] K. S. Reddy and M. Ranjan, “Solar resource estimation using artificial neural networks and comparison with other correlation models,” Energy Convers. Manag., vol. 44, no. 15, pp. 2519–2530, 2003.

[104] L. Hontoria, J. Aguilera, and P. Zufiria, “Generation of hourly irradiation synthetic series using the neural network multilayer perceptron,” Sol. Energy, vol. 72, no. 5, pp. 441–446, 2002.

[105] Y. Kemmoku, S. Orita, S. Nakagawa, and T. Sakakibara, “Daily insolation forecasting using a multi-stage neural network,” Sol. Energy, vol. 66, no. 3, pp. 193–199, 1999.

[106] R. C. Deo, X. Wen, and F. Qi, “A wavelet-coupled support vector machine model for forecasting global incident solar radiation using limited meteorological dataset,” Appl. Energy, vol. 168, pp. 568–593, 2016.

[107] H. Jiang and Y. Dong, “A nonlinear support vector machine model with hard penalty function based on glowworm swarm optimization for forecasting daily global solar radiation,” Energy Convers. Manag., vol. 126, pp. 991–1002, 2016.

[108] K. Gairaa, A. Khellaf, Y. Messlem, and F. Chellali, “Estimation of the daily global solar radiation based on Box-Jenkins and ANN models: A combined approach,” Renew. Sustain. Energy Rev., vol. 57, pp. 238–249, 2016.

Page 118: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

100 Modelo de pronóstico de radiación solar basado en Machine Learning.

[109] J. Heng, J. Wang, L. Xiao, and H. Lu, “Research and application of a combined model based on frequent pattern growth algorithm and multi-objective optimization for solar radiation forecasting,” Appl. Energy, vol. 208, no. September, pp. 845–866, 2017.

[110] S. M. Mousavi, E. S. Mostafavi, and P. Jiao, “Next generation prediction model for daily solar radiation on horizontal surface using a hybrid neural network and simulated annealing method,” Energy Convers. Manag., vol. 153, no. May, pp. 671–682, 2017.

[111] S. Ramaswamy and P. K. Sadhu, “Forecasting PV Power from Solar Irradiance and Temperature using Neural Networks,” pp. 0–4, 2017.

[112] S. Hussain and A. AlAlili, “A hybrid solar radiation modeling approach using wavelet multiresolution analysis and artificial neural networks,” Appl. Energy, vol. 208, no. May, pp. 540–550, 2017.

[113] I. A. Ibrahim and T. Khatib, “A novel hybrid model for hourly global solar radiation prediction using random forests technique and firefly algorithm,” Energy Convers. Manag., vol. 138, pp. 413–425, 2017.

[114] I. Renewable and E. Agency, RENEWABLE ENERGY STATISTICS 2017 STATISTIQUES D ’ ÉNERGIE RENOUVELABLE 2017 ESTADÍSTICAS DE ENERGÍA. 2017.

[115] IRENA, Planning for the Renewable Future. 2017.

[116] P. K, U. Govindarajan, V. K. Ramachandaramurthy, S. O. S. T, and B. Jeevarathinam, “Integrating solar photovoltaic energy conversion systems into industrial and commercial electrical energy utilization—A survey,” J. Ind. Inf. Integr., vol. 10, no. January, pp. 39–54, 2018.

[117] “Data for Renewable Energy Planning , Policy , and Investment.”

[118] K. B. Debnath and M. Mourshed, “Forecasting methods in energy planning models,” Renew. Sustain. Energy Rev., vol. 88, no. September 2017, pp. 297–325, 2018.

[119] C. Tiba, A. L. B. Candeias, N. Fraidenraich, E. M. d. S. Barbosa, P. B. de Carvalho Neto, and J. B. de Melo Filho, “A GIS-based decision support tool for renewable energy management and planning in semi-arid rural environments of northeast of Brazil,” Renew. Energy, vol. 35, no. 12, pp. 2921–2932, 2010.

[120] N. Sarmiento, S. Belmonte, P. Dellicompagni, J. Franco, K. Escalante, and J. Sarmiento, “A solar irradiation GIS as decision support tool for the Province of Salta, Argentina,” Renew. Energy, vol. 132, pp. 68–80, 2019.

[121] A. Gagliano, F. Nocera, A. D’Amico, and C. Spataru, “Geographical information system as support tool for sustainable Energy Action Plan,” Energy Procedia, vol. 83, pp. 310–319, 2015.

[122] J. Arán Carrión, A. Espín Estrella, F. Aznar Dols, M. Zamorano Toro, M. Rodríguez,

Page 119: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Bibliografía. 101

and A. Ramos Ridao, “Environmental decision-support systems for evaluating the carrying capacity of land areas: Optimal site selection for grid-connected photovoltaic power plants,” Renew. Sustain. Energy Rev., vol. 12, no. 9, pp. 2358–2380, 2008.

[123] H. Akiki, R. Chedid, and S. Rahman, “A DECISION SUPPORT TECHNIQUE FOR THE DESIGN OF HYBRID SOLAR-WIND POWER SYSTEltlS,” IEEE Trans. Energy Convers., vol. 13, no. 1, pp. 76–83, 1998.

[124] A. Cappelletti, L. Ceccherini Nelli, and A. Reatti, “Integration and architectural issues of a photovoltaic/thermal linear solar concentrator,” Sol. Energy, vol. 169, no. June 2017, pp. 362–373, 2018.

[125] G. T. H. E. Grid, “ENERGÍAS SOLAR Y EÓLICA EN LA RED ELÉCTRICA : MITOS Y ERRORES DE PERCEPCIÓN.”

[126] A. Di Piazza, M. C. Di Piazza, A. Ragusa, and G. Vitale, “Environmental data processing by clustering methods for energy forecast and planning,” Renew. Energy, vol. 36, no. 3, pp. 1063–1074, 2011.

[127] M. Koike et al., Planning of optimal daily power generation tolerating prediction uncertainty of demand and photovoltaics, vol. 19, no. 3. IFAC, 2014.

[128] B. P. Hayes and M. Prodanovic, “State Forecasting and Operational Planning for Distribution Network Energy Management Systems,” IEEE Trans. Smart Grid, vol. 7, no. 2, pp. 1002–1011, 2016.

[129] J. Rayl, G. S. Young, and J. R. S. Brownson, “Irradiance co-spectrum analysis: Tools for decision support and technological planning,” Sol. Energy, vol. 95, pp. 364–375, 2013.

[130] J. R. BENÍTEZ, “Sistema de predicción del recurso solar aplicado a centrales termosolares,” 2013.

[131] A. Molina, “Modelo de Radiación Solar,” p. 19, 2017.

[132] A. M. Monje and F. Martínez, “Modelo de GENERACIÓN FOTOVOLTAICA,” 2017.

[133] E. Islas Samperio, Jorge; Sanchez Juarez, Aaron; Manzini, Poli; Grande Acosta, Genice; Carrasco Gonzalez, Fidel; Zenon Olvera, “Potencial de los sistemas fotovoltaicos en Mexico. Analisis de los sectores residencial, publico e industrial por entidad federativa,” p. 213, 2010.

[134] S. S. Screening et al., “Solar resource assessment and site evaluation using remote sensing methods,” Fraunhofer ISE, vol. 1, no. February, p. 162, 2015.

[135] D. Morley, “Planning for Solar Energy,” no. 575, p. 148, 2014.

[136] F. R. Martins, E. B. Pereira, S. A. B. Silva, S. L. Abreu, and S. Colle, “Solar energy scenarios in Brazil, Part one: Resource assessment,” Energy Policy, vol. 36, no. 8, pp. 2843–2854, 2008.

Page 120: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

102 Modelo de pronóstico de radiación solar basado en Machine Learning.

[137] C. Hoyer, C. Schillings, D. Heinemann, H. Mannstein, and F. Trieb, “Solar resource assessment and site evaluation using remote sensing methods,” pp. 1–5, 2002.

[138] E. Zell et al., “Assessment of solar radiation resources in Saudi Arabia,” Sol. Energy, vol. 119, pp. 422–438, 2015.

[139] C. Belt et al., “Situación de Energías Renovables en el paraguay,” p. 83, 2011.

[140] M. Frutos, “Evaluación del recurso solar en Paraguay a partir de fusión de reanálisis meteorológicos y medidas en tierra,” 2015.

[141] G. Abal, M. D’Angelo, J. Cataldo, and A. Gutiérrez, “Mapa solar del Uruguay,” IV Conf. Lat. Am. Energía Sol. y XVII Simp. Peru. Energía Sol., p. 5, 2010.

[142] J. Sancho, J. Riesco, and C. Jiménez, “Atlas de Radiación Solar en España utilizando datos del SAF de Clima de EUMETSAT,” Minist. Agric. …, p. 162, 2012.

[143] C. Comision de Regulación de Energía y Gas (CREG), “Por la cual se regulan las actividades de autogeneración a pequeña escala y de generación distribuida en el sistema Interconectado Nacional.” .

[144] UPME, “Resolución 281 del 2015 Por la cual se define el límite máximo de potencia de la autogeneración a pequeña escala.” p. 2, 2015.

[145] C. Comision de Regulación de Energía y Gas (CREG), Resolución CREG 024 de 2015, Por la cual se regula la actividad de autogeneración a gran escala en el sistema interconectado nacional (SIN) y se dictan otras disposiciones. 2015, pp. 1–9.

[146] Comision de regulacion de energia y gas, “Resolucion 243 Por la cual se define la metodologia para determinar la energia firme para el cargo por confiabilidad ENFICC, de plantas solares fotovoltaicas,” 2016.

[147] Consorcio Energético CORPOEMA, “Plan de Desarrollo para las Fuentes no Convencionales de Energía en Colombia (PDFNCE),” Formulación un plan Desarro. para las fuentes no Conv. en Colomb. V1, vol. 1, pp. 25–28, 2010.

[148] IDEAM, “ATLAS DE RADIACIÓN SOLAR, ULTRAVIOLETA Y OZONO DE COLOMBIA ASPECTOS METODOLÓGICOS,” 2015.

[149] U. de los Andes and C. N. de Operación, “ANEXO 1 Protocolo : verificación y medición de series históricas para cálculo de ENFICC en plantas solares fotovoltaicas,” pp. 1–50, 2018.

[150] W. Ji and K. C. Chee, “Prediction of hourly solar radiation using a novel hybrid model of ARMA and TDNN,” Sol. Energy, vol. 85, no. 5, pp. 808–817, 2011.

[151] S. Belaid and A. Mellit, “Prediction of daily and mean monthly global solar radiation using support vector machine in an arid climate,” Energy Convers. Manag., vol. 118, pp. 105–118, 2016.

Page 121: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Bibliografía. 103

[152] C. Bergmeir and M. Ben, “frbs : Fuzzy Rule-Based Systems for Classification,” J. Stat. Softw., vol. 65, no. 6, pp. 1–30, 2015.

[153] B. Lantz, Machine Learning with R. 2017.

[154] A. Manzano, M. L. Martín, F. Valero, and C. Armenta, “A single method to estimate the daily global solar radiation from monthly data,” Atmos. Res., vol. 166, pp. 70–82, 2015.

[155] L. Tinker and R. Jones-Albertus, “Emerging PV technologies: The path to market competitiveness,” Conf. Rec. IEEE Photovolt. Spec. Conf., vol. 2016–Novem, pp. 3471–3474, 2016.

[156] M. Sengupta et al., “Best Practices Handbook for the Collection and Use of Solar Resource Data for Solar Energy Applications.,” Tech. Rep. - NREL/TP-5D00-63112, no. February, pp. 1–255, 2015.

[157] FONROCHE, “Circular 083-2015 Anexo. Consultoría para establecer una metodología para el cálculo de energía firme de una planta solar,” Circ. CREG 083-2015 Anexo, pp. 1–87, 2015.

[158] S. Ross et al., “Data quality for the Global Renewable Energy Atlas – Solar and Wind Concept paper,” Irena, pp. 1–26, 2013.

[159] R. Perez, C. Hoyer-Klick, and D. Renné, “Development of a Benchmarking Tool for Solar Energy Resource Datasets. A Guide for Non-Expert Users to Determine the most Appropriate Use of Solar Energy,” p. 18, 2011.

[160] J. G. HICKS, Solar Energy Forecasting and Resource Assessment. 2013.

[161] A. Agumya and G. G. J. Hunter, “A risk-based approach to assessing the ’Fitness for Use’of spatial data,” Urisa J., vol. 11, no. 1, pp. 33–44, 1999.

[162] P. W. Stackhouse et al., “POWER Release 8 ( with GIS Applications ) Methodology ( Data Parameters , Sources , & Validation ) Documentation Date ( All previous versions are obsolete ) ( Data Version 8 . 0 . 1 ),” vol. 8, 2018.

[163] J. Boland, M. David, and P. Lauret, “Short term solar radiation forecasting: Island versus continental sites,” Energy, vol. 113, pp. 186–192, 2016.

[164] O. Garcia-Hinde et al., “Feature selection in solar radiation prediction using bootstrapped SVRs,” 2016 IEEE Congr. Evol. Comput. CEC 2016, pp. 3638–3645, 2016.

[165] S. X. X. Chen, H. B. B. Gooi, and M. Q. Q. Wang, “Solar radiation forecast based on fuzzy logic and neural networks,” Renew. Energy, vol. 60, no. 0, pp. 195–201, 2013.

[166] Y. Barlas, “Formal aspects of model validity and validation in system dynamics,” Syst. Dyn. Rev., vol. 12, no. 3, pp. 183–210, 1996.

[167] S. Sperati, S. Alessandrini, P. Pinson, and G. Kariniotakis, “The ‘Weather intelligence

Page 122: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

104 Modelo de pronóstico de radiación solar basado en Machine Learning.

for renewable energies’ benchmarking exercise on short-term forecasting of wind and solar power generation,” Energies, vol. 8, no. 9, pp. 9594–9619, 2015.

[168] X. Zhang et al., “Solar Irradiance Forecasting by Using Wavelet Based Denoising,” Energy Procedia, vol. 57, no. 1, pp. 71–75, 2014.

[169] R. Sudirman, K. Ashenayi, and M. Golbaba, “Comparison of Methods Used for Forecasting Solar Radiation,” Green Technol. Conf. 2012 IEEE, pp. 1–3, 2012.

[170] M. M. Frasco, A. Ben, M. Frasco, and E. Ledell, “Package ‘ Metrics ,’” 2018.

[171] T. D. Stephan, “THE USE OF STATISTICAL MEASURES TO VALIDATE SYSTEM DYNAMICS MODELS,” NAVAL POSTGRADUATE SCHOOL Monterey, California, 1992.

[172] N. Case, “How To Become A Centaur,” pp. 17–18, 2018.

[173] G. Montavon, W. Samek, and K. R. Müller, “Methods for interpreting and understanding deep neural networks,” Digit. Signal Process. A Rev. J., vol. 73, pp. 1–15, 2018.

[174] K. R. Varshney, P. Khanduri, P. Sharma, S. Zhang, and P. K. Varshney, “An Answer Using Distributed Detection and Data Fusion Theory,” no. Whi, 2018.

[175] V. Van-Belle and P. Lisboa, “Research directions in interpretable machine learning models,” Esann, no. April, pp. 24–26, 2013.

[176] S. García, A. Fernández, J. Luengo, and F. Herrera, “A study of statistical techniques and performance measures for genetics-based machine learning: Accuracy and interpretability,” Soft Comput., vol. 13, no. 10, pp. 959–977, 2009.

[177] H. Ishibuchi and Y. Nojima, “Analysis of interpretability-accuracy tradeoff of fuzzy systems by multiobjective fuzzy genetics-based machine learning,” Int. J. Approx. Reason., vol. 44, no. 1, pp. 4–31, 2007.

[178] E. en M. XM and C. N. de D. CND, “PROPUESTA DE REQUERIMIENTOS TÉCNICOS PARA LA INTEGRACIÓN DE FUENTES DE GENERACIÓN NO SÍNCRONA AL SIN,” 2018.

[179] E. Obando-Paredes, S. X. Carvajal-quintero, and J. Pineda, “Comparación metodológica para pronosticar capacidad de generación de energía fotovoltaica basado en datos climáticos Methodological comparison to predict photovoltaic generation capacity based on climatic data,” pp. 1–8, 2017.

[180] F. Nomiyama, J. Asai, T. Murakami, H. Takano, and J. Murata, “A study on global solar radiation forecasting models using meteorological data and their application to wide area forecast,” 2012 IEEE Int. Conf. Power Syst. Technol., pp. 1–6, 2012.

[181] A. N. Syafawati et al., “Forecasting the potential of solar energy harvest in Kangar,” Proc. 2013 IEEE 7th Int. Power Eng. Optim. Conf. PEOCO 2013, no. June, pp. 77–82, 2013.

Page 123: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

Bibliografía. 105

[182] S. A. Fatemi and A. Kuh, “Solar radiation forecasting using zenith angle,” 2013 IEEE Glob. Conf. Signal Inf. Process. Glob. 2013 - Proc., pp. 523–526, 2013.

[183] H. Ohtake, K. ichi Shimose, J. G. da S. Fonseca, T. Takashima, T. Oozeki, and Y. Yamada, “Accuracy of the solar irradiance forecasts of the japan meteorological agency mesoscale model for the kanto region, Japan,” Sol. Energy, vol. 98, pp. 138–352, 2013.

[184] Y. Liu, S. Shimada, J. Yoshino, T. Kobayashi, Y. Miwa, and K. Furuta, “Ensemble forecasting of solar irradiance by applying a mesoscale meteorological model,” Sol. Energy, vol. 136, pp. 597–605, 2016.

[185] R. Perez, S. Kivalov, J. Schlemmer, K. Hemker, D. Renné, and T. E. Hoff, “Validation of short and medium term operational solar radiation forecasts in the US,” Sol. Energy, vol. 84, no. 12, pp. 2161–2172, 2010.

[186] A. Moghaddam and A. R. Seifi, “Study of forecasting renewable energies in smart grids using linear predictive filters and neural networks,” IET Renew. Power Gener., vol. 5, no. 6, p. 470, 2011.

[187] Y. Chu, H. T. C. Pedro, and C. F. M. Coimbra, “Hybrid intra-hour DNI forecasts with sky image processing enhanced by stochastic learning,” Sol. Energy, vol. 98, no. PC, pp. 592–603, 2013.

[188] L. F. Zarzalejo, L. Ramirez, and J. Polo, “Artificial intelligence techniques applied to hourly global irradiance estimation from satellite-derived cloud index,” Energy, vol. 30, no. 9 SPEC. ISS., pp. 1685–1697, 2005.

[189] S. Ferrari, M. Lazzaroni, V. Piuri, A. Salman, L. Cristaldi, and M. Faifer, “Computational intelligence models for solar radiation prediction,” Conf. Rec. - IEEE Instrum. Meas. Technol. Conf., pp. 757–762, 2013.

[190] S. Salcedo-Sanz, C. Casanova-Mateo, J. Munoz-Mari, and G. Camps-Valls, “Prediction of Daily Global Solar Irradiation Using Temporal Gaussian Processes,” IEEE Geosci. Remote Sens. Lett., vol. 11, no. 11, pp. 1936–1940, 2014.

[191] X. Shao, S. Lu, and H. F. Hamann, “Solar radiation forecast with machine learning,” Proc. AM-FPD 2016 - 23rd Int. Work. Act. Flatpanel Displays Devices TFT Technol. FPD Mater., pp. 19–22, 2016.

[192] J. Li, J. K. Ward, J. Tong, L. Collins, and G. Platt, “Machine learning for solar irradiance forecasting of photovoltaic system,” Renew. Energy, vol. 90, pp. 542–553, 2016.

[193] J. I. E. P. Jensona, “Solar radiation forecasting using artificial neural networks,” Natl. Inst. Sp. Res., vol. 1, pp. 1–34, 2017.

[194] S. Sreekumar, K. C. Sharma, and R. Bhakar, “Optimized Support Vector Regression Models for Short Term Solar Radiation Forecasting in Smart Environment,” pp. 1929–1932, 2016.

Page 124: Modelo de pronóstico de radiación solar basado en Machine ...bdigital.unal.edu.co/70361/1/1061744498.2018.pdf · 4.1 Modelo de predicción de radiación solar basado en Machine

106 Modelo de pronóstico de radiación solar basado en Machine Learning.

[195] J. Wang, Y. Xie, C. Zhu, and X. Xu, “Solar radiation prediction based on phase space reconstruction of wavelet neural network,” Procedia Eng., vol. 15, pp. 4603–4607, 2011.

[196] P. Zhang, H. Takano, and J. Murata, “Daily Solar Radiation Prediction based on Wavelet Analysis,” pp. 712–717, 2011.

[197] M. Ozgoren, M. Bilgili, and B. Sahin, “Estimation of global solar radiation using ANN over Turkey,” Expert Syst. Appl., vol. 39, no. 5, pp. 5043–5051, 2012.

[198] G. Capizzi, C. Napoli, and F. Bonanno, “Innovative Second-Generation Wavelets Construction With Recurrent Neural Networks for Solar Radiation Forecasting,” vol. 23, no. 11, pp. 1–11, 2012.

[199] J. Boland, M. Korolkiewicz, M. Agrawal, and J. Huang, “Forecasting solar radiation on short time scales using a coupled autoregressive and dynamical system (CARDS) model,” Sol. Energy, vol. 87, no. December, pp. 1–10, 2012.

[200] L. Lyu, M. Kantardzic, and E. Arabmakki, “Solar Irradiance Forecasting by Using Wavelet Based Denoising,” IEEE Symp. Comput. Intell. Eng. Solut., no. 1, pp. 110–116, 2014.

[201] M. Ghayekhloo, M. Ghofrani, M. B. Menhaj, and R. Azimi, “A novel clustering approach for short-term solar radiation forecasting,” Sol. Energy, vol. 122, pp. 1371–1383, 2015.

[202] Y. Gala, Á. Fernández, J. Díaz, and J. R. Dorronsoro, “Hybrid machine learning forecasting of solar radiation values,” Neurocomputing, vol. 176, pp. 48–59, 2016.

[203] R. Azimi, M. Ghayekhloo, and M. Ghofrani, “A hybrid method based on a new clustering technique and multilayer perceptron neural networks for hourly solar radiation forecasting,” Energy Convers. Manag., vol. 118, pp. 331–344, 2016.

[204] F. O. Hocaoglu and F. Serttas, “A novel hybrid (Mycielski-Markov) model for hourly solar radiation forecasting,” Renew. Energy, vol. 108, pp. 635–643, 2017.

[205] L. Achour, M. Bouharkat, O. Assas, and O. Behar, “Hybrid model for estimating monthly global solar radiation for the Southern of Algeria: (Case study: Tamanrasset, Algeria),” Energy, vol. 135, pp. 526–539, 2017.