ÍNDICE DE RADIAÇÃO ULTRAVIOLETA MÁXIMO DA CIDADE DE … · IUVmáx utilizados referem-se à...

4
ÍNDICE DE RADIAÇÃO ULTRAVIOLETA MÁXIMO DA CIDADE DE NATAL: MODELAGEM VIA MÉTODO UNIVARIADO SARIMA. Alexandre Boleira Lopo; Maria Helena Constantino Spyrides; Paulo Sérgio Lucio. Programa de Pós-Graduação em Ciências Climáticas - PPGCC-DFTE-UFRN Caixa Postal 1641, Campus Universitário Lagoa Nova, CEP 59072-970, Natal/RN E-mail: [email protected], [email protected], [email protected] Palavras-Chave: IUV, série temporal, estimação dos parâmetros, previsões, análise de resíduos. Resumo: O objetivo desta pesquisa refere-se a construção de um modelo univariado SARIMA (auto- regressivo integrado sazonal de médias móveis) ajustado à variabilidade do Índice de Radiação Ultravioleta máximo (IUVmáx) mensal, com a finalidade de realizar a previsão desta variável a partir de seu comportamento temporal/histórico (valores no passado) e componente sazonal. Os dados máximos de IUVmáx utilizados referem-se à cidade de Natal-RN e ao período de 2001 a 2011. O método consistiu de cinco etapas: (1) Imputação dos dados diários de IUVmáx; (2) Estudo descritivo da variabilidade do IUVmáx mensal e anual; (3) Análise e decomposição da série temporal; (4) Construção do modelo SARIMA com identificação, estimação dos parâmetros e análise dos resíduos; e (5) Previsões/simulações de IUVmáx. Concluiu-se que o modelo SARIMA (1,1,1) x (3,1,3) 12 foi o mais adequado em função da normalidade e independência dos seus resíduos. 1. INTRODUÇÃO A Radiação no Ultravioleta (RUV) é apenas uma pequena parte do espectro solar, seu valor está na ordem de 8% a 9% da radiação solar total incidente no topo da atmosfera terrestre para comprimentos de onda λ< 400 mnm, entretanto, a RUV é de grande importância na estruturação da atmosfera terrestre e também tem grande ação na biosfera [8]. No ser humano a RUV é responsável pela síntese da vitamina D e em excesso pode causar câncer da pele [4]. A justificativa deste artigo está relacionada ao aumento do Fluxo de Radiação Ultravioleta no Hemisfério Sul causado pela queda da coluna total de ozônio e pelas alterações na cobertura de nuvens e refletividade dos aerossóis apontados por [3] que analisou dados de 30 anos (1979-2008) do TOMS-Espectrômetro de Mapeamento Total de Ozônio instalado em satélites da Agencia Espacial dos EUA (NASA). O Índice de Radiação Ultravioleta (IUV) é inteiro e adimensional e descreve o nível ou intensidade de RUV solar na superfície do planeta em relação ao seu o efeito fotobiológico, sendo classificado como baixo 2), moderado ou médio 5), alto 7), muito alto 10) e extremo . As precauções a serem tomadas pelo indivíduo, de acordo com essa classificação, se referem ao uso de chapéus, roupas, óculos de sol, guarda-chuvas ou até mesmo a permanência dentro de casa [10]. Considerando a relevância do IUV e a importância de sua modelagem procurou-se o modelo ARIMA (auto-regressivo integrado de médias móveis), pois trata-se de um modelo univariado com construção a partir de um ciclo iterativo, no qual a escolha da estrutura do modelo é baseada nos próprios dados que descrevem adequadamente processos lineares estacionários, processos lineares não estacionários homogêneos e processos de memória longa, e podem ser generalizados pela inclusão de um operador sazonal SARIMA (auto-regressivo integrado sazonal de médias móveis)[1]. Ressalta-se que o modelo ARIMA (p,d,q) e sua variante sazonal SARIMA (p,d,q) x (P,D,Q) são meios poderosos e úteis para representar modelos de séries temporais e para inferir previsões sobre os movimentos futuros da variável analisada, sendo esses escolhidos para modelar a variabilidade de IUV (valor máximo diário) em função desta variável apresentar inúmeros fatores incontroláveis relativos ao clima e sazonalidade [9]. O objetivo desse artigo é determinar um modelo de séries temporais univariado (SARIMA) para análise e previsão de dados que correspondam à variabilidade do Índice de Radiação Ultravioleta (valor máximo ou IUVmáx) da cidade de Natal-RN. 2. MATERIAIS E MÉTODOS O método consistiu de cinco etapas: (1) Imputação dos dados diários de IUVmáx via técnica Preditive Mean Matching (PMM); (2) Estudo descritivo da variabilidade do IUVmáx mensal e anual; (3) Análise e decomposição da série temporal; (4) Construção do modelo SARIMA com identificação, estimação dos parâmetros e análise dos resíduos; e (5) Previsões/simulações de IUVmáx via modelo SARIMA. 2.1 DADOS Os dados mensais do IUV máx em Natal (5°48’S e 35°12’W) para o período de 2001 à 2010 foram construídos a partir de dados diários obtidos no Laboratório de Variáveis Ambientais Tropicais (LAVAT) do Instituto Nacional de Pesquisas Espaciais-Centro regional do Nordeste (INPE-CRN). 414 ISSN 2317-3297

Transcript of ÍNDICE DE RADIAÇÃO ULTRAVIOLETA MÁXIMO DA CIDADE DE … · IUVmáx utilizados referem-se à...

ÍNDICE DE RADIAÇÃO ULTRAVIOLETA MÁXIMO DA CIDADE DE

NATAL: MODELAGEM VIA MÉTODO UNIVARIADO SARIMA. Alexandre Boleira Lopo; Maria Helena Constantino Spyrides; Paulo Sérgio Lucio.

Programa de Pós-Graduação em Ciências Climáticas - PPGCC-DFTE-UFRN Caixa Postal 1641, Campus Universitário Lagoa Nova, CEP 59072-970, Natal/RN

E-mail: [email protected], [email protected], [email protected]

Palavras-Chave: IUV, série temporal, estimação dos parâmetros, previsões, análise de resíduos.

Resumo: O objetivo desta pesquisa refere-se a construção de um modelo univariado SARIMA (auto-

regressivo integrado sazonal de médias móveis) ajustado à variabilidade do Índice de Radiação Ultravioleta

máximo (IUVmáx) mensal, com a finalidade de realizar a previsão desta variável a partir de seu

comportamento temporal/histórico (valores no passado) e componente sazonal. Os dados máximos de

IUVmáx utilizados referem-se à cidade de Natal-RN e ao período de 2001 a 2011. O método consistiu de

cinco etapas: (1) Imputação dos dados diários de IUVmáx; (2) Estudo descritivo da variabilidade do IUVmáx

mensal e anual; (3) Análise e decomposição da série temporal; (4) Construção do modelo SARIMA com

identificação, estimação dos parâmetros e análise dos resíduos; e (5) Previsões/simulações de IUVmáx.

Concluiu-se que o modelo SARIMA (1,1,1) x (3,1,3)12 foi o mais adequado em função da normalidade e

independência dos seus resíduos.

1. INTRODUÇÃO

A Radiação no Ultravioleta (RUV) é apenas uma pequena parte do espectro solar, seu valor está na ordem

de 8% a 9% da radiação solar total incidente no topo da atmosfera terrestre para comprimentos de onda λ<

400 mnm, entretanto, a RUV é de grande importância na estruturação da atmosfera terrestre e também tem

grande ação na biosfera [8]. No ser humano a RUV é responsável pela síntese da vitamina D e em excesso

pode causar câncer da pele [4].

A justificativa deste artigo está relacionada ao aumento do Fluxo de Radiação Ultravioleta no Hemisfério

Sul causado pela queda da coluna total de ozônio e pelas alterações na cobertura de nuvens e refletividade

dos aerossóis apontados por [3] que analisou dados de 30 anos (1979-2008) do TOMS-Espectrômetro de

Mapeamento Total de Ozônio instalado em satélites da Agencia Espacial dos EUA (NASA).

O Índice de Radiação Ultravioleta (IUV) é inteiro e adimensional e descreve o nível ou intensidade de

RUV solar na superfície do planeta em relação ao seu o efeito fotobiológico, sendo classificado como

baixo 2), moderado ou médio 5), alto 7), muito alto 10) e extremo

. As precauções a serem tomadas pelo indivíduo, de acordo com essa classificação, se referem ao uso

de chapéus, roupas, óculos de sol, guarda-chuvas ou até mesmo a permanência dentro de casa [10].

Considerando a relevância do IUV e a importância de sua modelagem procurou-se o modelo ARIMA

(auto-regressivo integrado de médias móveis), pois trata-se de um modelo univariado com construção a partir

de um ciclo iterativo, no qual a escolha da estrutura do modelo é baseada nos próprios dados que descrevem

adequadamente processos lineares estacionários, processos lineares não estacionários homogêneos e

processos de memória longa, e podem ser generalizados pela inclusão de um operador sazonal SARIMA

(auto-regressivo integrado sazonal de médias móveis)[1]. Ressalta-se que o modelo ARIMA (p,d,q) e sua

variante sazonal SARIMA (p,d,q) x (P,D,Q) são meios poderosos e úteis para representar modelos de séries

temporais e para inferir previsões sobre os movimentos futuros da variável analisada, sendo esses escolhidos

para modelar a variabilidade de IUV (valor máximo diário) em função desta variável apresentar inúmeros

fatores incontroláveis relativos ao clima e sazonalidade [9].

O objetivo desse artigo é determinar um modelo de séries temporais univariado (SARIMA) para análise e

previsão de dados que correspondam à variabilidade do Índice de Radiação Ultravioleta (valor máximo ou

IUVmáx) da cidade de Natal-RN.

2. MATERIAIS E MÉTODOS

O método consistiu de cinco etapas: (1) Imputação dos dados diários de IUVmáx via técnica Preditive

Mean Matching (PMM); (2) Estudo descritivo da variabilidade do IUVmáx mensal e anual; (3) Análise e

decomposição da série temporal; (4) Construção do modelo SARIMA com identificação, estimação dos

parâmetros e análise dos resíduos; e (5) Previsões/simulações de IUVmáx via modelo SARIMA.

2.1 DADOS

Os dados mensais do IUV máx em Natal (5°48’S e 35°12’W) para o período de 2001 à 2010 foram

construídos a partir de dados diários obtidos no Laboratório de Variáveis Ambientais Tropicais (LAVAT) do

Instituto Nacional de Pesquisas Espaciais-Centro regional do Nordeste (INPE-CRN).

414

ISSN 2317-3297

2.2 IMPUTAÇÃO DE DADOS

Em função da presença de dados faltantes em 17,77% da série, aplicou-se técnica de imputação múltipla

via método da média preditiva ou Preditive Mean Matching [1, 2, 7] presente no aplicativo mice

(Multivariate Imputation by Chained Equatoins) do software R (disponível em http://www.r-project.org/).

2.3 ANÁLISE DA SÉRIE TEMPORAL

As propriedades observadas em uma série temporal (Xt) podem ser captadas assumindo-se a seguinte

forma de decomposição: . Sendo que Tt é uma componente de tendência, Ct é uma

componente cíclica ou sazonal e ɛt é uma componente aleatória ou ruído (a parte não explicada, que espera-se

ser puramente aleatória).

2.4 MÉTODO ARIMA E SARIMA

O ARIMA (método autoregressivo integrado de média móveis) é uma método paramétrico e estatístico

sendo descrito através de parâmetros assim dispostos (p,d,q). O termo p se refere a ordem da autoregressão

na série e corresponde a defasagens da série transformada. O termo d e refere-se ao número de

diferenciações que visam induzir estacionalidade da série.e está associada a palavra integrado. O termo q se

refere a média móveis dos resíduos ou as defasagens dos erros aleatórios e visa evitar a propagação dos

erros e incertezas. A parte sazonal é representada através de mais três parâmetros semelhantes, sendo assim

chamada de SARIMA. O SARIMA é definido por uma parte simples de parâmetros (p,d,q) e sazonal

composta de parâmetros (P,D,Q).

Para determinar os parâmetros são utilizadas as funções de autocorrelação (ACF) e autocorrelação

parcial (PACF). A análise da ACF visa identificar a estacionalidade e definir o termo de médias móveis (q

ou Q). A análise da função PACF possibilita identificar a ordem do termo autoregressivo (p ou P).

O processo de construção de modelos ARIMA proposto por [1] está assentado em um ciclo iterativo,

composto de três estágios: identificação, estimação e checagem do diagnóstico. A identificação consiste no

estabelecimento da ordem (p,d,q) ou, no caso sazonal,(p,d, q) x (P,D,Q), e deve ser determinada inicialmente.

Onde “d” são diferenças simples e “D”, as diferenças sazonais, em seguida deve- se realizar um processo de

checagem do diagnóstico, isto é, de verificação da acurácia do modelo estimado na etapa anterior, com a

finalidade de verificar se o modelo matemático está ajustado aos dados através de testes estatísticos. Caso se

verifique que um modelo não é adequado, o ciclo será repetido [1].

3.0. RESULTADOS

3.1-ETAPA 2-ESTUDO DESCRITIVO

Como mostra a Figura 3.1, na análise mensal, março apresentou os maiores IUVmáx (próximo a 13),

classificado como IUV extremo (> 11) conforme [9]. O ano com o maior valor médio foi 2007 (próximo a

11). A Figura e Tabela 3.1 apresentam os resultados do estudo descritivo do IUVmáx.

Figura 3.1 – Estudo descritivo mensal, anual e sazonal de IUVmáx.

Tabela 3.1 Estimação dos coeficientes, erro padrão e p-valor dos modelos.

IUV 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

Mínimo 9,82 8,73 9,04 7,72 8,75 8,68 8,85 8,41 7,4 8,37 7,45

Média 11,24 10,82 11,06 10,69 11,03 10,91 11,35 10,62 10,36 10,96 10,24

Máximo 12,82 12,10 12,87 12,35 13,63 13,18 13,46 12,20 12,5 14,84 12,83

Fonte: Elaborada pelos autores.

415

ISSN 2317-3297

3.2 -ETAPA 3- ANÁLISE DA SÉRIE TEMPORAL

A série temporal foi decomposta na figura 3.2. O primeiro gráfico mostra as observações (dados

mensais) do IUVmáx. O gráfico seguinte mostra o componente da tendência (Trend) utilizando uma média

móvel. O terceiro gráfico demonstra a sazonalidade (Seasonal) da série, calculada pela média, para cada

unidade de tempo em todos os períodos e o último gráfico apresenta a parte residual (Remainder) através da

remoção de tendência e componente sazonal a partir da série de tempo original.

810

1214

obse

rved

10.4

10.8

11.2

trend

-2-1

01

2

seas

onal

-1.0

0.0

1.0

2.0

2002 2004 2006 2008 2010 2012

rand

om

Time

Decomposition of additive time series

Figura 3.2 – Estudo de tendência e sazonalidade do IUVmáx.

Pela análise do gráfico verifica-se a não estacionariedade da série e há forte presença sazonal. Fato este

também verificado na ACF, sendo assim é necessário realizar ao processo de diferenciar a série original para

torná-la estacionária [1].

3.1-ETAPA 4- IDENTIFICAÇÃO E ESTIMAÇÃO DOS PARÂMETROS E ANÁLISE DOS

RESÍDUOS DO MODELO SARIMA.

A série se tornou estacionária após a 1ª diferenciação simples e sazonal. Fato verificado pela ACF, em

seguida realizou-se a estimação dos parâmetros (p,q, P, Q). A Figura 3.3 retrata o processo.

0.0 0.5 1.0 1.5

-0.5

0.0

0.5

1.0

defasagem

fac

ACF da série original Série com 1ª diferenciação simples e sazonal

Anos

IUV

2002 2004 2006 2008 2010 2012

-1.5

-0.5

0.5

1.5

0 5 10 15 20 25 30 35

-0.4

0.0

0.4

0.8

Lag

fac

ACF da série diferenciada

0 5 10 15 20 25 30 35

-0.3

-0.2

-0.1

0.0

0.1

0.2

Lag

Parti

al A

CF

PACF da série diferenciada

Figura 3.3 – ACF da série original de IUVmáx e ACF e PACF da série diferenciada

Dentre os vários modelos testados, o modelo SARIMA (1,1,1)x(3,1,3)12, proporcionou o ajuste mais

adequado aos dados, cuja equação é: xt = -0,1785 xt-1–0,327xt-12 –0,0932xt-24 –0,906xt-36 -0,1562et-1 -

0,4076 et-12-0,3883 et-24 -0,1449et-36 + et. (3.1)

A análise dos resíduos constatou a sua normalidade através do Teste Shapiro-Wilk (p-valor= 0,093), sua

independência verificada pelo teste Box-Pierce (p-valor= 0,951) e os gráficos da ACF e PACF que indicaram

que os resíduos estão dentro do intervalo de confiança de 95%, verificando-se a existência do ruído branco.

416

ISSN 2317-3297

3.1-ETAPA 5- PREVISÕES/SIMULAÇÕES DE IUVmáx VIA MODELO SARIMA.

O modelo SARIMA (1,1,1) x (3,1,3)12 possibilitou a previsão da variabilidade do IUV máx para 12 passos

(meses), a partir do final da observação do ano 2011. A Figura 3.4 retrata esta previsão, sendo possível

identificar a sazonalidade nos dados previstos e a pequena diminuição do seu nível. Constata-se que devido

ao erro, o intervalo de confiança aumenta pra previsões mais distantes.

Figura 3.3 – Observações de IUVmáx e os resultados da previsão para 4 estações e 8 estações.

O modelo teve Critério de Informação de Akaike (AIC) igual a 223,61. O AIC é uma medida geral da

qualidade de ajustamento de modelos utilizado para comparação. Um modelo para a variável resposta Y é

considerado melhor que outro se tiver um AIC mais baixo. Para efeito de comparação o modelo ARIMA

(1,1,1) da série estudada teve AIC igual a 382,52.

4. CONSIDERAÇÕES FINAIS

Para tornar a série original estacionária fez-se uma diferenciação simples e sazonal e foram necessários

um termo autoregressivo simples (p), um termo média móvel simples (q), três termos autoregressivos

sazonais (P) e três termos médias moveis sazonais (Q), para que os resíduos se tornassem normalizados,

obtendo-se um modelo SARIMA (1,1,1) x (3,1,3)12, como descrito na equação nº 3.1, adequado para

previsão.

5. REFERENCIAS

[1] BOX, G.E.P.; JENKINS, G.M.; REINSEL, G.C. Time Series Analysis. Forecasting and Control. San

Francisco: Holden-day, 1976.

[2] BUUREN .V, S., OUDSHOORN , K.G. mice: Multivariate Imputation by Chained Equations in R.

Journal of Statistical Software, 45(3),p.1-67, 2011.

[3] HERMAN J.R. Global increase in UV irradiance during the past 30 years (1979–2008) estimated

from satellite data. Journal of Geophysical Research, vol. 115, 2010.

[4] BRASIL-INCA (Instituto Nacional de Câncer José Alencar Gomes da Silva). Estimativa 2012-

Incidência de Câncer no Brasil, Ministério da Saúde do Brasil, 2011.

[5] LEE-TAYLOR, J., MADRONICH, S.: Climatology of UV-A, UV-B, and Erythemal Radiation at the

Earth's Surface, 1979-2000 / National Center for Atmospheric Research Boulder, Colorado, 2007.

[6] LITTLE, RJA e RUBIN, DB. Statistical analysis with missing data. 2nd ed. New York: Wiley, 2002.

[7] LOPO, A.B. Imputação múltipla em dados do Índice de Radiação Ultravioleta da cidade de Natal

via Preditive Mean Matching (PMM). In: Anais do Congresso Brasileiro de Meteorologia. CBMET,

Gramado, 2012.

[8] MADRONICH, S. UV radiation in the natural and perturbed atmosphere. In: UV-B Radiation and

Ozone Depletion. Tevini, M. ed. Lewis Publisher, p. 17-69, 1993.

[9] MAKRIDAKIS, S.; WHEELWRIGHT, S.C.; HYNDMAN, J.R. Forecasting – Methods and

Applications. 3ª ed., New York: Wiley, 1998.

[10] WHO. Global Solar UV Index: A Practical Guide. World Health Organization, World Meteorological

Organization (WMO), United Nations Environment Program (UNEP), and International Commission on

Non-Ionising Radiation Protection (ICNRP), Geneva, 2002.

417

ISSN 2317-3297