Emprego da Teoria de Valores Extremos na constru˘c~ao de ...

Flavio Ferraz Vieira

Emprego da Teoria de Valores Extremos na

construcao de modelos espaco-temporal de

temperaturas

Niteroi - RJ, Brasil

20 de dezembro de 2018

Universidade Federal Fluminense


Emprego da Teoria de ValoresExtremos na construcao de modelos

espaco-temporal de temperaturas

Trabalho de Conclusao de Curso

Monografia apresentada para obtencao do grau de Bacharel emEstatıstica pela Universidade Federal Fluminense.

Orientador: Prof. Dr. Marco Aurelio dos Santos Sanfins

Co-Orientador: Prof. Dr. Valentin Sisko

Niteroi - RJ, Brasil

20 de dezembro de 2018

Universidade Federal Fluminense



construcao de modelos espaco-temporal de

temperaturas

Monografia de Projeto Final de Graduacao sob o tıtulo “Em-

prego da Teoria de Valores Extremos na construcao de modelos

espaco-temporal de temperaturas”, defendida por Flavio Ferraz

Vieira e aprovada em 20 de dezembro de 2018, na cidade de

Niteroi, no Estado do Rio de Janeiro, pela banca examinadora

constituıda pelos professores:

Prof. Dr. Marco Aurelio dos Santos SanfinsDepartamento de Estatıstica – UFF

Prof. Dr. Valentin SiskoDepartamento de Estatıstica – UFF

Prof. Me. Eduardo Ferioli GomesDepartamento de Estatıstica – UFF

Niteroi, 20 de dezembro de 2018

V657e Vieira, Flavio Ferraz


construção de modelos espaço-temporal de temperaturas /

Flavio Ferraz Vieira ; Marco Aurélio dos Santos Sanfins,

orientador ; Valentin Sisko, coorientador. Niterói, 2018.

51 f. : il.

Trabalho de Conclusão de Curso (Graduação em

Estatística)-Universidade Federal Fluminense, Instituto de

Matemática e Estatística, Niterói, 2018.

1. Modelagem. 2. Teoria dos Valores Extrems. 3.

Estatística Espacial. 4. Temperaturas Extremas. 5. Produção

intelectual. I. Sanfins, Marco Aurélio dos Santos, orientador.

II. Sisko, Valentin, coorientador. III. Universidade Federal

Fluminense. Instituto de Matemática e Estatística. IV. Título.

CDD –

Resumo

Os fundamentos da teoria dos valores extremos foram inicialmente expostos por Fishere Tippett [1], que por definicao introduziram os tres tipos possıveis de distribuicoes as-sintoticas dos valores extremos, conhecidas como Gumbel, de Frechet e de Weibull, res-pectivamente.

No entanto, o primeiro a estudar e formalizar a aplicacao estatıstica destas distri-buicoes foi Gumbel [2], cuja a metodologia tem sido frequentemente aplicada. Outrascontribuicoes importantes para o estudo de valores extremos foram dadas por Gnedenko[3], que mostrou as condicoes necessarias e suficientes para a existencia das distribuicoesassintoticas dos valores extremos. Atualmente diversas areas do conhecimento estao uti-lizando a Teoria de Valores extremos para construir modelos preditivos, principalmente adados relacionados ao meio ambiente. Esse fato decorre das grandes mudancas climaticasque vem ocorrendo em nosso planeta nos dias atuais.

Atualmente varios centros mundiais de coleta de dados sobre condicoes climaticas,vem coletando informacoes sobre as maiores temperaturas observadas em diversas areas doplaneta. Em especial atualmente o governo da India possui estas temperaturas maximascoletadas com as respectivas latitude e longitude, possuindo um Historico que abrange osperıodos de 1951 ate o ano de 2014. O objetivo deste projeto e utilizar a teoria de valoresextremos e com esta ser capaz de modelar os dados mencionados anteriormente, comotambem obter um modelo preditivo.

Palavras-chaves: Modelagem, Teoria dos Valores Extremos, Estatıstica Espacial, Tempe-raturas Extremas. Statistics

Este trabalho e dedicado aos meus pais, irmaos e minha namorada,

por todo apoio, suporte e compreensao durante a minha trajetoria.

Agradecimentos

Primeiramente agradecer a Deus pelo dom da vida e da sabedoria, sem ele nada disso

seria possıvel. Aos meus pais Dirlene e Sebastiao por toda educacao, apoio e suporte, meus

irmaos Paulo, Luiza e Diego pelos conselhos e sempre dispostos a oferecer um ombro

amigo, e minha melhor amiga e namorada Camila por todo amor, carinho e paciencia

durante toda minha trajetoria. E todas as pessoas que contribuıram durante a minha

graduacao, diretamente ou indiretamente; a todos meus amigos em especial ao Carlos

Renan, meu orientador Marco e co-orientador Valentin, e toda minha equipe de trabalho

da Fiocruz.

Sumario

Lista de Figuras

Lista de Tabelas

1 Introducao p. 11

1.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 11

2 Referencial Teorico p. 13

2.1 Teoria dos Valores Extremos . . . . . . . . . . . . . . . . . . . . . . . . p. 13

2.1.1 Historico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 13

2.2 Modelagem Univariada de Extremos . . . . . . . . . . . . . . . . . . . p. 14

2.2.1 Notacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 14

2.2.2 Distribuicao Exata e Limite do Maximo . . . . . . . . . . . . . p. 15

2.3 Modelos Assintoticos Para o Maximo . . . . . . . . . . . . . . . . . . . p. 18

2.4 Max-Estabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 21

2.4.1 Dominio de Atracao . . . . . . . . . . . . . . . . . . . . . . . . p. 22

2.5 Distribuicao de Valores Extremos Generalizada (GEV) . . . . . . . . . p. 23

2.6 Teste de Aderencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 24

3 Materiais e Metodos p. 26

3.0.1 Estimacao via Metodo de Maxima Verossimilhanca . . . . . . . p. 27

3.0.2 Estimacao via Metodo de L-Momentos . . . . . . . . . . . . . . p. 29

3.1 Testes Estatısticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 31

3.1.1 Estimativas Obtidas Por Maxima Verossimilhanca . . . . . . . . p. 31

3.1.2 Estimativas obtidas por L-Momentos . . . . . . . . . . . . . . . p. 33

3.2 Teste de Aderencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 34

3.3 Teste Grafico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 34

3.4 Modelagem e Previsoes . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 35

4 Analise dos Resultados p. 36

5 Conclusao p. 44

Referencias p. 45

Anexo A -- Analises Graficas de Coles p. 47

Lista de Figuras

1 Distribuicao Acumulada da Weibull com α = −2, Frechet com α = 1 e

Gumbel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 19

2 Curva Estimada e Teorica da Distribuicao Assintotica do Maximo Pa-

dronizado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 20

3 Representacao da Alocacao das Temperaturas Maximas na India . . . . p. 26

4 Regioes da India . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 27

5 Exemplo de um grafico de retorno . . . . . . . . . . . . . . . . . . . . . p. 35

6 Temperaturas Maximas dos Anos de 1951 e 2014 . . . . . . . . . . . . p. 36

7 Amplitude das Temperaturas Maximas Anuais . . . . . . . . . . . . . . p. 37

8 Maximos e Mınimos das Temperaturas Maximas Anuais . . . . . . . . p. 37

9 Desvio Padrao das Temperaturas Maximas Anuais . . . . . . . . . . . . p. 38

10 Media das Temperaturas Maximas Anuais . . . . . . . . . . . . . . . . p. 38

11 Temperatuas maximas observadas e previstas a partir de 2004 . . . . . p. 40

12 Previsao da Temperatura Maxima para 10 anos e seu IC . . . . . . . . p. 41



Lista de Tabelas

1 Representacao da Divisao de uma Variavel X em m Classes . . . . . . p. 24

2 Valores crıticos para as estatısticas de teste D+, D−, D e V . . . . . . . p. 32

3 Representacao do Teste de Aderencia de Pearson . . . . . . . . . . . . p. 34

4 Resultados da aplicacao do teste de aderencia de Pearson . . . . . . . . p. 39

11

1 Introducao

Em quase todas as areas da estatıstica a ordenacao da amostra e imprescindıvel para

a analise dos dados, na Teoria dos Valores Extremos (TVE) tal etapa e crucial. O TVE

e um ramo da probabilidade capaz de quantificar eventos extremos ou raros, atraves da

observacao de maximos (ou mınimos) de grupos de amostras. O TVE ja e presente na

literatura por um tempo relativamente longo e suas aplicacoes ja foram utilizadas em

diversas areas com interesse em observar eventos poucos frequentes, como na estimacao

de eventos climaticos, calculo de seguros e eventos pouco comuns no mercado financeiro.

Por ser um campo fertil para a inferencia estatıstica e possuir aplicacoes em muitas

areas, permitiu a Teoria dos Valores Extremos obter uma vasta bibliografia, entre eles o

classico livro de Gumbel [2], que foi o primeiro a estudar e formalizar os fundamentos da

teoria; outras contribuicoes importantes foram de Fisher e Tippett [1] que introduziram

as tres possıveis distribuicoes assintoticas dos valores extremos, conhecidos como Gumbel,

Frechet e Weibull, e Gnedenko [3] que mostrou as condicoes necessarias para a existencia

das distribuicoes assintoticas dos valores extremos.

Por causa das grandes mudancas climaticas que vem ocorrendo em nosso planeta nos

dias atuais, estudantes de diversas areas do conhecimento estao utilizando a Teoria de

Valores Extremos para construir modelos preditivos, afim de prever e prevenir eventos

indesejaveis.

1.1 Objetivos

A presente monografia tem por finalidade solidificar os conhecimentos e o manuseio

sobre variaveis que sejam coletadas segundo um padrao espaco-temporal. Solidificar os

conhecimentos sobre a Teoria dos Valores Extremos; como suas distribuicoes assintoticas

para os mınimos e maximos (Gumbel, Frechet e Weibull), as condicoes necessarias para

a existencia das convergencias, a distribuicao dos valores extremos generalizada, a es-

1.1 Objetivos 12

timacao dos seus parametros e os testes estatısticos para tais parametros. Estudar o

comportamento das temperaturas maximas da India nos anos de 1951 ate 2014 e propor

varios modelos para os dados com a utilizacao da Teoria de Valores Extremos. E por fim,

analisar e comparar estudos anteriores e correlatos, com a nova proposta e gerar previsoes

para anos posteriores.

13

2 Referencial Teorico

2.1 Teoria dos Valores Extremos

Essa secao aborda topicos sobre a Teoria dos Valores Extremos; seu historico, al-

gumas areas de aplicacoes e seus conceitos, as distribuicoes assintoticas dos maximos e

mınimos, suas condicoes necessarias e a distribuicao dos valores extremos generalizada.

As notacoes serao as mesmas utilizadas por Mendes [4]. Para um estudo mais detalhado

e intensificado sobre a Teoria dos Valores Extremos aconselha-se a leitura da tese de

doutorado denominada “Copulas para Distribuicoes Generalizadas de Valores Extremos

Multidimensionais”de Sanfins [5].

2.1.1 Historico

Eventos extremos sao definidos como eventos raros, eventos que nunca foram obser-

vados ou foram observados poucas vezes. Alguns exemplos classicos desses eventos sao as

crises financeiras, como a crise de 1929 ou desastres naturais, como tsunami, impacto de

meteoros e terremotos. A Teoria dos Valores Extremos surgiu com o interesse de cons-

truir um modelo preditivo que pudesse quantificar relativamente bem esses eventos, afim

de poder diminuir as consequencias ou preveni-los. De acordo com Pires [6], o impulso

dos estudos e da utilizacao do TVE se deu em 1953, quando barragens que protegem a

Holanda do avanco do mar se romperam e causaram a inundacao de boa parte do paıs,

provocando a morte de 1800 pessoas. Apos o desastre, o governo da Holanda criou um

comite que utilizava o ferramental ligado a Teoria dos Valores Extremos para estabelecer

a altura das barragens. Gumbel [2] diz que os interesses na construcao de modelos predi-

tivos de eventos extremos data desde o seculo XVII em estudos de astronomia. Apesar da

preocupacao dos estudos com a modelagem de valores extremos nao ser algo relativamente

novo, os primeiros fundamentos da TVE foram inicialmente expostos por Fisher e Tippett

[1] em 1928, que por introduziram os tres tipos possıveis de distribuicoes assintoticas dos

valores extremos, conhecidos como Gumbel, de Frechet e de Weibull.

2.2 Modelagem Univariada de Extremos 14

No entanto, o primeiro a estudar e formalizar a aplicacao estatıstica destas distri-

buicoes foi Gumbel [2] em 1954, cuja a metodologia tem sido frequentemente aplicada.

Outras contribuicoes importantes para o estudo de valores extremos foram dadas por

Gnedenko [3], que mostrou as condicoes necessarias e suficientes para a existencia das

distribuicoes assintoticas dos valores extremos.

2.2 Modelagem Univariada de Extremos

Nessa secao e apresentada a distribuicao assintotica dos maximos e dos mınimos e

suas condicoes necessarias, a distribuicao assintotica generalizada e seus parametros.

2.2.1 Notacoes

Seja X1, X2, ..., Xn uma amostra aleatoria simples de uma variavel X, com funcao de

distribuicao acumulada FX(x). Frequentemente trabalha-se com a funcao de densidade

fX(x), logo FX(x) e definida como:

FX(x) = P (X ≤ x) =

∫ x

−∞fX(a)da,

a esperanca da variavel X definida como:

E[X] =

∫ ∞−∞

xfX(x)dx,

e a variancia:

V ar[X] = E[(X − E[X])2].

A abordagem classica da Teoria dos Valores Extremos consiste em caracterizar as

caudas da distribuicao FX(x) a partir da distribuicao do maximo ou mınimo. Para isto e

definido as estatısticas de ordem, as estatısticas de ordem k e o suporte da FX(x).

Definicao 2.2.1 (Estatısticas de Ordem) Seja (Xn)n≥1 uma sucessao de variaveis aleatorias,

sao definidas estatısticas de ordem X(1), X(2), ..., X(n), que sao as variaveis aleatorias or-

denadas, tais que X(1) ≤ X(2) ≤ ... ≤ X(n).

Definicao 2.2.2 (Estatıstica de Ordem k) Seja (Xn)n≥1 uma sucessao de variaveis aleatorias,

e definida a k-esima estatıstica de ordem como X(k), tal que X(1) ≤ X(2) ≤ ... ≤ X(k) ≤... ≤ X(n).


Definicao 2.2.3 (Suporte da Funcao de Distribuicao) Seja X ∼ FX(x), o suporte da

funcao de distribuicao de X sera:

xFX = supx ∈ R : FX(x) < 1. (2.1)

2.2.2 Distribuicao Exata e Limite do Maximo

Na TVE e dada uma atencao em especial para o suporte da FX(x) e as estatısticas de

ordem dos extremos, o mınimo e o maximo que sao definidos como mınimo X(1) e maximo

X(n) de uma amostra i.i.d, ou seja:

X(1) = minX1, X2, ..., Xn e X(n) = maxX1, X2, ..., Xn.

A funcao de distribuicao exata do maximo e do mınimo e obtida atraves da funcao

de distribuicao de X.

Definicao 2.2.4 (Funcao de Distribuicao do Maximo) A funcao de distribuicao do maximo

e definida como FX(n)(x) e e obtida a partir da distribuicao de X, do jeito seguinte:

FX(n)(x) = F n

X(x).

Demonstracao.

FX(n)(x) = PX(n) 6 x

= Pmax(X1, X2, ..., Xn) 6 x

= PX1 6 x,X2 6 x, ..., Xn 6 xi.i.d= PX1 6 x × PX2 6 x × ...× PXn 6 x

= P nX 6 x = F nX(x).

e a do mınimo,

Definicao 2.2.5 (Funcao de Distribuicao do Mınimo) A funcao de distribuicao do mınimo

e definida como FX(1)(x) e e obtida a partir da distribuicao de X tal que:

FX(1)(x) = 1− (1− FX(x))n.

Demonstracao.


FX(1)(x) = PX(1) ≤ x

= 1− PX(1) > x

= 1− PX1 > x,X2 > x, ..., Xn > xi.i.d= 1− PX1 > x × PX2 > x × ...× PXn > x

= 1− P nX > x = 1− (1− PX ≤ x)n = 1− (1− FX(x))n.

Com isso, foram definidas as distribuicoes exatas do mınimo e do maximo, porem

suas distribuicoes dependem do conhecimento da distribuicao de X, que em muitos casos

e desconhecida, entretanto o Corolario 2.2.9 afirma que para n suficientemente grande

esta distribuicao sera degenerada. Mas para entender a demonstracao do Corolario 2.2.9,

e preciso entender os conceitos de convergencia em probabilidade, em distribuicao, e quase

certamente que sao uns dos mais importantes resultados da estatıstica.

Definicao 2.2.6 (Convergencia em Probabilidade) Seja (Xn)n≥1 uma sucessao de variaveis

aleatorias, e para qualquer ε > 0 temos que X converge em probabilidade para c se

limn−→∞

P|Xn − c| > ε = 0, (2.2)

Denotado por Xp→ c.

Definicao 2.2.7 (Convergencia Quase Certamente) Seja (Xn)n≥1 uma sucessao de variaveis

aleatorias, e dito que Xn converge quase certamente para X se

P (N) = 1, sendo N = w ∈ Ω|Xn(w)→ X(w), (2.3)

Denotado por Xnq.c.→ X.

Definicao 2.2.8 (Convergencia em Distribuicao) Sejam (Xn)n≥1 uma sucessao de variaveis

aleatorias, e dito que Xn converge em distribuicao para X se

limn→∞

FXn(x) = FX(x), (2.4)

Denotado por Xnd→ X.


E bastante intuitivo que os valores dos maximos sao aquelas que se localizam proximos

do limite superior do suporte da distribuicao de X e que quando maior a sucessao da

variavel X menor sera a distancia do maximo e do suporte . Isto indica que o compor-

tamento assintotico Xn deve estar relacionado com a cauda de FX(x) perto de xFX . Isto

nao e apenas intuitivo, mas tambem um Corolario (As afirmacoes feitas e os resultados

obtidos para o maximo, podem ser estendidos para os mınimos).

Corolario 2.2.9 (Convergencia em Probabilidade do Maximo) Sejam X1, X2, ..., Xn variaveis

aleatorias i.i.d com distribuicao FX(x), para n→∞, X(n) converge em probabilidade para

o suporte, se xFX <∞.

Demonstracao.

Para x < xFX temos que

PXn ≤ x = F nX(x)

n→∞→ 0

e para xFX <∞, temos que para x > xFX

PXn ≤ x = F nX(x) = 1

Logo foi demonstrado que Xnp→ xFX .

Corolario 2.2.10 (Convergencia Quase Certamente do Maximo) Sejam X1, X2, ..., Xn

variaveis aleatorias i.i.d com distribuicao FX(x), para n → ∞, X(n) converge quase cer-

tamente para o suporte, se xFX <∞.

Demonstracao.

Visto que a Sequencia Xn e nao decrescente em n, o maximo converge quase certa-

mente para xFX . Para mais detalhes dessa demonstracao veja James [7].

Os Corolarios 2.2.9 e 2.2.10 afirmam que nao importa a funcao de distribuicao de

X, se o tamanho da amostra de maximos for suficientemente grande, a distribuicao e

degenerada. Mas uma distribuicao degenerada nao fornece muita informacao, com isto, na

Secao 2.3 e apresentada a distribuicao assintotica do maximo, e atraves desta distribuicao

e possıvel obter a distribuicao original de X.

2.3 Modelos Assintoticos Para o Maximo 18

2.3 Modelos Assintoticos Para o Maximo

Para conhecer-se a distribuicao exata do maximo, e preciso conhecer a distribuicao da

variavel X o que na pratica nao ocorre frequentemente, e para n suficientemente grande

o maximo tem uma distribuicao degenerada o que nao fornece muita informacao. Mas,

o Teorema Fundamental de Fisher-Tippet fornece o resultado de convergencia fraca para

maximo centrado e normalizado e atraves do resultado desse teorema e possıvel obter

informacoes relevantes da distribuicao original X atraves da distribuicao assintotica do

maximo.

Teorema 2.3.1 (Fisher-Tippet[1928]) Seja (Xn)n≥1 uma sequencia de variaveis aleatorias

i.i.d. Se existirem sequencias de constantes normalizadoras cn > 0 e dn ∈ R e uma dis-

tribuicao nao degenerada H(x) tal que

X(n) − dncn

d→ H(x),

entao H(x) e uma das 3 funcoes distribuicao abaixo:

Gumbel : HI(x) = exp−e−x , x ∈ R. (2.5)

Frechet : HII(x) =

0 , x < 0

α > 0.exp−x−α , x > 0

(2.6)

Weibull : HIII(x) =

exp−(−x)−α , x ≤ 0

α < 0.1 , x > 0

(2.7)

A Figura 1 apresenta um grafico com as distribuicoes do Teorema 2.3.1, Gumbel,

Frechet e Weibull com α igual a 1 e -2 respectivamente e um exemplo de convergencia do

maximo de uma distribuicao Uniforme(0,1) para a Weibull com α = −1.


−1 0 1 2 3

0.0

0.2

0.4

0.6

0.8

1.0

x

Pro

b

WeibullFréchetGumbel

Figura 1: Distribuicao Acumulada da Weibull com α = −2, Frechet com α = 1 e Gumbel

Exemplo 2.3.2 Convergencia do maximo de uma distribuicao Uniforme(0,1) para uma

Weibull com α = −1:

Suponha que X ∼ Uniforme(0, 1), entao sua funcao de densidade sera fX(x) = I(0,1)(x) e

sua funcao de distribuicao FX(x) = xI(0,+∞)(x). A distribuicao exata do maximo e obtida

atraves da relacao FX(n)(x) = F n

X(x), logo:

FX(n)(x) = xn, 0 < x < 1.

O Teorema 2.3.1 indica que a distribuicao do maximo possui uma distribuicao as-

sintotica H(x), entao

P

X(n) − dn

cn< x

= P

X(n) < xcn + dn

= (xcn + dn)n.

Com isto, fazendo cn = 1n

e dn = 1 temos que

limn→∞

(1 +

x

n

)n→ ex

que coincide com a distribuicao HIII(x) com o parametro α = −1, isto e,

X(n) − 11n

n→∞→ HIII(x).

Entao a distribuicao Uniforme(0,1) com tamanhos de amostras suficientemente grande,


a sua distribuicao assintotica no maximo padronizado, convergira para uma Weibull com

α = −1. A Figura 2 apresenta a curva estimada e a curva teorica da distribuicao as-

sintotica do maximo padronizado do Exemplo 2.3.2, de uma amostra de maximos de

tamanho 100, retirados de blocos de tamanho igual a 5.

Figura 2: Curva Estimada e Teorica da Distribuicao Assintotica do Maximo Padronizado

Como mostrado no Exemplo 2.3.2, com n suficientemente grande, a distribuicao do

maximo da variavel X convergira para alguma distribuicao de H(x), para algumas cons-

tantes normalizadoras cn e dn. Embora as 3 distribuicoes nao aparentam haver nenhuma

relacao, do ponto de vista matematico existe uma familiaridade entre elas.

Proposicao 2.3.3 (Relacoes Entre os Modelos Assintoticos do Maximo) Seja X ∼ Frechet(α),

se X > 0 as relacoes a seguir sao validas:

X ⇔ ln(Xα) ∼ Gumbel⇔ −X−1 ∼Weibull(−α)

A seguir sao apresentadas as funcoes de distribuicao adicionadas com parametros de

locacao µ e escala σ.

2.4 Max-Estabilidade 21

Gumbel : HI(x) = exp−e− (x−µ)σ , x ∈ R. (2.8)

Frechet : HII(x) =

0 , (x− µ) ≤ 0

α > 0.exp−

(x−µσ

)−α , (x− µ) > 0(2.9)

Weibull : HIII(x) =

exp−(− (x−µ)

σ)−α , (x− µ) ≤ 0

α > 0.1 , (x− µ) > 0

(2.10)

O Teorema 2.3.1 nos da total condicao de estimar a distribuicao assintotica(X(n)−dn

cn

)atraves da famılia H(x), sem nenhuma necessidade de utilizar a distribuicao de X. Apos

encontrar a distribuicao assintotica do maximo, podemos encontrar informacoes da dis-

tribuicao de X atraves da seguinte relacao:

H(x) = FX(n)(x) = PX(n) ≤ x = F n

X(x)

entao,

FX(x) = n√H(x). (2.11)

O Teorema 2.3.1 tambem e valido para variaveis aleatorias apresentando dependencia

temporal e heteroscedasticidade. Neste caso existe algumas condicoes a serem verificadas.

Em essencia existem similiaridade entre o Teorema de Fisher-Tippett (TFT) e o Teo-

rema Central do Limite (TCL). O TCL estabelece que dentro das funcoes de distribuicao

nao degeneradas apenas as distribuicoes estaveis podem ser distribuicao limites. O TFT

estabelece que apenas as distribuicoes max-estaveis podem ser distribuicao limite, veja

Mendes [4].

2.4 Max-Estabilidade

Como dito anteriormente uma das condicoes para as distribuicoes do maximo norma-

lizado convergir para alguma das distribuicoes da famılia H(x) e ela ser max-estavel. A

definicao mostra a condicao de uma distribuicao ser max-estavel e diz que toda distri-

buicao max-estavel converge para ela mesma, logo sao distribuicoes limite para o maximo

normalizado.

Definicao 2.4.1 (Max-Estabilidade) Sejam X1, X2, ..., Xn variaveis aleatorias i.i.d de

uma distribuicao FX(x), e sejam dn ∈ R e cn > 0 constantes normalizadoras. E dito

que FX(x) e max-estavel se ela satisfaz a igualdade a seguir:

2.4 Max-Estabilidade 22

max(X1, X2, ..., Xn)d= cnX + dn, (2.12)

e temos que

limn→∞

F nX(cnx+ dn) = H(x).

Provando que as distribuicoes max-estaveis coincide com as distribuicoes da famılia H(x).

Teorema 2.4.2 A classe das distribuicoes que apresentam max-estabilidade coincide com

a classe de todas as distribuicoes limite possıveis (nao degeneradas) para o maximo pa-

dronizado de variaveis aleatorias i.i.d.

2.4.1 Dominio de Atracao

O Teorema de Fisher-Tippett tem a seguinte aplicacao direta: Se [FX(cnx + dn)]n e

nao degenerada quando n e suficientemente grande, para certas constantes positivas cn e

dn ∈ R, entao

∣∣∣∣[FX(x)]n −H(x− dncn

)∣∣∣∣→ 0, n→∞. (2.13)

Para alguma H(x) pertencente as distribuicoes limites para maximos normalizados

e padronizados. Este fato permite que seja definido uma colecao de F ′Xs que dispoem

de uma mesma distribuicao limite. Chama-se Domınio de Atracao a colecao de F ′Xs que

dispoe da mesma distribuicao limite.

Definicao 2.4.3 (Domınio de Atracao) Se a convergencia 2.13 verifica, dizemos que

FX(x) pertence ao domınio de atracao do maximo da distribuicao de valores extremos

H(x). Notacao FX(x) ∈MDA(H).

Entretanto a qualidade e a velocidade de convergencia da distribuicao do maximo

para H(x) depende de FX(x), para cada FX(x) ∈ MDA(H). Como exemplo, temos o

maximo de uma Exponencial que converge mais rapidamente para uma Gumbel do que

ao maximo de uma Normal. Uma relacao de equivalencia para as F ′Xs pertencentes ao

mesmo domınio de atracao pode ser definida atraves do conceito de equivalencia de cauda.

Definicao 2.4.4 (Equivalencia de Cauda) Duas distribuicoes F (x) e G(x) podem ser

2.5 Distribuicao de Valores Extremos Generalizada (GEV) 23

denominadas equivalentes de cauda se ambas apresentarem um mesmo limite superior,

isto e, XFX = XGX e limx↑XFXFXGX

= c, para qualquer constante no intervalo (0,∞).

2.5 Distribuicao de Valores Extremos Generalizada

(GEV)

Os tres tipos de distribuicoes, Gumbel, Frechet, e Weibull, sao integrantes de uma

unica famılia de distribuicoes: A distribuicao de valores extremos generalizada (Generali-

zed Extreme Value, GEV ) padrao, que refere-se as distribuicoes EV dentro de uma unica

famılia, parametrizadas somente pelo parametro ξ e e denotada por Hξ(x).

Hξ(x) =

e−(1+ξx)−1ξ

, se ξ 6= 01+ ξx > 0.

e−e−x

, se ξ = 0(2.14)

Quando ξ = 0 que ocorre na condicao de ξ → 0, a Hξ(x) adequa-se a distribuicao

de Gumbel. Quando ξ > 0 e ξ < 0 adequam-se as distribuicoes de Frechet e Weibull,

respectivamente.

A famılia de locacao e escala e obtida, substituindo o x, por(x−µσ

), com µ ∈ R e

σ > 0, da seguinte forma:

Hξ,µ,σ(x) =

e−(1+ξ(x−µσ ))

−1ξ

, se ξ 6= 01+ ξ

(x−µσ

)> 0.

e−e−(x−µσ )

, se ξ = 0(2.15)

A densidade da distribuicao generalizada (GEV) denotada por hξ,µ,σ(x), e obtida

derivando Hξ,µ,σ(x) e resulta na seguinte densidade (Considerando µ = 0):

hξ,µ,σ(x) =

e−(1+ξ(

xσ ))

−1ξ 1σ(1 + ξ

(xσ

))−1ξ−1 , se ξ 6= 0 e −∞ < x <

(−σξ

)ou ξ > 0 e x ≥

(−σξ

)e−e

−( xσ ) 1σe−x , se ξ = 0 e x ∈ R.

(2.16)

2.6 Teste de Aderencia 24

2.6 Teste de Aderencia

O teste de aderencia de Pearson, e um teste de hipoteses nao parametrico, e o teste

verifica se uma populacao P possui uma distribuicao X, ele testa a hipotese H0 : P = P0

com o nıvel de significancia α, ou seja:

H0 : P = P0

H1 : P 6= P0

(2.17)

O teste consiste em comparar os numeros observados em cada blocos com o numero

observado sob a hipotese de que H0 e verdadeira. O procedimento consiste em considerar

classes, segundo as quais a variavel X, caracterıstica da populacao, pode ser classificada.

A variavel X pode ser qualitativa ou quantitativa, veja Bussab [8]. A tabela seguir

representa a forma geral para um teste de aderencia classificada em m classes.

Tabela 1: Representacao da Divisao de uma Variavel X em m ClassesClasses da variavel X A1 A2 ... Am Total

Observados O1 O2 ... Om

∑mi=1Xi

Esperados E1 E2 ... Em

∑mi=1Xi

A estatıstica a seguir possui uma distribuicao qui-quadrado com m − 1 graus de

liberdade.

m∑i=i

(Oi − Ei)2

Ei∼ χ2

(m−1) (2.18)

Onde Oi e Ei representa os valores observados e esperados para os blocos de i= 1,...,m

respectivamente, apos o calculo da estatıstica observada (χ2(obs)), o criterio de decisao e se

P(χ2m−1 > χ2

(obs)) > α, nao se rejeita H0.

Um grande problema deste teste e que muitas vezes na pratica e desconhecido os

parametros da distribuicao X, de acordo com Artes [9], e possıvel estimar estes parametros

desconhecidos e o teste de aderencia podera ser ajustado para se adequar a essas es-

timacoes, a estatıstica 2.18 tera distribuicao qui-quadrado com m− k − 1 graus de liber-

dade, sendo k o numero de parametros estimados.

Antes da aplicacao do teste de aderencia e necessario evitar que alguns casos ocorram,

sao eles:

(i) Mais de 20% das classes com Ei sejam inferior a 5.


(ii) Mais de uma classe com Ei inferior a 1.

Caso alguns desse casos ocorra, a aproximacao ao qui-quadrado nao e mais apropriada,

alem disso, o numero de classes para o teste deve respeitar a regra de Mann e Wald.

Definicao 2.6.1 (Regra de Mann e Wald) O numero de classes m para o teste de aderencia

e escolhido de tal forma que, nm> 5.

26

3 Materiais e Metodos

Neste estudo foram investigados 360 sıtios localizados na India, cada sıtio registrou a

temperatura maxima anual de 1951 a 2014 observados em um “grid”, a Figura 3 apresenta

os sitios e os grids; obtendo uma amostra com 64 registros de temperatura maxima. Como

mostra a Figura 3, os sıtios e grids foram alocados de forma sequencialmente, porem essa

localizacao nao e a exata, alem disso o interesse deste estudo e localizar microrregioes mais

vulneraveis a temperaturas altas, em que a sobrevivencia humana esteja em risco. Logo

foi feito uma estimacao das temperaturas nas microrregioes, para estimar as temperaturas

maximas, foram verificadas se um ou mais grids sobrepos uma microrregiao e registrada

o maximo desse grids nelas. As microrregioes da India e apresentada na Figura 4.

Figura 3: Representacao da Alocacao das Temperaturas Maximas na India

+ + + + ++ + + + + + ++ + + + + + ++ + + + + + +

+ + + + + ++ + + + + +

+ + + + + + + ++ + + + + + + + + + + +

+ + + + + + + + + + + + + + + + + + ++ + + + + + + + + + + + + + + + + + + + + + + + +

+ + + + + + + + + + + + + + + + + + + + + + + + + ++ + + + + + + + + + + + + + + + + + + + + + + +

+ + + + + + + + + + + + + + + + + + + + + + + + ++ + + + + + + + + + + + + + + + + + + + + + + +

+ + + + + + + + + + + + + + + + + + + + ++ + + + + + + + + + + + + + + + + + + +

+ + + + + + + + + + + + + + + + ++ + + + + + + + + + + + + ++ + + + + + + + + + + + +

+ + + + + + + + + + ++ + + + + + + + + ++ + + + + + + +

+ + + + + + ++ + + + + + ++ + + + + + + +

+ + + + + + ++ + + + + +

+ + + + ++ + + +

+

(a) Representacao dos Sıtios (b) Representacao dos Grids

3 Materiais e Metodos 27

Figura 4: Regioes da India

A India e composta por 666 microrregioes, apos a estimacao das temperaturas, ape-

nas uma microrregiao nao registrou nenhuma temperatura, ou seja, apos a estimacao

obteve-se 665 amostras com 64 registros. Analises descritivas foram feitas nesses dados e

apresentacao das temperaturas observadas em microrregioes para todo o territorio.

Apos a introducao das principais caracterısticas e conceitos relevantes em relacao

as distribuicoes de valores extremos e da GEV, torna-se imprescindıvel a utilizacao de

metodos para a estimacao dos parametros ξ, µ, σ pertencentes a Hξ,µ,σ(x). As estimativas

para estes parametros podem ser obtidas por varios mecanismos estatısticos, incluindo o

Metodo dos Momentos, Metodo da Regressao, Metodo de Maxima Verossimilhanca e o

Metodo dos L-Momentos. No entanto, neste trabalho e apresentado o Metodo de Maxima

Verossimilhanca e o Metodo dos L-Momentos, dado que os estimadores obtidos por esses

metodos apresentam boas propriedades, ajustes mais precisos e sao os mais usados.

3.0.1 Estimacao via Metodo de Maxima Verossimilhanca

O Metodo de Maxima Verossimilhanca e amplamente empregado para a determinacao

de estimadores pontuais. O princıpio basico deste metodo firma-se na ideia de se encontrar

parametros que venham a maximizar a probabilidade de uma determinada amostra repre-

sentar de maneira mais adequada uma dada populacao. Ainda que em algumas ocasioes

nao seja possıvel calcular os estimadores de maxima verossimilhanca, estes sao consisten-

tes, eficientes e assintoticamente normais em condicoes relativamente suaves, possuindo

muitas vezes boas propriedades de convergencia e tornando-se assim uma escolha popular

para a estimacao parametrica. Os estimadores de maxima verossimilhanca (EMV) dos


parametros ξ, µ, σ pertencentes a GEV, podem ser alcancados de maneira numerica ao

se maximizar a funcao de verossimilhanca, ou seja, sao os valores em R × R × R+ que

maximizam

L(ξ, µ, σ; (m1, ...,mm)) =m∏i=1

hξ,µ,σ(mi)I1+ ξσ(mi−µ)>0. (3.1)

A funcao de log-verossimilhanca e dada por,

l(ξ, µ, σ; (m1, ...,mm)) = log[L(ξ, µ, σ; (m1, ...,mm))]

= log[m∏i=1

hξ,µ,σ(mi)]I1+ ξσ(mi−µ)>0, (3.2)

que e equivalente ha

l(ξ, µ, σ; (m1, ...,mm)) =m∑i=1

log[hξ,µ,σ(mi)]I1+ ξσ(mi−µ)>0, (3.3)

e (m1, ...,mm) refere-se a uma amostra de m maximos.

Os EMV dos parametros ξ, µ e σ, denotados por ξ, µ e σ respectivamente, podem ser

obtidos por intermedio da resolucao de um sistema de equacoes nao lineares, atingindo a

partir da diferenciacao da funcao de verossimilhanca ou log-verossimilhanca em relacao

aos parametros.

• Para obter ξ basta resolver:

∂l(ξ, µ, σ; (m1, ...,mm))

∂ξ= 0,

• Para obter µ basta resolver:

∂l(ξ, µ, σ; (m1, ...,mm))

∂µ= 0,

• Para obter σ basta resolver:

∂l(ξ, µ, σ; (m1, ...,mm))

∂σ= 0.


3.0.2 Estimacao via Metodo de L-Momentos

Os L-momentos sao tidos como variacoes dos “Probability Weighted Moments”(PWM),

de Greenwood et al [10]. A estimacao via L-Momentos apresenta a capacidade de carac-

terizar distribuicoes com caudas pesadas e, quando estimados, serem considerados mais

robustos a presenca de valores extremos (outliers), os L-momentos possuem uma vantagem

sobre os momentos convencionais.

Os L-momentos sao medidas de posicao, escala e forma das distribuicoes de probabi-

lidade, similares aos momentos convencionais, porem estimados por combinacoes lineares

da assimetria, da curtose e do coeficiente de variacao, veja Esmeria [11].

Segundo Hosking [12], os parametros estimados fazendo-se uso dos L-momentos de-

monstram, ocasionalmente, maior precisao em amostras pequenas, se comparado com

as estimativas obtidas utilizando-se o Metodo de Maxima Verossimilhanca, ou seja, os

L-momentos sao geralmente mais eficientes do que os EMV.

Os PWM de uma variavel aleatoria Z podem ser definidos como:

ηp,r,s = E[Zp(F (Z))r(1− F (Z))s].

No entanto, para este trabalho torna-se mais conveniente a utilizacao de um caso

particular, caracterizado por:

η1,r,0 = βr = E[Z(F (Z))r]. (3.4)

Os PWM amostrais de ordem r, com r = 0, 1, ...,m − 1, denotados por br, sao os

estimadores nao viesado dos PWM populacionais βr, e podem ser estimados por:

br =1

m

m∑j=r+1

(j − 1)(j − 2)...(j − r)(m− 1)(m− 2)...(m− r)m(j)

. (3.5)

Os L-Momentos λr+1, r = 0, 1, 2, ... (Ler Hosking [13]) sao estipulados para variaveis

aleatorias com esperanca finita e podem ser descritos como

λr+1 =r∑j=0

p∗r,jβj, r = 0, 1, 2, ... (3.6)


onde,

p∗r,j =(−1)r−j(r + j)!

(j!)2(r − j)!. (3.7)

e βj pode ser obtido utilizando-se a relacao 3.4.

No caso em que r = 0, denota-se λ1 0 L-momento relacionado com a locacao da

distribuicao. Quando r assume os valores 1 e 2, nesta ordem, λ2(λ2 = 2β1−β0) e λ3(λ3 =

6β2 − 6β1 + β0), sao os L-momentos associados a escala e assimetria, respectivamente. O

λ2 por sua vez, deve ser comparado com o desvio padrao σ, obtendo-se a seguinte relacao

σ ≥√

3λ2.

Os L-momentos amostrais lr sao estimadores nao viesado de λr e podem ser definidos

da seguinte maneira

lr+1 =r∑j=0

p∗r,jbj, r = 0, 1, 2, ...,m− 1, (3.8)

onde p∗r,j e obtido da relacao 3.7 e bj da relacao 3.4.

Para as quantidades populacionais, sao equacionados um numero fixo de L-momentos

amostrais equipolentes. Dessa forma, os parametros de uma distribuicao podem ser re-

presentados em funcao dos L-momentos.

Para a distribuicao de valores extremos generalizada tem-se

λ1 = µ− σ

ξ1− Γ(1− ξ), (3.9)

λ2 = −σξ

(1− 2ξ)(Γ(1− ξ)), (3.10)

λ3λ2

= 2(1− 3ξ)

(1− 2ξ)− 3, (3.11)

onde Γ(.) equivale a funcao gamma.

Com intuito de se estimar os parametros da GEV, ξ, µ e σ, os L-momentos populacio-

nais sao substituıdos pelos seus respectivos L-momentos amostrais, l1, l2, l3, nas equacoes

3.9, 3.10, 3.11. Para se estimar o parametro ξ e necessario a resolucao da equacao 3.11,

como nao ha uma solucao obvia para ela, a seguinte aproximacao e valida (ver Hosking e

3.1 Testes Estatısticos 31

Wallis [14]).

ξ = −7, 8590c− 2, 9554c2, (3.12)

onde c = 2

3+l3l2

− log2log3

e consequentemente

σ =−l2ξ

(1− 2ξ)Γ(1− ξ), (3.13)

µ = l1 +σ

ξ(1− Γ(1− ξ)). (3.14)

Os estimadores de L-momentos sao unicos e apresentam vıcio e variancia mınimos.

3.1 Testes Estatısticos

Independente do metodo utilizado para a realizacao da estimacao dos parametros,

torna-se essencial a aplicacao de testes estatısticos que sejam capazes de testar formal-

mente as suposicoes do modelo e a qualidade do ajuste. Alem dos testes estatısticos

formais e sempre conveniente a realizacao de analises graficas.

Com a intensao de se testar a qualidade do ajuste realizado e a adequacao de deter-

minado modelo a distribuicao Gumbel, pois sua expressao apresenta maior simplicidade,

nessa Secao 3.1 serao apresentados testes que podem ser aplicados as estimativas obtidas

pelos metodos de Maxima Verossimilhanca e de L-momentos

3.1.1 Estimativas Obtidas Por Maxima Verossimilhanca

Se as estimativas dos parametros da GEV foram obtidas por maxima verossimilhanca,

as seguintes estatısticas de teste podem ser utilizadas para se testar a suposicao de que

os dados sequem realmente a distribuicao GEV(ver Chandra et al

1. As estatıstica de Kolmogorov-Sminorv, D+, D− e D,

2. A Estatıstica Kuiper, V.

Estas sao definidas como


D+ = maxi

i

m−Hξ(m(i))

,

D− = maxi

Hξ(m(i) −

i− 1

m)

,

D = max(D+, D−),

V = D+ +D−,

onde m(i) refere-se aos maximos ordenados e Hξ representa a distribuicao GEV com

as estimativas obtidas.

A Tabela 2 exibe os valores crıticos para amostras de m = 50 e m = ∞ (amostras

significativamente grande). Os nıveis de significancia abordados foram de 1% e 5%.

Tabela 2: Valores crıticos para as estatısticas de teste D+, D−, D e V .Nıvel de Significancia

√mD+

√mD−

√mD

√mV

1% 0,940 0,944 0,988 1,6395% 0,796 0,796 0,856 1,428

1% 0,957 0,957 1,007 1,6715% 0,808 0,808 0,874 1,477

Para testar se o parametro ξ e estatisticamente zero, ou seja, que a distribuicao dos ex-

tremos se adequa a uma Gumbel, pode-se utilizar o Teste da Razao das Verossimilhancas,

cuja metodologia se encontra a seguir.

As seguintes hipoteses precisam ser testas

H0 = A distribuicao dos Extremos e Gumbel

H1 = A distribuicao dos Extremos nao e Gumbel

e a estatıstica de teste e representada por

Λ = −2(LGumbel − LGEV ),

onde a LGumbel e LGEV referem-se as log-verossimilhancas (obtidas como na equacao


3.2) com a utilizacao das densidade de Gumbel e da GEV, nesta ordem, expressas com

suas respectivas estimativas adquiridas por maxima verossimilhanca.

A estatıstica de teste Λ deve ser comparada com a distribuicao qui-quadrado com um

grau de liberdade (χ2(1)), para um nıvel de significancia fixado.

3.1.2 Estimativas obtidas por L-Momentos

Se as estimativas dos parametros da GEV foram obtidas pelo metodos dos L-momentos,

o Teste da Qualidade do Ajuste de Sherman pode ser empregado para testar o erro co-

metido ao se substituir a distribuicao exata (que apresenta n finito) pela distribuicao

assintotica.

O teste apresenta as seguintes hipoteses

H0 = Os extremos seguem uma funcao de distribuicao GEV

H1 = Os extremos nao seguem uma funcao de distribuicao GEV

a estatıstica de teste e,

Wm − EmDm

,

onde

Wm =1

2

m+1∑i=1

∣∣∣∣Hξ(m(i))−Hξ(m(i−1))−1

(m+ 1)

∣∣∣∣ ,Em =

(m

m+ 1

)(m+1)

e

E2m +D2

m =2mm+2 +m(m− 1)(m+2)

(m+ 2)(m+ 1)(m+2),

onde Hξ denota a distribuicao GEV com as estimativas obtidas por L-momentos, m(i)

representa novamente os maximos ordenados, Hξ(m(0)) e Hξ(m(m+1)) assumem respecti-

vamente, 0 e 1.

A estatıstica de teste pode ser considerada assintoticamente normal e o p-valor deve


ser calculado levando em consideracao apenas a cauda direita da distribuicao normal

padrao.

3.2 Teste de Aderencia

Apos toda estimacao dos parametros da GEV e preciso verificar se as estimacoes

foram adequadas, e para isto foi utilizado o teste de aderencia ajustada. Na aplicacao

deste teste precisa ficar atento com algumas regras para nao haver resultados imprecisos

apresentados na Secao 2.6. Para este estudo foi utilizado m = 6 de forma a obedecer a

regra de Mann e Wald e evitar que mais de 20% dos valores esperados sejam inferior a 5

e mais de um inferior a 1. Os criterios para a divisao de classes foram os quantis 20, 40,

50, 60, 80 da GEV para cada estimacao.

Tabela 3: Representacao do Teste de Aderencia de PearsonQuantis (−∞, Q20] (Q20, Q40] (Q40, Q50] (Q50, Q60] (Q60, Q80] (Q80,∞)N O1 O2 O3 O4 O5 O6

Sendo Qq o quantil q da GEV estimada e Oi o numero de elementos da amostra que

adequam a classe; logo apos a divisao das classes e contabilizado os numeros observados

e calculado o p − valor da estatıstica ??, com m = 6, k = 3. Coles [15], afirma que

para verificar a eficiencia do modelo proposto pela TVE, e mais adequado utilizar o teste

grafico apresentada na Secao 3.3, com isso foi utilizada o teste de aderencia para obter

medidas resumos (p-valor) para facilitar a averiguacao das estimativas, e nas GEV que o

teste de Pearson rejeitou a hipotese nula, foi feita a analise grafica por ser mais adequada.

3.3 Teste Grafico

Coles [15] propoem uma analise grafica da GEV com os parametros estimados para

verificar se o ajuste e adequado, atraves de grafico de probabilidade, grafico de quantil-

quantil, histograma com a curva da GEV, e grafico de retorno de nıveis. Este ultimo

teste, de acordo com o Coles e o melhor pois apresenta um intervalo de confianca para

os dados de 95% e facil de verificar. Se todos os pontos ficarem dentro do intervalo, ou

apenas poucos saırem, a estimacao e considerada boa.

3.4 Modelagem e Previsoes 35

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Probability Plot

Empirical

Mod

el

32 33 34 35 36

3233

3435

36

Quantile Plot

Model

Em

piric

al

1e−01 1e+00 1e+01 1e+02 1e+03

3233

3435

3637

Return Period

Ret

urn

Leve

l

Return Level Plot

Density Plot

z

f(z)

31 32 33 34 35 36 37

0.0

0.1

0.2

0.3

0.4

Figura 5: Exemplo de um grafico de retorno

3.4 Modelagem e Previsoes

Foi feita a modelagem utilizado a TVE apresentada na Secao 2.2 e os parametros

estimados foi utilizando a estimacao de maxima verossimilhanca apresentada na Secao

3.0.1. Apos e verificada se os modelos preditivos estimados, sao adequados, para isto foi

utilizado os testes de aderencia e grafica de Coles.

De acordo com Mendes [4], para obter previsao para n anos, e calculado o quantil

Q100− 1n

da GEV, a logica deste metodo e de que para n anos, uma observacao passara

o quantil Q100− 1n, com isso foi feita previsoes para 10, 20, 50 anos. Para o estudo foi

utilizado p-valor igual a 0.01, e todas as analises foram feitas no software estatıstico R.

36

4 Analise dos Resultados

A Figura 6 apresenta as temperaturas maximas observadas nos anos de 1951 e 2014.

Observou-se que boa parte do paıs obteve uma temperatura maxima acima de 43 Celsius

nos anos de 1951 e 2014, e que essas observacoes se encontradas maiores concentradas na

regiao central da India. Alem disto as regioes Leste e Sudoeste sao as que observaram as

menores temperaturas maximas anuais, nao ultrapassando a 35 Celsius.

Figura 6: Temperaturas Maximas dos Anos de 1951 e 2014

(a) Temperaturas maximas no ano de 1951 (b) Temperaturas maximas no ano de 2014

Nas Regioes Leste, Sudoeste e Noroeste, sao as que apresentam maior crescimento

das temperaturas dos anos de 1951 a 2014, a Figura 7 exibe os graficos das amplitudes

das temperaturas nas regioes e o histograma delas. E bastante visıvel o crescimento

mencionado, porem houve um decrescimo das temperaturas em varias microrregioes da

regiao central; outras microrregioes as temperaturas variaram pouco.

4 Analise dos Resultados 37

Figura 7: Amplitude das Temperaturas Maximas Anuais

(a) Amplitude por Regiao

Amplitude

Den

sida

de

−2 −1 0 1 2

0.0

0.1

0.2

0.3

0.4

(b) Histograma da Amplitude

A Figura 8 mostra os maximos e mınimos das temperatura maximas nesses 64 anos.

Essa Figura apresenta um resultado preocupante, quase todo o paıs da India teve um ano

que se observou uma temperatura proxima ou acima a 45 Celsius, e que em todos os

anos se observou temperaturas proximas ou acima de 37.5 Celsius.

Figura 8: Maximos e Mınimos das Temperaturas Maximas Anuais

(a) Maximos das Temperaturas Maximas (b) Minimos das Temperaturas Maximas

A Figura 9 apresenta o desvio padrao das temperaturas maximas observadas. As

regioes que houve menor variacao em suas temperaturas, foi a sul e a norte foi a que

houve maior variacao.


Figura 9: Desvio Padrao das Temperaturas Maximas Anuais

De acordo com o site Brasil Escola [16], a temperatura maxima que o corpo humano

suportaria para a sobrevivencia varia de acordo com a umidade do ar, ja que o suor e

responsavel pela liberacao do calor presente no corpo humano, em dias que a umidade do

ar estiver alta, temperaturas acima de 40 Celsius e considerada de grande risco para a

sobrevivencia. Com isto, dependendo da umidade do ar, a regiao central da India estaria

em grandes riscos, ja que de acordo com a Figura 10 as medias das temperaturas maximas

anuais observadas ja ultrapassam aos 40 Celsius.

Figura 10: Media das Temperaturas Maximas Anuais


Foi utilizada a GEV para modelagem das distribuicoes das 665 microrregioes, com

os parametros ξ, µ e σ estimados pelo metodo de maxima verossimilhanca; para obter

uma medida resumo da verificacao da eficiencia da modelagem da GEV nos dados para

as 665 microrregioes, foi utilizado o teste de aderencia de Pearson; a Tabela 4 mostra

os resultados do teste sob a hipotese nula (H0) que as amostras sao oriundas da GEV

proposta.

Tabela 4: Resultados da aplicacao do teste de aderencia de Pearsonp−valor Microrregioes

< 0.01 14≥ 0.01 651Total 665

Este resultado informa que pelo teste de aderencia rejeitou-se a modelagem de 14

microrregioes, uma verificacao mais detalhada foi feita nessas microrregioes para entender

tal resultado do teste de aderencia, presencas de outlier e valores esperados iguais a 1

foram as causas para a rejeicao do teste. Na Secao 2.6 foi explicado que para a verificacao

dos modelos propostos pela GEV o mais ideal e o teste grafico proposto por Coles apresen-

tado na Secao 3.3; logo para as 14 microrregioes que houve rejeicao no teste de Pearson,

foi feito o teste grafico. O Anexo A contem os graficos feitos para as 14 microrregioes e

constou-se que apesar da rejeicao inicial no teste de aderencia, pelo teste grafico nao ha

hipotese de rejeicao. Com isso para os 665 modelos propostos pela GEV, nao ha hipotese

para a rejeicao de nenhuma, todos os modelos sao considerados eficientes, os calculos das

previsoes foram feitas sob a GEV proposta.

Antes de calcular a previsao para 10, 20 e 50 anos, foi verificada a eficiencia do

metodo de previsao; para isto foi selecionada as amostras ate o ano de 2004 e feita a

previsao para 10 anos seguintes. A de deixar claro que a previsao para os anos seguintes,

nao e uma previsao para o ano exatamente, mas sim o maximo previsto nos anos, ou

seja, para a previsao de 10 anos apos o ano de 2004, tera o resultado do maximo previsto

de 2005 a 2014. Com isto claro, a Figura 11 apresenta o maximo observado de 2005

a 2014 e os valores previsto para 10 anos a partir de 2004. O metodo para a previsao

foi eficiente, estimando os valores futuros bem proximo dos valores reais observados. Os

valores previstos sao menores que observados em varias microrregioes, o que indica a

existencia de algum fator nos anos seguintes. E perceptıvel que nas microrregioes que

houve aumento, sao vizinhas uma das outras, pra este trabalho supomos a independencia

dos dados, mas esse resultado indica que a uma dependencia, mas a GEV tambem e capaz

de modelar dados com essa caracterıstica.


Figura 11: Temperatuas maximas observadas e previstas a partir de 2004

(a) Maximo das Temperaturas Maximas de 2005a 2014

(b) Previsao para 10 anos a partir de 2004

E por fim e apresentado os graficos de previsao para 10, 20 e 50 anos a partir de 2014

e seus respectivos intervalos de confianca de 95% (IC). Apesar de nao ser muito visıvel a

diferenca das previsoes, elas possuem uma diferenca em seu respectivos IC. As amplitudes

dos intervalos confianca vao aumentando quanto vai aumentando os anos das previsoes;

alem disso nao a uma melhora em relacao a diminuicao das temperaturas maximas ja que

a previsao feita para 10 anos e bem proxima da feita para 50 anos, a unica diferenca e no

IC como mencionado.


A Figura 12 exibe a previsao para as temperaturas maximas em 10 anos e seu IC, a

regiao central do paıs corre grande risco, ja que em 10 anos a previsao para boa parte

dessa regiao e uma temperatura maxima proxima a 45 Celsius, a regiao Leste e Sudoeste

sao as que menos correm risco.

Figura 12: Previsao da Temperatura Maxima para 10 anos e seu IC

(a) Limite Inferior do IC para Previsao de 10 anos (b) Limite Superior do IC para Previsao de 10anos

(c) Previsao para 10 Anos


A Figura 13 exibe a previsao das temperaturas maximas para 20 anos, da mesma

forma para a previsao de 10 anos, nao a uma melhora significativa; alem disso a diferenca

das duas previsoes e maior no intervalo de confianca, a previsao em si nao difere muito.

Apesar das temperaturas previstas de boa parte do paıs estarem proxima de 45, que e

perto do limite para a sobrevivencia humana dependendo da umidade do ar; a um leve

crescimento em relacao as duas previsoes, o que e um resultado satisfatorio.





Finalmente, a Figura 14 exibe as temperaturas maximas previstas para 50 anos. Como

mencionado, nao a uma diferenca grande das previsoes anteriores o que pode ser conside-

rado um resultado satisfatorio, porem as temperaturas em boa parte do paıs e de grande

risco.




44

5 Conclusao

Este trabalho analisou as temperaturas maximas anuais observadas de 1951 ate 2014,

e estimou-as em uma analise em microrregioes, das 666 regioes, obteve-se dados para

665. As analises descritivas, expos um resultado preocupante na regiao central do paıs,

que teve temperaturas maximas observadas entre 40 e 45 Celsius, o que e proximo do

limite para a sobrevivencia humana, de acordo com o site Brasil Escola [16]. Apesar das

regioes Leste e Sudoeste apresentarem menores temperaturas maximas, foram as regioes

que houve o maior crescimento delas.

Feitas as analises foi estimado os parametros da GEV e utilizou-se os testes de

aderencia e grafico para verificar a eficiencia, e foi considerado que os 665 modelos foram

eficientes; e feita previsoes utilizando esses modelos. Como feito para os modelos da GEV,

foi feita uma analise da previsao, para verificar sua eficiencia, que tambem foi considerada

satisfatoria, alem disso atraves dessa analise verificou-se que existe uma dependencia es-

pacial dos dados. Por fim, feitas as previsoes para 10, 20 e 50 anos; concluiu-se que nao

ha uma melhora nas temperaturas maximas que e um resultado preocupante, porem nao

ha um crescimento exponencial nas temperaturas, o que pode considerar satisfatorio.

Para este trabalho, foi feito um estudo apenas de analises descritivas e a modelagem

atraves da GEV; porem tera continuidade em trabalhos futuros com os seguinte objetivos:

(i) Um estudo das microrregioes com foco na Teoria de Copulas;

(ii) Identificacao das microrregioes com maiores probabilidade as temperaturas altas;

(iii) Calculos de correlacao espacial;

(iv) Analises das temperaturas, envolvendo a umidade do ar.

45

Referencias

[1] FISHER, R.; TIPPETT, L. H. C. Limiting forms of the frequency distribution of thelargest or smallest member of a sample. Proceedings of the Cambridge PhilosophicalSociety, 1928.

[2] GUMBEL, E. J. Statistics theory of extreme values and some pratical applications.Nat. Bureau of Standards Applications Mathmatics Series, 1954.

[3] GNEDENKO, B. V. Sur la distribution limite du terme maximum dune serie. [S.l.]:Annals of Mathematics, 1943.

[4] MENDES, B. V. de M. Introducao a Analise de Eventos Extremos. [S.l.]: E-papers,2004.

[5] SANFINS, M. A. Copulas para Distribuicoes Generalizadas de Valores Extremos Mul-tidimensionais. [S.l.]: Publicacao Academica, 2009.

[6] PIRES, G. L. G. Teoria dos Valores Extremos: Valor em Risco Para Ativos de RendaVariavel. [S.l.]: Publicacao Academica, 2008.

[7] JAMES, B. R. Probabilidade: um Curso em nıvel intermediario. [S.l.]: Projeto Eucli-des, 1981.

[8] MORETTIN, P.; BUSSAB, W. de O. Estatıstica basica.Saraiva, 2012. ISBN 9788502136915. Disponıvel em:<https://books.google.com.br/books?id=8mUrywAACAAJ>.

[9] ARTES, R. Teste Qui-quadrado de aderencia. [S.l.], 2014.

[10] ARTHUR, G. J. et al. Probability weighted moments: Definition and re-lation to parameters of several distributions expressable in inverse form.Water Resources Research, v. 15, n. 5, p. 1049–1054. Disponıvel em:<https://agupubs.onlinelibrary.wiley.com/doi/abs/10.1029/WR015i005p01049>.

[11] VALVERDE, A. E. L. et al. Momentos-l: Teoria e aplicacao em hidrologia. v. 28, 122004.

[12] HOSKING, J. R. M.; WALLIS, J. R.; WOOD, E. F. Estimation of the generali-zed extreme-value distribution by the method of probability-weighted moments. Te-chnometrics, [Taylor Francis, Ltd., American Statistical Association, American So-ciety for Quality], v. 27, n. 3, p. 251–261, 1985. ISSN 00401706. Disponıvel em:<http://www.jstor.org/stable/1269706>.

Referencias 46

[13] HOSKING, J. R. M. L-moments: Analysis and estimation of distributions usinglinear combinations of order statistics. Journal of the Royal Statistical Society. SeriesB (Methodological), [Royal Statistical Society, Wiley], v. 52, n. 1, p. 105–124, 1990.ISSN 00359246. Disponıvel em: <http://www.jstor.org/stable/2345653>.

[14] HOSKING, J. R. M.; WALLIS, J. R. Regional Frequency Analysis: An ApproachBased on L-Moments. [S.l.]: Cambridge University Press, 1997.

[15] COLES, S. An Introduction to Statistical Modeling of Extreme Values. [S.l.]: SpringerSeries in Statistics, Springer: Berlin., 2001.

[16] QUAL e a maior temperatura que o corpo pode aguentar? Accessed: 12/2018. Dis-ponıvel em: <https://brasilescola.uol.com.br/curiosidades/qual-maior-temperatura-que-corpo-pode-aguentar.htm>.

47

ANEXO A -- Analises Graficas de Coles

Esse Anexo apresenta as analises graficas dos modelos que foram rejeitados no teste

de aderencia.

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Probability Plot

Empirical

Mod

el

30 32 34 36

3032

3436

Quantile Plot

Model

Em

piric

al

1e−01 1e+00 1e+01 1e+02 1e+03

2830

3234

36

Return Period

Ret

urn

Leve

l

Return Level Plot

Density Plot

z

f(z)

28 30 32 34 36

0.00

0.10

0.20

(d)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Probability Plot

Empirical

Mod

el

30 32 34 36

3032

3436

Quantile Plot

Model

Em

piric

al

1e−01 1e+00 1e+01 1e+02 1e+03

2830

3234

36

Return Period

Ret

urn

Leve

l

Return Level Plot

Density Plot

z

f(z)

28 30 32 34 36

0.00

0.10

0.20

(e)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Probability Plot

Empirical

Mod

el

38 39 40 41

38.0

39.0

40.0

41.0

Quantile Plot

Model

Em

piric

al

1e−01 1e+00 1e+01 1e+02 1e+03

3839

4041

Return Period

Ret

urn

Leve

l

Return Level Plot

Density Plot

z

f(z)

38 39 40 41

0.0

0.2

0.4

0.6

(f)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Probability Plot

Empirical

Mod

el

38 39 40 41

38.0

39.0

40.0

41.0

Quantile Plot

Model

Em

piric

al

1e−01 1e+00 1e+01 1e+02 1e+03

3839

4041

Return Period

Ret

urn

Leve

l

Return Level Plot

Density Plot

z

f(z)

38 39 40 41

0.0

0.2

0.4

0.6

(g)

Anexo A -- Analises Graficas de Coles 48

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Probability Plot

Empirical

Mod

el

31.5 32.0 32.5 33.0 33.5 34.0

31.5

32.5

33.5

Quantile Plot

Model

Em

piric

al

1e−01 1e+00 1e+01 1e+02 1e+03

31.5

32.5

33.5

34.5

Return Period

Ret

urn

Leve

l

Return Level Plot

Density Plot

z

f(z)

31.0 32.0 33.0 34.0

0.0

0.2

0.4

0.6

(h)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Probability Plot

Empirical

Mod

el

31.5 32.5 33.5 34.5

3233

3435

Quantile Plot

Model

Em

piric

al

1e−01 1e+00 1e+01 1e+02 1e+03

3233

3435

Return Period

Ret

urn

Leve

l

Return Level Plot

Density Plot

z

f(z)

31 32 33 34 35

0.0

0.1

0.2

0.3

0.4

0.5

(i)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Probability Plot

Empirical

Mod

el

31.5 32.5 33.5 34.5

3233

3435

Quantile Plot

Model

Em

piric

al

1e−01 1e+00 1e+01 1e+02 1e+03

3233

3435

Return Period

Ret

urn

Leve

l

Return Level Plot

Density Plot

z

f(z)

31 32 33 34 35

0.0

0.1

0.2

0.3

0.4

0.5

(j)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Probability Plot

Empirical

Mod

el

42 43 44 45 46

4243

4445

46

Quantile Plot

Model

Em

piric

al

1e−01 1e+00 1e+01 1e+02 1e+03

4142

4344

4546

Return Period

Ret

urn

Leve

l

Return Level Plot

Density Plot

z

f(z)

41 42 43 44 45 46

0.0

0.1

0.2

0.3

0.4

(k)


0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Probability Plot

Empirical

Mod

el

42 43 44 45 46

4243

4445

46

Quantile Plot

Model

Em

piric

al

1e−01 1e+00 1e+01 1e+02 1e+03

4142

4344

4546

Return Period

Ret

urn

Leve

l

Return Level Plot

Density Plot

z

f(z)

41 42 43 44 45 46

0.0

0.1

0.2

0.3

0.4

(l)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Probability Plot

Empirical

Mod

el

37 38 39 40

3738

3940

Quantile Plot

Model

Em

piric

al

1e−01 1e+00 1e+01 1e+02 1e+03

3738

3940

41

Return Period

Ret

urn

Leve

l

Return Level Plot

Density Plot

z

f(z)

36 37 38 39 40 41

0.0

0.1

0.2

0.3

0.4

0.5

(m)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Probability Plot

Empirical

Mod

el

37 38 39 40

3738

3940

Quantile Plot

Model

Em

piric

al

1e−01 1e+00 1e+01 1e+02 1e+03

3738

3940

41

Return Period

Ret

urn

Leve

l

Return Level Plot

Density Plot

z

f(z)

36 37 38 39 40 41

0.0

0.1

0.2

0.3

0.4

0.5

(n)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Probability Plot

Empirical

Mod

el

39 40 41 42 43

3940

4142

4344

Quantile Plot

Model

Em

piric

al

1e−01 1e+00 1e+01 1e+02 1e+03

3839

4041

4243

44

Return Period

Ret

urn

Leve

l

Return Level Plot

Density Plot

z

f(z)

38 39 40 41 42 43 44 45

0.0

0.1

0.2

0.3

0.4

(o)


0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Probability Plot

Empirical

Mod

el

38 39 40 41 42 43

3839

4041

4243

Quantile Plot

Model

Em

piric

al

1e−01 1e+00 1e+01 1e+02 1e+03

3839

4041

4243

Return Period

Ret

urn

Leve

l

Return Level Plot

Density Plot

z

f(z)

38 39 40 41 42 43 44

0.00

0.10

0.20

0.30

(p)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Probability Plot

Empirical

Mod

el

40 41 42 43 44 45

3941

4345

Quantile Plot

Model

Em

piric

al

1e−01 1e+00 1e+01 1e+02 1e+03

3941

4345

Return Period

Ret

urn

Leve

l

Return Level Plot

Density Plot

z

f(z)

38 40 42 44 46

0.00

0.10

0.20

0.30

(q)

Emprego da Teoria de Valores Extremos na constru˘c~ao de ...

Documents

Transcript of Emprego da Teoria de Valores Extremos na constru˘c~ao de ...