Emprego da Teoria de Valores Extremos na constru˘c~ao de ...
Transcript of Emprego da Teoria de Valores Extremos na constru˘c~ao de ...
Flavio Ferraz Vieira
Emprego da Teoria de Valores Extremos na
construcao de modelos espaco-temporal de
temperaturas
Niteroi - RJ, Brasil
20 de dezembro de 2018
Universidade Federal Fluminense
Flavio Ferraz Vieira
Emprego da Teoria de ValoresExtremos na construcao de modelos
espaco-temporal de temperaturas
Trabalho de Conclusao de Curso
Monografia apresentada para obtencao do grau de Bacharel emEstatıstica pela Universidade Federal Fluminense.
Orientador: Prof. Dr. Marco Aurelio dos Santos Sanfins
Co-Orientador: Prof. Dr. Valentin Sisko
Niteroi - RJ, Brasil
20 de dezembro de 2018
Universidade Federal Fluminense
Flavio Ferraz Vieira
Emprego da Teoria de Valores Extremos na
construcao de modelos espaco-temporal de
temperaturas
Monografia de Projeto Final de Graduacao sob o tıtulo “Em-
prego da Teoria de Valores Extremos na construcao de modelos
espaco-temporal de temperaturas”, defendida por Flavio Ferraz
Vieira e aprovada em 20 de dezembro de 2018, na cidade de
Niteroi, no Estado do Rio de Janeiro, pela banca examinadora
constituıda pelos professores:
Prof. Dr. Marco Aurelio dos Santos SanfinsDepartamento de Estatıstica – UFF
Prof. Dr. Valentin SiskoDepartamento de Estatıstica – UFF
Prof. Me. Eduardo Ferioli GomesDepartamento de Estatıstica – UFF
Niteroi, 20 de dezembro de 2018
V657e Vieira, Flavio Ferraz
Emprego da Teoria de Valores Extremos na
construção de modelos espaço-temporal de temperaturas /
Flavio Ferraz Vieira ; Marco Aurélio dos Santos Sanfins,
orientador ; Valentin Sisko, coorientador. Niterói, 2018.
51 f. : il.
Trabalho de Conclusão de Curso (Graduação em
Estatística)-Universidade Federal Fluminense, Instituto de
Matemática e Estatística, Niterói, 2018.
1. Modelagem. 2. Teoria dos Valores Extrems. 3.
Estatística Espacial. 4. Temperaturas Extremas. 5. Produção
intelectual. I. Sanfins, Marco Aurélio dos Santos, orientador.
II. Sisko, Valentin, coorientador. III. Universidade Federal
Fluminense. Instituto de Matemática e Estatística. IV. Título.
CDD –
Resumo
Os fundamentos da teoria dos valores extremos foram inicialmente expostos por Fishere Tippett [1], que por definicao introduziram os tres tipos possıveis de distribuicoes as-sintoticas dos valores extremos, conhecidas como Gumbel, de Frechet e de Weibull, res-pectivamente.
No entanto, o primeiro a estudar e formalizar a aplicacao estatıstica destas distri-buicoes foi Gumbel [2], cuja a metodologia tem sido frequentemente aplicada. Outrascontribuicoes importantes para o estudo de valores extremos foram dadas por Gnedenko[3], que mostrou as condicoes necessarias e suficientes para a existencia das distribuicoesassintoticas dos valores extremos. Atualmente diversas areas do conhecimento estao uti-lizando a Teoria de Valores extremos para construir modelos preditivos, principalmente adados relacionados ao meio ambiente. Esse fato decorre das grandes mudancas climaticasque vem ocorrendo em nosso planeta nos dias atuais.
Atualmente varios centros mundiais de coleta de dados sobre condicoes climaticas,vem coletando informacoes sobre as maiores temperaturas observadas em diversas areas doplaneta. Em especial atualmente o governo da India possui estas temperaturas maximascoletadas com as respectivas latitude e longitude, possuindo um Historico que abrange osperıodos de 1951 ate o ano de 2014. O objetivo deste projeto e utilizar a teoria de valoresextremos e com esta ser capaz de modelar os dados mencionados anteriormente, comotambem obter um modelo preditivo.
Palavras-chaves: Modelagem, Teoria dos Valores Extremos, Estatıstica Espacial, Tempe-raturas Extremas. Statistics
Este trabalho e dedicado aos meus pais, irmaos e minha namorada,
por todo apoio, suporte e compreensao durante a minha trajetoria.
Agradecimentos
Primeiramente agradecer a Deus pelo dom da vida e da sabedoria, sem ele nada disso
seria possıvel. Aos meus pais Dirlene e Sebastiao por toda educacao, apoio e suporte, meus
irmaos Paulo, Luiza e Diego pelos conselhos e sempre dispostos a oferecer um ombro
amigo, e minha melhor amiga e namorada Camila por todo amor, carinho e paciencia
durante toda minha trajetoria. E todas as pessoas que contribuıram durante a minha
graduacao, diretamente ou indiretamente; a todos meus amigos em especial ao Carlos
Renan, meu orientador Marco e co-orientador Valentin, e toda minha equipe de trabalho
da Fiocruz.
Sumario
Lista de Figuras
Lista de Tabelas
1 Introducao p. 11
1.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 11
2 Referencial Teorico p. 13
2.1 Teoria dos Valores Extremos . . . . . . . . . . . . . . . . . . . . . . . . p. 13
2.1.1 Historico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 13
2.2 Modelagem Univariada de Extremos . . . . . . . . . . . . . . . . . . . p. 14
2.2.1 Notacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 14
2.2.2 Distribuicao Exata e Limite do Maximo . . . . . . . . . . . . . p. 15
2.3 Modelos Assintoticos Para o Maximo . . . . . . . . . . . . . . . . . . . p. 18
2.4 Max-Estabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 21
2.4.1 Dominio de Atracao . . . . . . . . . . . . . . . . . . . . . . . . p. 22
2.5 Distribuicao de Valores Extremos Generalizada (GEV) . . . . . . . . . p. 23
2.6 Teste de Aderencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 24
3 Materiais e Metodos p. 26
3.0.1 Estimacao via Metodo de Maxima Verossimilhanca . . . . . . . p. 27
3.0.2 Estimacao via Metodo de L-Momentos . . . . . . . . . . . . . . p. 29
3.1 Testes Estatısticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 31
3.1.1 Estimativas Obtidas Por Maxima Verossimilhanca . . . . . . . . p. 31
3.1.2 Estimativas obtidas por L-Momentos . . . . . . . . . . . . . . . p. 33
3.2 Teste de Aderencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 34
3.3 Teste Grafico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 34
3.4 Modelagem e Previsoes . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 35
4 Analise dos Resultados p. 36
5 Conclusao p. 44
Referencias p. 45
Anexo A -- Analises Graficas de Coles p. 47
Lista de Figuras
1 Distribuicao Acumulada da Weibull com α = −2, Frechet com α = 1 e
Gumbel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 19
2 Curva Estimada e Teorica da Distribuicao Assintotica do Maximo Pa-
dronizado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 20
3 Representacao da Alocacao das Temperaturas Maximas na India . . . . p. 26
4 Regioes da India . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 27
5 Exemplo de um grafico de retorno . . . . . . . . . . . . . . . . . . . . . p. 35
6 Temperaturas Maximas dos Anos de 1951 e 2014 . . . . . . . . . . . . p. 36
7 Amplitude das Temperaturas Maximas Anuais . . . . . . . . . . . . . . p. 37
8 Maximos e Mınimos das Temperaturas Maximas Anuais . . . . . . . . p. 37
9 Desvio Padrao das Temperaturas Maximas Anuais . . . . . . . . . . . . p. 38
10 Media das Temperaturas Maximas Anuais . . . . . . . . . . . . . . . . p. 38
11 Temperatuas maximas observadas e previstas a partir de 2004 . . . . . p. 40
12 Previsao da Temperatura Maxima para 10 anos e seu IC . . . . . . . . p. 41
13 Previsao da Temperatura Maxima para 20 anos e seu IC . . . . . . . . p. 42
14 Previsao da Temperatura Maxima para 50 anos e seu IC . . . . . . . . p. 43
Lista de Tabelas
1 Representacao da Divisao de uma Variavel X em m Classes . . . . . . p. 24
2 Valores crıticos para as estatısticas de teste D+, D−, D e V . . . . . . . p. 32
3 Representacao do Teste de Aderencia de Pearson . . . . . . . . . . . . p. 34
4 Resultados da aplicacao do teste de aderencia de Pearson . . . . . . . . p. 39
11
1 Introducao
Em quase todas as areas da estatıstica a ordenacao da amostra e imprescindıvel para
a analise dos dados, na Teoria dos Valores Extremos (TVE) tal etapa e crucial. O TVE
e um ramo da probabilidade capaz de quantificar eventos extremos ou raros, atraves da
observacao de maximos (ou mınimos) de grupos de amostras. O TVE ja e presente na
literatura por um tempo relativamente longo e suas aplicacoes ja foram utilizadas em
diversas areas com interesse em observar eventos poucos frequentes, como na estimacao
de eventos climaticos, calculo de seguros e eventos pouco comuns no mercado financeiro.
Por ser um campo fertil para a inferencia estatıstica e possuir aplicacoes em muitas
areas, permitiu a Teoria dos Valores Extremos obter uma vasta bibliografia, entre eles o
classico livro de Gumbel [2], que foi o primeiro a estudar e formalizar os fundamentos da
teoria; outras contribuicoes importantes foram de Fisher e Tippett [1] que introduziram
as tres possıveis distribuicoes assintoticas dos valores extremos, conhecidos como Gumbel,
Frechet e Weibull, e Gnedenko [3] que mostrou as condicoes necessarias para a existencia
das distribuicoes assintoticas dos valores extremos.
Por causa das grandes mudancas climaticas que vem ocorrendo em nosso planeta nos
dias atuais, estudantes de diversas areas do conhecimento estao utilizando a Teoria de
Valores Extremos para construir modelos preditivos, afim de prever e prevenir eventos
indesejaveis.
1.1 Objetivos
A presente monografia tem por finalidade solidificar os conhecimentos e o manuseio
sobre variaveis que sejam coletadas segundo um padrao espaco-temporal. Solidificar os
conhecimentos sobre a Teoria dos Valores Extremos; como suas distribuicoes assintoticas
para os mınimos e maximos (Gumbel, Frechet e Weibull), as condicoes necessarias para
a existencia das convergencias, a distribuicao dos valores extremos generalizada, a es-
1.1 Objetivos 12
timacao dos seus parametros e os testes estatısticos para tais parametros. Estudar o
comportamento das temperaturas maximas da India nos anos de 1951 ate 2014 e propor
varios modelos para os dados com a utilizacao da Teoria de Valores Extremos. E por fim,
analisar e comparar estudos anteriores e correlatos, com a nova proposta e gerar previsoes
para anos posteriores.
13
2 Referencial Teorico
2.1 Teoria dos Valores Extremos
Essa secao aborda topicos sobre a Teoria dos Valores Extremos; seu historico, al-
gumas areas de aplicacoes e seus conceitos, as distribuicoes assintoticas dos maximos e
mınimos, suas condicoes necessarias e a distribuicao dos valores extremos generalizada.
As notacoes serao as mesmas utilizadas por Mendes [4]. Para um estudo mais detalhado
e intensificado sobre a Teoria dos Valores Extremos aconselha-se a leitura da tese de
doutorado denominada “Copulas para Distribuicoes Generalizadas de Valores Extremos
Multidimensionais”de Sanfins [5].
2.1.1 Historico
Eventos extremos sao definidos como eventos raros, eventos que nunca foram obser-
vados ou foram observados poucas vezes. Alguns exemplos classicos desses eventos sao as
crises financeiras, como a crise de 1929 ou desastres naturais, como tsunami, impacto de
meteoros e terremotos. A Teoria dos Valores Extremos surgiu com o interesse de cons-
truir um modelo preditivo que pudesse quantificar relativamente bem esses eventos, afim
de poder diminuir as consequencias ou preveni-los. De acordo com Pires [6], o impulso
dos estudos e da utilizacao do TVE se deu em 1953, quando barragens que protegem a
Holanda do avanco do mar se romperam e causaram a inundacao de boa parte do paıs,
provocando a morte de 1800 pessoas. Apos o desastre, o governo da Holanda criou um
comite que utilizava o ferramental ligado a Teoria dos Valores Extremos para estabelecer
a altura das barragens. Gumbel [2] diz que os interesses na construcao de modelos predi-
tivos de eventos extremos data desde o seculo XVII em estudos de astronomia. Apesar da
preocupacao dos estudos com a modelagem de valores extremos nao ser algo relativamente
novo, os primeiros fundamentos da TVE foram inicialmente expostos por Fisher e Tippett
[1] em 1928, que por introduziram os tres tipos possıveis de distribuicoes assintoticas dos
valores extremos, conhecidos como Gumbel, de Frechet e de Weibull.
2.2 Modelagem Univariada de Extremos 14
No entanto, o primeiro a estudar e formalizar a aplicacao estatıstica destas distri-
buicoes foi Gumbel [2] em 1954, cuja a metodologia tem sido frequentemente aplicada.
Outras contribuicoes importantes para o estudo de valores extremos foram dadas por
Gnedenko [3], que mostrou as condicoes necessarias e suficientes para a existencia das
distribuicoes assintoticas dos valores extremos.
2.2 Modelagem Univariada de Extremos
Nessa secao e apresentada a distribuicao assintotica dos maximos e dos mınimos e
suas condicoes necessarias, a distribuicao assintotica generalizada e seus parametros.
2.2.1 Notacoes
Seja X1, X2, ..., Xn uma amostra aleatoria simples de uma variavel X, com funcao de
distribuicao acumulada FX(x). Frequentemente trabalha-se com a funcao de densidade
fX(x), logo FX(x) e definida como:
FX(x) = P (X ≤ x) =
∫ x
−∞fX(a)da,
a esperanca da variavel X definida como:
E[X] =
∫ ∞−∞
xfX(x)dx,
e a variancia:
V ar[X] = E[(X − E[X])2].
A abordagem classica da Teoria dos Valores Extremos consiste em caracterizar as
caudas da distribuicao FX(x) a partir da distribuicao do maximo ou mınimo. Para isto e
definido as estatısticas de ordem, as estatısticas de ordem k e o suporte da FX(x).
Definicao 2.2.1 (Estatısticas de Ordem) Seja (Xn)n≥1 uma sucessao de variaveis aleatorias,
sao definidas estatısticas de ordem X(1), X(2), ..., X(n), que sao as variaveis aleatorias or-
denadas, tais que X(1) ≤ X(2) ≤ ... ≤ X(n).
Definicao 2.2.2 (Estatıstica de Ordem k) Seja (Xn)n≥1 uma sucessao de variaveis aleatorias,
e definida a k-esima estatıstica de ordem como X(k), tal que X(1) ≤ X(2) ≤ ... ≤ X(k) ≤... ≤ X(n).
2.2 Modelagem Univariada de Extremos 15
Definicao 2.2.3 (Suporte da Funcao de Distribuicao) Seja X ∼ FX(x), o suporte da
funcao de distribuicao de X sera:
xFX = supx ∈ R : FX(x) < 1. (2.1)
2.2.2 Distribuicao Exata e Limite do Maximo
Na TVE e dada uma atencao em especial para o suporte da FX(x) e as estatısticas de
ordem dos extremos, o mınimo e o maximo que sao definidos como mınimo X(1) e maximo
X(n) de uma amostra i.i.d, ou seja:
X(1) = minX1, X2, ..., Xn e X(n) = maxX1, X2, ..., Xn.
A funcao de distribuicao exata do maximo e do mınimo e obtida atraves da funcao
de distribuicao de X.
Definicao 2.2.4 (Funcao de Distribuicao do Maximo) A funcao de distribuicao do maximo
e definida como FX(n)(x) e e obtida a partir da distribuicao de X, do jeito seguinte:
FX(n)(x) = F n
X(x).
Demonstracao.
FX(n)(x) = PX(n) 6 x
= Pmax(X1, X2, ..., Xn) 6 x
= PX1 6 x,X2 6 x, ..., Xn 6 xi.i.d= PX1 6 x × PX2 6 x × ...× PXn 6 x
= P nX 6 x = F nX(x).
e a do mınimo,
Definicao 2.2.5 (Funcao de Distribuicao do Mınimo) A funcao de distribuicao do mınimo
e definida como FX(1)(x) e e obtida a partir da distribuicao de X tal que:
FX(1)(x) = 1− (1− FX(x))n.
Demonstracao.
2.2 Modelagem Univariada de Extremos 16
FX(1)(x) = PX(1) ≤ x
= 1− PX(1) > x
= 1− PX1 > x,X2 > x, ..., Xn > xi.i.d= 1− PX1 > x × PX2 > x × ...× PXn > x
= 1− P nX > x = 1− (1− PX ≤ x)n = 1− (1− FX(x))n.
Com isso, foram definidas as distribuicoes exatas do mınimo e do maximo, porem
suas distribuicoes dependem do conhecimento da distribuicao de X, que em muitos casos
e desconhecida, entretanto o Corolario 2.2.9 afirma que para n suficientemente grande
esta distribuicao sera degenerada. Mas para entender a demonstracao do Corolario 2.2.9,
e preciso entender os conceitos de convergencia em probabilidade, em distribuicao, e quase
certamente que sao uns dos mais importantes resultados da estatıstica.
Definicao 2.2.6 (Convergencia em Probabilidade) Seja (Xn)n≥1 uma sucessao de variaveis
aleatorias, e para qualquer ε > 0 temos que X converge em probabilidade para c se
limn−→∞
P|Xn − c| > ε = 0, (2.2)
Denotado por Xp→ c.
Definicao 2.2.7 (Convergencia Quase Certamente) Seja (Xn)n≥1 uma sucessao de variaveis
aleatorias, e dito que Xn converge quase certamente para X se
P (N) = 1, sendo N = w ∈ Ω|Xn(w)→ X(w), (2.3)
Denotado por Xnq.c.→ X.
Definicao 2.2.8 (Convergencia em Distribuicao) Sejam (Xn)n≥1 uma sucessao de variaveis
aleatorias, e dito que Xn converge em distribuicao para X se
limn→∞
FXn(x) = FX(x), (2.4)
Denotado por Xnd→ X.
2.2 Modelagem Univariada de Extremos 17
E bastante intuitivo que os valores dos maximos sao aquelas que se localizam proximos
do limite superior do suporte da distribuicao de X e que quando maior a sucessao da
variavel X menor sera a distancia do maximo e do suporte . Isto indica que o compor-
tamento assintotico Xn deve estar relacionado com a cauda de FX(x) perto de xFX . Isto
nao e apenas intuitivo, mas tambem um Corolario (As afirmacoes feitas e os resultados
obtidos para o maximo, podem ser estendidos para os mınimos).
Corolario 2.2.9 (Convergencia em Probabilidade do Maximo) Sejam X1, X2, ..., Xn variaveis
aleatorias i.i.d com distribuicao FX(x), para n→∞, X(n) converge em probabilidade para
o suporte, se xFX <∞.
Demonstracao.
Para x < xFX temos que
PXn ≤ x = F nX(x)
n→∞→ 0
e para xFX <∞, temos que para x > xFX
PXn ≤ x = F nX(x) = 1
Logo foi demonstrado que Xnp→ xFX .
Corolario 2.2.10 (Convergencia Quase Certamente do Maximo) Sejam X1, X2, ..., Xn
variaveis aleatorias i.i.d com distribuicao FX(x), para n → ∞, X(n) converge quase cer-
tamente para o suporte, se xFX <∞.
Demonstracao.
Visto que a Sequencia Xn e nao decrescente em n, o maximo converge quase certa-
mente para xFX . Para mais detalhes dessa demonstracao veja James [7].
Os Corolarios 2.2.9 e 2.2.10 afirmam que nao importa a funcao de distribuicao de
X, se o tamanho da amostra de maximos for suficientemente grande, a distribuicao e
degenerada. Mas uma distribuicao degenerada nao fornece muita informacao, com isto, na
Secao 2.3 e apresentada a distribuicao assintotica do maximo, e atraves desta distribuicao
e possıvel obter a distribuicao original de X.
2.3 Modelos Assintoticos Para o Maximo 18
2.3 Modelos Assintoticos Para o Maximo
Para conhecer-se a distribuicao exata do maximo, e preciso conhecer a distribuicao da
variavel X o que na pratica nao ocorre frequentemente, e para n suficientemente grande
o maximo tem uma distribuicao degenerada o que nao fornece muita informacao. Mas,
o Teorema Fundamental de Fisher-Tippet fornece o resultado de convergencia fraca para
maximo centrado e normalizado e atraves do resultado desse teorema e possıvel obter
informacoes relevantes da distribuicao original X atraves da distribuicao assintotica do
maximo.
Teorema 2.3.1 (Fisher-Tippet[1928]) Seja (Xn)n≥1 uma sequencia de variaveis aleatorias
i.i.d. Se existirem sequencias de constantes normalizadoras cn > 0 e dn ∈ R e uma dis-
tribuicao nao degenerada H(x) tal que
X(n) − dncn
d→ H(x),
entao H(x) e uma das 3 funcoes distribuicao abaixo:
Gumbel : HI(x) = exp−e−x , x ∈ R. (2.5)
Frechet : HII(x) =
0 , x < 0
α > 0.exp−x−α , x > 0
(2.6)
Weibull : HIII(x) =
exp−(−x)−α , x ≤ 0
α < 0.1 , x > 0
(2.7)
A Figura 1 apresenta um grafico com as distribuicoes do Teorema 2.3.1, Gumbel,
Frechet e Weibull com α igual a 1 e -2 respectivamente e um exemplo de convergencia do
maximo de uma distribuicao Uniforme(0,1) para a Weibull com α = −1.
2.3 Modelos Assintoticos Para o Maximo 19
−1 0 1 2 3
0.0
0.2
0.4
0.6
0.8
1.0
x
Pro
b
WeibullFréchetGumbel
Figura 1: Distribuicao Acumulada da Weibull com α = −2, Frechet com α = 1 e Gumbel
Exemplo 2.3.2 Convergencia do maximo de uma distribuicao Uniforme(0,1) para uma
Weibull com α = −1:
Suponha que X ∼ Uniforme(0, 1), entao sua funcao de densidade sera fX(x) = I(0,1)(x) e
sua funcao de distribuicao FX(x) = xI(0,+∞)(x). A distribuicao exata do maximo e obtida
atraves da relacao FX(n)(x) = F n
X(x), logo:
FX(n)(x) = xn, 0 < x < 1.
O Teorema 2.3.1 indica que a distribuicao do maximo possui uma distribuicao as-
sintotica H(x), entao
P
X(n) − dn
cn< x
= P
X(n) < xcn + dn
= (xcn + dn)n.
Com isto, fazendo cn = 1n
e dn = 1 temos que
limn→∞
(1 +
x
n
)n→ ex
que coincide com a distribuicao HIII(x) com o parametro α = −1, isto e,
X(n) − 11n
n→∞→ HIII(x).
Entao a distribuicao Uniforme(0,1) com tamanhos de amostras suficientemente grande,
2.3 Modelos Assintoticos Para o Maximo 20
a sua distribuicao assintotica no maximo padronizado, convergira para uma Weibull com
α = −1. A Figura 2 apresenta a curva estimada e a curva teorica da distribuicao as-
sintotica do maximo padronizado do Exemplo 2.3.2, de uma amostra de maximos de
tamanho 100, retirados de blocos de tamanho igual a 5.
Figura 2: Curva Estimada e Teorica da Distribuicao Assintotica do Maximo Padronizado
Como mostrado no Exemplo 2.3.2, com n suficientemente grande, a distribuicao do
maximo da variavel X convergira para alguma distribuicao de H(x), para algumas cons-
tantes normalizadoras cn e dn. Embora as 3 distribuicoes nao aparentam haver nenhuma
relacao, do ponto de vista matematico existe uma familiaridade entre elas.
Proposicao 2.3.3 (Relacoes Entre os Modelos Assintoticos do Maximo) Seja X ∼ Frechet(α),
se X > 0 as relacoes a seguir sao validas:
X ⇔ ln(Xα) ∼ Gumbel⇔ −X−1 ∼Weibull(−α)
A seguir sao apresentadas as funcoes de distribuicao adicionadas com parametros de
locacao µ e escala σ.
2.4 Max-Estabilidade 21
Gumbel : HI(x) = exp−e− (x−µ)σ , x ∈ R. (2.8)
Frechet : HII(x) =
0 , (x− µ) ≤ 0
α > 0.exp−
(x−µσ
)−α , (x− µ) > 0(2.9)
Weibull : HIII(x) =
exp−(− (x−µ)
σ)−α , (x− µ) ≤ 0
α > 0.1 , (x− µ) > 0
(2.10)
O Teorema 2.3.1 nos da total condicao de estimar a distribuicao assintotica(X(n)−dn
cn
)atraves da famılia H(x), sem nenhuma necessidade de utilizar a distribuicao de X. Apos
encontrar a distribuicao assintotica do maximo, podemos encontrar informacoes da dis-
tribuicao de X atraves da seguinte relacao:
H(x) = FX(n)(x) = PX(n) ≤ x = F n
X(x)
entao,
FX(x) = n√H(x). (2.11)
O Teorema 2.3.1 tambem e valido para variaveis aleatorias apresentando dependencia
temporal e heteroscedasticidade. Neste caso existe algumas condicoes a serem verificadas.
Em essencia existem similiaridade entre o Teorema de Fisher-Tippett (TFT) e o Teo-
rema Central do Limite (TCL). O TCL estabelece que dentro das funcoes de distribuicao
nao degeneradas apenas as distribuicoes estaveis podem ser distribuicao limites. O TFT
estabelece que apenas as distribuicoes max-estaveis podem ser distribuicao limite, veja
Mendes [4].
2.4 Max-Estabilidade
Como dito anteriormente uma das condicoes para as distribuicoes do maximo norma-
lizado convergir para alguma das distribuicoes da famılia H(x) e ela ser max-estavel. A
definicao mostra a condicao de uma distribuicao ser max-estavel e diz que toda distri-
buicao max-estavel converge para ela mesma, logo sao distribuicoes limite para o maximo
normalizado.
Definicao 2.4.1 (Max-Estabilidade) Sejam X1, X2, ..., Xn variaveis aleatorias i.i.d de
uma distribuicao FX(x), e sejam dn ∈ R e cn > 0 constantes normalizadoras. E dito
que FX(x) e max-estavel se ela satisfaz a igualdade a seguir:
2.4 Max-Estabilidade 22
max(X1, X2, ..., Xn)d= cnX + dn, (2.12)
e temos que
limn→∞
F nX(cnx+ dn) = H(x).
Provando que as distribuicoes max-estaveis coincide com as distribuicoes da famılia H(x).
Teorema 2.4.2 A classe das distribuicoes que apresentam max-estabilidade coincide com
a classe de todas as distribuicoes limite possıveis (nao degeneradas) para o maximo pa-
dronizado de variaveis aleatorias i.i.d.
2.4.1 Dominio de Atracao
O Teorema de Fisher-Tippett tem a seguinte aplicacao direta: Se [FX(cnx + dn)]n e
nao degenerada quando n e suficientemente grande, para certas constantes positivas cn e
dn ∈ R, entao
∣∣∣∣[FX(x)]n −H(x− dncn
)∣∣∣∣→ 0, n→∞. (2.13)
Para alguma H(x) pertencente as distribuicoes limites para maximos normalizados
e padronizados. Este fato permite que seja definido uma colecao de F ′Xs que dispoem
de uma mesma distribuicao limite. Chama-se Domınio de Atracao a colecao de F ′Xs que
dispoe da mesma distribuicao limite.
Definicao 2.4.3 (Domınio de Atracao) Se a convergencia 2.13 verifica, dizemos que
FX(x) pertence ao domınio de atracao do maximo da distribuicao de valores extremos
H(x). Notacao FX(x) ∈MDA(H).
Entretanto a qualidade e a velocidade de convergencia da distribuicao do maximo
para H(x) depende de FX(x), para cada FX(x) ∈ MDA(H). Como exemplo, temos o
maximo de uma Exponencial que converge mais rapidamente para uma Gumbel do que
ao maximo de uma Normal. Uma relacao de equivalencia para as F ′Xs pertencentes ao
mesmo domınio de atracao pode ser definida atraves do conceito de equivalencia de cauda.
Definicao 2.4.4 (Equivalencia de Cauda) Duas distribuicoes F (x) e G(x) podem ser
2.5 Distribuicao de Valores Extremos Generalizada (GEV) 23
denominadas equivalentes de cauda se ambas apresentarem um mesmo limite superior,
isto e, XFX = XGX e limx↑XFXFXGX
= c, para qualquer constante no intervalo (0,∞).
2.5 Distribuicao de Valores Extremos Generalizada
(GEV)
Os tres tipos de distribuicoes, Gumbel, Frechet, e Weibull, sao integrantes de uma
unica famılia de distribuicoes: A distribuicao de valores extremos generalizada (Generali-
zed Extreme Value, GEV ) padrao, que refere-se as distribuicoes EV dentro de uma unica
famılia, parametrizadas somente pelo parametro ξ e e denotada por Hξ(x).
Hξ(x) =
e−(1+ξx)−1ξ
, se ξ 6= 01+ ξx > 0.
e−e−x
, se ξ = 0(2.14)
Quando ξ = 0 que ocorre na condicao de ξ → 0, a Hξ(x) adequa-se a distribuicao
de Gumbel. Quando ξ > 0 e ξ < 0 adequam-se as distribuicoes de Frechet e Weibull,
respectivamente.
A famılia de locacao e escala e obtida, substituindo o x, por(x−µσ
), com µ ∈ R e
σ > 0, da seguinte forma:
Hξ,µ,σ(x) =
e−(1+ξ(x−µσ ))
−1ξ
, se ξ 6= 01+ ξ
(x−µσ
)> 0.
e−e−(x−µσ )
, se ξ = 0(2.15)
A densidade da distribuicao generalizada (GEV) denotada por hξ,µ,σ(x), e obtida
derivando Hξ,µ,σ(x) e resulta na seguinte densidade (Considerando µ = 0):
hξ,µ,σ(x) =
e−(1+ξ(
xσ ))
−1ξ 1σ(1 + ξ
(xσ
))−1ξ−1 , se ξ 6= 0 e −∞ < x <
(−σξ
)ou ξ > 0 e x ≥
(−σξ
)e−e
−( xσ ) 1σe−x , se ξ = 0 e x ∈ R.
(2.16)
2.6 Teste de Aderencia 24
2.6 Teste de Aderencia
O teste de aderencia de Pearson, e um teste de hipoteses nao parametrico, e o teste
verifica se uma populacao P possui uma distribuicao X, ele testa a hipotese H0 : P = P0
com o nıvel de significancia α, ou seja:
H0 : P = P0
H1 : P 6= P0
(2.17)
O teste consiste em comparar os numeros observados em cada blocos com o numero
observado sob a hipotese de que H0 e verdadeira. O procedimento consiste em considerar
classes, segundo as quais a variavel X, caracterıstica da populacao, pode ser classificada.
A variavel X pode ser qualitativa ou quantitativa, veja Bussab [8]. A tabela seguir
representa a forma geral para um teste de aderencia classificada em m classes.
Tabela 1: Representacao da Divisao de uma Variavel X em m ClassesClasses da variavel X A1 A2 ... Am Total
Observados O1 O2 ... Om
∑mi=1Xi
Esperados E1 E2 ... Em
∑mi=1Xi
A estatıstica a seguir possui uma distribuicao qui-quadrado com m − 1 graus de
liberdade.
m∑i=i
(Oi − Ei)2
Ei∼ χ2
(m−1) (2.18)
Onde Oi e Ei representa os valores observados e esperados para os blocos de i= 1,...,m
respectivamente, apos o calculo da estatıstica observada (χ2(obs)), o criterio de decisao e se
P(χ2m−1 > χ2
(obs)) > α, nao se rejeita H0.
Um grande problema deste teste e que muitas vezes na pratica e desconhecido os
parametros da distribuicao X, de acordo com Artes [9], e possıvel estimar estes parametros
desconhecidos e o teste de aderencia podera ser ajustado para se adequar a essas es-
timacoes, a estatıstica 2.18 tera distribuicao qui-quadrado com m− k − 1 graus de liber-
dade, sendo k o numero de parametros estimados.
Antes da aplicacao do teste de aderencia e necessario evitar que alguns casos ocorram,
sao eles:
(i) Mais de 20% das classes com Ei sejam inferior a 5.
2.6 Teste de Aderencia 25
(ii) Mais de uma classe com Ei inferior a 1.
Caso alguns desse casos ocorra, a aproximacao ao qui-quadrado nao e mais apropriada,
alem disso, o numero de classes para o teste deve respeitar a regra de Mann e Wald.
Definicao 2.6.1 (Regra de Mann e Wald) O numero de classes m para o teste de aderencia
e escolhido de tal forma que, nm> 5.
26
3 Materiais e Metodos
Neste estudo foram investigados 360 sıtios localizados na India, cada sıtio registrou a
temperatura maxima anual de 1951 a 2014 observados em um “grid”, a Figura 3 apresenta
os sitios e os grids; obtendo uma amostra com 64 registros de temperatura maxima. Como
mostra a Figura 3, os sıtios e grids foram alocados de forma sequencialmente, porem essa
localizacao nao e a exata, alem disso o interesse deste estudo e localizar microrregioes mais
vulneraveis a temperaturas altas, em que a sobrevivencia humana esteja em risco. Logo
foi feito uma estimacao das temperaturas nas microrregioes, para estimar as temperaturas
maximas, foram verificadas se um ou mais grids sobrepos uma microrregiao e registrada
o maximo desse grids nelas. As microrregioes da India e apresentada na Figura 4.
Figura 3: Representacao da Alocacao das Temperaturas Maximas na India
+ + + + ++ + + + + + ++ + + + + + ++ + + + + + +
+ + + + + ++ + + + + +
+ + + + + + + ++ + + + + + + + + + + +
+ + + + + + + + + + + + + + + + + + ++ + + + + + + + + + + + + + + + + + + + + + + + +
+ + + + + + + + + + + + + + + + + + + + + + + + + ++ + + + + + + + + + + + + + + + + + + + + + + +
+ + + + + + + + + + + + + + + + + + + + + + + + ++ + + + + + + + + + + + + + + + + + + + + + + +
+ + + + + + + + + + + + + + + + + + + + ++ + + + + + + + + + + + + + + + + + + +
+ + + + + + + + + + + + + + + + ++ + + + + + + + + + + + + ++ + + + + + + + + + + + +
+ + + + + + + + + + ++ + + + + + + + + ++ + + + + + + +
+ + + + + + ++ + + + + + ++ + + + + + + +
+ + + + + + ++ + + + + +
+ + + + ++ + + +
+
(a) Representacao dos Sıtios (b) Representacao dos Grids
3 Materiais e Metodos 27
Figura 4: Regioes da India
A India e composta por 666 microrregioes, apos a estimacao das temperaturas, ape-
nas uma microrregiao nao registrou nenhuma temperatura, ou seja, apos a estimacao
obteve-se 665 amostras com 64 registros. Analises descritivas foram feitas nesses dados e
apresentacao das temperaturas observadas em microrregioes para todo o territorio.
Apos a introducao das principais caracterısticas e conceitos relevantes em relacao
as distribuicoes de valores extremos e da GEV, torna-se imprescindıvel a utilizacao de
metodos para a estimacao dos parametros ξ, µ, σ pertencentes a Hξ,µ,σ(x). As estimativas
para estes parametros podem ser obtidas por varios mecanismos estatısticos, incluindo o
Metodo dos Momentos, Metodo da Regressao, Metodo de Maxima Verossimilhanca e o
Metodo dos L-Momentos. No entanto, neste trabalho e apresentado o Metodo de Maxima
Verossimilhanca e o Metodo dos L-Momentos, dado que os estimadores obtidos por esses
metodos apresentam boas propriedades, ajustes mais precisos e sao os mais usados.
3.0.1 Estimacao via Metodo de Maxima Verossimilhanca
O Metodo de Maxima Verossimilhanca e amplamente empregado para a determinacao
de estimadores pontuais. O princıpio basico deste metodo firma-se na ideia de se encontrar
parametros que venham a maximizar a probabilidade de uma determinada amostra repre-
sentar de maneira mais adequada uma dada populacao. Ainda que em algumas ocasioes
nao seja possıvel calcular os estimadores de maxima verossimilhanca, estes sao consisten-
tes, eficientes e assintoticamente normais em condicoes relativamente suaves, possuindo
muitas vezes boas propriedades de convergencia e tornando-se assim uma escolha popular
para a estimacao parametrica. Os estimadores de maxima verossimilhanca (EMV) dos
3 Materiais e Metodos 28
parametros ξ, µ, σ pertencentes a GEV, podem ser alcancados de maneira numerica ao
se maximizar a funcao de verossimilhanca, ou seja, sao os valores em R × R × R+ que
maximizam
L(ξ, µ, σ; (m1, ...,mm)) =m∏i=1
hξ,µ,σ(mi)I1+ ξσ(mi−µ)>0. (3.1)
A funcao de log-verossimilhanca e dada por,
l(ξ, µ, σ; (m1, ...,mm)) = log[L(ξ, µ, σ; (m1, ...,mm))]
= log[m∏i=1
hξ,µ,σ(mi)]I1+ ξσ(mi−µ)>0, (3.2)
que e equivalente ha
l(ξ, µ, σ; (m1, ...,mm)) =m∑i=1
log[hξ,µ,σ(mi)]I1+ ξσ(mi−µ)>0, (3.3)
e (m1, ...,mm) refere-se a uma amostra de m maximos.
Os EMV dos parametros ξ, µ e σ, denotados por ξ, µ e σ respectivamente, podem ser
obtidos por intermedio da resolucao de um sistema de equacoes nao lineares, atingindo a
partir da diferenciacao da funcao de verossimilhanca ou log-verossimilhanca em relacao
aos parametros.
• Para obter ξ basta resolver:
∂l(ξ, µ, σ; (m1, ...,mm))
∂ξ= 0,
• Para obter µ basta resolver:
∂l(ξ, µ, σ; (m1, ...,mm))
∂µ= 0,
• Para obter σ basta resolver:
∂l(ξ, µ, σ; (m1, ...,mm))
∂σ= 0.
3 Materiais e Metodos 29
3.0.2 Estimacao via Metodo de L-Momentos
Os L-momentos sao tidos como variacoes dos “Probability Weighted Moments”(PWM),
de Greenwood et al [10]. A estimacao via L-Momentos apresenta a capacidade de carac-
terizar distribuicoes com caudas pesadas e, quando estimados, serem considerados mais
robustos a presenca de valores extremos (outliers), os L-momentos possuem uma vantagem
sobre os momentos convencionais.
Os L-momentos sao medidas de posicao, escala e forma das distribuicoes de probabi-
lidade, similares aos momentos convencionais, porem estimados por combinacoes lineares
da assimetria, da curtose e do coeficiente de variacao, veja Esmeria [11].
Segundo Hosking [12], os parametros estimados fazendo-se uso dos L-momentos de-
monstram, ocasionalmente, maior precisao em amostras pequenas, se comparado com
as estimativas obtidas utilizando-se o Metodo de Maxima Verossimilhanca, ou seja, os
L-momentos sao geralmente mais eficientes do que os EMV.
Os PWM de uma variavel aleatoria Z podem ser definidos como:
ηp,r,s = E[Zp(F (Z))r(1− F (Z))s].
No entanto, para este trabalho torna-se mais conveniente a utilizacao de um caso
particular, caracterizado por:
η1,r,0 = βr = E[Z(F (Z))r]. (3.4)
Os PWM amostrais de ordem r, com r = 0, 1, ...,m − 1, denotados por br, sao os
estimadores nao viesado dos PWM populacionais βr, e podem ser estimados por:
br =1
m
m∑j=r+1
(j − 1)(j − 2)...(j − r)(m− 1)(m− 2)...(m− r)m(j)
. (3.5)
Os L-Momentos λr+1, r = 0, 1, 2, ... (Ler Hosking [13]) sao estipulados para variaveis
aleatorias com esperanca finita e podem ser descritos como
λr+1 =r∑j=0
p∗r,jβj, r = 0, 1, 2, ... (3.6)
3 Materiais e Metodos 30
onde,
p∗r,j =(−1)r−j(r + j)!
(j!)2(r − j)!. (3.7)
e βj pode ser obtido utilizando-se a relacao 3.4.
No caso em que r = 0, denota-se λ1 0 L-momento relacionado com a locacao da
distribuicao. Quando r assume os valores 1 e 2, nesta ordem, λ2(λ2 = 2β1−β0) e λ3(λ3 =
6β2 − 6β1 + β0), sao os L-momentos associados a escala e assimetria, respectivamente. O
λ2 por sua vez, deve ser comparado com o desvio padrao σ, obtendo-se a seguinte relacao
σ ≥√
3λ2.
Os L-momentos amostrais lr sao estimadores nao viesado de λr e podem ser definidos
da seguinte maneira
lr+1 =r∑j=0
p∗r,jbj, r = 0, 1, 2, ...,m− 1, (3.8)
onde p∗r,j e obtido da relacao 3.7 e bj da relacao 3.4.
Para as quantidades populacionais, sao equacionados um numero fixo de L-momentos
amostrais equipolentes. Dessa forma, os parametros de uma distribuicao podem ser re-
presentados em funcao dos L-momentos.
Para a distribuicao de valores extremos generalizada tem-se
λ1 = µ− σ
ξ1− Γ(1− ξ), (3.9)
λ2 = −σξ
(1− 2ξ)(Γ(1− ξ)), (3.10)
λ3λ2
= 2(1− 3ξ)
(1− 2ξ)− 3, (3.11)
onde Γ(.) equivale a funcao gamma.
Com intuito de se estimar os parametros da GEV, ξ, µ e σ, os L-momentos populacio-
nais sao substituıdos pelos seus respectivos L-momentos amostrais, l1, l2, l3, nas equacoes
3.9, 3.10, 3.11. Para se estimar o parametro ξ e necessario a resolucao da equacao 3.11,
como nao ha uma solucao obvia para ela, a seguinte aproximacao e valida (ver Hosking e
3.1 Testes Estatısticos 31
Wallis [14]).
ξ = −7, 8590c− 2, 9554c2, (3.12)
onde c = 2
3+l3l2
− log2log3
e consequentemente
σ =−l2ξ
(1− 2ξ)Γ(1− ξ), (3.13)
µ = l1 +σ
ξ(1− Γ(1− ξ)). (3.14)
Os estimadores de L-momentos sao unicos e apresentam vıcio e variancia mınimos.
3.1 Testes Estatısticos
Independente do metodo utilizado para a realizacao da estimacao dos parametros,
torna-se essencial a aplicacao de testes estatısticos que sejam capazes de testar formal-
mente as suposicoes do modelo e a qualidade do ajuste. Alem dos testes estatısticos
formais e sempre conveniente a realizacao de analises graficas.
Com a intensao de se testar a qualidade do ajuste realizado e a adequacao de deter-
minado modelo a distribuicao Gumbel, pois sua expressao apresenta maior simplicidade,
nessa Secao 3.1 serao apresentados testes que podem ser aplicados as estimativas obtidas
pelos metodos de Maxima Verossimilhanca e de L-momentos
3.1.1 Estimativas Obtidas Por Maxima Verossimilhanca
Se as estimativas dos parametros da GEV foram obtidas por maxima verossimilhanca,
as seguintes estatısticas de teste podem ser utilizadas para se testar a suposicao de que
os dados sequem realmente a distribuicao GEV(ver Chandra et al
1. As estatıstica de Kolmogorov-Sminorv, D+, D− e D,
2. A Estatıstica Kuiper, V.
Estas sao definidas como
3.1 Testes Estatısticos 32
D+ = maxi
i
m−Hξ(m(i))
,
D− = maxi
Hξ(m(i) −
i− 1
m)
,
D = max(D+, D−),
V = D+ +D−,
onde m(i) refere-se aos maximos ordenados e Hξ representa a distribuicao GEV com
as estimativas obtidas.
A Tabela 2 exibe os valores crıticos para amostras de m = 50 e m = ∞ (amostras
significativamente grande). Os nıveis de significancia abordados foram de 1% e 5%.
Tabela 2: Valores crıticos para as estatısticas de teste D+, D−, D e V .Nıvel de Significancia
√mD+
√mD−
√mD
√mV
1% 0,940 0,944 0,988 1,6395% 0,796 0,796 0,856 1,428
1% 0,957 0,957 1,007 1,6715% 0,808 0,808 0,874 1,477
Para testar se o parametro ξ e estatisticamente zero, ou seja, que a distribuicao dos ex-
tremos se adequa a uma Gumbel, pode-se utilizar o Teste da Razao das Verossimilhancas,
cuja metodologia se encontra a seguir.
As seguintes hipoteses precisam ser testas
H0 = A distribuicao dos Extremos e Gumbel
H1 = A distribuicao dos Extremos nao e Gumbel
e a estatıstica de teste e representada por
Λ = −2(LGumbel − LGEV ),
onde a LGumbel e LGEV referem-se as log-verossimilhancas (obtidas como na equacao
3.1 Testes Estatısticos 33
3.2) com a utilizacao das densidade de Gumbel e da GEV, nesta ordem, expressas com
suas respectivas estimativas adquiridas por maxima verossimilhanca.
A estatıstica de teste Λ deve ser comparada com a distribuicao qui-quadrado com um
grau de liberdade (χ2(1)), para um nıvel de significancia fixado.
3.1.2 Estimativas obtidas por L-Momentos
Se as estimativas dos parametros da GEV foram obtidas pelo metodos dos L-momentos,
o Teste da Qualidade do Ajuste de Sherman pode ser empregado para testar o erro co-
metido ao se substituir a distribuicao exata (que apresenta n finito) pela distribuicao
assintotica.
O teste apresenta as seguintes hipoteses
H0 = Os extremos seguem uma funcao de distribuicao GEV
H1 = Os extremos nao seguem uma funcao de distribuicao GEV
a estatıstica de teste e,
Wm − EmDm
,
onde
Wm =1
2
m+1∑i=1
∣∣∣∣Hξ(m(i))−Hξ(m(i−1))−1
(m+ 1)
∣∣∣∣ ,Em =
(m
m+ 1
)(m+1)
e
E2m +D2
m =2mm+2 +m(m− 1)(m+2)
(m+ 2)(m+ 1)(m+2),
onde Hξ denota a distribuicao GEV com as estimativas obtidas por L-momentos, m(i)
representa novamente os maximos ordenados, Hξ(m(0)) e Hξ(m(m+1)) assumem respecti-
vamente, 0 e 1.
A estatıstica de teste pode ser considerada assintoticamente normal e o p-valor deve
3.2 Teste de Aderencia 34
ser calculado levando em consideracao apenas a cauda direita da distribuicao normal
padrao.
3.2 Teste de Aderencia
Apos toda estimacao dos parametros da GEV e preciso verificar se as estimacoes
foram adequadas, e para isto foi utilizado o teste de aderencia ajustada. Na aplicacao
deste teste precisa ficar atento com algumas regras para nao haver resultados imprecisos
apresentados na Secao 2.6. Para este estudo foi utilizado m = 6 de forma a obedecer a
regra de Mann e Wald e evitar que mais de 20% dos valores esperados sejam inferior a 5
e mais de um inferior a 1. Os criterios para a divisao de classes foram os quantis 20, 40,
50, 60, 80 da GEV para cada estimacao.
Tabela 3: Representacao do Teste de Aderencia de PearsonQuantis (−∞, Q20] (Q20, Q40] (Q40, Q50] (Q50, Q60] (Q60, Q80] (Q80,∞)N O1 O2 O3 O4 O5 O6
Sendo Qq o quantil q da GEV estimada e Oi o numero de elementos da amostra que
adequam a classe; logo apos a divisao das classes e contabilizado os numeros observados
e calculado o p − valor da estatıstica ??, com m = 6, k = 3. Coles [15], afirma que
para verificar a eficiencia do modelo proposto pela TVE, e mais adequado utilizar o teste
grafico apresentada na Secao 3.3, com isso foi utilizada o teste de aderencia para obter
medidas resumos (p-valor) para facilitar a averiguacao das estimativas, e nas GEV que o
teste de Pearson rejeitou a hipotese nula, foi feita a analise grafica por ser mais adequada.
3.3 Teste Grafico
Coles [15] propoem uma analise grafica da GEV com os parametros estimados para
verificar se o ajuste e adequado, atraves de grafico de probabilidade, grafico de quantil-
quantil, histograma com a curva da GEV, e grafico de retorno de nıveis. Este ultimo
teste, de acordo com o Coles e o melhor pois apresenta um intervalo de confianca para
os dados de 95% e facil de verificar. Se todos os pontos ficarem dentro do intervalo, ou
apenas poucos saırem, a estimacao e considerada boa.
3.4 Modelagem e Previsoes 35
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Empirical
Mod
el
32 33 34 35 36
3233
3435
36
Quantile Plot
Model
Em
piric
al
1e−01 1e+00 1e+01 1e+02 1e+03
3233
3435
3637
Return Period
Ret
urn
Leve
l
Return Level Plot
Density Plot
z
f(z)
31 32 33 34 35 36 37
0.0
0.1
0.2
0.3
0.4
Figura 5: Exemplo de um grafico de retorno
3.4 Modelagem e Previsoes
Foi feita a modelagem utilizado a TVE apresentada na Secao 2.2 e os parametros
estimados foi utilizando a estimacao de maxima verossimilhanca apresentada na Secao
3.0.1. Apos e verificada se os modelos preditivos estimados, sao adequados, para isto foi
utilizado os testes de aderencia e grafica de Coles.
De acordo com Mendes [4], para obter previsao para n anos, e calculado o quantil
Q100− 1n
da GEV, a logica deste metodo e de que para n anos, uma observacao passara
o quantil Q100− 1n, com isso foi feita previsoes para 10, 20, 50 anos. Para o estudo foi
utilizado p-valor igual a 0.01, e todas as analises foram feitas no software estatıstico R.
36
4 Analise dos Resultados
A Figura 6 apresenta as temperaturas maximas observadas nos anos de 1951 e 2014.
Observou-se que boa parte do paıs obteve uma temperatura maxima acima de 43 Celsius
nos anos de 1951 e 2014, e que essas observacoes se encontradas maiores concentradas na
regiao central da India. Alem disto as regioes Leste e Sudoeste sao as que observaram as
menores temperaturas maximas anuais, nao ultrapassando a 35 Celsius.
Figura 6: Temperaturas Maximas dos Anos de 1951 e 2014
(a) Temperaturas maximas no ano de 1951 (b) Temperaturas maximas no ano de 2014
Nas Regioes Leste, Sudoeste e Noroeste, sao as que apresentam maior crescimento
das temperaturas dos anos de 1951 a 2014, a Figura 7 exibe os graficos das amplitudes
das temperaturas nas regioes e o histograma delas. E bastante visıvel o crescimento
mencionado, porem houve um decrescimo das temperaturas em varias microrregioes da
regiao central; outras microrregioes as temperaturas variaram pouco.
4 Analise dos Resultados 37
Figura 7: Amplitude das Temperaturas Maximas Anuais
(a) Amplitude por Regiao
Amplitude
Den
sida
de
−2 −1 0 1 2
0.0
0.1
0.2
0.3
0.4
(b) Histograma da Amplitude
A Figura 8 mostra os maximos e mınimos das temperatura maximas nesses 64 anos.
Essa Figura apresenta um resultado preocupante, quase todo o paıs da India teve um ano
que se observou uma temperatura proxima ou acima a 45 Celsius, e que em todos os
anos se observou temperaturas proximas ou acima de 37.5 Celsius.
Figura 8: Maximos e Mınimos das Temperaturas Maximas Anuais
(a) Maximos das Temperaturas Maximas (b) Minimos das Temperaturas Maximas
A Figura 9 apresenta o desvio padrao das temperaturas maximas observadas. As
regioes que houve menor variacao em suas temperaturas, foi a sul e a norte foi a que
houve maior variacao.
4 Analise dos Resultados 38
Figura 9: Desvio Padrao das Temperaturas Maximas Anuais
De acordo com o site Brasil Escola [16], a temperatura maxima que o corpo humano
suportaria para a sobrevivencia varia de acordo com a umidade do ar, ja que o suor e
responsavel pela liberacao do calor presente no corpo humano, em dias que a umidade do
ar estiver alta, temperaturas acima de 40 Celsius e considerada de grande risco para a
sobrevivencia. Com isto, dependendo da umidade do ar, a regiao central da India estaria
em grandes riscos, ja que de acordo com a Figura 10 as medias das temperaturas maximas
anuais observadas ja ultrapassam aos 40 Celsius.
Figura 10: Media das Temperaturas Maximas Anuais
4 Analise dos Resultados 39
Foi utilizada a GEV para modelagem das distribuicoes das 665 microrregioes, com
os parametros ξ, µ e σ estimados pelo metodo de maxima verossimilhanca; para obter
uma medida resumo da verificacao da eficiencia da modelagem da GEV nos dados para
as 665 microrregioes, foi utilizado o teste de aderencia de Pearson; a Tabela 4 mostra
os resultados do teste sob a hipotese nula (H0) que as amostras sao oriundas da GEV
proposta.
Tabela 4: Resultados da aplicacao do teste de aderencia de Pearsonp−valor Microrregioes
< 0.01 14≥ 0.01 651Total 665
Este resultado informa que pelo teste de aderencia rejeitou-se a modelagem de 14
microrregioes, uma verificacao mais detalhada foi feita nessas microrregioes para entender
tal resultado do teste de aderencia, presencas de outlier e valores esperados iguais a 1
foram as causas para a rejeicao do teste. Na Secao 2.6 foi explicado que para a verificacao
dos modelos propostos pela GEV o mais ideal e o teste grafico proposto por Coles apresen-
tado na Secao 3.3; logo para as 14 microrregioes que houve rejeicao no teste de Pearson,
foi feito o teste grafico. O Anexo A contem os graficos feitos para as 14 microrregioes e
constou-se que apesar da rejeicao inicial no teste de aderencia, pelo teste grafico nao ha
hipotese de rejeicao. Com isso para os 665 modelos propostos pela GEV, nao ha hipotese
para a rejeicao de nenhuma, todos os modelos sao considerados eficientes, os calculos das
previsoes foram feitas sob a GEV proposta.
Antes de calcular a previsao para 10, 20 e 50 anos, foi verificada a eficiencia do
metodo de previsao; para isto foi selecionada as amostras ate o ano de 2004 e feita a
previsao para 10 anos seguintes. A de deixar claro que a previsao para os anos seguintes,
nao e uma previsao para o ano exatamente, mas sim o maximo previsto nos anos, ou
seja, para a previsao de 10 anos apos o ano de 2004, tera o resultado do maximo previsto
de 2005 a 2014. Com isto claro, a Figura 11 apresenta o maximo observado de 2005
a 2014 e os valores previsto para 10 anos a partir de 2004. O metodo para a previsao
foi eficiente, estimando os valores futuros bem proximo dos valores reais observados. Os
valores previstos sao menores que observados em varias microrregioes, o que indica a
existencia de algum fator nos anos seguintes. E perceptıvel que nas microrregioes que
houve aumento, sao vizinhas uma das outras, pra este trabalho supomos a independencia
dos dados, mas esse resultado indica que a uma dependencia, mas a GEV tambem e capaz
de modelar dados com essa caracterıstica.
4 Analise dos Resultados 40
Figura 11: Temperatuas maximas observadas e previstas a partir de 2004
(a) Maximo das Temperaturas Maximas de 2005a 2014
(b) Previsao para 10 anos a partir de 2004
E por fim e apresentado os graficos de previsao para 10, 20 e 50 anos a partir de 2014
e seus respectivos intervalos de confianca de 95% (IC). Apesar de nao ser muito visıvel a
diferenca das previsoes, elas possuem uma diferenca em seu respectivos IC. As amplitudes
dos intervalos confianca vao aumentando quanto vai aumentando os anos das previsoes;
alem disso nao a uma melhora em relacao a diminuicao das temperaturas maximas ja que
a previsao feita para 10 anos e bem proxima da feita para 50 anos, a unica diferenca e no
IC como mencionado.
4 Analise dos Resultados 41
A Figura 12 exibe a previsao para as temperaturas maximas em 10 anos e seu IC, a
regiao central do paıs corre grande risco, ja que em 10 anos a previsao para boa parte
dessa regiao e uma temperatura maxima proxima a 45 Celsius, a regiao Leste e Sudoeste
sao as que menos correm risco.
Figura 12: Previsao da Temperatura Maxima para 10 anos e seu IC
(a) Limite Inferior do IC para Previsao de 10 anos (b) Limite Superior do IC para Previsao de 10anos
(c) Previsao para 10 Anos
4 Analise dos Resultados 42
A Figura 13 exibe a previsao das temperaturas maximas para 20 anos, da mesma
forma para a previsao de 10 anos, nao a uma melhora significativa; alem disso a diferenca
das duas previsoes e maior no intervalo de confianca, a previsao em si nao difere muito.
Apesar das temperaturas previstas de boa parte do paıs estarem proxima de 45, que e
perto do limite para a sobrevivencia humana dependendo da umidade do ar; a um leve
crescimento em relacao as duas previsoes, o que e um resultado satisfatorio.
Figura 13: Previsao da Temperatura Maxima para 20 anos e seu IC
(a) Limite Inferior do IC para Previsao de 20 anos (b) Limite Superior do IC para Previsao de 20anos
(c) Previsao para 20 Anos
4 Analise dos Resultados 43
Finalmente, a Figura 14 exibe as temperaturas maximas previstas para 50 anos. Como
mencionado, nao a uma diferenca grande das previsoes anteriores o que pode ser conside-
rado um resultado satisfatorio, porem as temperaturas em boa parte do paıs e de grande
risco.
Figura 14: Previsao da Temperatura Maxima para 50 anos e seu IC
(a) Limite Inferior do IC para Previsao de 50 anos (b) Limite Superior do IC para Previsao de 50anos
(c) Previsao para 50 Anos
44
5 Conclusao
Este trabalho analisou as temperaturas maximas anuais observadas de 1951 ate 2014,
e estimou-as em uma analise em microrregioes, das 666 regioes, obteve-se dados para
665. As analises descritivas, expos um resultado preocupante na regiao central do paıs,
que teve temperaturas maximas observadas entre 40 e 45 Celsius, o que e proximo do
limite para a sobrevivencia humana, de acordo com o site Brasil Escola [16]. Apesar das
regioes Leste e Sudoeste apresentarem menores temperaturas maximas, foram as regioes
que houve o maior crescimento delas.
Feitas as analises foi estimado os parametros da GEV e utilizou-se os testes de
aderencia e grafico para verificar a eficiencia, e foi considerado que os 665 modelos foram
eficientes; e feita previsoes utilizando esses modelos. Como feito para os modelos da GEV,
foi feita uma analise da previsao, para verificar sua eficiencia, que tambem foi considerada
satisfatoria, alem disso atraves dessa analise verificou-se que existe uma dependencia es-
pacial dos dados. Por fim, feitas as previsoes para 10, 20 e 50 anos; concluiu-se que nao
ha uma melhora nas temperaturas maximas que e um resultado preocupante, porem nao
ha um crescimento exponencial nas temperaturas, o que pode considerar satisfatorio.
Para este trabalho, foi feito um estudo apenas de analises descritivas e a modelagem
atraves da GEV; porem tera continuidade em trabalhos futuros com os seguinte objetivos:
(i) Um estudo das microrregioes com foco na Teoria de Copulas;
(ii) Identificacao das microrregioes com maiores probabilidade as temperaturas altas;
(iii) Calculos de correlacao espacial;
(iv) Analises das temperaturas, envolvendo a umidade do ar.
45
Referencias
[1] FISHER, R.; TIPPETT, L. H. C. Limiting forms of the frequency distribution of thelargest or smallest member of a sample. Proceedings of the Cambridge PhilosophicalSociety, 1928.
[2] GUMBEL, E. J. Statistics theory of extreme values and some pratical applications.Nat. Bureau of Standards Applications Mathmatics Series, 1954.
[3] GNEDENKO, B. V. Sur la distribution limite du terme maximum dune serie. [S.l.]:Annals of Mathematics, 1943.
[4] MENDES, B. V. de M. Introducao a Analise de Eventos Extremos. [S.l.]: E-papers,2004.
[5] SANFINS, M. A. Copulas para Distribuicoes Generalizadas de Valores Extremos Mul-tidimensionais. [S.l.]: Publicacao Academica, 2009.
[6] PIRES, G. L. G. Teoria dos Valores Extremos: Valor em Risco Para Ativos de RendaVariavel. [S.l.]: Publicacao Academica, 2008.
[7] JAMES, B. R. Probabilidade: um Curso em nıvel intermediario. [S.l.]: Projeto Eucli-des, 1981.
[8] MORETTIN, P.; BUSSAB, W. de O. Estatıstica basica.Saraiva, 2012. ISBN 9788502136915. Disponıvel em:<https://books.google.com.br/books?id=8mUrywAACAAJ>.
[9] ARTES, R. Teste Qui-quadrado de aderencia. [S.l.], 2014.
[10] ARTHUR, G. J. et al. Probability weighted moments: Definition and re-lation to parameters of several distributions expressable in inverse form.Water Resources Research, v. 15, n. 5, p. 1049–1054. Disponıvel em:<https://agupubs.onlinelibrary.wiley.com/doi/abs/10.1029/WR015i005p01049>.
[11] VALVERDE, A. E. L. et al. Momentos-l: Teoria e aplicacao em hidrologia. v. 28, 122004.
[12] HOSKING, J. R. M.; WALLIS, J. R.; WOOD, E. F. Estimation of the generali-zed extreme-value distribution by the method of probability-weighted moments. Te-chnometrics, [Taylor Francis, Ltd., American Statistical Association, American So-ciety for Quality], v. 27, n. 3, p. 251–261, 1985. ISSN 00401706. Disponıvel em:<http://www.jstor.org/stable/1269706>.
Referencias 46
[13] HOSKING, J. R. M. L-moments: Analysis and estimation of distributions usinglinear combinations of order statistics. Journal of the Royal Statistical Society. SeriesB (Methodological), [Royal Statistical Society, Wiley], v. 52, n. 1, p. 105–124, 1990.ISSN 00359246. Disponıvel em: <http://www.jstor.org/stable/2345653>.
[14] HOSKING, J. R. M.; WALLIS, J. R. Regional Frequency Analysis: An ApproachBased on L-Moments. [S.l.]: Cambridge University Press, 1997.
[15] COLES, S. An Introduction to Statistical Modeling of Extreme Values. [S.l.]: SpringerSeries in Statistics, Springer: Berlin., 2001.
[16] QUAL e a maior temperatura que o corpo pode aguentar? Accessed: 12/2018. Dis-ponıvel em: <https://brasilescola.uol.com.br/curiosidades/qual-maior-temperatura-que-corpo-pode-aguentar.htm>.
47
ANEXO A -- Analises Graficas de Coles
Esse Anexo apresenta as analises graficas dos modelos que foram rejeitados no teste
de aderencia.
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Empirical
Mod
el
30 32 34 36
3032
3436
Quantile Plot
Model
Em
piric
al
1e−01 1e+00 1e+01 1e+02 1e+03
2830
3234
36
Return Period
Ret
urn
Leve
l
Return Level Plot
Density Plot
z
f(z)
28 30 32 34 36
0.00
0.10
0.20
(d)
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Empirical
Mod
el
30 32 34 36
3032
3436
Quantile Plot
Model
Em
piric
al
1e−01 1e+00 1e+01 1e+02 1e+03
2830
3234
36
Return Period
Ret
urn
Leve
l
Return Level Plot
Density Plot
z
f(z)
28 30 32 34 36
0.00
0.10
0.20
(e)
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Empirical
Mod
el
38 39 40 41
38.0
39.0
40.0
41.0
Quantile Plot
Model
Em
piric
al
1e−01 1e+00 1e+01 1e+02 1e+03
3839
4041
Return Period
Ret
urn
Leve
l
Return Level Plot
Density Plot
z
f(z)
38 39 40 41
0.0
0.2
0.4
0.6
(f)
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Empirical
Mod
el
38 39 40 41
38.0
39.0
40.0
41.0
Quantile Plot
Model
Em
piric
al
1e−01 1e+00 1e+01 1e+02 1e+03
3839
4041
Return Period
Ret
urn
Leve
l
Return Level Plot
Density Plot
z
f(z)
38 39 40 41
0.0
0.2
0.4
0.6
(g)
Anexo A -- Analises Graficas de Coles 48
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Empirical
Mod
el
31.5 32.0 32.5 33.0 33.5 34.0
31.5
32.5
33.5
Quantile Plot
Model
Em
piric
al
1e−01 1e+00 1e+01 1e+02 1e+03
31.5
32.5
33.5
34.5
Return Period
Ret
urn
Leve
l
Return Level Plot
Density Plot
z
f(z)
31.0 32.0 33.0 34.0
0.0
0.2
0.4
0.6
(h)
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Empirical
Mod
el
31.5 32.5 33.5 34.5
3233
3435
Quantile Plot
Model
Em
piric
al
1e−01 1e+00 1e+01 1e+02 1e+03
3233
3435
Return Period
Ret
urn
Leve
l
Return Level Plot
Density Plot
z
f(z)
31 32 33 34 35
0.0
0.1
0.2
0.3
0.4
0.5
(i)
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Empirical
Mod
el
31.5 32.5 33.5 34.5
3233
3435
Quantile Plot
Model
Em
piric
al
1e−01 1e+00 1e+01 1e+02 1e+03
3233
3435
Return Period
Ret
urn
Leve
l
Return Level Plot
Density Plot
z
f(z)
31 32 33 34 35
0.0
0.1
0.2
0.3
0.4
0.5
(j)
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Empirical
Mod
el
42 43 44 45 46
4243
4445
46
Quantile Plot
Model
Em
piric
al
1e−01 1e+00 1e+01 1e+02 1e+03
4142
4344
4546
Return Period
Ret
urn
Leve
l
Return Level Plot
Density Plot
z
f(z)
41 42 43 44 45 46
0.0
0.1
0.2
0.3
0.4
(k)
Anexo A -- Analises Graficas de Coles 49
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Empirical
Mod
el
42 43 44 45 46
4243
4445
46
Quantile Plot
Model
Em
piric
al
1e−01 1e+00 1e+01 1e+02 1e+03
4142
4344
4546
Return Period
Ret
urn
Leve
l
Return Level Plot
Density Plot
z
f(z)
41 42 43 44 45 46
0.0
0.1
0.2
0.3
0.4
(l)
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Empirical
Mod
el
37 38 39 40
3738
3940
Quantile Plot
Model
Em
piric
al
1e−01 1e+00 1e+01 1e+02 1e+03
3738
3940
41
Return Period
Ret
urn
Leve
l
Return Level Plot
Density Plot
z
f(z)
36 37 38 39 40 41
0.0
0.1
0.2
0.3
0.4
0.5
(m)
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Empirical
Mod
el
37 38 39 40
3738
3940
Quantile Plot
Model
Em
piric
al
1e−01 1e+00 1e+01 1e+02 1e+03
3738
3940
41
Return Period
Ret
urn
Leve
l
Return Level Plot
Density Plot
z
f(z)
36 37 38 39 40 41
0.0
0.1
0.2
0.3
0.4
0.5
(n)
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Empirical
Mod
el
39 40 41 42 43
3940
4142
4344
Quantile Plot
Model
Em
piric
al
1e−01 1e+00 1e+01 1e+02 1e+03
3839
4041
4243
44
Return Period
Ret
urn
Leve
l
Return Level Plot
Density Plot
z
f(z)
38 39 40 41 42 43 44 45
0.0
0.1
0.2
0.3
0.4
(o)
Anexo A -- Analises Graficas de Coles 50
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Empirical
Mod
el
38 39 40 41 42 43
3839
4041
4243
Quantile Plot
Model
Em
piric
al
1e−01 1e+00 1e+01 1e+02 1e+03
3839
4041
4243
Return Period
Ret
urn
Leve
l
Return Level Plot
Density Plot
z
f(z)
38 39 40 41 42 43 44
0.00
0.10
0.20
0.30
(p)
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Empirical
Mod
el
40 41 42 43 44 45
3941
4345
Quantile Plot
Model
Em
piric
al
1e−01 1e+00 1e+01 1e+02 1e+03
3941
4345
Return Period
Ret
urn
Leve
l
Return Level Plot
Density Plot
z
f(z)
38 40 42 44 46
0.00
0.10
0.20
0.30
(q)