INTRODUÇÃO À ESTATÍSTICA...

Post on 14-Feb-2019

240 views 0 download

Transcript of INTRODUÇÃO À ESTATÍSTICA...

INTRODUÇÃO À ESTATÍSTICA ESPACIAL

Prof. Anderson Rodrigo da Silvaanderson.silva@ifgoiano.edu.br

Métodos

• Índices de agregação

• Métodos de quantificação da dependência especial– Correlograma

– Variograma

• Métodos de interpolação (mapas)– Determinísticos

– Estocásticos

21:04 Geoestatística 2

Amostragem espacial

21:04 Estatística Espacial 3

10 15 20 25 30

30

40

50

60

70

Aleatória

Coord. x

Coord

. y

10 15 20 25 30

30

40

50

60

70

Aleatória Estratificada

Coord. x

Coord

. y

10 15 20 25 30

30

40

50

60

70

Sistemática

Coord. x

Coord

. y

Referenciamento vs Georreferenciamento

21:04 Geoestatística 4

• Estudos em áreas experimentais ou pequenas áreas podem ser apenas referenciados em relação a um ponto de referência.

• A distância euclidiana pode ser utilizada como medida de distância.

• Georreferenciamento significa referenciar os pontos amostrais em relação a algum sistema geográfico de informação, como:– Sistema UTM

– Sistema Lat-Long.

Exemplo 1Densidade populacional

Pratylenchus brachyurus (1000 x nematóides/dm³ solo) em área

de produção de soja

21:04 Geoestatística 5

Coord. x Coord. y Dens.74 123 272 93 372 62 172 31 172 0 248 0 248 31 348 62 448 93 348 123 424 123 424 93 524 62 324 31 324 0 40 0 60 31 70 62 70 93 80 123 6

0 20 40 60

02

04

06

08

01

00

12

0

x

y

Índice de agregação de Morisita

21:04 Geoestatística 6

==

==

=n

i

i

n

i

i

n

i

i

n

i

i

yy

yy

nI

1

2

1

11

2

em que: n é o número de pontos amostrais e yi

é o valor observado no i-ésimo ponto. De

acordo com Morisita (1962), Ia = 1 indica

distribuição aleatória, Ia < 1 indica distribuição

regular e Ia > 1 indica distribuição agregada.

Obs.: índices de agregação não consideram a dependência espacial dos dados.

Teste e Correlograma de Mantel

21:04 Geoestatística 7

.

30 40 50 60 70 80-0

.3-0

.2-0

.10

.00

.10

.2

Distance class index

Ma

nte

l co

rre

latio

n

Baseia-se na correlação entre a matriz A de distâncias geográficas e a

matriz B de distânciasecológicas/biológicas.

O TESTE de Mantel (1967) baseia-se na aleatorização dos elementos da

matriz B.

O correlograma é construído atravésde lags de distância.

Interpolação pelo método IQD

21:04 Geoestatística 8

.

Grid amostral vs Grid de predição.

IQD: Inverso do Quadrado das Distâncias.

Método determinístico: não quantifica a incerteza das predições.

0 20 40 60

02

04

06

08

01

00

12

0

x

y

𝑌 𝒙 =

𝑖=1

𝑛Τ𝑌𝑖 𝑑𝑖

2

1

𝑑𝑖2

INTRODUÇÃO À GEOESTATÍSTICA

Exemplo de Introdução

Num estudo sobre compactaçãodo solo de uma área de cerca de3500 m², foram coletados dadosde resistência do solo àpenetração (MPa), de acordocom o grid semi-regular ao lado.

• Valores de resistência à penetração espacialmente próximos são semelhantes?

• Até que distância podemos afirmar isso?

• É possível predizer valores em locais não amostrados?

21:04 10Geoestatística

0 20 40 60 80

0

10

20

30

40

50

60

Coord. X (m)

Coord

. Y

(m

)

EN

W S

17º29'23'' S, 48º13'02'' W

Como é feita uma análise geoestatística?

21:04 11Geoestatística

Preparação do data set

• estatísticadescritiva

• Detecção de outliers

Estrutura de dependênciaespacial

• Correlogramas

• Semivariogramas

Prediçãoespacial

• Krigagem

Análise da dependência espacial

21:04 12Geoestatística

• Usualmente feita através de variogramas ou semivariogramas– Semivariância = variância / 2

• A idéia é identificar a dependênciapela variabilidade dos dados em umadeterminada distância ou classe de distância.

• Se há dependência espacial, pontosmais próximos apresentam maiorcorrelação ou covariância, ou menorvariabilidade

• Dizemos então que a covariância é função da distância apenas

0 20 40 60 80

0

5

10

15

0 - 20 cm

Distância (m)S

em

ivariância

0 20 40 60 80

0

1

2

3

4

5

20 - 40 cm

Distância (m)

Sem

ivariância

Como obter um semivariograma?

21:04 13Geoestatística

0 20 40 60 80

0

5

10

15

0 - 20 cm

Distância (m)S

em

ivariância

0 20 40 60 80

0

1

2

3

4

5

20 - 40 cm

Distância (m)

Sem

ivariância

A semivariância de um conjunto de pontosseparados por uma distância d é calculadapor meio de:

=

+−=)(

1

2)()(

)(2

1)(

dN

i

ii dszszdN

d

Como obter um semivariograma?

23:48 14Geoestatística

Exemplo prático:

Dados de teor de potássio no solo (mmolc/dm³)

0.5 1.0 1.5 2.0 2.5 3.0 3.5

0.5

1.0

1.5

2.0

2.5

3.0

3.5

x

y1.5 1.1 0.9

1 0.8 0.7

0.8 0.7 0.85

Pressuposições

21:04 15Geoestatística

• Considere z(x) a realização da variável Z indexada pelo vetor de coordenadas x (2 ou 3D).

• z(x) é considerada uma variável contínua

• Há n realizações (observações)

• Vamos assumir:

– Estacionariedade: a variabilidade é (praticamente) a mesma em qualquerparte da área amostrada

– Isotropia: o grau de dependência espacial entre os valores z(x) é (praticamente) o mesmo em qualquer direção da área

– z(x) tem distribuição normal

Análise da dependência espacial

23:00 16Geoestatística

Dizemos que dois pontos, zi e zj, separados pela distância d apresentam a seguinte variância:

Dois modelos usuais para a correlação espacial são o exponencial e o gaussiano:

Var 𝑧𝑖 , 𝑧𝑗 = 2𝜏2 + 2𝜎2{1 − 𝐶𝑜𝑟 𝑧𝑖 , 𝑧𝑗 }

1

2𝑉𝑎𝑟 𝑧𝑖 , 𝑧𝑗 = 𝛾, 𝑎 𝒔𝒆𝒎𝒊𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎

𝐶𝑜𝑟 𝑧𝑖 , 𝑧𝑗 = exp(−𝑑ϕ)

𝐶𝑜𝑟 𝑧𝑖 , 𝑧𝑗 = exp(− 𝑑ϕ

2

)

Análise da dependência espacial

21:04 17Geoestatística

Temos, então, os seguintes parâmetros para o modelo de semivariância:

Os modelos de semivariância são ajustados

a partir da estimação dos três parâmetros.

Dentre os métodos de estimação, destaca-se o

método da máxima verossimilhança.

Uma vez ajustado o modelo, é possível

realizar predição espacial.

𝜏2: efeito pepita ou variação ao acaso

Φ: parâmetro de alcance

𝜎2: variação espacial

0 20 40 60 80

0

5

10

15

0 - 20 cm

Distância (m)

Sem

ivariância

0 20 40 60 80

0

1

2

3

4

5

20 - 40 cm

Distância (m)

Sem

ivariância

Grau de aleatoriedade

22:38 18Geoestatística

GA < 0,15: Baixa aleatoriedade

0,15 ≤ GA ≤ 0,30: Aleatoriedade significativa

GA > 0,3: Aleatoriedade muito significative

O extremo da aleatoriedade é o “efeito pepita puro”.

GA=𝜏2

𝜎2

Krigagem

23:07 19Geoestatística

• É o método de predição espacial, isto é, o processo de interpolação de dados.

• Nada mais é do que um modelo de regressão. Uma combinação linear ponderada de valores.

• Alguns tipos de krigagem são:– Ordinária

– Simples

– Universal

– Co-krigagem

መ𝑍(𝒙)𝐾𝑂 =

𝑖=1

𝑛

𝜔𝑖 𝑍𝑖(𝒙)

Em que wi são pesos ótimos obtidosde acordo com o modelo de variograma.

Exercícios

21:04 20Geoestatística

1. Consulte o site do Inmet Goiás e construa um banco de dados deprecipitação (mm), temperatura máx, umidade do ar (%) fornecidos pelasestações automáticas de todas as cidades, e dados de lat/long. Construaum mapa de predição especial para cada variável pelo método IQD.

2. Tente ajustar um modelo de variograma para os dados de nematóidesapresentados como exemplo. Interprete os valores do modelo devariograma. Calcule o grau de aleatoriedade. Construa um mapa atravésda krigagem ordinária.

3. (Para nota da disciplina) Faça uma resenha (max. 1 página) sobre aanálise estatística realizada no artigo: Ribeiro Jr. et al. (2009) SPATIALPATTERN DETECTION MODELING OF THRIPS (Thrips tabaci) ON ONIONFIELDS. Sci. Agric., v.66, n.1, p.90-99.

Bibliografia

Legendre, P.; Legendre, L. (2012) Numerical Ecology. 3rd ed. Elsevier.

Yamamoto, J.K.; Landim, P.M.B. (2013) Geoestatística: conceitose aplicações. Oficina de Textos.

21:04 Geoestatística 21