ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma...
Transcript of ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma...
1
ANÁLISE VARIOGRÁFICA
1 2
A Geoestatística é baseada nos seguintes conceitos: •Funções aleatórias •Variável regionalizada •Estacionariedade
3
No espaço (2D) ocorrem infinitos valores de uma variável. Por amostragem obtem-se diversos resultados dessa variável.
𝒗𝒂𝒓𝒊â𝒏𝒄𝒊𝒂 = 𝒔𝟐 = 𝒙𝒊 − 𝒙
𝒏 − 𝟏 𝟐
𝒄𝒐𝒗𝒂𝒓𝒊â𝒏𝒄𝒊𝒂 = 𝒄𝒐𝒗 = 𝒙𝒊 − 𝒙 (𝒚𝒊 − 𝒚 )
𝒏 − 𝟏
média =
2
Variável aleatória e função aleatória
Cada ponto no espaço não apresenta um único valor, mas uma distribuição de probabilidades de ocorrência de valores
No ponto x a propriedade Z(x) é uma variável aleatória com média m, variância s2 e uma função específica de distribuição acumulada.
No espaço existem infinitos pontos xi, i = 1,2, ..., Z(xi), com suas próprias funções de distribuição
O conjunto de variáveis aleatórias constituem uma função aleatória, ou processo aleatório, ou processo estocástico.
5
Christakos, Olea, Serre, Yu, Wang (2005) – Interdisciplinary public health reasoning and epidemiologic modelling: Springer
6
•Uma variável aleatória é entendida como uma única realização de uma função casual e não diversos resultados de uma única variável casual. •Uma realização é o conjunto de valores que surge após a obtenção de um resultado para cada distribuição. •O conjunto de valores reais de Z que inclui a realização da função aleatória é conhecido como variável regionalizada. •No estudo do comportamento das variáveis regionalizadas, entendidas como resultantes de um processo aleatório, a ferramenta básica é a análise da continuidade espacial. •Para descrever a variação existente associada ao processo aleatório, deve-se supor que os valores da variável regionalizada obtidos em lugares próximos tendem a ser autocorrelacionados.
7
Momentos considerados na função aleatória em Geoestatística Linear: média e variância
Momento de primeira ordem: Média = E{Z(x)} = m(x) Momentos de segunda ordem: Variância (Covariância) Correlação Variograma (semivariograma) Todos em função da localização espacial (vetor h) Os pares de valores referem-se à mesma variável, obtidos em locais com distâncias “h(lag)”, ou seja Z(x)/head” e Z(x+h)/tail
8
3
9
Covariância:
𝑪 𝒉 =𝟏
𝑵 𝒉 𝒛 𝒖𝜶 ∙ 𝒛 𝒖𝜶 + 𝒉 − 𝒎𝟎 ∙ 𝒎+𝒉
𝑵 𝒉 𝜶=𝟏
Correlação: 𝝆 𝒉 =𝑪 𝒉
𝝈𝟎∙𝝈+𝒉
Semivariância: 𝜸 𝒉 =𝟏
𝟐𝑵 𝒉 [𝒛 𝒖𝜶 + 𝒉 − 𝒛 𝒖𝜶 ]𝟐
𝑵 𝒉 𝜶=𝟏
𝒎𝟎 =𝟏
𝑵 𝒉 𝒛 𝒖𝜶 𝒎+𝒉 =
𝟏
𝑵 𝒉 𝒛 𝒖𝜶 + 𝒉
𝑵 𝒉
𝜶=𝟏
𝑵 𝒉
𝜶=𝟏
𝝈𝟎 =𝟏
𝑵 𝒉 [𝒛
𝑵 𝒉 𝜶=𝟏 (𝒖𝜶 − 𝒎𝟎]²
𝝈+𝒉 =𝟏
𝑵 𝒉 [𝒛
𝑵 𝒉 𝜶=𝟏 (𝒖𝜶 + 𝒉 −𝒎+𝒉]²
10
Covariância e Correlação são medidas de similaridade entre valores de Z(x) e Z(x+h). Semivariância é uma medida de dissimilaridade entre valores de Z(x) e Z(x+h)
Variável regionalizada (V.R.)
Apresenta duas características:
Característica “aleatória”: irregularidade e variação imprevisível de um ponto para outro
Característica “estrutural”: ligações existentes entre os pontos no espaço, motivadas pela gênese do fenômeno natural.
É impossível prever com exatidão o teor de um poluente na pluma de contaminação (aspecto aleatório), mas é provável que se encontre um alto teor de um poluente perto de outro alto teor (aspecto estrutural),
11
Como definir e, por conseqüência, prever o comportamento espacial da variável regionalizada?
A natureza estrutural de um conjunto de dados da variável regionalizada é definida a partir da comparação de valores obtidos entre dois pontos, segundo uma determinada direção.
12
4
O conjunto de variáveis aleatórias Z(xi), i = 1, 2, ...N, correlacionadas entre si constituem uma função aleatória da qual se conhece apenas uma realização z(xi), ou seja o conjunto dos dados experimentais. Com uma só realização é teoricamente impossível determinar quaisquer parâmetros, como média ou variância, da função. A solução consiste em assumir restrições segundo diversos graus de estacionariedade da função aleatória.
13
Uma variável regionalizada obedece a uma estacionariedade de 1ª ordem quando seus atributos são invariantes por translação. Se for admitido que todas as variáveis aleatórias tenham a mesma media, este parâmetro passa a ser independente da localização de xi e pode ser estimado pela média aritmética dos valores das realizações das variáveis aleatórias: E{Z(x1)}= E{Z(x2)}=... E{Z(xi)}= E{Z(x)}= m Essa hipótese estar correta significa supor que a média das amostras seja representativa da área estudada, ou seja, que os valores não homogêneos. A homogeneidade espacial dificilmente ocorre, sendo necessário a verificação da variabilidade presente.
N
i
ixZN
m1
)(1
A hipótese de estacionariedade de 2ª ordem alem de definir que a esperança matemática, E{Z(x)}, existe e não depende do suporte x, define também que a correlação entre duas variáveis aleatórias depende somente da distância espacial, h, que as separa e é independente da sua localização: E{Z(x)} = m Covariância= C(h)=E{Z(x+h)*Z(x)}-m2, onde h representa um vetor de coordenadas. Como a covariância depende do tamanho do vetor h, se h=0, C(h) passará a representar a variância (C(0)). Var{Z(x)}=E{[Z(x)-m]2}=C(0). A função variograma é definida como a variância do incremento [Z(x+h)–Z(x)]:
(h)= E{[Z(x+h)-Z(x)]2}=C(0)-C(h).
A hipótese de estacionariedade de 2ª ordem assume a existência da variância e, portanto, de uma variância a priori finita. Existe fenômenos físicos com uma capacidade infinita de dispersão nos quais não se pode definir a priori nem a covariância nem a variância. Hipótese intrínseca: se a media pode não ser constante, para intervalos pequenos de h, as diferenças esperadas poderiam ser zero: E[Z(x) – Z(x+h)] = 0 Alem disso substitui a covariância pela variância das diferenças como medida de relação espacial, assumindo a existência e estacionariedade do variograma. Para todos os vetores h o incremento [Z(x+h) – Z(x)] tem uma variância finita, a qual não depende do suporte x: Var{Z(x+h) – Z(x)} = E{[Z(x+h) – Z(x)]2=2 (h).
5
Como (h) = C(0) - C(h) se o vetor h for infinitamente pequeno, a variância é mínima e a covariância máxima. Haverá um valor Δh para o qual ambas podem apresentar valores aproximadamente iguais, porém, à medida que Δh aumenta a covariância diminui enquanto a variância aumenta, porque ocorre progressivamente maior independência entre os pontos a distâncias cada vez maiores. A variância distribui-se assim de 0, quando h=0, até um valor igual à variância das observações para um alto valor de h, se os dados forem estacionários, isto é, não ocorrer a presença de tendência nos valores.
Essas relações são mostradas quando a função (h) é colocada em gráfico contra h para originar o variograma. A distância segundo a qual (h) atinge um patamar, denominado soleira ou sill, igual à variância à priori dos dados, é chamada de alcance (a) ou amplitude (range). A variância não é apenas igual à média das diferenças ao quadrado entre pares de pontos espaçados segundo distâncias h, mas também é igual à variância dessas diferenças.
Estacionariedade de 1ª Ordem:
Lei de distribuição é invariante por translação
µ = E[Z(x)]
Estacionariedade de 2ª. Ordem ou estacionaridade fraca:
Quando x1 e x2 coincidem: s2=E[{Z)-m}2]
Quando x1 e x2 não coincidem, para qualquer par de pontos x1 e x2 separados pelo vetor h=xi-xj:
C(xi,xj)=E[{Z(xi)-m}{Z(xj)-m}]
Constância da média, variância e covariância dependem apenas da separação ‘h’ e não das posições absolutas.
19
Hipótese intrínseca
Admite que os incrementos [Z(x)-Z(x+h)] sejam fracamente estacionários, i.e., independentes de x e dependentes apenas da distância e da orientação entre os pontos.
E[Z(x) – Z(x+h)] = 0 (estacionariedade de 1ª ordem)
No lugar de covariância, variância:
Var[Z(x) – Z(x+h)] = E{[Z(x) – Z(x+h)]}2 = 2(h)
Função variograma 2γ(h): esperança matemática do quadrado da diferença entre os valores de pontos no espaço, separados por uma distância h.
20
6
Para a obtenção de um variograma é suposto que a variável regionalizada tenha um comportamento fracamente estacionário, onde os valores esperados, assim como sua covariância espacial, sejam os mesmos por uma determinada área.
Assume-se, desse modo, que os valores dentro da área de interesse não apresentem tendência que possam afetar os resultados.
21
(h) = C(0) - C(h)
22
Covariância e Correlação são medidas de similaridade entre valores de Z(x) e Z(x+h). Semivariância é uma medida de dissimilaridade entre valores de Z(x) e Z(x+h).
Variograma teórico
Variograma ou semi-variograma?
Variância das diferenças entre dois valores em pontos separados por h.
Na prática, o interesse é pela metade disso (semi) que fornece a variância por ponto, quando os pontos são considerados aos pares
23 24
Diagrama de dispersão com um ponto com coordenadas (Z(x+h),Z(x)). Esse ponto é projetado na reta bissetriz e resulta na ordenada Z(x+h); em seguida, determina-se a distância entre o ponto original e a reta bissetriz (vetor em vermelho). Esses três pontos formam um triângulo retângulo, cuja hipotenusa é a diferença em módulo entre Z(x+h) e Z(x). Sendo o i-ésimo par de coordenadas (Z(x+h),Z(x)), a distância para a reta bissetriz pode ser calculada: di =|Z(x+h)-Z(x)|.cos45º Elevando a i-ésima distância ao quadrado tem-se: di²= ½[Z(x+h)-Z(x)]²
Considerando n pares de pontos, para uma determinada distância h, pode-se calcular a média das distâncias, chamada por Journel (1989) de momento de inércia: Quanto maior a dispersão, maior o momento de inércia e menor a correlação. Se não houver dispersão, isto é, todos os pares de pontos caírem sobre a reta 45º, o momento de inércia é zero e o coeficiente de correlação é igual a 1 (máxima correlação). Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos em um diagrama de dispersão. Como o variograma também usa a fórmula do semi-variograma, é indiferente denominar variograma ou semi-variograma.
7
Gráfico para o variograma: valores de , em ordenada, e “h”, na abcissa.
25
Preferência pelo Variograma
• O variograma pode ser utilizado para modelar fenômenos não estacionários e a covariância não, pelo não conhecimento da média. .
• Quando a média é constante, mas não conhecida, não se torna necesaria para o cáculo do variograma, mas sim para o cálculo da covariância.
•Se a função tem variância infinita (não estacionária), a covariância não esta definida em 0, mas o variograma sim e é tambem nulo.
1x2x 3x
4x 5x 6x
h
Dados igualmente espaçados: 1D
27
Dados igualmente espaçados: 2D
44 42 45 37 34 12 34 56
55 33 23 45 56 34 33 45
29 37 48 39 40 45 64 44
66 23 27 45 45 34 33 28
56 41 90 42 38 45 56 66
44 23 23 45 45 44 87 56
1 2 3 4 5 6 7 8
0
1
2
3
4
5
E-W
N-S
NE-SW
NW-SE
28
8
Dados irregularmente espaçados: 2D
• Pode ocorrer que não existam valores da variável na distância h
• Pode ocorrer que não existam valores na direção θ
29
Correção para regularizar a malha
30
31 32
9
33
Distância Leste-Oeste Norte-Sul
h Np h Np
0,5 0,028 8 0,028 11 1,0 0,043 18 0,097 15 1,5 0,051 12 0,069 13 2,0 0,047 12 0,147 7 2,5 0,158 6 0,216 9 3,0 0,015 5 0,133 3 3,5 0,104 4 0,178 3
Variograma experimental mínimo de 30 (50?, 100?) pares remoção de valores anômalos maior h, a metade da maior distância existente entre
os pontos. grau de casualidade dos dados, E = Co/C
E<0,15: componente aleatória pequena 0,15 < E < 0,30: componente aleatória significante E > 0,30: componente aleatória muito significativa
extremo do grau de casualidade é o modelo de pepita pura, onde não ocorre covariância entre os valores e a análise semivariográfica não se aplica
iniciar com semivariograma omnidirecional
34
35
Efeito pepita
(h)
0
Mínimo alcance(range) detectavel = d
h d
Distancia entre pontos = d
x x x x
x x x x
x x x x
d
36
10
Modelagem
37
Processo que envolve várias tentativas e durante o qual a experiência pesa muito
Necessidade de ajustar uma função matemática que descreva continuamente a variabilidade ou correlação espacial nos dados
O variograma experimental não serve para esse fim, porque há necessidade de interpolação e os pontos apresentar-se-ão com uma certa dispersão, principalmente para distâncias grandes, quando o número de pares de amostras diminui.
• O variograma experimental não avalia distâncias e direções intermediárias
• Uma interpolação entre pontos do variograma
experimental não garante a existência e unicidade de
solução para o sistema de krigagem
38
Variograma teórico
Ajuste do variograma experimental a um modelo
variográfico teórico Comparação visual Técnicas de ajuste automático:
Método dos mínimos quadrados Critério AIC (Akaike Information Criterion) Critério Cressie Critério Variowin, etc.
Validação cruzada
39
Validação cruzada Depois de obtido o modelo variográfico, cada valor original é removido do domínio espacial e, usando-se os demais, um novo valor é estimado para esse ponto. Desse modo, um gráfico pode ser construído mostrando a relação entre valores reais e estimados. A validação cruzada, porém, não prova que o modelo escolhido é o mais correto, mas sim que o mesmo não é inteiramente incorreto. A melhor verificação, então, é aquela resultante do confronto entre os valores estimados e a realidade de campo.
40
11
Modelos de variogramas
As funções matemáticas dos modelos devem permitir que a matriz de covariâncias, neles baseada, possa ser invertida, para fornecer os “pesos” para a interpolação por krigagem.
Desse modo, somente certos modelos podem ser usados.
41
Modelo Esférico
42
Modelo Exponencial
43
Modelo Gaussiano
44
12
Modelo Potência
45
Modelo Efeito Pepita Puro
Va
rio
gra
ma
Distancia
S
Este modelo representa um
fenômeno completamente
aleatório, no qual não ha
correlação espacial
46
A interpretação do variograma permite obter parâmetros que descrevem o comportamento espacial das variáveis regionalizadas.
Uma feição resultante da análise dos parâmetros do variograma experimental é a zona de influência: qualquer valor de Z(x) estará correlacionado com outros valores Z(x+h) que estiverem dentro de um raio "a" de x. Esta correlação, ou a influência de um valor em outro, decresce conforme Z(x+h) aproxima-se de "a".
O variograma é utilizado para calcular os valores de variância, para uma dada distância, os quais são necessários para a organização do sistema de equações da krigagem.
47
Para a utilização do variograma as seguintes suposições básicas são requeridas:
a) as diferenças entre pares de valores de amostras são determinadas apenas pela orientação espacial relativa dessas amostras;
b) o interesse é enfocado apenas na média e na variância das diferenças, significando que esses dois parâmetros dependem unicamente da orientação (hipótese intrínseca);
c) por conveniência assume-se que os valores da área de interesse não apresentam tendência que possa afetar os resultados e assim a preocupação será apenas com a variância das diferenças entre valores das amostras.
48
13
Análise variográfica
Os variogramas expressam o comportamento espacial da variável regionalizada e mostram:
a) o tamanho da zona de influência em torno de uma amostra, pois toda amostra cuja distância ao ponto a ser estimado for menor ou igual ao alcance, fornece informações sobre o ponto;
b) a anisotropia, quando os variogramas mostram diferentes comportamentos para diferentes direções de linhas de amostragem e de estudo da variável; geométrica quando o alcance varia de acordo com as diversas direções consideradas, mantendo constante a soleira; zonal quando o alcance permanece constante e a soleira varia conforme for modificada a direção;
49
c) presença de descontinuidade inicial, em que para h 0, (h) já apresenta algum valor (efeito pepita (nugget effect); pode ser atribuído a erros de medição ou ao fato de que os dados não foram coletados a intervalos suficientemente pequenos para mostrar o comportamento espacial subjacente do fenômeno em estudo; d) pela forma : 1) se estabiliza ao longo do patamar, indica um processo estacionário de segunda ordem; 2) se cresce indefinidamente, ou seja, sem estabilizar ao longo do patamar, indica presença de tendência nos dados; 3) se com h 0, (h) apresenta já algum valor e permanece nesse nível, indica efeito pepita puro, ou seja que os valores não apresentam autocorrelação espacial.
50
Anisotropias
Variograma experimental ao ser calculado para distintas
direções apresenta distintos comportamentos
Anisotropia geométrica
Anisotropia zonal
51
Anisotropía Geométrica :
Variogramas com distintas direções apresentam distintos alcances, porém com o mesmo patamar
0
0,5
1
1,5
2
2,5
3
0,0 0,9 2,0 3,0 4,1 5,1 6,2 7,2 8,3 9,3 10,4 11,4
Vari
og
ram
a
Distancia
N-S
E-O
Maior continuidade espacial na direção com maior alcance
Menor continuidade espacial na direção de menor alcance
52
14
Anisotropía Zonal :
Variogramas em distintas direções apresentam distintos patamares para o mesmo alcance
Presença de diferentes estruturas
0
0,5
1
1,5
2
2,5
3
3,5
0 0,94 1,99 3,04 4,09 5,14 6,19 7,24 8,29 9,34 10,3911,44
Vari
og
ram
a
Distancia
Anisotropía Zonal
53 54
Fatores que podem afetar a confiabilidade no variograma experimental:
• Tamanho da amostra • Intervalo de amostragem e escala espacial • Intervalo do “lag” • Função de distribuição dos valores • Anisotropia • Presença de tendência
55
EXERCÍCIO 02. Análise variográfica No Exercício 01 a matriz de dados era composta por 359 pontos. Posteriormente foi realizado um sorteio reduzindo a matriz para 100 pontos, conforme listagem anexada. Construir variogramas experimentais para as três variáveis geoquímicas com dados tanto do exercício 01 como deste exercício. Comparar os resultados. Modelar os variogramas construidos para 359 pontos. Verificar para cada caso se a soma dos valores de “nugget” + “sill” equivale à variância amostral. Explicar por que.
56
Encontrar os variogramas experimentais apenas para a variável Pb (359 valores) nas seguintes direções: 0º, abertura 90º (omnidirecional) 45º, abertura 90º (omnidirecional) 90º, abertura 90º (omnidirecional) 135º, abertura 90º (omnidirecional) 0º, abertura 20º 45º, abertura 20º 90, abertura 20º 135, abertura 20º Comparar os resultados e explicá-los.