Post on 12-Nov-2018
ESTIMATIVA DA DISTRIBUIÇÃOESPACIAL DE RETENÇÃO DE ÁGUA
EM UM SOLO UTILIZANDOKRIGAGEM INDICATRIZ
Cassio Freitas Pereira de AlmeidaPaulo Justiniano Ribeiro Junior
Relatório Técnico do Laboratório de Estatística
Departamento de Estatística
Universidade Federal do Paraná
Curitiba1996
ii
Sumário:
1- Descrição....................................................................................................... 012 - Modelagem Probabilística e Estacionaridade............................................... 043 - Descrição e Modelagem de Variabilidade Espacial...................................... 064 - Krigagem....................................................................................................... 11
4.1 - Krigagem Ordinária......................................................................... 124.2 - Krigagem Indicatriz.......................................................................... 17
5 - Resultados.................................................................................................... 256 - Referências Bibliográficas............................................................................. 297- Anexos
7.1 Anexo 1............................................................................................. 317.2 Anexo 2 ............................................................................................ 34
1
1- Descrição:
O conhecimento da variabilidade espacial dos atributos físico-hídricos do
solo é um dos fatores que pode viabilizar o manejo do solo e da água numa
agricultura irrigada.
A preocupação com o tema não é recente como mostram os artigos de
Waynick (1918 e 1919). Após um período onde a ênfase era nos delineamentos
experimentais, onde normalmente utilizavam-se blocos como forma de “controlar”
a variabilidade, os estudos que buscam compreender as relações de dependência
espacial ganharam novo impulso com o desenvolvimento e formalização das
técnicas geoestatísticas.
Notadamente a partir da década de 80 diversos trabalhos vem sendo
publicados na área de solos, como por exemplo os de Vieira (1981 e 1983),
Webster (1985) e a publicação Geoderma: an International Journal of Soil Science
onde o v. 62 (1994) dedicou-se exclusivamente ao tema.
Um experimento realizado e descrito por Moraes (1991) visou o estudo da
heterogeneidade hidráulica de uma terra roxa estruturada onde foram verificadas
as seguinte hipóteses: (1a.) há que se modificar o procedimento operacional
corrente do funil de Haines e câmara de pressão de Richards para a obtenção da
curva característica contemplando os vários tipos de problemas que ocorrem
desde a coleta da amostra até a elaboração da curva; (2a.) o solo utilizado pode
apresentar variabilidade que independentemente da metodologia utilizada, desde
que uniforme durante as análises, deverá manifestar-se pela análise estatística e
interpretação física dos fenômenos. Posteriormente os dados da variável
densidade foram utilizados por Ribeiro Jr. (1995), no estudo da variabilidade
espacial de parâmetros de solo apresentando e discutindo conceitos
geoestatísticos como: análise descritiva espacial, variografia, krigagem ordinária
e validação cruzada.
Este experimento será aqui descrito sucintamente, maiores detalhes
podem ser encontrados em Moraes(1991).
O experimento refere-se a uma área localizada no campo experimental do
Departamento de Física e Meteorologia do campus da Escola Superior da
2
Agricultura "Luiz de Queiroz" da Universidade de São Paulo, no município de
Piracicaba, Estado de São Paulo. A área experimental possui um relevo suave,
com solo classificado como Terra Roxa Estruturada Latossólica, com dimensões
de 125m por 50m.
Nesta área foi tomada uma amostra sistemática de tamanho 250. Foram
coletadas amostras de solo a uma profundidade de 25cm e com espaçamento
regular de 5m resultando numa malha de pontos amostrados de 25 linhas por 10
colunas como mostra a Figura 1:
25• 50• 75• 100• 125• 150• 175• 200• 225• 250• 24• 49• 74• 99• 124• 149• 174• 199• 224• 249• 23• 48• 73• 98• 123• 148• 173• 198• 223• 248• 22• 47• 72• 97• 122• 147• 172• 197• 222• 247• 21• 46• 71• 96• 121• 146• 171• 196• 221• 456• 20• 45• 70• 95• 120• 145• 170• 195• 220• 245• 19• 44• 69• 94• 119• 144• 169• 194• 219• 244• 18• 43• 68• 93• 118• 143• 168• 193• 218• 243• 17• 42• 67• 92• 117• 142• 167• 192• 217• 242• 16• 41• 66• 91• 116• 141• 166• 191• 216• 241• 15• 40• 65• 90• 115• 140• 165• 190• 215• 240• 14• 39• 64• 89• 114• 139• 164• 189• 214• 239• 13• 38• 63• 88• 113• 138• 163• 188• 213• 238• 12• 37• 62• 87• 112• 137• 162• 187• 212• 237• 11• 36• 61• 86• 111• 136• 161• 186• 211• 236• 10• 35• 60• 85• 110• 135• 160• 185• 210• 235• 9• 34• 59• 84• 109• 134• 159• 184• 209• 234• 8• 33• 58• 83• 108• 133• 158• 183• 208• 233• 7• 32• 57• 82• 107• 132• 157• 182• 207• 232• 6• 31• 56• 81• 106• 131• 156• 181• 206• 231• 5• 30• 55• 80• 105• 130• 155• 180• 205• 230• 4• 29• 54• 79• 104• 129• 154• 179• 204• 229• 3• 28• 53• 78• 103• 128• 153• 178• 203• 228• 2• 27• 52• 77• 102• 127• 152• 177• 202• 227• 1• 26• 51• 76• 101• 126• 151• 176• 201• 226•
Figura 1: Representação da área experimental com os pontos amostrados.
Em cada ponto foram medidos os valores das seguintes variáveis:
densidade, teor de água às tensões de 5, 10, 60, 100, 306, 816, 3060 e 15300 cm
de coluna de água (cca).
Neste trabalho foram considerados os teores de água às tensões de 306
e 15300 cca relacionados com capacidade de campo e o ponto de murcha
permanente respectivamente.
O objetivo é aplicar a metodologia geoestatística, em particular a
krigagem indicatriz, para verificação da distribuição espacial para cada uma das
variáveis obtendo-se mapas que representem os valores médios, probabilidades
3
de obtenção de um valor de umidade maior que uma determinado valor de
referência e valores de umidade dado uma probabilidade fixada (quantis). Além
disso, acrescentou-se de forma resumida os conceitos básicos de geoestatística.
O capítulo 1 trata da modelagem probabilística e estacionaridade, o capítulo 2da descrição e modelagem da estrutura de variabilidade espacial, capítulo 3 da
krigagem ordinária e krigagem indicatriz e no capítulo 4 um exemplo completo de
aplicação da krigagem indicatriz.
4
2- Modelagem Probabilística e Estacionaridade:
Seja uma região onde em certos pontos foram extraídas amostras e feitas
medidas das variáveis mencionadas. Desta amostra resulta um conjunto de dados
espacialmente distribuídos, ou seja, medidas de um atributo acompanhadas de
suas coordenadas. Estas coordenadas permitem o cálculo de distâncias
(euclidianas) entre os pontos observados.
Para cada ponto xi amostrado tem-se uma variável aleatória Z distinta,
considera-se este conjunto de variáveis aleatórias um processo estocástico,
descrito da forma:
{ }Z(x ):x Did∈ ⊂ℜ , (1)
onde,
Z é a variável aleatória que varia continuamente em D;
x é a posição da variável, considerada fixa;
D é a região em estudo;
ℜd é o espaço d-dimensional (d=1, 2, 3 ou 4).
Quando d=1 os dados estão em uma transição, para d=2 em um plano e
para d=3 em um volume. Pode-se ainda considerar o tempo.
O conjunto de dados obtidos da amostragem mencionada é uma realização
{z(xi):x ∈ ⊂ ℜD 2 } do processo descrito em (1).
Nota-se que o resultado da amostragem para cada variável aleatória é
composto de uma única realização em cada ponto e portanto de cada variável, o
que torna impossível qualquer tipo de inferência sobre este processo. Isto faz com
que algum tipo de estacionaridade, condizente com o problema em questão, deva
ser assumido, de forma a possibilitar estimação de ao menos os dois primeiros
momentos da distribuição da variável aleatória, que em geral estão relacionados
com as propriedades de interesse tais como: média, correlação, covariância e de
semivariância.
5
A forma de estacionaridade usualmente assumida na análise geoestatística
é a chamada hipótese intrínseca e é definida pela condições:
i) { }E Z x Z xi h i( ) ( )+ − = 0 , (2)
ii) { }E Z x Z x hi h i[ ( ) ( )] ( )+ − =2 2γ , (3)
onde:
γ(h) é a semivariância que deve ser independente da posição dos pontos,
sendo função apenas da distância entre eles e que será discutida com mais
detalhes posteriormente.
Esta hipótese é um tipo de estacionaridade dos incrementos, que é
formulada sob a variável aleatória:
g(h) = [Z(x+h) - Z(x)],
ou seja, as diferenças entre as variáveis separadas pela distância ¨h¨.
Portanto na situação aqui considerada espera-se que os dados sejam uma
realização de um processo estocástico ao menos intrinsecamente estacionário.
Existem situações mais gerais no que diz respeito a forma de
estacionaridade que não serão discutidas aqui e que podem ser encontradas em
Isaaks & Srisvastava (1989) e Cressie (1991).
6
3- Descrição e Modelagem da Variabilidade Espacial:
Assumida a estacionaridade (hipótese intrínseca) definida em (2) e (3) e
considerando que a associação das variáveis em pontos distintos é maior a
medida que se reduz a distância entre eles, o passo seguinte é descrever e
modelar estas relações entre distâncias e associação espacial.
Um exemplo de modelo que descreve tal comportamento é dado na Figura
1, onde γ(h) é uma medida de dissimilaridade.
Figura 2: Representação da associação das variáveis em pontos
distintos em função da distância que as separa.
Várias medidas se prestam a tal descrição tais como a autocovariância e
autocorrelação, usuais na análise de séries temporais. Na abordagem
geoestatística a medida normalmente utilizada é a semivariância. É importante
notar que, ao contrário da covariância e correlação, a semivariância é uma
medida de dissimilaridade, ou seja, é maior a medida que as variáveis estão
menos associadas. Esta medida exige uma hipótese de estacionaridade menos
restritiva em relação as outras medidas possíveis, como por exemplo a
covariância, que exige estacionaridade de segunda ordem Ribeiro Jr. (1995).
Portanto a semivariância pode ser utilizada em um maior número de situações
sendo definida a partir de (3) por:
[ ]γ ( ) ,( ) ( )h i jE z x z x=
−12
2
(4)
7
onde:
xi e xj indicam a posição dos pontos na região de estimação, separados por
uma distância h.
Observa-se ainda na Figura 2 que a função inicia no valor γ(0),
denominado efeito pepita ("nugget effect"). A função se estabiliza no valor γ(a)
que denomina-se patamar total e sua respectiva distância ¨a¨ é denominada
alcance ("range"). Denomina-se patamar (“sill”) a quantidade dada por: c= γ(a) -
γ(0). Deve-se tomar cuidado no uso de programas computacionais verificando se
requerem informações do patamar ou patamar total.
Em seu comportamento típico o valor do variograma aumenta a medida
que aumenta a distância de separação entre os pontos, até estabilizar-se. Pode-
se dizer então, que o grau de dissimilaridade mantém-se constante entre os
pontos com distância maior ou igual ao alcance.
O estimador obtido pelo método dos momentos é dado por:
[ ]$ ( )( )
( ) ( )γ hN h
z x z xi h i= −∑ +
12
2. (5)
Para melhor esclarecimento, segue um exemplo simplificado da estimação
da semivariância (exemplo 1).
8
Exemplo 1: Cálculo do semivariograma amostral.
Suponha o espaço D unidimensional onde foram amostrados cinco pontos como
segue:
•
z(x1)= 7
•
z(x2)= 9
•
z(x3)= 10
•
z(x4)= 11
•
z(x5)= 13
Figura 3: Amostras no espaço D
Considerando que as amostras foram tomadas em distâncias regulares de 1m,
procede-se então os cálculos das semivariâncias, segundo o estimador dado por
(5):
γ(1) = ½ *[ (7-9)2 + (9-10)2 + (10-11)2 + ( 11-13)2 ]/ 4 = 1.25
γ(2) = ½ *[ (7-10)2 + (9-11)2 + ( 10-13)2 ]/ 3 = 3.67
γ(3) = ½ *[ (7-11)2 + (9-13)2 ]/ 2 = 8
Fazendo o semivariograma tem-se:
Figura 4: Semivariograma estimado.
Em situações reais o variograma é obtido a partir de uma quantidade
razoável de pontos, de maneira geral não menos que 50.
9
Na Figura 5 tem-se um exemplo de um semivariograma estimado para um
conjunto de dados com número grande de observações num espaço
bidimensional, onde observa-se as estimativas de semivariância para as
distâncias possíveis no conjunto amostrado.
Figura 5 : Semivariograma estimado para um conjunto de dados hipotético.
No exemplo 1 estimou-se a semivariância nas distâncias de 1m, 2m e 3m,
não sendo possível fazer o mesmo para distâncias intermediárias tal como 2.5m.
Porém, muitas vezes necessita-se de um detalhamento maior da área amostrada,
sendo necessário estimar pontos intermediários para proceder uma interpolação,
o que exigirá o calculo de $γ (h) para distâncias que podem não coincidir com as
distâncias da amostra.
Para isso pode-se ajustar um modelo sobre os pontos do semivariograma
estimado. Este modelo pode ser ajustado "a sentimento", ou seja, é selecionado e
ajustado de modo que se sobreponha da melhor maneira possível aos pontos do
semivariograma estimado. Cressie (1991) discute outros métodos de ajuste. O
modelo ajustado pode posteriormente ser posto à prova através da validação
cruzada ,discutida em Davis (1987). A Figura 6 mostra um modelo ajustado para o
semivariograma da Figura 5.
10
Figura 6: Modelo ajustado sob um semivariograma estimado.
Os modelos para o variograma devem ser monótonos não decrescentes e
positivo definidos. Outras condições são citadas por Ribeiro Jr. (1995).
Os modelos mais comumente disponíveis nos ¨softwares¨ e na literatura
são: Gaussiano, Esférico, Exponencial e Linear. Suas expressões podem ser
encontradas em Isaaks & Srisvastava (1989).
O fenômeno estudado pode ou não apresentar estruturas de variabilidade
espacial diferentes conforme a direção tomada dentro da área. Estas diferenças
podem ser percebidas comparando os semivariogramas estimados para varias
direções. Quando esta estrutura de dependência espacial é a mesma para todas
as direções ( ou seja, h é considerado como escalar), o fenômeno é dito
isotrópico, caso contrário considera-se h um vetor e o fenômeno é dito
anisotrópico.
Os casos de anisotropia devem ser considerados na estimação das
semivariâncias e ajuste do modelo, o que acarreta em modelos com mais
parâmetros conforme discutido em Ribeiro Jr.(1995).
A etapa de ajuste do modelo de semivariograma é de grande importância e
pode influenciar resultados posteriores. Deve-se portanto, ter muita cautela
verificando todas as possibilidades de ajuste para que o modelo ajustado
escolhido se aproxime ao máximo do fenômeno real e consequentemente
estimativas a serem feitas sejam mais próximas da realidade.
11
4 - KRIGAGEM:
Na maioria das vezes o interesse da análise não se limita a obtenção de
um modelo de dependência espacial, desejando-se também predizer valores em
pontos não amostrados. O interesse, pode ser em um ou mais pontos específicos
da área ou obter uma malha de pontos interpolados que permitam visualizar o
comportamento da variável na região através de um mapa de isolinhas ou
desenho de uma superfície. Para se obter este maior detalhamento da área em
estudo é necessário um interpolador.
Entre os muitos métodos de interpolação existentes pode-se citar: método
poligonal, triangulação, médias locais das amostras e inverso do quadrado das
distâncias. De modo geral estes interpoladores citados são simples e de cálculo
relativamente fácil. Por outro lado, suas principais limitações são:
poligonal - estimativas locais descontínuas.
inverso do quadrado das distâncias - não considera a anisotropia, não limita a
vizinhança, não considera a configuração
da vizinhança.
triangulação - não considera a anisotropia.
médias locais - sensível a concentração de valores e não considera a distância
entre as amostras e o ponto a ser estimado.
A proposta geoestatística de interpolação é conhecida como krigagem.
Este interpolador pondera os vizinhos do ponto a ser estimado obedecendo os
critérios de não tendenciosidade e mínima variância. Existem diversos tipos de
krigagem: a simples, ordinária, universal, indicadora, probabilística, etc.
Para o entendimento deste interpolador proposto será inicialmente
abordado em 4.1 a krigagem ordinária e no item 4.2 a krigagem indicatriz que é o
objetivo principal deste trabalho.
12
4.1 - Krigagem Ordinária:
Considerando-se a Figura 7 onde na região D contida no espaço ℜ2 define-
se o processo espacial:
{ }Z x xi( ): ∈ ⊂ ℜD 2 , (6)
onde em n pontos xi são feitas medidas de uma variável Z. Tem-se então, uma
amostra de variáveis aleatórias espacialmente dependentes (ou seja, uma
realização de (6)) { }z x xi( ): ∈ ⊂ ℜD 2 .
Figura 7: Variáveis amostradas no espaço D
Deseja-se então estimar Z(x0) que é um valor desconhecido para
determinada localização contida na região D.
Considera-se o estimador:
$( ) ( )Z x iz xi0 = ∑λ , (7)
função linear dos pontos conhecidos e onde os λi’s dados pela krigagem são
ponderadores distintos dos demais de outros interpoladores usuais mencionados
anteriormente. Distintos porque são proporcionais às “distâncias estatísticas”,
significando que, além de ponderar pelas distâncias euclidianas entre o ponto a
ser estimado e os demais pontos conhecidos, incorporam também a estrutura de
variabilidade na região de estimação. Salienta-se ainda que as distâncias
13
consideradas não são somente as distâncias entre o ponto a ser predito e os
vizinhos, mas também, as distâncias entre vizinhos. Exemplificando, suponha a
situações representadas pelas Figuras 8a e 8b, assumindo fenômenos
isotrópicos.
• x2
• x1 • x2 • x3
• x4
• A • A
• x3 • x4 • x1
Figura 8 a e b : Diferentes configurações de vizinhança.
É razoável que para a Figura 8a os pesos de cada ponto sejam
semelhantes, uma vez que estão aproximadamente a mesma distância do ponto
A e entre si. Na Figura 8b, nota-se um agrupamento de dados. Neste caso é
razoável que o peso de x1 seja maior que os pesos de x2, x3 e x4, pois estes
dados agrupados trazem informações quase redundantes de uma mesma região.
Esta característica deste interpolador é denominada ¨declustering¨,
devendo-se ao fato do preditor considerar uma medida de associação entre os
pontos xi da vizinhança. Normalmente, a medida de associação utilizada é a
semivariância, e daí a necessidade do semivariograma e do modelo ajustado.
Considerando que o modelo adotado para o semivariograma é correto e
não apresenta erros de medida, deve-se então determinar os valores de λi que
garantam as propriedades de mínima variância e não tendenciosidade.
Assumida a hipótese intrínseca, para a não tendenciosidade ser
assegurada deve-se ter:
14
[ ]E Z x Z x$( ) ( )0 0 0− = (8)
o que implica em λii∑ = 1 . A variância de estimação é dada por :
[ ] { } { }( )V a r Z x Z x E Z x Z x E Z x Z x$ ( ) ( ) [ $ ( ) ( ) ] [ $ ( ) ( ) ]0 0 0 02
0 0
2
− − −= − ,
onde o último termo é zero pela a condição (8).
A variância quando minimizada sujeita a restrição λii∑ = 1e igualada a
zero, resulta em um sistema de equações do tipo:
( ) ( )ii
i j i j
ii
x x x x$ $
$
, ,λ γ µ γ
λ
∑
∑
+ =
=
1
que sob notação matricial pode ser escrito:
γ γ γγ γ γ
γ γ γ
λλ
λµ
γγ
γ
1 1 1 2 1
2 2 2 2 2
1 2
1
2
1 0
2 0
0
1111
1 1 1 1 0 1
, , ,
, , ,
, , ,
,
,
,
. . .
. . .. . . . . . . . . . . .
. . .
$
$
. . .$
$
. . .
n
n
n n n n n n
=
Assim, resolvendo o sistema tem-se a estimativa:
z x z xi ii
( ) $ ( )0 = ∑λ ,
onde o estimador é BLUE (¨Best Linear Umbiesed Estimator¨).
Detalhes das demonstrações envolvidas podem ser encontradas em
Ribeiro Jr. (1995).
15
Através da krigagem ordinária obtém-se ( )$z xo , que é uma estimativa do
valor esperado da variável no ponto x0 , ou seja, [ ]E Z x( )0 .
Repetindo-se o processo de krigagem ordinária em vários pontos de modo
a formar uma malha fina é possível obter um mapa das estimativas na região
estudada, o que facilita a interpretação quanto ao comportamento espacial da
variável.
Por estimar uma média este processo de krigagem implica numa
suavização dos valores preditos para a região em estudo, além de não fornecer
uma estimativa da dispersão destas variáveis (a variância de krigagem avalia
apenas a configuração da vizinhança).
O exemplo 2 mostra o procedimento de estimação pela krigagem ordinária.
16
Exemplo 2: Seja o espaço D onde foram observados os valores conforme
listados abaixo:
x3 •
x2 • • x0 • x4
x1 • • x5 D
valores observados:z(x1)=0.90z(x2)=0.75z(x3)=0.70z(x4)=0.65z(x5)=0.25
Medindo-se as distâncias entre os pontos 1, 2, 3, 4, e 5 tem-se a matriz dedistâncias:
H=
0 1 0 2 4 2 6 2 051 0 0 1 6 2 4 2 52 4 1 6 0 15 2 62 6 2 4 15 0 1 62 05 2 5 2 6 1 6 0
. . . .. . . .. . . .. . . .. . . .
e procedendo da mesma forma em relação ao ponto 0 e os demais tem-se o
vetor de distâncias: h’= [ ]1.7, 1.4, 1.0, 1.0, 1.65
Considerando o modelo de variabilidade espacial:
γ ( ) , ,h h= +0 11 0 46 (obs: γ(0)=0) .
Monta-se o sistema de equações na forma matricial:
0 0 5 7 1 2 1 4 1 3 0 6 1 0 5 3 10 5 7 0 0 8 4 6 1 2 1 4 1 2 6 1
1 2 1 4 0 8 4 6 0 0 8 1 3 0 6 11 3 0 6 1 2 1 4 0 8 0 0 8 4 6 11 0 5 3 1 2 6 1 3 0 6 0 8 4 6 0 1
1 1 1 1 1 0
0 8 9 20 7 5 40 5 70 5 7
0 8 6 9
1
2
3
4
5
. . . .. . . .
. . . .
. . . .
. . . .
*
$
.
...
.
$$$$$
=
λλλλλµ
1
Resolvendo o sistema obtém-se:
i$
.
.
.
.
.
λ =
0 11120 14970 30340 31640 1194
E a estimativa é dada por:
z x z xi ii
( ) $ ( )0 = ∑λ = 0.6608
17
4.2- Krigagem Indicatriz:
Como a krigagem ordinária fornece apenas estimativa da esperança da
variável Z em pontos desconhecidos, as possibilidades de interpretação e uso
destes resultados são limitadas. A krigagem indicatriz é uma das alternativas que
possibilita a estimação, não só da esperança, mas de toda a função de
distribuição acumulada da variável em cada ponto.
A krigagem indicatriz baseia-se na transformação do conjunto de dados
em variáveis indicadoras, mantendo-se os procedimentos básicos da krigagem
ordinária.
Seja a transformação indicadora para um ponto de corte zc dada por:
{I x z z x zi c i c( , ) ( )= ≤1
0 se c.c , (9)
onde as realizações z(xi) i=1, 2, 3, ..., N das variáveis Z contínuas, espacialmente
distribuídas e espacialmente dependentes, são transformadas em variáveis
dicotômicas segundo (9).
O ponto de corte ou ”cutoff”, representado por zc, pode assumir valores
contidos em [min z(xi) , max z(xi)], podendo ser selecionado segundo um critério
do pesquisador.
O exemplo 3 mostra a transformação de um pequeno conjunto de dados
hipotéticos.
Tem-se então a esperança e variância de cada variável indicadora:
{ } [ ] [ ][ ]
E I x z n P Z x z n P Z x z n
P Z x z n F x z n
i c i c i c
i c Z i c
( , / ( ) * ( ) / ( ) * ( ) / ( )
( ) / ( ) ( , / ( ))
= ≤ + > =
= ≤ =
1 0 (10)
{ } [ ]Var I x z F x z F x zi c n Z i c n Z i c n( , / ( , / ) * ( , / )( ) ( ) ( )= −1 (11)
18
Exemplo 3:
Observando-se afigura abaixo tem-se que as colunas x e y são as
coordenadas, a coluna z são os valores observados e as colunas Ii são
as variáveis transformadas segundo (9) utilizando-se os seguintes
¨cutoff’s¨: z1=0.232, z2=0.239, z3=0.2459, z4=0.24785 e z5=0.2527.
x y z I1 I2 I3 I4 I50 0 0.2459 0 0 1 1 1
0 5 0.239 0 1 1 1 1
0 10 0.2338 0 1 1 1 1
0 15 0.2467 0 0 0 1 1
0 20 0.2541 0 0 0 0 0
0 25 0.2466 0 0 0 1 1
Portanto, como mostrado em (10), estima-se { }E I x zi c n( , / ( ) e tem-se a
estimativa de um ponto da função de distribuição acumulada condicional de Z em
zc. Foi mencionado em 4.1 que a krigagem ordinária estima a esperança de uma
variável aleatória e portanto pode-se utilizar a krigagem ordinária de uma variável
indicadora para estimar a função distribuição acumulada.
A abordagem probabilística é semelhante a de Z. Dada a região D contida
no espaço ℜ2 e definindo o processo espacial:
{ }I x z xi c( , ): ∈ ⊂ℜD 2 , (12)
A hipótese intrínseca para a variável indicadora é definida por:
{ }E I x I xi h i( ) ( )+ − = 0 (13)
19
{ }E I x I x hi h i[ ( ) ( )] ( )+ − =2 2γ (14)
onde em n pontos xi tem-se os indicadores de uma variável Z para o ponto de
corte zc. Para cada ¨cutoff¨ tem-se então, uma amostra de variáveis aleatórias
{ }i x z xi c( , ): ∈ ⊂ ℜD 2 .
Figura 9: Variáveis Indicadoras das variáveis amostradas no espaço D.
Deseja-se estimar E{I(x0)/(n)} , valor indicador no ponto x0, dado o número
¨n¨ de observações consideradas na vizinhança definida.
Propõe-se o estimador: $( ) / ( )( )I x i I xiin0 = ∑ λ ,
onde os ponderadores λi devem ser estimados de modo a garantir as propriedades
de mínima variância e não tendenciosidade, tal como na krigagem ordinária.
Assumindo a hipótese intrínseca, para a não tendenciosidade ser
assegurada deve-se ter:
[ ]E I x I x$( ) ( )0 0 0− = , (15)
que implica em λii∑ = 1 , com demonstração análoga a krigagem ordinária. A
variância de estimação é dada por:
20
[ ] { } { }( )Var I x I x E I x I x E I x I x$( ) ( ) [ $( ) ( )] [ $( ) ( )] ,0 0 0 02
0 0
2
− − −= −
onde o último termo é nulo dada a condição (15).
Semelhante à krigagem ordinária, a variância quando minimizada, sujeita a
restrição λii∑ = 1 , é igualada a zero, resultando em um sistema de equações do
tipo:
( ) ( )iii j i j
ii
x x x x$ $
$
, ,λ γ µ γ
λ
∑
∑
+ =
=
1
que sob notação matricial pode ser escrito:
γ γ γγ γ γ
γ γ γ
λλ
λµ
γγ
γ
1 1 1 2 1
2 2 2 2 2
1 2
1
2
1 0
2 0
0
1111
1 1 1 1 0 1
, , ,
, , ,
, , ,
,
,
,
. . .
. . .. . . . . . . . . . . .
. . .
$
$
. . .$
. . .
n
n
n n n n n n
=
Resolvendo o sistema obtém-se os λi’s que são usados no estimador:
$( , / ) $ ( )I x z n i xc i ii
0 =∑λ ,
note que ( )$ , /I x z c n0 é um estimador BLUE e está estimando [ ]E I x z nc( , / )0 .
Conforme comentado anteriormente, tal esperança é igual a função distribuição
acumulada condicional para o ponto de corte zc ou seja:
[ ]$( , / ) $ ( ) / ( )I x z n E I xc n0 0= = [ ]$ ( ) / $ ( , / )( ) ( )P Z x z F x zi c n Z i c n≤ = .
21
Assim, repetindo o processo para vários zc ’s é possível estimar a função
de distribuição acumulada condicional empírica em cada ponto da áreaconforme ilustra a Figura 10.
Figura 10: Função distribuição acumulada condicional
Estimando-se a função distribuição acumulada pode-se obter mais
informações sobre a área em estudo, sendo possível construir mapas não só de
médias, mas de outras estatísticas das variáveis na região de estimação tais
como: medianas, quantis e probabilidades.
A Figura 11 mostra um fluxograma para o processo da krigagem indicatriz.
Maiores detalhes podem ser obtidos em Journel (1983 e 1984), Kim (1988) e
Isaaks & Srivastava (1989).
22
Modelar variograma
Tomar o j-ésimo cutoff
Tomar o ponto k da malha
Montar e resolver o sistema de krigagem
Outro cutoff ?
Corrigir as relações de ordem e montar a ccdf
Outro ponto namalha?
Obter o mapa desejado
SIM
Definir a malha
Definir outro cutoff?
Escolher cutoff z(c) e Transformar os dados
sim
sim
sim
Krigagem Indicatriz
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
Figura 11: Fluxograma da krigagem indicatriz
23
5 - Resultados:
Com os resultados de teor de água dos dois conjuntos, tensão de 306 cca
e 15300 cca, foram obtidas as variáveis indicadoras para nove pontos de corte
(“cutoff’s”) conforme mostra a Tabela 1:
“cutoff” Tensão
306 cca 15300 cca
zc1 0,232 0,17225
zc2 0,239 0,1797
zc3 0,2459 0,1871
zc4 0,24785 0,19315
zc5 0,2527 0,199
zc6 0,2579 0,2048
zc7 0,263 0,21165
zc8 0,26795 0,2178
zc9 0,2712 0,22605
Tabela 1: Relação dos valores dos pontos de corte
Os “cutoff’s” selecionados foram os decis exceto para os “cutoff’s” 1, 2, 3 e
9 da tensão 306 cca onde foram utilizados, respectivamente, os seguintes quantis
0.15, 0.25, 0.35 e 0.85.
Após a transformação foram construídos semivariogramas e ajustado os
modelos isotrópicos listados na Tabela 2:
Estes procedimentos até este ponto equivalem aos passos 1, 2, 3 do
fluxograma (Figura 11).
24
306 cca 15300 cca“cutoff” MODELO “cutoff” MODELO
zc1 γ( h ) = 0.081 + 0.0465 sph (h/24.8) zc1 γ( h ) = 0.0747+0.0153 sph(h/31.33)
zc2 γ( h ) = 0.095 + 0.0925 sph (h/18.8) zc2 γ( h ) = 0.1 + 0.06 exp (h/18.48)
zc3 γ( h )= 0.142 + 0.0855 sph(h/16.578) zc3 γ( h ) = 0.12 + 0.09 sph (h/14.56)
zc4 γ( h ) = 0.147 + 0.093 sph (h/17.2) zc4 γ( h ) = 0.123 + 0.117 sph (h/13.44)
zc5 γ( h ) = 0.12 + 0.13 exp (3h/(18.4)) zc5 γ( h ) = 0.117 + 0.133 sph (h/13.44)
zc6 γ( h ) = 0.16 + 0.08 sph (h/26.157) zc6 γ( h ) = 0.111 + 0.129 sph (h/11.76)
zc7 γ( h ) = 0.139 + 0.071 sph (h/31.63) zc7 γ( h ) = 0.111 + 0.099 sph (h/11.2)
zc8 γ( h ) = 0.11 + 0.05 sph (h/40.0) zc8 γ( h ) = 0.096 + 0.064 sph (h/11.76)
zc9 γ( h ) = 0.78 + 0.0495 sph (h/40.0) zc9 γ( h ) = 0.0756 + 0.0144 sph (h/44.4)
Tabela 2: Modelos ajustados para os nove “cutoff’s” dos dois conjuntos.
Os variogramas com os modelos ajustados estão no anexo 1. Nota-se que para
cada um dos variogramas existe um valor definido para o patamar total
correspondente a variância da variável indicadora. Exemplificando, caso tenha-se
um semivariograma para uma variável indicatriz referente ao ““cutoff””
correspondente ao primeiro decil, a variância para esta variável será:
{ }Var I x zi c n( , / , * , ,( ) = =0 1 0 9 0 09 ,
que portanto deve ser o patamar total para o variograma.
Foram obtidas estimativas compondo uma malha com espaçamento de 0,5
m (passo 4 da Figura 11) e então procedeu-se a krigagem indicatriz utilizando-se
as rotinas da GSLIB, mais especificamente o programa Ik3d (passos 5 a 11 da
Figura 11) e posteriormente, com o programa Postik, foram gerados os mapas
das Figuras 12, 13 e 14 (passo 12 da Figura 11). Para a tensão de 306 cca, os
arquivos de parâmetros utilizados na GSLIB estão no anexo 2.
Os mapas da Figura 12 referem-se às médias e medianas para a duas
tensões analisadas, 306 cca e 15300 cca. No mapa “12a” tem-se as esperanças
estimadas com valores representados por escala de cores. Assim, a região fica
mapeada em relação aos valores esperados de teor de água. Analogamente, o
mapa “12c” traz o mesmo tipo de informação referente a tensão de 15300 cca. Os
25
mapas “12b” e “12d” mostram as medianas estimadas para as tensões 306 cca e
15300 cca respectivamente.
A Figura 13 apresenta os mapas de probabilidades do teor de água ser
menor que um nível fixado. Nestes mapas a escala de cores representa uma
probabilidade. Assim, pode-se determinar regiões de maior ou menor
probabilidade que o teor de água seja menor que um valor de referência. Nos
mapas da Figura 13 os valores de referência foram 0,19 e 0,25
Outra representação gráfica refere-se a Figura 14, que são os mapas dequantis para as duas tensões. Para os conjuntos estudados foram selecionados
os quantis 0,2 e 0,8 que correspondem aos mapas “14a”, “14c “ e “14b”, “14d”.
Nestes mapas a escala de cor refere-se a um quantil do teor de água que pode
ser interpretado como segue: Para o mapa “14a”, a cor vermelha refere-se a
teores de umidade em torno de 0,25. As regiões marcadas por esta cor no mapa
tem probabilidade 0,2 de terem seu valor de umidade igual ou menor que o
indicado na escala. Analogamente, no mapa “14b” , as regiões com cor vermelho
tem probabilidade 0,8 de terem o teor de água menor ou igual ao valor indicado
na escala.
Analisando de outro modo, os mapas “14a” e “14c”, que tem probabilidades
fixadas em 0,2, demarcam as regiões com alta probabilidade (0,8) do teor de
água ser maior ou igual ao indicado na escala. Nesta situação tem-se o ¨alto
confiável¨. Isto significa uma probabilidade alta de se ter valores elevados de
umidade. Para o quantil 0,8 a situação é inversa, são mapeados valores cuja a
probabilidade da umidade estar abaixo deles é de 0,8. Neste caso tem-se o ¨baixo
confiável”. De forma geral pode-se dizer que fixando quantis baixos tem-se
confiança nos valores altos e para quantis alto tem-se confinaça valores baixos.
O processo de krigagem Indicatriz apresenta procedimentos e dificuldades
adicionais: a obtenção de semivariogramas e ajustes de modelos em quantidade
igual ao número de “cutoff’s” escolhidos, problemas de relação de ordem e tempo
computacional. Por outro lado, os resultados obtidos são compensadores. A
obtenção das distribuições acumuladas condicionais empíricas em cada ponto da
região permite explorá-la com mapas como os das Figuras 12, 13 e 14, que dão
mais elementos para análise e maior segurança em uma possível tomada de
decisão.
26
PR 306 cca PR 15300 cca
MÉDIAS ESTIMADAS MÉDIAS ESTIMADAS
MEDIANAS ESTIMADAS MEDIANAS ESTIMADAS
Figura 12: Mapas do teor de água do solo.a) Mapa das médias estimadas à tensão de 306 cca. b) Mapa das medianas estimadas à tensão de 306 cca. c) Mapa das médias estimadas à tensão de 15300 cca.d) Mapa das medianas estimadas à tensão de 15300 cca.
27
PR 306 cca PR 15300 cca
P ( z(u) > 0.19 ) P ( z(u) > 0.19 )
P ( z(u) > 0.25 ) P ( z(u) > 0.25 )
Figura 13: Mapas de probabilidade para o teor de água do solo.a) Mapa de probabilidade do teor de água ser maior que 0,19 à tensão de 306 cca ( P(z(u)>0.19). b) Mapa de probabilidade do teor de água ser maior que 0,25 à tensão de 306 cca ( P(z(u)>0.25).c) Mapa de probabilidade do teor de água ser maior que 0,19 à tensão de 15300 cca (P(z(u)>0.19).d) Mapa d e probabilidade do teor de água ser maior que 0,25 à tensão de 15300 cca (Pz(u)>0.25).
28
PR 306 cca PR 15300 cca
QUANTIL 0.2 QUANTIL 0.2
QUANTIL 0.8 QUANTIL 0.8
Figura 14: Mapas de quantis do teor de água do solo às tensões de 306cca e 15300cca.a) Mapa do quantil 0,2 do teor de água do solo á pressão 306 cca.b) Mapa do quantil 0,8 do teor de água do solo á pressão 306 cca.c) Mapa do quantil 0,2 do teor de água do solo á pressão 15300 cca.d) Mapa do quantil 0,8 do teor de água do solo á pressão 15300 cca.
29
6- Referências Bibliográficas:
CRESSIE, N.. Statistics for Spatial Data. John Wiley & Sons, 1991.
DAVIS, B.M.. Uses and abuses of cross-validation in geostatistics.
Mathematical Geology, New York, 19(3): 241-8, 1987.
DEUTSCH, C.V. & JOURNEL, A.G.. GSLIB: Geostatistics softwarelibrary and user's guide. New York: Oxford University Press,1992.
GEODERMA: AN INTERNATIONAL JOURNAL OF SOIL SCIENCE. Pedometrics-92:
Developments in Spatial Statistics for Soil Science, Special Issue.
Netherlands: Elsevier, v. 62, n. 1-3,1994.
ISAAKS, E.H. & SRISVASTAVA, R.M.. An introduction to appliedgeostatistics. New York: Oxford University Press, 1989.
JOURNEL, A.G.. Non-parametric estimation of spatial distributions.
Mathematical Geology, New York, 15(3): 445-468, 1983.
JOURNEL, A.G.. A place on non-parametric geostatistics. In VERLY et. al.,
ed. Geostatistics for natural resources caracterization, vol.1, pag
307-55, Riedel, Dordrecht, Holland, 1984.
KIM, Y.C.. Geostatistics for highly skewed data. Department of Mining
and Geological Engineering. The University of Arizona, 1988.
MORAES, S.O.. Heterogeneidade hidráulica de uma terra roxaestruturada. Piracicaba, 1991. 141p. Tese, (Doutorado) - Escola
Superior de Agricultura "Luiz de Queiroz", USP.
30
RIBEIRO JR, P.J.. Métodos geoestatísticos no estudo variabilidadeespacial de parâmetros físicos do solo. Piracicaba, 1985. 100p.
Dissertaçào (Mestrado em Estatística) - Escola Superior de Agricultura
"Luiz de Queiroz", USP.
VIEIRA, S.R.; NIELSEN, D.R.; BIGGAR, J.W.. Spatial varialility of field-
measured infiltration rate. Soil Science Society of American Journal,Madison, 45(2): 1040-8, 1981.
VIEIRA, S.R.; HATFIELD, J.L.; NIELSEN, D.R.; BIGGAR, J.W.
Geostatistical theory and applications to variability of some agronomical
properties. Hilgardia. Berkeley, 51(3): 1-75, 1983.
WAYNICK, D. D.. Variability in soil and its significance to past and future
soil investigations. University of California Publications inAgricultural Sciences, vol. 3, No. 9, pp. 243-270, 1918.
WAYNICK, D. D.; SHARP, L.T.. Variability in soil and its significance to past
and future soil investigations. II. Variations in nitrogen and carbon in
field soil and their relation to the accuracy of the field trial. University ofCalifornia Publications in Agricultural Sciences, vol. 4, No. 5, pp.
121-139, 1919.
WEBSTER, R. Quantitative spatial analysis of soil in the field. Advances inSoil Science. New York, 3:1-70, 1985.
31
Anexo 1
32
VARIOGRAMAS INDICADORES PARA PRESSÃO 306 CCA
CUTOFF 1 CUTOFF 2
CUTOFF 3 CUTOFF 4
CUTOFF 5 CUTOFF 6
CUTOFF 7 CUTOFF 8
CUTOFF 9
33
VARIOGRAMA INDICADOR PARA PRESSÃO 15300 CCA
CUTOFF 1 CUTOFF 2
CUTOFF 3 CUTOFF 4
CUTOFF 5 CUTOFF 6
CUTOFF 7 CUTOFF 8
CUTOFF 9
34
Anexo 2
35
Parameters for IK3D *******************
START OF PARAMETERS:306test.dat \data file1 2 0 3 \column for x,y,z and variabledirect.ik \direct indicator input (soft)-1.0e21 1.0e21 \data trimming limits306sinkr.out \output file of kriging results0 \debugging level: 0,1,2,3ik3d.dbg \output file for debugging91 0.0 0.5 \nx,xmn,xsiz241 0.0 0.5 \ny,ymn,ysiz1 0.0 5.0 \nz,zmn,zsiz1 30 \min, max data for kriging45.0 \maximum search radius0.0 0.0 0.0 1.0 1.0 \search: ang1,2,3,anis1,20 \max per octant (0-> not used)0 2.5 \0=full IK, 1=Med IK (cutoff)1 \0=SK, 1=OK9 \number cutoffs0.232 0.15 1 0.6353 \cutoff, global cdf, nst, nugget 1 24.8 0.3647 \it, aa, cc 0.0 0.0 0.0 1.0 1.0 \ ang1,ang2,ang3,anis1,20.239 0.25 1 0.5067 \Cutoff, global cdf, nst, nugget 1 18.8 0.4933 \ it, aa, cc 0.0 0.0 0.0 1.0 1.0 \ang1,ang2,ang3,anis1,20.2459 0.35 1 0.6242 \cutoff, global cdf, nst, nugget 1 16.578 0.3758 \ it, aa, cc 0.0 0.0 0.0 1.0 1.0 \ang1,ang2,ang3,anis1,20.24785 0.40 1 0.6125 \cutoff, global cdf, nst, nugget 1 17.2 0.3875 \ it, aa, cc 0.0 0.0 0.0 1.0 1.0 \ ang1,ang2,ang3,anis1,20.2527 0.50 1 0.48 \cutoff, global cdf, nst, nugget 2 6.133 4 0.52 \ it, aa, cc 0.0 0.0 0.0 1.0 1.0 \ ang1,ang2,ang3,anis1,20.2579 0.60 1 0.6667 \cutoff, global cdf, nst, nugget 1 25.877 0.3333 \ it, aa, cc 0.0 0.0 0.0 1.0 1.0 \ ang1,ang2,ang3,anis1,20.263 0.70 1 0.6619 \cutoff, global cdf, nst, nugget 1 31.63 0.3381 \ it, aa, cc 0.0 0.0 0.0 1.0 1.0 \ ang1,ang2,ang3,anis1,20.26795 0.80 1 0.6875 \cutoff, global cdf, nst, nugget 1 40.0 0.3125 \ it, aa, cc 0.0 0.0 0.0 1.0 1.0 \ ang1,ang2,ang3,anis1,20.2712 0.85 1 0.6118 \cutoff, global cdf, nst, nugget 1 40.00 0.3882 \ it, aa, cc0.0 0.0 0.0 1.0 1.0 \ang1,ang2,ang3,anis1,2
36
Parameters for POSTIK (obtenção das estimativas “e-type”)******************** START OF PARAMETERS:pr306in.out \input from IK3D306ppet.out \output file1 0.5 \output option, output parameter9 \number of cutoffs0.2284 0.23475 0.2428 0.24785 0.2527 0.2579 0.263 0.26795 0.2769 \the cutoffs0 1 0.75 \volume support, type, varredpr306 \global distribution3 5 -1.0 1.0e21 \ivr, iwt, tmin, tmax0.0 1.0 \minimum and maximum Z value2 1.5 \lower tail: option, parameter1 1.0 \middle : option, parameter2 0.5 \upper tail: option, parameter50 \maximum discretization