Análise Espacial de Dados Geográficos

download Análise Espacial de Dados Geográficos

of 190

Transcript of Análise Espacial de Dados Geográficos

LIVRO:

Anlise Espacial de Dados Geogrficos

AUTORES: Suzana Druck, Marlia S Carvalho, Gilberto Cmara, Antnio Miguel Vieira Monteiro Edio em papel: EMBRAPA, Braslia, 2004, Referncia cientfica: Druck, S.; Carvalho, M.S.; Cmara, G.; Monteiro, A.V.M. (eds) "Anlise Espacial de Dados Geogrficos". Braslia, EMBRAPA, 2004

ApresentaoEste livro objetiva apresentar as principais tcnicas de Anlise Espacial no contexto de estudos de Geoprocessamento, incluindo: Estatstica Espacial, Geoestatstica, Representao de Incerteza e Modelagem Dinmica. O objetivo das tcnicas de Anlise Espacial descrever os padres existentes nos dados espaciais e estabelecer, preferencialmente de forma quantitativa, os relacionamentos entre as diferentes variveis geogrficas.

= PREFCIO^=~~=~~=~~==~~==~=~I=== ~~=~=~=~~==~~I====I= ~= = ~~= = = ~K= b~I= ~= ~= = I= = = ~= = ~= K= r~= ~= ~= = = = ~= ~= ~= = = = = = = = = = ~I= = =~=~=~====~K=^I===~~= = = = ~= ~~= = ~= = = ~= ~~= = K=q~=~=~=====~==~==~= ~~I= = = = ~= ~= ~= ~K= l~= ~= = ~=~~I=~=~===~==~=== ~~==~=~I=~=~=====~~=~~==pfdI= ~= = = = ~= = ~~= ~= ~= ~~~= = ~~= = pfd= = = = ~~= = ~= = ~~I= ~= ~= ~= ~= = ~= = = I= ~~= = ~==~~K== = f~~=====~~==~==`~= = pI= d~I= l~~~I= p~= `~= = m~= m~I= = = = ~= = ~~= ~~~= = ~= ~= ~= ~= = ~=~~===~=~K=_~===== ===~=~==I=~=~==~==~~= ~= =K=m~~= ~I= ~~= ~= ~~=~I= ~= ~===~==~=~~====~=~~K= l=~===E~F====~===~= ==~===~===J~~=~==~= =fkmbI=~=rpm==~=cfl`orw=K=b=~~=~==~==~== = = ~= ~= = = = ~= = ~= = ~= = = _~K= ^= = = = ~~= = = = ~~= ~~I= ~~~= ~= ~= = ~= = = = = ~~== ~I= ~= ~= ~= ~~== = ~== = K= p= = = I= ~= = = ~~= ~= ~I= ~==~=====~I====~== ==~=~=~~~= = `=~~=~I=~===~=~== ==I========~~=~~= = = = ~= J= = ~~JI= = == YKKKLLL~~[K= ^= ~= ~= ~= ~= = =

~~= = ~= pmofkd= = ~= ~= ~= ~= = = pmofkd= = ~=~~I===p~p~K=l=pmofkd===== fkmb= = = = ~= = = YKKKL[K= ^= I= = ~= ~= o= YKJK[I= = = I= ~= = ~~=~=~=~=~=~=~~~K== = l= = = ~= = \= ^= = ~= ~= ~~~I= ~=====~=~=~~~I=~==~= = I= = = = = ~K= d~~= ~~= = ~~= = = = ~= = = = ~= ~= = ~= = = ~= ~~~~==~~=~~I=~~=~=~=~~=~=~~=~K== = j= = ~= = ~~= = `~= `~= c~I= b~=`~~I=`~=c~==g=^==`~~=m~~=EfkmbFI= b~= ^~= Ebj_o^m^FI= j~~= i= ^~= Er_FI= c= k= E`lmmbLrcogFI= l~= d~= `I= `~= _~I= q~= j~~= i~~I= t~= s~= =p~= Ecfl`orwFI= o~= ^= ErcjdF= = ^~~= p~= = a= h~= Emr`LpmFI= m~= g~= o= gK= = p~= p~~= ErcmoFI= q= _~= Er~= = bI= f~~F= ~= ~= = = = ~= = ~= ~~K= o~~= ~~= = ~= = = = ~~= = ~= = I= ~= = ~~====~==J~~==fkmb==~=bkpmK= m~==~~=~W=j~=kI=p=_I=p~~=^~~= h~I= g= i= o= vI= t~~= _~I= c= o~= o~I= m~~= d= = s~= o~= `~I= ~= = fkmbI= = q~~~= `~I= b~= alI= j~= `~~= = p~I= p= j~~= = p~I= o~= p= mI= ~= ~= bkpmLcfl`orwK= c~I= ~= = = = = = ~= ~~= ~~= ~= b~~J`~I= = = ~= ~= = `~= j~I= = K= k= ~= ~= ~= o~= `~~= j= = p~I= ~= = ~~= ~= = = = ~= a== m~= = f~= = fkmbI= = = ~= I= ~= = = = ~I= = = = ~~~= ~= ~= = ~= ====~=~~===K== = `=~=~=~==I==~==~==~W= ==f~=p~~=a~~=^~I==q=_~==^=d~I=~= =~=~=I====~=~~==~I==~=~~= b~~=b~~==^~==b~I=b~==p~I== o~=^=ErcjdFI===~=~=KKKL~~K== = ^= ~= = ~= ~~= ~= ~~= = = ~= = d~= = _~I= ~= ~= ~= ~= = ~= = ~~= = ~= ~~~= = = ~= = ~= ~~K= k~= = = =~~===~~K=`~=~=~=~=

= ~= = d~I= = ~= = ~= = ~= ~= ========~==~=~=~~== = J~K= ^~= = = = ~= = ~= = ~= ~==K=

p=g==`~I=o==g~I=_~~I=c~~I=m~~=~=cI= g==OMMO

Suzana Druck Marilia S Carvalho Gilberto Cmara Antnio Miguel Vieira Monteiro==

1 ANLISE ESPACIAL E GEOPROCESSAMENTO=Gilberto Cmara Antnio Miguel Monteiro Suzana Druck Fucks Marilia S Carvalho=

1.1 INTRODUO `= ~= = ~~= = ~= = = = == ~= = = = ~= ~= ~~= ~= ~= = = ~= = ~= ~= = I= ~= = ~I= = ~I==~I==~~I==~~=~K=q~=== =~=~~==~=I===~==~== ~=~=EpfdF==~====~=~K=b= ~= = ~= ~~= ~~= = ~= = ~= = I===~~==~==~==~=~== ~~==~~K=m~~=~I=~~====~==~===~= ~= ~= E= = ~~= = FI= = = pfd= = ~~= = ~~= = ~~= = = ~= ~~= = ~= ~~= =K== = ^=~==~=~==~~==~I=== = ~= = ~= = = ~= ~= = I====~W= b~= ~= ~= = ~= = ~K= ^= = = ~= = ~= ~= ~= = ~= = ~\= b=~~==~~===\=b~==\= s~==\= a~J= ~= = = ~~= ~= ~~= ~= = = K= o= = = = ~~= ~= =~~==~~~=J~=~=~\= d= ~= ~= ~= = = = = ~= = ~= = ~= ~== ~~K=mJ= ~= ~= ~~= ~~= ~= ~= ==~=~=\== a~J= ~~~= ~= = ~~= = = ~= ~~K= `= = ~= ~= ~~= = I= ~I= ~= = =

~= ~= ~= = = ~~= ~= ~= ~~= = = = ~====~==~=~~\= = q= = ~= ~= ~= ~= ~= ~~= = ~= K= ^= ~= ~= ^= b~~= = ~= ~= = ~~I= ~= = ~= ~= ~~= ~~= = = = = = ~= ~K= l= ~I= ~= ~= ~= = ~= = ~= = ~===~=~K=b==~~====~~= ~= = ~= ~= K= mJ= ~~= = ~= ~= ~I= ~= = ~= = = = ~= ~~= = ~= ==~I=~=~~===K== = r= = I= = ~= = = ~= ~~= ~==~=~~~==~~===ufu==g=pK=b= NURQI= ~= = i= ~= ~= ~= ~= = ~= ~~= ~= ~K= m= = ~~= = = = ~= ~~= ~=~K= a~= =~=~~=J~W=~=~~J~=~=~~I= ~= ~== ~~= = ~~~= ~=~I= = ~= = = = ~= ~K= l= ~~= Ec~= NJNF= ~~= ~= ~= = = ~~= ~= ~= = ~= ~= = ~= = ~~~= ~= ~I= = ~~= ~~= ~= ~= = = _~= p= = = = = ~= ~K= b= = ~~= ~= I= ~~= = ~= ~= ~= = ~= ~~= = = = ~~= = ~= ~= ~= ~= ~= E= ~~F= ~= ~I= = ~= =~=~==I===~==~=~K= b~==~=~=~==~=~=~~===~== ~~= ~~= = ~~= ~= = = I= = = ===~=~=~~K=

Figura 1-1 - Mapa de Londres com bitos por clera identificados por pontos e poos de gua representados por cruzes.= 1.2 TIPOS DE DADOS EM ANLISE ESPACIAL = ^= ~~= ~= ~~= ~~= ~~~= = ~= = ~= ~~=~====~W=

b= = m~= m~= J= = = ~~= = ~= ~~= = = ~~= = ~I= ~= = ~K= p= W= ~~= = I= ~==~I==~~===~K== p=`~==J= ~~=~=~=====~~= =~I===~=~==~=~K= r~I====~==~==~~=== ~~I= = = = ~~= I= I= I= ==K= ~==`~==q~~=^~~=J=~~J==~=~~= ~=~~=~~I====~~==~I=== ~= = = ~= = ~~= = = = =~K=m=~==~~I==~==~~== ~= = ~I= ~= ~~= = = ~= E=I=~==~=~I=FK==

= ^= ~= ~= = ~~I= ~J= = = ~= = ~= ~~= ~= = ~= ~~= = = ~= K= b= ~= = ~I= ~= ~= ~~= = ~= = = = =

= ~~= ~= ~~= = ~= ~= = = = ~= = = ~= = ~~= ~~= ==K=b=~I====~==== ~=~==~=~~I=~~~==~~=~==~= = ~== = = ~~= = ~= ~== ~== ~= ~~====K== = k= ~= = ~= = ~= = I= = = = = = ~= ~= ~~= ~~= = = = K= `= ~= ~= ~~~~= = pI= = = = ~= ~= = ~~= = I= ~= = = = ~= ~W= = = ~~I= = ~= = = ~~J= = ~~= = ~= K= = ~= = ~= = = ~= ~= = J= = ~= ~= = = ~= ~K= l= ~= = ~= = ~~= = ~= = = = ~~~= = I= ~= ~= ~= = ~= ~= ~= ~~I= = ~= = = = = ~K= m= I= = = ~= ~~= = I= = ~==~===I=~~===~==~= = ~\= ^= ~= ~= = ~~= = = = ~= = ~~~==`~=OK= = `= I= ~=c~=NJO= ~= ~=~~= ~= ~= = ~= ~= ~~= = ~= = ~~= = ~~= ~= = m= ^I= ==~==NVVSI=~~~==p=p~===`~=_~I= ~= cfl`orwK= ^= ~~= = = EFI= = ~= = =E~~F===E~F=~=~~=~=c~=NJO=E=~FK= =~I=~~J=~==~~=~=~=~~I=== = ~~= = ~= ~~= ~= ~K= ^= = ~~= ~==~======~==~== =~=~=====~=~=~=~~~K=

Figura 1-2 Distribuio de casos de mortalidade por causas externas em Porto Alegre em 1996 e estimador de intensidade.

= m~~=~=~==I=====~==~=~= ====~=~~K=`=I=J=~=== ==~~===~~==~==p~~=`~~~==~=~I== =~~===~~=~=~=~~==~I== =p=_I==fkmbI==~~=~=c~=NJPKK= =

55,437 (%)

* Perfis * Amostras8,250

=

Figura 1-3 - Distribuio de perfis e amostras de solo em Santa Catarina (esquerda) e = distribuio contnua estimada para a varivel saturao por bases (direita). = `= = = = ~~\= ^= = ~~~= ~= ~= ~~= = = = ~= = ~~= = X= ~= ~= ~= ~I= = ~= = = = ~= ~~I= = = ~= ~= ~= = ~~~= = ~~K= l= = ~I= ==~=~==~=P==QI====~~= ~=~=~~===~=~=~~K=b==~=~= ~= ~= ~~I= ~= = ~= = = = = ~~~I====~==~=~== ~= ~~=~= = = I= = ==~= = NKQ== ~K= `= ~= ~~= = ~= = = ~~= = ~= = ~= ~= E= = = FI= ~= = = ~~~= = = ~= ~~= ~~= = X= ~= ~I==~==~=~~~====~== = ~K= a= = ~= = ~= ~~~= = ~= = = ~~= = ~= ~= ~~= = ~= J~K= j= = ~= ~I= ~JI= ~= ~I= ~= ~~I=~=~==~J=~=~~==== ~K= = k=~==~==~I=~==`~=RI==~=I= =~=~I===~~=~~=~==I= ~~==~==~~~==K=b~=~==~= ~~= = = ~= = = = ~= ~= ~I= = ~I= ~~= ~= = = = K= bI= ~= = ~= ~= = = ~~I= ~= = = ~= ~= = ~~= = ~= = =

~~=E=F===EF====~= ~~~= = ~= = = = ~= ~= = ~= ~K= b= ~= = ~= ~= ~= = = _~I= = = = = ~= = ~= ~~= = ~= ~= = = ~= = ~~= = ~= = = ~= = ~= ~~==~=~=~==~=K=b=~= I= ~= ~= ~~= ~~= ~~=~= ~= = ~= = ~K= k= ~I= ~= ~= ~~= = ~~= = =====~=~~==~=~== = ~= = = = = ~= ~= = ~= = K== = `===~=~~==~I=J=~=c~=NJQ= E~FI= = ~~= ~= = ~~= = = = L= ~= = p= m~I= = ~= = ~~= ~= K= ^~~= p~= Emr`LpmFK= l= ~= = L= ~= ~==~=~==~=~==VS===p=m~I= = ~= = = = NVVNK= ^= ~= = ~~I= = = ~= = ~~= = = = = ~I= ~= ~= c~= NJQ== E~FI==~=======~=~=~K=

=

=

Figura 1-4- Mapa de Excluso/Incluso Social de So Paulo (1991) e agrupamentos de = excluso social (Zonas Leste e Sul) e incluso social (centro).= = 1.3 REPRESENTAO COMPUTACIONAL DE DADOS GEOGRFICOS = l= = p~= = f~= d~= EpfdF= = ~~= ~~= ~= = ~~= = ~~= ~~= = ~= = == ~~~=~=~===~==~===~I= = I= ~~= ~= = = = ~= ~= = ~~K= k~= = ~~I= J= ~= = = pfd= = = =I==~=~=c~=NJRW==

f~==X= b~~==~==~X= c==~====~X= s~~==~X= ^~~= = ~= = ~= E~~= = ~== ~===~==~=FK== = b= = = ~~= = ~= ~K= ^= ~= J~= = = = ~= = ~= = ~K= k= = I= = pfd= = = ~= = ~= = ~= ~~= E~~I= I= ~I= ~~= = ~~FK= f~= ~= ~I= = ~= = ~= = ~~~= = ~= = ~= ~~K= `~~= ~I= = = = = = = ~I= ~= = = = ~=~I=~= == ~= ~====pfdK= =Interface

Entrada e Integr. Dados

Consulta e Anlise Espacial

Visualizao Plotagem

Gerncia Dados Espaciais

Banco de Dados Geogrfico

== Figura 1-5 - Arquitetura de Sistemas de Informao Geogrfica. = ^=~~==~==~==~=~~==== J~~= E= ~~= ~FI= = ~= = ~= ~= = ~= = ~= Epd_aF= ~~I= = = a_^pb= = ^``bppI= ~~= ~~~= = ~= ~~= = ~= = = I= = ~= =~~=~~=~~=~=~=~==K== = ^= ~= ~~= = = J~~= = = ~= = pd_a= ~~= = ~K= a= = = ~= = I= ~= ~~= = = ~~= ~I= ~= = ~= = = ~= = pd_a= ~~I= ~= =

~===K=k=~I===pd_a=~~== = ~= ~= ~= ~I= = = = = = = = ~==~==~=K=f~JI==I== = = = ~~= ~= ~~~= ~= = = =~~I=~======~=~~=~= ~~= ~= ~K= b~= ~= ~= ~~= ~= = = ~= ~I= ~J= K= ^I= = ~= ~= ~= ~~= = ~= = = = = = = ~~= ~I= == = ==~= = ~= ~= ~~I= ~= = = = = J~~= = = ~= = ~~= ~= ~~~=~~=~=~==~K= = ^= ~= ~= ~~= = ~= = ~~~W= m= OaW= r=Oa= == ~= ~= EI=F= = ~~= ~~K= = r= = ~= = ~= = ~= = = I= = = ~= ~= ~~= = ~~= ~I= ~~= ~= c~=NJOK== mW=r======~=~=EI=F== ~~=~~I==~=~=====~== ~= I= ~= ~= = ~~= = ~K= k~= ~= ~=I=~~==~=~==~=E== ~= = = = p= m~= ~= c~= NJQFX= = ~= ~= ~I= ~= = ~= = = = = ~~= = = K= ^~W===~=~=EI=I=F==~==~= EI= F= ~= ~= ~~= ~= = = ~= = ~= ~= = ~= ~~= ~= ~~K= r~= ~= ~~= =~~~=~=~~==~I===~==~= I= = = ~K= l= = = ~~= = = ~~= ~~= = ~= = ~= ~= = ~= ~=~~K== d~=~W==~=~==~~===~~=~== ~=K=b~=~==~~~=~=~==~== I= ~= ~= = ~~= ~I= ~= ~= ~= ~= = = ~= ~I= = = ~~= ~= ~= =~==~K== f~W==~=~==~~===~~=~==~= = E~= ~= ~~= = M= = ORRFI= ~~= ~~= ~~K=b~=~==~~=~~=~~=~==~= ~=~K=l=~==~=~==~~=~~==

~= = ~~= ~= ~X= = ~= ~= = ~====~=~=~I======= ~=~=K=k~=~=~==pfdI==~=~= = ~~= ~= ~= ~= ~= ~= = ~= E= = = ~===FI===~~==~~== K= ^=c~=NJP= E~F= ~= ~= ~=~==~= ~=~~==~==p~~=`~~~K= = ^= ~= ~~~= ~= I= ~~= = = = ~~~= ~= c~= NJS= = ~= ~= ~= = ~~= ~= c~= NJUK= r~I= ~= ~= ~= = ~= = ~~~= ~= ~~= ~= ~= = ~I= = = ~~~= ~= ~= = ~~= ~~I= = ~= ~= = ~= E~~= vF= = = E~~=uFK=

= Figura 1-6 Geometrias: Ponto2D, Amostra e Polgono =

= Figura 1-7 Representao Geomtrica de Grade Regular = k= = J~~I= = ~= = = ~~= = = ~~=~=~==~=~~I==~=~==~=~=

= ~= = ~= ~= = ~= == ~K= `~~= ~= ~=~~==~=~=~~=~===X=~=~~= ===~~=~==~===I=~~= = ~= = ~= ~= ~= ~= = = ~= = ~= ~= ~K== = `= ~= ~= = = = = ~= ~= = ~= ~~I= ~= ~= = ~~~~= = pfd= = ~~= ~= ~= ~= ~~~= ~= c~= NJUK= `~~= ~I= = = = = = I= ==~==I==~~=~~==== ~===~==~~=~=~~===pd_a=~~K= ^= c~= NJU= ~= ~= ~~= = ~= ~= ~I= ~= = ~I=~~===K=`~~=~===~=== ~~= ~= = = ~= = = = ~= = = ~= ~= ~~= ===~K=k=I=~=~==~=~~=== =~=q^ielK==l====~~====== ===~I===W=~===I=== ~= ~~I= ~~= = ~I= ~= = ~= ~X= ~= = ~~====~===~=~~X===== ~~=~===~=~K=

= Figura 1-8 - Estratgia dual para bancos de dados geogrficos. = k= ~= = I= = ~= = = ~~= ~= = pd_a= ~~I= = = ~~= ~~~= = = ~= ~= = = ==~=~=~~K=^~J====~~==~==~W= ~~= = = ~~= ~= = ~I= = = ~= ~= = = ~==~~=~==~=~~==~==~K==

= m~~=~=I=~=~=~===~~=~~==~= I= = = ~~~= = ~= = = pd_a= ~~K= k=~I=~=~=~=~====~==~~==~~~= = ~~I= ~~~= ~= = = = = = ~= = = K=l===~==~=~=~==== ~= ~~~= = = ~= = = K= b~= ~= = = ~~~=~=~=~~===~~=E=~==c~=NJPFK= 1.4 CONCEITOS BSICOS EM ANLISE ESPACIAL a~=b~~= = r==~=~===~===~~==~= ~= ~~K= b~= = ~= = = t~= q= ~~= = ~= = ~= ~~W= ~= ~= ~= = ~~I= ~= ~= ~= ~==~=~==~=~=~K=lI==~~=k= `I= ~= ~= x~~z= = = = ~= ~= = = ~= ~=~~==~===~~=~==~=~~==~K= = d~~I=J=~~==~=~=~=~=~I=~= ~= ~~= = ~I= ~~= = = ~= ~= = = ~= ~K=l======\=p=~=== = = = ~I= = = = ~== ~= ~= ~~= ~= ~= K= l= = = ~= ~= = ~= = ~~= = = = = ~I= ~= = = = ~= ~I= = ~= ~=~=~==~==~~K== ^~=b~~= = ^= = ~~= = = = ~= ~~= = ~= ~~= ~~K= b= = = ~= = = ~= = ~I= ~= ~~= ~= = ~~= = ~= ~= ~~~K= ^= = ~= ~= = ~= ~= = ~= = ~~~= = ~= ~= ~= ~~~I= ~= = ~= = = ~K= m~~= = ~= ~~= ~~I= J= ~= = ~I= = ~~= ~= ~= ~W= ~= = ~~= ~= ~= ~~I= ~= ~= ~= ~~= = = ~= = ~= ~~= = = = K= l= ~= = ~~= ~~= = ~=~~==~=~~===~=== (d ) =

wij (d )ij =i =1 j =1

n

n

ENJNF=

= b==~=~=~===~=~~~== = = = ~= ~K= a~~= ~= ~= I= ~= ~= = = ~=~==~=~~==~=~=~~~===I==

I=~===~~~==~===K=^=~== =~=~==~==~=~=~~~I=== ===~=~I===~====j~=~~=~I= ==~=R==I=~====

I=

w ( zi =1 j =1 ij n i =1

n

n

i

z )( z j z )=i

= ENJOF=

( z

z )2

= = = N= = ~= ~= ~= ~~~= ~= = = = = ~I= = M= ~= K=l===~===~~~I===~= PI===~==~~=~=~==~I===~=~= =~==

(d ) =

1 N (d ) [ z ( xi ) z ( xi + d )]2 = 2 N ( d ) i=1

ENJPF=

=kEF=====~~=~~~=~=~=K== = b= ~= = ~I= = ~= = = = ~~= = = ~==~===~===~=~~=~~== ~= ~K= s~= ~= = == ~~= ~~= = ~= = ~= ~~= = ~= = = ~= = ~= ~= ~~I= ~= ~= ~= ~= = = = ~=~~I=======~=~~==~= =~=~==~==~==~=~K== f~=b~~=~~=a~=b~~= = =r~= ~= ~= ~= ~= ~~= = = ~= ~=~~====~=====~== ~==~~====~~K=b=~=~~~I=~= ~=~~=~=~=~=~===~K=a=~=~I= = = = = ~~= ~= ~~= ~= ~~I= = = = ~= = = = = = = ~= = ~~= = = ~I= ~~= ~= ~= = ~= = = ~= ~K= = k~=~=~==~I=~=~=~=~~~==~== ~= ~~= = = = = = ~~= I= ~= =~=~=~~====K==~=~== ~~= ~~I= = = ~~= ~= ~= ~= ~= I== ~== == = ~=~= ~= = ~~==~=~=~~===~=~~=== ~K= ^= = ~= = I= ~~= = ~~= = u = = ~= = A =

~= = 2 I= = ~= = = = ~= z = = = z (u ) = = = = ~~==== {Z (u ), u A} K== k= ~I= = = ~== = ~= ~~= = = I= ~= = = = = = = = = ~= ~= L= I= = =~=K= b~~~==f~= = l=~==~===~=~=~~== ~= ~~J= ~= = = N= = O= K= b= = N= = = = ~=~I==I=~=~====~K=b==O===~= ~~==~=~===K=r==~===== ===~~~K=l===~=~==== =N==O===~I==~=~==~~I==~I=== ~K= r= = = = I= ~= = ~I= ~= ~~= ==~=~======~===K= = r=== Z ====~==~===~= ~~= = Z (u ) = = ~= = ~= ~= = = = A I= = ~= = =~=~==

E{Z (u)} = m =

ENJQF=

= ~= ~= = ~~= ~~= = ~= = = ~= == h = u u =

C (h) = E{Z (u ) Z (u + h)} E{Z (u )}E{Z (u + h)} =

ENJRF=

= a~= = = ~~= I= ~= = ~= ~~~= = = ~~= ~= ~= = = = ~= ~~= = ~~= ~I= = = = ~= ~= ~= ~~=~~K=k~=~~=~~= C h I=== h ==~= ~ h =~=K=n~=~=~==~~I=~==~~= =~=~I=~~=~~===~=I=~==~== ~~K=k=~===~=~=~~==~=~==~=~= I=J= = = = = K= ^= ~=~= ~== ~~=~~===~~~==~===K=m=~= = ~= ~~= ~= ~~~= ~= = ~= ~= = ~~=~~==~=~=~====~= =K=

1.5 O PROCESSO DA ANLISE ESPACIAL = ^= ~= ~~= = ~= = = = = = ~~= ~= ~~= = ~= ~= = = = ~= = = ~= = ~~= ~~= = = K= l= = ~= ~= ~= = = = = = ==~=~~==~=~~==~I==~=~~= = ~~K= b~= ~== = ~==~= ~= = I=~=~= ~~= EF== = = ~= ~= = = I= ~= ~= = ~= ~= I= = ~=~= ~= =~=~==~~K=^~===== ~= = = ~= ~I= = ~= ~= ~= = = ~==~==~K=== = l= = ~= ~~= = ~= ~~= = = ~=W=~~=~I=~~=~====~K= ^====~=~~===~=~==== = ~= ~= = ~= = = = K= l== ~~= ~= ~= ~===I====~===~= = = = = = = = I= ~~~= = ~= ~I= ==~K= = ^= i~= ~= = ~= ~= ~= = ~~I= ~= =~=~==K=l=~=~==~=~= ~~= = = I= = ~= ~~= ~~= K= ^= ~= = ~~==I========~~=~= =I====~~~==~=~~K=k==~= ~=~=~====~=~~==_= eI=^~~~I=`~I=q~==k~~K=l==~=~== ~~==~=~===~=~====~=~= = I= = = OMM= = = = = ~= ~= = ~K= b~I=~=~=~~=~=~=~~==== =~=~I=~J=~=~K=m==~I=~=~I= ~= = = = I= ~= ~= ~= = ~= ~= ~I= = = = = ~~= ~= = = ~~= ~=~=~==K=l=~==~I==~~==I== =~~~=~=~=~=~~=====~K= r~= ~= ~~= = ~= ~~I= ~~= = = ~~==~~==~==~K=`==W=

n~==~=========~~\== = k~= ~= ~= = = = ~= i~I= ~= ~~= ~==~=======~=~==~=~= ==~=~=~I=====~W=

l= = ~~= ~I= = = = = ~= = ~= ~=~=~==~==~=~==~=~~==~= ===~=~===E~~===FK= l= = ~I= = = = = ~= ~= ~~= = ~~= = K= k= ~I= ~= ~= ~~~= = = = ~= = = ~= E~= = ~~= = F= ~= = ~= = = ~~K=

b=~=~~I=~===~=~====\== = m~~= ~= = ~= ~== = = = = ~= ~= ~~= = ~= ~= = ~= = ~= ~== ~~==~==~~====== ~= ~= ~~= ~= = = = = K= k= ~= = ==~~=~=~==~=~~=== ==~==~K== b= ~= = ~~= ~~= = = ~= ~= ~\== = ^~= = I= ~~I= = ~= ~= ~K= = == ~~= ~~== = ~= = = ~= I== I==K=b~I==~==~=~=~==~== ==~===~=~===~=~= ~I==~~=~=~==~~==~= =~~~==~K=^===~=~=~=~= ~= ~= = I= = = = ~= ~= = ~= ~= ~~= = ~= ~K= l= = = ~= = ~= = ~= = ~I= = I= ~= K= f= I= ~= ~= = = ~= = ~= I= = ~= ~~= = ~K= ^= = = = ~= = ~= ~= ~= = = = ~= ~= ~= ~= ~~K= k= ~I= ~J= = ==~~=~K==

=

r~= = ~= ~= ~= = = ~= = = = = = = = = ~= ~= = = ~~= I= = = = = ~~= = = = ~~=~=K=

j=f~= = j~= = = ~= = ~~I= = = ~= ~= = ~~~= ~~= ~~= ~= ~= ~= ~~= ~K= ^= ~= = ~= ~~= = = ~= ~I= = ===~~=~=====~=~== ==~I=======~~K=n~=~== ~= ~~= = ~= ~= = ~= ~\= `~= = ~~= = = = = = ~~= ~~= ~~=~I= = = = = ~==~I==~======~== ~= = = ~I= ~= = ~= ~= = ~= ~==~K=r~=~=~~======~= ~= = = ~= ~= ~= ~~~= ~K= m= = ~I= = = I= ~= ~= ~= ~= = ~~==~K=^=~=~===~I==~== ===I=~==~======~=~= ~= = ~= ~= ~= = = ~~= ~= = = ==K= m=~== = m= ~= = = = = = = = ~= = = = I= ~= ~~= = ~~= = = ~= K= ^= ~~= = = = = = = I= ======~=~K=`~J== = = = (u1 , u 2 ,........) ~= ~~= = A = = ~= K= m= I= = = = = = = ==~=~~=I=~J=~====~= =~~====I==~I=~=J== A == ~=~~==~K=== = l= = ~= = ~= ~= = S = = A = ~~= = ~= ~~= E [N (S )] = = ~= ~~= C N (S i ), N S j I= = N (S ) =~======pK=p===~=~=~=

[

( )]

~= ~~= = = ~= = ~= I= ~= ~~===~=~==~==~=~~== = = ~K= b= ~= = = = ~~= = N (S ) = ~~= ~= ~= = du = = = = u I= ~= ~= = ~= K= b~= ~~= =~~= ~= E~= =~= FI= =~=X==

(u ) = lim du 0

E [N (du )] I= du

=

=

=

=

ENJSF=

= m~= = ~= = = = ~= ~= ~= ~I= ~=~=~=~ ui , u j ==~==~=

(

)

du == du j ===== u i == u j K==

(d (ui ), d (u j )) ==

C N (dui ), N du j du i , du j 0 dui , du j lim

[

( )]

==

=

ENJTF=

~==I= u i , u j ==== ( h ) I== h =~=~=== = K= n~= = = = = ~I= = ~I= ~= ~= ~=~~=~==^I=~=~=~=~==~= ui , u j =

n~= = = = = ~I= (u ) = = ~= ~= (u ) = X= =

(

)

=~=~=~~== (u ) K=l==~==~~== ~=OK= s~~=~=

(

)

= l= = ~= = ~~= ~= ~= = = = { Z (u ), u A, A 2 } I= = ~= = = = = ===~=~==K=^=~==~=~~===~= z I=~~==== u === A I {z (u ), = 1,.., n} I=~J= =~==~==~== z K=^=~=== = = = ~= = ~= ~= J~~~= = ~= ~= = ~= = ~I= = = = = ~= P= = Q= = K= b= = ~= = = ~= = = =~==~~K== = ^= ~~= ~= = = = = = ~W= ~= ~==~=~=~K=k~=~I==~~== uo I== ~=~=~=~~~= Z ==~I= z (uo ) =~J==~I= Z (u ) I= = = = ~= = = ~= = ~= ~= = ~~= ~~=o

Z (uo ) = f (C , (n )) K= b= ~= ~~= ~~= ~=

~W= = = = = = = = = = ~= ===~K=== = k~= ~= ~I= = = = ~= ~= = ~~~= Z = ~~= = ~~= = = = = = = ~K= `~~= ~~= ~= ~~~= = ~= ~= = ~= ~= ~~= = = = = ~~~= ~K= d~= ~= ~~= = ~= = ~===~====~~~=~~~I= F (z ) I==~= ~==~~=~~=~~K=== = ^=~==~====~== z =~~= = ~~= ~= ~I= z (u ) I= ~= = ~= ~= ~=

= ~= ~~~= ~~= ~= = ~~= = = ~=~=====~~~K=m~~==== ~I=~=~==~=~I=~==~~I=== ~= ~= = = = = = ~= ~= = ~= I= = I= = = ~= ~= = ~= = ~= = ~= ~~==~~===~==~=~~K=k=I= = = = = = = = ~I= ~~= = ~=P==QK= s~~=~= = l= = ~= = ~~= ~= = = = = = = ~= ~~= = ~~~= ~= ~= ~~= =K=b=~===~=~=~=~== = ~~= = I= ~= = = I= = ~I= ~~= = ~K= k= ~I= = = ~= ~~= ~~==I=~===~=~~==~K=l===~= = ~= = ~= ~~= = = = = K= l= ==~~=~==~==~=R==K= = k= = = ~= ~J= = = ~= = = I=~==^I======~=~~K=l=== =~=~=~==== {Z i : i = 1,..., n} I= = = = = = ~= ~~~K= _~J= = ~= ~~= ~~= ~= = ~= ~= ~= Z = {Z1 , ..., Z n } I= = ~~= ~= ~~~= = ~~~= ~= ~= ~= ~= = = ~= =~==~~K=p====~I==~=~== Z i = ~= ~= ~= ~= = = ~= ~= = ~~= = ~=~=~I==~=~==~~==~=~K= 1.6 CONCLUSES = b= ~= ~= = ~= = = ~= ~~= = ~= = = = ~= = = ~= = ~= ~= ~~K= l= = = = ~= = ^= b~~= = ~= = = = ~= q~~= NJNI= = = ~~= ~= ~~=~~==K=

Tabela 1-1 Tipos de Dados e Problemas em Anlise Espacial = Tipos de Dados Analise Padres Pontuais Anlise Superfcies de Eventos Localizados Amostras de Campo e Matrizes Polgonos e Atributos Exemplo Ocorrncia de Doenas Depsitos Minerais Dados Censitrios Problemas Tpicos Determinao de Padres e Agregamentos Interpolao e Medidas de Incerteza Regresso e Distribuies Conjuntas

de

Anlise de reas

= = m~~==~=I==~=~==~=~= ~=^=b~~====~==I=====~= c~= NJVK= l= ~~= = = = = E= `~= = pI= d~= = p~= m~F= = ~= = = I= = = ~= ~= = ~~= = pfdK= b~= ~= ==~===~=~~==~K=^=~= ~= ~I= = = = = ~~= = = ~= ~~I= = = = = ~= = = ~~= = = ~I=~~====^=b~~K=l=~= = = = ~= = = ~~= ~= ~= = ~~=~=~==K== =Domnios do Conhecimento Teorias Modelos Inferenciais Hipteses Testveis

Conceitos Qualitativos

Anlise Espacial

= Figura 1-9 Relao entre anlise espacial e as teorias disciplinares. = `= = = ~I= = ~= = = ~= ~= ~= ~I= = = = = = ~~= ~~= ~K= l= = ~= = = = ~~= ~~= ~=

==~K=j~====~=~== ~~=E=~I=~~=~==~~=~F=~~= ~~= ~= ~= ~= ~K= k= ~I= = = ~= = = = ~= ~= = = = = I= = ~~= = = ~===~=~=~=~=~~~K== = b~= = ~= ~= = = = ~= = ~= ~= ~= ^=b~~K=^=~=~~~==^=b~~=== ~=~=====~~==~==~~== = = = K= p= = = = = ~= J= ~= ~~W= = = = ~= = = d~= = b~~= b~~= = ~= ~= = ~~= ~I= ~= ~= ~~= = = ~= E~~= ~F= = ~= ~=E~~=~F==~~K= = ^=~==~===~===== ==~=~==~==~=~=~~= =~=K=m~~=~=~=~==j=p~I==~== ~= ~~I= ~= ~= ~~= = ~= = = = = ~= == X= ~= ~~= = ~~= ~= ~= ~~= ~~~K= `= = = = pfd= = = ~= ~~I= = ~~~= ~~~= ~= ~= = ~~= = ~I= ~= = ~= ==~~====X==~~=~=~=~= ~= = ~I= ~= ~= = = = I= ~= = =~=~=~~=~==I=~=~~== ~K= ^= ~= = ~= = = ~~= = = = ~= ~= ~= = ~= ~= ~~~= E= = ~= ~= = ~~= = ~F= = = ~~= E= = ~= ~==FK== = b~= ~~= = = = ~= = = ~~= ~= ~= = ^= b~~= = d~K= k= ~~~= = ==~~=~I=====~~= = ~= ~~I= = = = = ~= ~= ~~= = ~K=b===~=====~==== ~=~===~~===~~==K= 1.7 REFERNCIAS = l=J===~=~~I===~~=~== =~=~~==I==p~~=a~~=^~==b~= E_~=~=d~I=NVVRFK=p===~====K=q= _~= ~= ~= ~= ~= ~~= = ~K= l= = = = = ~= ~= = c~= = ~K= EOMMNFI= I= ~=

======_~==d~I==~=~=K= m~~= = ~= I= = = = j~= ENVVRF= ~~= ~= ~= ~= I= ~= = ~= ~= ~= ~= = ~~= ~~K= b= mI= = = = = o~= ^= EOMMNF= ~=~==~~~~==J~==~I=~== ~= ~= ~= ~~= = ~= = = ~= ~~= ~= = K= = m~~= = = = ~= ~~= ~= ~I= = = = `=ENVVNF=~~=~=~~===~I==~== = = ~~= ~K= r~= ~= ~= = ~~I= = = = = = = = = = = f~= = p~~~= ENVUVFK= ^= = ~= dpif_I= ~= ~= ~= ~= ~~= ~~= = = = ~~= = ~~I= = = ~~= = ==a==g=ENVVOFK= = m~~=~==~=~=d~I====~= `~~= = ~K= EOMMNF= = _= = ja= ENVVUFK= `= ~= = ~= = ~~= = pfdI= = = = J= ~= `~~= ENVVTFI= = = = = = = = ~= = ~= pmofkdK= l= = = p~~= `~~~= = ~~= = ~~= =_=EOMMNFK=^~==^=b~~=~~=~==~= ~==~==`~~=ENVVTFK= ^I=oK=EOMMNFK=b~~=b~~==^~==b~I= b~I= p~K= _= eI= rcjdK= E= = YKKKL~~[F= _~I=qK=~=^K=d~=ENVVRFK=p~~=a~~=^~==b~K=iI= i~K= _I= pK= EOMMNF= d~= ^~= = q~~= = f~W=l=`~==w~=m=~~=~=p~==b~= =p~~=`~~~K=a~=Ej~==p~=oF== f=k~~==m~=b~~I=p=g==`~K= _I= mK^KX= jaI= oKX= m= = d~~= f~= pK=lI=l=r=mI=NVVUK== `~~I=dKX=a~K`KX=jI=^KjKX=aD^I=gK`K=f==`~=~= d~K=p=g==`~I=fkmbI=OMMN=EO~K=I=~== ~~~I===KKKLLFK= `~~I= bK= ENVVTFK= aI= f~= = = = q= = = m= = d~= = Eh~F= = p~= = m~= = f~= d~~= EpmofkdFK=

a~= Ej~= = p~= oF= = f= k~~= =m~=b~~I=p=g==`~K= `~~I= jKpK= ENVVTF= ^~= = j= = ^= b~~= ~= `~~~= = ~= = o= = p~K= q= = a~= = b~~= _~I= `lmmbLrcogK= EfW= YKKKL~~[=FK= `I=kK=ENVVNF=p~==p~~=a~~K=`I=g=tK= aI=`K==^K=g=ENVVOFK=dpif_W=d~~=p~=i~=~= =K=k=vI=l=r=mK= c~I= ^KpKI= `K= _= ^= jKbK= `~= EOMMMFI= n~~= d~I=iW=p~K= f~I=jK==bK=p~~~=ENVUVFK=^=f==^=d~K== k=vI=l=r=mI=NVUVK= j~I= aK= ENVVRFK= d~= f~= pW= p= ^~K=iI=oK= qI=bK=ENVUPFK=q=s~=a~==n~~=f~K=`I= `qI=d~=mK=

= APNDICE SOFTWARE PARA ANLISE ESPACIAL= ^= ~~= = ~= = ~= ~= = = = = ~~= ~= ~= = ~~= ~~I= ~= = I= = ~= ~= = = ~= = ==~I=~=~=~==~=~=~~K= ^= = I= ~= = = ~= pfd= = = = ~= ~~K=j~=I=~=~==~=~~==~= ~= ~= ~= ~= = = = = ~~= ~= ~= = pfd= ==_~K=b==~=~~~=~=~=~I== ~==~~===~===~~==~== ~==~K== = m~~= ~= = I= = ~= = ~= = = ~= = ~= ~~= = ~= ~~= = = ~= = ~=~======~=~~K=a~~=~= ~=~~I=J=~=====~=~=~=~~== ~~= ~K= m~~= ~= = ~~~~I= ~J= ~= ~= ~= = K~J~KI= ~= = d= aI= = = ~===~===~K=

= ^==~~=~=~=I=J=~~===faofpf=== do^ppI==pfd==~I==~===~=dpq^q== ~= = ~~= ~= ~~K= s~J= = = ~= q~~=NJPK= TABELA 1-2 GSLIB Biblioteca para Geoestatstica Descrio Autores Disponibilidade Funes Biblioteca para desenvolvimento de programas em geoestatstica, escrita em Fortran 90 Clayton Deutsch e Andr Journel Software livre em Anlise Exploratria: estatsticas descritivas, clculo de variograma (2D e 3D). Estimao: krigeagem simples e ordinria, com modelo de tendncia, co-krigagem, krigeagem por indicao, simulao seqencial (gaussiana e por indicao), com suporte a variveis contnuas ou categricas. Aplicabilidade = =TABELA 1-3 GSTAT Software para Geoestatstica Descrio Autores Disponibilidade Funes Ambiente para desenvolvimento de programas em geoestatstica, escrito em C. Possui interface com IDRISI e GRASS. Edsger Predesma Software livre em Anlise Exploratria: estatsticas descritivas, clculo de variograma (2D e 3D). Estimao: krigeagem simples, ordinria e universal (com modelo de tendncia), co-krigagem, krigeagem por indicao, simulao seqencial (gaussiana e por indicao), com suporte a variveis contnuas ou categricas. Aplicabilidade Geoestatstica Linear (cap 3) e por Indicao (cap 4) Geoestatstica Linear (cap 3) e por Indicao (cap 4)

TABELA 1-4 ClusterSeer Clustering de Processos Pontuais= Descrio Autores Disponibilidade Funes Programa para deteco de clusters (conglomerados) associados a eventos Godfrey Jacquez Software comercial em Deteco de Conglomerados Espaciais: testes focados (Diggle, Bithell, Besag e Newell, Turnbull) e globais (Besag e Newell, funo K de Ripley). Deteco de Conglomerados Espao-Temporais (Kulldorff) Aplicabilidade = TABELA 1-5 CrimeStat Anlise de Estatsticas Criminais= Descrio Autores Disponibilidade Funes Software livre em Estatsticas descritivas: centro mdio, elipse dos desvios padres, ndice I de Moran. Deteco de conglomerados: funo K de Ripley, k-mdias e ndices locais de Moran. Estimador de densidade: kernel estimator. Aplicabilidade = Anlise de Eventos (cap 2) Software para anlise de eventos associados a criminalidade Anlise de Eventos (cap 2)

TABELA 1-5 SpaceStat Anlise Espacial de reas = Descrio Autor Disponibilidade Funes Software para anlise espacial de reas, com nfase em tcnicas de regresso espacial. Possui interface com ArcView. Luc Anselin Comercial em http://www.spacestat.com/ Anlise ExploratriaW=estatsticas descritivas, ndice I de Moran (global e local), mapa de Moran, ndice C de Geary, com testes de hipteses sobre autocorrelao espacial. EstimaoW= Regresso por mnimos quadrados, e regresso espacial com vrias tcnicas: modelos SAR (spatial lag e spatial error), com incluso de heterocedasticidade. Aplicabilidade = TABELA 1-6 SPRING = Descrio Software de geoprocessamento de propsito geral, com funes de processamento de imagens, modelagem de terreno, lgebra de mapas e consulta a bancos de dados geogrficos. Possui interface com SpaceStat e suas funes de geoestatstica utilizam a GSLIB. Equipe da Diviso de Processamento de Imagens do INPE Software livre em Anlise de reas (captulo 5)

Autores Disponibilidade

Funes de Anlise Exploratria: estatsticas descritivas, clculo de variograma (2D Anlise Espacial e 3D), ndice I de Moran (global e local), mapa de Moran, ndice C de Geary, com testes de hipteses sobre autocorrelao espacial. Deteco de conglomerados: funo K de Ripley, vizinho mais prximo e ndices locais de Moran. Estimador de densidade: kernel estimator. Estimao: krigeagem simples e ordinria, krigeagem por indicao, simulao seqencial (gaussiana e por indicao), com suporte a variveis contnuas ou categricas. Aplicabilidade = Anlise de eventos (cap 2), geoestatstica Linear (cap 3) e por Indicao (cap 4), anlise de reas (cap 5).

TABELA 1-7 ArcGIS Geostatistical Analyst= Descrio Autores Disponibilidade Extenso do ArcGIS (software de geoprocessamento de propsito geral) Konstantin Krivoruchko e equipe da ESRI Comercial em

Funes de Anlise Exploratria: estatsticas descritivas, clculo de variograma (2D Anlise Espacial e 3D), anlise de tendncias Estimao: krigeagem simples e ordinria, krigeagem por indicao, co-krigagem e krigeagem disjuntiva Aplicabilidade = = Geoestatstica Linear (cap 3) e por Indicao (cap 4)

2 ANLISE ESPACIAL DE EVENTOSGilberto Cmara Marilia S Carvalho

2.1 INTRODUO Neste captulo sero estudados os fenmenos expressos atravs de ocorrncias identificadas como pontos localizados no espao, denominados processos pontuais. So exemplos: localizao de crimes, ocorrncias de doenas, e localizao de espcies vegetais. O objetivo destas anlises estudar a distribuio espacial destes pontos, testando hipteses sobre o padro observado: se aleatrio, se apresentase em aglomerados ou se os pontos esto regularmente distribudos. O objeto de interesse a prpria localizao espacial dos eventos em estudo. O tipo de dado nestes estudos consiste em uma srie de coordenadas de pontos (p1, p2, ...) dos eventos de interesse dentro da rea de estudo. O termo evento refere-se a qualquer tipo de fenmeno localizvel no espao que, dentro de nossa escala de investigao, possa estar associado a uma representao pontual. Exemplos incluem:

Epidemiologia: residncia de casos de doenas Sociologia: local de ocorrncia de ofensas criminais Demografia: localizao de cidades Biologia: localizao de espcies vegetais de interesse

Para ilustrar estes conceitos, considere a figura 2.1, que apresenta a distribuio de 299 bitos de menores de um ano, registrados no ano de 1998, de crianas nascidas no mesmo ano na cidade de Porto Alegre, Rio Grande do Sul, divididos em neonatais (menores de 28 dias de nascidos) e posneonatais (entre 28 dias e um ano). A anlise de padres neste tipo de dado pode ser utilizada como uma forma de identificao de possveis reas com maior concentrao de mortes infantis, de comparao entre os bitos nos dois grupos de idade, e de identificao de fatores de risco associados a esta ocorrncia. Os dados de distribuies pontuais tm as seguintes caractersticas:

A rea dos eventos no uma medida vlida apesar de em muitos casos ocuparem espao. Mesmo na anlise do padro de distribuio de cidades estas so consideradas como um ponto no espao do estudo.

Os pontos em geral no esto associados a valores, mas apenas ocorrncia dos eventos considerados. Em alguns estudos os pontos podem estar associados a atributos de identificao, como no exemplo acima, em bitos neonatais e posneonatais. Quando este atributo elemento do estudo, atravs da comparao da distribuio espacial destes atributos, denomina-se processo pontual marcado.

Figura 2-1 - Distribuio espacial de mortalidade infantil neonatal e posneonatal - em Porto Alegre em 1998.

Nosso interesse primrio ao analisar padres de distribuio de pontos determinar se os eventos observados exibem algum padro sistemtico, em oposio uma distribuio aleatria. Busca-se detectar a existncia de padro de conglomerados espaciais (cluster), atravs da constatao de um nmero acima do esperado de casos excessivamente prximos, considerando uma distribuio estocstica, usualmente um processo de Poisson. Se um padro de eventos pontuais apresentar desvios significativos do comportamento esperado para uma distribuio de Poisson, isto indica a existncia de uma distribuio espacial diferente da completa aleatoriedade, que merece ser objeto de maior anlise.

Anlise Espacial de Dados Geogrficos

2-2

2.2 CARACTERIZAO DE DISTRIBUIES DE PONTOS Numa viso estatstica, processos pontuais so definidos como um conjunto de pontos irregularmente distribudos em um terreno, cuja localizao foi gerada por um mecanismo estocstico. Para sua caracterizao, este processo estocstico pode ser descrito em termos dos efeitos de primeira ordem e efeitos de segunda ordem. Os efeitos de primeira ordem, considerados globais ou de larga escala, correspondem a variaes no valor mdio do processo no espao. Neste caso, estamos interessados na intensidade do processo, isto , no nmero de eventos por unidade de rea. Efeitos de segunda ordem, denominados locais ou de pequena escala, representam a dependncia espacial no processo, proveniente da estrutura de correlao espacial. Para medir a dependncia espacial, procuramos estimar o relacionamento entre pares de eventos (por unidade de rea) no espao, o que corresponde a uma aproximao do clculo da covarincia entre as variveis aleatrias que representam cada evento1. Considera-se um conjunto de pontos (u1 , u 2 ,........) numa determinada regio A onde ocorreram eventos. O processo pontual modelado considerando subregies S em A atravs de sua esperana E [N (S )] e a covarincia C N (Si ), N S j , onde

N (S ) denota o nmero de eventos em S. Sendo o objetivo da anlise estimar as

[

( )]

localizaes provveis de ocorrncia de determinados eventos, essas estatsticas devem ser inferidas considerando o valor limite da quantidade de eventos por rea. Este valor limite corresponde esperana de N (S ) para uma pequena regiodu em torno do ponto u , quando essa tende a zero. Essa esperana denominada intensidade (propriedade de primeira ordem), sendo definida como

(u ) = lim du 0

E [N (du )] , du

(2.1)

Propriedades de segunda ordem podem ser definidas da mesma forma, considerando a intensidade conjunta ui , u j entre duas regies infinitesimais | du |

(

)

i

e du j que contm os pontos u i e u j .

(d (ui ), d (u j )) =Quando o

C N (dui ), N du j du i , du j 0 dui , du j lim

[

( )]

(2.2)

tambm isotrpico, u i , u j se reduz ( h ) , sendo h a distncia entre os dois pontos. Quando o processo no estacionrio, ou seja, a intensidade mdia varia

processo estacionrio, (u ) uma constante, ou (u ) = ; se

(

)

1

Vale relembrar a discusso do seo 1, onde caracterizamos os eventos no espao por um processo estocstico, onde cada ocorrncia uma realizao de uma varivel aleatria distinta.

Anlise Espacial de Dados Geogrficos

2-3

na regio A, a modelagem da estrutura de dependncia ui , u j deve incorporar a supe, explcita ou implicitamente, um comportamento estacionrio e isotrpico do processo aleatrio subjacente aos eventos analisados.

variao de (u ) . A maior parte das tcnicas de anlise de distribuio de pontos

(

)

No exemplo acima da mortalidade infantil, a ocorrncia dos bitos est condicionada pela distribuio dos nascimentos. Alm disso, caractersticas individuais da criana, tais como prematuridade e peso, so importantes condicionantes do bito. possvel, entretanto, modelar estes eventos e detectar reas de sobre-risco, considerando simultaneamente o padro de distribuio dos nascimentos e bitos, e verificando a variao da intensidade do evento na regio e a estrutura de correlao local. A anlise estatstica dos padres de distribuies de pontos requer um modelo terico de referncia, base para o desenvolvimento de mtodos formais que checam a significncia dos resultados exploratrios. O modelo terico mais simples (e bastante aplicado na prtica) conhecido como aleatoriedade espacial completa (complete spatial randomness - CSR). Este modelo divide a regio de estudo A em subreas Si e modela a distribuio de eventos pontuais como um processo aleatrio

{Z i (ui ), ui S i : i = 1,..., n}

(2.3)

Neste caso, consideramos Zi(ui) como o nmero de eventos que ocorrem na sub-rea Si. No modelo CSR, consideramos que as ocorrncias em cada sub-rea so no-correlacionadas e homogneas, e esto associadas mesma distribuio de probabilidade de Poisson. Numa viso intuitiva, pode-se considerar que a posio dos eventos independente e de que os eventos tem igual probabilidade de ocorrncia em toda a regio A. Esta formulao nos permite estabelecer uma base de comparao entre uma distribuio completamente aleatria (que seria gerada por um processo de Poisson) e os dados coletados em campo. O procedimento mais usual para estimar a probabilidade associada ao padro encontrado ser produzir uma simulao do processo aleatrio na regio de estudo. Dado um nmero fixo de eventos medidos em campo (denotado por n), determinamos o retngulo envolvente da regio A (seja {(x,y) : x1 x x2, y1 y y2} ). Os eventos so gerados a partir de abscissas x, obtidas de uma distribuio uniforme em (x1,x2) e de ordenadas y, obtidas de uma distribuio uniforme em (y1,y2). Pontos que caem fora da regio so rejeitados. Este processo repetido at que n eventos tenham sido obtidos na regio. Podemos gerar um conjunto de simulaes, para que possamos obter uma base de comparao entre o comportamento de um processo aleatrio e a distribuio dos eventos medidos. Os conceitos de CSR so utilizados paraAnlise Espacial de Dados Geogrficos

2-4

caracterizar os efeitos de segunda ordem em distribuio de pontos, utilizando os mtodos do vizinho mais prximo e da funo K, descritos a seguir. So tambm utilizados para avaliao em vrios mtodos de deteco de aglomerados (clusters).

2.3 ESTIMADOR DE INTENSIDADE ("KERNEL ESTIMATION") Uma alternativa simples para analisar o comportamento de padres de pontos a estimar a intensidade pontual do processo em toda a regio de estudo. Para isto, pode-se ajustar uma funo bi-dimensional sobre os eventos considerados, compondo uma superfcie cujo valor ser proporcional intensidade de amostras por unidade de rea. Esta funo realiza uma contagem de todos os pontos dentro de uma regio de influncia, ponderando-os pela distncia de cada um localizao de interesse, como mostrado na Figura 2-2.

Kernel k()

LarguraFigura 2-2 - Estimador de intensidade de distribuio de pontos.

A partir dos conceitos apresentados, suponha e u1,...,un so localizaes de n eventos observados em uma regio A e que u represente uma localizao genrica cujo valor queremos estimar. O estimador de intensidade computado a partir dos m eventos {ui,...ui+m-1} contidos num raio de tamanho em torno de u e da distncia d entre a posio e a i-sima amostra, a partir de funes cuja forma geral : (u ) = 1

2

k(i =1

n

d (ui , u )

) , d (ui , u )

(2.4)

Este estimador chamado kernel estimator e seus parmetros bsicos so: (a) um raio de influncia ( 0) que define a vizinhana do ponto a ser interpolado e controla o "alisamento" da superfcie gerada; (b) uma funo de estimao com propriedades de suavizao do fenmeno. O raio de influncia define a rea centrada no ponto de estimao u que indica quantos eventos ui contribuem para a estimativa da funo intensidade . Um raio muito pequeno ir gerar uma superfcie muito descontnua; se for grande demais, a superfcie poder ficar muito amaciada. No caso da funo de interpolao k(), comum usar funes de terceira ou quarta ordem, comoAnlise Espacial de Dados Geogrficos

2-5

k ( h) =

3

(1 h 2 )

(2.5)

ou o kernel gaussianok ( h) = h2 exp 2 2 2 1

(2.6)

Nestes estimadores, h representa a distncia entre a localizao em que desejamos calcular a funo e o evento observado. Com o uso desta funo de quarta ordem (equao 2.5), o estimador de intensidade pode ser expresso como: (u ) = 3 h2 2 1 i2 hi 2

(2.7)

O estimador de intensidade muito til para nos fornecer uma viso geral da distribuio de primeira ordem dos eventos. Trata-se de um indicador de fcil uso e interpretao. A figura 2.3 ilustra a aplicao do estimador de intensidade para o caso de mortalidade por causas externas em Porto Alegre, com os dados de 1996. A localizao dos homicdios (vermelho), acidentes de trnsito (amarelo) e suicdios (azul) esta mostrada na figura 2.3 esquerda e o estimador de intensidade dos homicdios apresentado na figura 2.3. A superfcie interpolada mostra um padro de distribuio de pontos com uma forte concentrao no centro da cidade e decrescendo em direo aos bairros mais afastados.

Figura 2.3: Distribuio de casos de mortalidade por causas externas em Porto Alegre em 1996 e estimador de intensidade.

Anlise Espacial de Dados Geogrficos

2-6

2.4 ESTIMADORES DE DEPENDNCIA ESPACIAL Para a estimao de propriedades de segunda ordem do processo pontual, as tcnicas mais utilizadas so o vizinho mais prximo e a funo K, descritos a seguir. Mtodo do Vizinho Mais Prximo O mtodo do vizinho mais prximo estima a funo de distribuio cumulativa G ( h) baseado nas distncias h entre eventos em uma regio de anlise. Esta funo de distribuio pode ser estimada empiricamente da seguinte forma:#( d (ui , u j ) h) G ( h) = n

(2.8)

onde o valor normalizado acumulado para uma distncia h corresponde soma dos vizinhos mais prximos de cada evento cuja distncia menor ou igual a h, dividido pelo nmero de eventos na regio. A plotagem dos resultados desta funo de distribuio cumulativa emprica G ( h) pode ser usada como um mtodo exploratrio para se verificar se existe evidncia de interao entre os eventos. Se esta plotagem apresentar um crescimento rpido para pequenos valores de distncia, esta situao aponta para interao entre os eventos caracterizando agrupamentos nestas escalas. Se esta plotagem apresentar valores pequenos no seu incio, e s crescer rapidamente para valores maiores de distncia, esta situao aponta para uma distribuio mais regular. A Figura 2-4 mostra a funo G ( h) para os dados de mortalidade infantil de Porto Alegre (figura 2.1), com distncia mnima de 0 km e distncia mxima de 1 km. Verifica-se que a curva mostra um crescimento acentuado para distncias at 500 m para depois se estabilizar, o que caracteriza agrupamento nesta faixa de distncias.

Figura 2-4 Funo vizinho-mais-prximo para mortalidade infantil neonatal em Porto Alegre.Anlise Espacial de Dados Geogrficos

2-7

A anlise de vizinhana pode ser usada como mtodo formal para se comparar estatsticamente a distribuio dos eventos observados com o que se esperaria na hiptese da aleatoriedade espacial completa (CSR). Esta metodologia consiste em se criar envelopes de simulao para a distribuio CSR, a fim de se acessar a significncia dos desvios. Na hiptese de CSR, a funo de distribuio G(w) seria dada por um processo de PoissonG ( h) = 1 e h h 02

(2.9)

A estimao simulada para a distribuio G(w) assumindo-se CSR calculada como G i ( h)i k

G ( h) =

k

(2.10)

onde G i ( h) , i=1,2..,k so funes de distribuio empricas, estimadas a partir de

k simulaes independentes dos n eventos, na hiptese de CSR (n eventos independentes e uniformente distribudos). Para verificar a condio de aleatoriedade, calculamos ainda os envelopes de simulao superior e inferior, definidos como se segue: U (h) = max{ Gi (h)}, i = 1,..., k L( h) = min { Gi (h)}, i = 1,..., k

(2.11)

A plotagem da distribuio estimada G ( h) versus a distribuio simuladaG (h) , com a adio dos envelopes inferior e superior, permite medir a

significncia dos desvios relativo a aleatoriedade. Se a condio CSR for vlida para os dados observados, o grfico da curva de G ( h) versus G (h) deve ser praticamente linear com um ngulo de 45 graus. Se o dado apresenta tendncias para agrupamentos, os traados no grfico estaro acima da linha de 45 graus, ao passo que para padres de regularidade os traados ficaro abaixo da linha de 45 graus. A Figura 2-5 mostra um exemplo de grfico mostrando o posicionamento da distribuio e dos envelopes com relao a linha de 45 graus, para os dados referentes mortalidade infantil neonatal em Porto Alegre. Neste caso percebe-se a posio dos envelopes e da distribuio acima da linha de 45 graus, o que caracteriza agrupamento para as distncias em anlise.

Anlise Espacial de Dados Geogrficos

2-8

Figura 2-5 Grfico de G ( h) (estimado) versus G (h) (CSR), com envelopes superior e inferior, para os dados de mortalidade neonatal em Porto Alegre

Embora o mtodo do vizinho mais prximo fornea uma indicao inicial da distribuio espacial, ele considera apenas escalas pequenas. Para se ter informao mais efetiva para o padro espacial em escalas maiores, o melhor mtodo a ser utilizado o da funo K. Funo K A funo K, tambm denominada medida de momento de segunda ordem reduzido, definida para o processo univariado como: K(h) = E(# eventos contidos a uma distncia h de um evento arbitrrio) (2.12) onde # est associado ao nmero de eventos, E() o operador de estimativa, e a intensidade ou nmero mdio de eventos por unidade de rea, assumida constante na regio. Uma estimativa de K(h) :A K (h ) = 2 n

i

n

n

I h ( d ij ) wij

(2.13)

j ,i j

onde A a rea da regio, n o nmero de eventos observados, Ih(dij) uma funo indicatriz cujo valor 1 se (dij) t0 (obtida a partir de ~ g 0 ( s ) ) e o nvel de significncia correspondente por p = ( k + 1 ) ( m + 1 ) .

2.7 REFERNCIAS A referncia das tcnicas mais bsicas apresentadas neste captulo o livro de Trevor Bailey, Spatial Data Analysis by Example (Bailey and Gattrel, 1995). As tcnicas de caso-controle espacial foram desenvolvidas por Peter Diggle e colaboradores, e a maior parte das rotinas e algoritmos est disponvel na pgina da do Departamento de Matemtica e Estatstica da Universidade de Lancaster (http://www.maths.lancs.ac.uk). O relatrio tcnico An S+ library on risk estimation and cluster detection in case-control studies, de Jarner, M. F. and Diggle, P. J., mostra as funes desenvolvidas e como us-las. Est disponvel em http://www.maths.lancs.ac.uk/dept/stats/techabstracts02.html. Os modelos aditivos generalizados, que servem de base para a extenso espacial podem ser melhor estudados em HASTIE, T. J.; TIBSHIRANI, R. J., 1990, Generalized Additive Models. London:Chapman and Hall. Um excelente livro para estudar modelos de regresso o HOSMER, D. W.; LEMESHOW, S., 1989, Applied Logistic Regression. New York:Wiley. Os trabalho sobre mortalidade infantil em Porto Alegre foi publicado no nmero especial dos Cadernos de Sade Pblica sobre o tema de estatsticas espaciais em sade (volume 17(5), outubro-novembro 2001, 1251-1261), disponvel na Internet (www.scielo.br).

1. DIGGLE, P. J., 1992. Point process modelling in environmental epidemiology. Relatrio Tcnico MA92/70, Lancaster: Department of Mathematics and Statistics, Lancaster University. 2. KELSALL, J. E.; DIGGLE, P. J. , 1995b. Non-parametric estimation of spatial variation in relative risk. Statistics in Medicine, 14:2335-2342. 3. KELSALL, J. E.; DIGGLE, P. J., 1998. Spatial variation in risk of disease: a nonparametric binary regression approach. Applied Statistics, 47:559-573.

Anlise Espacial de Dados Geogrficos

2-15

3

ANLISE ESPACIAL DE SUPERFCIESEduardo Celso Gerbi Camargo Suzana Druck Fucks Gilberto Cmara

3.1 INTRODUO No captulo anterior, apresentamos tcnicas de Anlise Espacial para eventos discretos, associados a ocorrncias pontuais. Neste captulo, apresentamos tcnicas para tratamento e anlise de dados de superfcies. De uma forma geral, estes dados esto disponveis na forma de amostras pontuais, e para utiliz-los de forma efetiva em um ambiente de Geoprocessamento, necessitamos de um procedimento de interpolao, para gerar uma representao na forma de grade regular, como ilustrado na Figura 3-1. As amostras so valores representativos do fenmeno estudado, usualmente obtidas a partir de levantamento de campo, e que apresentam consistncia de metodologia e unidade. Conforme explicado no captulo 1, essas amostras podem representam tanto variveis naturais (como teor de argila no solo) como socioeconmicas (como taxa de homicdios).

Figura 3-1 Ilustrao do processo de interpolao: amostras (cruzes) e aproximao da superfcie por uma grade regular (crculos). Para gerar superfcies que aproximem o fenmeno estudado de forma realista, necessrio modelar sua variabilidade espacial. Os modelos que objetivam gerar superfcies a partir de procedimentos de interpolao, de forma geral, representam a varivel em estudo como uma combinao da variabilidade em larga e pequena

escala. Esse enfoque, entretanto, no nico. Assim, pode-se tomar trs grandes abordagens: Para tanto, pode-se tomar trs grandes abordagens: Modelos determinsticos de efeitos locais: cada ponto da superfcie estimado apenas a partir da interpolao das amostras mais prximas, utilizando funes como inverso do quadrado da distncia. A suposio implcita que predominam os efeitos puramente locais. Neste caso, no feita qualquer hiptese estatstica sobre a variabilidade espacial. Estes interpoladores sero apresentados na seo 3.2 deste captulo. Modelos determinsticos de efeitos globais: a suposio implcita nesta classe de interpoladores que, para a caracterizao do fenmeno em estudo, predomina a variao em larga escala, e que a variabilidade local no relevante. Este caso do interpoladores por superfcies de tendncia, apresentados na seo 3.3 deste captulo. Modelos estatsticos de efeitos locais e globais (krigagem): cada ponto da superfcie estimada apenas a partir da interpolao das amostras mais prximas, utilizando um estimador estatstico. Esses procedimentos requerem que a variabilidade local e global sejam modelada atravs de modelos apresentados como

Z (x ) = j f j + (x )j =1

p

Nesse caso E {Z ( x )} =

j =1

p

j

f j aonde j um conjunto de parmetros

desconhecidos e f j um conjunto de funes bsicas, em geral, polinomiais. Esses estimadores apresentam propriedades de no ser tendenciosos e de procurar minimizar os erros inferenciais. Eles podem ser estimados atravs de procedimentos como a krigagem universal e as funes intrnsecas de ordem k no abordadas nesse captulo. Neste captulo, iremos dar nfase ao uso de tcnicas de krigagem ordinria, ou seja a um caso particular desse modelo global em que p=1 e k=0 , aonde k representa a ordem da funo f j ,e 1 igual a mdia local. A nfase nesse procedimento devido s suas propriedades, sua grande importncia na modelagem de fenmenos naturais e tambm porque esse capitulo objetiva procedimentos que priorizam a interpolao espacial (predio). A modelagem de tendncias ou variao em larga escala se faz necessria quando a etiologia de um fenmeno deve ser estudada e aonde a estimao da tendncia importante na compreenso do fenmeno. As tcnicas da krigagem so discutidas a partir da seo 3.4. Para a comparao entre os interpoladores, foram utilizados dados da EMBRAPA Solos,

obtidos na Fazenda Canchim, em So Carlos - SP. Trata-se de amostragem de 85 observaes georreferenciadas coletadas no horizonte Bw (camada do solo com profundidade mdia de 1m), conforme ilustra a Figura 3-2. Dentre as variveis disponveis, selecionou-se para estudo o teor de argila, cujas estatsticas bsicas amostrais so apresentadas na Tabela 3.1.

Figura 3-2- Disposio das amostras de teor de argila da Fazenda Canchim (EMBRAPA).

Tabela 3-1 - ESTATSTICAS DA AMOSTRA.Nmero de observaes Mdia Varincia Desvio Padro Coeficiente de variao Coeficiente de assimetria Coeficiente de curtose Quartil Inferior Mediana Quartil superior 85 33,035 288,034 16,972 0,514 0,214 2,344 10 33 43

O histograma das amostas mostra que a distribuio do teor de argila levemente alongada direita. Neste caso, a distribuio dita ser positivamente assimtrica, com coeficiente de assimetria de 0,214. Quanto ao grau de achatamento, o coeficiente de curtose (2,344) indica que a distribuio

ligeiramente platicrtica. Dentre outros valores apresentados na Tabela 3-1, nota-se que a mdia e a mediana, medidas que procuram caracterizar o centro da mesma distribuio de freqncias, possuem valores prximos (33,035 e 33,0), respectivamente. Assim sendo, a distribuio da varivel em estudo, pode ser considerada aproximadamente simtrica.

3.2 MODELOS DETERMINSTICOS LOCAIS Uma alternativa simples para gerar uma superfcie bidimensional a partir de amostras pontuais ajustar uma funo bidimensional sobre os amostras considerados, compondo uma superfcie cujo valor ser proporcional local intensidade de amostras. A formulao geral para este tipo de interpolao :

wij z j zi =j =1 n

n

wijj =1

,

(3.1)

onde: zi o valor de cota de um ponto i qualquer da grade, zj a cota de uma amostra j vizinha do ponto i da grade e wij um fator de ponderao. A Figura 3-3 ilustra o procedimento de estimao.

Figura 3-3 Ilustrao do processo de interpolao por estimador local: (a) configurao original de amostras; (b) grade regular superposta s amostras; (c) interpolao de um valor a partir dos vizinhos; (d) grade regular resultante

Variaes desse esquema bsico so os interpoladores: (a) por vizinho mais prximo; (b) por mdia simples; (c) por mdia ponderada; Nos trs primeiros casos, considera-se uma regio em torno do ponto a ser interpolado como contendo os pontos que influenciam na interpolao. A interpolao por vizinho mais prximo definida pela escolha de apenas uma amostra vizinha para cada ponto da grade. Este interpolador deve ser usado quando se deseja manter os valores de cotas das amostras na grade, sem gerar valores intermedirios. A interpolao por mdia simples considera o valor de cota z do elemento da grade igual a mdia aritmtica dos valores de cota das amostras vizinhas. Neste caso considera-se que o fator de ponderao wij igual a 1/n para qualquer amostra considerada. Na interpolao por mdia ponderada o valor de cota de cada elemento da grade definido pela mdia ponderada dos valores de cota das amostras vizinhas. A ponderao mais usada na prtica o inverso da distncia euclidiana do ponto da grade amostra considerada ou seja:k wij = 1 d ij ,

(3.2)

onde: k o expoente da distncia, geralmente igual a 1 ou 2 e; dij o valor de distncia da amostra j ao ponto i da grade, expresso por:dij = ( xi x j ) 2 + ( yi y j ) 2

(3.3)

Uma comparao visual entre os resultados desses interpoladores mostrada na Figura 3-4 para os dados do teor de argila da Fazenda Canchim. Os mapas ilustram os defeitos tpicos dessas funes simples: as funes de vizinho mais prximo e mdia simples tendem a produzir superfcies com variaes abruptas; no caso do inverso do quadrado da distncia, os mximos locais tendem a ser muito acentuados, formando picos artificiais.

Figura 3-4 - Comparao entre interpoladores de mdia mvel, para o mesmo conjunto de amostras. direita, inverso do quadrado da distncia; no centro, mdia simples; esquerda, vizinho mais prximo. Regies mais claras representam alto valores e vice-versa. Um refinamento desses estimadores o uso de uma funo de ponderao mais complexa que a mdia simples ou o inverso do quadrado da distncia. Esta classe de estimadores descrita na literatura como kernel estimators, ou estimadores de densidade no-paramtricos. Estes estimadores generalizam a idia de mdia mvel local, ao supor que a densidade do fenmeno varia localmente de forma suave, sem picos nem descontinuidades. Seu objetivo produzir superfcies mais suaves, que se espera mais representativas de fenmenos naturais e socioeconmicos. Estes estimadores so do mesmo tipo que os discutidos no captulo 2 para o caso de eventos pontuais, agora generalizados para o caso de amostras. Um kernel estimator um estimador cujos parmetros bsicos so: (a) um raio de influncia que define a vizinhana do ponto a ser interpolado; (b) uma funo de estimao com propriedades convenientes de suavizao do fenmeno. Para toda posio zi cujo valor queremos estimar, o estimador de intensidade ser computado a partir dos valores das amostras {z1,...zn} contidos num raio de tamanho , e da distncia euclidiana dij entre a i-sima posio e a j-sima amostra (como expresso na equao 3.3), a partir de funes do tipo

zi =

k( ij ) z jj =1 n

n

d

k( j =1

dij

, dij

(3.4)

)

Esta frmula uma generalizao da equao 3.1, na qual o cmputo dos pesos wij foi substitudo por uma funo generalizada dependente da distncia. Exemplos destas funes incluem o kernel gaussianok ( x, y, ) = d 2 ij exp , 2 2 2 1

(3.5)

ou o kernel de quarta ordemk ( x, y, ) = 32 d ij 2 (1 )

2

2

(3.6)

Para ilustrar esta classe de estimadores, foram geradas duas superfcies a partir das mesmas amostras usadas para produzir os mapas da Figura 3-4. A partir de um kernel de quarta ordem (equao 3.6), foram gerados dois mapas mostrados na Figura 3-5, com raios de busca de 500 e 1500 metros. A comparao entre os mapas mostra a grande importncia de uma seleo apropriada do raio de busca no uso de kernel estimators. No primeiro mapa predominam os efeitos locais, pelo uso de um raio de busca reduzido; o segundo mapa evidencia melhor a distribuio do fenmeno, pelo uso de um raio mais apropriado aos dados. Em resumo, os kernel estimators so uma alternativa vivel a mtodos mais sofisticados de interpolao, pois no requerem a parametrizao da estrutura de correlao espacial (como no caso da geoestatstica). As superfcies interpoladas so suaves e aproximam muitos fenmenos naturais e socioeconmicos. As desvantagens destes estimadores so a forte dependncia no raio de busca e a excessiva suavizao da superfcie, que pode em alguns casos esconder variaes locais importantes.

Figura 3-5- Superfcies de teor de argila interpoladas por kernel de quarta ordem. esquerda, raio de busca de 500m; direita, raio de busca de 1500m.

3.3 SUPERFCIES DE TENDNCIA As superfcies de tendncia so interpoladores determinsticos globais. A superfcie aproximada por um ajuste polinomial aos dados, atravs de um processo de regresso mltipla entre os valores do atributo e as localizaes geogrficas. Essa funo polinomial ento utilizada para estimar os valores dos pontos em todas as localizaes de uma grade regular que aproxima a superfcie. As superfcies de tendncia buscam modelar a variao espacial em larga escala atravs de uma regresso mltipla entre os valores de atributo e as localizaes geogrficas. A sada uma funo polinomial na qual o valor do atributo expresso em funo das coordenadas da superfcie, expressas em duas ou trs dimenses. Exemplos incluem equaes lineares do tipo:

z = 1 + 2 x + 3 ye equaes quadrticas como:w = 1 + 2 x + 3 y + 4 xy + 5 x 2 + 6 y 2

(3.7)

(3.8)

A suposio implcita nos interpoladores por superfcies de tendncia que, para a caracterizao do fenmeno em estudo, predomina a variao em larga escala, e que a variabilidade local no relevante. Neste modelo, a funo de autocorrelao continua decaindo mesmo aps ultrapassar a distncia onde h influncias locais; a covarincia no se estabiliza com a distncia e assim o fenmeno analisado no-estacionrio.

Para o caso dos dados de teor de argila da Fazenda Canchim (acima descritos), foi realizada uma anlise de tendncia usando uma regresso linear. Os ajustes indicaram um coeficiente de determinao (R2 ajustado) de apenas 17,3%, o que indica no haver efeitos espaciais significativos de larga escala. Deste modo, pode-se esperar que estes dados sejam modelveis por interpoladores locais, sejam determinsticos (seo 3.2) ou estocsticos (seo 3.4 e seguintes). Um exemplo tpico de superfcies de tendncia o uso de dados de longitude, latitude e altitude para estimar a distribuio de temperatura. Neste caso, o objetivo foi estimar a distribuio de temperatura para o estado de Santa Catarina, para a poca do plantio de soja, em intervalos de 10 dias (decndios). Partindo da poca recomendada para semeadura e do ciclo de diferentes cultivares de soja, determinou-se um perodo de anlise compreendido entre 11/10 e 20/05 (22 decndios), permitindo que cultivares com ciclos diferentes, semeadas dentro da poca recomendada, tivessem todo o seu ciclo avaliado neste estudo. Foram coletados dados de temperatura mdia diria e precipitao diria de 27 estaes meteorolgicas monitoradas pela Empresa de Pesquisa Agropecuria e Extenso Rural de Santa Catarina S. A. Epagri, com uma srie histrica de aproximadamente cinco anos, mostrados na Figura 3-6.

Figura 3-6 Distribuio espacial das estaes monitoradas pela Epagri. A partir dos dados dirios, foi calculada a mdia decendial. Esta mdia das 27 estaes foi utilizada no clculo de superfcies de tendncia a partir de uma equao do tipo:

z ( x, y , h) = 1x+ 2 y + 3h + 4

(3.9)

onde z a temperatura calculada a partir da longitude (x), latitude (y) e altitude (h). Para o primeiro decndio (11/10 a 20/10), os resultados esto mostrados na Tabela 3.1. Na anlise dos coeficientes da regresso, mostrada na Tabela 3.2, a relao entre as variveis independentes com a varivel dependente (temperatura mdia decendial) foi verificada, inicialmente, pelo teste F e, depois,

pelo teste t de Student. Esta anlise indicou todos os coeficientes como significativos. A normalidade dos resduos foi avaliada pelo teste de Keifer-Salmon, e aceita a hiptese.Tabela 3-2 - Coeficientes para Estimativa de Temperatura em Santa Catarina (Decndio de 11/10 a 20/10).= Valor Intercepto Latitude Longitude Altitude R ajustado2

Teste F 7,169 0,169 0,085 0,000

Teste T p-valor Comentrios Significativo -2,637 5,488 -16,162 (idem) (idem) (idem)

9,475 -0,447 0,466 -0,005 0,909

A grande vantagem das superfcies de tendncia sua simplicidade e facilidade de clculo. No entanto, a suposio implcita do modelo, em negligenciar a variabilidade local, no realista para a maior parte dos dados naturais. Adicionalmente, os parmetros estimados so muito sensveis a valores extremos (outliers). Apesar destes problemas, as superfcies de tendncia so teis para remover efeitos de primeira ordem, quando a mdia varia de forma consistente no espao. Outros usos importantes so a anlise dos resduos de estimao; tais resduos tambm so bastante informativos, pois mostram a existncia de subregies que apresentam diferenas significativas na tendncia geral. No exemplo apresentado, trata-se de uma situao favorvel, em que, em funo do comportamento da temperatura, da poca do ano e das caractersticas do estado de Santa Catarina, apenas a variao em larga escala foi capaz de produzir estimativas acuradas. Esta situao no a mais usual. Na prtica, na maior parte das vezes as variaes locais no podem ser ignoradas. Neste caso, ser preciso modelar o comportamento da varivel e para isto, utiliza-se a abordagem geoestatstica, descrita a seguir.

3.4 MODELOS ESTATSTICOS DE EFEITOS LOCAIS E GLOBAIS: KRIGAGEM 3.1.1 FUNDAMENTAO TERICA

A krigagem compreende um conjunto de tcnicas de estimao e predio de superfcies baseada na modelagem da estrutura de correlao espacial. A hiptese implcita no procedimento geoestatstico que o processo estudado estacionrio (veja-se a definio de estacionariedade no captulo 1 do livro). Os passos num estudo empregando tcnicas de krigagem incluem: (a) anlise exploratria dos dados; (b) anlise estrutural (modelagem da estrutura de correlao espacial); (c) interpolao estatstica da superfcie. O procedimento de interpolao chamado de krigagem em honra a Daniel Krige, o pioneiro em introduzir o uso de mdias mveis para evitar a superestimao sistemtica de reservas em minerao. O que diferencia a krigagem de outros mtodos de interpolao a estimao de uma matriz de covarincia espacial que determina os pesos atribudos s diferentes amostras, o tratamento da redundncia dos dados, a vizinhana a ser considerada no procedimento inferencial e o erro associado ao valor estimado. Alm disso, a krigagem tambm fornece estimadores com propriedades de no tendenciosidade e eficincia. A estrutura terica da krigagem est baseada no conceito de varivel regionalizada, desenvolvida por Georges Matheron. Uma varivel regionalizada uma varivel distribuda no espao (ou tempo) cujos valores so considerados como realizaes de uma funo aleatria (ou processo aleatrio, ou campo aleatrio, ou processo estocstico). Esta teoria permite incluir hipteses estatsticas em processos espaciais locais. A variao espacial de uma varivel regionalizada pode ser expressa pela soma de trs componentes: a) uma componente estrutural, associada a um valor mdio constante ou a uma tendncia constante; b) uma componente aleatria, espacialmente correlacionada; e c) um rudo aleatrio ou erro residual. Se o vetor x representa uma posio em uma, duas ou trs dimenses, ento o valor da funo aleatria Z, em x, dada por:

Z ( x ) =( x ) + ' ( x ) + ' 'onde:

(3.10)

(x) uma funo determinstica que descreve a componente estrutural de Z em x;

(x) um termo estocstico correlacionado, que varia localmente;

um rudo aleatrio no correlacionado, com distribuio normal com mdia zero e varincia 2.

Figura 3-7- Componentes de uma varivel regionalizada. As Figura 3-7(a) e (b) ilustram as trs componentes principais da variao espacial. A Figura 3.8(a) apresenta uma componente determinstica que possui um comportamento regular (diferena entre os nveis mdios), enquanto a componente determinstica na Figura 3.8(b) apresenta uma tendncia constante. A hiptese mais simples sobre o comportamento da varivel regionalizada que a mdia do fenmeno, (x), seja constante na regio de estudo, o que implica em no haver variao significativa na larga escala. Esta hiptese d origem aos interpoladores de Krigagem ordinria, discutida a seguir. No caso de se querer modelar uma tendncia, h vrios mtodos disponveis: Krigagem Universal, Funes Aleatrias Intrnsecas de Ordem k, no discutidos neste captulo. Na hiptese da Krigagem ordinria, (x) constante e denotada por m. Deste modo, o valor esperado da funo aleatria Z nas posies x e x + h so iguais a m. Isto implica que o valor esperado da diferena entre os valores observados em x e x + h, separados por um vetor de distncia h, nulo: E [Z(x) - Z(x+h)] = 0 (3.11)

Admite-se tambm que o fenmeno considerado seja estacionrio de segunda ordem, isto , a covarincia entre dois pares quaisquer Z(x) e Z(x + h), separados por um vetor distncia h, existe e depende somente de h. Ento: C(h) = COV [ Z(x), Z(x+h)] = E[Z(x).Z(x+h)] m2 (3.12)

Adicionalmente, a estacionariedade da covarincia implica na estacionariedade da varincia:

Var(Z(x)) = E [Z(x)- m]2 = E[Z2(x)] 2E[Z(x)].m + m2 ou ainda Var(Z(x)) = E[Z2(x)] 2m.m + m2 = E[Z2(x)] m2 = C(0)

(3.13)

(3.14)

Deste modo, verifica-se que as hipteses de mdia constante e estacionariedade da covarincia implicam que a determinao da funo C(h) suficiente para caracterizar a varivel regionalizada. Isto quer dizer que, com base na Equao 3.10, a funo C(h) permite caracterizar o termo estocstico (x). Para determinar C(h), utiliza-se uma funo auxiliar, chamada de funo variograma 2(h), definida por: 2(h)= E[Z(x) - Z(x+h)]2 que pode ser desenvolvida em: 2(h)= E[Z2(x) -2 Z(x).Z(x+h) - Z2(x+h)] ou ainda 2(h)= E[Z2(x)] -2 E[Z(x).Z(x+h)] - E[Z2(x+h)] Da equao (3.14), obtm-se E[Z2(x)] = E [Z2(x+h)] = C(0) + m2 e da equao (3.13) obtm-se E[Z(x).Z(x+h)] = C(h) + m2 Substituindo as equaes (3.18) e (3.19) na equao (3.17), obtm-se: 2(h) = 2C(0) 2C(h) ou (h) = C(0) C(h) onde: (3.20) (3.19) (3.18) (3.17) (3.16) (3.15)

(h) representa o semivariograma, que metade do variograma. A relao em(3.20) indica que sob a hiptese de estacionariedade de 2a ordem, que a covarincia e o semivariograma so formas alternativas de caracterizar a autocorrelao dos pares Z(x) e Z(x+h) separados pelo vetor h.

3.1.2

DETERMINAO EXPERIMENTAL DO SEMIVARIOGRAMA

O semivariograma uma ferramenta bsica de suporte s tcnicas de Krigeagem, pois permite representar quantitativamente a variao de um fenmeno regionalizado no espao. O semivariograma pode ser calculado experimentalmente, considerando o esquema de amostragem em duas dimenses mostrado na Figura 3-8, onde z(x) denota o valor de uma posio cujos componentes so (x1, y1), e z(x+h) o valor da amostra numa posio cujos componentes so (x2 , y2), sendo h um vetor distncia (mdulo e direo) que separa os pontos.

y z(x1+h)h

y2

y1

z(x1)

x1

x2

x

Figura 3-8 Amostragem em duas dimenses. A determinao experimental do semivariograma, para cada valor de h, considera todos os pares de amostras z(x) e z(x+h), separadas pelo vetor distncia h, a partir da equao:

(h ) =onde:

1 N( h ) [ z( xi ) z ( xi + h )] 2 2 N ( h ) i =1

(3.21)

(h) o semivariograma estimado e N(h) o nmero de pares de valoresmedidos, z(x) e z(x+h), separados pelo vetor h. Esta frmula, entretanto, no robusta. Podem existir situaes em que variabilidade local no constante e se modifica ao longo da rea de estudo (heteroscedasticidade). Um caso particular desse fato (denominado efeito proporcional) ocorre quando as distribuies so assimtricas e a mdia se correlaciona com a varincia. O estimador de semivariograma apresentado em (3.22) no resistente a esse efeito e apresenta tendncias que impedem a estimao correta de seus parmetros. Para expresses alternativas, deve-se consultar Cressie (1993).

Na prtica, pode-se fazer a hiptese adicional de que o fenmeno isotrpico (com comportamento igual em todas as direes). Neste caso, a determinao experimental do semivariograma depende apenas da distncia entre as amostras e no da direo relativa entre elas. O tratamento da anisotropia (caso em que a estrutura espacial do fenmeno varia conforme a direo) discutido no Apndice deste captulo. As hipteses de estacionariedade e mdia constante levam a postular um comportamento idealizado para o semivariograma experimental, mostrado na Figura 3-9. Espera-se que observaes mais prximas geograficamente tenham um comportamento mais semelhante entre si do que aquelas separadas por maiores distncias. Assim, o valor absoluto da diferena entre duas amostras z(x) e z(x+h) deveria crescer medida que aumenta a distncia entre elas, at um valor na qual os efeitos locais no teriam mais influncia.^ (h)

Patamar (C)

Efeito Pepita (Co) Alcance (a) h

Figura 3-9 Parmetros do variograma.

Os parmetros do semivariograma podem ser observados na Figura 3-9:

Alcance (a): distncia dentro da qual as amostras apresentam-se correlacionadas espacialmente. Patamar (C): o valor do semivariograma correspondente a seu alcance (a). Deste ponto em diante, considera-se que no existe mais dependncia espacial entre as amostras, porque a varincia da diferena entre pares de amostras (Var [Z(x) - Z(x+h)]) torna-se aproximadamente constante. Efeito Pepita (C0): idealmente, (0)=0. Entretanto, na prtica, medida que h tende para zero, (h) se aproxima de um valor positivo chamado Efeito Pepita (C0), que revela a descontinuidade do semivariograma para distncias menores do que a menor distncia entre as amostras. O efeito pepita o valor da

semivarincia para a distncia zero e representa a componente da variabilidade espacial que no pode ser relacionado com uma causa especfica (variabilidade ao acaso). Parte desta descontinuidade pode ser tambm devida a erros de medio, sendo impossvel quantificar se a maior contribuio provm dos erros de medio ou da variabilidade de pequena escala no captada pela amostragem. 3.1.3 MODELOS TERICOS O grfico do semivariograma experimental, (h) , calculado atravs da Equao (3.22), formado por uma srie de valores, conforme ilustra a Figura 3-9, sobre os quais se objetiva ajustar uma funo. importante que o modelo ajustado represente a tendncia de (h) em relao a h. Deste modo, as estimativas obtidas a partir da krigagem sero mais exatas e, portanto mais confiveis. O procedimento de ajuste no direto e automtico, como no caso de uma regresso, por exemplo, mas sim interativo, pois nesse processo o intrprete faz um primeiro ajuste e verifica a adequao do modelo terico. Dependendo do ajuste obtido, pode ou no redefinir o modelo, at obter um que seja considerado satisfatrio. Os modelos aqui apresentados so considerados modelos bsicos, denominados modelos isotrpicos. Esto divididos em dois tipos: modelos com patamar e modelos sem patamar. Modelos do primeiro tipo so referenciados na geoestatstica como modelos transitivos. Alguns dos modelos transitivos atingem o patamar (C) assintoticamente. Para tais modelos, o alcance (a) arbitrariamente definido como a distncia correspondente a 95% do patamar. Modelos do segundo tipo no atingem o patamar, e continuam aumentanto enquanto a distncia aumenta. Tais modelos so utilizados para modelar fenmenos que possuem capacidade infinita de disperso. Os modelos transitivos mais utilizados so: modelo esfrico (Sph), modelo exponencial (Exp) e modelo gaussiano (Gau). Estes modelos esto apresentados na Figura 3-10 com o mesmo alcance (a).

(h)

Modelo Exponencial Modelo Esfrico Modelo Gaussiano

C=1

0 0

a

h

Figura 3-10 Representao grfica de modelos transitivos normalizados. Modelo Esfrico O modelo esfrico um dos modelos mais utilizados e est representado na Figura 3-10. A equao normalizada deste modelo :

0 , | h |=0 3 | h | | h | 0,5 Sph ( h ) =1,5 a , 0 a Modelo Exponencial

(3.22)

Um outro modelo bastante utilizado o modelo exponencial, o qual apresentado na Figura 3-10. A equao normalizada deste modelo :

0 , | h |=0 xp( h )= | h | 1exp a , | h |0

(3.23)

Este modelo atinge o patamar assintoticamente, com o alcance prtico definido como a distncia na qual o valor do modelo 95% do patamar. Modelo Gaussiano O modelo gaussiano um modelo transitivo, muitas vezes usado para modelar fenmenos extremamente contnuos. Sua formulao dada por:

0 , | h |=0 2 Gau( h )= | h | 1exp , | h |0 a

(3.24)

Semelhante no modelo exponencial, o modelo gaussiano atinge o patamar assintoticamente e o parmetro a definido como o alcance prtico ou distncia na qual o valor do modelo 95% do patamar. O que caracteriza este modelo seu comportamento parablico prximo origem, conforme a Figura 3-10 . At este ponto foram apresentados os principais modelos bsicos normalizados, os quais so utilizados para ajustar o semivariograma experimental. Na prtica, os semivariogramas experimentais possuem valores de efeito pepita (Co) maior que zero e valores de patamar (C) maiores que a unidade, conforme ilustrado na Figura 3-11.(h)Modelo Exponencial Modelo Esfrico Modelo Gaussiano

C

C1 C = Co + C1 C1 : Contribuio do Modelo a

Co 0

h

Figura 3-11 - Representao grfica de semivariogramas experimentais e modelos tericos. Em resumo, os semivariogramas dos modelos transitivos bsicos so assim definidos:

Modelo Esfrico de Semivariograma:

0 , | h |= 0 3 | h | 1 | h | 3 =C +C [ Sph (| h |) ] ,0 a Co +C1 Modelo Exponencial de Semivariograma:

(3.25)

,| h |= 0 0 (h)= | h | C o + C 11exp a =C o + C 1 [ Exp (| h |)]

, | h | 0

(3.26)

Modelo Gaussiano de Semivariograma:

,| h |= 0 0 2 (h)= | h | C o + C11exp =C o + C1 [Gau (| h |)] ,| h | 0 a Modelos Aninhados

(3.27)

Existem determinados fenmenos em que so necessrios modelos mais complexos de semivariograma para explicar suas variaes espaciais. Estes modelos so combinaes de modelos simples, denominados aninhados; em muitos casos, os modelos aninhados so necessrios para explicar a variao de fenmenos decorrentes da combinao de fatores independentes de formao. Por exemplo, um modelo aninhado til em estudos de minerao e pesquisa de solo o duplo esfrico, definido como:

3 3 | h | 1 | h | C0 + C1 2 a 2 a = 1 (h) , 0 < | h | a1 1 1 3 (h)= 3 | h | 1 | h | C0 + C 2 2 a 2 a = 2 (h) , a1 < | h | a 2 2 2 C + C + C ,| h | > a 1 2 2 0 0 ,| h | = 0 onde,

(3.28)

a1 e C1 correspondem aos parmetros de alcance e contribuio, respectivamente, do primeiro modelo esfrico ( 1 (h) ). a2 e C2 correspondem aos parmetros de alcance e contribuio, respectivamente, do segundo modelo esfrico ( 2 (h) ).

Este modelo mostrado na Figura 3-12, onde as linhas slida e pontihada representam os modelos de ajuste terico ao semivariograma experimental.

(h)

C2 1 (h) C1 2 (h) a1

C0

a2 h

Figura 3-12 - Representao grfica de um modelo duplo esfrico. Dependendo do fenmeno em estudo, outros modelos aninhados so necessrios para caracterizar a variabilidade espacial.

3.5 KRIGAGEM O termo krigagem derivado do nome Daniel G. Krige, que foi o pioneiro a introduzir o uso de mdias mveis para evitar a superestimao sistemtica de reservas de minerao. Inicialmente, o mtodo de krigagem foi desenvolvido para solucionar problemas de mapeamentos geolgicos, mas seu uso expandiu-se com sucesso no mapeamento de solos, mapeamento hidrolgico, mapeamento atmosfrico e outros campos correlatos. A diferena entre a krigagem e outros mtodos de interpolao a maneira como os pesos so atribudos s diferentes amostras. No caso de interpolao linear simples, por exemplo, os pesos so todos iguais a 1/N (N = nmero de amostras); na interpolao baseada no inverso do quadrado das distncias, os pesos so definidos como o inverso do quadrado da distncia que separa o valor interpolado dos valores observados. Na Krigeagem, o procedimento semelhante ao de interpolao por mdia mvel ponderada, exceto que aqui os pesos so determinados a partir de uma anlise espacial, baseada no semivariograma experimental. Alm disso, a krigagem fornece, em mdia, estimativas no tendenciosas e com varincia mnima1.

1

Estimativas no tendenciosas significam que, em mdia, a diferena entre valores estimados e observados para o mesmo ponto deve ser nula; e varincia mnima significa que estes estimadores possuem a menor varincia dentre todos os estimadores no tendenciosos.

A krigagem engloba um conjunto de mtodos de estimao, incluindo procedimentos estacionrios(krigagem simples e ordinria), no estacionrios (krigagem universal, funoes intrinsicas de ordem k), univariados e multivariados ( co-krigeagem etc). Este captulo limita-se apresentao da krigagem ordinria, descrita a seguir. 3.5.1. KRIGEAGEM ORDINRIA

Considere uma superfcie sobre a qual se observe alguma propriedade do solo, Z, em n pontos distintos, com coordenadas representadas pelo vetor x. Assim, tem-se um conjunto de valores {z(xi), i=1, ..., n}, onde xi identifica uma posio em duas dimenses representada pelos pares de coordenadas (xi, yi). Suponha que se objetive estimar o valor de Z no ponto c. O valor desconhecido de Z(x0) pode ser estimado a partir de uma combinao linear dos n valores observados, adicionado a um parmetro 0 :n Z* ( x 0 ) =0 + i Z(x i )

(3.29)

i =1

Deseja-se um estimador no tendencioso, isto , E [Z(x0) Z*(x0)] = 0 EPKPMF A relao acima impe que as duas mdias sejam iguais; assim aplicando-se a Equao 3.34 em 3.35, obtm-se:n n E [Z(x 0 )]=E 0 + i .Z(x i )m=0 + i m i =1 i =1

(3.31)

A krigagem ordinria no requer o prvio conhecimento da mdia m. Neste caso, para que a igualdade da Equao 3.36 seja satisfeita necessrio que

0 =0 e i =1 .Portanto, o estimador de Krigeagem ordinria :i =1 n

n

Z * (x 0 ) = i Z ( x i ) , comi =1

n

=1i i =1

(3.32)

Minimizando a varincia do erro (Var [Z(x0) Z*(x0)]) na condio de

i =1 ,i =1

n

os pesos i so obtidos a partir do seguinte sistema de equaes, denominado sistema de krigeagem ordinria:

n j C( x i , x j ) = C( xi , x0 ) para i = 1, ..., n j=1 n j =1 j=1 onde,

(3.33)

C(xi, xj) e C(xi, x0) so, respectivamente, a semivarincia entre os pontos xi e xj e entre os pontos xi e x0.

o multiplicador de Lagrange necessrio para a minimizao da varincia do erro.

A correspondente varincia minimizada do erro, denominada varincia de krigagem ordinria ( 2 ), dada pela expresso ko2 ko =Var[ Z ( x ) Z * ( x 0 )] = C( 0 ) i C( x i ,x 0 ) i =1 n

(3.34)

A krigagem ordinria um interpolador exato no sentido de que, quando as equaes acima forem usadas, os valores interpolados iro coincidir com os valores dos pontos amostrais. Alm disso, a varincia da krigagem ordinria, indicada na equao (3.35), fornece informao importante sobre a confiabilidade dos valores interpolados.

3.6 ESTUDO DE CASO ` Tomemos como exemplo a distribuio amostral apresentada na Figura 3-2, cuja as estatsticas descritivas esto sumarizadas na Tabela 3-1. A anlise da variabilidade espacial, do teor de argila, realizada com o auxlio do semivariograma. Esta uma das etapas mais importantes, pois o modelo de semivariograma escolhido representa a estrutura de correlao espacial a ser utilizada nos procedimentos inferenciais de krigagem. O resultado apresentado na Figura 3-13, mostra o semivariograma omnidirecional (caso isotrpico) e seu modelo de ajuste.

(h)390 351 312 273 234 195 156 117 78 39 0 0 1000

Semivariograma Omnidirecional Modelo Esferico

h 2000 3000 4000 5000

Figura 3-13 Semivariograma omnidirecional e modelo esfrico O modelo de ajuste, mostrado na Figura 3-13, tm os seguintes parmetros: Estrutura tipo Esfrica, Efeito Pepita (Co) = 118,85; Contribuio (C1) = 230,89 e Alcance (a) = 3989,20. O modelo terico, normalizado em relao ao alcance, leva a seguinte notao:

h h ( h ) = C o + C1 Sph =118,85 + 230,89 Sph a 3989,20

(3.35)

Uma vez definido o modelo e validado o mesmo, a etapa seguinte refere-se estimao de krigagem ordinria. Como resultado tm-se uma grade de valores estimados e uma outra que refere-se varincia de krigagem. Ambas so convertidas em superfcies e apresentadas na Figura 3-14. Na Figura 3-14 esquerda, regies mais claras representam altos valores de teor de argila e vice-versa. Diferente dos mtodos determinsticos (ver Figura 3-4), o uso da krigagem ordinria como mtodo de interpolao espacial permitiu capturar e, portanto, representar com mais qualidade, a variabilidade espacial inerente propriedade em estudo. Alm disso, conforme ilustra a Figura 3-14 direita, a krigagem ordinria fornece a varincia da estimativa (denominada varincia de krigagem). Tal informao pode ser til para identificar regies onde a amostragem pode ser melhorada.

Figura 3-14 esquerda a superfcie do teor de argila e direita a varincia de krigagem. Com algumas ressalvas, o mtodo da mdia ponderada pelo inverso do quadrado da distncia, produz resultado que se assemelha ao resultado da krigagem ordinria. O ponto crtico, porm, ocorre em regies onde h agrupamento (clusters) de amostras. A krigagem ordinria, por utilizar intrinsecamente uma estrutura de covarincia, consegue tratar redundncias (clusters), isto , atribuir pesos adequados para os agrupamentos de amostras. Fato este no considerado nos procedimentos determinsticos. Alm disso, na krigagem ordinria, a rea de influncia na interpolao indicada pelo alcance; j nos procedimentos determinsticos, como o mtodo da mdia ponderada pelo inverso do quadrado da distncia, o raio de busca arbitrrio. Os resultados produzidos pelos mtodos mdia simples e vizinho mais prximo, so menos expressivos com relao aos demais. O mtodo da mdia simples produz resultado que apresenta imbricao, principalmente na regio central da rea de estudo. J o mtodo de inferncia relativo ao vizinho mais prximo, embora sendo o que pior expressa a variabilidade espacial do fenmeno estudado, revela a rea de influncia de cada ponto de observao. Tal informao de grande valia, como, por exemplo, numa anlise preliminar para deteco de valores amostrais suspeitos. Um outro fato que merece ateno, que os resultados apresentados na Figura 3-14 so oriundos de um modelo isotrpico. A suposio de isotropia, que rara em fenmenos naturais, simplifica a modelagem por procedimentos geoestatsticos. Se a anisotropia existe, deve ser detectada e modelada, afim de representar com mais qualidade, a variabilidade espacial inerente propriedade em estudo. No

apndice ao Captulo, so apresentados alguns tpicos sobre anisotropia e uma tcnica para a modelagem da mesma.

3.7 CONCLUSES Conclui-se que possvel melhorar a distribuio espacial das variveis ambientais significativamente quando procedimentos geoestatsticos so aplicados. Ficou constatado que o teor de argila varia mais intensamente numa direo do que em outra. Tal fato refere-se anisotropia da varivel em estudo. Muitos aspectos particulares dos dados ficariam ocultos sem o uso de semivariogramas e da modelagem da anisotropia, mostrando, por exemplo, a tendncia da distribuio espacial nos dados de teor de argila. Informaes como estas no so apresentadas quando se usam apenas parmetros estatsticos clssicos como mdias e varincias ou ento, procedimentos determinsticos.

3.8 REFERNCIAS BIBLIOGRFICAS A estrutura terica da geoestatstica est apresentadas na Teoria das Variveis Regionalizadas, desenvolvida por Matheron (1971) e um artigo detalhado e terico sobre geoestatstica escrito por Journel (1988). A referncia bsica sobre geoestatstica, com um conjunto extensivo de exemplos o livro de Issaks e Srivastava (1989). A descrio da GSLIB, uma das bibliotecas mais utilizadas para o desenvolvimento de programas em geoestatstica, pode ser encontrada no livro de Deutsch e Journel (1992). Com relao integrao entre geoestatstica e SIGs, o leitor deve referir-se a Camargo (1997), que descreve o desenvolvimento de um mdulo geoestatstico no ambiente SPRING. Referncias bsicas sobre mtodos de interpolao so descritas por Burrough (1987). O exemplo de superfcies de tendncia est baseado no trabalho de Bnisch (2001). Bnisch, S. (2001) Geoprocessamento Ambiental com Tratamento de Incerteza: O Caso do Zoneamento Pedoclimtico para a Soja no Estado de Santa Catarina. Dissertao (Mestrado em Sensoriamento Remoto) Instituto Nacional de Pesquisas Espaciais, So Jos dos Campos. Burrough, P. (1987). Principles of geographical information systems for land resources assessment. Oxford, Clarendon Press. Camargo, E. (1997). Desenvolvimento, Implementao e Teste de Procedimentos Geoestatsticos (Krigeagem) no Sistema de Processamento de Informaes Georreferenciadas (SPRING). Dissertao (Mestrado em Sensoriamento Remoto) Instituto Nacional de Pesquisas Espaciais, So Jos dos Campos.

Deutsch, C. e A. Journel (1992). GSLIB: Geostatistical Software Library and users guide. New York, Oxford University Press. Issaks, M. e E. Srivastava (1989). An Introduction to Applied Geostatistics. New York, Oxford University Press, 1989. Journel, A. (1988). Fundamentals of geostatistics in five lessons. California, Stanford Center for Reservoir Forecasting Applied Earth Sciences Department. Matheron (1963, 1971). The theory of regionalized variables and its applications. Paris, Les Cahiers du Centre de Morphologie Mathematique de Fontainebleu, 1971. 211p.

APNDICE MODELAGEM DA ANISOTROPIAA anisotropia uma caracterstica muito freqente nos elementos da natureza, isto , a variabilidade ou distribuio espacial de tais elementos ocorre mais intensamente numa direo e menos intensamente em outra direo. Tome como exemplo o mapeamento do teor de zinco, dentro de uma regio de interesse, pouco provvel que tal propriedade se espalhe igualmente em todas as direes. Para lidar com a anisotropia, importante que o modelo proposto represente bem a variabilidade espacial da propriedade em estudo. Procedimentos determinsticos para este fim so limitados, porque no consideram a estrutura de autocorrelao espacial bem como a anisotropia presente. Modelos mais adequados para este objetivo vem sendo propostos e a geoestatstica engloba esses modelos.

TIPOS DE ANISOTROPIA Antes de apresentar os tipos de anisotropia, necessrio mostrar as convenes direcionais usadas na geoestatstica. Isto resumido conforme ilustra a Figura 3-15.

Figura 3-15 - Convenes direcionais usadas na geoestatstica. Quando os semivariogramas experimentais direcionais apresentam diferenas acentuadas, a distribuio denominada anisotrpica. Se a anisotropia observada e refletida pelo mesmo Patamar (C) com diferentes Alcances (a) do mesmo modelo, ento ela denominada Geomtrica, conforme ilustra a Figura 3-16. Existe ainda um outro tipo de anisotropia em que os semivariogramas experimentais direcionais apresentam os mesmos Alcances (a) e diferentes Patamares (C). Neste caso, a anisotropia denominada zonal. Como a isotropia, a anisotropia zonal tambm pouco presente nas variveis ambientais. O mais comum encontrar combinaes da anisotropia Zonal e Geomtrica, denominada anisotropia

Combinada, conforme Figura 3-16. Na Figura 3-16, a1 e a2 esto relacionados s direes de menor e maior continuidade espacial da varivel, respectivamente.(h) C (h) C1 C21 2 1 2

Co1 Co2

Co a1 a2

h

a1

a2

h

Figura 3-16 esquerda Anisotropia Geomtrica e direita Anisotropia Combinada.

DETEO DA ANISOTROPIA Existem vrias formas de detectar a anisotropia, por exemplo calculando-se os semivariogramas experimentais direcionais em vrias direes, desenhando todos num nico grfico, e visualmente avaliando suas similaridades. Outra forma, atravs do esboo grfico de uma elipse (conhecido tambm como diagrama da rosa), calculada atravs dos alcances obtidos em direes distintas. A forma mais eficiente e direta de detectar a anisotropia atravs do mapa de semivariograma, conhecido tambm como semivariograma de superfcie, que um grfico, 2D, no qual obtm-se uma viso geral da variabilidade espacial da varivel em estudo. Alm disso, sobre o mapa de semivariograma possvel detectar rapidamente os eixos de anisotropia, isto , as direes de maior e menor variabilidade espacial da varivel em anlise. A Figura 3-17 ilustra o mapa de semivariograma aplicado aos dados da EMBRAPA Solos, obtidos na Fazenda Canchim, em So Carlos - SP., conforme descritos na Seo 3.1. Os eixos maior e menor, da elipse, correspondem s direes de maior e menor variabilidade espacial do teor de argila respectivamente. O ngulo de anisotropia tomado da direo norte, em sentido horrio, at o eixo maior; neste caso igual a 17 o. Conseqentemente a direo de menor variabilidade 17o + 90 o = 107 o. Obviamente que a exigncia de ortogonalidade entre os eixos, pode no corresponder realidade, mas necessrio para modelagem dos semivariogramas como ser visto mais adiante.

Figura 3-17 Mapa de Semivariograma do teor de argila. MODELAGEM DA ANISOTROPIA O princpio fundamental na modelagem de anisotropia (geomtrica, zonal ou combinada), consiste em usar todas as estruturas presentes em todas as direes, atribuindo um alcance infinito s inexistentes. Inicialmente identificam-se os eixos de anisotropia, isto , os eixos de maior e de menor variabilidade espacial da varivel em estudo. Isto realizado com auxlio do mapa de semivariograma conforme descrito na seo anterior. Identificados os eixos de anisotropia, calculam-se os dois semivariogramas experimentais direcionais, relativos s direes de maior e menor variabilidade espacial da varivel em estudo, e proced