Estatística Espacial Análise de Padrões de Distribuição de Pontos
-
Upload
devin-rodriquez -
Category
Documents
-
view
47 -
download
0
description
Transcript of Estatística Espacial Análise de Padrões de Distribuição de Pontos
Estatística EspacialEstatística EspacialAnálise de Padrões de Distribuição de Análise de Padrões de Distribuição de PontosPontos
INPE - Divisão de Processamento de INPE - Divisão de Processamento de ImagensImagens
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
22 NOV/99NOV/99
OrganizaçãoOrganização
• IntroduçãoIntrodução
• Distribuição de PontosDistribuição de Pontos
• Caracterização de Distribuição de PontosCaracterização de Distribuição de Pontos
• Estimador de Intensidade (“Kernel Estimador de Intensidade (“Kernel Estimation”)Estimation”)
• Modelagem de Distribuição de PontosModelagem de Distribuição de Pontos
• Método do Vizinho Mais PróximoMétodo do Vizinho Mais Próximo
• Função KFunção K
• Exemplos Práticos com o Sistema SpringExemplos Práticos com o Sistema Spring
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
33 NOV/99NOV/99
Introdução - preliminaresIntrodução - preliminares
• Consideramos aqui fenômenos expressos através de Consideramos aqui fenômenos expressos através de ocorrências pontuais.ocorrências pontuais.
• São observações disponíveis no espaço.São observações disponíveis no espaço.
• Representações pontuais podem corresponder a Representações pontuais podem corresponder a dados comodados como– índice de mortalidade,índice de mortalidade,– ocorrências de doenças,ocorrências de doenças,– localização de espécie vegetais, etc.localização de espécie vegetais, etc.
• ObjetivoObjetivo– aumentar o entendimento do processo verificando aumentar o entendimento do processo verificando
hipóteses viáveis ou inferir valores em áreas sem hipóteses viáveis ou inferir valores em áreas sem
observaçõesobservações..
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
44 NOV/99NOV/99
Introdução - preliminaresIntrodução - preliminaresA L G U N S E X E M P L O SA L G U N S E X E M P L O S
• EpidemologiaEpidemologia– A distribuição dos casos de uma doença formam um A distribuição dos casos de uma doença formam um
padrão no espaço ? Existe associação com alguma fonte padrão no espaço ? Existe associação com alguma fonte de poluição ? Evidência de contágio ?de poluição ? Evidência de contágio ?
• CrimeCrime– Roubos que ocorrem em determinadas áreas estão Roubos que ocorrem em determinadas áreas estão
correlacionados com características sócio econômicas ?correlacionados com características sócio econômicas ?
• GeologiaGeologia– Dado um conjunto de amostras, qual a extensão de um Dado um conjunto de amostras, qual a extensão de um
depósito mineral ?depósito mineral ?
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
55 NOV/99NOV/99
Introdução - preliminaresIntrodução - preliminares
Mapeando a violência - localização pontualMapeando a violência - localização pontual
CACHOEIRINHA
ALVORADA
VIAMÃO
10
Quilômetros
N
50
GUAÍBA
Legenda: Homicídios / Acidentes de transporte / Suicídios Santos,S.M., 1999Santos,S.M., 1999
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
66 NOV/99NOV/99
ClustersClusters
• “Cluster”: qualquer agregado de eventos.– resultado de classificação onde se busca definir um
grupamento de “semelhantes”.
• Cluster espacial – agregado de eventos no espaço ou a ocorrência de
“taxas semelhantes” em área próximas.
• Detecção de cluster espacial – estabelecer a significância de um sobre-risco em um
determinado espaço ou tempo e espaço.
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
77 NOV/99NOV/99
ClustersClusters
• O que causa um “cluster”? – Agentes infecciosos, contaminação ambiental Agentes infecciosos, contaminação ambiental
localizada, efeitos colaterais de tratamentos, etc.localizada, efeitos colaterais de tratamentos, etc.
• Os estudos Os estudos – evidência de tendência geral à clusterização, ou a um evidência de tendência geral à clusterização, ou a um
determinado e predefinido agregado.determinado e predefinido agregado.
• Podem ser usados para pontos ou áreas.Podem ser usados para pontos ou áreas.• Fatores de controle:Fatores de controle:
– distribuição populacional e outras covariáveis que distribuição populacional e outras covariáveis que podem criar agregados.podem criar agregados.
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
88 NOV/99NOV/99
Conceitos BásicosConceitos Básicos
• EstacionariedadeEstacionariedade– AAs propriedades estatísticas da variável independem de sua s propriedades estatísticas da variável independem de sua
localização absoluta, ou seja, a média e a variância são constantes em localização absoluta, ou seja, a média e a variância são constantes em qualquer sub-área e a covariância entre dois pontos quaisquer qualquer sub-área e a covariância entre dois pontos quaisquer depende somente de sua localização relativa;depende somente de sua localização relativa;
• IsotropiaIsotropia– AAlém de estacionário, a covariância depende somente da distância lém de estacionário, a covariância depende somente da distância
entre os pontos e não da direção entre eles.entre os pontos e não da direção entre eles.
• Processo de modelagemProcesso de modelagem– Transformações visando obtenção de estacionariedade;Transformações visando obtenção de estacionariedade;
– Ajuste de modelos.Ajuste de modelos.
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
99 NOV/99NOV/99
Introdução - preliminaresIntrodução - preliminares
• Fenômeno espacial: contínuo ou discretoFenômeno espacial: contínuo ou discreto
• Discreto - espaço contém entidades do mundo realDiscreto - espaço contém entidades do mundo real– Na concepção Spring denominado de modelo de objetosNa concepção Spring denominado de modelo de objetos
– Exs: municípios, quadras, escolas, hospitais, etc...Exs: municípios, quadras, escolas, hospitais, etc...
• Contínuo - informação presente em todas as Contínuo - informação presente em todas as posições posições – Na concepção Spring denominado de modelo de campoNa concepção Spring denominado de modelo de campo
– Exs: temperatura, pressão, teor de argila no solo, etc...Exs: temperatura, pressão, teor de argila no solo, etc...
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
1010 NOV/99NOV/99
Introdução - preliminaresIntrodução - preliminares
C L A S S E S D E P R O B L E M A SC L A S S E S D E P R O B L E M A S
Tipos de DadosTipos de Dados ExemploExemplo Problemas TípicosProblemas Típicos
Análise deAnálise dePadrões PontuaisPadrões Pontuais
EventosEventosLocalizadosLocalizados
Ocorrência deOcorrência deDoençasDoenças
DeterminaçãoDeterminaçãode Padrõesde Padrões
Análise de Análise de SuperficiesSuperficies
Amostras deAmostras deCampoCampo
DepósitoDepósitoMineraisMinerais
Interpolação deInterpolação deSuperfícieSuperfície
Análise deAnálise deÁreasÁreas
Entidades eEntidades eAtributosAtributos
DadosDadosCensitáriosCensitários
RelacionamentoRelacionamentodas entidadesdas entidades
RegressãoRegressão
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
1111 NOV/99NOV/99
Distribuição de PontosDistribuição de Pontos
• Padrão pontual - conjunto de dados consistindo de uma Padrão pontual - conjunto de dados consistindo de uma série de localizações pontuais (psérie de localizações pontuais (p11, p, p22, ...,p, ...,pnn) ) que estãoque estão
associados a eventos de interesseassociados a eventos de interesse dentro da área de dentro da área de estudo.estudo.
Área de EstudoÁrea de Estudo
• pp11
• pp66
• pp55
• pp44
• pp33
• pp22
• pp77
• pp11
• pp88
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
1212 NOV/99NOV/99
• As localizações não estão associadas a valores, As localizações não estão associadas a valores, mas mas apenas a ocorrência dos eventos.apenas a ocorrência dos eventos.
• Dimensão das medidas é zero. Medidas válidas na Dimensão das medidas é zero. Medidas válidas na distribuição de pontos são o # de ocorrências no distribuição de pontos são o # de ocorrências no padrão e as localizações geográficas.padrão e as localizações geográficas.
• Área dos eventos não é uma medida válida apesar Área dos eventos não é uma medida válida apesar de em muitos casos ocuparem espaço.de em muitos casos ocuparem espaço.
• Entidades geográficas representadas como pontos Entidades geográficas representadas como pontos no mapa são considerados de mesma qualidade.no mapa são considerados de mesma qualidade.
Distribuição de PontosDistribuição de Pontos
Distribuições pontuais tem as seguintes características:Distribuições pontuais tem as seguintes características:
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
1313 NOV/99NOV/99
Distribuição de Pontos - Distribuição de Pontos - Estatísticas DescritivasEstatísticas Descritivas
• A distribuição de características pontuais pode ser descrita pela:A distribuição de características pontuais pode ser descrita pela:
– FrequênciaFrequência
– DensidadeDensidade
– Centro GeométricoCentro Geométrico
– Dispersão EspacialDispersão Espacial
– Arranjo Espacial *Arranjo Espacial *
• Com exceção do arranjo espacial, a avaliação das propriedades Com exceção do arranjo espacial, a avaliação das propriedades espaciaisespaciais pontuais pode ser realizada através de estatísticas descritivas pontuais pode ser realizada através de estatísticas descritivas básicas.básicas.
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
1414 NOV/99NOV/99
Distribuição de Pontos - Distribuição de Pontos - Estatísticas DescritivasEstatísticas Descritivas• FrequênciaFrequência :- # de características pontuais que ocorrem no mapa.:- # de características pontuais que ocorrem no mapa.
Nota:-Nota:- A comparação de duas distribuição de frequência pode ser A comparação de duas distribuição de frequência pode ser enganosaenganosa se a área não é considerada.se a área não é considerada. Quando dois padrões de pontos que diferem na área são Quando dois padrões de pontos que diferem na área são comparados, comparados, é aconselhável compará-los pela densidade.é aconselhável compará-los pela densidade.
• DensidadeDensidade :- Frequência / Área:- Frequência / Área
• Centro Geométrico e Dispersão EspacialCentro Geométrico e Dispersão Espacial :- são medidas que :- são medidas que caracterizam as caracterizam as propriedades geográfica de um padrão de pontos.propriedades geográfica de um padrão de pontos.
Centro GeométricoCentro Geométrico = média das coordenadas de localização X e Y = média das coordenadas de localização X e Y
DispersãoDispersão = desvio padrão de cada média (X e Y). = desvio padrão de cada média (X e Y).
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
1515 NOV/99NOV/99
Distribuição de Pontos - Distribuição de Pontos - Estatísticas DescritivasEstatísticas Descritivas
• A figura abaixo apresenta quatro padrões de pontos (A, B, A figura abaixo apresenta quatro padrões de pontos (A, B, C e D).C e D).
L O C A L I Z A Ç Õ E SL O C A L I Z A Ç Õ E S----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
A A BB CC DD----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
(2, 7)(2, 7) (3, 6)(3, 6) (2,4)(2,4) (3,4)(3,4)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
(3, 5)(3, 5) (4, 4)(4, 4) (3,10)(3,10) (5,2)(5,2)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
(3, 6)(3, 6) (4, 5)(4, 5) (4,7)(4,7) (5,8)(5,8)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
(3, 7)(3, 7) (4, 6)(4, 6) (5,2)(5,2) (7,11)(7,11)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
(3, 8)(3, 8) (5, 4)(5, 4) (7,4)(7,4) (8,5)(8,5)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
(4, 6)(4, 6) (5, 5)(5, 5) (7,6)(7,6) (8,8)(8,8)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
(4, 7)(4, 7) (5, 6)(5, 6) (7,9)(7,9) (9,2)(9,2)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
(4, 8)(4, 8) (5, 7)(5, 7) (10,2)(10,2) (10,8)(10,8)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
(5, 6)(5, 6) (6, 4)(6, 4) (11,6)(11,6) (12,2)(12,2)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
(5, 7)(5, 7) (6, 5)(6, 5) (11,10)(11,10) (13,4)(13,4)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
(5, 8)(5, 8) (6, 6)(6, 6) (13,4)(13,4) (13,6)(13,6)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
(5, 9)(5, 9) (7, 5)(7, 5) (13,8)(13,8) (13,8)(13,8)
(0,0)(0,0)
(12, 15)(12, 15)
AA BB
CC DD
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
1616 NOV/99NOV/99
Distribuição de Pontos - Distribuição de Pontos - Estatísticas DescritivasEstatísticas Descritivas
• A figura abaixo apresenta quatro padrões de pontos (A, B, A figura abaixo apresenta quatro padrões de pontos (A, B, C e D).C e D).
(0,0)(0,0)
(12, 15)(12, 15)
AA BB
CC DD
FrequênciaFrequência = 12 em A, B, C, D = 12 em A, B, C, D
DensidadeDensidade = 180/12 em A, B, C, D = 180/12 em A, B, C, D
Centro GeométricoCentro Geométrico
Nota:Nota: CGa e CGb representam bem a CGa e CGb representam bem a tendência central porque ambas distri-tendência central porque ambas distri- buições estão concentradas em tornobuições estão concentradas em torno dos respectivos centros. Por outro lado,dos respectivos centros. Por outro lado, CGc e CGd não são bons indicadoresCGc e CGd não são bons indicadores para suas respectivas distribuições.para suas respectivas distribuições.
CGaCGa
CGbCGbCGcCGc
CGdCGd
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
1717 NOV/99NOV/99
Distribuição de Pontos - Distribuição de Pontos - Estatísticas DescritivasEstatísticas Descritivas
• Padrões de pontos com diferentes características de dispersão Padrões de pontos com diferentes características de dispersão espacial espacial
xx > > yy
xx < < yy
22xx ~ ~ 22
yy 22xx ~ ~ 22
yy
(significante)(significante) (insignificante)(insignificante)
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
1818 NOV/99NOV/99
Distribuição de Pontos - Distribuição de Pontos - Arranjos EspaciaisArranjos Espaciais
• Objetivo Objetivo : verificar se os eventos observados apresentam algum tipo de padrão : verificar se os eventos observados apresentam algum tipo de padrão sistemático, ao invés de estar distribuídos aleatoriamente.sistemático, ao invés de estar distribuídos aleatoriamente.
AleatórioAleatório Agrupado Agrupado RegularRegular
• Na realidade o que se deseja é detectar padrões de aglomerados Na realidade o que se deseja é detectar padrões de aglomerados espaciais (“clusters”). espaciais (“clusters”).
• Base conceitual -> supor uma distribuição estocástica que serve de base Base conceitual -> supor uma distribuição estocástica que serve de base para a hipótese de aleatoriedade.para a hipótese de aleatoriedade.
• No caso de pontos é usual utilizar a distribuição de Poisson.No caso de pontos é usual utilizar a distribuição de Poisson.
• Uma característica importante de um padrão espacial é a localização dos pontos eUma característica importante de um padrão espacial é a localização dos pontos e a relação entre eles. Isto tem um efeito significativo na distribuição dos padrões.a relação entre eles. Isto tem um efeito significativo na distribuição dos padrões.
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
1919 NOV/99NOV/99
Caracterização de Distribuição de Caracterização de Distribuição de PontosPontos
• Processo de análise de pontos pode ser descritos em Processo de análise de pontos pode ser descritos em termos de :termos de :
Efeitos de Primeira OrdemEfeitos de Primeira Ordem• considerados globais ou de grande escala.considerados globais ou de grande escala.• correspondem a variações no valor médio do processo.correspondem a variações no valor médio do processo.• Neste caso estamos interessados na intensidade do Neste caso estamos interessados na intensidade do
processoprocesso (N(Noo Eventos / Unidade de Área). Eventos / Unidade de Área).
Efeitos de Segunda OrdemEfeitos de Segunda Ordem• denominados locais ou de pequena escala.denominados locais ou de pequena escala.• representam a dependência espacial no processorepresentam a dependência espacial no processo
• A maior parte das técnicas de análise de distribuição A maior parte das técnicas de análise de distribuição de pontos supõe um comportamento isotrópico.de pontos supõe um comportamento isotrópico.
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
2020 NOV/99NOV/99
• Técnicas a serem abordadas :Técnicas a serem abordadas :
• Para Efeitos de Primeira OrdemPara Efeitos de Primeira Ordem– Estimador de Intensidade (“Kernel Estimation”) Estimador de Intensidade (“Kernel Estimation”)
• Para Efeitos de Segunda OrdemPara Efeitos de Segunda Ordem– Vizinho mais Próximo Vizinho mais Próximo – Função K Função K
Caracterização de Distribuição de Caracterização de Distribuição de PontosPontos
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
2121 NOV/99NOV/99
Estimador de Intensidade (“Kernel Estimador de Intensidade (“Kernel Estimation”)Estimation”)
• Segundo (Bailey e Gatrell, 1995):Segundo (Bailey e Gatrell, 1995):
Onde:Onde:– A função A função I( )I( ) -> FDP, escolhida de forma adequada para construir -> FDP, escolhida de forma adequada para construir
uma superfície contínua sobre os dados.uma superfície contínua sobre os dados.
– O parâmetro O parâmetro denominado “largura de faixa”, controla o denominado “largura de faixa”, controla o amaciamento da superfície gerada.amaciamento da superfície gerada.
– SS representa uma localização qualquer na área de estudo e representa uma localização qualquer na área de estudo e SSii são são asas
localizações dos eventos observados.localizações dos eventos observados.
– nn representa o número de eventos. representa o número de eventos.
in
iτ
ssIs
12
1)(ˆ
in
iτ
ssIs
12
1)(ˆ
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
2222 NOV/99NOV/99
• Uma função muito utilizada para Uma função muito utilizada para I()I() é: é:
onde:onde:– hh representa a distância entre a localização em que desejamos representa a distância entre a localização em que desejamos calcular a função e os eventos observados.calcular a função e os eventos observados.
• Assim o estimador de intensidade pode ser expresso como:Assim o estimador de intensidade pode ser expresso como:
onde:onde:– hhii é a distância entre o ponto a calcular é a distância entre o ponto a calcular SS e o valor observado e o valor observado SSii..
2213
)( hhI
2213
)( hhI
2
2
2
12
13
)(ˆ
i
n
iτ
hIs
2
2
2
12
13
)(ˆ
i
n
iτ
hIs
Estimador de Intensidade (“Kernel Estimador de Intensidade (“Kernel Estimation”)Estimation”)
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
2323 NOV/99NOV/99
2
2
2
12
13
)(ˆ
i
n
iτ
hIs
2
2
2
12
13
)(ˆ
i
n
iτ
hIs
• A Figura abaixo ilustra a idéia do estimador de intensidadeA Figura abaixo ilustra a idéia do estimador de intensidade
Estimador de Intensidade (“Kernel Estimador de Intensidade (“Kernel Estimation”)Estimation”)
hiSi
S
kernel
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
2424 NOV/99NOV/99
Estimador de Intensidade (“Kernel Estimador de Intensidade (“Kernel Estimation”)Estimation”)
• Efeito da Largura de Faixa (Efeito da Largura de Faixa ())
Banda estreitaBanda estreita
Banda largaBanda larga
Observações
•
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
2525 NOV/99NOV/99
• Uma visão do Kernel no Sistema SPRINGUma visão do Kernel no Sistema SPRING
Estimador de Intensidade (“Kernel Estimador de Intensidade (“Kernel Estimation”)Estimation”)
Plano de Informação (PI)Plano de Informação (PI) Grade de IntensidadeGrade de Intensidade Superfície de saídaSuperfície de saída
Ponto a ser estimadoPonto a ser estimado
kernel
Observações
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
2626 NOV/99NOV/99
• Exemplo: Mapeando a violência na cidade de Porto Alegre - RS.Exemplo: Mapeando a violência na cidade de Porto Alegre - RS.
CACHOEIRINHA
ALVORADA
VIAMÃO
10
Quilômetros
N
50
GUAÍBA
Legenda: Homicídios / Acidentes de transporte / Suicídios Santos,S.M., 1999Santos,S.M., 1999
KernelKernel
Estimador de Intensidade (“Kernel Estimador de Intensidade (“Kernel Estimation”)Estimation”)
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
2727 NOV/99NOV/99
Vizinho mais próximoVizinho mais próximo
• KernelKernel– explorar a variação da média do processo na região de explorar a variação da média do processo na região de
estudo - propriedade de primeira ordemestudo - propriedade de primeira ordem
• Propriedades de segunda ordemPropriedades de segunda ordem– distâncias entre os eventosdistâncias entre os eventos
• Dois tipos de distâncias: Dois tipos de distâncias: – evento-evento (W) e ponto aleatório-evento (X)evento-evento (W) e ponto aleatório-evento (X)
• Função empírica Função empírica – histograma das distâncias para o vizinho mais próximo histograma das distâncias para o vizinho mais próximo
- cada classe do histograma é uma contagem de - cada classe do histograma é uma contagem de eventos que ocorrem até aquela distânciaeventos que ocorrem até aquela distância
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
2828 NOV/99NOV/99
Vizinho mais PróximoVizinho mais Próximo• O método do vizinho mais próximo estima a função de O método do vizinho mais próximo estima a função de distribuição distribuição cumulativa ( ) baseado nas distâncias entre eventos cumulativa ( ) baseado nas distâncias entre eventos em umaem uma região de análise.região de análise.
n
wwwG i
#)(ˆ
n
wwwG i
#)(ˆ
• Pode ser estimado empiricamente por:Pode ser estimado empiricamente por:
onde:onde:– ww distância de entrada distância de entrada
– wwii distância entre eventos distância entre eventos
– nn número de eventos número de eventos
)(ˆ wG )(ˆ wG
• A plotagem dos resultados de em relação as distâncias, pode ser A plotagem dos resultados de em relação as distâncias, pode ser utilizado como um utilizado como um método exploratóriométodo exploratório para verificar se existe evidência para verificar se existe evidência de interação entre os eventos.de interação entre os eventos.
)(ˆ wG )(ˆ wG
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
2929 NOV/99NOV/99
Baseado na distância mínima Baseado na distância mínima entre os pontosentre os pontos
distância mdistância míínimanima
Método Método - Vizinho mais Próximo- Vizinho mais Próximo
1 distância1 distância
2 distância2 distância
3 distância3 distância
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
3030 NOV/99NOV/99
Método Método - Vizinho mais Próximo- Vizinho mais Próximo
n
wwwG i
#)(ˆ
n
wwwG i
#)(ˆ
• Na prática a distância de entrada Na prática a distância de entrada ww está compreendida entre um está compreendida entre um valor valor mínimo e máximo estabelecido pelo usuário.mínimo e máximo estabelecido pelo usuário. Além disso, deve-se Além disso, deve-se definirdefinir também o número de intervalos desejados (Ex: com 9 intervalos).também o número de intervalos desejados (Ex: com 9 intervalos).
Distância entre eventosDistância entre eventos
)(ˆ wG )(ˆ wG
ww00
11
00
mín.mín. máx.máx.
nnoo intervalos intervalos
ww1
23
45
67
89
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
3131 NOV/99NOV/99
Método Método - Vizinho mais Próximo- Vizinho mais Próximo
)(ˆ wG )(ˆ wG
ww00
11
00
)(ˆ wG )(ˆ wG
00
11
00ww
• Análise exploratória de padrões de distribuição de pontos Análise exploratória de padrões de distribuição de pontos utilizando utilizando
)(ˆ wG )(ˆ wG
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
3232 NOV/99NOV/99
Teste de SignificânciaTeste de Significância
• Teste de SignificânciaTeste de Significância– comparar com distribuições teóricas ou simulações comparar com distribuições teóricas ou simulações
querepresentem a “Completa Aleatoriedade Espacial”querepresentem a “Completa Aleatoriedade Espacial”
• A hipótese de CAE A hipótese de CAE – evento segue um processo de Poisson homogêneo evento segue um processo de Poisson homogêneo
sobre a região estudada, sobre a região estudada,
• Outras modelosOutras modelos– processo de Poisson heterogêneo, processo de Cox, processo de Poisson heterogêneo, processo de Cox,
etc.etc.
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
3333 NOV/99NOV/99
Método Método - Vizinho mais Próximo- Vizinho mais Próximo• A significância do resultado da análise exploratória, do padrão de A significância do resultado da análise exploratória, do padrão de distribuição de pontos, utilizando o método vizinho mais próximo distribuição de pontos, utilizando o método vizinho mais próximo pode serpode ser avaliada através de um modelo teórico denominado avaliada através de um modelo teórico denominado Aleatoriedade Aleatoriedade Espacial Espacial Completa ( “Complete Spatial Randomness - CSR” ).Completa ( “Complete Spatial Randomness - CSR” ).• Na realidade o que se faz é comparar a distribuição dos eventos Na realidade o que se faz é comparar a distribuição dos eventos observados observados com o que se esperaria na hipótese CSR.com o que se esperaria na hipótese CSR.• Esta metodologia consiste em se criar envelopes de simulação Esta metodologia consiste em se criar envelopes de simulação para a para a distribuição CSR, afim de acessar a significância dos desvios.distribuição CSR, afim de acessar a significância dos desvios.• Na hipótese de CSR, a função de distribuição Na hipótese de CSR, a função de distribuição G(w)G(w) seria dada por seria dada por um um processo de Poisson, como segue (Bailey e Gatrell, 1995):processo de Poisson, como segue (Bailey e Gatrell, 1995):
01)(2
wewG w 01)(2
wewG w
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
3434 NOV/99NOV/99
• , , i =1, 2, ..., i =1, 2, ..., mm são funções de distribuição empíricas, estimadas a são funções de distribuição empíricas, estimadas a partir de partir de mm simulações independentes dos n eventos, na hipótese simulações independentes dos n eventos, na hipótese CSR (n eventos independentes e uniformemente distribuídos).CSR (n eventos independentes e uniformemente distribuídos).
Método Método - Vizinho mais Próximo- Vizinho mais Próximo
• A estimação simulada para a distribuição A estimação simulada para a distribuição G(w)G(w) assumindo- assumindo-se CSR é se CSR é calculada como (Bailey e Gatrell, 1995):calculada como (Bailey e Gatrell, 1995):
m
wGwG
m
ii
1
)(ˆ
)(m
wGwG
m
ii
1
)(ˆ
)(
onde:onde:
)(ˆ wGi )(ˆ wGi
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
3535 NOV/99NOV/99
Método Método - Vizinho mais Próximo- Vizinho mais Próximo• Para calcular a condição de aleatoriedade, calcula-se os envelopes Para calcular a condição de aleatoriedade, calcula-se os envelopes de de simulação superior e inferior, definidos como segue (Bailey e simulação superior e inferior, definidos como segue (Bailey e Gatrell, 1995):Gatrell, 1995):
miwGmaxwU i ...,,1,)(ˆ)( miwGmaxwU i ...,,1,)(ˆ)(
miwGminwL i ...,,1,)(ˆ)( miwGminwL i ...,,1,)(ˆ)(
• Envelope Envelope superiorsuperior
• Envelope Envelope inferiorinferior
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
3636 NOV/99NOV/99
Método Método - Vizinho mais Próximo- Vizinho mais Próximo
• A plotagem x , com adição dos envelopes, permite A plotagem x , com adição dos envelopes, permite medir a medir a significância dos desvios relativo a aleatoriedade.significância dos desvios relativo a aleatoriedade.
)(wG )(wG)(ˆ wG )(ˆ wG
)(ˆ wG )(ˆ wG
)(wG )(wG• Se a condição de CSR for válida para os dados observados, a Se a condição de CSR for válida para os dados observados, a plotagemplotagem
x deve ser praticamente linear com um ângulo de x deve ser praticamente linear com um ângulo de 4545oo
)(ˆ wG )(ˆ wG )(wG )(wG
Envelope InferiorEnvelope Inferior
Envelope SuperiorEnvelope Superior
EstimadoEstimado
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
3737 NOV/99NOV/99
Método Método - Vizinho mais Próximo- Vizinho mais Próximo
• Se o dado apresenta tendências para agrupamento, os traçados Se o dado apresenta tendências para agrupamento, os traçados no gráfico no gráfico estarão acima da linha de 45estarão acima da linha de 45oo..
)(ˆ wG )(ˆ wG
)(wG )(wG
• Por outro lado, se o dado apresenta padrões de regularidade os Por outro lado, se o dado apresenta padrões de regularidade os traçados traçados ficarão abaixo da linha de 45ficarão abaixo da linha de 45oo..
)(ˆ wG )(ˆ wG
)(wG )(wG
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
3838 NOV/99NOV/99
Método Método - Vizinho mais Próximo- Vizinho mais Próximo• O exemplo abaixo refere-se a crimes juvenis na região de O exemplo abaixo refere-se a crimes juvenis na região de Cardiff, UK Cardiff, UK (Herbert, 1980). Neste caso percebe-se a posição dos (Herbert, 1980). Neste caso percebe-se a posição dos envelopes eenvelopes e da distribuição acima da linha de 45da distribuição acima da linha de 45oo, o que caracteriza , o que caracteriza agrupamento agrupamento para as distâncias em análise.para as distâncias em análise.
DistânciaDistância mín.=0. mín.=0. máx.=16 #intervalos=10 máx.=16 #intervalos=10 #simulações=10#simulações=10
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
3939 NOV/99NOV/99
Função KFunção K
• Vizinho mais próximoVizinho mais próximo– pequena escalapequena escala
• FFunção K unção K – propriedades de segunda ordem de um processo propriedades de segunda ordem de um processo
isotrópicoisotrópico
• Definição Definição (Bailey e Gatrell, 1995):(Bailey e Gatrell, 1995):
K(h)K(h) = = EE [#(eventos a distância [#(eventos a distância hh de um evento arbitráriode um evento arbitrário)])]
onde:onde:
- N- Noo eventos / área eventos / área
E()E() - operador esperança. - operador esperança.
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
4040 NOV/99NOV/99
Função KFunção K
K(h)K(h) = = EE [#(eventos a distância [#(eventos a distância hh de um evento arbitráriode um evento arbitrário)])]
== nnoo eventos/R eventos/R
R = áreaR = área
R
denominado de intensidadedenominado de intensidade
ouou
Lembrando Lembrando que:que:
# eventos = 7
# eventos = 3
h
h
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
4141 NOV/99NOV/99
Função KFunção K
• Necessitamos agora, definir um estimador para a função kNecessitamos agora, definir um estimador para a função k
K(h)K(h) = = EE [#(eventos a distância [#(eventos a distância hh de um evento arbitráriode um evento arbitrário)])]
K(h) =K(h) = , onde: , onde: ddijij é a distância entre os eventos i e é a distância entre os eventos i e
j.j.
IIhh(d(dijij)= )= 1 se1 se ddijij <=h, <=h, 0 se0 se ddijij > h. > h.
R = n = # eventos em RR = n = # eventos em R..
• ResultandoResultando
• O estimador de lambda , então:O estimador de lambda , então:
n
i
n
jijh dI
RhK
1 12
)(1
)(ˆ
n
i
n
jijh dI
RhK
1 12
)(1
)(ˆ
n
i
n
jijh dI
R 1 1
)(1
n
i
n
jijh dI
R 1 1
)(1
R
n̂
R
n̂
n
i
n
jijh dI
n
RhK
1 12
)()(ˆ
n
i
n
jijh dI
n
RhK
1 12
)()(ˆ
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
4242 NOV/99NOV/99
Função KFunção K
• Uma idéia gráfica do que está embutido na notação do estimador da função KUma idéia gráfica do que está embutido na notação do estimador da função K
n
i
n
jijh dI
n
RhK
1 12
)()(ˆ
n
i
n
jijh dI
n
RhK
1 12
)()(ˆ R
h=5
h=5
h=5# eventos=7
# eventos=7
# eventos=3
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
4343 NOV/99NOV/99
Função KFunção K• Para uPara um processo aleatório o m processo aleatório o # esperado de eventos a uma # esperado de eventos a uma distância hdistância h de de UMUM evento escolhido aleatoriamenteevento escolhido aleatoriamente é é k(h)=k(h)=hh22 ((Bailey e Gatrell, 1995)Bailey e Gatrell, 1995)
Processo aleatórioProcesso aleatório hhhh
hhhh
hh
hh ÁreaÁreahh22
Tipo de Processo Tipo de Processo K(h)K(h)
Randômico = Randômico = hh22
Ordenação regular < Ordenação regular < hh22
Agregação espacial > Agregação espacial > hh22
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
4444 NOV/99NOV/99
Função KFunção K• Uma vez obtido, este pode ser plotado e examinado.Uma vez obtido, este pode ser plotado e examinado.
• O gráfico da função K não é tão intuitivo quanto a do gráfico do O gráfico da função K não é tão intuitivo quanto a do gráfico do vizinho vizinho mais próximo. Portanto utiliza-se uma função auxiliar L, para mais próximo. Portanto utiliza-se uma função auxiliar L, para facilitar afacilitar a interpretação.interpretação.
• O estimador da função L é: O estimador da função L é:
)(ˆ hK )(ˆ hK
hhK
hL
)(ˆ)(ˆ h
hKhL
)(ˆ
)(ˆ
Tipo de Processo Tipo de Processo L(h) K(h) L(h) K(h)
Randômico = Randômico = 0 0 = = hh22
Ordenação regular < Ordenação regular < 0 0 < < hh22
Agregação espacial > Agregação espacial > 0 0 > > hh22
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
4545 NOV/99NOV/99
Função KFunção K
• Interpretação da plotagem de Interpretação da plotagem de hhK
hL
)(ˆ)(ˆ h
hKhL
)(ˆ
)(ˆ
)(ˆ hL )(ˆ hL
hh
00
• extremos negativos: mais regularidadeextremos negativos: mais regularidade
• extremos positivos: mais agrupamentoextremos positivos: mais agrupamento
• em torno de zero aleatórioem torno de zero aleatório
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
4646 NOV/99NOV/99
• Exemplo :- Exemplo :- O exemplo abaixo refere-se ao município Bood O exemplo abaixo refere-se ao município Bood Moor, situado no condado de Cornwall, Inglaterra. Dados Moor, situado no condado de Cornwall, Inglaterra. Dados geomorfológicos com 36 localizações de rochas de granito. geomorfológicos com 36 localizações de rochas de granito. Neste caso percebe-se que para distâncias entre Neste caso percebe-se que para distâncias entre aproximadamente 2.5 a 3 (extremo positivo do gráfico) há aproximadamente 2.5 a 3 (extremo positivo do gráfico) há evidências de agrupamento.evidências de agrupamento.
Função KFunção K
DistânciaDistância mín.=0.5 máx.=4 #intervalos=10 mín.=0.5 máx.=4 #intervalos=10
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
4747 NOV/99NOV/99
Função KFunção K
• Uma abordagem similar a do vizinho mais próximo pode ser feita para seUma abordagem similar a do vizinho mais próximo pode ser feita para se estimar a significância dos desvios da distribuição em relação a aleato-estimar a significância dos desvios da distribuição em relação a aleato- riedade (CSR).riedade (CSR).
• Idéia realizar simulações CSR sobre a região R e computar os envelopesIdéia realizar simulações CSR sobre a região R e computar os envelopes superior e inferior.superior e inferior.
• O envelope superior é definido como (Baley e Gratel, 1995):O envelope superior é definido como (Baley e Gratel, 1995):
• O envelope inferor é definido como (Baley e Gratel, 1995):O envelope inferor é definido como (Baley e Gratel, 1995):
mihLmaxhUpper i ...,,1,)(ˆ)( mihLmaxhUpper i ...,,1,)(ˆ)(
mihLminhLower i ...,,1,)(ˆ)( mihLminhLower i ...,,1,)(ˆ)(
)(ˆ hL )(ˆ hL
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
4848 NOV/99NOV/99
• Análise do gráfico com os envelopes Upper(Análise do gráfico com os envelopes Upper(hh) e Lower() e Lower(hh).).
Função KFunção K
)(ˆ hL )(ˆ hL
1.0 -1.0 -
0.5 -0.5 -
1.5 -1.5 -
0.0 -0.0 -
-0.5 --0.5 -
-1.0 --1.0 -
-1.5 --1.5 -
hh
Upper(Upper(hh))
Lower(Lower(hh))
)(ˆ hL )(ˆ hL
)(ˆ hL )(ˆ hL
aleatórioaleatório
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
4949 NOV/99NOV/99
Função KFunção K
• Exemplo :- Exemplo :- mudas de Sequoia, Califórnia. Dados representam mudas de Sequoia, Califórnia. Dados representam 62 mudas distribuídas numa região de 23m62 mudas distribuídas numa região de 23m22. .
Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos
5050 NOV/99NOV/99
AULA PRÁTICA NO SISTEMA SPRINGAULA PRÁTICA NO SISTEMA SPRING
• BANCOS DE DADOS:BANCOS DE DADOS:
– PORTO ALEGRE: PORTO ALEGRE: eventos de violência (homicídios, acidentes de eventos de violência (homicídios, acidentes de transito e suicídios) na cidade de Porto Alegre - RS.transito e suicídios) na cidade de Porto Alegre - RS.
– BoodminMoor: BoodminMoor: refere-se ao município Bood Moor, situado no refere-se ao município Bood Moor, situado no condado de Cornwall, Inglaterra. Dados geomorfológicos com 36 condado de Cornwall, Inglaterra. Dados geomorfológicos com 36 localizações de rochas de granito.localizações de rochas de granito.
– Cardiff: Cardiff: estado em Wales, UK. Dados representam localizações das estado em Wales, UK. Dados representam localizações das 168 residências de infratores juvenis no estado de Cardiff.168 residências de infratores juvenis no estado de Cardiff.
– Redwood: Redwood: mudas de Sequoia, Califórnia. Dados representam 62 mudas de Sequoia, Califórnia. Dados representam 62 mudas distribuídas numa região de 23mmudas distribuídas numa região de 23m22..