Estatística Espacial Análise de Padrões de Distribuição de Pontos

50
Estatística Espacial Estatística Espacial Análise de Padrões de Distribuição Análise de Padrões de Distribuição de Pontos de Pontos INPE - Divisão de Processamento de INPE - Divisão de Processamento de Imagens Imagens

description

Estatística Espacial Análise de Padrões de Distribuição de Pontos. INPE - Divisão de Processamento de Imagens. Organização. Introdução Distribuição de Pontos Caracterização de Distribuição de Pontos Estimador de Intensidade (“Kernel Estimation”) Modelagem de Distribuição de Pontos - PowerPoint PPT Presentation

Transcript of Estatística Espacial Análise de Padrões de Distribuição de Pontos

Page 1: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística EspacialEstatística EspacialAnálise de Padrões de Distribuição de Análise de Padrões de Distribuição de PontosPontos

INPE - Divisão de Processamento de INPE - Divisão de Processamento de ImagensImagens

Page 2: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

22 NOV/99NOV/99

OrganizaçãoOrganização

• IntroduçãoIntrodução

• Distribuição de PontosDistribuição de Pontos

• Caracterização de Distribuição de PontosCaracterização de Distribuição de Pontos

• Estimador de Intensidade (“Kernel Estimador de Intensidade (“Kernel Estimation”)Estimation”)

• Modelagem de Distribuição de PontosModelagem de Distribuição de Pontos

• Método do Vizinho Mais PróximoMétodo do Vizinho Mais Próximo

• Função KFunção K

• Exemplos Práticos com o Sistema SpringExemplos Práticos com o Sistema Spring

Page 3: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

33 NOV/99NOV/99

Introdução - preliminaresIntrodução - preliminares

• Consideramos aqui fenômenos expressos através de Consideramos aqui fenômenos expressos através de ocorrências pontuais.ocorrências pontuais.

• São observações disponíveis no espaço.São observações disponíveis no espaço.

• Representações pontuais podem corresponder a Representações pontuais podem corresponder a dados comodados como– índice de mortalidade,índice de mortalidade,– ocorrências de doenças,ocorrências de doenças,– localização de espécie vegetais, etc.localização de espécie vegetais, etc.

• ObjetivoObjetivo– aumentar o entendimento do processo verificando aumentar o entendimento do processo verificando

hipóteses viáveis ou inferir valores em áreas sem hipóteses viáveis ou inferir valores em áreas sem

observaçõesobservações..

Page 4: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

44 NOV/99NOV/99

Introdução - preliminaresIntrodução - preliminaresA L G U N S E X E M P L O SA L G U N S E X E M P L O S

• EpidemologiaEpidemologia– A distribuição dos casos de uma doença formam um A distribuição dos casos de uma doença formam um

padrão no espaço ? Existe associação com alguma fonte padrão no espaço ? Existe associação com alguma fonte de poluição ? Evidência de contágio ?de poluição ? Evidência de contágio ?

• CrimeCrime– Roubos que ocorrem em determinadas áreas estão Roubos que ocorrem em determinadas áreas estão

correlacionados com características sócio econômicas ?correlacionados com características sócio econômicas ?

• GeologiaGeologia– Dado um conjunto de amostras, qual a extensão de um Dado um conjunto de amostras, qual a extensão de um

depósito mineral ?depósito mineral ?

Page 5: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

55 NOV/99NOV/99

Introdução - preliminaresIntrodução - preliminares

Mapeando a violência - localização pontualMapeando a violência - localização pontual

CACHOEIRINHA

ALVORADA

VIAMÃO

10

Quilômetros

N

50

GUAÍBA

Legenda: Homicídios / Acidentes de transporte / Suicídios Santos,S.M., 1999Santos,S.M., 1999

Page 6: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

66 NOV/99NOV/99

ClustersClusters

• “Cluster”: qualquer agregado de eventos.– resultado de classificação onde se busca definir um

grupamento de “semelhantes”.

• Cluster espacial – agregado de eventos no espaço ou a ocorrência de

“taxas semelhantes” em área próximas.

• Detecção de cluster espacial – estabelecer a significância de um sobre-risco em um

determinado espaço ou tempo e espaço.

Page 7: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

77 NOV/99NOV/99

ClustersClusters

• O que causa um “cluster”? – Agentes infecciosos, contaminação ambiental Agentes infecciosos, contaminação ambiental

localizada, efeitos colaterais de tratamentos, etc.localizada, efeitos colaterais de tratamentos, etc.

• Os estudos Os estudos – evidência de tendência geral à clusterização, ou a um evidência de tendência geral à clusterização, ou a um

determinado e predefinido agregado.determinado e predefinido agregado.

• Podem ser usados para pontos ou áreas.Podem ser usados para pontos ou áreas.• Fatores de controle:Fatores de controle:

– distribuição populacional e outras covariáveis que distribuição populacional e outras covariáveis que podem criar agregados.podem criar agregados.

Page 8: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

88 NOV/99NOV/99

Conceitos BásicosConceitos Básicos

• EstacionariedadeEstacionariedade– AAs propriedades estatísticas da variável independem de sua s propriedades estatísticas da variável independem de sua

localização absoluta, ou seja, a média e a variância são constantes em localização absoluta, ou seja, a média e a variância são constantes em qualquer sub-área e a covariância entre dois pontos quaisquer qualquer sub-área e a covariância entre dois pontos quaisquer depende somente de sua localização relativa;depende somente de sua localização relativa;

• IsotropiaIsotropia– AAlém de estacionário, a covariância depende somente da distância lém de estacionário, a covariância depende somente da distância

entre os pontos e não da direção entre eles.entre os pontos e não da direção entre eles.

• Processo de modelagemProcesso de modelagem– Transformações visando obtenção de estacionariedade;Transformações visando obtenção de estacionariedade;

– Ajuste de modelos.Ajuste de modelos.

Page 9: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

99 NOV/99NOV/99

Introdução - preliminaresIntrodução - preliminares

• Fenômeno espacial: contínuo ou discretoFenômeno espacial: contínuo ou discreto

• Discreto - espaço contém entidades do mundo realDiscreto - espaço contém entidades do mundo real– Na concepção Spring denominado de modelo de objetosNa concepção Spring denominado de modelo de objetos

– Exs: municípios, quadras, escolas, hospitais, etc...Exs: municípios, quadras, escolas, hospitais, etc...

• Contínuo - informação presente em todas as Contínuo - informação presente em todas as posições posições – Na concepção Spring denominado de modelo de campoNa concepção Spring denominado de modelo de campo

– Exs: temperatura, pressão, teor de argila no solo, etc...Exs: temperatura, pressão, teor de argila no solo, etc...

Page 10: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

1010 NOV/99NOV/99

Introdução - preliminaresIntrodução - preliminares

C L A S S E S D E P R O B L E M A SC L A S S E S D E P R O B L E M A S

Tipos de DadosTipos de Dados ExemploExemplo Problemas TípicosProblemas Típicos

Análise deAnálise dePadrões PontuaisPadrões Pontuais

EventosEventosLocalizadosLocalizados

Ocorrência deOcorrência deDoençasDoenças

DeterminaçãoDeterminaçãode Padrõesde Padrões

Análise de Análise de SuperficiesSuperficies

Amostras deAmostras deCampoCampo

DepósitoDepósitoMineraisMinerais

Interpolação deInterpolação deSuperfícieSuperfície

Análise deAnálise deÁreasÁreas

Entidades eEntidades eAtributosAtributos

DadosDadosCensitáriosCensitários

RelacionamentoRelacionamentodas entidadesdas entidades

RegressãoRegressão

Page 11: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

1111 NOV/99NOV/99

Distribuição de PontosDistribuição de Pontos

• Padrão pontual - conjunto de dados consistindo de uma Padrão pontual - conjunto de dados consistindo de uma série de localizações pontuais (psérie de localizações pontuais (p11, p, p22, ...,p, ...,pnn) ) que estãoque estão

associados a eventos de interesseassociados a eventos de interesse dentro da área de dentro da área de estudo.estudo.

Área de EstudoÁrea de Estudo

• pp11

• pp66

• pp55

• pp44

• pp33

• pp22

• pp77

• pp11

• pp88

Page 12: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

1212 NOV/99NOV/99

• As localizações não estão associadas a valores, As localizações não estão associadas a valores, mas mas apenas a ocorrência dos eventos.apenas a ocorrência dos eventos.

• Dimensão das medidas é zero. Medidas válidas na Dimensão das medidas é zero. Medidas válidas na distribuição de pontos são o # de ocorrências no distribuição de pontos são o # de ocorrências no padrão e as localizações geográficas.padrão e as localizações geográficas.

• Área dos eventos não é uma medida válida apesar Área dos eventos não é uma medida válida apesar de em muitos casos ocuparem espaço.de em muitos casos ocuparem espaço.

• Entidades geográficas representadas como pontos Entidades geográficas representadas como pontos no mapa são considerados de mesma qualidade.no mapa são considerados de mesma qualidade.

Distribuição de PontosDistribuição de Pontos

Distribuições pontuais tem as seguintes características:Distribuições pontuais tem as seguintes características:

Page 13: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

1313 NOV/99NOV/99

Distribuição de Pontos - Distribuição de Pontos - Estatísticas DescritivasEstatísticas Descritivas

• A distribuição de características pontuais pode ser descrita pela:A distribuição de características pontuais pode ser descrita pela:

– FrequênciaFrequência

– DensidadeDensidade

– Centro GeométricoCentro Geométrico

– Dispersão EspacialDispersão Espacial

– Arranjo Espacial *Arranjo Espacial *

• Com exceção do arranjo espacial, a avaliação das propriedades Com exceção do arranjo espacial, a avaliação das propriedades espaciaisespaciais pontuais pode ser realizada através de estatísticas descritivas pontuais pode ser realizada através de estatísticas descritivas básicas.básicas.

Page 14: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

1414 NOV/99NOV/99

Distribuição de Pontos - Distribuição de Pontos - Estatísticas DescritivasEstatísticas Descritivas• FrequênciaFrequência :- # de características pontuais que ocorrem no mapa.:- # de características pontuais que ocorrem no mapa.

Nota:-Nota:- A comparação de duas distribuição de frequência pode ser A comparação de duas distribuição de frequência pode ser enganosaenganosa se a área não é considerada.se a área não é considerada. Quando dois padrões de pontos que diferem na área são Quando dois padrões de pontos que diferem na área são comparados, comparados, é aconselhável compará-los pela densidade.é aconselhável compará-los pela densidade.

• DensidadeDensidade :- Frequência / Área:- Frequência / Área

• Centro Geométrico e Dispersão EspacialCentro Geométrico e Dispersão Espacial :- são medidas que :- são medidas que caracterizam as caracterizam as propriedades geográfica de um padrão de pontos.propriedades geográfica de um padrão de pontos.

Centro GeométricoCentro Geométrico = média das coordenadas de localização X e Y = média das coordenadas de localização X e Y

DispersãoDispersão = desvio padrão de cada média (X e Y). = desvio padrão de cada média (X e Y).

Page 15: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

1515 NOV/99NOV/99

Distribuição de Pontos - Distribuição de Pontos - Estatísticas DescritivasEstatísticas Descritivas

• A figura abaixo apresenta quatro padrões de pontos (A, B, A figura abaixo apresenta quatro padrões de pontos (A, B, C e D).C e D).

L O C A L I Z A Ç Õ E SL O C A L I Z A Ç Õ E S----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

A A BB CC DD----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

(2, 7)(2, 7) (3, 6)(3, 6) (2,4)(2,4) (3,4)(3,4)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

(3, 5)(3, 5) (4, 4)(4, 4) (3,10)(3,10) (5,2)(5,2)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

(3, 6)(3, 6) (4, 5)(4, 5) (4,7)(4,7) (5,8)(5,8)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

(3, 7)(3, 7) (4, 6)(4, 6) (5,2)(5,2) (7,11)(7,11)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

(3, 8)(3, 8) (5, 4)(5, 4) (7,4)(7,4) (8,5)(8,5)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

(4, 6)(4, 6) (5, 5)(5, 5) (7,6)(7,6) (8,8)(8,8)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

(4, 7)(4, 7) (5, 6)(5, 6) (7,9)(7,9) (9,2)(9,2)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

(4, 8)(4, 8) (5, 7)(5, 7) (10,2)(10,2) (10,8)(10,8)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

(5, 6)(5, 6) (6, 4)(6, 4) (11,6)(11,6) (12,2)(12,2)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

(5, 7)(5, 7) (6, 5)(6, 5) (11,10)(11,10) (13,4)(13,4)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

(5, 8)(5, 8) (6, 6)(6, 6) (13,4)(13,4) (13,6)(13,6)----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

(5, 9)(5, 9) (7, 5)(7, 5) (13,8)(13,8) (13,8)(13,8)

(0,0)(0,0)

(12, 15)(12, 15)

AA BB

CC DD

Page 16: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

1616 NOV/99NOV/99

Distribuição de Pontos - Distribuição de Pontos - Estatísticas DescritivasEstatísticas Descritivas

• A figura abaixo apresenta quatro padrões de pontos (A, B, A figura abaixo apresenta quatro padrões de pontos (A, B, C e D).C e D).

(0,0)(0,0)

(12, 15)(12, 15)

AA BB

CC DD

FrequênciaFrequência = 12 em A, B, C, D = 12 em A, B, C, D

DensidadeDensidade = 180/12 em A, B, C, D = 180/12 em A, B, C, D

Centro GeométricoCentro Geométrico

Nota:Nota: CGa e CGb representam bem a CGa e CGb representam bem a tendência central porque ambas distri-tendência central porque ambas distri- buições estão concentradas em tornobuições estão concentradas em torno dos respectivos centros. Por outro lado,dos respectivos centros. Por outro lado, CGc e CGd não são bons indicadoresCGc e CGd não são bons indicadores para suas respectivas distribuições.para suas respectivas distribuições.

CGaCGa

CGbCGbCGcCGc

CGdCGd

Page 17: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

1717 NOV/99NOV/99

Distribuição de Pontos - Distribuição de Pontos - Estatísticas DescritivasEstatísticas Descritivas

• Padrões de pontos com diferentes características de dispersão Padrões de pontos com diferentes características de dispersão espacial espacial

xx > > yy

xx < < yy

22xx ~ ~ 22

yy 22xx ~ ~ 22

yy

(significante)(significante) (insignificante)(insignificante)

Page 18: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

1818 NOV/99NOV/99

Distribuição de Pontos - Distribuição de Pontos - Arranjos EspaciaisArranjos Espaciais

• Objetivo Objetivo : verificar se os eventos observados apresentam algum tipo de padrão : verificar se os eventos observados apresentam algum tipo de padrão sistemático, ao invés de estar distribuídos aleatoriamente.sistemático, ao invés de estar distribuídos aleatoriamente.

AleatórioAleatório Agrupado Agrupado RegularRegular

• Na realidade o que se deseja é detectar padrões de aglomerados Na realidade o que se deseja é detectar padrões de aglomerados espaciais (“clusters”). espaciais (“clusters”).

• Base conceitual -> supor uma distribuição estocástica que serve de base Base conceitual -> supor uma distribuição estocástica que serve de base para a hipótese de aleatoriedade.para a hipótese de aleatoriedade.

• No caso de pontos é usual utilizar a distribuição de Poisson.No caso de pontos é usual utilizar a distribuição de Poisson.

• Uma característica importante de um padrão espacial é a localização dos pontos eUma característica importante de um padrão espacial é a localização dos pontos e a relação entre eles. Isto tem um efeito significativo na distribuição dos padrões.a relação entre eles. Isto tem um efeito significativo na distribuição dos padrões.

Page 19: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

1919 NOV/99NOV/99

Caracterização de Distribuição de Caracterização de Distribuição de PontosPontos

• Processo de análise de pontos pode ser descritos em Processo de análise de pontos pode ser descritos em termos de :termos de :

Efeitos de Primeira OrdemEfeitos de Primeira Ordem• considerados globais ou de grande escala.considerados globais ou de grande escala.• correspondem a variações no valor médio do processo.correspondem a variações no valor médio do processo.• Neste caso estamos interessados na intensidade do Neste caso estamos interessados na intensidade do

processoprocesso (N(Noo Eventos / Unidade de Área). Eventos / Unidade de Área).

Efeitos de Segunda OrdemEfeitos de Segunda Ordem• denominados locais ou de pequena escala.denominados locais ou de pequena escala.• representam a dependência espacial no processorepresentam a dependência espacial no processo

• A maior parte das técnicas de análise de distribuição A maior parte das técnicas de análise de distribuição de pontos supõe um comportamento isotrópico.de pontos supõe um comportamento isotrópico.

Page 20: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

2020 NOV/99NOV/99

• Técnicas a serem abordadas :Técnicas a serem abordadas :

• Para Efeitos de Primeira OrdemPara Efeitos de Primeira Ordem– Estimador de Intensidade (“Kernel Estimation”) Estimador de Intensidade (“Kernel Estimation”)

• Para Efeitos de Segunda OrdemPara Efeitos de Segunda Ordem– Vizinho mais Próximo Vizinho mais Próximo – Função K Função K

Caracterização de Distribuição de Caracterização de Distribuição de PontosPontos

Page 21: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

2121 NOV/99NOV/99

Estimador de Intensidade (“Kernel Estimador de Intensidade (“Kernel Estimation”)Estimation”)

• Segundo (Bailey e Gatrell, 1995):Segundo (Bailey e Gatrell, 1995):

Onde:Onde:– A função A função I( )I( ) -> FDP, escolhida de forma adequada para construir -> FDP, escolhida de forma adequada para construir

uma superfície contínua sobre os dados.uma superfície contínua sobre os dados.

– O parâmetro O parâmetro denominado “largura de faixa”, controla o denominado “largura de faixa”, controla o amaciamento da superfície gerada.amaciamento da superfície gerada.

– SS representa uma localização qualquer na área de estudo e representa uma localização qualquer na área de estudo e SSii são são asas

localizações dos eventos observados.localizações dos eventos observados.

– nn representa o número de eventos. representa o número de eventos.

in

ssIs

12

1)(ˆ

in

ssIs

12

1)(ˆ

Page 22: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

2222 NOV/99NOV/99

• Uma função muito utilizada para Uma função muito utilizada para I()I() é: é:

onde:onde:– hh representa a distância entre a localização em que desejamos representa a distância entre a localização em que desejamos calcular a função e os eventos observados.calcular a função e os eventos observados.

• Assim o estimador de intensidade pode ser expresso como:Assim o estimador de intensidade pode ser expresso como:

onde:onde:– hhii é a distância entre o ponto a calcular é a distância entre o ponto a calcular SS e o valor observado e o valor observado SSii..

2213

)( hhI

2213

)( hhI

2

2

2

12

13

)(ˆ

i

n

hIs

2

2

2

12

13

)(ˆ

i

n

hIs

Estimador de Intensidade (“Kernel Estimador de Intensidade (“Kernel Estimation”)Estimation”)

Page 23: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

2323 NOV/99NOV/99

2

2

2

12

13

)(ˆ

i

n

hIs

2

2

2

12

13

)(ˆ

i

n

hIs

• A Figura abaixo ilustra a idéia do estimador de intensidadeA Figura abaixo ilustra a idéia do estimador de intensidade

Estimador de Intensidade (“Kernel Estimador de Intensidade (“Kernel Estimation”)Estimation”)

hiSi

S

kernel

Page 24: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

2424 NOV/99NOV/99

Estimador de Intensidade (“Kernel Estimador de Intensidade (“Kernel Estimation”)Estimation”)

• Efeito da Largura de Faixa (Efeito da Largura de Faixa ())

Banda estreitaBanda estreita

Banda largaBanda larga

Observações

Page 25: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

2525 NOV/99NOV/99

• Uma visão do Kernel no Sistema SPRINGUma visão do Kernel no Sistema SPRING

Estimador de Intensidade (“Kernel Estimador de Intensidade (“Kernel Estimation”)Estimation”)

Plano de Informação (PI)Plano de Informação (PI) Grade de IntensidadeGrade de Intensidade Superfície de saídaSuperfície de saída

Ponto a ser estimadoPonto a ser estimado

kernel

Observações

Page 26: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

2626 NOV/99NOV/99

• Exemplo: Mapeando a violência na cidade de Porto Alegre - RS.Exemplo: Mapeando a violência na cidade de Porto Alegre - RS.

CACHOEIRINHA

ALVORADA

VIAMÃO

10

Quilômetros

N

50

GUAÍBA

Legenda: Homicídios / Acidentes de transporte / Suicídios Santos,S.M., 1999Santos,S.M., 1999

KernelKernel

Estimador de Intensidade (“Kernel Estimador de Intensidade (“Kernel Estimation”)Estimation”)

Page 27: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

2727 NOV/99NOV/99

Vizinho mais próximoVizinho mais próximo

• KernelKernel– explorar a variação da média do processo na região de explorar a variação da média do processo na região de

estudo - propriedade de primeira ordemestudo - propriedade de primeira ordem

• Propriedades de segunda ordemPropriedades de segunda ordem– distâncias entre os eventosdistâncias entre os eventos

• Dois tipos de distâncias: Dois tipos de distâncias: – evento-evento (W) e ponto aleatório-evento (X)evento-evento (W) e ponto aleatório-evento (X)

• Função empírica Função empírica – histograma das distâncias para o vizinho mais próximo histograma das distâncias para o vizinho mais próximo

- cada classe do histograma é uma contagem de - cada classe do histograma é uma contagem de eventos que ocorrem até aquela distânciaeventos que ocorrem até aquela distância

Page 28: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

2828 NOV/99NOV/99

Vizinho mais PróximoVizinho mais Próximo• O método do vizinho mais próximo estima a função de O método do vizinho mais próximo estima a função de distribuição distribuição cumulativa ( ) baseado nas distâncias entre eventos cumulativa ( ) baseado nas distâncias entre eventos em umaem uma região de análise.região de análise.

n

wwwG i

#)(ˆ

n

wwwG i

#)(ˆ

• Pode ser estimado empiricamente por:Pode ser estimado empiricamente por:

onde:onde:– ww distância de entrada distância de entrada

– wwii distância entre eventos distância entre eventos

– nn número de eventos número de eventos

)(ˆ wG )(ˆ wG

• A plotagem dos resultados de em relação as distâncias, pode ser A plotagem dos resultados de em relação as distâncias, pode ser utilizado como um utilizado como um método exploratóriométodo exploratório para verificar se existe evidência para verificar se existe evidência de interação entre os eventos.de interação entre os eventos.

)(ˆ wG )(ˆ wG

Page 29: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

2929 NOV/99NOV/99

Baseado na distância mínima Baseado na distância mínima entre os pontosentre os pontos

distância mdistância míínimanima

Método Método - Vizinho mais Próximo- Vizinho mais Próximo

1 distância1 distância

2 distância2 distância

3 distância3 distância

Page 30: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

3030 NOV/99NOV/99

Método Método - Vizinho mais Próximo- Vizinho mais Próximo

n

wwwG i

#)(ˆ

n

wwwG i

#)(ˆ

• Na prática a distância de entrada Na prática a distância de entrada ww está compreendida entre um está compreendida entre um valor valor mínimo e máximo estabelecido pelo usuário.mínimo e máximo estabelecido pelo usuário. Além disso, deve-se Além disso, deve-se definirdefinir também o número de intervalos desejados (Ex: com 9 intervalos).também o número de intervalos desejados (Ex: com 9 intervalos).

Distância entre eventosDistância entre eventos

)(ˆ wG )(ˆ wG

ww00

11

00

mín.mín. máx.máx.

nnoo intervalos intervalos

ww1

23

45

67

89

Page 31: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

3131 NOV/99NOV/99

Método Método - Vizinho mais Próximo- Vizinho mais Próximo

)(ˆ wG )(ˆ wG

ww00

11

00

)(ˆ wG )(ˆ wG

00

11

00ww

• Análise exploratória de padrões de distribuição de pontos Análise exploratória de padrões de distribuição de pontos utilizando utilizando

)(ˆ wG )(ˆ wG

Page 32: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

3232 NOV/99NOV/99

Teste de SignificânciaTeste de Significância

• Teste de SignificânciaTeste de Significância– comparar com distribuições teóricas ou simulações comparar com distribuições teóricas ou simulações

querepresentem a “Completa Aleatoriedade Espacial”querepresentem a “Completa Aleatoriedade Espacial”

• A hipótese de CAE A hipótese de CAE – evento segue um processo de Poisson homogêneo evento segue um processo de Poisson homogêneo

sobre a região estudada, sobre a região estudada,

• Outras modelosOutras modelos– processo de Poisson heterogêneo, processo de Cox, processo de Poisson heterogêneo, processo de Cox,

etc.etc.

Page 33: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

3333 NOV/99NOV/99

Método Método - Vizinho mais Próximo- Vizinho mais Próximo• A significância do resultado da análise exploratória, do padrão de A significância do resultado da análise exploratória, do padrão de distribuição de pontos, utilizando o método vizinho mais próximo distribuição de pontos, utilizando o método vizinho mais próximo pode serpode ser avaliada através de um modelo teórico denominado avaliada através de um modelo teórico denominado Aleatoriedade Aleatoriedade Espacial Espacial Completa ( “Complete Spatial Randomness - CSR” ).Completa ( “Complete Spatial Randomness - CSR” ).• Na realidade o que se faz é comparar a distribuição dos eventos Na realidade o que se faz é comparar a distribuição dos eventos observados observados com o que se esperaria na hipótese CSR.com o que se esperaria na hipótese CSR.• Esta metodologia consiste em se criar envelopes de simulação Esta metodologia consiste em se criar envelopes de simulação para a para a distribuição CSR, afim de acessar a significância dos desvios.distribuição CSR, afim de acessar a significância dos desvios.• Na hipótese de CSR, a função de distribuição Na hipótese de CSR, a função de distribuição G(w)G(w) seria dada por seria dada por um um processo de Poisson, como segue (Bailey e Gatrell, 1995):processo de Poisson, como segue (Bailey e Gatrell, 1995):

01)(2

wewG w 01)(2

wewG w

Page 34: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

3434 NOV/99NOV/99

• , , i =1, 2, ..., i =1, 2, ..., mm são funções de distribuição empíricas, estimadas a são funções de distribuição empíricas, estimadas a partir de partir de mm simulações independentes dos n eventos, na hipótese simulações independentes dos n eventos, na hipótese CSR (n eventos independentes e uniformemente distribuídos).CSR (n eventos independentes e uniformemente distribuídos).

Método Método - Vizinho mais Próximo- Vizinho mais Próximo

• A estimação simulada para a distribuição A estimação simulada para a distribuição G(w)G(w) assumindo- assumindo-se CSR é se CSR é calculada como (Bailey e Gatrell, 1995):calculada como (Bailey e Gatrell, 1995):

m

wGwG

m

ii

1

)(ˆ

)(m

wGwG

m

ii

1

)(ˆ

)(

onde:onde:

)(ˆ wGi )(ˆ wGi

Page 35: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

3535 NOV/99NOV/99

Método Método - Vizinho mais Próximo- Vizinho mais Próximo• Para calcular a condição de aleatoriedade, calcula-se os envelopes Para calcular a condição de aleatoriedade, calcula-se os envelopes de de simulação superior e inferior, definidos como segue (Bailey e simulação superior e inferior, definidos como segue (Bailey e Gatrell, 1995):Gatrell, 1995):

miwGmaxwU i ...,,1,)(ˆ)( miwGmaxwU i ...,,1,)(ˆ)(

miwGminwL i ...,,1,)(ˆ)( miwGminwL i ...,,1,)(ˆ)(

• Envelope Envelope superiorsuperior

• Envelope Envelope inferiorinferior

Page 36: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

3636 NOV/99NOV/99

Método Método - Vizinho mais Próximo- Vizinho mais Próximo

• A plotagem x , com adição dos envelopes, permite A plotagem x , com adição dos envelopes, permite medir a medir a significância dos desvios relativo a aleatoriedade.significância dos desvios relativo a aleatoriedade.

)(wG )(wG)(ˆ wG )(ˆ wG

)(ˆ wG )(ˆ wG

)(wG )(wG• Se a condição de CSR for válida para os dados observados, a Se a condição de CSR for válida para os dados observados, a plotagemplotagem

x deve ser praticamente linear com um ângulo de x deve ser praticamente linear com um ângulo de 4545oo

)(ˆ wG )(ˆ wG )(wG )(wG

Envelope InferiorEnvelope Inferior

Envelope SuperiorEnvelope Superior

EstimadoEstimado

Page 37: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

3737 NOV/99NOV/99

Método Método - Vizinho mais Próximo- Vizinho mais Próximo

• Se o dado apresenta tendências para agrupamento, os traçados Se o dado apresenta tendências para agrupamento, os traçados no gráfico no gráfico estarão acima da linha de 45estarão acima da linha de 45oo..

)(ˆ wG )(ˆ wG

)(wG )(wG

• Por outro lado, se o dado apresenta padrões de regularidade os Por outro lado, se o dado apresenta padrões de regularidade os traçados traçados ficarão abaixo da linha de 45ficarão abaixo da linha de 45oo..

)(ˆ wG )(ˆ wG

)(wG )(wG

Page 38: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

3838 NOV/99NOV/99

Método Método - Vizinho mais Próximo- Vizinho mais Próximo• O exemplo abaixo refere-se a crimes juvenis na região de O exemplo abaixo refere-se a crimes juvenis na região de Cardiff, UK Cardiff, UK (Herbert, 1980). Neste caso percebe-se a posição dos (Herbert, 1980). Neste caso percebe-se a posição dos envelopes eenvelopes e da distribuição acima da linha de 45da distribuição acima da linha de 45oo, o que caracteriza , o que caracteriza agrupamento agrupamento para as distâncias em análise.para as distâncias em análise.

DistânciaDistância mín.=0. mín.=0. máx.=16 #intervalos=10 máx.=16 #intervalos=10 #simulações=10#simulações=10

Page 39: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

3939 NOV/99NOV/99

Função KFunção K

• Vizinho mais próximoVizinho mais próximo– pequena escalapequena escala

• FFunção K unção K – propriedades de segunda ordem de um processo propriedades de segunda ordem de um processo

isotrópicoisotrópico

• Definição Definição (Bailey e Gatrell, 1995):(Bailey e Gatrell, 1995):

K(h)K(h) = = EE [#(eventos a distância [#(eventos a distância hh de um evento arbitráriode um evento arbitrário)])]

onde:onde:

- N- Noo eventos / área eventos / área

E()E() - operador esperança. - operador esperança.

Page 40: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

4040 NOV/99NOV/99

Função KFunção K

K(h)K(h) = = EE [#(eventos a distância [#(eventos a distância hh de um evento arbitráriode um evento arbitrário)])]

== nnoo eventos/R eventos/R

R = áreaR = área

R

denominado de intensidadedenominado de intensidade

ouou

Lembrando Lembrando que:que:

# eventos = 7

# eventos = 3

h

h

Page 41: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

4141 NOV/99NOV/99

Função KFunção K

• Necessitamos agora, definir um estimador para a função kNecessitamos agora, definir um estimador para a função k

K(h)K(h) = = EE [#(eventos a distância [#(eventos a distância hh de um evento arbitráriode um evento arbitrário)])]

K(h) =K(h) = , onde: , onde: ddijij é a distância entre os eventos i e é a distância entre os eventos i e

j.j.

IIhh(d(dijij)= )= 1 se1 se ddijij <=h, <=h, 0 se0 se ddijij > h. > h.

R = n = # eventos em RR = n = # eventos em R..

• ResultandoResultando

• O estimador de lambda , então:O estimador de lambda , então:

n

i

n

jijh dI

RhK

1 12

)(1

)(ˆ

n

i

n

jijh dI

RhK

1 12

)(1

)(ˆ

n

i

n

jijh dI

R 1 1

)(1

n

i

n

jijh dI

R 1 1

)(1

R

R

n

i

n

jijh dI

n

RhK

1 12

)()(ˆ

n

i

n

jijh dI

n

RhK

1 12

)()(ˆ

Page 42: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

4242 NOV/99NOV/99

Função KFunção K

• Uma idéia gráfica do que está embutido na notação do estimador da função KUma idéia gráfica do que está embutido na notação do estimador da função K

n

i

n

jijh dI

n

RhK

1 12

)()(ˆ

n

i

n

jijh dI

n

RhK

1 12

)()(ˆ R

h=5

h=5

h=5# eventos=7

# eventos=7

# eventos=3

Page 43: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

4343 NOV/99NOV/99

Função KFunção K• Para uPara um processo aleatório o m processo aleatório o # esperado de eventos a uma # esperado de eventos a uma distância hdistância h de de UMUM evento escolhido aleatoriamenteevento escolhido aleatoriamente é é k(h)=k(h)=hh22 ((Bailey e Gatrell, 1995)Bailey e Gatrell, 1995)

Processo aleatórioProcesso aleatório hhhh

hhhh

hh

hh ÁreaÁreahh22

Tipo de Processo Tipo de Processo K(h)K(h)

Randômico = Randômico = hh22

Ordenação regular < Ordenação regular < hh22

Agregação espacial > Agregação espacial > hh22

Page 44: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

4444 NOV/99NOV/99

Função KFunção K• Uma vez obtido, este pode ser plotado e examinado.Uma vez obtido, este pode ser plotado e examinado.

• O gráfico da função K não é tão intuitivo quanto a do gráfico do O gráfico da função K não é tão intuitivo quanto a do gráfico do vizinho vizinho mais próximo. Portanto utiliza-se uma função auxiliar L, para mais próximo. Portanto utiliza-se uma função auxiliar L, para facilitar afacilitar a interpretação.interpretação.

• O estimador da função L é: O estimador da função L é:

)(ˆ hK )(ˆ hK

hhK

hL

)(ˆ)(ˆ h

hKhL

)(ˆ

)(ˆ

Tipo de Processo Tipo de Processo L(h) K(h) L(h) K(h)

Randômico = Randômico = 0 0 = = hh22

Ordenação regular < Ordenação regular < 0 0 < < hh22

Agregação espacial > Agregação espacial > 0 0 > > hh22

Page 45: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

4545 NOV/99NOV/99

Função KFunção K

• Interpretação da plotagem de Interpretação da plotagem de hhK

hL

)(ˆ)(ˆ h

hKhL

)(ˆ

)(ˆ

)(ˆ hL )(ˆ hL

hh

00

• extremos negativos: mais regularidadeextremos negativos: mais regularidade

• extremos positivos: mais agrupamentoextremos positivos: mais agrupamento

• em torno de zero aleatórioem torno de zero aleatório

Page 46: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

4646 NOV/99NOV/99

• Exemplo :- Exemplo :- O exemplo abaixo refere-se ao município Bood O exemplo abaixo refere-se ao município Bood Moor, situado no condado de Cornwall, Inglaterra. Dados Moor, situado no condado de Cornwall, Inglaterra. Dados geomorfológicos com 36 localizações de rochas de granito. geomorfológicos com 36 localizações de rochas de granito. Neste caso percebe-se que para distâncias entre Neste caso percebe-se que para distâncias entre aproximadamente 2.5 a 3 (extremo positivo do gráfico) há aproximadamente 2.5 a 3 (extremo positivo do gráfico) há evidências de agrupamento.evidências de agrupamento.

Função KFunção K

DistânciaDistância mín.=0.5 máx.=4 #intervalos=10 mín.=0.5 máx.=4 #intervalos=10

Page 47: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

4747 NOV/99NOV/99

Função KFunção K

• Uma abordagem similar a do vizinho mais próximo pode ser feita para seUma abordagem similar a do vizinho mais próximo pode ser feita para se estimar a significância dos desvios da distribuição em relação a aleato-estimar a significância dos desvios da distribuição em relação a aleato- riedade (CSR).riedade (CSR).

• Idéia realizar simulações CSR sobre a região R e computar os envelopesIdéia realizar simulações CSR sobre a região R e computar os envelopes superior e inferior.superior e inferior.

• O envelope superior é definido como (Baley e Gratel, 1995):O envelope superior é definido como (Baley e Gratel, 1995):

• O envelope inferor é definido como (Baley e Gratel, 1995):O envelope inferor é definido como (Baley e Gratel, 1995):

mihLmaxhUpper i ...,,1,)(ˆ)( mihLmaxhUpper i ...,,1,)(ˆ)(

mihLminhLower i ...,,1,)(ˆ)( mihLminhLower i ...,,1,)(ˆ)(

)(ˆ hL )(ˆ hL

Page 48: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

4848 NOV/99NOV/99

• Análise do gráfico com os envelopes Upper(Análise do gráfico com os envelopes Upper(hh) e Lower() e Lower(hh).).

Função KFunção K

)(ˆ hL )(ˆ hL

1.0 -1.0 -

0.5 -0.5 -

1.5 -1.5 -

0.0 -0.0 -

-0.5 --0.5 -

-1.0 --1.0 -

-1.5 --1.5 -

hh

Upper(Upper(hh))

Lower(Lower(hh))

)(ˆ hL )(ˆ hL

)(ˆ hL )(ˆ hL

aleatórioaleatório

Page 49: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

4949 NOV/99NOV/99

Função KFunção K

• Exemplo :- Exemplo :- mudas de Sequoia, Califórnia. Dados representam mudas de Sequoia, Califórnia. Dados representam 62 mudas distribuídas numa região de 23m62 mudas distribuídas numa região de 23m22. .

Page 50: Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial - Análise de Padrões de Estatística Espacial - Análise de Padrões de Distribuição de PontosDistribuição de Pontos

5050 NOV/99NOV/99

AULA PRÁTICA NO SISTEMA SPRINGAULA PRÁTICA NO SISTEMA SPRING

• BANCOS DE DADOS:BANCOS DE DADOS:

– PORTO ALEGRE: PORTO ALEGRE: eventos de violência (homicídios, acidentes de eventos de violência (homicídios, acidentes de transito e suicídios) na cidade de Porto Alegre - RS.transito e suicídios) na cidade de Porto Alegre - RS.

– BoodminMoor: BoodminMoor: refere-se ao município Bood Moor, situado no refere-se ao município Bood Moor, situado no condado de Cornwall, Inglaterra. Dados geomorfológicos com 36 condado de Cornwall, Inglaterra. Dados geomorfológicos com 36 localizações de rochas de granito.localizações de rochas de granito.

– Cardiff: Cardiff: estado em Wales, UK. Dados representam localizações das estado em Wales, UK. Dados representam localizações das 168 residências de infratores juvenis no estado de Cardiff.168 residências de infratores juvenis no estado de Cardiff.

– Redwood: Redwood: mudas de Sequoia, Califórnia. Dados representam 62 mudas de Sequoia, Califórnia. Dados representam 62 mudas distribuídas numa região de 23mmudas distribuídas numa região de 23m22..