IV - areas

87
Tópicos de Estatística Espacial Areas Anderson Castro Soares de Oliveira Notes

description

Analise de dados de areas

Transcript of IV - areas

  • Tpicos de Estatstica EspacialAreas

    Anderson Castro Soares de Oliveira

    Notes

  • Anlise de dados de area

    I Em algumas situaes prticas a localizao geogrficados eventos (pontos) no est disponvel.

    I Mas pode-se encontrar dados aglomerados por de rea,como um estado, municpio, bairro, distrito, setor censitrio,etc.

    I Nestes casos os dados em geral, so contagens por uni-dade de rea tais como: nmero de nascimentos, nmerode crimes, nmero de arvores, etc.

    I Os dados de rea tambm podem ser expressos em formade taxas, mdias, medianas, por exemplo: taxa de morta-lidade, percentual de adultos analfabetos; renda mdia dochefe da familia, mediana etria em mulheres.

    Notes

  • Anlise de dados de area

    I A forma usual de apresentao de dados de reas pormeio dos mapas temticas,

    Figura 1: Renda mdia mensal dos municpios de Mato Grosso(Fonte: IBGE)

    Notes

  • Anlise de dados de area

    I Os mapas temticos representam padro espacial do fen-meno nas areas

    I A anlise estatstica permite alm de visualizar o fenmenonas areas:

    I definir se o padro aleatrio ou noI verificar se existe tendncia

    Notes

  • Anlise de dados de area

    I Para analisar dados de area em geral utiliza-se o modelode variao espacial discreta.

    I Considere-se a existncia de um processo estocstico Zii = 1, ...,n , em que:

    I Zi a realizao do processo espacial na rea i eI n o total de reas (A1, ...An

    I O objetivo principal da anlise construir uma aproxima-o para a distribuio conjunta de variveis aleatrias Z ={Z1, ...Zn}.

    I Em geral supes que Zi segue uma distribuio Poisson,mas quando a varivel taxas ou mdias, pode-se suporque Zi segue uma distribuio normal

    Notes

  • Anlise de dados de area

    I Um dos problemas bsicos com dados agregados por rea que, para uma mesma populao estudada, a definioespacial das fronteiras das reas afeta os resultados obti-dos.

    I As estimativas obtidas dentro de um sistema de unidadesde rea so funo das diversas maneiras segundo as quaisessas unidades podem ser agrupadas.

    I Pode-se obter resultados diferentes simplesmente alterandoas fronteiras entre essas reas.

    I Este problema conhecido como "problema da unidade derea modificvel"

    Notes

  • Vizinhana

    I importante estabelecer quais reas esto conectadas en-tre si;

    I Tipos de vizinhana

    Notes

  • Vizinhana

    I Inicialmente deve-se escolher o critrio de vizinhana a serutilizado;

    I Em seguida deve-se atribuir pesos para a ligaes entre osvizinhos identificados.

    Notes

  • Vizinhana

    I A vizinhana representada por uma matriz de proximi-dade espacial, tambm chamada matriz de vizinhana.

    I Dado um conjunto de n reas (A1, ...,An), a matriz de vi-zinhana de primeira ordem represetando porW (1)(nxn), ecada um dos elementos wi j representa uma medida de pro-ximidade entre Ai e Aj .

    I Existem vrios critrios para escolha de wijI wij = 1 se Ai faz fronteira com Aj e wij = 0 caso contrrioI wij = 1 se Ai est a uma certa distncia de Aj e wij = 0

    caso contrrioI wij = 1/d representa inverso da distncia d entre Ai e AjI wij = 1/d2 representa inverso do quadrado da distncia d

    entre Ai e Aj

    Notes

  • Vizinhana

    I Considere um gride regular com 9 observaes em x e yso as coordenadas de cada rea

    y x0,2 0,5 1,2

    0,5 Z1 = 1 Z4 = 3 Z7 = 31,5 Z2 = 3 Z5 = 10 Z8 = 12,5 Z3 = 5 Z6 = 8 Z9 = 3

    Notes

  • Vizinhana

    I Como temos 9 reas a matrix W ter ordem 9I Considerando como vizinhos apenas as areas que fazem

    fronteiras norte, sul, leste e oesteI Assim, teriamos por exemplo:

    I A1 tem como vizinhos A2 e A4I A5 tem como vizinhos A2, A4, A6 e A8

    I Matriz de pesos

    W =

    0 1 0 1 0 0 0 0 01 0 1 0 1 0 0 0 00 1 0 0 0 1 0 0 01 0 0 0 1 0 1 0 00 1 0 1 0 1 0 1 00 0 1 0 1 0 0 0 10 0 0 1 0 0 0 1 00 0 0 0 1 0 1 0 10 0 0 0 0 1 0 1 0

    Notes

  • Vizinhana

    I Para utilizar a distncia para definir vizinhana necessrioobter a matriz de distncias,

    I A matriz de distncia uma matriz simtrica em que cadadi j pode ser obtido pela distncia euclidiana entre as reas

    I Temos a seguinte matriz de distncia

    D =

    0, 00 1, 00 2, 00 0, 50 1, 12 2, 06 1, 00 1, 00 1, 411, 00 0, 00 1, 00 1, 12 0, 50 1, 12 1, 41 1, 41 1, 002, 00 1, 00 0, 00 2, 06 1, 12 0, 50 2, 24 2, 24 1, 410, 50 1, 12 2, 06 0, 00 1, 00 2, 00 0, 50 0, 50 1, 121, 12 0, 50 1, 12 1, 00 0, 00 1, 00 1, 12 1, 12 0, 502, 06 1, 12 0, 50 2, 00 1, 00 0, 00 2, 06 1, 12 0, 501, 00 1, 41 2, 24 0, 50 1, 12 2, 06 0, 00 1, 00 2, 001, 00 1, 41 2, 24 0, 50 1, 12 1, 12 1, 00 0, 00 1, 001, 41 1, 00 1, 41 1, 12 0, 50 0, 50 2, 00 1, 00 0, 00

    Notes

  • Vizinhana

    I Considerando como vizinhos apenas as areas que tem dis-tncia menor que 1,5

    I Assim, a matrix de vizinhana dada por:

    W =

    0 1 0 1 1 0 1 1 11 0 1 1 1 1 1 1 10 1 0 0 1 1 0 0 11 1 0 0 1 0 1 1 11 1 1 1 0 1 1 1 10 1 1 0 1 0 0 1 11 1 0 1 1 0 0 1 01 1 0 1 1 1 1 0 11 1 1 1 1 1 0 1 0

    Notes

  • Vizinhana

    I Considerando todos como vizinhos e os pesos dados peloinverso da distncia

    I A matrix de vizinhana dada por:

    W =

    0, 00 1, 00 0, 50 2, 00 0, 89 0, 49 1, 00 1, 00 0, 711, 00 0, 00 1, 00 0, 89 2, 00 0, 89 0, 71 0, 71 1, 000, 50 1, 00 0, 00 0, 49 0, 89 2, 00 0, 45 0, 45 0, 712, 00 0, 89 0, 49 0, 00 1, 00 0, 50 2, 00 2, 00 0, 890, 89 2, 00 0, 89 1, 00 0, 00 1, 00 0, 89 0, 89 2, 000, 49 0, 89 2, 00 0, 50 1, 00 0, 00 0, 49 0, 89 2, 001, 00 0, 71 0, 45 2, 00 0, 89 0, 49 0, 00 1, 00 0, 501, 00 0, 71 0, 45 2, 00 0, 89 0, 89 1, 00 0, 00 1, 000, 71 1, 00 0, 71 0, 89 2, 00 2, 00 0, 50 1, 00 0, 00

    Notes

  • Vizinhana

    I A matriz W conhecida como matriz de vizinhana nonormalizada, pode-se trabalhar com matrizes normalizadasem que os todos os elementos esto entre 0 e 1

    I A matriz W , designada de matriz normalizada por linhaI Esta matriz construda a partir da matriz W original, dividindo-

    se todos os elementos de cada linha de W pela soma dalinha

    I Portanto, a matriz W possui todas as linhas com a somaigual a 1 e no simtrica

    Notes

  • Vizinhana

    I A matriz Wn, designada de matriz normalizada globalI Esta matriz construda a partir da matriz W original:

    Wn =n

    ni=1

    nj=1

    wijW

    em que n o numero de reas e wij so os pesos da matrixW

    I Wn esta matriz simtrica

    Notes

  • Mdia Movel Espacial

    I A mdia mvel espacial pode ser utilizada para analisar aexistncia de tendncia espacial

    I Para calcular a mdia mvel espacial utiliza-se a expres-so:

    i =

    nj=1

    wijzi

    nj=1

    wij

    em queI wij so os pesos da matriz de vizinhanaI zi o valor da varivel na area i

    Notes

  • Mdia Movel Espacial

    Zinj=1

    wij

    1 0, 00 1, 00 0, 50 2, 00 0, 89 0, 49 1, 00 1, 00 0, 71 7, 63 1, 00 0, 00 1, 00 0, 89 2, 00 0, 89 0, 71 0, 71 1, 00 8, 25 0, 50 1, 00 0, 00 0, 49 0, 89 2, 00 0, 45 0, 45 0, 71 6, 53 2, 00 0, 89 0, 49 0, 00 1, 00 0, 50 2, 00 2, 00 0, 89 9, 8

    10 0, 89 2, 00 0, 89 1, 00 0, 00 1, 00 0, 89 0, 89 2, 00 9, 68 0, 49 0, 89 2, 00 0, 50 1, 00 0, 00 0, 49 0, 89 2, 00 8, 33 1, 00 0, 71 0, 45 2, 00 0, 89 0, 49 0, 00 1, 00 0, 50 7, 01 1, 00 0, 71 0, 45 2, 00 0, 89 0, 89 1, 00 0, 00 1, 00 7, 93 0, 71 1, 00 0, 71 0, 89 2, 00 2, 00 0, 50 1, 00 0, 00 8, 8

    Notes

  • Mdia Movel Espacial

    wi1z1 wi2z2 wi3z3 wi4z4 wi5z5 wi6z6 wi7z7 wi8z8 wi9z9nj=1

    wijzi

    0, 00 3, 00 2, 50 6, 00 8, 93 3, 88 3, 00 1, 00 2, 13 30, 441, 00 0, 00 5, 00 2, 68 20, 00 7, 14 2, 13 0, 71 3, 00 41, 660, 50 3, 00 0, 00 1, 46 8, 93 16, 00 1, 34 0, 45 2, 13 33, 802, 00 2, 68 2, 43 0, 00 10, 00 4, 00 6, 00 2, 00 2, 68 31, 780, 89 6, 00 4, 46 3, 00 0, 00 8, 00 2, 68 0, 89 6, 00 31, 930, 49 2, 68 10, 00 1, 50 10, 00 0, 00 1, 46 0, 89 6, 00 33, 011, 00 2, 13 2, 23 6, 00 8, 93 3, 88 0, 00 1, 00 1, 50 26, 671, 00 2, 13 2, 23 6, 00 8, 93 7, 14 3, 00 0, 00 3, 00 33, 430, 71 3, 00 3, 55 2, 68 20, 00 16, 00 1, 50 1, 00 0, 00 48, 43

    Notes

  • Mdia Movel Espacial

    Zinj=1

    wijzinj=1

    wij i

    1 30,44 7,59 4,013 41,66 8,20 5,085 33,80 6,48 5,223 31,78 9,77 3,25

    10 31,93 9,57 3,348 33,01 8,26 4,003 26,67 7,03 3,791 33,43 7,94 4,213 48,43 8,81 5,50

    Notes

  • Mdia Movel Espacial

    Figura 2: Taxa de homicdio por 1000 habitantes do estado de matogrosso. esquerda valores observados. direita mdia mvel local,considerando uma vizinhana do tipo Queen.

    Notes

  • Dependncia Espacial

    I Na anlise de dados de area um dos objetivos verifica otipo de interao entre as reas, surgindo questes do tipo

    I Se em uma rea existe um alto numero de ocorrncias deum evento, em uma rea vizinha a ocorrncia tambm seralta?

    I Se em uma rea existe um alto numero de ocorrncias deum evento, em uma rea vizinha a ocorrncia ser baixa?

    I Neste contexto importante estudar a dependncia espa-cial, mostrando como os valores esto correlacionados noespao

    Notes

  • Dependncia Espacial

    I A dependncia espacial pode ser expressa pela autocor-relao espacial que indica quanto uma varivel varia emfuno dos seus vizinhos

    I Para estimar a dependencia espacial pode-se utilizar doisindices

    I Indice de MoranI Indice de Geary

    Notes

  • ndice de Moran

    I O ndice de Moran um coeficiente muito til para medir acorrelao espacial.

    I Este ndice mede a relao do desvio padronizado de umavarivel Z numa rea i com o desvio padronizado dasreas vizinhas para a mesma varivel Z.

    I =

    nni=1

    nj=1

    wij(zi z)(zj z)

    S0(zi z)2

    I n total de reas;I zi e zj os valores da varivel nas reas i e j ;I z mdia geral ;I wij a matriz de pesosI S0 o somatrio dos elementos wij da matriz de pesos

    Notes

  • ndice de Moran

    I A interpretao deste ndice :I I > 0 correlao positiva indicando presena de conglome-

    rados ou agrupamentos.I I = 0 ausncia de correlao indicando que a distribuio

    espacial aleatriaI I < 0 correlao negativa indicando a existncia de regula-

    ridade

    Notes

  • ndice de Moran

    I Aps calcular o ndice de Moran importante testar as se-guintes hipteses{

    H0 : I = 0 no existe correlao espacialH1 : I 6= 0 existe correlao espacial

    I A significncia do ndice de Moran por duas suposies b-sicas

    I NormalidadeI Aletadoriedade

    Notes

  • ndice de Moran

    I Sob a suposio de normalidade temos queI I o valor esperado do ndice de Moran dado por:

    I = 1n 1I 2I a varincia do ndice de Moran dada por:

    2I =

    (n3 n2)S1 + (n n2)S2 + (2 4n)S20

    (n3 n2 n + 1)S20em que

    S1 =12

    ni=1

    nj=1

    (wij + wji)2

    S2 =ni=1

    (wi. + w.i)2 wi. =

    nj=1

    wij

    Notes

  • ndice de Moran

    I Sob hiptese de aleatoriedade a distribuio de probabili-dade desconhecida e assim, temos que:

    I IR o valor esperado do ndice de Moran dado por:

    IR = 1

    n 1I 2I a varincia do ndice de Moran dada por:

    2IR

    =n[3S0

    2 +(n2 3n + 3

    )S1 nS2

    ] k

    [6S0

    2 +(n2 n

    )S1 2nS2

    ](n 3) (n 2) (n 1) S02

    1(n 1)2

    em que

    k =

    ni=1

    (zi z)4

    n(

    ni=1

    (zi z)2)2

    Notes

  • ndice de Moran

    I Em ambos os casos a significncia do ndice de Moran uti-lizado a estatstica

    zc =I 2

    em que e 2 so o valor esperando e varinciaI Rejeita-se H0 se valor p ou zc > z, em que z

    obtido da distribuio normal padro

    Notes

  • ndice de Geary

    I O ndice de Geary utilizado para medir a correlao es-pacial

    I Este ndice se baseia na diferena entre os pares de reas

    C =

    (n 1)ni=1

    nj=1

    wij(zi zj)2

    S0ni=1

    z2i

    I n total de reas;I zi e zj os valores da varivel nas reas i e j ;I wij a matriz de pesosI S0 o somatrio dos elementos wij da matriz de pesos

    Notes

  • ndice de Geary

    I A interpretao deste ndice :I I < 1 correlao positiva indicando presena de conglome-

    rados ou agrupamentos.I I = 1 ausncia de correlao indicando que a distribuio

    espacial aleatriaI I > 1 correlao negativa indicando a existncia de regula-

    ridade

    Notes

  • ndice de Geary

    I Para verificar a significncia do ndice de Geary pode-seutilizar duas suposies bsicas

    I NormalidadeI Aletadoriedade

    Notes

  • ndice de Geary

    I Para ambas as suposies temos que c = 1I Sob suposio de normalidade temos que

    2C =(n 1)(2S1 + S2)) 4S20

    2(n + 1)S20

    I Sob suposio de alaetoriedade temos que

    2C =

    [(n 1)S1(n2 3n + 3 (n 1)k

    ][

    14 (n 1)S2(n2 + 3n 6 (n2 n + 2)k)

    ]+[S20 (n

    2 3 (n 1)2k)]

    n(n 2)(n 3)S20

    Notes

  • ndice de Geary

    I Em ambos os casos a significncia do ndice de Moran uti-lizado a estatstica

    zc =I 12

    em que e 2 so o valor esperando e varinciaI Rejeita-se H0 se valor p ou zc > z, em que z

    obtido da distribuio normal padro

    Notes

  • Exemplo

    I Utilizando taxa homicdios no ano de 2012 em mato grosso,e considerando vizinhana tipo Queen

    I ndice de MoranI I=0,0027, suposio normal valor-p=0.4228, suposio de

    aleatoriedade valor-p=0,4240I Como valor-p>0,05 temos evidncias de que no existe

    correlao entre as areas.I ndice de Grey

    I I=0,9559, suposio normal valor-p=0,2514, suposio dealeatoriedade valor-p=0,2173

    I Como valor-p>0,05 temos evidncias de que no existecorrelao entre as areas.

    Notes

  • Correlograma Espacial

    I Os ndices de Moran e Geary so utilizados para estimar adependncia espacial

    I Para cada classe de distncia d pode-se estabelecer umamatriz de vizinhana W (d) permitindo o clculo diferentesvalores destes ndices para a mesma varivel.

    I Isso permite avaliar o comportamento de autocorrelaoespacial como uma funo de distncia, em um grfico cha-mado de correlograma espacial, que fornece um descritordo padro espacial nos dados.

    Notes

  • Correlograma Espacial

    I O nmero e o tipo de classes de distncia a ser condisera-das so em principio, arbitrrios e podem ser consideradasdiferentes possibilidades a partir de um mesmo conjunto dedados.

    I Pode-se utilizar a frmula de Sturges para determinar o n-mero k de classe de distncia, em que

    k = 1 + log2n

    sendo n numero de distncias na rea amostral.

    Notes

  • Correlograma Espacial

    I Neste caso, os valores obtidos pelo correlograma podemser considerados significativos a um determinado nvel designificncia , utilizando o critrio de correo de Bonfer-roni

    I Esta correo consiste em ajustar o nvel de probabilidade em que se avalia a significncia, dividindo pelo numerode classes de distncia k de maneira que = /k .

    Notes

  • Correlograma Espacial

    Figura 3: Correlograma de Moran (circulos em preto correspondem acorrelaes significativas)

    Notes

  • Correlograma Espacial

    Figura 4: Padro de dados com gradiente linear - Correlograma apre-senta correlaes positiva em distncias curtas e correlaes negati-vos em grandes distncias

    Notes

  • Correlograma Espacial

    Figura 5: Padro de grandes manchas - Correlograma apresenta cor-relaes positiva em pequenas e grandes distncias e correlaesnegativos distncias intermedirias

    Notes

  • Correlograma Espacial

    Figura 6: Padro de pequenas manchas e regulares - Correlogramaapresenta correlaes positiva e negativas significativas oscilando emfuno das distncias

    Notes

  • Correlograma Espacial

    Figura 7: Padro aleatrio - Correlograma apresenta a maioria dascorrelaes no significativas oscilando em torno de zero

    Notes

  • Correlograma Espacial

    I Vrios outros padres podem ser encontrados no correlo-gramas

    Notes

  • Correlograma Espacial

    Figura 8: Renda mdia mensal dos municpios de Mato Grosso e cor-relogramas de Moran e Geary

    Notes

  • Correlograma Espacial

    Figura 9: Taxa de homicdio por 1000 habitantes do estado de matogrosso e correlogramas de Moran e Geary

    Notes

  • Diagrama de Espalhamento de Moran

    I O diagrama de espalhamento de Moran uma maneira adi-cional de visualizar a dependncia espacial.

    I Para construir esse grfico utiliza-se os valores normaliza-dos da varivel

    a =z

    I Em seguida plotado os valores normalizados a da varivelcom a mdia do seu vizinho com a mdia dos seus vizinhosWa

    Notes

  • Diagrama de Espalhamento de Moran

    I O diagrama de espalhamento de Moran dividido emquatro quadrantes, que so interpretados da seguinte forma

    I reas que que encontram-se no Q1 (valores positivos, m-dias positivas) e Q2 (valores negativos, mdias negativas)apresentam associao espacial positiva, no sentido queuma localizao possui vizinhos com valores semelhantes.

    I reas que que encontram-se no Q3 (valores positivos, m-dias negativas) e Q4 (valores negativos, mdias positivas)apresentam associao espacial negativa, no sentido queuma localizao possui vizinhos com valores distintos

    Notes

  • Diagrama de Espalhamento de Moran

    Figura 10: Diagrama de Espalhamento de Moran

    Notes

  • Diagrama de Espalhamento de Moran

    I O diagrama reflete a estrutura espacial nas duas escalasde anlise: vizinhana e tendncia

    I O ndice de Moran I e equivalente ao coeficiente de regres-so linear entre a e Wa

    I A regresso linear entre a e Wa permite identificar valo-res extremos (outliers), para isso localiza-se pontos no dia-grama de Moran que so extremos em relao tendnciacentral, refletida pela inclinao da reta de regresso.

    I A presena de valores extremos pode significar:I problemas com a especificao da matriz de proximidade

    ou com a escala espacial de observao dos dados.I a existncia de regies de transio entre regimes

    espaciais distintos, os quais geralmente pertencem aosquadrantes Q3 e Q4

    I O diagrama de espalhamento de Moran tambm pode serapresentado na forma de um mapa temtico, no qual cadaarea apresentada com a cor do respectivo quadrante

    Notes

  • Diagrama de Espalhamento de Moran

    I O diagrama de espalhamento de Moran tambm pode serapresentado na forma de um mapa temtico, no qual cadaarea apresentada com a cor do respectivo quadrante

    I As areas que se encontram nos quadrantes 3 e 4 (correla-o negativa), podem podem ser entendidos como regiesde transio entre as reas que se encontram nos quadran-tes 1 e 2 (correlao positiva)

    Notes

  • Diagrama de Espalhamento de Moran

    Figura 11: Diagrama de Espalhamento de Moran para renda mdiamensal dos municpios de Mato Grosso

    Notes

  • Diagrama de Espalhamento de Moran

    Figura 12: Diagrama de Espalhamento de Moran para taxa de homi-cdio por 1000 habitantes dos municpios de Mato Grosso

    Notes

  • Indicadores Locais de Associao Espacial (LISA)

    I A estatstica espacial local quantifica o grau de associaoespacial a que cada localizao est submetida em funode um modelo de vizinhana preestabelecido

    I Para este tipo de anlise utilizas-e os Indicadores Locaisde Associao Espacial (LISA)

    I O LISA para cada observao d uma indicao da exten-so da aglomerao espacial significativa de valores simi-lares em torno de que a observao

    I Um LISA ser qualquer estatstica que satifaa a dois crit-rio:

    I Um indicador LISA deve possuir, para cada observao,uma indicao de clusters espaciais significantes de valo-res similares em torno da observao (e.g. regio)

    I O somatrio dos LISAs, para todas as regies, proporcio-nal ao indicador de autocorrelao espacial global.

    Notes

  • ndice local de Moran

    I O ndice local de Moran um indicador LISA baseado nandice de Moran.

    Ii =(zi z)S2i

    nj=1

    wij(zj z)

    I n total de reas;I zi e zj os valores da varivel nas reas i e j ;I z mdia geral ;I wij a matriz de pesos

    I S2i =

    nj=1,i 6=j

    wij

    n1 z2

    Notes

  • ndice local de Moran

    I O valor esperado para o ndice local de Moran

    Ii =

    nj=1

    wij

    n 1I A varincia dada por:

    2Ii =

    (n k)n

    j=1,i 6=jw2ij

    n 1 +(2k n)

    nj=1,i 6=j

    nk=1,i 6=j,j 6=k

    wijwik

    (n 1)(n 2)

    nj=1

    wij

    n 1

    2

    Notes

  • ndice local de Moran

    I A significncia do ndice local de Moran testada utilizadoa estatstica

    zc =Ii Ii

    2Ii

    I Rejeita-se H0 se valor p ou zc > z, em que z obtido da distribuio normal padro

    Notes

  • ndice local de Moran

    I A anlise do ndice local de Moran muito semelhante aodo ndice de Moran.

    I I > Ii correlao positivaI I = Ii ausncia de correlaoI I < Ii correlao negativa

    I Determinada a significncia estatstica do ndice local deMoran, em geral apresentado um mapa temtico indi-cando as regies que apresentam correlao local signi-ficativamente diferente do resto do dados

    Notes

  • ndice local de Moran

    Figura 13: Indice local de Moran para renda mdia mensal dos muni-cpios de Mato Grosso

    Notes

  • ndice local de Moran

    Figura 14: Indice local de Moran para taxa de homicdio por 1000habitantes dos municpios de Mato Grosso

    Notes

  • Regresso Espacial

    I A anlise de regresso uma tcnica que estuda a relaoentre duas ou mais variveis quantitativas estabelecendouma equao matemtica

    I Por meio do modelos de regresso possvel o investigar oefeito de variveis explicativas (X ) na mudana da varivelresposta (Y )

    I Existem diversos modelos de regressoI regresso linearI regresso linear mltiplaI regresso no linear

    Notes

  • Regresso Espacial

    I Quando ajustado um modelo de regresso tem-se a pres-suposio so:

    I Os erros tem distribuio normalI Os erros tem varincia constanteI Os erros so independentes

    I Quando os dados so distribudos espacialmente em areas,em geral a hiptese de independncia dos erros no aten-dida

    Notes

  • Regresso Espacial

    I Em dados distribudos espacialmente em areas deve-se ve-rificar a presena da autocorrelao espacial no resduosda regresso

    I A autocorrelao ou dependncia espacial pode afetar oerro, a varivel dependente ou ambos

    Notes

  • Regresso Espacial

    I Quando detectada a presena de autocorrelao espacial, necessrio ajustar modelos de regresso espacial

    I Os principais modelos de regresso espacial so:I Modelo SARI Modelo SEMI Modelo SARMA

    Notes

  • Modelo SAR

    I O modelo autorregressivo espacial (SAR) utilizado paramodelar o efeito a interao espacial entre uma rea e seusvizinhos

    I um modelo que considera o efeito de defasagem espacialou lag espacial.

    I O modelo SAR dada por:

    y = Wy + X +

    em que:I y o vetor de observaesI o coeficiente de autocorrelao espacialI W a matriz de vizinhanaI X matriz de regressoI vetor de covariveisI o vetor de erros, em que i so independentes e

    identicamente distribudos com i N(0, 2)

    Notes

  • Modelo SAR

    I A estimao do modelo SAR feita assumindo que o vetorde erros tem distribuio normal multivariada com mdiazero e covarincia 2I

    I O modelo SAR pode ser escrito da seguinte forma:

    y = (I W )1X + (I W )1I O vetor de observaes y possui distribuio condicional a

    X normal multivariada, com mdia e varincia condicional,dadas por:

    E [Y |X ] = (I W )1X[Y |X ] = 2(I W )1

    [(I W )1

    ]

    Notes

  • Modelo SAR

    I A partir da distribuio de y obtm-se a verosimilhanacondicional e estimao dos parmetros (,, 2) feitapor mtodo iterativos.

    Notes

  • Modelo SEM

    I O modelo de erro espacial (SEM) considera um processoespacial autoregressivo em termo de erro

    I O modelo SEM dada por:

    y = X + uu = Wu +

    em que:I y o vetor de observaesI o coeficiente de autocorrelao espacial de erroI W a matriz de vizinhanaI X matriz de regressoI vetor de covariveisI o vetor de erros, em que i so independentes e

    identicamente distribudos com i N(0, 2)

    Notes

  • Modelo SEM

    I A varivel u uma varivel latente no observadaI Essa varivel latente pode representar uma observao no

    medida como por exemplo: cultura, capital social, violncia,etc

    I A varivel u tambm pode se entendida como uma varivelque expressa a heterogeneidade espacial

    Notes

  • Modelo SEM

    I O modelo SEM pode ser escrito da seguinte forma

    y = X + (I W )1I A estimao do modelo SEM feita assumindo que o vetor

    de erros tem distribuio normal multivariada com mdiazero e covarincia 2I

    Notes

  • Modelo SEM

    I O vetor de observaes y possui distribuio condicional aX normal multivariada, com mdia e varincia condicional,dadas por:

    E [Y |X ] = X[Y |X ] = 2(I W )1

    [(I W )1

    ]I A estimao feita por maxima verosimilhana condicional

    Notes

  • Modelo SARMA

    I O modelo de autoregressivo de mdias mveis espcial (SARMA) uma combinao dos modelos SAR e SEM

    I O modelo SARMA dada por:

    y = W1yX + uu = W2u +

    em que:I y o vetor de observaesI so coeficientes de autocorrelao espacial de

    defasagem e de erroI W1 e W2 a matriz de vizinhana, em que W1 pode ser

    diferente de W2I X matriz de regressoI vetor de covariveisI o vetor de erros, em que i so independentes e

    identicamente distribudos com i N(0, 2)

    Notes

  • Modelo SARMA

    I A estimao do modelo feita por mxima verossimilhana,assumindo que o N(0, 2I), e reescrevendo o modelo

    y = (I W1)1X + (I W1)1(I W2)1I O vetor de observaes y possui distribuio condicional a

    X normal multivariada, com mdia e varincia condicional,dadas por:

    E [Y |X ] = (I W1)1X[Y |X ] = 2(I W )1(I W2)1

    [(I W )1(I W2)1

    ]

    Notes

  • Teste de Autocorrelao Espacial

    I Os principais testes utilizados para detectar a autocorrela-o espacial so:

    1. Teste de Moran2. Teste de Multiplicador de Lagrange para a dependncia

    espacial de erro (LMe)3. Teste de Multiplicador de Lagrange para a dependncia

    espacial de defasagem (LMlag)4. Teste de Multiplicador de Lagrange para a dependncia

    espacial de defasagem e erro (LMsarma)

    Notes

  • Teste de Moran

    I O teste de Moran consiste em aplicar o indice de Moranaos resduos da regresso

    I O problema deste teste que ele no identifica o tipo deefeito (erro ou defasagem espacial)

    I A estatstica do teste dada por

    I =nS0

    eWeee

    em queI n total de reas;I e o vetor de errosI W matriz de vizinhana ;I S0 o somatrio dos elementos wij da matriz de vizinhana

    Notes

  • Teste de Moran

    I Sob a suposio de normalidade temos queI I o valor esperado do ndice de Moran dado por:

    I = tr(MW )n kI 2I a varincia do ndice de Moran dada por:

    2I =tr(MWMW ) + tr(MWMW ) + (tr(MW ))2

    (n k)(n k + 2) 2I

    em que

    M = I X (X X )1X

    sendo X a matriz do modelo

    Notes

  • Teste de Moran

    I A significncia do ndice de Moran pode ser testada utili-zando a estatstica

    zc =I I2I

    em que e 2 so o valor esperando e varinciaI Rejeita-se H0 se valor p ou zc > z, em que z

    obtido da distribuio normal padro

    Notes

  • Teste de Moran

    I A significncia do ndice de Moran pode ser testada utili-zando a estatstica

    zc =I I2I

    em que e 2 so o valor esperando e varinciaI Rejeita-se H0 se valor p ou zc > z, em que z

    obtido da distribuio normal padro

    Notes

  • Teste de LMe

    I O Teste de Multiplicador de Lagrange para a dependnciaespacial de erro (LMe) utilizado para detectar efeitos deautocorrelao espacial no termo no erro do modelo

    I Este teste verifica a existncia de componente que ex-pressa a dependncia espacial

    I As hipteses do teste so{H0 : = 0 no existe correlao espacial no erroH1 : 6= 0 existe correlao espacial no erro

    Notes

  • Teste de LMe

    I A significncia pode ser testada utilizando a estatstica

    LMe =

    (eWeS2

    )2tr(W W + W 2)

    em queI n total de reas;I e o vetor de errosI W matriz de vizinhana ;

    I S2 =een

    I A estatstica LMe tem distribuio assinttica 2(1)I Rejeita-se H0 se valor p ou 2c > 2

    Notes

  • Teste de LMlag

    I O teste de Multiplicador de Lagrange para a dependn-cia espacial de defasagem (LMlag) utilizado para detectarefeitos de autocorrelao espacial proveniente da vari-vel observada

    I Este teste verifica a existncia de componente que ex-pressa a dependncia espacial

    I As hipteses do teste so{H0 : = 0 no existe correlao espacialH1 : 6= 0 existe correlao espacial

    Notes

  • Teste de LMlag

    I A significncia pode ser testada utilizando a estatstica

    LMlag =

    (eWzS2

    )2(WX )MWX

    S2 + tr(WW + W 2)

    em queI n total de reas;I e o vetor de errosI z o vetor de observaesI W matriz de vizinhana ;

    I S2 =een

    I M = I X (X X )1X sendo X a matriz do modeloI so os coeficientes estimados no modelo de regresso

    Notes

  • Teste de LMlag

    I A estatstica LMlag tem distribuio assinttica 2(1)I Rejeita-se H0 se valor p ou 2c > 2

    Notes

  • Teste de LMSARMA

    I O teste de Multiplicador de Lagrange para a dependnciaespacial de defasagem e erro (LMSARMA) utilizado paradetectar efeitos de autocorrelao espacial no erro e navarivel observada

    I Este teste verifica a existncia de duas componentes evque expressa a dependncia espacial

    I As hipteses do teste so{H0 : = 0 = 0 no existe correlao espacialH1 : 6= 0 6= 0 existe correlao espacial

    Notes

  • Teste de LMSARMA

    I A significncia pode ser testada utilizando a estatstica

    LMSARMA =

    (eWzeWe

    S2

    )2(WX )MWX

    S2 + tr(WW + W 2)

    +

    (eWeS2

    )2tr(W W + W 2)

    em queI n total de reas;I e o vetor de errosI z o vetor de observaesI W matriz de vizinhana ;

    I S2 =een

    I M = I X (X X )1X sendo X a matriz do modeloI so os coeficientes estimados no modelo de regresso

    Notes

  • Teste de LMlag

    I A estatstica LMSARMA tem distribuio assinttica 2(2)I Rejeita-se H0 se valor p ou 2c > 2

    Notes

  • Procedimento para Regresso Espacial

    I Para ajustar uma regresso de dados distribudos espaci-almente deve-se seguir os seguintes passos:

    1. Ajustar o modelo de regresso2. Estabelecer uma matriz de vizinhana3. Testar a presena da autocorrelao espacial utilizando o

    teste de Moran4. Se for detectada a presena da autocorrelao espacial ajus-

    tar um novo modelo SAR, SEM ou SARMAI Para escolha do modelo a ser ajustado utilizar os testes LMI Quando mais de um teste LM for significativo, ajustar os mo-

    delos e escolher o melhor modelo pelos critrios de Akaikeou Schwartz.

    Notes