Indicadores de Autocorrelação Local em São Paulo
Transcript of Indicadores de Autocorrelação Local em São Paulo
1
INDICADORES DE AUTOCORRELAÇÃO LOCALEXEMPLO DO MUNICÍPIO DE SÃO PAULO
INTRODUÇÃO
O ferramental de análise espacial em unidades de áreas é muito importante
dentro do universo de possibilidades já disponíveis em diversos Sistemas de
Informação Geográfica. Divisão geopolítica, setores censitários, unidades de
paisagem, bairros são casos típicos de elementos geográficos representados
por áreas, ou polígonos, onde para cada polígono há um valor do atributo
associado. Este tipo de representação é também conhecida como mapa
coroplético. Nestes mapas, a variação do atributo no espaço não é
representada por uma superfície contínua, mas apresenta variações abruptas
de valor. Apesar de limitadas às características de cada polígono (tamanho,
forma, homogeneidade), muitas inferências sobre padrões ou comportamentos
espaciais dos diversos atributos podem ser realizadas.
As técnicas de estatística espacial de áreas foram desenvolvidas para tentar
identificar regiões onde a distribuição dos valores possa apresentar um padrão
específico associado a sua localização geográfica. A informação que se busca
é quanto sou parecido com meu vizinho próximo e sou diferente do meu vizinho
distante. Neste trabalho, foram utilizadas duas técnicas de estatística espacial
que nos fornecem indicadores locais de autocorrelação. Cada polígono, ou
unidade de área, terá um determinado valor de dependência espacial. O
indicador de associação espacial local Moran (li) ( Anselin, 1994) explora o
grau de dependência espacial a partir de uma estimativa de segunda ordem, ou
seja, um tipo de covariância espacial entre os polígonos. A segunda
estatística utilizada neste trabalho é conhecida como indicadores Gi e Gi*
(Getis;Ord, 1992) e se baseia em estimativas de primeira ordem, como um tipo
de estimador de médias móveis.
2
A idéia da utilização destes indicadores de autocorrelação local para realização
do trabalho de curso surgiu quando tivemos acesso ao Mapa da
Exclusão/Inclusão Social da Cidade de São Paulo, trabalho coordenado pela
Prof. Aldaíza Sposati da PUC-SP. Este material possui uma série de
indicadores e resultados de pesquisas espacializados nos 96 distritos que
compõem o município de São Paulo. Além de ser um banco de dados
geográficos extremamente rico, o Mapa da Exclusão/Inclusão trazia em sua
gênese a tentativa de captação das discrepâncias e contradições sociais
existentes dentro da estrutura urbana de São Paulo. Dessa forma, o trabalho
se propôs a avaliar as potencialidades de aplicação destas duas ferramentas
estatísticas dentro desta perspectiva.
OBJETIVOS
Os objetivos principais deste trabalho foram:
Primeiro, estudar os métodos estatísticos Gi e Moran Local para detecção de
padrões de forte autocorrelação local e buscar o entendimento do seu
significado estatístico e de sua formulação matemática;
Discutir as semelhanças e diferenças entre estes dois indicadores a partir da
análise comparativa dos resultados obtidos para os distritos do município de
São Paulo sobre os dados presentes no Mapa da Exclusão/Inclusão de São
Paulo;
E, por fim, observar e explorar possíveis padrões quanto seu significado na
tentativa de mapear a exclusão social no município de São Paulo, uma vez que
um dos objetivos do Mapa da Exclusão/Inclusão era captar as diferenças intra-
urbanas entre os 96 distritos paulistanos.
3
INDICADORES LOCAIS DE ASSOCIAÇÃO ESPACIAL
MORAN LOCAL
O Índice de Moran Local foi proposto por Luc Anselin (1994) como uma
ferramenta estatística para testar a autocorrelação local e para detectar objetos
espaciais com influência no indicador Moran Global. Esta família estatística
trabalha a partir da estimativa de segunda ordem do comportamento dos seus
dados, em outras palavras, a partir da análise das covariâncias entre as
diferentes unidades de área. Enquanto o Índice Global de Moran informa o
nível de interdependência espacial entre todos os polígonos em estudo, o
Índice Local de Moran avalia a covariância entre um determinado polígono e
uma certa vizinhança definida em função de uma distância d.
Em análises de associação espacial, assumir uma estabilidade estrutural ou
estacionariedade pode ser complicado, especialmente quando um grande
número de observações são utilizadas, (Anselin, 1994), é possível então a
utilização do Índice Local de Moran como uma ferramenta estatística que
possibilita uma indicação sobre a extensão da significância de um “cluster” de
iguais valores.
Anselin define o Índice Local de Moran como o produto do resíduo no polígono
de referência com a média local dos resíduos dos seus vizinhos adjacentes.
Desta maneira o Índice Local de Moran pode ser escrito como:
Onde:wij= valor na matriz de vizinhança para a região i com a região j em
função da distância d, e onde zi e zj são os desvios em relação à média.
A matriz Wij é a que define os vizinhos de um certo polígono. Esta matriz pode
ser gerada de diferentes maneiras, ou seja, existem várias possibilidades de
Ii = zi Σj wij zj
4
determinação de quem são ou não vizinhos. Neste trabalho adotamos como
critério de vizinhança a adjacência, assim, os valores correspondentes aos
polígonos com borda em comum assumem valor 1 na matriz de vizinhança, por
outro lado, entre os polígonos que não apresentam este tipo de relação o valor
então é nulo.
Como por definição os parâmetros zi e zj representam desvios em relação à
media, torna-se clara a semelhança entre o Índice de Moran e a fórmula da
correlação entre duas variáveis:
Cor= E (x – x) (y – y) / E (x – x)²
Dessa forma, o Índice de Moran Local permite duas importantes interpretações
combinadas: a indicação de “pockets” de não estacionariedade espacial
(indicação de “outliers”) e a possibilidade de teste da hipótese nula sobre a
interdependência dos dados. A relação existente entre o Índice de Moran Local
e o Global pode ser observada na fórmula que define o I global como a soma
dos Ii locais.
Σ Ii = Σ zi Σ wijzje
I=Σ Ii / [So (Σ zi / n)]
A interpretação mais direta do Índice Local de Moran é aquela onde valores
significativamente altos e positivos apontam a presença de um “cluster” tanto
de valores iguais tanto altos como baixos, já valores significativamente baixos
indicam um regime espacial de desigualdade na região, uma espécie de
padrão “anti-cluster”, ou melhor, zonas de transição entre um determinado
regime espacial e outro.
5
Anselin expõe em seu trabalho a formulação matemática que define os
momentos de Ii ( E[Ii] e Var [Ii]) para a construção de intervalos de confiança
para a aceitação da hipótese nula de total aleatoriedade espacial. A partir desta
formulação e assumindo-se uma normalidade na distribuição destes índices
torna-se possível avaliar a significância da observação de um regime espacial
diferenciado.
ESTATÍSTICA Gi E Gi*
A estatística Gi e Gi* é uma ferramenta estatística apresentada por Getis e Ord
como um indicador de associação espacial local. Apesar da estatística G se
aproximar da estatística Moran enquanto objetivo, as informações que ambas
apontam são conceitualmente diferentes. Enquanto o Índice Local de Moran é
baseado na análise das covariância entre áreas o Índice G é na realidade uma
somatória de valores vizinhos definidos a partir de uma matriz de vizinhança
Wij.( Getis;Ord, 1992)
Desta forma Gi e Gi* podem ser escritos como:
Gi = Σj wij(d) xj / Σ xj para i ≠ j
e
Gi* = Σj wij(d) xj / Σ xj para i = j
Onde: Wij é a matriz binária e simétrica que define a vizinhança entre as áreas.
A única diferença existente entre o indicador Gi e Gi* é o fato do valor do
polígono referência ser incluído no cálculo do Gi* e não no cálculo do Gi.
Neste trabalho, a matriz de vizinhança utilizada para o cálculo dos índices Gi e
Gi* foi a mesma utilizada para a definição do Índice Local de Moran, apenas
áreas com bordas comuns foram consideradas vizinhas.
6
Diferentemente do Índice Local de Moran, a estatística Gi e Gi* apresenta uma
interpretação mais direta sobre como os dados estão distribuídos no espaço.
Uma vez que estes indicadores são compostos por uma somatória de valores
de atributos e não desvios em relação à média como no Moran, a observação
de valores significativamente altos de Gi e Gi* apontam a existência de altos
índices de ocorrência deste atributo, sendo o oposto um indício de
agrupamento de valores baixos.
Uma das comparações mais evidentes entre a estatística G e a Moran é a de
que apesar de medirem coisas fundamentalmente diferentes, ambas supõe
normalidade em suas distribuições para construírem intervalos de confiança
para a hipótese nula de total ausência de autocorrelação local.
Em circunstâncias típicas, a hipótese nula é a de que um certo quadro de
valores x dentro de uma distância d é uma amostra aleatória independente de
sua posição geográfica, então assumindo-se uma distribuição normal dos
resultados dos Gi podemos construir intervalos de confiança para um
determinado valor Zi, onde :
Zi = { Gi(d) – E [Gi(d)]} / (var Gi(d))½
A estatística G(d) mede a concentração total ou falta de concentração de todos
os pares de (xi, xj) desde que j seja vizinho de i. O índice Moran, por outro lado
mede a correlação entre cada xi com seus vizinhos xj. Desta forma, e como
poderá ser observado nos resultados obtidos com estes indicadores no caso de
São Paulo, é interessante adotar ambos indicadores na identificação de
autocorrelação espacial uma vez que estes trazem informações
complementares.
7
DADOS E MATERIAIS
Para a realização deste trabalho foram utilizados os seguintes materiais:
- Dados extraídos do Mapa da Exclusão/Inclusão Social da Cidade de São
Paulo / Coord. Aldaíza Sposati / 1996 publicado pela educ;
- Excel 97 e Access 97/Windows para a manipulação dos bancos de dados
(tabelas);
- O software STATISTICS/Windows para análises estatísticas tradicionais;
- SpaceStat 1.9 /DOS para análises espacial dos dados georeferenciados e
Arcview 3.0/ Windows para manipulação e visualização destes dados.
MANIPULAÇÃO DOS INDICADORES
Os dados geográficos quando estão representados por unidades de área
poligonais apresentam uma dificuldade de interpretação básica que é a falta
de informação sobre o comportamento do atributo dentro da unidade espacial
básica de análise. A inacessibilidade a esta informação aliada à metodologia de
pesquisa e aos critérios de divisão do espaço em unidades torna a análise
espacial destes dados um pouco mais específica, na medida que uma se torna
necessária uma avaliação sobre o que realmente representa este dado
espacializado dentro de um determinado polígono de área igual a x.
A dificuldade de manipulação destes dados aumenta conforme a
heterogeneidade de polígonos. Isto se torna especialmente crítico em áreas
urbanas, onde existem áreas altamente povoadas (ti alto) e áreas pouco
povoadas, como áreas rurais (ti baixo) por exemplo. Este tipo de problema
surgiu logo nas primeiras análises dos dados, uma vez que São Paulo, como
caso típico, apresenta alta diversidade de tamanho, forma e densidade de
Distritos (polígonos), podendo ser identificado um padrão de área urbana com
polígonos menores e áreas na região sul que apresentavam características de
zonas rurais.
8
A fim de minimizar o problema heterogeneidade nos polígonos foi aplicado aos
dados brutos um ponderador de intensidade, desta forma, os dados foram
ponderados pelo número de habitantes da área e pelo número relativo aos
outros polígonos. Esta técnica de manipulação foi proposta Besag e Newell em
1991 através da seguinte formulação:
qi = (ni – p ti) / [ ti p(1 – p)]!
onde: p = Σ ni / Σ ti
ni = número de casos observado
ti = população total do polígono I
Os valores (“scores”) que são obtidos a partir desta técnica variam de –100 a
100 e apresentaram uma classificação interessante dos indicadores escolhidos
para a análise. Como uma primeira avaliação, estão organizados a seguir em
ordem decrescente os onze primeiros distritos em função de a) número total de
pessoas idosas; b) porcentagem de pessoas idosas e c) o qi de pessoas
idosas.
POPULAÇÃO >70 % DE IDOSOS qi DE IDOSOS
V. MARIANA CONSOLAÇÃO JD. PAULISTAJD. PAULISTA JD. PAULISTA V. MARIANASAÚDE LAPA CONSOLAÇÃOSANTANA MOÓCA LAPAPERDIZES PINHEIROS PINHEIROSIPIRANGA BELÉM MOÓCAPENHA V. MARIANA STA. CECÍLIAJABAQUARA CAMBUCI SAÚDEITAIM BIBI BARRA FUNDA IPIRANGAPINHEIROS STA. CECÍLIA PERDIZESSTA. CECÍLIA IPIRANGA TATUAPÉ
SACOMÃ TATUAPÉ BELÉM
Neste trabalho foram utilizados três variáveis fornecidas pelo Mapa da
Exclusão/Inclusão de São Paulo. Foram elas:
9
- número de domicílios alugados;
- número de chefes de família com renda até dois salários mínimos ;
- número de pessoas maiores de 70 anos.
A escolha destas variáveis não procurou a princípio ilustrar de maneira
completa o quadro da exclusão social dentro do território urbano, mesmo
porque, o significado da exclusão social passa pela avaliação e ponderação de
inúmeras variáveis. Esta escolha partiu antes da facilidade de interpretação
que representaria a aplicação das estatísticas Moran e Gi.
ÁREA DE ESTUDO
O Município de São Paulo é a maior cidade do Brasil com cerca de 10 milhões
de habitantes, juntamente com mais 36 municípios a Região Metropolitana de
São Paulo representa uma das maiores aglomerações humanas do planeta.
Apesar destes números, todo o processo de expansão ocorrido neste século e,
particularmente nas quatro últimas décadas, foi extremamente rápido e caótico
culminando num quadro social gravíssimo na cidade atual.
O Mapa da Exclusão / Inclusão Social trabalha com o recorte distrital do
espaço urbano. São 96 distritos que correspondem a aglomerações
significativamente maiores que muitas cidade brasileiras.
A heterogeneidade das unidades básicas de análise, os distritos, é mais óbvia
quando são comparados os tamanhos e formas dos polígonos centrais aos
polígonos das regiões de borda, especialmente no quadrante sul. Devido a esta
heterogeneidade partiu-se para uma análise, ou que chamei de visão geral
sobre a área de estudo, onde são avaliadas as características de cada distrito
individualmente e dentro do conjunto total de polígonos. Basicamente busca-se
identificar a significância de cada distrito dentro do município.
10
Fig. 1 . Divisão distrital do município de São Paulo classificado por população
total por distrito.
Fig.2. Distritos do município de São Paulo classificados por densidade
demográfica.
11
APLICAÇÃO DOS MÉTODOS ESTATÍSTICOS AOS DISTRITOS DO
MUNICÍPIO DE SÃO PAULO
A partir das três variáveis qi construídas (idosos, alugueis e sem renda) foram
realizadas basicamente quatro tipo de análises a partir dos indicadores de
autocorrelação local Moran e Gi. Uma refere-se ao cálculo do Índice de Moran
Local tradicional e outra ao cálculo do Índice de Moran Local a partir de 99
permutações. A aplicação de permutações permite em tese uma melhor
aproximação a uma distribuição normal, dessa forma garantindo melhores
inferências aos dados. Os outros dois mapas gerados dizem respeito às
estatísticas Gi e Gi*. É importante relembrar que para ambas as estatísticas foi
adotada a mesma matriz de vizinhança Wij.
A interpretação dos diferentes mapas gerados, parte primeiro de uma análise
estatística básica sobre os dados. Todos os mapas estão acompanhados do
histograma e do gráfico de probabilidade de normalidade dos indicadores de
autocorrelação espacial, dessa forma torna-se mais direta a interpretação dos
valores e a coerência dos intervalos de confiança construídos.
Ao lado de cada mapa, ou resultados obtidos, o SpaceStat 1.9 gera uma lista
apontando os comportamentos mais extremos e os respectivos distritos
relacionados a estes comportamento. Para esta classificação de “outliers”, o
programa se vale da regra dos desvios padrões. Dessa forma, pode-se esperar
que se encontre uma estatística amostral real, S, situada nos intervalos de µµµµs -σσσσs a µµµµs + σσσσs, de µµµµs - 2σσσσs a µµµµs + 2σσσσs, ou de µµµµs - 3σσσσs a µµµµs + 3σσσσs,
aproximadamente em 68,27%, 95,45% e 99,73% de vezes respectivamente.
Como a identificação de comportamentos extremos se baseia
na construção destes intervalos de confiança, todos os mapas foram
classificados a partir dos desvios em relação à média. Assim a visualização e
identificação destes casos extremos se dá de maneira direta e intuitiva.
12
ÍNDICE LOCAL DE MORAN PARA qi DE DOMICÍLIOS ALUGADOS
Fig. 3. Mapa dos índices de Moran Local gerados a partir da variável qi de
domicílios alugados e classificados em função da regra da média mais desvios
padrões.
Histograma do LM_qi_aluguel Gráfico de probabilidade normal
Distritos identificados como “outliers”: IBGE LM
SÉ 3.579176LAPA -1.55504SANTA CECÍLIA 3.128312REPÚBLICA 5.159141BOM RETIRO 2.788280BRÁS 2.360710
stog a o _ _ ( S 96c)96 * 1 * normal (x, 0.418074, 0.93681)
LM_Z_AL
Noofobs
0
10
20
30
40
50
60
-3 -2 -1 0 1 2 3 4 5 6
o a obab ty ot VAR4
Value
ExpectedNormal
-3
-2
-1
0
1
2
3
-20 0 20 40 60 80 100
13
ÍNDICE LOCAL DE MORAN SOBRE PERMUTAÇÕES
Fig. 4. Distritos do município de São Paulo classificados de acordo com índice
de moran local sobre permutações para qi de alugueis.
Histograma do LM_qi_aluguel Gráfico de probabilidade normal
Distritos identificados como “outliers”:IBGE LMP
SÉ 3.579176LAPA -1.55504SANATA CECÍLIA 3.128312REPÚBLICA 5.159141
Histogram of LMP_Z_AL (NEW.STA 10v*96c)96 * 1 * normal (x, 0.418074, 0.93681)
LMP_Z_AL
No
of o
bs
������������������������������������
������������������
���������
���������������������������
������������������
���������
���������������������������
������������������
���������������������������������������������
������������������������������������������������������������������������������������������������������������������������������
���������������������������������������������������������������������������������������������������
���������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
�������������
�������������������������������������������������������
����������������������������������������������������������������������������������������������������������������
��������������������������
������������������������������������ ���������������
0
10
20
30
40
50
60
-3 -2 -1 0 1 2 3 4 5 6
Normal Probability PlotZ_GI__AL
Value
Expe
cted
Nor
mal
Val
ue
���������������������������
������������������
���������������������������������������������
������������������������������������
������������������
���������
������������������������������������
���������������������������
���������
����������������������������������������������������������������������������������������������������������������������������������������
����������������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
-3
-2
-1
0
1
2
3
-4 -3 -2 -1 0 1 2 3 4 5
14
ESTATÍSTICA Gi PARA qi ALUGUEIS
Fig. 5. Distritos de São Paulo classificados pelo valor de Gi.
Histograma de Gi para qi_aluguel Gráfico de probabilidade normal
Distritos identificados como “outliers” para Gi de qi de aluguel:
IBGE Z PROBCONSOLAÇÃO 3.7602 0.0002SÉ 3.6893 0.0002CAMPO LIMPO -3.0400 0.0024JD. ÂNGELA -2.7608 0.0058
Histogram of NG_Z_AL (NEW.STA 11v*96c)96 * 1 * normal (x, 0.008287, 1.521965)
NG_Z_AL
No
of o
bs
���������������������������
������������������
������������������������������������
������������������
���������
���������������������������
������������������
������������������������������������
���������������������������
����������������������������������������������������������������������������������������������������������
����������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
���������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
��������������
������������������������������������
��������������������������������������������������������
��������������������������������������������������������������������������������������������������������
������������������������������������������������������������������
����������������������������
������������������������������������
����������������������������
0
5
10
15
20
25
30
35
-4 -3 -2 -1 0 1 2 3 4 5
Normal Probability PlotZ_LM_ZID
Value
Expe
cted
Nor
mal
Val
ue
���������������������������
������������������
������������������
���������
���������
���������������������������������������������
������������������������������������������������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
-3
-2
-1
0
1
2
3
-2 0 2 4 6 8 10
15
ESTATÍSTICA Gi* PARA qi ALUGUÉIS
Fig. 6. Distritos de São Paulo classificados pelo valor de Gi* de qi de aluguel.
Histograma de Gi* para qi_aluguel Gráfico de probabilidade normal
Distritos identificados como “outliers” para Gi* de qi de aluguel:
IBGE Z PROBSÉ 4.1501 0.0000 REPÚBLICA 4.0764 0.0000 JD. SÃO LUIS -3.2949 0.0010 CAMPO LIMPO -3.1093 0.0019
Histogram of Z_GI__SR (NEW.STA 10v*96c)96 * 1 * normal (x, -0.052278, 2.04597)
Z_GI__SR
No
of o
bs
������������������������������������
������������������������������������
������������������������������������
���������������������������������������������
���������
���������
���������
������������������
������������������
������������������
������������������
���������������������������
����������������������������������������������������������������������������������������������������������������������������������
��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
������������������������������������
������������������������������������
���������������������������������������
���������������������������
������������������������������������������������������������������������
������������������������������������������������������������������������
��������������������������������������������������������������������������������
������������������������������
��������������������
0
4
8
12
16
20
24
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
Normal Probability PlotZ_GI__AL
Value
Expe
cted
Nor
mal
Val
ue
���������������������������
������������������
���������
���������
������������������������������������
���������������������������
������������������
���������
������������������������������������
����������������������������������������������������������������������������������������������������������������������������������
��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
-3
-2
-1
0
1
2
3
-4 -3 -2 -1 0 1 2 3 4 5
16
RESULTADOS SOBRE DOMICÍLIOS ALUGADOS
Nas análises realizadas sobre a variável “qi” de domicílios alugados foi
possível identificar um comportamento diferenciado para os distritos da região
central da cidade. Todos os indicadores de autocorrelação gerados apontaram
o centro da cidade como a área da cidade que apresenta maior número de
famílias vivendo em imóveis não próprios. O quadrante sudoeste da cidade
também foi indicado como uma região com comportamento diferenciado em
relação à média da cidade, porém, neste caso os indicadores Gi apontaram
como sendo uma alta concentração de valores baixos da variável “qi”.
A indicação da região central da cidade como um “outlier” em relação ao
número de imóveis alugados poderia, em uma primeira análise, ser explicado
pelo alto número de cortiços, principalmente quando analisamos que este
comportamento se dá mais sobre o quadrante nordeste, quadrante que
engloba as regiões do Brás, Belém e Bom Retiro, conhecidos distritos com este
tipo de ocupação.
O comportamento apontado no quadrante sudoeste, sobretudo nos distritos de
Campo Limpo, Jardim Ângela e Jardim São Luís poderia ser explicado pela alta
concentração de loteamentos irregulares e invasões presentes nestas regiões.
É interessante notar que através de apenas uma rápida especulação sobre o
significado destas estatísticas, já pudemos identificar dois padrões distintos de
ocupação e uma forte polarização nordeste/sudoeste dentro do espaço urbano.
No caso desta variável é possível observar como a aplicação da técnica de
permutações consegue um ajuste significativo em relação à normalidade dos
dados (veja Fig.3 e Fig.4). Os indicadores Gi e Gi* apresentaram distribuições
onde a aceitação da normalidade é bem coerente.
17
ÍNDICE LOCAL DE MORAN PARA qi DE CHEFES DE FAMÍLIA SEM RENDA
Fig. 7. Mapa dos distritos de São Paulo classificados em relação ao Índice
Local de Moran para a variável “chefes de família sem renda”
Histograma de Ii para qi_sem renda Gráfico de Prob. de Normalidade
“Outliers” apontados pelo SpaceStat:IBGE LOCAL MORANCONSOLAÇÃO 3.372106JD. PAULISTA 5.925623ITAIM PAULISTA 4.440743JD. HELENA 3.608146MOEMA 4.258492
Histogram of Z_LM_SR (NEW.STA 14v*96c)96 * 1 * normal (x, 1.644937, 2.55723)
Z_LM_SR
No
of o
bs
������������������������
����������������
��������������������������������
������������������������
��������
��������������������������������
������������������������
��������
��������������������������������
����������������
��������
������������������������
����������������
��������������������������������
�����������������������������������������������������������������������������������������������������������������������
���������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
���������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
����������������
�����������������������������������������������������������������������������
������������������
��������������������������������������������������������������������������������������
0
10
20
30
40
50
60
-2 -1 0 1 2 3 4 5 6 7 8 9 10 11 12
Normal Probability Plot VAR4
Value
Expe
cted
Nor
mal
Val
ue
����������������
��������
��������������������������������
����������������
��������
��������������������������������
�������������������������������������������������������������������������������������������������������������������
���������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
���������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
-3
-2
-1
0
1
2
3
-20 0 20 40 60 80 100
18
ÍNDICE LOCAL DE MORAN SOBRE PERMUTAÇÕES
Fig. 8. Índice Local de Moran após 99 permutações para a variável “chefe de
família sem renda” para os distritos de São Paulo.
Histograma de Ii para qi_sem renda Gráfico de Prob. de Normalidade
“Outliers” apontados pelo SpaceStat:IBGE LOCAL MORANCONSOLAÇÃO 3.372106JD. PAULISTA 5.925623ITAIM PAULISTA 4.440743JD. HELENA 3.608146MOEMA 4.258492
Histogram of P_LMP_SR (NEW.STA 14v*96c)96 * 0.5 * normal (x, 0.762699, 1.20694)
P_LMP_SR
No
of o
bs
���������������������������
���������
���������������������������
������������������������������������
������������������
������������������������������������
������������������
������������������������������������
���������
���������������������������
���������
���������������������������
������������������������������������
������������������
������������������������������������
������������������
��������������������������������������������������������������������������������������������������������������������������
�����������������������������������������������������������������������������������������������
���������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
����������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
���������������������
����������������������������������������������������������������
��������������������
��������������������������
��������������
���������������������������������������� ��������
0
10
20
30
40
50
60
-1 -0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5 7
Normal Probability Plot VAR4
Value
Expe
cted
Nor
mal
Val
ue
������������������
������������������
���������
������������������������������������
���������������������������
���������������������������
����������������������������������������������������������������������������������������������������������������
����������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
-3
-2
-1
0
1
2
3
-20 0 20 40 60 80 100
19
ESTATÍSTICA Gi PARA A VARIÁVEL qi CHEFES DE FAMÍLIA SEM RENDA
Fig. 9. Distritos de São Paulo classificados de acordo com o valor Gi calculados
para a variável “chefes de família sem renda”.
Histograma de Gi_sem renda Probabilidade de normalidade
“Outliers” apontados para qi_sem rendaIBGE Z PROB VILA CURUÇÁ 4.1568 0.0000 SÃO MIGUEL 3.7919 0.0001 MOEMA -4.6730 0.0000 ITAIM BIBI -4.5468 0.0000
Histogram of Z_NG_SRE (NEW.STA 14v*96c)96 * 1 * normal (x, -0.066983, 1.845625)
Z_NG_SRE
No
of o
bs
���������������������������
���������������������������
���������������������������
���������������������������
������������������
������������������
������������������
���������
���������
���������
������������������������������������
������������������������������������
������������������������������������������������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
����������������������
����������������������������������������
������������������������������
��������������������������������������������������
������������������������������������������������������������������������
���������������������������������������������������������������������������������
������������������������������������������������������������������������
������������������
������������������������
������������������������0
4
8
12
16
20
24
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
Normal Probability PlotZ_NG_SRE
Value
Expe
cted
Nor
mal
Val
ue
������������������������
����������������
��������
��������������������������������
������������������������
����������������
�����������������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
���������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
-3
-2
-1
0
1
2
3
-6 -4 -2 0 2 4 6
20
ESTATÍSTICA Gi* PARA A VARIÁVEL qi CHEFES DE FAMÍLIA SEM RENDA
Fig. 10. Classificação dos distritos do município de São Paulo em relação ao
valor de Gi* calculado para a variável qi de chefes de família sem renda.
Histograma de Gi*_sem renda Prob. Normal
“Outliers” apontados para Gi* de chefes de família sem rendaIBGE Z PROB VILA CURUÇÁ 4.3464 0.0000 ITAIM PAULISTA 4.0837 0.0000MOEMA -5.0586 0.0000 ITAIM BIBI -4.8552 0.0000
Histogram of Z_GI__SR (NEW.STA 14v*96c)96 * 1 * normal (x, -0.052278, 2.04597)
Z_GI__SR
No
of o
bs
����������������
��������
��������������������������������
������������������������
����������������
����������������������������������������
������������������������
����������������
��������
��������������������������������
������������������������
����������������
��������������������������������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������
�������������������������
����������������������
���������������������������
������������������������
������������������������������������������������������������������
����������������������������������������������������������������������
���������������������������������������������������������������
���������������������������
��������������������
0
4
8
12
16
20
24
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
Normal Probability PlotZ_NG_SRE
Value
Expe
cted
Nor
mal
Val
ue
������������������
���������
������������������������������������
���������������������������
������������������
���������������������������������������������
����������������������������������������������������������������������������������������������������������������������
�������������������������������������������������������������������������������������������
����������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
�������������������������������������������������������������������������������������������
-3
-2
-1
0
1
2
3
-6 -4 -2 0 2 4 6
21
RESULTADOS SOBRE CHEFES DE FAMÍLIA SEM RENDA
Novamente o padrão altamente polarizado pode ser observado. Neste caso,
porém, o contraste ocorreu mais fortemente entre os distritos do chamado
centro expandido e os distritos do extremo leste da capital. É possível avaliar
as técnicas estatísticas Local Moran e Gi através desta variável e perceber que
o Indicador de autocorrelação local é mais restritivo na atribuição de nível de
confiança para aceitação da hipótese de ausência de regime espacial extremo.
Apesar da distribuição dos indicadores Moran não apresentarem uma
normalidade, nem mesmo após aplicada a técnica de permutações, os
resultados encontrados em comparação aos levantados nas estatísticas Gi são
muito compatíveis e coerentes.
A zona leste é caracterizada pela ocupação dos grandes projetos habitacionais
das décadas de 70 e 80, e são na realidade verdadeiros distritos dormitórios
dentro da estrutura urbana da capital paulista.
A polarização é extrema quando estes distritos da zona leste são comparados
aos da região do centro expandido onde os distritos de Moema e Itaim Bibi
indicados como “outliers” por todas as estatísticas. Num primeiro momento
parece óbvio o resultado alcançado nestas estatísticas, uma vez que é
bastante conhecido o processo de apropriação do espaço urbano pelas elites
paulistanas no decorrer da história. Este deslocamento no sentido do
quadrante sudoeste começou já no início do processo de metropolização da
cidade com as grandes mansões nos Campos Elísios, posteriormente Av.
Paulista, Av. Brasil e atualmente a Av. Berrini. Neste aspecto é muito
interessante a visualização do indicador Gi, pois o mapa desenha quase que
perfeitamente este processo de apropriação.
22
ÍNDICE DE MORAN LOCAL PARA qi DE POSSOAS IDOSAS
Fig. 11. Distritos de São Paulo classificados pelo índice de Moran Local
calculados sobre a variável qi de pessoas idosas.
Histograma de Ii_qi_idosos Prob. Normal
Outliers identificados para o Moran Local de qi de pessoas idosas:
IBGE LOCAL MORANSANTA CECÍLIA 2.273214CONSOLAÇÃO 2.640032JD. PAULISTA 3.812878VILA MARIANA 3.018939
Histogram of Z_LM_ZID (NEW.STA 14v*96c)96 * 1 * normal (x, 1.4539, 1.639666)
Z_LM_ZID
No
of o
bs
���������������������������
������������������
������������������
���������
������������������������������������
������������������������������������
���������������������������
������������������
������������������
���������
���������������������������������������������
������������������������������������
����������������������������������������������������������������������������������������������������������������������
��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
���������������������������
������������������������������������������������������������������������
��������������������������������
������������������������������������������������������������
���������������������������������
��������������������������������������� ������������
0
5
10
15
20
25
30
35
40
-2 -1 0 1 2 3 4 5 6 7 8 9 10
Normal Probability PlotZ_NG_SRE
Value
Expe
cted
Nor
mal
Val
ue
������������������
������������������������������������
���������������������������
������������������
������������������������������������
���������������������������
��������������������������������������������������������������������������������������������������
�������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
�����������������������������������������������������������������������������������������
-3
-2
-1
0
1
2
3
-6 -4 -2 0 2 4 6
23
MORAN LOCAL APÓS 99 PERMUTAÇÕES PARA qi DE PESSOAS IDOSAS
Fig. 12. Distritos classificados de acordo com o índice local de moran após 99
permutações sobre qi de idosos.
Histograma de LMP_qi_idosos Prob. Normal
“Outlier” indentificados para local moran após permutações:
IBGE LOCAL MORANSANTA CECÍLIA 2.273214CONSOLAÇÃO 2.640032JD. PAULISTA 3.812878VILA MARIANA 3.018939
Histogram of LMP_ZIDO (NEW.STA 14v*96c)96 * 0.5 * normal (x, 0.659648, 0.749906)
LMP_ZIDO
No
of o
bs
������������������������
������������������������
������������������������
������������������������
����������������
����������������
����������������
����������������
����������������
����������������
����������������
����������������������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
������������������������������
��������������������������������������������������������������������������������
����������������������������������������
����������������������������������������
������������������������������������������������������������
0
5
10
15
20
25
30
35
40
-1 -0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
Normal Probability PlotZ_NG_SRE
Value
Expe
cted
Nor
mal
Val
ue
����������������
��������������������������������
������������������������
��������
������������������������
����������������
������������������������������������������������������������������������������������������������������������������������
��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
����������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
-3
-2
-1
0
1
2
3
-6 -4 -2 0 2 4 6
24
ESTATÍSTICA Gi PARA qi DE IDOSOS
Fig. 13. Distritos paulistanos classificados segundo o Gi encontrado para a
variável qi de idosos.
Histograma de Gi_qi_idosos Prob. Normal
“Outliers” apontados pelo SpaceStat para os Gi do qi de pessoas idosas:
IBGE Z PROBVILA MARIANA 3.9700 0.0001 MOEMA 3.6893 0.0002PARELHEIROS -2.7774 0.0055 JOSÉ BONIFÁCIO -2.5313 0.0114
Histogram of GI_Z_IDO (NEW.STA 14v*96c)96 * 1 * normal (x, 0.13141, 1.94596)
GI_Z_IDO
No
of o
bs
��������������
��������������
���������������������
���������������������
���������������������
���������������������
����������������������������
����������������������������
����������������������������
����������������������������
����������������������������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
������������������������������������������������������������
�������������������������������������������������������
��������������������������������������������
�������������������������������������������������������
��������������������������������������������
������������������������������������������������������������
������������������������������������������������
0
4
8
12
16
20
24
-4 -3 -2 -1 0 1 2 3 4 5 6
Normal Probability PlotZ_NG_SRE
Value
Expe
cted
Nor
mal
Val
ue
��������
������������������������
��������������������������������
����������������
��������������������������������
��������
�����������������������������������������������������������������������������������������������������������
����������������������������������������������������������������������������������������������������������������������������������������������������������������������
����������������������������������������������������������������������������������������������������������������������������������������������������������������������
���������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
-3
-2
-1
0
1
2
3
-6 -4 -2 0 2 4 6
25
RESULTADOS DAS ANÁLISES SOBRE qi DE IDOSOS
Novamente o padrão apontado por todos os indicadores revelam dois regimes
espaciais distintos, um na área mais central e outro antagônico nas periferias.
Dentro desta variável é possível observar que as áreas que apresentam
maiores qi de idosos coincidem com as áreas mais abastadas do espaço
urbano. Não seria equivocado estabelecer esta relação, na medida em que o
acesso a serviços de saúde, as condições de habitabilidade, violência e
padrões de renda são fatores diretamente relacionados à longevidade da
população.
Nesta variável, tanto as periferias leste como sul foram apontadas como tendo
um comportamento extremo porém negativo, ou seja, há uma clara
necessidade de se investigarem os aspectos listados acima para que se estude
até que ponto as condições de vida estão influenciando esta variável.
É interessante notar nos indicadores locais de moran a presença de uma
espécie de anel de polígonos com baixos valores justamente nas áreas de
transição entre o regime espacial da região central com o regime espacial das
periferias. Este tipo de informação é só é possível no Moran Local, é por este
motivo que quando utilizamos o Moran Local em conjunto com as estatísticas
Gi, podemos observar o comportamento espacial das variáveis de maneira
muito mais global.
A construção dos intervalos de confiança para “outliers” pode ser questionada
até certo ponto, uma vez que as distribuições apresentaram um certo de grau
de assimetria, fator que interfere diretamente nesta inferência.
26
CONCLUSÕES
O que se pode concluir ao final deste trabalho é muito mais do que as
observações sobre os resultados observados nos mapas de indicadores de
autocorrelação. Entende-se que estes tipos de análises espaciais são
processos complexos uma vez que toda uma manipulação de indicadores de
pesquisas, verificação do suporte gráfico (mapa coroplético) e pesquisa de
ferramentas estatísticas são peças fundamentais para a coerência das
análises. Como conclusões mais diretas podemos apontar:
- A escala dos dados (tamanho e semelhança entre os polígonos) é um fator
decisivo para qualquer tipo de análise espacial. No caso dos distritos de São
Paulo a heterogeneidade tanto espacial quanto em relação às características
internas de cada distrito limitaram uma visualização mais refinada das análises.
Fica agora como sugestão para próximas pesquisas a necessidade de se
buscar uma base com áreas mais refinadas (escala mais local) e que englobe
toda a região metropolitana, uma vez que alguns desvios observados poderia
ser explicado pela localização de borda de um polígono.
- A manipulação dos dados brutos deve sempre estar relacionada a que tipo de
informação se quer extrair. As diferenças internas de cada polígono com
relação a número de habitantes e densidade de habitantes é um complicador
para o entendimento do que estes dados estão nos revelando. A utilização do
ponderador de intensidade aparentemente se mostrou uma possibilidade
bastante interessante.
- Ambos indicadores de autocorrelação local apresentaram bons resultados e
apontaram padrões coerentes à realidade do Município. Como já foi apontado
antes, estes indicadores quando utilizados em conjunto nos propiciam uma
visão muito mais abrangente da situação em estudo.
27
- Dentro da perspectiva de se mapear a exclusão social no município de São
Paulo estas duas ferramentas estatísticas se mostraram de grande valia. A
capacidade de síntese e a visualização cartográfica destes indicadores.
Podem ser observados através destes indicadores regimes espaciais
extremamente polarizados dentro do ambiente urbano, a caracterização das
zonas de centralidade (incluídos) e das periferias (excluídos) ocorre em
todos os dados analisados e evidencia o paradoxo que vivem atualmente
nossas cidades.
28
BIBLIOGRAFIA
Anselin, L., Local Indicators of Spatial Association – LISA. In: GeographicalAnalysis, Vol. 27, No. 2 (April 1995)
Anselin, L., SpaceStat 1.8 user’s guide, Technical Report S-92, National
Center for geographic Information ans Analysis, 1992.
Bailey, T.; Gatrell, A.C., Interactive Spatial Data Analysis., Longman Group
Limited, England, 1995.
Getis,A.; Ord, J.K., Local Spatial Autocorrelation Statistics: Distribuitional Issues
and an Application., In: Geographical Analysis, vol. 27, No.4 (October
1995)
Getis,A.; Ord, J.K., The Analysis of Spatial Association by Use of Distance
Statistics. In: Geographical Analysis, Vol. 24, No. 3 (July 1992)
Sposati, A., Mapa da Exclusão/Inclusão da Cidade de São Paulo, Editora da
PUC-SP, São Paulo, 1996.