Avaliador: Prof. Dr. Alexandre Rosa dos Santos Captura e Estruturas de Dados Espaciais Capítulo 6...
Transcript of Avaliador: Prof. Dr. Alexandre Rosa dos Santos Captura e Estruturas de Dados Espaciais Capítulo 6...
Avaliador: Prof. Dr. Alexandre Rosa dos Santos
Captura e Estruturas de Dados Espaciais
Capítulo 6 – Parte 02
Novembro 2013 – Alegre, ES
Antonio P. Drumond Neto Doutorando PPGPV – UFES/CCA
BANCO DE DADOS
Banco de dados do SIG é composto por:
• Dados Textuais
• Dados Numéricos
A, B, C, D ...
1, 2, 3, 4 ...
• Dados Vetoriais • Dados matriciais (raster)
O SIG possui a capacidade de armazenar atributos descritivos e formas geométricas dos diferentes tipos de dados geográficos.
(CAMARA, 2005)
ESTRUTURAS DE DADOS EM SIG
ESTRUTURAS DE DADOS EM SIG
A estrutura dos dados são formas padrões para armazenar dados no computador, sendo um intermediário entre o modelo da realidade e um formato de arquivo
Dados espaciais - Dados relacionados a superfícies contínuas, contendo três coordenadas denominadas de amostra 3D
Dados geográficos - necessários para definir onde as feições cartográficas ocorrem;
Atributos - que registrem o que as feições cartográficas representam.
Coordenadas X, Y e o atributo Z
PRINCIPAIS ESTRUTURAS DE DADOS NO SIGRepresentação matricial: o espaço é representado como uma matriz composta de colunas e linhas.
Cada célula possui um número de linha, um número de coluna e um valor correspondente ao atributo estudado.
Representação vetorial: o fenômeno pode ser abstraído em três elementos gráficos:
• ponto (dimensão zero), • linha (uma dimensão), e • área ou polígono (duas dimensões).
• Mundo Real
DADOS MATRICIAIS
É à representação gráfica do mundo real por meio de pixel (picture element) ou células, com forma poligonal regular, geralmente quadradas, que são definidos pelas suas posições em relação às colunas e linhas de uma malha.
Cada célula armazena um valor de atributo de um determinado tema. Cria-se uma cobertura (ou plano de informação) para cada tema (uso da terra, tipo de solo, cobertura vegetal, tipos de rocha, entre outros).
Dependendo do que se quer representar a célula poderá ter um valor quantitativo ou qualitativo.
TIPO DE ARQUIVOS RASTER
9455
15101
38305
a) Imagem codificada 2n
92,55-12,3
-32,351
53,8-3,41,5
b) Imagem contínua
c) Imagem binária d) Imagem ternária
ESTRUTURAS MATRICIAIS
São estruturados em modelos simples e compacta.
Principais Estruturas Raster:
• CÓDIGO DE CADEIAS
• RUN-LENGTH ENCODING (RLE)
• VALUE POINT ENCODING (VPE)
• MODELOS HIERÁRQUICOS, (QUADTREE e BLOCOS MÁXIMOS).
Exemplo
1
22222222
23322222
23322222
22222111
22222111
22222111
2221111
22211111
DADO MATRICIAL DE 3 DIFERENTES TIPOS DE SOLO
CÓDIGO DE CADEIAS
Códigos:0= ESTE - 1= SUL - 2= OESTE - 3= NORTE
A estruturação em código de cadeias reduziu o tamanho do arquivo em 8 unidades de bytes.
A partir linha 1 e coluna 1, no sentido anti-horário, os dados são organizados segundo determinada categoria.
1
22222222
23322222
23322222
22222111
22222111
22222111
2221111
22211111
Categoria 1= 15, 03, 35, 23.
CÓDIGO DE CADEIAS
Códigos:0= ESTE1= SUL2= OESTE 3= NORTE
13, 00, 30, 20288
10, 02, 30, 20268
11, 01, 31, 21366
13, 03, 33, 23216
16, 02, 36, 22243
15, 03, 35, 23261
11, 01, 31, 21141
15, 03, 35, 23111
CODIFICAÇÃOATRIBUTOCOLUNALINHA
1
22222222
23322222
23322222
22222111
22222111
22222111
2221111
22211111
RLE (Run-Length Encoding)
1
22222222
23322222
23322222
22222111
22222111
22222111
2221111
22211111
O principio consiste em pixels adjacentes tendo o mesmo atributo, combinados em faixa, representada por um par de números. Cada linha inicia uma nova faixa
EXEMPLO: Para a nossa matriz temos:
• LINHA 1: (5,1), (3,2);• LINHA 2: (5,1), (3,2);• LINHA 3: (3,1), (5,2);• LINHA 4: (3,1), (5,2);• LINHA 5: (3,1), (5,2);• LINHA 6: (5,2), (2,3), (1,2);• LINHA 7: (5,2), (2,3), (1,2);• LINHA 8: (8,2).
VPE (Value Point Encoding)
1
22222222
23322222
23322222
22222111
22222111
22222111
2221111
22211111
A codificação dos dados é a partir da linha 1 e coluna 1, continuamente, associando o atributo ao número de pixels. A cada mudança de atributo tem-se um determinado número de pixels.
Exemplo:
5(1); 2(8); 1(13); 2(16); 1(21);
2(24); 1(26); 2(32); 1(35); 2(45); 3(47); 2(53); 3(55); 2(64).
168
157
146
22135
21124
19113
18102
1791
DADO RASTER EM ESTRUTURA QUADTREE
1
22222222
23322222
23322222
22222111
22222111
22222111
2221111
22211111
• O princípio fundamental é a divisão do dado raster a partir de múltiplos polígonos regulares.
• O primeiro quadrado compreende toda a matriz, contém 3 categorias. Este é dividido em sucessivos quadrados, até a unidade fundamental (pixel).
• O modelo de Blocos Máximos é uma variante do quadtree, cujo objetivo é eliminar possíveis redundâncias.
• A matriz é subdividida em polígonos regulares, não necessariamente quadrados, e cada polígono contém um único atributo.
MÉTODOS DE COMPRESSÃO
VANTAGENS DESVANTAGENS
RLE e VPESão voltados para pequenos
computadores. Estrutura simples.
Menos eficiente quando o limite entre os polígonos aumenta. Aumenta os tamanhos dos
arquivos e o tempo de processamento quando o
número de polígonos aumenta.
CÓDIGO DE CADEIAS
Estrutura simples. Dados compactados.
Presença de redundância; os limites dos polígonos são armazenados duas vezes.
Superposições são difíceis sem que se retorne à grade
originais.
BLOCOS MÁXIMOS
Eficiente para formas simples e grades.
Limitado para ser usado em arquivos com muita variedade
espacial.
QUADTREEEstrutura elegante. Dados
compactados. Rápido processamento.
Dificuldade para criação e atualização de arquivos.
Uso do modelo matricial
Variáveis físicas: como precipitação (quantidade de chuva) ou elevação (valor da elevação);
Regiões administrativas: códigos para distritos urbanos;
Uso da terra: definidas a partir de um sistema de classificação;
Distância de um dado objeto a um alvo: cada célula do modelo tem um valor que representa a distância do objeto em estudo.
Neste modelo as coordenadas são consideradas
matematicamente exatas.
3
4
5
7
71
• O que existe de mais importante no modelo vetorial é a entidade ponto.
• Engloba todas as entidades geográficas e gráficas que são posicionadas por um simples par de coordenadas (x,y)
DADOS VETORIAIS
DADOS VETORIAIS
É à representação gráfica do mundo real por meio de coordenadas x, y para definir as feições de dados discretos representados por pontos, linhas e polígonos
Na representação vetorial, o mundo é dividido em elementos com sua própria geometria de pontos, linhas e áreas permitindo que todas as posições sejam definidas exatamente.
ESTRUTURAS VETORIAIS
Os mais usuais são:
As entidades poligonais podem ser estruturadas em diferentes formatos:
• MODELO TOTAL • DUAL INDEPEDENT MAP ENCODING – DIME
• MODELO RELACIONAL E DIGITAL LINE GRAFHS - DGL
• MODELO TOPOLÓGICO
• MODELO ESPAGUETE
ESTRUTURA ESPAGUETE (DESUSADO)
• Fácil entendimento e boa adequação para representação de mapas.
• Apresenta dados redundantes, uma vez que as linhas comuns a dois polígonos são armazenadas duas vezes e a relações espaciais não são arquivadas.
O SIG IDRISI utiliza este modelo para arquivar e representar os PIs
1. Arcos ausente de contiguidade
2. Poligono aberto (ausente de area)
3. Arcos sem conectividade (cruzamento)
4. Poligonos adjacentes com sobreposição (buracos)
É definido como a relação espacial entre feições vizinhas ou adjacentes
TOPOLOGIA
É um conjunto de regras e comportamentos que estipulam como pontos, linhas e polígonos partilham geometrias coincidentes.
TOPOLOGIA NO SIG
Apresenta uma estrutura compacta.
• Garante a integridade e qualidade dos dados
As relações matemáticas entre os objetos são mantidas
• Permite a execução de algumas funções de análise espacial (por exemplo, a operação dissolução).
Constitui a estrutura mais comum para os dados vetoriais
TIPO VANTAGENS DESVANTAGENS
MODELO TOTALEstrutura compacta.
Não há mecanismos explícitos para referenciar áreas adjacentes. As
relações matemáticas entre objetos não são arquivadas.
MODELO TOPOLÓGICO
Estrutura compacta. As relações matemáticas entre objetos são
arquivadas. Rápido processamento de dados.
Estrutura complexas. Redundância de dados.
MODELO ESPAGUETE
Estrutura compacta e de fácil entendimento. Adequado para
mapas.
Lento processamento de dados. As relações espaciais não são
arquivadas. As linhas comuns a dois polígonos são arquivadas duas
vezes.
DIME As estruturas e os atributos são arquivados separadamente.
Redundância de dados. Complexo gerenciamento de arquivos.
DLG São topologicamente estruturados. Custo baixo.
Estrutura complexas.
Vetorial x Raster
Algum tempo atrás estes modelos eram incompatíveis.
Os sistemas comerciais de SIG preferem implementar o modelo vetorial.
Sistemas atuais manipulam ambos os modelos de dados.
Os dois modelos são passíveis de conversão entre si.
A conversão do sentido vetorial para matricial é mais fácil
A conversão no sentido matricial para vetorial é complexa
RASTER x VETORIAL
Aspecto Matricial Vetorial
Transformação de coordenadas Complexo Simples
Estrutura de dados Simples Complexa
Captação de dado Rápido Lento
Área de armazenamento Grande Pequena
Gráficos Médio Bom
Precisão geométrica Baixa Alta
Análise de rede Pobre Bom
Análise de área Bom Médio
Generalização Simples Complexa
Geração de desenho Rápido Lento
Modelagem Simples Complexo
Operação pontual Simples Complexo
MODELO RASTER MODELO VETORIAL• Os dados possuem uma estrutura simples;
• Operações de superposição sãofacilmente implementadas;
• Altas variabilidades espaciais sãoeficientemente representadas;
• Permite operações matemáticascom precisão;
• Operações de modelagem e simulação são facilitadas;
• Possui uma estrutura de dadoscompacta;
• Permite uma codificação da topologia de forma eficaz, como resultado das análises de rede sãofacilmente implementadas;
• É recomendado para gráficos que devam se aproximar dos desenhos feitos à mão;
VANTAGENS
DESVANTAGENS
MODELO RASTER MODELO VETORIAL
• A estrutura dos dados toma muito espaço de memória;
• As relações topológicas são difíceis de serem representadas;
• O produto final pode não ser esteticamente agradável;
• A estruturação dos dados é complexa;
• Operações de superposição são difíceis de serem implementadas;
• A representação de alta variabilidade espacial não é eficaz;
GEOPROCESSAMENTO DAS ESTRUTURAS DE DADOS
IMAGENSObtidas por:
Satélites,
Fotografias aéreas
Scanners aerotransportados
São armazenadas como matrizes e representam formas de captura da informação espacial.
Tipos de Dados em Geoprocessamento
Cada elemento de imagem, denominado pixel, tem um valor proporcional à energia eletromagnética refletida ou emitida pela área da superfície terrestre correspondente.
MAPAS TEMÁTICOS
Descrevem de forma qualitativa, a distribuição espacial de uma grandeza geográfica.
.
Tipos de Dados em Geoprocessamento
Mapa de reconhecimento dos solos da região de Inhamuns, Salgado
(Assad & Sano, 1998)
MAPAS CADASTRAIS
cada elemento é considerado como um objeto geográfico
possui atributos e pode estar associado a várias representações gráficas.
Tipos de Dados em Geoprocessamento
LIMITES CENSITÁRIOS DO DISTRITO DE ARACÊ, DOMINGOS MARTINS, ES
MAPAS POLITEMÁTICOS
Quando as informações, qualitativa e quantitativa estão presentes em um mesmo mapa
Tipos de Dados em Geoprocessamento
MINAS GERAIS
BAHIA
RIO DE JANEIRO
190000
190000
280000
280000
370000
3700007630
000
7630
000
7720
000
7720
000
7810
000
7810
000
7900
000
7900
000
7990
000
7990
000
ESTADO DO ESPÍRITO SANTO
µ50 0 5025 Km
Sistema de CoordenadasDATUM SIRGAS 2000 - ZONA 24S
OC
EA
NO
AT
LÂ
NT
ICO
Atividade agrícola
Apta
Inapropriada
190000
190000
280000
280000
370000
370000
7630
000
7630
000
7720
000
7720
000
7810
000
7810
000
7900
000
7900
000
7990
000
7990
000
µ50 0 5025 Km
Sistema de CoordenadasDATUM SIRGAS 2000 - ZONA 24S
OC
EA
NO
AT
LÂ
NT
ICO
Altitude
2862.5 m
-3.69 m
REDES
armazenam os elementos geográficos em modelo vetorial com topologia de rede (arco-nó),
Os arcos armazenam atributos sobre o sentido dos fluxos e os nós sobre a capacidade
Tipos de Dados em Geoprocessamento
Malha rodoviária do Estado do Paraná
MAPAS NUMÉRICOS DE TERRENO:
O termo é utilizado para denotar a representação quantitativa de uma grandeza que varia continuamente no espaço.
Tipos de Dados em Geoprocessamento
Resolução Espacial
Célula pequena
Maior resolução
Maior precisão da feição espacial
Apresentação mais lenta
Processamento mais lento
Arquivo de armazenagem maior
Célula grande
Menor resolução
Menor precisão na localização da feição espacial
Apresentação mais rápida
Processamento mais rápido
Arquivo de armazenagem menor
Resolução Espacial
SPOT 5
Colorida – resol. 10 m Pancrom. – resol. 2,5 m
1. Época que os dados foram coletados.
2. Fonte dos dados
3. Formato original dos dados
4. Área coberta dos dados.
5. Escala dos mapas
6. Sistema de coordenadas (projeção, datum)
7. Densidade de observações do dado
8. Acurácia das feições (posição e atributos)
9. Consistência logica dos atributos
10. Como os dados foram testados?
Qualidade de Dados e Erros
Qualidade de Dados e Erros
Exatidão
Precisão
Valor verdadeiro
Elementos e sub-elementos de qualidade de dados geográficos
Acurácia posicional ou Geométricao Qualidade externa ou absoluta – Proximidade dos valores em função
dos dados ditos “reais”.
o Qualidade relativa ou interna - Proximidade das posições relativas com respectivas posições aceitas como reais.
o Qualidade da posição da grade de coordenadas – Proximidade da grade de coordenadas com a localização real.
Metadadoso Linhagem – Parâmetros e dados que construíram o conjunto de dados.
Coeficientes de Concordância para a avaliação da acurácia total.
Coeficientes de Concordância para avaliação da acurácia para classes individuais
Elementos e sub-elementos de qualidade de dados geográficos
Consistência Lógicao Consistência de formato – Nível de armazenamento em acordo com a
estrutura física do conjunto de dados.
o Consistência topológica - Características topológicas dos dados.
o Consistência de domínio – Conformidade com os valores de domínio dos dados.
Acurácia temporalo Exatidão das medidas do tempo – Correção na medida temporal.
o Consistência temporal – Correção de eventos ordenados ou em sequencia, caso registrada.
o Validade temporal – Validade dos dados em relação ao tempo (atualização).
Elementos e sub-elementos de qualidade de dados geográficos
Qualidade temáticao Correção da classificação – Comparação da classe associada á feições
ou seus atributos em relação a um conjunto de dados de controle.
o Verificação dos atributos não qualitativos.
o Exatidão dos atributos quantitativos.
Completudeo Comissão – Excesso de dados no conjunto, tanto para as feições
como para seus atributos.
o Omissão - Dados faltantes no conjunto.
TABELA DE VALIDAÇÃO CRUZADA PARA CÁLCULO DE EC E EQ
(1 - 44/64) 0,31
-(1 - 7/18)
0,61(1 - 8/9)
0,11(1 - 20/23)
0,13(1 - 9/14)
0,36Erro de
Omissão
-641892314TOTAL
(1 – 7/8) 0,1387100
Variável (4)
(1 - 8/17) 0,53
175831Variável
(3)
(1 - 20/23) 0,13
2620204Variável
(2)
(1 - 9/13) 0,31
134009Variável
(1)
Erro de ComissãoTOTAL
Variável (4)
Variável (3)
Variável (2)
Variável (1)
Map
a In
terp
reta
do
Mapa Real
Percebe-se que o menor ERRO DE COMISSÃO
refere-se a VARIAVEL 2 e 4, ou seja, em cada
um deles, somente 1 pixel encontrado no mapa
interpretado não correspondeu ao seu
equivalente no mapa real (no campo).
O menor ERRO DE OMISSÃO refere-se a VARIÁVEL 3
(0,11), ou seja, somente 1 pixel encontrado no mapa real
não correspondeu ao seu equivalente no mapa interpretado.
Exemplo para verificar a completitude
ERRO MÉDIO QUADRÁTICO (ROOT MEAN SQUARE) RMS
A quantificação do erro operacional é feita pelos eixo das ordenadas e abscissas onde o cálculo do RMS total será representado graficamente como a hipotenusa de um triângulo retângulo
O RMS calculado pode ser calculado segundo três perspectivas diferentes:
• Escala do mapa;• Probabilidade de erro de um objetivo ser alcançado;• Produto final esperado.
RMS(y)
RMS(x)
Enquadramento original do mapa
Enquadramento feito pela mesa
N
i
i
N
xx
1
21
RMS (x): erro médio quadrático, eixo x
N
i
i
N
yy
1
21
RMS (y): erro médio quadrático, eixo y
22 )()()( yRMSxRMStRMS RMS (t): erro médio quadrático total
1/50 polegadas para mapas com escalas 1:20.000 ou menores1/60 polegadas para mapas com escalas maiores que 1:20.000.
• A conversão para padrões de acurácia é feita baseada em estatística.
• RMS permitido requer 90% de erros acidentais menores que 1,64% do RMS calculado. Ou seja, 1,64 desvios padrões assumindo uma distribuição normal dos erros.
Se tivermos um mapa com escala de 1:15.000, o erro aceitável ou o RMS permitido será o erro aceitável multiplicado pela conversão da escala, multiplicado pela conversão da unidade, dividido por 1,64,ou seja:
m 64,41,64
m/pol 0254,0*000.15* 50
1
pol
RMS permitido
Se tivermos um mapa com escala de 1:25.000:
m 45,61,64
m/pol 0254,0*000.25* 60
1
pol
RMS permitido