DADOS EM AMBIENTE SIG - aquarius.ime.eb.braquarius.ime.eb.br/~ivanildo/sig/UD2.pdf · É possível...

39
UD 2 DADOS EM AMBIENTE SIG

Transcript of DADOS EM AMBIENTE SIG - aquarius.ime.eb.braquarius.ime.eb.br/~ivanildo/sig/UD2.pdf · É possível...

UD 2

DADOS EM AMBIENTE SIG

Conteúdo

• Entrada de Dados;

• Edição de Dados;

• Saída de Dados;

• Manipulação de Dados;

• Fontes de dados – Geometria– GPS;– Sensoriamento remoto (fotos e imagens);– Topografia;– Digitalização (vetorial e matricial);

• Fontes de dados – Atributos– Reambulação;– Interpretação visual;– Classificação supervisionada;– Propriedades geométricas;– Entrada manual;

• Armazenamento

Entrada de Dados

• Protocolos de transferência de arquivos;• Método de aquisição: estático, cinemático, RTK, etc.;• Processamento: DGPS, ajustamento de redes, etc.;• Perda de sinal;• Estrutura de dados adicional;• Equipamentos empregados: portáteis, geodésicos, etc.

Entrada de DadosGeometria – GPS

• Resolução: espacial, radiométrica, temporal e espectral;

• Cobertura de nuvens;

• Balanço da imagem: contraste, brilho, saturação, etc.;

• Dados de registro: pontos de controle (GCP), modelos de retificação e reamostragem;• Composição falsa-cor;

Entrada de DadosGeometria – Sensoriamento remoto

• Normas Técnicas NBR 13133;• Especificações de Levantamento Cadastral;• Cálculo de coordenadas: preliminar, compensações e ajustamento;• Estruturação das feições: CAD X BDG;• Suporte geodésico na integração de projetos;• Integração com métodos de levantamento com GPS;

Entrada de DadosGeometria – Topografia

• Qualidade do documento analógico original;• Atenção ao equipamento;

– Resolução;– Calibração;– Varredura;

• Eliminação de ruídos;• Extração de geometria em formato vetorial;

– Automatizada;– Semi-automatizada;– Manual;

• Consistência topológica;

Entrada de DadosGeometria – Digitalização

Entrada de DadosAtributos – Bancos de dados

• Operações CRUD: CREATE, Read, Update e Delete;• Integridade;• Controle de Acesso;

• Compatibilidade de domínios;

• Preenchimento posterior à aquisição da geometria;

• Arquitetura Dual: dados espaciais relacionados a dados alfanuméricos, mas armazenados separadamente;• Arquitetura Integrada: SGBD armazena simultaneamente dados espaciais e dados alfanuméricos;

• Necessidade de operações espaciais;– Indexação bidimensional: ordenação de ordenadas, células de

Morton, tiling, etc.;– Descritores do objeto: retângulo envolvente, área pré-computada,

nível de cinza médio, etc.

– Adaptação a algoritmos de Computação Gráfica: armazenamento de vértices de polígonos em sentido anti-horário, etc.

Entrada de DadosArmazenamento

• para matrizes mais simples: armazenar, nas páginas físicas em memória secundária, uma linha após a outra (ou uma coluna após a outra).

Este método é adequado para processar operações que exigem visitar os elementos da matriz linha a linha, ou sem nenhuma ordem preferencial como, por exemplo, no cálculo de um histograma.

Ele não é apropriado, no entanto, quando se deseja recuperar os elementos da matriz cobertos por uma janela definida por um intervalo de índices em cada dimensão, por exemplo.

Entrada de DadosArmazenamento e Indexação de Representações Vetoriais

É possível minimizar este problema através de um método de armazenamento que divida cada linha (ou coluna) em segmentos de comprimento fixo, submúltiplo do tamanho da linha, e que permita transferir tais segmentos da memória secundária para a memória principal e vice-versa. Este método seria complementado com um mecanismo que permitisse trazer concomitantemente para memória principal vários segmentos de linha.

Outra estratégia consiste em dividir cada matriz em pequenos blocos, digamos de dimensão 256 X 256, armazenados seqüencialmente em memória secundária segundo alguma ordem, digamos na direção das linhas. Este método permite otimizar o processamento de operações que não trabalham linha a linha (ou coluna a coluna).

Entrada de DadosArmazenamento e Indexação de Representações Matriciais

Entrada de DadosArmazenamento e Indexação de Representações Vetoriais

Pontos: par ordenado (x, y) de coordenadas espaciais

Grade: particiona a região de interesse em células através de retas paralelas aos eixos e espaçadas irregularmente. Um arquivo em grade consiste de duas escalas e um diretório.

A escala associada ao eixo X é uma lista contendo as abcissas em que as retas paralelas ao eixo Y cruzam o eixo X (e similarmente para a outra escala).

O diretório é uma matriz bidimensional, com as mesmas dimensões da grade, tal que cada elemento do diretório corresponde a uma célula e aponta para a página física (ou bucket) que contém todas as coordenadas dos pontos localizados na célula.

Entrada de DadosArmazenamento e Indexação de Representações Vetoriais

Pontos

Árvore kd: é uma árvore de busca binária tal que os nós interiores em cada nível contêm valores referentes a um único eixo (X ou Y, alternadamente) e as folhas apontam para páginas físicas. O processo de subdivisão pára quando a célula contém um conjunto de pontos que possa ser armazenado em uma única página física.

Entrada de DadosArmazenamento e Indexação de Representações Vetoriais

Retângulos

Transformação de retângulos em pontos: consiste em transformar um retângulo de duas dimensões em uma quádrupla (um ponto de 4 dimensões) e utilizar um método de armazenamento e indexação espacial de quádruplas, como arquivos em grade e árvores kd quadri-dimensionais.

Decomposição do espaço com superposição: abandona a idéia de decompor o espaço em regiões que não se superpõem e utiliza a noção de retângulo envolvente. O retângulo envolvente mínimo (r.e.m.) de um conjunto de objetos no R2 é o menor retângulo com lados paralelos aos eixos X e Y que contém todos os objetos no conjunto. Sugere-se o uso de árvores R, onde todos os ramos possuem o mesmo comprimento, ou seja, todas as folhas estão no mesmo nível, como numa árvore de busca balanceada.

Superposição

Espaço não representado

Balanceamento da árvore

Estrutura dinâmica altera-se a cada inserção ou remoção de retângulo

Entrada de DadosArmazenamento e Indexação de Representações Vetoriais

Retângulos

•Retalhamento de retângulos: mantém a idéia de decompor o espaço em regiões que não se superpõem. Porém, cada retângulo ao ser inserido, é retalhado em um conjunto mínimo de retângulos tal que:

–os retângulos não se superpõem; –a união dos retângulos reconstrói o retângulo original; –cada retângulo intercepta exatamente uma das regiões em que se decompõe o espaço.

Resulta na replicação de objetos na estrutura, pois a inserção de um único retângulo acarreta a inserção de uma entrada para cada região que intercepta.

As árvores R+

Variante de árvores R em que, ao se inserir uma nova entrada, se o seu retângulo intercepta os retângulos de dois ou mais nós,

o retângulo é recortado como anteriormente descrito e cada

um dos novos retângulos é inserido nos nós apropriados

Entrada de DadosArmazenamento e Indexação de Representações Vetoriais

•Linhas Poligonais

Sejam v0, v1,... vn n pontos no plano.

Sejam s0 = v0v1, s1 = v1v2,... sn-2 = vn-2vn-1 uma seqüência de n – 1 segmentos, conectando estes pontos.

Estes segmentos formam uma poligonal L se, e somente se:•a interseção de segmentos consecutivos é apenas o ponto extremo compartilhado por eles (i.e., si ∩ si+1 = vi+1)

•segmentos não consecutivos não se interceptam (i.e., si ∩ sj = para ∅todo i, j tais que j ≠ i + 1), e

•v0 ≠ vn-1, ou seja, a poligonal não é fechada.

Entrada de DadosArmazenamento e Indexação de Representações Vetoriais

Linhas Poligonais

•decomposição do espaço em regiões que não se superpõem: cada linha é quebrada em um conjunto mínimo de novas linhas tal que:

–as novas linhas não se superpõem;–a união das novas linhas resulta na linha original; –cada nova linha intercepta exatamente uma das regiões em que se decompõe o espaço.

Este enfoque permite adaptar para linhas qualquer método desenvolvido para armazenar e acessar pontos. Porém, para cada linha, podem ser criadas múltiplas entradas na estrutura de dados adotada, com as mesmas conseqüências para os processos de inserção e remoção, e desperdício de espaço de armazenamento, já observados para retângulos.

Entrada de DadosArmazenamento e Indexação de Representações Vetoriais

Linhas Poligonais

•Aproximar pelo retângulo envolvente mínimo: Cada linha é armazenada em uma árvore V separada e aproximada pelo seu retângulo envolvente mínimo; o conjunto destes retângulos é então armazenado em uma árvore R, cujas folhas apontam para as raízes das árvores V. A estrutura resultante, composta desta árvore R e das várias árvores V, forma então uma árvore VR.

Este enfoque não é apropriado, para o caso de linhas muito longas ou, em geral, quando o retângulo envolvente mínimo não resulta em uma boa aproximação para as linhas. Nesses casos, a linha pode ser quebrada em fragmentos consecutivos que serão aproximados pelo seu retângulo envolvente mínimo.

V1 V2 V3 V4

V5 V8V7V6

v1v2v3v4

V9 V12V11V10 V13 V16V15V14

V17 V18

v4v5v6v7

v7v8v9v10

v10v11v12v13

v13v14v15v16

v16v17v18v19

v19v20v21v22

v22v23v24v25

v25v26v27v28

v28v29v30v31

v31v32v33v34

v34v35v36v37

v37v38v39v40

v40v41V42

Entrada de DadosArmazenamento e Indexação de Representações Vetoriais

Polígonos: região do plano limitada por uma linha poligonal fechada.

•aproximações para a geometria dos polígonos: O retângulo envolvente mínimo (r.e.m.) de um polígono oferece uma aproximação bastante simples e cômoda.

•decomposição dos polígonos em polígonos simples: significa dividí-lo em várias componentes simples - triângulos, trapézios, e outros - de tal forma que, durante o processamento de uma consulta espacial, apenas um pequeno número destas componentes precise ser examinado.

Entrada de DadosArmazenamento e Indexação de Representações Vetoriais

Polígonos: região do plano limitada por uma linha poligonal fechada.

•método de decomposição por grades: o espaço dividido hierarquicamente em células regulares. As células geradas a cada nível podem ser colocadas em z-ordem através do processo de intercalação de bits, proposto originalmente por Morton.

Em cada quadrante, as células são conectadas em z-ordem e depois os grupos de células de cada um dos quatro quadrantes são novamente conectados em z-ordem. Cada célula em cada nível da hierarquia possui um endereço dado por uma cadeia de bits cujo comprimento corresponde ao nível ao qual a célula pertence.

• Recursos de desenho;• Modelagem de vértices;• Álgebra de feições:

– Edge matching;– Criação de ilhas;– Particionamento;

• Convenções de representação;• Generalização;

– Geometria conforme escala: ponto, linha, polígono;– Densidade de vértices;– Critérios de eliminação de geometrias;

Edição de DadosGeometria – Vetores

• Filtros: passa-alta, passa-baixa, etc.

• Classificação;

• Alteração de histograma: balanço de cores;

• Generalização:– Criação de pirâmides;– Compressão de arquivos;

• Operações algébricas com imagens;

Edição de DadosGeometria – Raster

• Gráfico– Mapas;– Gráficos;

– Cartograma;

• Tabular– Tabela;– Texto: linguagem natural ou baseada em XML;

Saída de Dados Apresentação

Roraima is a unit of the federation that has a total of 395.725 people for the year 2007 and aggregate variable “resident population”. Roraima is located in the North Region, with an area of 22,377,870 square kilometers.

Fonte: http://www.inf.puc-rio.br/~casanova/Publications/Papers/2010-Papers/2010-secogis-2.pdf

<gml:featureMember><IBGE:Ferrovias fid="Ferrovias.2"><IBGE:ID>1517</IBGE:ID><IBGE:EMPREENDIM>Ferroanel de São Paulo - SP</IBGE:EMPREENDIM><IBGE:SUBEIXO>Transportes</IBGE:SUBEIXO><IBGE:TIPO>Ferrovia</IBGE:TIPO><IBGE:VALOR_2011>4000000,00</IBGE:VALOR_2011><IBGE:INV_11_14>4000000.0</IBGE:INV_11_14><IBGE:INV_POS_14>0.0</IBGE:INV_POS_14><IBGE:INVEST_T>0.0</IBGE:INVEST_T><IBGE:INVESTIM_2>R$ 4.000.000,00</IBGE:INVESTIM_2><IBGE:UF>SP</IBGE:UF><IBGE:MUNICIPIOS>São Paulo</IBGE:MUNICIPIOS><IBGE:EXECUTORES>ANTT</IBGE:EXECUTORES><IBGE:ORGAO>Ministério dos Transportes</IBGE:ORGAO><IBGE:ESTAGIO>Em execução</IBGE:ESTAGIO><IBGE:DATA_CICLO>30/04/2012</IBGE:DATA_CICLO><IBGE:DATA_CONCL>31/07/2012</IBGE:DATA_CONCL><IBGE:EMBLEMATIC>Não</IBGE:EMBLEMATIC><IBGE:LAT1>-23,5171</IBGE:LAT1><IBGE:LON1>-46,9409</IBGE:LON1><IBGE:GEOCODIGO>3550308</IBGE:GEOCODIGO><IBGE:the_geom><gml:Point srsName="EPSG:4674"><gml:coordinates xmlns:gml="http://www.opengis.net/gml" decimal="." cs="," ts=" ">-46.9409,-23.5171</gml:coordinates></gml:Point></IBGE:the_geom></IBGE:Ferrovias></gml:featureMember>

http://www.geoservicos.inde.gov.br/geoserver/IBGE/ows?service=WFS&version=1.0.0&request=GetFeature&typeName=IBGE:Ferrovias&maxFeatures=50

http://folhaspdados.blogfolha.uol.com.br/2012/10/29/cartograma-os-partidos-ganhadores-de-acordo-com-o-tamanho-do-eleitorado/

• Analógica– Papel: tamanho, textura, gramatura, etc.;– Equipamentos: impressora, plotter, off-set, etc.;– Hologramas;– Maquetes (impressora 3D).

• Digital– Imagem estática: navegador web, CAD, PDF reader, etc.– Animação: fly-through, sequência de imagens, etc.– Documentos: texto, planilhas, hipertexto, etc.– Dispositivo: celular, PC, GPS veicular, etc.– Realidade aumentada: http://popcode.info/demos.html;

Saída de Dados Interface

Operações CRUD: Create, READ, UPDATE e DELETE;• Leitura

– Linguagens de consulta;

– Consulta por atributos;

– Consulta por geometria (topologia);

• Atualização– Geometria (edição);– Atributos: sem histórico de valores;

• Eliminação: feição (geometria e respectivos atributos) deixa de

pertencer ao banco,

Manipulação de DadosOperações sobre bancos de dados

• Interpolação;– Polinomial;– Spline;– Inverso da distância.

• Georreferenciamento;• Reamostragem;• Extrapolação;

– Padrões de comportamento bem definidos;– Consistência de domínio;– Agrega incerteza;

Manipulação de DadosModelos matemáticos

• Comprimento de linhas;

• Extensão de áreas;

• Geração de redes triangulares;

•Geração de isolinhas;

• Geração de superfícies;

• Mapas de declividades;

• Mapas de visibilidade;

• Operações sobre redes; etc.

Manipulação de DadosCálculos

• Uma transação é uma seqüência de operações que o SGBD deve processar até o fim;

• O sistema deve processar as operações sem interferência de outras transações;

• Operações começam em um estado consistente do banco de dados terminam em um estado também consistente;

• Os dados podem apresentar-se em um dos estados:

– Pronto (committed);

– em trabalho (uncommitted); ou

– obsoleto (obsolete).

Manipulação de DadosTransações em Bancos de Dados

• A operação create cria um dado d’ completamente novo em um banco B’;

• A operação create-version cria uma nova versão d’ de um dado d pronto ou em trabalho no mesmo banco de dados B’ que contém d;

• A operação update permite atualizar um dado em trabalho, sem alterar o seu estado;

•A operação commit transforma em pronto um dado em trabalho.

• A operação delete remove um dado d de um banco B.

– Se d for um dado em trabalho, ele é efetivamente destruído;

– Se d for um dado pronto, ele é tornado obsoleto.

– Ao remover um banco B, todos os dados e bancos subordinados a B serão removidos, recursivamente.

Manipulação de DadosTransações em Bancos de Dados

• Operações de atualização submetidas ao banco de dados geográfico: Inserção, Remoção e Modificação;

• Consultas espaciais

– seleção convencional: dado um conjunto de dados D e definida uma restrição ρ sobre atributos convencionais dos dados em D, determinar todos os dados em D que satisfazem ρ.

– seleção pontual: dado um ponto P e um conjunto de dados D, determinar todos os dados em D que contêm P.

– seleção por região: dada uma região R e um conjunto de dados D, determinar todos os dados em D que interceptam ou estão contidos em R.

– junção espacial: dados dois conjuntos de dados, D e D’, e definido um relacionamento espacial θ entre pares de dados (por exemplo, estar contido em), determine todos os pares de dados (d; d’) D D’ tais que d e d’ satisfazem θ.

Manipulação de DadosConsultas em Bancos de Dados

1. Filtragem: São usados os índices para resolver a parte espacial para indicar, dos conjuntos de dados armazenados no banco de dados, aqueles que certamente não satisfazem à qualificação da consulta;

2. Refinamento: as geometrias exatas das componentes espaciais dos dados (preferencialmente, apenas a parte necessária à execução dos operadores) são trazidas para memória principal e sobre as tais são então executados os operadores espaciais especificados na qualificação;

3. Pós-processamento: os dados que atendem à qualificação da consulta são passados para as camadas superiores da arquitetura onde sofrerão processamento posterior ou serão visualizados.

Manipulação de DadosProcessamento da componente espacial da consulta