Bancos de dados geográficos

503
editado e organizado por: Marco Antonio Casanova Gilberto Câmara Clodoveu A. Davis Jr. Lúbia Vinhas Gilberto Ribeiro de Queiroz Bancos de Dados Geográficos Maio, 2005

description

A Parte I - Fundamentos examina os problemas básicos de representação computacional de dados geográficos, resume os principais algoritmos geométricos e representações topológicas e trata da modelagem de dados espaço-temporais em geral. A Parte II - Persistência e Acesso apresenta uma visão geral das principais tecnologias especificamente desenvolvidas para sistemas de gerência de banco de dados geográficos. Inclui ainda exemplos de sistemas existentes que oferecem extensões espaciais. A Parte III - Interoperabilidade cobre tecnologias relacionadas a integração e interoperabilidade, e inclui o tema de disseminação de dados geográficos na Internet. Apresenta também as propostas do Open Geospatial Consortium para interoperabilidade. Por fim, a Parte IV - TerraLib descreve os aspectos mais relevantes da biblioteca TerraLib, incluindo o tratamento de dados matriciais. Apresenta ainda o TerraLib Development Kit - Tdk, cujo objetivo principal é facilitar o desenvolvimento de aplicativos geográficos que utilizem a TerraLib.

Transcript of Bancos de dados geográficos

  • editado e organizado por:

    Marco Antonio Casanova Gilberto Cmara

    Clodoveu A. Davis Jr. Lbia Vinhas

    Gilberto Ribeiro de Queiroz

    Bancos de Dados Geogrficos

    Maio, 2005

  • EditoraCoordenao Editorial

    Produo GrficaCapa

    PreparaoReviso

    Editorao EletrnicaImpresso e acabamento

    Mundogeo AR Comunicao AR Comunicao Grfica Infante

    Copyright Editora Mundogeo

    B212b

    Bancos de dados geogrficos / Organizadores Joo da Silva... [et al.]. Curitiba: EspaoGEO, 2005.

    504 p.

    ISBN

    1. Bancos de dados geogrficos. 2. Aplicativos geogrficos. 3. Geoinformao.

    I. Cmara, Gilberto, 1956 II. Ttulo.

    CDD- 629.4

    Todos os direitos desta edio so reservados Editora MundoGEO.

    R. Desembargador Hugo Simas, 1231 Escritrio 03 Bom Retiro Curitiba / PR 80520-250 Tel.: (41) 3338-7789 Fax: (41) 3338-9237

    www.mundogeo.com

  • H quase duas dcadas, bancos de dados tornaram-se o componente central de sistemas de informao, tanto do ponto de vista de projeto, quanto do ponto de vista de operao. Esta evoluo foi possvel graas a uma slida tecnologia desenvolvida para armazenamento e manipulao de dados convencionais, notadamente os chamados sistemas de gerncia de bancos de dados objeto-relacionais (SGBD-OR).

    O projeto e operao de sistemas de informao geogrfica vem seguindo o mesmo rumo, adotando bancos de dados geogrficos (BDGs) como ponto central da arquitetura. A relativa demora na adoo de BDGs explica-se pela complexidade de representao e manipulao de dados geogrficos. Tal complexidade exigiu desenvolvimentos adicionais da tecnologia dos SGBD-OR at que o nvel de funcionalidade e o desempenho fossem satisfatrios para a plena adoo de BDGs.

    Mais recentemente, o foco do desenvolvimento de sistemas de informao caminhou na direo de federaes de sistemas fracamente acoplados. Os sistemas de informao geogrfica acompanharam de perto esta evoluo, oferecendo uma gama variada de servios de intercmbio e disseminao de dados geogrficos, novamente fruto da maturao de novas tecnologias.

    Este livro aborda bancos de dados geogrficos dentro desta ampla perspectiva, cobrindo desde aspectos de representao dos dados geogrficos at a sua disseminao na Internet. O livro est dividido em quatro partes, para facilitar a leitura.

  • A Parte I - Fundamentos examina os problemas bsicos de representao computacional de dados geogrficos, resume os principais algoritmos geomtricos e representaes topolgicas e trata da modelagem de dados espao-temporais em geral.

    A Parte II - Persistncia e Acesso apresenta uma viso geral das principais tecnologias especificamente desenvolvidas para sistemas de gerncia de banco de dados geogrficos. Inclui ainda exemplos de sistemas existentes que oferecem extenses espaciais.

    A Parte III - Interoperabilidade cobre tecnologias relacionadas a integrao e interoperabilidade, e inclui o tema de disseminao de dados geogrficos na Internet. Apresenta tambm as propostas do Open Geospatial Consortium para interoperabilidade.

    Por fim, a Parte IV - TerraLib descreve os aspectos mais relevantes da biblioteca TerraLib, incluindo o tratamento de dados matriciais. Apresenta ainda o TerraLib Development Kit - Tdk, cujo objetivo principal facilitar o desenvolvimento de aplicativos geogrficos que utilizem a TerraLib.

    O contedo do livro foi balanceado para atender a diferentes comunidades:

    Gerentes de tecnologia de informao interessados em implantar bancos de dados geogrficos em suas instituies podem se beneficiar da leitura dos Captulos 1, 3, 5, 8, 10 e 11.

    Desenvolvedores de sistemas de informao geogrfica tm acesso a material sobre o funcionamento interno dos bancos de dados geogrficos (Captulos 2, 6 e 7) e tambm uma descrio da TerraLib (Captulos 12, 13 e 14).

    Alunos de ps-graduao podem encontrar uma introduo a temas no estado-da-arte nos Captulos 4, 9 e 10.

    Este livro resultante da cooperao entre as equipes baseadas nos estados de So Paulo (INPE), Rio de Janeiro (PUC-Rio) e Minas Gerais (UFMG e PUC Minas). Uma parte substancial dos resultados aqui

  • apresentados resultou de projetos de pesquisa e desenvolvimento, teses e dissertaes nessas instituies. Este livro serve como texto bsico do curso de ps-graduao em Bancos de Dados Geogrficos ministrado no INPE (http://www.dpi.inpe.br/cursos/ser303) e nas disciplinas da Ps-Graduao em Informtica da PUC Minas. Este livro tambm se encontra on-line, com material adicional, no stio:

    http://www.dpi.inpe.br/livros/bdados.

    Agradecemos ao CNPq pelo apoio ao projeto TerraLib e o apoio parcial as pesquisas de Gilberto Cmara e Clodoveu Davis Jr; ao INPE pelo apoio na editorao deste livro; ao Dr. Antnio Miguel Vieira Monteiro, chefe da Diviso de Processamento de Imagens; ao TecGraf e seu coordenador Prof. Marcelo Gattass; PRODABEL e PUC Minas; e, finalmente, Terezinha Gomes dos Santos pelo apoio logstico.

    Esperamos que a comunidade de geoinformao brasileira possa beneficiar-se de nossa experincia, que tentamos transmitir neste livro.

    So Jos dos Campos, Rio de Janeiro, Belo Horizonte, maio de 2005.

    Os autores.

  • Sobre os autores

    Alberto H. F. Laender doutor em Cincia da Computao pela University of East Anglia (UK) e professor titular da UFMG.

    Clodoveu A. Davis Jr. doutor em Cincia da Computao pela UFMG e professor da PUC Minas.

    Daniela Francisco Brauner doutoranda em Informtica na PUC-Rio.

    Gilberto Cmara doutor em Computao Aplicada pelo INPE, e pesquisador da Diviso de Processamento de Imagens do INPE.

    Gilberto Ribeiro de Queiroz mestre em Computao Aplicada pelo INPE e engenheiro da Diviso de Processamento de Imagens do INPE.

    Karine Reis Ferreira mestre em Computao Aplicada pelo INPE e engenheira da Diviso de Processamento de Imagens do INPE.

    Karla A. V. Borges doutoranda em Cincia da Computao na UFMG e analista da PRODABEL.

    Ligiane Alves de Souza mestrando em Cincia da Computao na UFMG.

    Lbia Vinhas doutoranda em Computao Aplicada no INPE e engenheira da Diviso de Processamento de Imagens do INPE.

    Marcelo Tlio Monteiro de Carvalho pesquisador do Grupo de Tecnologia em Computao Grfica (TecGraf) da PUC-Rio.

    Marco Antonio Casanova doutor em Applied Mathematics pela Harvard University (EUA) e professor da PUC-Rio.

    Mrio de S Vera pesquisador do Grupo de Tecnologia em Computao Grfica (TecGraf) da PUC-Rio.

    Olga Fradico de Oliveira doutoranda em Computao Aplicada no INPE.

  • Paulo de Oliveira Lima Junior mestre em Computao Aplicada pelo INPE, professor e coordenador do curso de Bacharelado em Sistemas de Informao da UNIPAC (Conselheiro Lafaiete, MG).

    Ricardo Cartaxo Modesto de Souza engenheiro snior da Diviso de Processamento de Imagens do INPE.

    Taciana de Lemos Dias doutoranda em Computao Aplicada no INPE, professora da PUC Minas e analista da PRODABEL.

  • 1. Representao computacional de dados geogrficos ............................. 11

    2. Algoritmos geomtricos e relacionamentos topolgicos ....................... 53

    3. Modelagem conceitual de dados geogrficos ......................................... 93

    4. Modelos espao-temporais .................................................................. 147

    5. Arquiteturas e Linguagens..................................................................... 181

    6. Mtodos de acesso para dados espaciais ............................................... 213

    7. Processamento de consultas e gerncia de transaes......................... 233

    8. SGBD com extenses espaciais ............................................................. 281

    9. Integrao e interoperabilidade ............................................................. 317

    10. Disseminao de dados geogrficos na Internet................................ 353

    11. O Open Geospatial Consortium ......................................................... 377

    12. Descrio da TerraLib.......................................................................... 395

    13. Tratamento de dados matriciais na TerraLib.................................... 439

    14. Desenvolvimento de aplicativos com a TerraLib .............................. 475

  • 1 Representao computacional de dados geogrficos

    Gilberto Cmara

    1.1 Introduo Este captulo examina os problemas bsicos de representao computacional de dados geogrficos, e esclarece questes da seguinte natureza: Como representar os dados geogrficos no computador? Como as estruturas de dados geomtricas e alfanumricas se relacionam com os dados do mundo real? Que alternativas de representao computacional existem para dados geogrficos? Em seu livro Olhos de Madeira, Carlo Ginzburg nos traz um fascinante ensaio sobre a origem da palavra representao. A origem do termo remonta ao sculo XIII, chamando-se reprsentation aos manequins de cera exibidos junto ao cadver dos reis franceses e ingleses durante as cerimnias funerrias (Ginzburg, 2001). Enquanto o soberano era velado, a presena do manequim era um testemunho transcendncia do rei e a sua presena futura no mundo dos mortos. O manequim tinha a funo de lembrar aos presentes que o rei havia assumido uma outra forma e que uma nova vida se iniciava para o morto. Nesta nova forma, apesar de morto o rei continuaria presente para seus sditos (re + prsentation). Assim, desde a sua origem a palavra representao est associada a uma forma abstrata de descrio do mundo. O uso do manequim como representao do soberano morto apenas um exemplo do problema mais geral da construo de abstraes que descrevem o mundo. Para explicar como funcionam os bancos de dados geogrficos, este captulo descreve o processo de transformar aos conceitos abstratos de espao

  • 1. Representao computacional de dados geogrficos

    12

    geogrfico no referindo ao espao computacionalmente representado. Para exemplificar, consideremos alguns problemas:

    Uma cientista social deseja entender e quantificar o fenmeno da excluso social numa grande cidade brasileira, atravs de mapas de excluso/incluso social, gerados a partir de dados censitrios (Sposati, 1996).

    Uma ecloga pretende estudar os remanescentes florestais da Mata Atlntica, atravs de estudos de fragmentao obtidos a partir de interpretao de imagens de satlite (Pardini et al., 2005).

    Uma pedloga pretende determinar a distribuio de propriedades do solo numa rea de estudo, a partir de um conjunto de amostras de campo (Bnisch et al., 2004).

    O que h de comum nesses casos? A especialista lida com conceitos de sua disciplina (excluso social, fragmentos, distribuio de propriedades do solo) e precisa de representaes que traduzam estes conceitos para o computador. Aps esta traduo, ela poder compartilhar os dados de seu estudo, inclusive com pesquisadores de outras disciplinas.

    1.2 Descrio geral de sistemas de informao geogrfica O termo sistemas de informao geogrfica (SIG) aplicado para sistemas que realizam o tratamento computacional de dados geogrficos. A principal diferena de um SIG para um sistema de informao convencional sua capacidade de armazenar tanto os atributos descritivos como as geometrias dos diferentes tipos de dados geogrficos. Assim, para cada lote num cadastro urbano, um SIG guarda, alm de informao descritiva como proprietrio e valor do IPTU, a informao geomtrica com as coordenadas dos limites do lote. A partir destes conceitos, possvel indicar as principais caractersticas de SIGs:

    Inserir e integrar, numa nica base de dados, informaes espaciais provenientes de meio fsico-bitico, de dados censitrios, de cadastros urbano e rural, e outras fontes de dados como imagens de satlite, e GPS.

    Oferecer mecanismos para combinar as vrias informaes, atravs de algoritmos de manipulao e anlise, bem como para consultar, recuperar e visualizar o contedo da base de dados geogrficos.

  • Descrio geral de sistemas de informao geogrfica

    13

    Os componentes de um SIG esto mostrados na Figura 1.1. No nvel mais prximo ao usurio, a interface homem-mquina define como o sistema operado e controlado. Esta interface pode ser tanto baseada na metfora da mesa de trabalho (Kuhn e Frank, 1991) (Richards e Egenhofer, 1995) (Cmara et al., 1999), como adaptada ao ambiente de navegao da Internet (Kraak e Brown, 2001), quanto baseada em linguagens de comando como Spatial SQL (Egenhofer, 1994) e LEGAL (Cmara, 1995). No nvel intermedirio, um SIG deve ter mecanismos de processamento de dados espaciais. A entrada de dados inclui os mecanismos de converso de dados (Hohl, 1998). Os algoritmos de consulta e anlise espacial incluem as operaes topolgicas (Egenhofer e Franzosa, 1991), lgebra de mapas (Tomlin, 1990), estatstica espacial (Druck et al., 2004), modelagem numrica de terreno (Li et al., 2004) e processamento de imagens (Mather, 2004). Os mecanismos de visualizao e plotagem devem oferecer suporte adequado para a apreenso cognitiva dos aspectos relevantes dos dados pesquisado (MacEachren, 2004) (Tufte, 1983) (Monmonier, 1993). No nvel mais interno do sistema, um sistema de gerncia de bancos de dados geogrficos oferece armazenamento e recuperao dos dados espaciais e seus atributos. Cada sistema, em funo de seus objetivos e necessidades, implementa estes componentes de forma distinta, mas todos os subsistemas citados devem estar presentes num SIG.

    Interface

    Consulta e Anlise Espacial

    Entrada e Integr.Dados

    VisualizaoPlotagem

    Gerncia Dados Espaciais

    Banco de DadosGeogrfico

    Figura 1.1- Arquitetura de sistemas de informao geogrfica.

  • 1. Representao computacional de dados geogrficos

    14

    Do ponto de vista da aplicao, o uso de sistemas de informao geogrfica (SIG) implica em escolher as representaes computacionais mais adequadas para capturar a semntica de seu domnio de aplicao. Do ponto de vista da tecnologia, desenvolver um SIG significa oferecer o conjunto mais amplo possvel de estruturas de dados e algoritmos capazes de representar a grande diversidade de concepes do espao. Como o presente livro est focado nos diferentes aspectos relacionados com a tecnologia de bancos de dados geogrficos, discutiremos em maior detalhe a questo de gerncia de dados espaciais. Leitores interessados nos demais aspectos de um SIG podero consultar as referncias acima.

    1.3 Traduzindo a informao geogrfica para o computador Para abordar o problema fundamental da Geoinformao, que a produo de representaes computacionais do espao geogrfico, usamos o paradigma dos quatro universos, proposto inicialmente por Gomes e Velho (1995) e adaptado para a geoinformao por Cmara (1995). Este paradigma distingue quatro passos entre o mundo real e sua realizao computacional (ver Figura 1.2).

    Figura 1.2 - Paradigma dos quatro universos.

    No primeiro passo, nossas percepes do mundo real so materializadas em conceitos que descrevem a realidade e respondem a questes como: Que classes de entidades so necessrias para descrever o problema que estamos estudando? (Smith, 2003). Criamos assim o universo ontolgico, onde inclumos os conceitos da realidade a serem representados no computador, como os tipos de solo, elementos de cadastro urbano, e caracterizao das formas do terreno. O segundo universo (o universo formal) inclui modelos lgicos ou construes matemticas que generalizam os conceitos do universo ontolgico e do resposta pergunta: Quais so as abstraes formais

  • Traduzindo a informao geogrfica para o computador

    15

    necessrias para representar os conceitos de nosso universo ontolgico? Estas abstraes incluem modelos de dados e lgebras computacionais. Exemplos: o modelo entidade-relacionamento (Chen, 1976) e o modelo OMT (Rumbaugh et al., 1991). O caso especfico de modelos dados geogrficos tratado em maior detalhe nos captulos 3 e 4 deste livro e inclui o modelo OMT-G (Davis et al., 2002). A questo de linguagens tratada no Captulo 5. O terceiro universo o universo estrutural, onde as diversas entidades dos modelos formais so mapeadas para estruturas de dados geomtricas e alfanumricas, e algoritmos que realizam operaes. Neste universo, respondemos a questes como: Quais so os tipos de dados e algoritmos necessrios para representar os modelos e as lgebras do universo formal? As estruturas de dados so os elementos bsicos de construo dos sistemas computacionais, e sero discutidas em maior detalhe neste captulo. Aspectos do universo estrutural descritos no livro incluem arquiteturas de SGBD (Captulo 8), converso de dados (Captulo 9), interoperabilidade (Captulo 10) e disseminao de dados na Internet (Captulo 11). O universo de implementao completa o processo de representao computacional. Neste universo, realizamos a implementao dos sistemas, fazendo escolhas como arquiteturas, linguagens e paradigmas de programao. Neste livro, as questes de implementao discutidas incluem geometria computacional (Captulo 2), mtodos de acesso (Captulo 6), processamento de consultas (Captulo 7), alm da descrio detalhada da biblioteca TerraLib (captulos 12 a 14). O paradigma dos quatro universos uma forma de compreendermos que a transposio da realidade para o computador requer uma srie complexa de mediaes. Primeiro, precisamos dar nomes s entidades da realidade. Depois, geramos modelos formais que as descrevem de forma precisa. A seguir, escolhemos as estruturas de dados e algoritmos que melhor se adaptam a estes modelos formais. Finalmente, fazemos a implementao num suporte computacional apropriado. Nas prximas sees, examinaremos em detalhe cada um destes universos.

  • 1. Representao computacional de dados geogrficos

    16

    1.4 O universo ontolgico Ontologia o campo da filosofia cujo objetivo descrever os tipos e estruturas de entidades, eventos, processos e relaes que existem no mundo real (Smith, 2003). Sua gnese remonta a Aristteles, mas o interesse recente por ontologias em sistemas de informao decorre principalmente da necessidade de compartilhar informao de forma eficiente para um pblico cada vez mais interdisciplinar. Um sistema de informao pode ser concebido como um mecanismo de comunicao entre duas partes: o produtor e o usurio. Para que funcione, necessrio que haja uma concordncia entre os conceitos das partes. Numa perspectiva mais geral, seu sucesso depende da existncia de uma comunidade que compartilhe as definies utilizadas para constru-lo. Por exemplo, considere o caso de um estudo sobre segregao em reas urbanas. Existem diferentes conceitos de segregao na literatura sociolgica (Caldeira, 2000) (Massey e Denton, 1993) (Torres, 2004) (White, 1983). Para construir um sistema de informao que permita o estudo da segregao urbana, preciso que o produtor de informao defina qual dos diferentes conceitos estar sendo representado, como esta representao ser construda, e como o usurio pode compreender as caractersticas e limitaes desta representao. Deste modo, o problema fundamental de um sistema de informao definir o conjunto de conceitos a ser representado. Se quisermos que estes conceitos sejam compartilhados por uma comunidade interdisciplinar, fundamental que os conceitos utilizados sejam devidamente explicitados. Assim, surge a pergunta: Qual o papel dos conceitos na representao do mundo? A melhor forma de responder baseando-se na perspectiva realista (Searle, 1998):

    1. A realidade existe independentemente das representaes humanas.

    2. Ns temos acesso ao mundo atravs de nossos sentidos e de nossos instrumentos de medida.

    3. As palavras em nossa linguagem podem ser usadas para referir-se a objetos do mundo real.

  • O universo ontolgico

    17

    4. Nossas afirmaes so verdadeiras ou falsas dependendo de sua correspondncia aos fatos do mundo.

    5. Algumas afirmaes em nossa linguagem dizem respeito a uma realidade externa e independente (h neve no topo do Monte Evereste). Outras afirmaes dizem respeito a convenes socialmente construdas (este papel uma certido de nascimento).

    Como nos ensina Searle (1993), esta perspectiva tem conseqncias importantes sobre nossa concepo do mundo:

    Apesar de termos representaes mentais e lingsticas do mundo sob a forma de crenas, experincias, afirmaes, teorias, etc., h um mundo, l fora, totalmente independente destas representaes. A rbita elptica dos planetas relativamente ao Sol e a estrutura do tomo de hidrognio so inteiramente independentes das representaes que os seres humanos tm de tais fenmenos. J coisas como o dinheiro, a propriedade, o casamento e os governos so criados e sustentados pelo comportamento cooperativo humano. Na sua maior parte, o mundo existe independentemente da linguagem (princpio 1) e uma das funes da linguagem representar como so as coisas no mundo (princpio 3). Um aspecto crucial no qual a realidade e a linguagem entram em contato marcado pela noo de verdade. Em geral, as afirmaes so verdadeiras na medida em que representam com preciso uma caracterstica da realidade que existe independentemente da afirmao (princpio 4)..

    O projeto de um sistema de informao requer, como passo inicial, a escolha das entidades a ser representados e, se possvel, a descrio organizada destas entidades por meio de conceitos. Esta descrio forma uma ontologia de aplicao, definida como um conjunto de conceitos compartilhados por uma comunidade (Gruber, 1995). Para os dados geogrficos, uma geo-ontologia tem dois tipos bsicos de conceitos: (a) conceitos que correspondem a fenmenos fsicos do mundo real; (b) conceitos que criamos para representar entidades sociais e institucionais (Smith e Mark, 1998) (Fonseca et al., 2003). Chamamos o primeiro tipo de conceitos fsicos e o segundo de conceitos sociais (Tabela 1.1). Embora todos os conceitos resultem do uso compartilhado da linguagem, h uma diferena entre conceitos que se referem ao mundo fsico (A Amaznia

  • 1. Representao computacional de dados geogrficos

    18

    possui uma floresta tropical) e aqueles que resultam de convenes humanas (Esta uma reserva indgena). Nossa geo-ontologia diferencia entre conceitos associados a entidades que pode ser individualizadas e identificadas nominalmente (caso de lagos e lotes) e aquelas que variam de forma contnua no espao (caso de poluio).

    Tabela 1.1 Tipos de conceitos associados a entidades geogrficas

    Realidade fsica Realidade social

    Entidades individualizveis

    indivduos bona fide (e.g., montanha)

    indivduos fiat (e.g., lote)

    Entidades com variao contnua

    topografias fsicas (e.g., poluio)

    topografias sociais (e.g., segregao)

    Os conceitos fsicos podem ser subdivididos em:

    Conceitos associados a entidades individualizveis, que possuem uma fronteira bem definida a partir de diferenciaes qualitativas ou descontinuidades na natureza. Designados como indivduos bona fide (do latim boa f), sua existncia decorre de nossa necessidade de dar nomes aos elementos do mundo natural. Por exemplo, embora a a superfcie da Terra apresente uma variao contnua no espao, nossa percepo do espao depende da associao de nomes especiais a variaes bem definidas no terreno. Da nascem conceitos como montanha, vale e desfiladeiro.

    Conceitos associados a entidades que tem variao contnua no espao, associadas aos fenmenos do mundo natural, no estando a princpio limitadas por fronteiras. Chamamos estes conceitos de topografias fsicas, onde o termo topografia est associado a qualquer grandeza que varia continuamente. Exemplos incluem temperatura, altimetria, declividade e poluio.

  • O universo ontolgico

    19

    Os conceitos sociais podem ser subdivididos em: Conceitos que descrevem entidades individuais criadas por leis e

    por aes humanas. Estas entidades possuem uma fronteira que as distingue do seu entorno e tem uma identidade nica. Sua existncia depende usualmente de um registro legal. Designadas como indivduos fiat (do latim fazer), incluem conceitos como lotes, municpios e pases.

    Conceitos descrevendo entidades que tm variao contnua no espao, associadas a convenes sociais. Tome-se o caso de pobreza, conceito socialmente definido que ocorre no espao de forma ininterrupta (em cada lugar h algum tipo diferente de pobreza). Chamamos estes conceitos de topografias sociais. Exemplos incluem: excluso social, segregao urbana, desenvolvimento humano.

    Uma geo-ontologia um conjunto de conceitos e um conjunto de relaes semnticas e espaciais entre estes termos. Cada conceito tem um nome, uma definio e um conjunto de atributos. O conjunto das relaes semnticas inclui as relaes de sinonmia, similaridade, e hiponmia (tambm dito especializao: hospital um tipo de prdio). Por exemplo:

    rio: Curso de gua natural, de extenso mais ou menos considervel, que se desloca de um nvel mais elevado para outro mais baixo, aumentando progressivamente seu volume at desaguar no mar, num lago, ou noutro rio.

    riacho: rio pequeno, mais volumoso que o regato e menos que a ribeira

    relao semntica: um riacho um rio. (hiponmia). O conjunto de relaes espaciais inclui as relaes topolgicas como pertinncia e adjacncia, relaes direcionais como ao norte de, e relaes informais como no corao de ou perto de. Por exemplo:

    afluente: curso de gua que desgua em outro curso de gua, considerado principal.

    relao espacial: um afluente est conectado a um rio.

  • 1. Representao computacional de dados geogrficos

    20

    Na maior parte dos sistemas de informao atuais, as ontologias de aplicao no esto explicitadas, o que reduz o potencial de compartilhamento da informao. Com o advento da Internet, que permite a disseminao de dados forma ampla e para um pblico heterogneo, a necessidade de explicitar as ontologias utilizadas tornou-se ainda mais premente. A explicitao das ontologias de aplicao est na base das propostas recentes da Web Semntica (Berners-Lee et al., 2001) e de propostas de padres como OWL. Como resultado de pesquisas recentes, j temos vrios sistemas disponveis na Internet para criao e gesto de ontologias, como o Proteg (Noy et al., 2001). Para dados geogrficos, o consrcio OGC (Open Geospatial Consortium) props o formato GML como mecanismo de descrio de ontologias geogrficas. Fazemos uma descrio mais detalhada do tema nos captulos 9 e 10 deste livro.

    1.5 O universo formal O universo formal representa um componente intermedirio entre os conceitos do universo ontolgico e as estruturas de dados e algoritmos computacionais. Como os computadores trabalham com estruturas matemticas, a passagem direta de conceitos informais da ontologia de aplicao para estruturas de dados poderia gerar decises inconsistentes. No universo formal, buscamos estabelecer um conjunto de entidades lgicas que agrupem os diferentes conceitos da ontologia de aplicao da forma mais abrangente possvel. Adicionalmente, neste universo definimos ainda como sero associados valores aos diferentes conceitos; ou seja, como podemos medir o mundo real. Deste modo, o universo formal tem duas partes: (a) como medir o mundo real (teoria da medida); (b) como generalizar os conceitos da ontologia em entidades formais abrangentes. Estas duas partes sero discutidas a seguir.

    1.5.1 Atributos de dados geogrficos: teoria da medida Para representar dados geogrficos no computador, temos de descrever sua variao no espao e no tempo. Em outras palavras, precisamos poder a perguntas como: qual o valor deste dado aqui e agora?. Isto requer uma compreenso dos processos de mensurao da realidade, de forma consistente com os dois primeiros princpios de Searle (1998): a

  • O universo formal

    21

    realidade existe independentemente das representaes humanas e ns temos acesso ao mundo atravs de nossos sentidos e de nossos instrumentos de medida. O processo de medida consiste em associar nmeros ou smbolos a diferentes ocorrncias de um mesmo atributo, para que a relao dos nmeros ou smbolos reflita as relaes entre as ocorrncias mensuradas. Por exemplo, podemos medir a poluio numa cidade atravs de sensores localizados em diferentes locais. Cada um destes sensores nos dar uma medida diferente. Esta atribuio denominada escala de medida. A referncia geral mais importante sobre escalas de medidas o trabalho de Stevens (1946), que prope quatro escalas de mensurao: nominal, ordinal, intervalo e razo. Os nveis nominal e ordinal so temticos, pois a cada medida atribudo um nmero ou nome associando a observao a um tema ou classe. A escala nominal classifica objetos em classes distintas sem ordem inerente, como rtulos que podem ser quaisquer smbolos. As possveis relaes entre os valores so identidade (a = b) e dessemelhana (a b). Um exemplo a cobertura do solo, com rtulos como floresta, rea urbana e rea agrcola (ver Figura 1.3).

    Figura 1.3 Exemplos de medida nominal (mapa geolgico) e medida ordinal (mapa de classes de declividade).

  • 1. Representao computacional de dados geogrficos

    22

    A escala ordinal introduz a idia de ordenao, caracterizando os objetos em classes distintas que possuem uma ordem natural (por exemplo 1 ruim, 2 bom, 3 timo ou 0-10%, 11-20%, mais que 20%). A distncia definida entre os elementos no significativa. Nesta escala so evidenciadas as relaes , isto implica que para todo a e b, as relaes a < b, a > b ou a = b so possveis. Um exemplo a aptido agrcola de solos, com rtulos como muito apto, apto, pouco apto, e inapto. As medidas temticas no esto associadas magnitude do fenmeno. Quando o estudo necessita de uma descrio mais detalhada, que permita comparar intervalo e ordem de grandeza entre eventos, recorre-se aos nveis de medidas denominados de numricos, onde as regras de atribuio de valores baseiam-se em uma escala de nmeros reais. Existem dois nveis de medidas baseados em escalas de nmeros reais: escala por intervalo e o escala por razo. A escala por intervalo possui um ponto zero arbitrrio, uma distncia proporcional entre os intervalos e uma faixa de medidas entre [-,]. A temperatura em graus Celsius exemplo de medida por intervalo, onde o ponto zero corresponde a uma conveno (a fuso do gelo em gua). Por ter uma referncia zero arbitrria, valores medidos no nvel por intervalo no podem ser usados para estimar propores. Operaes aritmticas elementares (adio e subtrao) so vlidas, porm multiplicao e diviso no so apropriadas. Por exemplo, dados a e b, pode-se ter a = b + c, onde c a diferena entre a e b em alguma unidade padro. Assim, a temperatura em So Paulo pode ser c graus mais baixa do que a temperatura em Campos de Jordo. A escala de razo permite um tratamento mais analtico da informao, pois nela o ponto de referncia zero no arbitrrio, mas determinado por alguma condio natural. Sua faixa de valores limitada entre [0,]. Nesta escala existe um ponto zero absoluto que no pode ser alterado e um intervalo arbitrrio com distncias proporcionais entre os intervalos. Nmeros negativos no so permitidos, pois o nmero zero representa ausncia total daquilo que est sendo medido. Por exemplo, na descrio de atributos como peso e volume de objetos no h valores negativos. No caso de temperatura em graus Kelvin, a condio natural o ponto de

  • O universo formal

    23

    repouso dos tomos da matria, a partir do qual no se consegue temperaturas menores. Este ponto o zero absoluto para temperatura, zero graus Kelvin. O fato de ponto de referncia zero ser absoluto permite afirmaes tais como a duas vezes mais pesado que b. Desta forma, dado a e b pode-se ter a = c x b, onde c indica o nmero de vezes que b vai at a, a relao de a para b. Operaes matemticas de adio, subtrao, multiplicao e diviso so suportadas nesta escala. A Tabela 1.2 apresenta um resumo das escalas de medidas, destaca a caracterstica principal, apresenta algumas operaes admitidas e exemplos para cada uma delas.

    Tabela 1.2 Tipos de medidas de dados geogrficos

    Escala Caractersticas Exemplos Operaes possveis

    Nominal Descrio Tipo de solo, vegetao, uso do solo

    Seleo, Comparao

    Ordinal Ordem Classes de declividade, aptido de uso

    Mediana, Mximo, Mnimo

    Intervalo Distncia Altimetria Diferena, Soma

    Razo Valores absolutos

    Renda, populao, taxa de natalidade

    Operaes aritmticas

    1.5.2 Espao absoluto e espao relativo Antes de considerar os diferentes modelos formais para dados geogrficos, necessrio analisarmos brevemente os conceitos de espao absoluto e espao relativo. Esta distino decorre da possibilidade de representarmos no computador a localizao dos objetos no espao ou apenas o posicionamento relativo entre eles, como ilustrado na Figura 1.4. Nesta figura, mostramos esquerda os distritos da cidade de So Paulo, identificados por suas fronteiras. Neste caso, trata-se de uma representao no espao absoluto, na qual as coordenadas das fronteiras devem corresponder s estabelecidas na legislao. Do lado direito, mostramos um grafo com as conexes dos distritos, que formam uma rede (repetimos a imagem dos distritos por razes de melhor legibilidade

  • 1. Representao computacional de dados geogrficos

    24

    da figura). No modelo de redes, a localizao exata de cada distrito no armazenada, pois a rede s captura as relaes de adjacncia. Dizemos ento que a rede de conexes dos distritos um modelo de espao relativo.

    Figura 1.4 Dualidade entre espao absoluto e espao relativo. esquerda, distritos de So Paulo com suas fronteiras. direita, grafo mostrando a rede de conectividade entre os distritos (espao relativo). O mapa da esquerda foi

    repetido por razes de melhor legibilidade.

    A distino entre espao absoluto e espao relativo de grande importncia para a Geografia. Milton Santos (Santos, 1985) refere-se ao espao dos fixos e ao espao dos fluxos. Castells (1999) fala em espao de lugares e espaos de fluxos. Vejam o que Helen Couclelis comenta a respeito do tema:

    Espao absoluto, tambm chamado cartesiano, um container de coisas e eventos, uma estrutura para localizar pontos, trajetrias e objetos. Espao relativo, ou leibnitziano, o espao constitudo pelas relaes espaciais entre coisas (Couclelis, 1997).

    Uma das escolhas bsicas que fazemos na modelagem dos fenmenos geogrficos definir se utilizaremos representaes no espao absoluto ou no espao relativo. Esta escolha depende primordialmente do tipo de anlise que queremos realizar. Usualmente, consultas espaciais que envolvem dois tipos de entidades (quais os rios que cruzam esta estao ecolgica?) requerem a representao no espao absoluto. O mesmo vale

  • O universo formal

    25

    para questes de lgebra de mapas (reas inaptas tem declividade maior que 15% ou solos arenosos). Quando os procedimentos de anlise envolvem apenas as relaes de conectividade (como chegar na estao de metr Clnicas, partindo da estao Liberdade? ou qual a mdia da mortalidade infantil de meus vizinhos?) podemos utilizar representaes no espao relativo. Quando falamos em entidades como estradas, linhas de transmisso, conexes de gua e esgoto, cadeias de mercado e linhas de comunicao, o espao relativo na maioria das vezes plenamente adequado.

    1.5.3 Modelos no espao absoluto: geo-campos e geo-objetos Existem dois modelos formais para entidades geogrficos no espao absoluto: geo-campos e geo-objetos. O modelo de geo-campos enxerga o espao geogrfico como uma superfcie contnua, sobre a qual variam os fenmenos a serem observados. Por exemplo, um mapa de vegetao associa a cada ponto do mapa um tipo especfico de cobertura vegetal, enquanto um mapa geoqumico associa o teor de um mineral a cada ponto. O modelo de geo-objetos representa o espao geogrfico como uma coleo de entidades distintas e identificveis, onde cada entidade definida por uma fronteira fechada. Por exemplo, um cadastro urbano identifica cada lote como um dado individual, com atributos que o distinguem dos demais. Definio 1.1. Geo-Campo. Um geo-campo representa um atributo que possui valores em todos os pontos pertencentes a uma regio geogrfica. Um geo-campo gc uma relao gc = [R, A, f], onde R 2 uma partio conexa do espao, A um atributo cujo domnio D(A), e a funo de atributo f: R A tal que, dado p R, f(p) = a, onde a D(A). A noo de geo-campo decorre da definio fsica associada (segundo o Aurlio, campo um conjunto de valores de uma grandeza fsica que, numa regio do espao, dependem s das coordenadas dos pontos pertencentes a essa regio). Em outras palavras, para cada ponto do espao, um campo ter um valor diferente. Definio 1.2 Geo-Objeto. Um geo-objeto uma entidade geogrfica singular e indivisvel, caracterizada por sua identidade, suas fronteiras, e seus atributos. Um geo-objeto uma relao go = [id, a1,...an, G], onde id um identificador nico, G um conjunto de parties 2D conexas e

  • 1. Representao computacional de dados geogrficos

    26

    distintas {R1,...,Rn} do espao 2, e ai so os valores dos atributos A1,...,

    An. Note-se que um geo-objeto pode ser composto por diferentes geometrias, onde cada geometria tem uma fronteira fechada (e.g., o Japo com suas diferentes ilhas). Um exemplo de geo-campo (uma imagem IKONOS da cidade do Rio de Janeiro) e de um conjunto de geo-objetos (os distritos dessa cidade) apresentado na Figura 1.5. A varivel associada imagem a reflectncia do solo, medida pelo sensor ptico do satlite. Os geo-objetos associados aos distritos de So Paulo so mostrados numa gradao de tons de cinza, cuja intensidade proporcional ao ndice de excluso social (Sposati, 1996); quanto mais escuro, mais o distrito possui moradores em situao de excluso social. Os dados na Figura 1.3 acima (geologia e declividade) tambm so exemplos de geo-campos. A Figura 1.5 tambm ilustra uma questo importante: existem diferenas fundamentais entre geo-campos e geo-objetos? Ou seriam apenas duas maneiras de ver o mesmo tipo de dado? Considere os retngulos desenhados no interior das duas representaes mostradas. Na figura esquerda, o interior do retngulo tem as mesmas propriedades do geo-campo que o contm. Para cada ponto interior ao retngulo, podemos recuperar o valor do atributo (neste caso, a reflectncia da imagem). Verificamos que uma partio espacial genrica de um geo-campo compe outro geo-campo com as mesmas propriedades.

    Figura 1.5 Exemplo de geo-campo (imagem IKONOS do Rio de Janeiro) e de conjunto de geo-objetos (distritos da cidade de So Paulo).

  • O universo formal

    27

    Considere agora a figura da direita (distritos de So Paulo). O interior do retngulo mostrado no define mais um conjunto de geo-objetos com as mesmas propriedades do conjunto completo. O retngulo intercepta parcialmente alguns objetos. Como cada objeto nico e no pode ser dividido sem perder suas caractersticas originais, verificamos que uma partio espacial genrica de um conjunto de geo-objetos no compe outro conjunto de geo-objetos com as mesmas propriedades. A diferena essencial entre um geo-campo e um geo-objeto o papel da fronteira. A fronteira de um geo-campo uma diviso arbitrria relacionada apenas com nossa capacidade de medida. Na Figura 1.5, os limites da imagem correspondem apenas a eventuais limitaes do instrumento sensor e no do fenmeno medido. Assim, o geo-campo pode ser divido em partes e ainda assim manter sua propriedade essencial (que sua funo de atributo). Por contraste, um geo-objeto essencialmente definido por sua fronteira, que o separa do mundo exterior; ele no pode ser dividido e manter suas propriedades essenciais. Dentro da fronteira, todas as propriedades do objeto so constantes. Tomemos um distrito de So Paulo, como a S, que tem um cdigo nico de identificao no censo do IBGE. Se dividirmos a S em duas partes, precisamos de dois novos cdigos de identificao para caracterizar os dois novos distritos. O exame da Figura 1.5 ilustra outra propriedade dos geo-objetos. bastante comum lidarmos com um conjunto de geo-objetos que representam uma partio consistente do espao; isto , os recobrimentos espaciais destes objetos no se interceptam e eles possuem o mesmo conjunto de atributos. Estas caractersticas fazem com que possamos agrupar estes objetos numa coleo. Definio 1.3 Coleo de geo-objetos. Uma coleo de geo-objetos relao cgo = [id, o1,...on, A1,..., An], onde id um identificador nico, e o1,...on so geo-objetos que possuem os atributos A1,..., An. Usualmente, se Ri for a regio geogrfica associada a oi, temos Ri Rj = , i j. Deste modo, uma coleo rene geo-objetos cujas fronteiras no se interceptam, e tm o mesmo conjunto de atributos. O uso de colees de geo-objetos bastante freqente em bancos de dados geogrficos, pois muito conveniente tratar geo-objetos similares

  • 1. Representao computacional de dados geogrficos

    28

    de forma consistente. Por exemplo, falamos dos distritos da cidade de So Paulo, dos municpios do estado do Cear, e das reservas indgenas da Amaznia. A idia de colees de geo-objetos ainda til para propormos um modelo orientado-a-objetos para dados geogrficos, discutido a seguir.

    1.5.4 Modelos no espao relativo: redes O modelo de redes concebe o espao geogrfico como um conjunto de pontos no espao (chamados de ns), conectados por linhas (chamados arcos), onde tanto os ns quanto os arcos possuem atributos. Os fenmenos modelados por redes incluem fluxo de pessoas ou materiais, conexes de influncia, linhas de comunicao e acessibilidade. Um dos atrativos do modelo de redes que o suporte matemtico para este modelo (a teoria de grafos) uma rea de pesquisa consolidada (Bondy e Murty, 1976) (Gross e Yelen, 1998). O problema que deu incio teoria dos grafos foi uma questo espacial. Em 1736, o matemtico Leonard Euler vivia na cidade de Knigsberg (na poca parte da Prssia; hoje chamada Kaliningrad e pertencente Rssia) onde haviam duas ilhas prximas no meio da cidade, cruzadas por sete pontes (ver Figura 1.6 esquerda). Euler se perguntou se havia uma maneira de fazer um circuito fechado (sair e voltar para um mesmo lugar), cruzando cada uma das pontes apenas uma vez. Ele construiu um grafo equivalente (ver Figura 1.6 direita) e demonstrou que o problema era insolvel.

    Figura 1.6 As sete pontes de Knigsberg e o grafo equivalente.

  • O universo formal

    29

    Definio 1.4 Redes. Uma rede uma estrutura geogrfica que tem como suporte um grafo G = [N, A, ], onde N um conjunto de ns, A um conjunto de arcos (arestas), e (a)=(u,v) uma funo de incidncia que associa cada arco a A a um par de ns (u, v) N. No caso geogrfico, os ns podem estar associados a uma localizao (x,y) do espao para fins de referncia. Como os ns de uma rede so abstraes de entidades existentes no espao, eles podem estar associados aos seus atributos descritivos. Por exemplo, na rede mostrada na Figura 1.4, cada n est associado a um distrito de So Paulo, e poderia ter diferentes atributos que descrevem este distrito. Tambm os arcos de uma rede podem ter propriedades, como o custo de percorrimento de um n a outro. As propriedades mensurveis das redes incluem operaes diretas computveis sobre a topologia do grafo, como qual o caminho timo entre dois ns. Tambm podemos computar operaes matemticas que envolvem apenas as relaes de conectividade, como os indicadores locais de autocorrelao espacial (veja-se a respeito, Druck et al, 2004). A definio de redes pode ser estendida para considerar o caso de conexes bidirecionais, como no caso de redes de transporte, onde as relaes entre os ns no so simtricas, pois os fluxos em sentidos opostos podem ser diferentes. A Figura 1.7 ilustra uma rede simples e uma rede com conexes bidirecionais.

    Figura 1.7 Exemplos de redes simples e de redes com conexes bidirecionais.

  • 1. Representao computacional de dados geogrficos

    30

    Os modelos de rede tm grande utilidade em problemas de geoinformao, incluindo assuntos como gerenciamento de servios como gua, esgoto, eletricidade e telefonia. Para maiores referncias, deve-se consultar Birkin et al (1996) e Godin (2001).

    1.5.5 Um modelo orientado-a-objetos para dados geogrficos As sees anteriores nos permitem apresentar um modelo orientado-a-objetos que apresenta uma verso unificada dos dados geogrficos, com base nos conceitos bsicos de geo-campo, coleo de geo-objetos e rede. Para fins de organizao lgica, o modelo considera a existncia de uma classe genrica, chamada de plano de informao (ou layer), que uma generalizao destes dois conceitos. O conceito de plano de informao captura uma caracterstica comum essencial dos trs conceitos bsicos: cada instncia deles referente a uma localizao no espao e tem um identificador nico. Assim, o uso do conceito de plano de informao permite organizar o banco de dados geogrfico e responder a perguntas como: Quais so os dados presentes no banco, qual o modelo associado a cada um e qual a regio geogrfica associada? Adicionalmente, como cada geo-campo est associado a uma nica funo de atributo, ele pode ser especializado em geo-campo temtico (associado a medidas nominais ou ordinais) e geo-campo numrico (associados a medidas por intervalo ou por razo). Com estes seis conceitos, construmos um modelo formal bsico para dados geogrficos, mostrado na Figura 1.8.

    Figura 1.8 Modelo OO bsico para dados geogrficos.

  • Do universo ontolgico ao universo formal

    31

    O modelo mostrado na Figura 1.8 serve de base para a maioria dos modelos de dados orientados-a-objetos adotados atualmente em geoinformao:

    O software SPRING (Cmara et al., 1996) inclui os conceitos de rede, geo-campo numrico e geo-campo temtico, coleo de geo-objetos (chamada de mapa cadastral). Os geo-campos numricos admitem as imagens como caso particular.

    No ArcGIS (ESRI, 2000), a coleo de geo-objetos chamada de features (feies). Os geo-campos numricos so chamados de surfaces (superfcies), e as imagens tambm so modeladas como caso particular de geo-campos numricos. As redes (networks) tambm so includas.

    No modelo OpenGIS (OGC, 1998), os geo-campos so chamados de coverage, e a coleo de objetos chamada de feature collection. O modelo OpenGIS no tem o conceito explcito de layer, mas considera que as vises de feature collection e coverage so complementares.

    Na TerraLib (vide Captulo 12 deste livro), o conceito de plano de informao (layer) um conceito usado para organizar a informao no banco de dados. Os conceitos de geo-campos e de colees de geo-objetos so implcitos. Como se trata de uma biblioteca, os designers da TerraLib quiseram permitir diferentes alternativas de projeto de sistema.

    1.6 Do universo ontolgico ao universo formal Para passar do universo ontolgico para o universo formal, precisamos responder pergunta: como os conceitos da ontologia de aplicao so formalizados? Colocando o problema de forma mais geral: Que critrios deve satisfazer um conceito para que seja utilizvel em estudos quantitativos associados geoinformao? Tais critrios so:

    O conceito deve ser passvel de ser associado a propriedades mensurveis.

    Estas propriedades devem ser medidas no territrio e devem permitir diferenciar as diferentes localizaes.

  • 1. Representao computacional de dados geogrficos

    32

    Os resultados quantitativos e os modelos matemticos utilizados devem ser validados em estudos de campo, que devem incluir dimenses objetivas e subjetivas do fenmeno em questo.

    Para representar um conceito genrico como excluso social, precisamos definir precisamente quais atributos caracterizam a excluso social e como podemos medi-los no territrio. Esta caracterizao realiza a passagem do universo ontolgico para o universo formal. Com base em conceitos bem estabelecidos e associados a medidas quantitativas no espao, podemos construir territrios digitais. O processo pode ser resumido na Figura 1.9.

    ModelosInferenciaisTeorias

    ConceitosQualitativos

    HiptesesTestveis

    Territrios

    Digitais

    Domnios do Conhecimento

    Figura 1.9 Relao entre a construo dos territrios digitais e as teorias

    disciplinares (cortesia de Silvana Amaral Kampel).

    Os especialistas desenvolvem teorias gerais sobre os fenmenos, que incluem o estabelecimento de conceitos organizadores de sua pesquisa (como excluso ou vulnerabilidade). Para passar destas teorias para a construo computacional, necessrio que o especialista formule modelos inferenciais quantitativos. Estes modelos devem ser submetidos a testes de validao e de corroborao, atravs dos procedimentos de anlise quantitativa. Os resultados numricos podem ento dar suporte ou ajudar a rejeitar conceitos qualitativos. Aps definir como que atributos mensurveis sero associados ao conceito, o projetista do sistema de informao dever decidir se este conceito ser modelado no espao absoluto ou no espao relativo. A deciso deve-se dar essencialmente em funo das propriedades que queremos

  • Universo estrutural

    33

    medir. Se a localizao exata fundamental, ou se precisamos saber o valor do fenmeno em todos os pontos da regio de estudo, ento necessrio usar os modelos de espao absoluto. Se o fluxo e as conexes so essenciais, ento podemos usar o modelo de rede. Se precisamos dos dados expressos no espao absoluto, ento devemos escolher ainda qual o modelo apropriado (geo-campo ou geo-objeto). Para isto, a deciso depende essencialmente do papel da fronteira. Se as fronteiras so parte essencial das entidades modeladas, estamos tratando com indivduos e no com topografias (vide Tabela 1.1) e o modelo de geo-objetos o mais adequado. Seno, usaremos os modelos de geo-campos.

    1.7 Universo estrutural As estruturas de dados utilizadas em bancos de dados geogrficos podem ser divididas em duas grandes classes: estruturas vetoriais e estruturas matriciais.

    1.7.1 Estruturas de dados vetoriais As estruturas vetoriais so utilizadas para representar as coordenadas das fronteiras de cada entidade geogrfica, atravs de trs formas bsicas: pontos, linhas, e reas (ou polgonos), definidas por suas coordenadas cartesianas, como mostrado na Figura 1.10.

    Figura 1.10 Representaes vetoriais em duas dimenses.

    Um ponto um par ordenado (x, y) de coordenadas espaciais. O ponto pode ser utilizado para identificar localizaes ou ocorrncias no espao. So exemplos: localizao de crimes, ocorrncias de doenas, e localizao de espcies vegetais. Uma linha um conjunto de pontos

  • 1. Representao computacional de dados geogrficos

    34

    conectados. A linha utilizada para guardar feies unidimensionais. De uma forma geral, as linhas esto associadas a uma topologia arco-n, descrita a seguir. Uma rea (ou polgono) a regio do plano limitada por uma ou mais linhas poligonais conectadas de tal forma que o ltimo ponto de uma linha seja idntico ao primeiro da prxima. Observe-se tambm que a fronteira do polgono divide o plano em duas regies: o interior e o exterior. Os polgonos so usados para representar unidades espaciais individuais (setores censitrios, distritos, zonas de endereamento postal, municpios). Para cada unidade, so associados dados oriundos de levantamentos como censos e estatsticas de sade.

    1.7.2 Vetores e topologia: o caso dos geo-objetos A topologia a parte da matemtica na qual se investigam as propriedades das configuraes que permanecem invariantes nas transformaes de rotao, translao e escala. No caso de dados geogrficos, til ser capaz de determinar relaes como adjacncia (vizinho de), pertinncia (vizinho de), interseco, e cruzamento. Objetos de rea podem ter duas formas diferentes de utilizao: como objetos isolados ou objetos adjacentes. O caso de objetos isolados bastante comum em SIG urbanos, e ocorre no caso em que os objetos da mesma classe em geral no se tocam. Por exemplo, edificaes, piscinas, e mesmo as quadras das aplicaes cadastrais ocorrem isoladamente, no existindo segmentos poligonais compartilhados entre os objetos. Finalmente, temos objetos adjacentes, e os exemplos tpicos so todas as modalidades de diviso territorial: bairros, setores censitrios, municpios e outros. Neste caso, pode-se ter o compartilhamento de fronteiras entre objetos adjacentes, gerando a necessidade por estruturas topolgicas. Estes tambm so os casos em que recursos de representao de buracos e ilhas so mais necessrios. Quando queremos armazenar as estruturas de dados do tipo polgono no caso de objetos adjacentes, temos uma deciso bsica a tomar: guardamos as coordenadas de cada objeto isoladamente, e assim duplicamos as fronteiras em comum com outros objetos, ou armazenamos cada fronteira comum uma nica vez, indicando a que objetos elas esto associadas? No primeiro caso chamado de polgonos sem topologia e o segundo, de topologia arco-n-polgono, comparados na Figura 1.11.

  • Universo estrutural

    35

    Figura 1.11 Polgonos sem topologia ( esquerda) e topologia arco-n-

    polgono ( direita). (Fonte: Ravada, 2003).

    Figura 1.12 Topologia arco-n-polgono.

    A topologia arco-n-polgono, como mostrado na Figura 1.12, requer trs listas separadas. Os pontos inicial e final de cada linha so chamados de ns. Para cada n, armazenamos as linhas nele incidentes. Para cada linha, armazenamos os ns inicial e final, permitindo assim que a linha esteja associada a um sentido de percorrimento; guardamos ainda os dois polgonos separados por cada linha ( esquerda e direita, considerando o sentido de percorrimento). Para cada polgono, guardamos as linhas que definem sua fronteira.

    1.7.3 Vetores e topologia: o caso das redes Objetos de linha podem ter variadas formas de utilizao. Analogamente aos objetos de rea, podemos ter objetos de linha isolados,

  • 1. Representao computacional de dados geogrficos

    36

    em rvore e em rede. Objetos de linha isolados ocorrem, por exemplo, na representao de muros e cercas em mapas urbanos. Objetos de linha organizados em uma rvore podem ser encontrados nas representaes de rios e seus afluentes, e tambm em redes de esgotos e drenagem pluvial. E podem ser organizados em rede, nos casos de redes eltricas, telefnicas, de gua ou mesmo na malha viria urbana e nas malhas rodoviria e ferroviria. No caso das redes, fundamental armazenar explicitamente as relaes de adjacncia, utilizamos a topologia arco-n. Um n pode ser definido como o ponto de interseco entre duas ou mais linhas, correspondente ao ponto inicial ou final de cada linha. Nenhuma linha poder estar desconectada das demais para que a topologia da rede possa ficar totalmente definida. Para exemplificar, considere-se a Figura 1.13, que mostra um exemplo de como a topologia arco-n pode ser armazenada.

    Figura 1.13 Estrutura de dados para topologia arco-n no Oracle Spatial

    SGBD (Fonte: Ravada, 2003).

    1.7.4 Vetores e topologia: o caso dos dados 2,5 D Uma das possibilidades associadas a dados vetoriais a associao de valores que denotem a variao espacial de uma grandeza numrica. No caso mais simples, associamos a cada localizao no espao um valor numrico de atributo. Neste caso, como os valores de localizao esto no plano e o valor adicional descreve uma superfcie sobre este plano. Os

  • Universo estrutural

    37

    dados resultantes so chamados de dimenso dois e meio, pois no se tratam estritamente de dados tridimensionais, pois o suporte espacial ainda so localizaes 2D. A Figura 1.14 ilustra exemplo de dados de dimenso 2,5.

    Figura 1.14 Exemplo de dado com dimenso 2,5 (cortesia de Renato

    Assuno).

    A maneira mais comum de armazenar estes dados atravs de estruturas matriciais (vide prxima seo). Temos trs alternativas que usam estruturas vetoriais:

    Conjunto de amostras esparsas 2,5D, constitudo de pares ordenados (x,y,z), onde (x,y) uma localizao no plano e z um valor numrico de atributo.

    Conjunto de isolinhas (curvas de nvel), que so linhas s quais esto associados valores numricos. As isolinhas no se cruzam, e so entendidas como estando empilhadas umas sobre as outras.

    A malha triangular ou TIN (do ingls triangular irregular network) uma estrutura do tipo vetorial com topologia do tipo n-arco e representa uma superfcie atravs de um conjunto de faces triangulares interligadas.

    A malha triangular a estrutura vetorial mais utilizada para armazenar dados 2,5D. Cada um dos trs vrtices da face do tringulo armazenados as coordenadas de localizao (x, y) e o atributo z, com o valor de elevao ou altitude. Em geral, nos SIGs que possuem pacotes para MNT, os algoritmos para gerao da malha triangular baseiam-se na triangulao de Delaunay com restrio de regio. Quanto mais equilteras forem as faces triangulares, maior a exatido com que se descreve a superfcie. O valor de elevao em qualquer ponto dentro da

  • 1. Representao computacional de dados geogrficos

    38

    superfcie pode ser estimado a partir das faces triangulares, utilizando-se interpoladores. A Figura 1.15 mostra uma superfcie tridimensional e a grade triangular correspondente.

    Figura 1.15 Superfcie e malha triangular correspondente. (cortesia de Larcio

    Namikawa ).

    1.7.5 Hierarquia de representaes vetoriais Para um entendimento mais detalhado das representaes vetoriais em GIS, deve-se inicialmente precisar o que se entende por primitivas geomtricas: coordenadas 2D, coordenadas 2,5D, n 2D, n 2,5D, n de rede, arcos, arcos orientados, isolinhas e polgonos. Dada uma regio R 2, pode-se definir:

    COORDENADA_2D - Uma coordenada 2D um objeto composto por uma localizao singular (xi, yj) R;

    COORDENADA_2,5D - Uma coordenada 2,5D um objeto composto por uma localizao singular (xi, yj, z), onde (xi, yj) R;

    PONTO2D - Um ponto 2D um objeto que possui atributos descritivos e uma coordenada 2D;

    LINHA2D - Uma linha 2D possui atributos e inclui um conjunto de coordenadas 2D;

    ISOLINHA - uma isolinha contm uma linha 2D associada a um valor real (cota);

    ARCO ORIENTADO - um arco orientado contm uma linha 2D associada a uma orientao de percorrimento;

  • Universo estrutural

    39

    N2D - um n 2D inclui uma coordenada2D (xi, yi) R e uma lista L de linhas 2D (trata-se da conexo entre duas ou mais linhas, utilizada para manter a topologia da estrutura);

    N REDE - um n de rede contm um n 2D e uma lista de arcos orientados;

    N 2,5D - um n 2,5D instncia desta classe contm uma coordenada 2,5D (xi, yi, zi) e um lista L de linhas 2D (trata-se da conexo entre trs ou mais linhas de uma grade triangular);

    POLGONO - um polgono pode ser armazenado como uma lista de coordenadas 2D (caso dos geo-objetos sem topologia) ou por uma uma lista de linhas 2D e uma lista de ns 2D (caso de topologia arco-n-polgono).

    Uma vez definidas as primitivas geomtricas vetoriais, pode ser estabelecida a hierarquia de representaes geomtricas vetoriais, como mostrado na Figura 1.16, onde distinguem-se os relacionamentos de especializao -um (is-a), incluso de uma instncia parte-de (part-of), incluso de um conjunto de instncias conjunto-de (set-of) e incluso de uma lista de identificadores de instncias lista-de (list-of).

    Figura 1.16 Hierarquia de classes para estruturas vetoriais.

  • 1. Representao computacional de dados geogrficos

    40

    Distinguimos os seguintes tipos de estruturas de dados vetoriais: CONJUNTO DE PONTOS 2D - uma instncia desta classe um

    conjunto de pontos 2D utilizados para guardar localizaes isoladas no espao (p.ex. no caso de poos de petrleo);

    CONJUNTO DE ISOLINHAS - uma instncia desta classe um conjunto de linhas, onde cada linha possui uma cota e as linhas no se interceptam;

    SUBDIVISO PLANAR - para uma regio geogrfica R qualquer, uma subdiviso planar contm um conjunto Pg de polgonos que no se sobrepem;

    GRAFO ORIENTADO - uma instncia desta classe uma representao composta de um conjunto de n de rede e de um conjunto de arco orientado 2D;

    MALHA TRIANGULAR - uma instncia desta classe contm um conjunto de ns 2,5D e um conjunto L de linhas 2D tal que todas as linhas se interseptam, mas apenas em seus pontos iniciais e finais;

    MAPA PONTOS 2,5D - uma instncia desta classe um conjunto de coordenadas 2,5D. Trata-se de um conjunto de amostras 2,5D.

    1.7.6 Representao matricial As estruturas matriciais usam uma grade regular sobre a qual se representa, clula a clula, o elemento que est sendo representado. A cada clula, atribui-se um cdigo referente ao atributo estudado, de tal forma que o computador saiba a que elemento ou objeto pertence determinada clula. Nesta representao, o espao representado como uma matriz P(m, n) composto de m colunas e n linhas, onde cada clula possui um nmero de linha, um nmero de coluna e um valor correspondente ao atributo estudado e cada clula individualmente acessada pelas suas coordenadas. A representao matricial supe que o espao pode ser tratado como uma superfcie plana, onde cada clula est associada a uma poro do terreno. A resoluo do sistema dada pela relao entre o tamanho da clula no mapa ou documento e a rea por ela coberta no terreno, como mostrado na Figura 1.17.

  • Universo estrutural

    41

    Figura 1.17 Estrutura matricial.

    A estrutura matricial pode ser utilizada para representar diferentes tipos de dados:

    Grade regular: representao matricial de dimenso dois e meio na qual cada elemento da matriz est associado a um valor numrico, como mostra a Figura 1.18 esquerda.

    Matriz temtica: representao matricial 2D na qual cada valor da matriz um cdigo correspondente uma classe do fenmeno estudado, como mostra a Figura 1.18 direita.

    Figura 1.18 esquerda, grade regular com valores de temperatura em graus

    Celsius e, direita, matriz temtica com dados classificados (1 = 15-20 graus, 2 = 20-25 graus, 3 = 25-35 graus).

  • 1. Representao computacional de dados geogrficos

    42

    1.7.7 Espaos celulares: generalizao de estruturas matriciais Um espao celular uma estrutura matricial generalizada onde cada clula est associada a vrios tipos de atributos. Os espaos celulares tm vrias vantagens sobre estruturas matriciais simples. Usando matrizes com um nico atributo (como o caso dos dados mostrados na Figura 1.18), um fenmeno espao-temporal complexo precisa de vrias matrizes separadas para ser representado, o que resulta em maior dificuldade de gerncia e de interface. Num espao celular, a mesma clula est associada a diferentes informaes, com ganhos significativos de manuseio dos dados. Os espaos celulares so muito convenientes para armazenamento em bancos de dados objeto-relacionais. Toda a estrutura de um espao celular pode ser armazenada numa nica tabela, o que faz o manuseio dos dados ser bem mais simples que os dados vetoriais ou mesmo que os dados matriciais indexados. Aplicaes como lgebra de mapas e modelagem dinmica ficam mais simples de implementar e operar. Um exemplo de espao celular mostrado na Figura 1.19, onde mostramos uma parte de um banco de dados onde h um espao celular onde a Amaznia foi dividida em clulas de 25 x 25 km2; cada uma delas est associada a diferentes atributos socioeconmicos e ambientais (na Figura 1.19, o atributo visualizado umidade mdia nos trs meses mais secos do ano). Os espaos celulares ainda no so estruturas de dados comuns nos bancos de dados geogrficos, e atualmente apenas a TerraLib tem suporte para este tipo de estrutura (vide Captulo 12). Com a nfase crescente dos SIG em modelos dinmicos, podemos prever que esta estrutura ser futuramente amplamente disponvel nas diferentes implementaes de bancos de dados geogrficos.

  • Do universo formal para o universo estrutural

    43

    Figura 1.19 Espao celular com a Amaznia dividida em clulas de 25 x 25

    km2; o atributo visualizado umidade mdia nos trs meses mais secos do ano (cortesia: Ana Paula Dutra de Aguiar).

    1.8 Do universo formal para o universo estrutural A passagem do universo formal (geo-campos, geo-objetos e redes) para o universo estrutural no unvoca. Para cada tipo de entidade do modelo formal, h diferentes possibilidades de uso de estruturas de dados, a saber:

    Geo-objetos: como as fronteiras so elementos essenciais, so usualmente armazenados em estruturas poligonais, com as opes polgonos sem topologia ou topologia arco-n-polgono.

    Redes: como a topologia parte essencial, as redes devem ser armazenadas como um grafo orientado.

    Geo-campos numricos: podem ser armazenados como amostras 2,5D, malhas triangulares ou grades regulares.

    Geo-campos temticos: admitem o armazenamento como estruturas vetoriais (polgonos) ou matriciais (matrizes temticas).

  • 1. Representao computacional de dados geogrficos

    44

    Os diferentes compromissos de armazenamento para as entidades do modelo formal so discutidos a seguir. Note-se que um espao celular (discutido na seo 1.7.7) pode guardar uma combinao arbitrria de geo-campos numricos e temticos.

    1.8.1 Estruturas de dados para geo-objetos A escolha entre estruturas topolgicas ou no-topolgicas para geo-objetos em bancos de dados geogrficos depende tambm do suporte oferecido pelo SGBD. Nos SIG cujas estruturas de dados geomtricas so manuseadas fora do SGBD (como o SPRING e o Arc/Info), comum a escolha da topologia arco-n-polgono. No caso dos bancos de dados geogrficos, a maneira mais simples de armazenar geo-objetos guardando cada um deles separadamente, o que implica em estruturas no-topolgicas. Esta forma de trabalho foi sancionada pelo consrcio Open GIS e suportada pelos diferentes SGBDs (Oracle, PostgreSQL, mySQL). No entanto, vrias aplicaes requerem o uso da topologia arco-n-polgono, e alguns SGBDs com suporte espacial j esto incluindo esta opo, com o Oracle Spatial (Ravada, 2003).

    1.8.2 Estruturas de dados para geo-campos temticos Geo-campos temticos admitem tanto a representao matricial quanto a vetorial. Para a produo de cartas e em operaes onde se requer maior preciso, a representao vetorial mais adequada. As operaes de lgebra de mapas so mais facilmente realizadas no formato matricial. No entanto, para um mesmo grau de preciso, o espao de armazenamento requerido por uma representao matricial substancialmente maior. Isto ilustrado na Figura 1.20.

  • Do universo formal para o universo estrutural

    45

    Figura 1.20 Geo-campo temtico em estruturas vetorial e matricial.

    A Tabela 1.3 apresenta uma comparao entre as vantagens e desvantagens de armazenamento matricial e vetorial para geo-campos temticos. Esta comparao leva em conta os vrios aspectos: relacionamentos espaciais, anlise, armazenamento. Nesta tabela, o formato mais vantajoso para cada caso apresentado em destaque. O armazenamento de geo-campos temticos em estruturas vetoriais uma herana da cartografia, onde limites entre classes temticas eram desenhados com preciso em mapas. No entanto, sabemos que estes limites so imprecisos, na grande maioria dos casos. Assim, como nos ensina Peter Burrough, as estruturas matriciais so mais adequadas:

    Os limites desenhados em mapas temticos (como solo, vegetao, ou geologia) raramente so precisos e desenha-los como linhas finas muitas vezes no representa adequadamente seu carter. Assim, talvez no nos devamos preocupar tanto com localizaes exatas e representaes grficas elegantes. Se pudermos aceitar que limites precisos entre padres de vegetao e solo raramente ocorrem, ns estaramos livres dos problemas de erros topolgicos associados como superposio e interseo de mapas(Burrough, 1986).

  • 1. Representao computacional de dados geogrficos

    46

    Tabela 1.3 Comparao entre estruturas vetoriais e matriciais para mapas temticos

    Aspecto Vetorial Matricial

    Armazenamento Por coordenadas (mais eficiente)

    Requer mais espao de armazenamento

    Algoritmos Problemas com erros geomtricos

    Processsamento mais rpido e eficiente.

    Escalas de trabalho Adequado tanto a grandes quanto a pequenas escalas

    Mais adequado para pequenas escalas (1:25.000 e menores)

    Anlise, Simulao e Modelagem

    Representao indireta de fenmenos contnuos lgebra de mapas limitada

    Representa melhor fenmenos com variao contnua no espao Simulao e modelagem mais fceis

    1.8.3 Estruturas de dados para geo-campos numricos Para geo-campos numricos, a escolha bsica se d entre malhas triangulares e grades regulares. As demais estruturas de dados (amostras 2,5D e isolinhas) so formatos intermedirios, utilizados para entrada ou sada de dados, mas no adequadas para anlise. As malhas triangulares so normalmente melhores para representar a variao do terreno, pois capturam a complexidade do relevo sem a necessidade de grande quantidade de dados redundantes. As grades regulares tm grande redundncia em terrenos uniformes e dificuldade de adaptao a relevos de natureza distinta no mesmo mapa, por causa da grade de amostragem fixa. Para o caso de variveis geofsicas e para operaes como visualizao 3D, as grades regulares so preferveis, principalmente pela maior facilidade de manuseio computacional. A Tabela 1.4 resume as principais vantagens e desvantagens de grades regulares e malhas triangulares.

  • Universo de implementao

    47

    Tabela 1.4 Estruturas para geo-campos numricos

    Malha triangular Grade regular

    Vantagens Melhor representao de relevo

    complexo

    Incorporao de restries como

    linhas de crista

    Facilita manuseio e

    converso

    Adequada para dados no-

    altimtricos

    Problemas Complexidade de manuseio

    Representao relevo

    complexo

    Clculo de declividade

    1.8.4 Representaes computacionais de atributos de objetos Entende-se por atributo qualquer informao descritiva (nomes, nmeros, tabelas e textos) relacionada com um nico objeto, elemento, entidade grfica ou um conjunto deles, que caracteriza um dado fenmeno geogrfico. Nos bancos de dados geogrficos, os atributos de objetos geogrficos so armazenados em relaes convencionais. As representaes geomtricas destes objetos podem ser armazenadas na mesma tabela que os atributos ou em tabelas separadas, mas ligadas por identificadores nicos. Estes aspectos so discutidos em maior detalhe nos captulos 3, 5, e 8 deste livro.

    1.9 Universo de implementao No universo de implementao, so tomadas as decises concretas de programao e que podem admitir nmero muito grande de variaes. Estas decises podem levar em conta as aplicaes s quais o sistema voltado, a disponibilidade de algoritmos para tratamento de dados geogrficos e o desempenho do hardware. Neste livro, aspectos do universo de implementao so tratados em diferentes captulos:

    Os algoritmos de geometria computacional para problemas como ponto-em-polgono, simplificao de linhas e interseco de linhas e polgonos so tratados no Captulo 2.

  • 1. Representao computacional de dados geogrficos

    48

    Os problemas de indexao espacial, que representam um componente determinante no desempenho total do sistema, so abordados no Captulo 6.

    As questes de processamento e otimizao de consultas espaciais so discutidas no Captulo 7.

    Uma discusso detalhada dos SGBDs com suporte espacial apresentada no Captulo 8.

    Os Captulos 12 a 14 apresentam a biblioteca TerraLib, um ambiente para construo de aplicativos geogrficos.

    1.10 Leituras suplementares Este captulo apresentou uma viso geral dos diferentes aspectos envolvidos com a representao computacional dos dados geogrficos, que o grande objetivo dos bancos de dados geogrficos. Para uma viso geral de geoinformao sob o ponto de vista da Cincia da Computao, a referncia mais atualizada Worboys e Duckham (2004). O livro de Druck et al (2004) apresenta uma discusso sobre as questes de anlise espacial de dados geogrficos. Sobre o tema de bancos de dados geogrficos, os livros de Rigaux et al (2002) e Shekar e Chawla (2002) so leituras complementares a este livro. A coletnea editada por Sellis et al (2003) apresenta um conjunto de artigos excelentes sobre os problemas emergentes de bancos de dados espao-temporais.

  • Leituras suplementares

    49

    Referncias BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The Semantic Web.

    Scientific American, v. May, 2001. BIRKIN, M.; CLARKE, G.; CLARKE, M. P.; WILSON, A. Intelligent GIS :

    Location Decisions e Strategic Planning. New York: John Wiley, 1996. BONDY, J. A.; MURTY, U. S. R. Graph Theory with Applications. London:

    The Macmillan Press LTD, 1977. BNISCH, S.; ASSAD, M. L.; CMARA, G.; MONTEIRO, A. M.

    Representao e Propagao de Incertezas em Dados de Solos: I - Atributos Numricos. Revista Brasileira de Cincia do Solo, v. 28, n.1, p. 33-47, 2004.

    BURROUGH, P. Principles of Geographical Information Systems for Land Resources Assessment. Oxford, England, Oxford University Press, 1986.

    CALDEIRA, T. Cidade de Muros: Crime, Segregao e Cidadania em So Paulo (City of Walls: Crime, Segregation e Citizenship in Sao Paulo). So Paulo: Edusp, 2000.

    CMARA, G. Modelos, Linguagens e Arquiteturas para Bancos de Dados Geogrficos.So Jos dos Campos, SP: Instituto Nacional de Pesquisas Espaciais (INPE), 1995.Ph.D., 1995.

    CMARA, G.; SOUZA, R.; FREITAS, U.; GARRIDO, J. SPRING: Integrating Remote Sensing e GIS with Object-Oriented Data Modelling. Computers e Graphics, v. 15, n.6, p. 13-22, 1996.

    CMARA, G. S., R.C.M.; MONTEIRO, A.M.V.; PAIVA, J.A.C; GARRIDO, J. Handling Complexity in GIS Interface Design. In: I Brazilian Workshop on Geoinformatics. SBC, Campinas, SP, 1999.

    CASTELLS, M. A Sociedade em Rede. So Paulo: Paz e Terra, 1999. CHEN, P. S. S. The Entity-Relationship Model: Towards a Unified View of

    Data. ACM Transactions on Database Systems, v. 1, n.1, p. 9-36, 1976. COUCLELIS, H. From Cellular Automata to Urban Models: New Principles

    for Model Development e Implementation. Environment e Planning B: Planning e Design, v. 24, p. 165-174, 1997.

    DAVIS, C.; BORGES, K.; LAENDER, A. OMT-G: An Object-Oriented Data Model for Geographic Applications. GeoInformatica, v. 3, n.1, 2002.

    DRUCK, S.; CARVALHO, M. S.; CMARA, G.; MONTEIRO, A. M. V. Anlise Espacial de Dados Geogrficos. Braslia: EMBRAPA (ISBN 85-7383-260-6), 2004.

  • 1. Representao computacional de dados geogrficos

    50

    EGENHOFER, M. Spatial SQL: A Query e Presentation Language. IEEE Transactions on Knowledge e Data Engineering, v. 6, n.1, p. 86-95, 1994.

    EGENHOFER, M.; FRANZOSA, R. Point-Set Topological Spatial Relations. International Journal of Geographical Information Systems, v. 5, n.2, p. 161-174, 1991.

    ESRI, 2000, Modelling Our World : The ESRI Guide to Geodatabase Design, Redlands, CA.

    FONSECA, F.; DAVIS, C.; CAMARA, G. Bridging Ontologies e Conceptual Schemas in Geographic Applications Development. Geoinformatica, v. 7, n.4, p. 355-378, 2003.

    GINZBURG, C. Olhos de Madeira: Nove Reflexes sobre a Distncia. So Paulo: Companhia das Letras, 2001.

    GODIN, L. GIS in Telecommunications. Redlands, CA: ESRI Press, 2001. GOMES, J.; VELHO, L. Abstraction Paradigms for Computer Graphics. The

    Visual Computer, v. 11, n.5, p. 227-239, 1995. GROSS, J.; YELLEN, J. Graph Theory e Its Applications. Boca Raton, FL:

    CRC Press, 1998. GRUBER, T. R. Toward Principles for the Design of Ontologies Used for

    Knowledge Sharing. Int. Journal of Human-Computer Studies, v. 43, p. 907-928, 1995.

    HOHL, P. GIS Data Conversion: Strategies, Techniques, e Management. Clifton Park, NY: OnWorld Press, 1998.

    KRAAK, M.-J.; BROWN, A., eds., 2001, Web Cartography. London, Taylor e Francis.

    KUHN, W.; FRANK, A., 1991. A Formalization of Metaphors e Image-Schemas in User Interfaces. In: MARK, D.; FRANK, A., eds., Cognitive e Linguistic Aspects of Geographic Space: Dordrecht, Kluwer Academic Publishers, p. 419-434.

    LI, Z.; ZHU, Q.; GOLD, C. Digital Terrain Modeling: Principles e Methodology. London: Taylor e Francis, 2004.

    MACEACHREN, A. M. How Maps Work : Representation, Visualization, e Design. New York: Guilford Press, 2004.

    MASSEY, D. S.; DENTON, N. A. American Apartheid: Segregation e the Making of the Underclass. Cambridge: Harvard University Press, 1993.

    MATHER, P. M. Computer Processing of Remotely-Sensed Images : An Introduction (3rd ed). New York: John Wiley, 2004.

  • Leituras suplementares

    51

    MONMONIER, M. Mapping It Out: Expository Cartography for the Humanities e Social Sciences. Chicago: University of Chicago Press, 1993.

    NOY, N. F.; SINTEK, M.; DECKER, S.; CRUBEZY, M.; FERGERSON, R. W.; MUSEN, M. A. Creating Semantic Web Contents with Protege-2000. IEEE Intelligent Systems, v. 16, n.2, p. 60-71, 2001.

    OGC, 1998, The OpenGIS Specification Model: The Coverage Type e Its Subtypes, Wayland, MA, Open Geospatial Consortium.

    PARDINI, R.; SOUZA, S.; BRAGANETO, R.; METZGER, J.-P. The role of forest structure, fragment size e corridors in maintaining small mammal abundance e diversity in an Atlantic forest landscape. Biological Conservation, v. 124, p. 253-266, 2005.

    RAVADA, S. Topology Management in Oracle Spatial 10g. Dagstuhl Seminar on Computational Cartography e Spatial Modelling, 2003. http://www.dagstuhl.de/03401/Materials/.

    RICHARDS, J.; EGENHOFER, M. A Comparison of Two Direct-Manipulation GIS User Interfaces for Map Overlay. Geographical Systems, v. 2, n.4, p. 267-290, 1995.

    RIGAUX, P.; SCHOLL, M.; VOISARD, A. Spatial Databases with Application to GIS. San Francisco: Morgan Kaufman, 2002.

    RUMBAUGH, J.; BLAHA, M.; PREMERLANI, W.; EDDY, F.; LORENSEN, W. Object-Oriented Modeling e Design. Englewood Cliffs, NJ: Prentice-Hall, 1991.

    SANTOS, M. Espao e Mtodo. So Paulo: Nobel, 1985. SEARLE, J. R. Rationality e Realism, What is at Stake? Ddalus, v. 122, n.4,

    1993. SEARLE, J. R. Mind, Language e Society. New York: Basic Books, 1998. SELLIS, T.; FRANK, A. U.; GRUMBACH, S.; GUTING, R. H.;

    KOUBARAKIS, M., eds., 2003, Spatio-Temporal Databases: The Chorochronos Approach: Berlin, Springer.

    SHEKHAR, S.; CHAWLA, S. Spatial Databases: A Tour. New York: Prentice-Hall, 2002.

    SMITH, B., 2003. Ontology e Information Systems. In: ZALTA, E. N., ed., The Stanford Encyclopedia of Philosophy. The Metaphysics Research Lab, Center for the Study of Language e Information.: Stanford, Stanford University.

  • 1. Representao computacional de dados geogrficos

    52

    SMITH, B.; MARK, D. Ontology e Geographic Kinds. In: International Symposium on Spatial Data Handling. Vancouver, Canada, 1998. p. 308-320.

    SPOSATI, A. Mapa de Excluso/Incluso Social de So Paulo. So Paulo: EDUC, 1996.

    STEVENS, S. S. On the theory of scales of measurement. Science, v. 103, n.2684, p. 677-680, 1946.

    TOMLIN, C. D. Geographic Information Systems e Cartographic Modeling. Englewood Cliffs, NJ: Prentice-Hall, 1990.

    TORRES, H. Segregao residencial e polticas pblicas: So Paulo na dcada de 1990 (Spatial segregation e public policies: So Paulo in the 1990s). Revista Brasileira de Cincias Sociais (Brazilian Social Sciences Journal), v. 54, p. 41-56, 2004.

    TUFTE, E. The Visual Display of Quantitative Information. Chesire, CT: Graphics Press, 1983.

    WHITE, M. J. The measurement of spatial segregation. American Journal of Sociology, v. 88, p. 1008-1018, 1983.

    WORBOYS, M. F.; DUCKHAM, M. GIS - A Computing Perspective (2nd edition). Boca Raton: CRC Press, 2004.

  • 2 Algoritmos geomtricos e relacionamentos topolgicos

    Clodoveu A. Davis Jr. Gilberto Ribeiro de Queiroz

    2.1 Introduo Este captulo apresenta uma introduo s principais tcnicas e algoritmos utilizados na implementao das diversas funes de um sistema de gerncia de bancos de dados espaciais (SGBDE), em especial as operaes sobre representaes vetoriais (pontos, linhas e polgonos), que esto subjacentes a situaes tpicas, tais como:

    Seleo por apontamento, em que um usurio seleciona um determinado objeto atravs da interface grfica;

    Determinao do relacionamento espacial entre dois objetos, tanto para consultas quanto para o estabelecimento de restries de integridade espaciais no banco de dados;

    Criao de mapas de distncia (buffer zones) e soluo de problemas de proximidade;

    Sobreposio e aritmtica de polgonos para operaes de anlise espacial.

    Essas operaes so alvo de estudo de uma rea da Cincia da Computao conhecida como Geometria Computacional (Preparata e Shamos, 1985), que procura desenvolver e analisar algoritmos e estruturas de dados para resolver problemas geomtricos diversos. Neste particular, tem um ponto importante de contato com a rea de projeto e anlise de algoritmos, uma vez que tambm procura caracterizar a dificuldade de problemas especficos, determinando a eficincia computacional dos algoritmos e usando tcnicas de anlise de

  • 2. Algoritmos geomtricos e relacionamentos topolgicos

    54

    complexidade assinttica (Knuth, 1973). Existe tambm uma preocupao em desenvolver solues para problemas clssicos de geometria, construindo estruturas mais apropriadas para a representao geomtrica robusta no ambiente computacional, que tem limitaes conhecidas quanto preciso numrica e a capacidade de armazenamento de dados (Schneider, 1997).

    2.2 Definies Em um SGBDE, cada objeto vetorial codificado usando um ou mais pares de coordenadas, o que permite determinar sua localizao. Para entender melhor a maneira como os SGBDE tratam a informao vetorial, so relacionadas a seguir algumas definies fundamentais (Davis Jr., 1997). Como na maioria dos SGBDE, as definies consideram apenas duas dimenses.

    Ponto: um ponto um par ordenado (x, y) de coordenadas espaciais.

    Reta e segmento de reta: Sejam p1 e p2 dois pontos distintos no plano. A combinao linear . ( )p p1 21+ , onde qualquer nmero real, uma reta no plano. Quando 0 1 , se tem um segmento de reta no plano, que tem p1 e p2 como pontos extremos.

    A definio de reta e segmento estritamente geomtrica, e nos interessa uma definio mais aplicada. Assim, partimos para o conceito de linha poligonal, que composta por uma seqncia de segmentos de reta. O mais comum, no entanto, definir a linha poligonal atravs da seqncia dos pontos extremos de seus segmentos, ou seja, seus vrtices.

    Linha poligonal: Sejam v v vn0 1 1, , ,K n pontos no plano. Sejam s v v s v v s v vn n n0 0 1 1 1 2 2 2 1= = = , , ,K uma seqncia de n - 1 segmentos, conectando estes pontos. Estes segmentos formam uma poligonal L se, e somente se, (1) a interseo de segmentos consecutivos apenas o ponto extremo compartilhado por eles (i.e., s s vi i i =+ +1 1 ), (2) segmentos no consecutivos no se interceptam (i.e., s si j = para todo i, j tais que j i +1), e (3) v vn0 1 , ou seja, a poligonal no fechada.

  • Definies

    55

    Observe, na definio da linha poligonal, a excluso da possibilidade de auto-interseo. Os segmentos que compem a poligonal s se tocam nos vrtices. Formalmente, poligonais que no obedecem a este critrio so chamadas poligonais complexas. Estas poligonais podem criar dificuldades na definio da topologia e em operaes como a criao de buffers (vide Seo 2.8).

    Polgono: Um polgono a regio do plano limitada por uma linha poligonal fechada.

    A definio acima implica que, apenas invertendo a condio (3) da definio de linha poligonal, temos um polgono. Assim, tambm aqui no permitida a interseo de segmentos fora dos vrtices, e os polgonos onde isto ocorre so denominados polgonos complexos. Os mesmos comentrios que foram feitos para poligonais valem para os polgonos. Observe-se tambm que o polgono divide o plano em duas regies: o interior, que convencionalmente inclui a fronteira (a poligonal fechada) e o exterior. Estas trs entidades geomtricas bsicas podem ser definidas em uma linguagem de programao usando tipos abstratos de dados. Essa definio inclui tipos abstratos para retngulos e para segmentos, que so bastante teis nos testes preliminares de alguns algoritmos geomtricos. No foi definido um tipo abstrato especfico para polgonos, uma vez que correspondem a poligonais em que o primeiro e o ltimo vrtices coincidem. Para as poligonais, foi includa no tipo uma varivel Retngulo, para armazenar os limites do objeto segundo cada eixo1.

    estrutura Ponto

    incio

    inteiro x;

    inteiro y;

    fim;

    estrutura Segmento

    incio

    Ponto p1;

    1 Este retngulo usualmente denominado retngulo envolvente mnimo (REM), e o

    menor retngulo com lados paralelos aos eixos que contm o objeto em questo.

  • 2. Algoritmos geomtricos e relacionamentos topolgicos

    56

    Ponto p2;

    fim;

    estrutura Retngulo

    incio

    inteiro x1;

    inteiro y1;

    inteiro x2;

    inteiro y2;

    fim;

    estrutura Poligonal

    incio

    inteiro numPontos;

    Retngulo retnguloEnvolventeMnimo;

    Ponto[] vertice;

    fim;

    Programa 2.1 - Tipos abstratos de dados para Ponto, Retngulo e Poligonal.

    2.3 Algoritmos bsicos Diversos problemas de geometria computacional utilizam resultados bsicos de problemas mais simples em sua soluo. Alguns destes resultados bsicos vm da anlise geomtrica do mais simples dos polgonos, e o nico que sempre plano: o tringulo.

    2.3.1 rea de um tringulo A determinao da rea de um tringulo uma das operaes mais bsicas empregadas por outros algoritmos. Ela calculada como a metade da rea de um paralelogramo (Figura 2.1) (Figueiredo e Carvalho, 1991). O produto vetorial dos vetores A e B determina a rea (S) do paralelogramo com os lados A e B e, portanto, a rea do tringulo ABC (que corresponde metade do paralelogramo) pode ser computada a partir da seguinte equao:

    )(21

    111

    21

    cbcbcacababa

    cc

    bb

    aa

    xyyxyxxyxyyxyxyxyx

    S ++== (2.1)

  • Algoritmos bsicos

    57

    Figura 2.1 - rea do tringulo abc.

    A Equao 2.1 fornece outra informao muito til para os algoritmos de geometria computacional: a orientao dos trs pontos que formam o tringulo. Caso a rea seja negativa, os pontos a, b e c encontram-se no sentido horrio; se positiva, os pontos encontram-se no sentido anti-horrio; e se for zero, indica que os trs pontos so colineares (esto alinhados).

    2.3.2 Coordenadas baricntricas Para determinar se um determinado ponto pertence ou no a um tringulo, utiliza-se um mtodo baseado em coordenadas baricntricas (Figueiredo e Carvalho, 1991). De acordo com esse mtodo, cada ponto p do plano pode ser escrito na forma p p p p= + + 1 1 2 2 3 3 , onde 1, 2 e 3 so nmeros reais e 1 2 3 1+ + = . Os coeficientes 1, 2 e 3 so denominados coordenadas baricntricas de p em relao a p1, p2 e p3.

    Os valores de 1, 2 e 3 podem ser obtidos usando a regra de Cramer, e expressos em termos de reas de tringulos cujos vrtices so p, p1, p2 e p3. Temos, portanto:

    12 3

    1 2 3=S pp pS p p p

    ( )( )

    , 21 3

    1 2 3=S p ppS p p p

    ( )( )

    e31 2

    1 2 3

    =S p p pS p p p

    ( )( )

    A anlise do sinal das coordenadas baricntricas indica a regio do plano em que se encontra p, em relao ao tringulo p1p2p3 (Figura 2.2). Observe-se que, para isso, as reas devem ser orientadas, ou seja, com sinal.

  • 2. Algoritmos geomtricos e relacionamentos topolgicos

    58

    p1

    p2

    p3

    2=0

    3=0

    1=0

    1>02>03>0

    103>0

    1>020

    1>02>03

  • Algoritmos bsicos

    59

    Figura 2.3 (a) Interseo dos REMs (b) REMs disjuntos.

    O programa 2.2 ilustra este teste.

    2.3.4 Interseo de dois segmentos de reta Dados dois segmentos a e b, formados pelos pontos p1p2 e p3p4 (Figura 2.4), respectivamente, deseja-se verificar se eles se interceptam. A soluo consiste em testar se os pontos p1 e p2 esto de lados opostos do segmento formado por p3p4 e tambm se p3 e p4 esto de lados opostos do segmento formado por p1p2. Este problema se conecta com o problema da rea de tringulo, pois, determinar se p3 est do lado oposto de p4 em relao ao segmento p1p2, consiste em avaliar o sinal da rea dos tringulos formados por p1p2p3 e p1p2p4. Se os sinais forem contrrios, significa que os pontos

    funo interseoRetngulos(Ponto A, Ponto B, Ponto C, Ponto D): booleano

    incio

    Ponto P, Ponto Q, Ponto P1, Ponto Q1;

    P.x = min(A.x, B.x);

    P.y = min(A.y, B.y);

    Q.x = max(A.x, B.x);

    Q.y = max(A.y, B.y);

    P1.x = min(C.x, D.x);