ELAINE REIS COSTA
GERAÇÃO AUTOMÁTICA DE MODELOS DIGITAIS DE TERRENO A PARTIR DE IMAGENS DE
CÂMARAS DIGITAIS
Dissertação de Mestrado
Presidente Prudente 2006
Elaine Reis Costa
GERAÇÃO AUTOMÁTICA DE MODELOS DIGITAIS DE TERRENO A PARTIR DE IMAGENS DE
CÂMARAS DIGITAIS
Dissertação apresentada ao Programa de Pós-Graduação em Ciências Cartográficas da Faculdade de Ciências e Tecnologia da UNESP, como parte dos requisitos necessários para a obtenção do título de Mestre em Ciências Cartográficas.
Orientador: Prof. Dr. Antonio M. G. Tommaselli
Co-orientador: Prof. Dr. Maurício Galo
Presidente Prudente 2006
Elaine Reis Costa
GERAÇÃO AUTOMÁTICA DE MODELOS DIGITAIS
DE TERRENO A PARTIR DE IMAGENS DE CÂMARAS DIGITAIS
BANCA EXAMINADORA
DEFESA DA DISSERTAÇÃO DE MESTRADO
___________________________________________
Prof. Dr. Antonio M. G. Tommaselli Presidente e orientador
___________________________________________ Prof. Dr. Edson A. Mitshita
2o Examinador
___________________________________________ Prof. Dr. Júlio K. Hasegawa
3o Examinador
Presidente Prudente, _____ de _______________ de 2006.
Aos meus queridos pais Luiz e Mariza,
meus irmãos Ricardo e Camila,
e ao meu amado noivo Daniel,
por todo amor, incentivo e apoio.
Sem vocês não teria sido possível.
AGRADECIMENTOS
A autora deseja agradecer sinceramente:
Aos professores Antonio M. G. Tommaselli e Maurício Galo por toda
a dedicação a mim dispensada ao longo destes anos de convivência e pela
orientação precisa e segura neste trabalho. Obrigada pela amizade e pela atenção.
Sem dúvida vocês são exemplos de ética e profissionalismo que pretendo seguir
vida afora.
Aos demais professores do Programa de Pós Graduação em
Ciências Cartográficas (PPGCC) e do Departamento de Cartografia, que foram
essenciais em minha formação.
Ao colega Roberto da Silva Ruy que atenciosamente colaborou com
esclarecimentos sobre sua implementação do processo de reamostragem epipolar
de imagens e a todos os companheiros do PPGCC.
Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico
(CNPq) pelo auxílio financeiro dado a esta pesquisa através da bolsa de estudos
concedida.
A todos que contribuíram para a realização deste trabalho, seja em
aspectos científicos ou com palavras de apoio e incentivo.
“Tudo posso Naquele que me fortalece”
(Filipenses, 4:13)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
RESUMO
Os sistemas fotogramétricos digitais existentes atualmente apresentam funções capazes de gerar MDT’s de modo automático, no entanto, problemas na etapa de correspondência de pontos fazem com que a edição desses modelos seja, na maioria das vezes, obrigatória. Nesse sentido, neste trabalho procura-se incorporar ao fluxo da geração de MDT’s, a partir de imagens digitais, alguns procedimentos para tornar a sua geração mais robusta. A metodologia proposta neste trabalho segue a seguinte seqüência: a primeira etapa do processo é a reamostragem epipolar das imagens, o que reduz o espaço de busca para o processo de correspondência. Em seguida faz-se rotulação da imagem através do cálculo de um índice que detecta áreas de sombra, permitindo a aplicação de operações lógicas para eliminar estas áreas. Uma vez definidos os parâmetros de controle do processo de correlação, é realizada a varredura hierárquica do modelo utilizando pirâmide de imagens, sendo determinadas as correspondências. A este processo, foram incorporadas técnicas de pré-análise do processo de correlação, evitando que esta operação seja realizada em áreas inadequadas ao processo de correspondência por área. Determinadas as correspondências, realiza-se uma filtragem dos dados para a eliminação de erros grosseiros e, em seguida, são calculadas as coordenadas tridimensionais dos pontos no referencial do terreno por interseção fotogramétrica. Uma vez gerado o Modelo Digital de Terreno é feito um controle de qualidade com dados de referência já existentes na região. Foram feitos experimentos utilizando imagens tomadas com uma câmara digital Hasselblad, comparando os resultados obtidos com o modelo gerado pelo Sistema Fotogramétrico Digital LPS. Verificou-se que os resultados são compatíveis, o que indica que a abordagem funciona adequadamente. Palavras-chave: Modelo Digital de Terreno, correlação de imagens digitais,
reamostragem epipolar, detecção de sombras, redução do espaço de busca.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
ABSTRACT
Digital photogrammetric workstations are able to execute Digital Terrain Models (DTM’s) generation automatically but the edition of these models is indispensable due to problems related to correspondence process. Nesse sentido, neste trabalho procura-se incorporar ao fluxo da geração de MDT’s, a partir de imagens digitais, alguns procedimentos para tornar a sua geração mais robusta. A metodologia proposta neste trabalho segue a seguinte seqüência: a primeira etapa do processo é a reamostragem epipolar das imagens, o que reduz o espaço de busca para o processo de correspondência. Em seguida faz-se rotulação da imagem através do cálculo de um índice que detecta áreas de sombra, permitindo a aplicação de operações lógicas para eliminar estas áreas. Uma vez definidos os parâmetros de controle do processo de correlação, é realizada a varredura hierárquica do modelo utilizando pirâmide de imagens, sendo determinadas as correspondências. A este processo, foram incorporadas técnicas de pré-análise do processo de correlação, evitando que esta operação seja realizada em áreas inadequadas ao processo de correspondência por área. Determinadas as correspondências, realiza-se uma filtragem dos dados para a eliminação de erros grosseiros e, em seguida, são calculadas as coordenadas tridimensionais dos pontos no referencial do terreno por interseção fotogramétrica. Uma vez gerado o Modelo Digital de Terreno é feito um controle de qualidade com dados de referência já existentes na região. Foram feitos experimentos utilizando imagens tomadas com uma câmara digital Hasselblad, comparando os resultados obtidos com o modelo gerado pelo Sistema Fotogramétrico Digital LPS. Verificou-se que os resultados são compatíveis, o que indica que a abordagem funciona adequadamente. Keywords: Digital Terrain Model, digital image correlation, epipolar resampling,
shadow detection, search space reduction.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
SUMÁRIO
1 INTRODUÇÃO......................................................................................................................... 11
1.1 JUSTIFICATIVA E OBJETIVOS .................................................................................................. 12
2 FUNDAMENTOS TEÓRICOS ................................................................................................... 14
2.1 CONCEITOS GERAIS ............................................................................................................. 14 2.1.1 Definição de Modelo Digital de Terreno ........................................................................ 14 2.1.2 Terminologia ............................................................................................................... 14 2.1.3 Fontes de Dados para Geração de MDT....................................................................... 15
2.2 IMAGENS DIGITAIS ................................................................................................................ 16 2.2.1 Câmaras digitais ......................................................................................................... 18
2.3 ROTULAÇÃO DE IMAGENS COLORIDAS ..................................................................................... 19 2.3.1 Modelos de cores ........................................................................................................ 20
2.3.1.1 Modelo de cores RGB...............................................................................................................................20 2.3.1.2 Modelo de cores HSI.................................................................................................................................21 2.3.1.3 Transformação RGB – HSI.......................................................................................................................23
2.3.2 Índice de detecção de sombras .................................................................................... 24 2.3.3 Índice de artificialidade ................................................................................................ 24
2.4 CORRESPONDÊNCIA DE IMAGENS ............................................................................................ 25 2.4.1 Correlação de Imagens ............................................................................................... 28 2.4.2 Problemas na correlação de imagens ........................................................................... 32 2.4.3 Redução do Espaço de Busca ..................................................................................... 34
2.4.3.1 Linhas Epipolares .......................................................................................................................................35 2.4.3.2 Normalização..............................................................................................................................................38 2.4.3.3 Paralaxes .....................................................................................................................................................43 2.4.3.4 Hierarquia ....................................................................................................................................................45
2.4.4 Precisão da correlação................................................................................................ 47 2.4.4.1 Variância do ruído ......................................................................................................................................49 2.4.4.2 Estimativa dos parâmetros de translação..............................................................................................50 2.4.4.3 Precisão dos parâmetros de translação.................................................................................................52
2.4.5 Interseção Fotogramétrica .......................................................................................... 53 2.5 AJUSTE DE SUPERFÍCIE......................................................................................................... 55
2.5.1 Estruturas de Dados para MDT's.................................................................................. 56 2.5.1.1 Curvas de Nível..........................................................................................................................................56 2.5.1.2 Malha Regular.............................................................................................................................................57 2.5.1.3 Rede Irregular de Triângulos (TIN) .........................................................................................................59 2.5.1.4 Comparação entre as estruturas .............................................................................................................61
2.6 CONTROLE DE QUALIDADE DE MODELOS DIGITAIS DE TERRENO.................................................... 62 2.6.1 Acurácia das Coordenadas dos Pontos ........................................................................ 63
2.6.1.1 Qualidade da imagem ...............................................................................................................................64
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
2.6.1.2 Parâmetros de Controle da Correlação..................................................................................................64 2.6.2 Estrutura de dados para a aquisição do MDT................................................................ 67 2.6.3 Validação do MDT....................................................................................................... 68
2.6.3.1 Validação Interna........................................................................................................................................69 2.6.3.2 Validação Externa......................................................................................................................................69
3 MÉTODO PROPOSTO ............................................................................................................. 71
3.1 CONCEITO GERAL DA PROPOSTA............................................................................................. 71 3.1.1 Orientação do estereopar de imagens coloridas ............................................................ 73 3.1.2 Normalização.............................................................................................................. 73 3.1.3 Pré-análise ................................................................................................................. 74 3.1.4 Determinação de áreas de exclusão............................................................................. 75
3.1.4.1 Exclusão de áreas de sombra..................................................................................................................76 3.1.4.2 Exclusão de edificações............................................................................................................................76
3.1.5 Transformação das imagens coloridas em tons de cinza ............................................... 77 3.1.6 Geração da pirâmide de imagens ................................................................................. 77 3.1.7 Correspondência de pontos ......................................................................................... 78
3.1.7.1 Correlação na pirâmide de imagens .......................................................................................................79 3.1.7.2 Geração do mapa de paralaxes...............................................................................................................83 3.1.7.3 Adensamento de pontos nas imagens originais ...................................................................................86
3.1.8 Interseção fotogramétrica ............................................................................................ 89 3.1.9 Controle de qualidade ................................................................................................. 89
3.1.9.1 Controle interno ..........................................................................................................................................90 3.1.9.1.1 Critério para a exclusão de pontos .................................................................................................95
3.1.9.2 Controle externo.........................................................................................................................................97 3.1.10 Interpolação da malha regular de pontos .................................................................... 98
4 EXPERIMENTOS E RESULTADOS .......................................................................................... 99
4.1 DADOS UTILIZADOS............................................................................................................... 99 4.2 EXPERIMENTOS ..................................................................................................................100
4.2.1 Experimento 1............................................................................................................106 4.2.2 Experimento 2............................................................................................................116 4.2.3 Interpolação de malha regular de pontos .....................................................................120
4.2.3.1 Curvas de nível de referência................................................................................................................120 4.2.3.2 Curvas de nível para os Experimentos 1 e 2.......................................................................................122
4.2.4 Controle externo ........................................................................................................127
5 CONSIDERAÇÕES FINAIS .....................................................................................................131
5.1 CONCLUSÕES .....................................................................................................................131 5.2 RECOMENDAÇÕES PARA TRABALHOS FUTUROS ........................................................................133
REFERÊNCIAS .........................................................................................................................136
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
LISTA DE FIGURAS
Figura 01 – Representação de uma imagem digital........................................................................ 16
Figura 02 – Esquema de uma câmara digital. ................................................................................ 18
Figura 03 – Cubo de cores rgb. .................................................................................................... 21
Figura 04 - Representação de cor no modelo hsi........................................................................... 22
Figura 05 – Correlação digital de imagens..................................................................................... 28
Figura 06 – Plano epipolar e as correspondentes linhas epipolares. ............................................... 35
Figura 07 – Redução do espaço de busca usando informações altimétricas.................................... 36
Figura 08 – Estereopar de imagens normalizadas. ........................................................................ 39
Figura 09 – Geometria do processo de normalização. .................................................................... 40
Figura 10 – Pirâmide de imagens. ................................................................................................ 46
Figura 11 – Fluxograma do processo de obtenção da qualidade da correlação................................ 48
Figura 12 – Mapa altimétrico. ....................................................................................................... 57
Figura 13 – Superfície gerada a partir de grade regular. ................................................................. 59
Figura 14 – Superfície formada a partir de grade triangular irregular. .............................................. 60
Figura 15 – Fluxograma do método proposto. ............................................................................... 72
Figura 16 – Correlação utilizando os n níveis da pirâmide de imagens. ........................................... 80
Figura 17 – Varredura do modelo na imagem esquerda. ................................................................ 81
Figura 18 – Conjunto de pontos projetados dos níveis anteriores para a base da pirâmide. .............. 84
Figura 19 – Pontos interpolados nas linhas com paralaxes conhecidas........................................... 85
Figura 20 – Pontos interpolados entre as duas primeiras linhas com paralaxes conhecidas. ............ 85
Figura 21 – Redução do espaço de busca utilizando o mapa de paralaxes. .................................... 87
Figura 22 – Varredura das imagens originais utilizando o mapa de paralaxes para a redução do
espaço de busca. ................................................................................................................ 88
Figura 23 – Distribuição dos pontos correlacionados na etapa de adensamento ao longo de uma linha
da área de interesse. ........................................................................................................... 90
Figura 24 – Situações onde o controle de qualidade interno pode ser aplicado. ............................... 91
Figura 25 – Situações onde existe um ponto muito distante do ponto a ser controlado. .................... 92
Figura 26 – Situações onde é realizado o ajuste de uma função linear. ........................................... 93
Figura 27 – Imagem esquerda do estereopar. ..............................................................................100
Figura 28 – Imagem direita do estereopar ....................................................................................100
Figura 29 – Imagem esquerda normalizada. .................................................................................101
Figura 30 – Imagem direita normalizada.......................................................................................103
Figura 31 – Área de interesse na imagem esquerda normalizada. .................................................103
Figura 32 – Imagem resultante do processo de detecção de sombras. ..........................................104
Figura 33 – Imagens esquerda (a) e direita (b) do nível 4 da pirâmide de imagens. ........................105
Figura 34 – Pontos correlacionados na área de interesse no nível 4 da pirâmide. ...........................108
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
Figura 35 – Pontos correlacionados na área de interesse na imagem esquerda da base da pirâmide.
.........................................................................................................................................109
Figura 36 – Pontos correlacionados na área de interesse na imagem direita da base da pirâmide. ..109
Figura 37 – Imagem gerada a partir do mapa de paralaxes. ..........................................................110
Figura 38 – Pontos correlacionados em uma região da área de interesse. .....................................112
Figura 39 – Pontos correlacionados após controle interno para desnível de 5 metros. ....................112
Figura 40 – Pontos correlacionados após controle interno para desnível de 1 metro. ......................113
Figura 41 – Pontos correlacionados em uma região da área de interesse. .....................................114
Figura 42 – Pontos correlacionados após controle interno para desnível de 5 metros. ....................114
Figura 43 – Pontos correlacionados após controle interno para desnível de 1 metro. ......................115
Figura 44 – Pontos correlacionados na área de interesse no nível 4 da pirâmide. ...........................117
Figura 45 – Pontos correlacionados na área de interesse na imagem esquerda da base da pirâmide.
.........................................................................................................................................118
Figura 46 – Pontos correlacionados na área de interesse na imagem direita da base da pirâmide. ..118
Figura 47 – Imagem gerada a partir do mapa de paralaxes. ..........................................................119
Figura 48 – Curvas de nível geradas no lps – estratégia 1.............................................................121
Figura 49 – Curvas de nível geradas no lps – estratégia 2.............................................................121
Figura 50 – Curvas de nível geradas no lps – estratégia 3.............................................................122
Figura 51 – Curvas de nível para o modelo do experimento 1 com limiar de desnível de 5 metros...123
Figura 52 – Curvas de nível para o modelo do experimento 1 com limiar de desnível de 1 metro.....123
Figura 53 – Pontos utilizados para a geração da grade. ................................................................125
Figura 54 – Curvas de nível para o modelo do experimento 2 com limiar de desnível de 5 metros...126
Figura 55 – Curvas de nível para o modelo do experimento 2 com limiar de desnível de 1 metro.....126
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
LISTA DE TABELAS
Tabela 1 – Parâmetros da calibração. ........................................................................................... 99 Tabela 2 – Parâmetros de orientação exterior das imagens e desvios padrão estimados. ...............100 Tabela 3 – Parâmetros adotados para o experimento 1. ...............................................................107 Tabela 4 – Número de pontos projetados ao longo da pirâmide no experimento 1. .........................107 Tabela 5 – Número de pontos correlacionados após o controle interno..........................................115 Tabela 6 – Parâmetros adotados para o experimento 2. ...............................................................116 Tabela 7 – Número de pontos projetados ao longo da pirâmide no experimento 2. .........................116 Tabela 8 – Número de pontos correlacionados após o controle interno. .........................................120 Tabela 9 – Comparação dos Experimentos 1 e 2 com os dados de referência. ...............................128 Tabela 10 – Estatísticas para os MDT’s dos Experimentos 1 e 2. ..................................................129
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
11
1 INTRODUÇÃO
Os Modelos Digitais de Terreno são usados em várias áreas, como
Engenharia Civil, ciências da Terra, Fotogrametria, planejamento e gerenciamento
de recursos, entre outras, destacando-se como um importante produto para a
modelagem e análise da informação topográfica e espacial. Em Fotogrametria, seu
uso se destaca no processo de geração de ortoimagens.
Para modelar fidedignamente superfícies como a terrestre, seria
necessário um número infinito de pontos, o que geraria uma quantidade infinita de
dados a serem armazenados. Desta forma, a modelagem se tornaria uma tarefa
impossível para qualquer sistema digital. Neste sentido, surgiram as técnicas de
modelagem digital do terreno, cujo objetivo é representar superfícies contínuas de
forma discreta utilizando para isto uma quantidade finita de dados, ou seja,
amostras.
A geração automática de MDT’s, a partir de um estereomodelo
orientado, compreende três etapas principais (SCHENK, 1996) que são:
1. Correspondência de imagens: consiste em encontrar pontos homólogos;
2. Ajuste de superfície: consiste em interpolar e densificar uma superfície e;
3. Controle de qualidade: verificar e editar o MDT.
A etapa de encontrar os pontos homólogos é conhecida como
correspondência de imagens (image matching), muitas vezes chamada de
correlação de imagens devido ao fato deste ser o método mais utilizado para a
determinação de pontos homólogos.
Os pontos obtidos na etapa 1 não estão uniformemente distribuídos
e não representam completamente a superfície. Mesmo se todos os pixels das
imagens fossem correlacionados, haveria pontos que seriam rejeitados, uma vez
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
12
que a correspondência nem sempre é bem sucedida. Assim, existe a necessidade
de se realizar a interpolação de pontos para a representação adequada da
superfície, através do processo conhecido como ajuste de superfície. Uma vez
iniciadas, as etapas 1 e 2 não requerem intervenção do operador.
A etapa 3, referente ao controle de qualidade do produto gerado, é
de fundamental importância, uma vez que, nos dias de hoje, MDT’s gerados
automaticamente ainda requerem edição. Geralmente, esta etapa é realizada
manualmente por um operador, ou seja, é basicamente interativa.
1.1 JUSTIFICATIVA E OBJETIVOS
A Fotogrametria Digital é o ambiente ideal para a geração
automática de MDT’s. Entretanto, apesar dos avanços deste tipo de sistema o
problema da geração automática de MDT’s de modo robusto ainda não está
totalmente resolvido. Seja, por exemplo, uma área urbana, em grande escala. Nem
todos os sistemas digitais existentes são capazes de gerar automaticamente um
MDT confiável desta área. Nestes casos, os MDT’s gerados automaticamente não
são adequados para a interpolação de curvas de nível, sendo que, para esta tarefa,
ainda se faz necessário o operador, que faz a restituição estereoscópica dos
contornos.
Além disto, deve-se fazer uma ressalva quanto ao uso do termo
“automático”. Na geração automática de MDT’s esperar-se-ia que o computador
realizasse as mesmas tarefas que um operador executa. Entretanto, isto não é
possível, até o momento, sendo importante e necessária a intervenção humana, pelo
menos em algumas etapas do processo. Deste modo, os sistemas atuais não são
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
13
independentes e não o serão em curto prazo. Assim, a geração automática de
MDT’s é realizada em um ambiente interativo nas estações de trabalho (SCHENK,
1996).
Embora a automação seja a principal vantagem da Fotogrametria
Digital, no processo de geração automática de MDT's, esta vantagem ainda não
produz resultados tão satisfatórios. Mesmo realizando todas as aproximações
necessárias, um MDT gerado automaticamente ainda requer muita edição. Norvelle
(1996) diz que a quantidade de dados produzidos automaticamente por correlação
em quinze minutos requer mais de cinco horas para verificação e edição. Assim, fica
claro que a economia feita na automação do processo de geração do MDT é perdida
nas etapas de verificação e edição.
Desta forma, diante da importância dos Modelos Digitais de Terreno
na Fotogrametria e da necessidade de solucionar os problemas que envolvem a sua
geração, o objetivo deste trabalho é o estudo e o desenvolvimento de uma
metodologia adequada para a geração automática de MDT’s mais confiáveis
utilizando imagens digitais coloridas, além de realizar testes com dados reais para
verificar a eficiência do algoritmo adotado. Esta metodologia prevê os seguintes
aspectos: a rotulação prévia das áreas de sombras presentes nas imagens, ou seja,
uma pré-classificação do estereopar com o cálculo de um índice desenvolvido para a
separação de sombras em imagens coloridas; a estimativa da qualidade do processo
de correlação, permitindo a exclusão de regiões de baixa potencialidade para a
correlação; e a redução do espaço de busca para a correlação, através da
reamostragem epipolar, também chamada de normalização, e da varredura
hierárquica do estereopar utilizando pirâmides de imagens.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
14
2 FUNDAMENTOS TEÓRICOS
2.1 CONCEITOS GERAIS
2.1.1 Definição de Modelo Digital de Terreno
O conceito de modelo digital do terreno é relativamente recente e a
introdução do termo Modelo Digital do Terreno é atribuída aos engenheiros Miller e
LaFlamme, do Instituto de Tecnologia de Massachusetts (MIT), durante os anos 50
(EL-SHEIMY, 1999). A definição dada por eles é a seguinte: “O MDT é simplesmente
uma representação estatística da superfície contínua do terreno por um número
elevado de pontos selecionados com coordenadas (X,Y,Z) conhecidas em um
sistema de coordenadas arbitrário” (MILLER e LAFLAMME1, 1958 apud EL-SHEIMY,
1999). Uma definição mais recente, apresentada por Mikhail, Bethel e McGlone
(2001), diz que o modelo digital de terreno pode ser definido como uma
representação digital da superfície terrestre através de um conjunto de pontos. À
representação digital está associada uma estrutura de dados, além de funções
matemáticas para a realização das interpolações entre os pontos amostrais obtidos.
2.1.2 Terminologia
Desde a década de 50, diversos outros termos surgiram para
descrever a modelagem digital de terreno. Embora muitas vezes estes termos sejam
usados como sinônimos, na realidade eles se referem a produtos distintos.
1 MILLER, C.; LAFLAMME, R. A. The digital terrain modeling - theory and applications.
Photogrammetric Engineering, v.24, 1958. p. 433-442.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
15
Segundo Egels e Kasser (2002), o Modelo Digital de Elevações
(MDE) é uma representação matemática e digital de um objeto e seu ambiente,
como por exemplo, as ondulações do terreno em uma área selecionada. Nota-se
pela definição que o termo MDE é um conceito genérico, que pode se referir à
elevações do terreno mas também de qualquer nível acima do terreno, como topos
de edificações. Quando a informação é limitada às elevações do terreno, o MDE é
chamado de Modelo Digital de Terreno (MDT) e fornece informação sobre a
elevação de qualquer ponto no terreno. Quando se têm disponíveis as elevações
máximas para cada ponto, seja no terreno ou acima dele, o MDE é chamado de
Modelo Digital de Superfície (MDS). O MDS contém também as elevações de
edificações, árvores, enfim, dos objetos que estão acima da superfície do terreno.
Neste trabalho, como o objetivo inicial prevê a eliminação de
edificações e árvores para a realização da correspondência, será utilizado o termo
MDT para o produto gerado.
2.1.3 Fontes de Dados para Geração de MDT
Os dados necessários para a elaboração de um MDT são as
elevações de pontos no terreno. Estas elevações podem ser derivadas de curvas de
nível digitalizadas, podem ser obtidas por métodos fotogramétricos, ou ainda através
de levantamento de campo. Neste trabalho serão abordados aspectos sobre a
geração de MDT a partir de dados obtidos por Fotogrametria. Existem duas fontes
principais de dados obtidos por Fotogrametria: as fotografias aéreas e as imagens
de satélite. Fotografias terrestres também são utilizadas em algumas aplicações. Há
atualmente uma grande quantidade de novas fontes de dados, tais como radar e
laser altimétrico e radar de abertura sintética (SAR) interferométrico.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
16
2.2 IMAGENS DIGITAIS
Uma imagem digital é uma função discreta e bidimensional da
intensidade da luz f(x,y), onde x e y denotam as coordenadas espaciais e o valor da
função f em qualquer ponto (x,y) é proporcional ao brilho ou nível de cinza da
imagem naquele ponto (GONZALEZ e WOODS, 2000). Desta forma, uma imagem
digital pode ser entendida como uma matriz, cujas colunas e linhas identificam um
ponto na imagem. O elemento da matriz correspondente a este ponto identifica o
valor de brilho ou nível de cinza. Os elementos dessa matriz são denominados pixels
(picture elements). A Figura 01 ilustra esta definição.
Figura 01 – Representação de uma imagem digital.
Há duas componentes principais que definem a qualidade de
imagens digitais: as resoluções espacial e radiométrica (MIKHAIL, BETHEL e
MCGLONE, 2001). A resolução espacial da imagem está relacionada às dimensões
i (linhas)
j (colunas)
(0,0)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
17
do pixel na imagem, ou seja, à taxa de amostragem da imagem e freqüentemente é
expressa em pontos por polegada (ppp ou dpi – “dots per inch”). Já a resolução
radiométrica da imagem depende dos níveis de quantização adotados. Se uma
imagem é quantizada em n bits, ela possuirá 2n valores de brilho. Além destas duas
resoluções, existem ainda a resolução temporal, que diz respeito à freqüência com
que imagens da mesma região são obtidas; e a resolução espectral, caracterizada
pelo número de bandas espectrais em que a imagem é obtida. Estas duas últimas
resoluções são mais comuns quando se trata de sensores a bordo de satélites.
O sistema de coordenadas de uma imagem digital tem origem (0,0)
no seu canto superior esquerdo, sendo a contagem das colunas na direção
horizontal e o eixo de contagem das linhas rotacionado de 90° para baixo em
relação ao eixo das colunas.
Segundo Atkinson (1996) e Tommaselli, Hasegawa e Galo (2000),
algumas vantagens do uso de imagens digitais são:
§ As imagens podem ser visualizadas e medidas em computadores, não
havendo a necessidade de equipamentos ópticos ou mecânicos;
§ Rápida análise e processamento dos dados capturados já que não há
necessidade de revelação de filme;
§ Os sistemas de medidas são estáveis e não necessitam de calibração
mecânica;
§ Grande variedade de resoluções, ou seja, a resolução pode variar de acordo
com a necessidade da aplicação;
§ Podem ser aplicadas técnicas de melhoramentos das imagens;
§ Também pode ser aplicado o processo de automação; e
§ As operações podem ser realizadas em tempo real ou quase real.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
18
Os dados digitais podem ser obtidos diretamente por câmaras
digitais ou através do processo de digitalização, com o uso de scanners. Neste
trabalho, as imagens digitais são adquiridas diretamente através de câmara digital.
2.2.1 Câmaras digitais
Câmaras digitais são dispositivos para a coleta e armazenamento de
imagens digitais. Segundo Tommaselli, Hasegawa e Galo (2000), uma câmara digital
possui um sistema de lentes, um chip CCD ou CMOS, processadores e uma
memória para o armazenamento das imagens. A Figura 02 ilustra os componentes
de uma câmara digital.
Figura 02 – Esquema de uma câmara digital.
(Fonte: TOMMASELLI, HASEGAWA e GALO, 2000).
Os raios de luz provenientes da cena atingem o sistema de lentes da
câmara e são focalizados no sistema sensor CCD (Charge Coupled Device). Em
cada célula do sensor é produzida uma carga elétrica proporcional à intensidade da
luz incidente (WOLF e DEWITT, 2000). Esta carga elétrica é então amplificada e
convertida da forma analógica para um sinal digital, que é armazenado em uma
memória temporária (frame buffer). Em seguida, a imagem passa por
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
19
processamentos para a interpolação de cores e compactação e em seguida é
armazenada.
2.3 ROTULAÇÃO DE IMAGENS COLORIDAS
Antes de iniciar o processo de correspondência de pontos para a
geração do MDT é interessante ter um conhecimento preliminar das feições
presentes nas imagens, permitindo decidir se tais feições devem pertencer ou não
ao MDT. Desta forma, é possível realizar um pré-processamento das imagens,
podendo-se fazer a rotulação das imagens com o cálculo de índices.
No caso de imagens multiespectrais de baixa resolução existem
vários índices que diferenciam alvos baseados em sua resposta espectral. O cálculo
destes índices é facilitado devido à característica multiespectral das imagens, além
da baixa resolução no terreno. Para imagens aéreas coloridas, o cálculo de tais
índices é dificultado. Como as imagens são de alta complexidade (maior escala), as
técnicas convencionais de processamento digital nem sempre apresentam
resultados satisfatórios.
Neste sentido, Polidorio et. al (2003) apresentam algumas técnicas
que permitem a separação de alguns alvos em imagens aéreas coloridas. São
propostos dois índices: um para separar alvos naturais dos artificiais a partir de
decomposições da imagem para o modelo RGB; e outro para a detecção de
sombras utilizando decomposição para o modelo HSI. Ambos os índices são obtidos
por operações pixel a pixel.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
20
Primeiramente, na seção 2.3.1, serão discutidos alguns aspectos
básicos sobre modelos de cores e, em seguida, serão apresentados os índices
propostos nas seções 2.3.2 e 2.3.3.
2.3.1 Modelos de cores
Segundo Gonzalez e Woods (2000), a proposta de um modelo de
cores é facilitar a especificação das cores de acordo com algum padrão consagrado.
Na essência, o modelo de cores é uma especificação de um sistema de
coordenadas tridimensionais (3-D) e de um sub-espaço dentro deste sistema, onde
cada cor é representada por um único ponto. Os modelos de cores mais utilizados
em processamento de imagens são o RGB e o HSI, descritos nas seções 2.3.1.1 e
2.3.1.2, de acordo com Gonzalez e Woods (2000).
2.3.1.1 Modelo de cores RGB
O modelo de cores RGB (Red, Green, Blue) é baseado em um
sistema cartesiano de coordenadas no qual cada cor é representada em função de
três componentes primárias que são as cores vermelho (R), verde (G) e azul (B). O
subespaço de cores é representado por um cubo, como pode ser visto na Figura 03.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
21
Figura 03 – Cubo de cores RGB.
(Fonte: Adaptado de GONZALEZ e WOODS, 2000).
No caso de uma imagem quantizada em 8 bits, cada componente de
cor varia de 0 a 255 níveis, permitindo diferenciar 16.777.216 cores (2563). Uma
imagem no modelo de cores RGB constitui, na verdade, três planos independentes
de imagem, um para cada cor primária. Esses três planos combinados produzem
composições de cores. Os pontos ao longo da diagonal principal têm valores de
cinza normalizados, a partir do preto na origem (0, 0, 0), até o branco (1, 1, 1) na
direção oposta, que está no vértice mais afastado da origem.
2.3.1.2 Modelo de cores HSI
O modelo HSI (Hue, Saturation, Intensity) é uma representação da
cor muito útil por duas razões principais: primeiro porque a componente intensidade
(I) pode ser desvinculada da informação de cor de uma imagem (matiz e saturação);
segundo porque as componentes de matiz (H) e saturação (S) estão intimamente
relacionadas com o processo pelo qual os seres humanos percebem a cor. Esses
atributos tornam o modelo HSI ideal para o desenvolvimento de algoritmos de
B
G
R (1,0,0) (0,0,0)
(1,1,1)
(0,1,0)
(0,0,1)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
22
processamento de imagens baseados nas propriedades sensoriais da cor percebida
pelo sistema visual humano.
Neste modelo, as características usadas para distinguir uma cor de
outra são suas componentes de matiz ou tonalidade, saturação e intensidade,
conforme ilustrado na Figura 04.
Figura 04 - Representação de cor no modelo HSI.
(Fonte: Adaptado de GONZALEZ e WOODS, 2000).
A intensidade fornece a noção de intensidade de luz e representa
a componente acromática da cor; o matiz (hue ou tonalidade) é um atributo
relacionado com o comprimento de onda dominante em uma mistura de faixas de
luz, ou seja, representa a cor dominante percebida por um observador; e a saturação
refere-se à pureza relativa ou quantidade de luz branca misturadas com a cor
dominante. As cores do espectro puro são completamente saturadas, sendo que o
Branco
Intensidade [0,1]
Preto
R
G
B
P
P P’
O Matiz [0, 360º]
Saturação = OP/OP’ [0,1]
R
G
B
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
23
( ) ( )[ ]
( ) ( )( )[ ]
−−+−
−+−=
21
2 BGBRGR
BRGR21
arccosH
( ) ( )[ ]B,G,RminBGR
31S
++−=
3BGR
I++
=
seu grau de saturação é inversamente proporcional à quantidade de luz branca que
foi acrescida.
2.3.1.3 Transformação RGB – HSI
De acordo com Gonzalez e Woods (2000), as componentes H, S e I
podem ser obtidas a partir das componentes R, G e B normalizadas no intervalo de
[0,1]. A obtenção destas componentes é mostrada nas Equações 01, 02 e 03.
(01)
onde H = 360º - H se (B/I) > (G/I)
(02)
(03)
Como será mostrado na seção 2.3.2, neste trabalho, para o cálculo
do índice detector de sombras, não será utilizada a matiz, somente a saturação e a
intensidade.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
24
2.3.2 Índice de detecção de sombras
O cálculo do índice de detecção de sombras é realizado utilizando
as componentes intensidade (I) e saturação (S) do modelo de cores HSI. Para obter
estas componentes, utiliza-se a transformação entre o modelo de cores RGB, que é
o modelo original da imagem, e o modelo HSI, no qual será calculado o índice
detector de sombras.
Os atributos de alta saturação e de baixa intensidade luminosa das
sombras permitem a sua detecção através de uma operação simples. Desta forma, o
índice para a detecção de sombras SDW (ShaDoW) é calculado simplesmente
através da subtração entre as bandas intensidade (I) e saturação (S), como pode ser
visto na Equação 04 (POLIDORIO et al., 2003).
SDW = I – S
Na imagem SDW resultante, as sombras se tornam mais escuras
que os demais alvos, permitindo sua separação das demais feições presentes na
imagem. Esta separação é realizada através da aplicação de um limiar pré-
estabelecido.
2.3.3 Índice de artificialidade
O índice NandA (Natural and Artificial) é baseado em operações
envolvendo as componentes R, G e B do sistema de cores RGB, sendo calculado
através da Equação 05 (POLIDORIO et al., 2003):
(04)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
25
NandA = G - (R+B)
A resposta espectral da vegetação na banda verde é maior que nas
bandas vermelho e azul. Já a resposta dos alvos artificiais (concreto, asfalto, etc)
aumenta ao longo do espectro visível. Desta forma, a aplicação deste índice torna as
feições naturais mais claras e as artificiais mais escuras, tornando mais fácil o
processo de separação e classificação destas feições.
2.4 CORRESPONDÊNCIA DE IMAGENS
Um dos processos fundamentais em Fotogrametria é a identificação
e medição de pontos homólogos em duas ou mais fotografias sobrepostas. Na
Fotogrametria analógica e analítica, esta tarefa é realizada por um operador. Na
Fotogrametria digital, este problema pode ser resolvido automaticamente através do
processo conhecido como correspondência de imagens, que é um recurso
disponível em uma série de sistemas fotogramétricos digitais. A correspondência de
imagens está envolvida em praticamente todos os processos fotogramétricos
digitais, como a orientação de imagens, geração de modelos digitais de terrenos e
extração automática de feições.
Segundo Heipke (1996), a correspondência de imagens digitais
estabelece automaticamente a correspondência entre primitivas extraídas de duas
ou mais imagens digitais desde que elas descrevam, pelo menos parcialmente, a
mesma cena.
(05)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
26
O que difere os algoritmos de correspondência é o tipo de primitiva
utilizada no processo. A classificação dos métodos varia de acordo com os autores.
Heipke (1996) considera como primitivas os tons de cinza e as feições presentes nas
imagens. Desta forma, classifica os métodos de correspondência em duas
categorias:
§ Correspondência baseada em áreas (Area-Based Matching - ABM): é
associada com a correspondência dos tons de cinza das imagens, ou seja,
comparam-se os níveis de cinza de pequenas áreas nas duas imagens e a
similaridade é medida por correlação estatística, podendo ser seguida por
técnicas de mínimos quadrados (Least Squares Matching – LSM). É o método
mais usado em Fotogrametria.
§ Correspondência baseada em feições (Feature-Based Matching - FBM): neste
método feições são extraídas nas imagens para a correspondência. Estas
feições podem ser locais, tais como pontos, bordas, pequenas linhas e
regiões, ou globais, como polígonos ou estruturas, que são descrições mais
complexas do conteúdo das imagens. Cada feição é caracterizada por
atributos, tais como a posição (coordenadas), orientação e magnitude das
bordas (gradientes), comprimento e curvatura de linhas, tamanho e brilho
médio de regiões, entre outros. Além dos atributos, podem ser estabelecidas
relações entre as feições. Tais relações podem ser geométricas, como o
ângulo entre dois lados de polígonos adjacentes ou a distância mínima entre
duas bordas; radiométricas, como a diferença entre os tons de cinza ou sua
variância entre duas regiões adjacentes; ou ainda topológicas. A
correspondência utilizando feições globais é também chamada de
correspondência relacional (relational matching).
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
27
Em Schenk (1999) são descritos três métodos de correspondência:
§ Correspondência baseada em áreas: similar à descrição dada por Heipke
(1996);
§ Correspondência baseada em feições: não inclui a correspondência com
feições globais descrita por Heipke (1996) (correspondência relacional); e
§ Correspondência simbólica (symbolic matching): é o método que compara
descrições simbólicas das imagens e mede a similaridade através de uma
função de custo. As descrições simbólicas se referem aos níveis de cinza ou
às feições derivadas. Podem ser implementadas como grafos, árvores, redes
semânticas, entre outras possibilidades. Diferentemente dos outros métodos,
a correspondência simbólica não é estritamente baseada nas propriedades
geométricas para medir a similaridade. Ao invés de usar a forma como um
critério de similaridade, este método compara as propriedades topológicas
entre as feições. Para Schenk (1999), a correspondência relacional é um tipo
de correspondência simbólica.
Em linhas gerais, o problema da correspondência de imagens
abrange as seguintes etapas:
1) Selecionar uma primitiva (níveis de cinza, feições ou descrições simbólicas)
para correspondência em uma imagem;
2) Encontrar a primitiva conjugada na outra imagem;
3) Calcular a posição tridimensional da primitiva correspondida no espaço
objeto; e
4) Avaliar a qualidade da correspondência.
Neste trabalho, serão abordadas estas etapas para o método de
correspondência de imagens baseado em áreas.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
28
Imagem Esquerda Imagem Direita
Janela de Busca
Janela de Referência
Janela de Pesquisa
Embora seja um tópico bem explanado, a correspondência de
imagens é um assunto que ainda é objeto de estudo em várias pesquisas, visto que
pode apresentar falhas em algumas situações.
2.4.1 Correlação de Imagens
A correlação de imagens com precisão ao nível de pixel examina
áreas pré-estabelecidas no estereopar de imagens e aplica uma função de
correlação ou critério de medida de similaridade aos valores numéricos das funções
de tom de cinza (STRAUCH, 1991). Em outras palavras, compara a distribuição dos
níveis de cinza de uma janela de referência delimitada na imagem esquerda,
também chamada de template, com todas as janelas de pesquisa possíveis dentro
de uma janela de busca delimitada na imagem direita. A Figura 05 ilustra esta
situação.
Figura 05 – Correlação digital de imagens.
Existem vários critérios de medida de similaridade, tais como a
função erro, onde é feita a subtração dos níveis de cinza entre os pixels das janelas
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
29
e a posição de melhor correlação é aquela na qual a função assume o valor mais
próximo de zero; e a função quociente, onde é feita a razão entre os níveis de cinza
e a posição de maior similaridade é a mais próxima do valor um. Entretanto, uma
das funções mais conhecidas e utilizadas é o coeficiente de correlação, que pode
ser expresso pela Equação 06 (HEIPKE, 1996; WOLF e DEWITT, 2000):
( )( ) ( )( )( )
( )( ) ( )( )∑∑∑∑
∑∑
= == =
= =
−−
−−=
σσσ
=ρn
0i
m
0j
2PjiP
n
0i
m
0j
2RjiR
n
1i
m
1jPjiPRjiR
PR
RP
gy,xg*gy,xg
gy,xggy,xg
onde:
RPσ é a covariância entre as janelas de referência e de pesquisa;
Rσ é o desvio-padrão da janela de referência;
Pσ é o desvio-padrão da janela de pesquisa;
n, m são o número de colunas e linhas da janela de referência;
( )jiR y,xg é o nível de cinza da posição ( )ji y,x na janela de referência;
( )jiP y,xg é o nível de cinza da posição ( )ji y,x na janela de pesquisa;
Rg é a média dos níveis de cinza da janela de referência; e
Pg é a média dos níveis de cinza da janela de pesquisa.
O fator de correlação varia de -1 a 1. O valor 1 corresponde a
medida de similaridade máxima, o valor 0 indica que não há correlação entre as
janelas e o valor -1 indica correlação inversa.
De forma resumida, o processo de correlação resume-se a quatro
etapas fundamentais:
(06)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
30
§ Seleção de uma sub-imagem de referência em uma imagem;
§ Seleção da sub-imagem de busca em outra imagem;
§ Cálculo da correlação;
§ Identificação dos pontos de máximo ou mínimo para todas as possíveis
combinações; e
§ Verificação da qualidade do processo realizado.
A última etapa, ou seja, a verificação da qualidade do processo é de
grande importância, uma vez que existem vários fatores que influenciam o processo
de correlação a fornecer um resultado falso.
Uma vez achada a janela correlacionada ao nível de pixel, pode-se
obter um refinamento desta solução utilizando o método dos mínimos quadrados, ou
seja, pode-se obter uma solução sub-pixel. Este procedimento é conhecido como
correspondência pelos mínimos quadrados e tem a função de minimizar a diferença
entre os níveis de cinza da janela de referência e da janela correlacionada
(SCHENK, 1999). Neste processo, a posição e o formato da janela correlacionada
são os parâmetros calculados no ajustamento, ou seja, estes parâmetros são
recalculados até que a diferença nos níveis de cinza entre a janela correlacionada
(que varia) e a janela de referência (constante) seja mínima. O formato da janela
correlacionada deve ser modificado devido ao efeito das distorções geométricas que
ocorrem nas imagens e prejudicam o processo de correlação. Mais detalhes sobre
esta formulação, inclusive modelo matemático, pode ser encontrada em Ackermann
(1984), Andrade (1998, p.124), Schenk (1999, p.257), Wolf e Dewitt (2000, p.339).
Outra possibilidade para encontrar a solução da correspondência com precisão
subpixel é o ajuste de uma superfície quadrática ao redor do ponto de máximo ou do
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
31
mínimo da matriz de coeficientes de correlação. As coordenadas subpixel podem ser
obtidas estimando o ponto crítico desta função.
No método de correspondência de imagens baseado em área alguns
pontos devem ser discutidos (SCHENK, 1999):
§ Localização da matriz de referência: a janela de referência deve ser a melhor
possível, de tal forma que não ocorram falhas na correspondência entre as
entidades. Tais falhas podem ocorrer devido à homogeneidade da região,
oclusão da área selecionada na outra imagem, repetição de padrões, entre
outros. Neste sentido, Förstner (1986) desenvolveu o operador de interesse.
Este operador determina primeiramente se uma determinada janela de
referência possui alto potencial para a correspondência e, em seguida,
determina pontos notáveis nestas janelas para a realização da
correspondência baseada em feições. Neste trabalho, será utilizada a
formulação proposta para selecionar as janelas de referência para a
correlação, apresentada na seção 2.4.4.
§ Dimensão da janela de referência: este ponto deve ser levado em
consideração, pois à medida que a dimensão da janela é incrementada, a
unicidade da função dos níveis de cinza aumenta, porém o problema das
distorções geométricas é mais marcante.
§ Localização e dimensão da janela de pesquisa: o método de correspondência
baseado em área requer boas aproximações, e com isso, métodos de
redução do espaço de busca devem ser usados.
§ Critério de similaridade: os valores obtidos nas medidas de similaridade entre
a janela de referência e as janelas de pesquisa devem ser analisados. Para
isso, limiares ou outros critérios podem ser usados.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
32
2.4.2 Problemas na correlação de imagens
A correspondência de imagens pertence à classe dos problemas
inversos, conhecidos por serem mal-condicionados. Um problema é dito mal-
condicionado se ocorrerem as seguintes condições (HEIPKE, 1996):
o não há garantias de que a solução exista;
o não há garantias de que a solução seja única; e
o não há garantias de que a solução seja estável para pequenas
variações nos dados de entrada.
A correspondência de imagens é um processo mal-condicionado
uma vez que, dado um ponto em uma imagem, seu ponto correspondente em outras
imagens pode:
1. não existir devido à oclusões, atendendo a condição (1);
§ ter mais de uma possibilidade de correspondência devido à padrões
repetitivos nas imagens, atendendo a condição (2); e
§ não ser estável devido a ruídos presentes nas imagens, atendendo a
condição (3).
Nesta seção, serão tratados alguns problemas fundamentais da
correspondência de imagens. Os programas de geração de MDT’s devem considerá-
los e a capacidade de resolvê-los irá determinar a qualidade do produto gerado.
Dois problemas principais na correspondência de imagens são: o
alto custo computacional, quando a correlação é realizada sobre a imagem inteira; e
as ambigüidades, que ocorrem toda vez que a entidade de correspondência não é
única e, assim, são encontradas mais de uma solução. O problema do alto custo
computacional pode ser minimizado restringindo o espaço de busca para a
correlação. As ambigüidades também são conseqüências de se realizar a correlação
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
33
na imagem inteira. Ao reduzir o espaço de busca, diminui-se a probabilidade de
entidades ambíguas. Este assunto será abordado na seção 2.4.3.
Supondo que o espaço de busca esteja reduzido e que não haja
ambigüidades, dado um par de pontos realmente correspondentes, teoricamente a
medida de similaridade resultaria no resultado máximo se todos os tons de cinza
para todos os pixels das janelas comparadas fossem idênticos. Esta situação seria
ideal, entretanto, ela nunca ocorre. Somente em casos hipotéticos, as funções de
correlação serão ótimas. Na prática, ruídos, mudanças de iluminação e propriedades
de reflexão entre duas imagens consecutivas causam diferença nos níveis de cinza.
Estas diferenças são chamadas de distorções radiométricas.
Além destes problemas, existem também as distorções geométricas.
Segundo Ackermann (1994), estas distorções se devem principalmente aos
parâmetros de orientação da câmara diferentes nas imagens e ao efeito do relevo.
Segundo Schenk (1999), as duas principais distorções geométricas
devido aos diferentes parâmetros de orientação são:
§ Distorção causada pela diferença na altura de vôo na tomada das imagens:
ocasiona escalas diferentes entre as duas imagens. Os pixels das imagens não
se relacionam mais, uma vez que se referem a locais diferentes no espaço
objeto. Esta distorção se acentua conforme a distância do centro da imagem
aumenta; e
§ Distorção causada pelos diferentes ângulos de rotação entre as duas imagens:
quando as imagens apresentam os ângulos de rotação κ, ϕ e ω diferentes. Da
mesma forma que na diferença de escala, os pixels das imagens não se
relacionam mais, referindo-se a locais diferentes no espaço objeto.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
34
Com relação ao efeito do relevo, quando se tem uma superfície que
possui diferentes elevações, os pixels não se conjugam, nem mesmo se o vôo for
perfeitamente vertical.
Existe ainda uma outra situação que ocasiona distorções
geométricas. É o caso das superfícies inclinadas. Se a superfície for inclinada em
uma direção paralela à aerobase, não há problemas uma vez que a distorção
geométrica será igual em todas as imagens. Porém, se a superfície for inclinada em
uma direção perpendicular à aerobase, o efeito da distorção é diferente (Schenk,
1999, p.240). Se a inclinação for tal que se alcance um ângulo crítico, as feições não
aparecerão nas outras imagens, ocasionando as oclusões.
De acordo com Heipke (1996), devido ao fato de a correspondência
ser um problema mal condicionado, devem ser introduzidas algumas restrições para
que o problema se torne bem condicionado. Neste sentido, são descritos na
seqüência os processos de redução do espaço de busca e de estimativa da precisão
do processo de correlação.
2.4.3 Redução do Espaço de Busca
Um grande problema da correlação de imagens é a definição do
espaço de busca. Se a região de busca para as feições homólogas não for restrita, o
custo computacional será elevado e a chance de se ter ambigüidade será elevada, o
que aumenta o risco de se ter falsas correspondências. Assim, para evitar cálculos
desnecessários e reduzir o custo computacional, é preciso restringir o espaço de
busca (WOLF e DEWITT, 2000). Alguns meios para reduzir o espaço de busca na
correlação são: o princípio da geometria epipolar, no qual a área de busca é
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
35
reduzida às linhas epipolares; e a busca hierárquica, na qual se utiliza uma pirâmide
de imagens. Estes métodos serão apresentados a seguir.
Além destes métodos, pode-se utilizar um MDT aproximado ou um
MDT já existente da região em questão para a redução do espaço de busca. Esta
técnica não será utilizada neste trabalho.
2.4.3.1 Linhas Epipolares
A Figura 06 mostra um estereopar com o ponto A no espaço objeto
(terreno) e os correspondentes pontos homólogos a1 e a2 no espaço imagem
(imagens esquerda e direita respectivamente).
O plano definido pelos centros perspectivos (pontos C1, C2) e o
ponto A é conhecido como plano epipolar. As interseções do plano epipolar com os
planos das imagens produzem as linhas epipolares conjugadas (MIKHAIL, BETHEL
e MCGLONE, 2001). Nota-se que as distâncias focais L1 e L2 devem ser ortogonais
aos planos imagem.
Figura 06 – Plano epipolar e as correspondentes linhas epipolares.
(Fonte: Adaptado de MIKHAIL, BETHEL e MCGLONE, 2001).
A
Linha epipolar
a2 a1
Plano Epipolar
B C1 C2
L1 L2
Linha epipolar
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
36
Uma característica importante, conseqüência desta geometria, é
que, dado um ponto em uma das imagens, o ponto correspondente na outra imagem
do par deve, necessariamente, localizar-se sobre a linha epipolar conjugada. Deste
modo, se uma feição em uma imagem é selecionada, a linha epipolar que passa
pelo ponto correspondente na outra imagem poderá ser obtida se a orientação
relativa entre as imagens for conhecida, ou seja, se o estereopar estiver orientado.
Deste modo, uma vez conhecida a orientação relativa, as linhas epipolares
conjugadas podem ser obtidas e o espaço de busca passa a ser reduzido, deixando
de ser bidimensional e passando a ser unidimensional.
Para melhor entender o processo, considera-se a Figura 07, que
mostra o raio C’p’ (que liga o centro perspectivo e imagem do ponto P na imagem
esquerda), com P sendo a feição no espaço objeto com elevação estimada ZP, que
pode ser uma altitude média da região.
Figura 07 – Redução do espaço de busca usando informações altimétricas.
(Fonte: Adaptado de SCHENK, 1999).
O raio C’p’ intercepta a superfície no ponto T. Com a altitude
estimada do ponto P (ZP) e os parâmetros de orientação da imagem da esquerda é
possível projetar o ponto imagem p’, cujas coordenadas se encontram no sistema
T
C’ C”
p’ p” s” i”
S
P
I ZP
Datum
HP
∆Z
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
37
fotogramétrico, para o sistema do espaço objeto, ou seja, do terreno, a partir das
equações de colinearidade inversas (Equação 07).
( )
( )fmymxmfmymxm
ZZYY
fmymxmfmymxm
ZZXX
E33P
E23P
E13
E32P
E22P
E12E
0E0
E33P
E23P
E13
E31P
E21P
E11E
0E0
−+−+
−+=
−+−+
−+=
,
onde:
( )PP y,x são as coordenadas do ponto no sistema fotogramétrico na imagem da
esquerda;
Eijm são os elementos da matriz de rotação para a imagem da esquerda;
f é a distância focal da câmara;
( )E0
E0
E0 Z,Y,X são as coordenadas do centro perspectivo (CP) da câmara para a
imagem da esquerda no sistema de terreno; e
( )Z,Y,X são as coordenadas do ponto no sistema de terreno.
Como a altitude ZP foi estimada, uma incerteza (∆z) deve ser
associada a ela (SCHENK, 1999). Com base em um conhecimento prévio da
altimetria da região, este intervalo de incerteza pode ser calculado, obtendo-se os
valores de S e I mostrados na Figura 07.
Em seguida, o ponto P no sistema de terreno, assim como os
extremos do intervalo de incerteza altimétrica S e I são projetados na imagem direita,
a fim de gerar uma região de busca s’’, i’’. Esta projeção é realizada através das
equações de colinearidade diretas (Equação 08), utilizando os parâmetros de
orientação exterior da imagem da direita.
(07)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
38
( ) ( ) ( )( ) ( ) ( )
( ) ( ) ( )( ) ( ) ( )D
0D33
D0
D32
D0
D31
D0
D23
D0
D22
D0
D21
P
D0
D33
D0
D32
D0
D31
D0
D13
D0
D12
D0
D11
P
ZZmYYmXXmZZmYYmXXm
fy
ZZmYYmXXmZZmYYmXXm
fx
−+−+−−+−+−
−=
−+−+−−+−+−
−=
,
onde: Dijm são os elementos da matriz de rotação para a imagem da direita; e
( )D0
D0
D0 Z,Y,X são as coordenadas do centro perspectivo (CP) da câmara para
a imagem da direita no sistema de terreno.
Segundo Schenk (1999), as etapas principais para implementar a
correspondência ao longo das linhas epipolares são:
§ Selecionar a entidade que se deseja corresponder na imagem da esquerda
(p’);
§ Estimar a elevação (ZP) de tal entidade e seu intervalo de incerteza (∆z);
§ Calcular a posição aproximada da entidade na imagem da direita (p’’);
§ Calcular o intervalo de busca ( ''Sx - ''
Ix );
§ Realizar a correspondência dentro do intervalo de busca; e
§ Analisar os valores obtidos para cada posição do intervalo de busca para
determinar a posição homóloga.
2.4.3.2 Normalização
Em geral, as linhas epipolares não são paralelas ao eixo de
coordenadas x. Porém, se os parâmetros de orientação forem conhecidos, as
imagens podem ser transformadas para suas posições normalizadas, a fim de tornar
(08)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
39
as linhas epipolares paralelas nas imagens. Este processo é denominado
Reamostragem Epipolar ou Normalização de Imagens e tem por objetivo remover a
paralaxe vertical, permitindo a visualização estereoscópica adequada do modelo,
como pode ser observado na Figura 08. Além disto, a normalização melhora a
qualidade do processo de correspondência, uma vez que as entidades
correspondentes se localizam sobre as linhas epipolares conjugadas.
A Figura 08 ilustra um estereopar de imagens normalizadas.
Figura 08 – Estereopar de imagens normalizadas.
(Fonte: RUY et al., 2005).
A transformação das imagens originais em imagens normalizadas
requer dois passos (CHO, SCHENK e MADANI, 1992; MIKHAIL, BETHEL e
MCGLONE, 2001, p.217; SCHENK, 1999, p.301):
1) As imagens do par são transformadas para suas posições verticais através do
uso das matrizes de rotação das imagens esquerda e direita; e
2) A partir das imagens verticais, são aplicadas rotações envolvendo as direções
dos componentes da base para se chegar à imagem normalizada.
Na Figura 09, N1 e N2 representam as imagens normalizadas e F1 e
F2 representam as imagens originais.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
40
Figura 09 – Geometria do processo de normalização.
(Fonte: Adaptado de MIKHAIL, BETHEL e MCGLONE, 2001).
A primeira transformação das posições originais para as posições
verdadeiramente verticais envolve simplesmente a matriz de rotação transposta das
imagens originais. Já para transformar as imagens de suas posições verticais para
as posições normalizadas, é necessário o cálculo da matriz de rotação da aerobase
(MB). Os ângulos de rotação θz e θy da matriz MB, mostrados na Figura 09, podem
ser calculados através dos elementos Bx, By e Bz da aerobase, também mostrados
XV
ZV
YV
C1
C2
By
Bz
Bx
Aerobase
θz
θy
θx
N1
N2
F1
F2
yN1
yN2
xN2
xN1
yF1
yF2
xF1
xF2
Sistema de Coordenadas do Espaço Objeto
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
41
na Figura 9. Já o ângulo θx é calculado em função dos elementos de orientação
exterior das imagens originais (CHO, SCHENK e MADANI, 1992).
A primeira rotação θz (Equação 09) leva o eixo Xv para o plano
vertical que passa pela aerobase.
=θ −
x
y1z B
Btan
A segunda rotação θy (Equação 10) torna o já rotacionado eixo Xv
paralelo à aerobase.
+
−=θ −
2y
2x
z1y
BB
Btan
Já a terceira rotação θx (Equação 11) fixa o eixo Zv, que já foi
rotacionado duas vezes.
2
21x
ϖ+ϖ=θ
sendo que ϖ1 e ϖ2 são ângulos de orientação das imagens originais.
Calculados os ângulos de orientação, pode-se escrever as matrizes
de rotação em cada direção. Para os ângulos θx, θy e θz têm-se, respectivamente, as
matrizes de rotação Mx, My e Mz. A matriz de rotação da aerobase pode ser
(09)
(10)
(11)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
42
calculada através da composição destas três matrizes, como pode ser vista na
Equação 12.
MB = Mx My Mz
Sendo:
θθ−θθ=
)cos()sin(0)sin()cos(0
001
M
xx
xxx
θθ
θ−θ=
)cos(0)sin(010
)sin(0)cos(M
yy
yy
y
θθ−
θθ
=1000)cos()sin(
0)sin()cos(
M zz
zz
z
Uma vez calculada a matriz MB, sejam M1 e M2 as matrizes de
rotação das imagens esquerda (F1) e direita (F2) respectivamente, as matrizes de
rotação entre as imagens originais e as normalizadas são dadas por (MIKHAIL,
BETHEL e MCGLONE, 2001):
MN1 = MB.M1T
MN2 = MB.M2T
As coordenadas normalizadas (xN,yN) para as imagens esquerda e
direita podem ser obtidas a partir das coordenadas originais (xF,yF), também nas
imagens esquerda e direita, através da Equação 17.
(16)
(13)
(14)
(15)
(12)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
43
( )( )
( )( )fmymxm
fmymxmfy
fmymxm
fmymxmfx
333231
232221
333231
131211
NFNFN
NFNFNN
NFNFN
NFNFNN
−++
−++−=
−++
−++−=
onde: i jNm são os elementos da matriz de rotação entre as imagens originais
(esquerda ou direita) e as normalizadas (Equação 16).
A transformação inversa, ou seja, a obtenção das coordenadas
originais a partir das coordenadas normalizadas pode ser expressa pela Equação
18:
( )( )
( )( )fmymxm
fmymxmfy
fmymxm
fmymxmfx
332313
322212
332313
312111
NNNNN
NNNNNF
NNNNN
NNNNNF
−++
−++−=
−++
−++−=
Uma vez que as imagens estão em suas posições normalizadas, os
processos de correspondência de pontos podem ser realizados nas mesmas linhas
nas duas imagens, o que reduz o espaço de busca para uma dimensão.
2.4.3.3 Paralaxes
Como já dito, a reamostragem epipolar faz com que o espaço de
busca deixe de ser bidimensional e se torne unidimensional. Porém, nem sempre
esta aproximação é suficiente. Resta ainda reduzir o espaço de busca ao longo das
(17)
(18)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
44
linhas epipolares. Para isto, pode-se utilizar as paralaxes dos pontos
correspondentes já determinados como aproximação para pontos subseqüentes.
Uma vez encontrado um par de pontos correspondentes, a paralaxe
absoluta neste ponto pode ser calculada por pa= xd-xe, onde xe e xd são as
coordenadas na imagem da esquerda e direita, respectivamente. Uma vez calculada
a paralaxe absoluta no ponto A, a diferença de paralaxe entre este ponto e seu
vizinho pode ser estimada pela Equação 19 (WOLF, 1983), que utiliza a paralaxe do
ponto inicial, a altura de vôo Hvôo, e uma estimativa de desnível ∆h entre pontos
considerados.
vôoa H
hpp
∆⋅=∆
O desnível ∆h máximo entre pontos vizinhos pode ser predito em
função de uma declividade máxima da região, em percentual, como pode ser visto
na Equação 20:
∆h = Dterreno * Declividade
onde Dterreno é a distância entre os pontos no referencial do terreno, calculada por:
Dterreno = dpixels * dim * denominador da escala da foto
sendo dpixels a distância entre os pontos medida em pixels e dim o tamanho do pixel
na direção x.
(19)
(20)
(21)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
45
Deste modo, ao ser definida a posição xe de um ponto na imagem
esquerda, próximo do primeiro ponto encontrado e com paralaxe absoluta pa; a
posição predita do ponto imagem homólogo a xe pode ser obtida por:
ppxx aed ∆±+=
Deve ser mencionado que este procedimento de redução do espaço
de busca deve ser aplicado de modo seqüêncial, ou seja, a cada ponto, uma vez
que este espaço depende da paralaxe do ponto anterior. Desta forma, ao encontrar
uma correspondência errada, este problema pode se propagar para os demais
pontos.
2.4.3.4 Hierarquia
Apesar da busca em linhas epipolares reduzir o espaço de busca da
área de sobreposição ao longo da linha epipolar, ainda são necessárias mais
aproximações para o processo de correlação se iniciar.
As imagens aéreas geralmente são muito grandes, ou seja, ocupam
um grande espaço de memória. Assim, além de consumir um tempo maior, torna-se
problemático encontrar correspondências diretamente nestas imagens de alta
resolução (HUNG et al., 1997). Desta forma, outra maneira de reduzir o espaço de
busca é realizar a correspondência de maneira hierárquica, utilizando a pirâmide de
imagens do estereopar. Este método também é chamado de estratégia coarse-to-
fine e é muito utilizado em sistemas fotogramétricos digitais.
(22)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
46
A pirâmide de imagens consiste em um conjunto de imagens de
diferentes níveis de resolução, a partir da imagem original, no qual o nível mais alto
corresponde ao nível de menor resolução e o nível mais baixo ao de maior
resolução. (HEIPKE, 1996).
A Figura 10 ilustra o princípio das pirâmides de imagens.
Figura 10 – Pirâmide de Imagens.
(Fonte: Adaptado de LEICA GEOSYSTEMS GIS & MAPPING, 2003).
Geralmente a imagem original é a base da pirâmide, ou seja, o nível
de maior resolução (fine). A partir da base, a resolução das imagens de um nível
para outro é reduzida por um fator de 2. Desta forma, para cada área de 2 por 2
pixels, um pixel é criado na imagem do próximo nível (LARSSON, 1984). Assim,
Nível 3 - 1:4
Nível 2 - 1:2
Nível 1 - 1:1
Nível 4 - 1:8 Correspondência começa no nível 4
Correspondência termina no nível 1
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
47
cada novo nível de imagens ocupa 25% do espaço ocupado pelo nível anterior. Este
processo se repete para todos os níveis até que se alcance o topo da pirâmide, ou
seja, o nível de menor resolução (coarse). Segundo Larsson (1984), uma pirâmide
completa é armazenada em 4/3 do espaço de armazenamento da imagem original.
Para gerar os níveis da pirâmide, deve-se aplicar um filtro passa-
baixa à imagem do nível anterior, como por exemplo, um filtro Gaussiano (HANNAH,
1988), gerando assim uma imagem mais suavizada. Kaiser, Schmolla e Wrobel
(1992), dizem que a escolha da máscara de suavização ideal é aquela que elimina
quase totalmente as altas freqüências e, em contrapartida, preserva quase
totalmente as baixas freqüências. Uma vez suavizada, esta imagem é reamostrada
de forma que seus pixels sejam quatro vezes maiores que os pixels do nível anterior.
O processo de correspondência ao longo da pirâmide de imagens se
inicia na imagem de mais baixa resolução. Os resultados deste nível são projetados
para as imagens de maior resolução até atingir as imagens com a resolução original
(SCHENK, 1999), ou seja, a informação extraída no nível de menor resolução é
utilizada para reduzir o espaço de busca nos níveis de resolução mais fina (HUNG
et. al, 1997; HEIPKE, 1996). É ideal que se alcance a base da pirâmide no processo
de correspondência hierárquica, uma vez que a imagem original possui detalhes que
as imagens de menor resolução não possuem.
2.4.4 Precisão da correlação
Considerando os problemas citados relacionados à correlação de
imagens, torna-se importante estimar à priori a qualidade com que este processo
será realizado para posteriormente validá-lo ou não. Assim, no processo de geração
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
48
de MDT's, pode-se evitar o cálculo das correlações que têm grande chance de
serem mal sucedidas, melhorando a qualidade do produto gerado.
Neste sentido, têm-se os procedimentos descritos na Figura 11,
encontrados em Haralick e Shapiro (1993) e que foram primeiramente descritos por
Förstner (1986). Este processo é baseado no cálculo da estimativa da precisão do
processo de correspondência por mínimos quadrados (LSM). Tais procedimentos
têm por finalidade avaliar a qualidade das componentes (translações) antes de
efetuar a correlação, utilizando para isto o resultado do coeficiente de correlação de
uma correspondência bem sucedida, que pode variar de acordo com cada situação.
Geralmente adotam-se valores acima de 60%. No caso do sistema OrthoMax, o
valor do mínimo coeficiente de correlação aceitável para se validar o processo é de
60% (GOOCH, CHANDLER e STOJIC, 1999). Para tanto, utiliza-se a função
coeficiente de correlação. Em síntese, o processo possui as seguintes etapas que
serão descritas em detalhes na seqüência, segundo Haralick e Shapiro (1993):
Figura 11 – Fluxograma do processo de obtenção da qualidade da correlação.
1. Cálculo da variância do ruído ( 2nσ ) em
função da variância da janela de
referência ( 2fσ ) e do máximo
coeficiente de correlação (ρ12).
2. Cálculo da matriz de equações normais (N) em função dos gradientes nas
linhas e colunas da janela de referência.
3. Cálculo da precisão dos parâmetros de translação entre as imagens em função da
variância do ruído ( 2nσ ) e da matriz de
equações normais (N).
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
49
2.4.4.1 Variância do ruído
Sejam ge e gd duas imagens que podem ser obtidas a partir de uma
função estocástica f(x,y) de variância 2fσ . Admitindo que cada uma delas esteja
sujeita a ruído branco (aleatório e estatisticamente independente), respectivamente
expressos por ne(x,y) e nd(x,y), pode-se escrever:
g1(x,y) = f(x,y) + ne(x,y)
g2(x,y) = a [f(x,y) + nd(x,y)] + b
Admitindo que a e b sejam respectivamente um fator de escala nos
tons de cinza e uma diferença de brilho e que os ruídos possuam mesma variância,
i.e., 2ne
σ = 2nd
σ = 2nσ , pode-se realizar a propagação de covariâncias nas Equações 23
e 24, obtendo-se as seguintes variâncias:
2g1
σ = 2fσ + 2
nσ
2g2
σ = a2( 2fσ + 2
nσ )
e a covariância
21ggσ = a. 2fσ
A partir destas grandezas pode-se determinar o coeficiente de
correlação por:
2n
2f
2f
gg
gg12
21
21
σ+σσ
=σ⋅σ
σ=ρ
(25)
(26)
(27)
(28)
(23)
(24)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
50
Além disto, conhecendo-se a variância 2fσ do sinal observado, pode-
se obter a variância do ruído 2nσ :
12
122f
122g
2n
)1()1(
1 ρρ−σ
=ρ−σ=σ
O coeficiente de correlação fornece apenas informação parcial sobre
a precisão da correlação, sendo necessários outros parâmetros para melhor avaliá-
la.
2.4.4.2 Estimativa dos parâmetros de translação
Na seção anterior admitiu-se que as imagens g1 e g2 podem ser
escritas a partir de f(x,y) e que existem diferenças de brilho e um fator de escala
entre os tons de cinza de g1 e g2. Assumindo agora que existe apenas translação
entre as imagens g1 e g2, e que esta translação seja dada por (∆x, ∆y), a diferença
entre os tons de cinza, para um determinado pixel i, pode ser obtida por:
)yy,xx(g)y,x(gg 12i ∆−∆−−=∆
O modelo acima pode ser linearizado, podendo-se escrever:
( ) ( ) i0c0ri nyy'gxx'ggii
+∆−∆−∆−∆−=∆
(29)
(31)
(30)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
51
como detalhado em Haralick e Shapiro (1993), sendo g’r e g’c os gradientes
direcionais obtidos por:
( )
( )
∂∆−∆−∂
=
∂∆−∆−∂
=
cyy,xxg
'g
ryy,xxg
'g
1c
1r
i
i
com r e c correspondendo à linha e coluna, respectivamente.
Usando a Equação 31 como equação de observação pode-se
estimar os parâmetros (∆x, ∆y) bem como sua matriz variância e covariância pelo
método dos mínimos quadrados (MMQ). Nota-se que este é o matching por mínimos
quadrados (LSM) quando supõe-se que existe apenas translação. As equações
normais podem ser escritas por N.X = U, onde:
∆−∆∆−∆
=0
0
yyxx
X
e a matriz N das equações normais, composta pelos gradientes (Equação 32), é
dada por:
=
=∑∑ ∑
∑ ∑∑
== =
= ==
2221
1211m
1i
2c
m
1i
m
1icr
m
1i
m
1icr
m
1i
2r
NNNN
ggg
gggN
iii
iii
(32)
(33)
(34)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
52
2.4.4.3 Precisão dos parâmetros de translação
A partir do conhecimento da matriz N, que pode ser obtida apenas a
partir dos gradientes nas direções x e y, a precisão dos parâmetros, ou seja, a MVC
das translações pode ser obtida pela Equação 35:
ou, usando a Equação 34:
onde 2nσ̂ é a variância à posteriori do ruído.
Assim, a partir da Equação 36 tem-se:
Em síntese, pode-se observar que a MVC das translações, e
conseqüentemente, os desvios-padrão das translações, dependem dos seguintes
fatores:
12ny,x Nˆ −
∆∆ ⋅σ=∑
−
−−
⋅σ=
σσσσσσ
∆∆∆
∆∆∆
1121
12222122211
2n2
yyx
yx2
x
NNNN
NNN1
ˆ
2122211
22nu NNN
Nˆˆ−
⋅σ=σ
2122211
11nv NNN
Nˆˆ
−⋅σ=σ
(35)
(36)
(37)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
53
§ Variância do ruído: quando se tem o conhecimento da variância do ruído 2nσ ,
pode-se utilizá-la no lugar do valor estimado 2nσ̂ . Entretanto, para o cálculo de
2nσ , é necessário que se realize a correlação pelo menos uma vez, já que 2
nσ
depende do máximo coeficiente de correlação.
§ O número m de pixels usados: o tamanho da janela é importante, uma vez
que o desvio-padrão diminui linearmente com o tamanho da janela.
§ O gradiente médio quadrático da janela: indica a presença de bordas, que é
decisivo para a precisão da correlação.
A vantagem em usar as Equações 37 é que, assumindo a variância
do ruído constante em toda a imagem, podem-se determinar claramente os lugares
onde se espera alta precisão na correlação antes de calculá-la. Isto é possível
porque as equações dependem somente do conteúdo da janela de referência. Por
outro lado, nas regiões onde se estima que a precisão será baixa, a correlação é
evitada.
Maiores detalhes e experimentos que utilizam esta formulação
podem ser encontrados em Costa, Tommaselli e Galo (2003).
2.4.5 Interseção Fotogramétrica
Uma vez encontradas as fotocoordenadas dos pontos por
correspondência, é necessário transformá-las para coordenadas tridimensionais no
referencial do espaço objeto, ou seja, no terreno, para gerar o MDT. Isto é realizado
através do processo de interseção fotogramétrica ou interseção dos raios
homólogos. Este procedimento permite determinar as coordenadas tridimensionais
no espaço objeto de quaisquer pontos pertencentes a um modelo que esteja
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
54
devidamente orientado, ou seja, conhecidos os parâmetros de orientação exterior da
câmara. Para tanto, utiliza-se as coordenadas observadas no espaço imagem,
reduzidas ao sistema fotogramétrico (WOLF e DEWITT, 2000).
Este cálculo pode ser efetuado através da aplicação das
equações de colinearidade (Equações 38 e 39), considerando somente as
coordenadas X, Y e Z como incógnitas. Assim, a determinação das coordenadas dos
pontos é realizada resolvendo-se um sistema com 4 equações e 3 incógnitas
aplicando o método dos mínimos quadrados.
( ) ( ) ( )( ) ( ) ( )
( ) ( ) ( )( ) ( ) ( )E
0E33
E0
E32
E0
E31
E0
E23
E0
E22
E0
E21E
P
E0
E33
E0
E32
E0
E31
E0
E13
E0
E12
E0
E11E
P
ZZmYYmXXmZZmYYmXXm
fy
ZZmYYmXXmZZmYYmXXm
fx
−+−+−−+−+−
−=
−+−+−−+−+−
−=
,
( ) ( ) ( )( ) ( ) ( )
( ) ( ) ( )( ) ( ) ( )D
0D33
D0
D32
D0
D31
D0
D23
D0
D22
D0
D21D
P
D0
D33
D0
D32
D0
D31
D0
D13
D0
D12
D0
D11D
P
ZZmYYmXXmZZmYYmXXm
fy
ZZmYYmXXmZZmYYmXXm
fx
−+−+−−+−+−
−=
−+−+−−+−+−
−=
,
onde:
Eijm são os elementos da matriz de rotação para a imagem esquerda;
Dijm são os elementos da matriz de rotação para a imagem direita;
f é a distância focal da câmara;
( )EP
EP y,x são as coordenadas do ponto no sistema fotogramétrico na imagem
esquerda corrigidas dos erros de distorções;
(38)
(39)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
55
( )DP
DP y,x são as coordenadas do ponto no sistema fotogramétrico na imagem
direita corrigidas dos erros de distorções;
( )E0
E0
E0 Z,Y,X são as coordenadas do centro perspectivo (CP) da câmara para
a imagem esquerda no sistema de terreno; e
( )D0
D0
D0 Z,Y,X são as coordenadas do centro perspectivo (CP) da câmara para
a imagem direita no sistema de terreno.
Para o caso das imagens normalizadas, deve-se primeiro realizar a
transformação das coordenadas obtidas na correspondência para o referencial das
imagens originais. Esta transformação é realizada através da Equação 18.
2.5 AJUSTE DE SUPERFÍCIE
Os pontos obtidos pela correspondência de imagens não estão
uniformemente distribuídos e não representam completamente a superfície. Surge
então a necessidade de se realizar interpolações, obtendo valores nos locais onde
não existem pontos amostrais. Assim, o processo de interpolação não melhora a
qualidade do produto gerado, mas preenche os “vazios” deixados pelo processo de
correspondência. O termo ajuste de superfícies é mais geral, uma vez que inclui
tanto as interpolações quanto métodos de aproximação. Lancaster e Salkauskas2
(1986) apud Schenk (1996) definem o ajuste de superfícies como sendo a tarefa de
encontrar uma função que seja adequada aos dados amostrais e modele
apropriadamente o intervalo entre eles. Neste caso, os dados amostrais são as
coordenadas dos pontos obtidas na etapa da correspondência de imagens e a
superfície ajustada seria a superfície da Terra naquela região, ou seja, o MDT. Em 2 LANCASTER, P.; SALKAUSKAS. K. Curve and surface fitting: an introduction. Londres:
Academic. 1986.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
56
síntese, é necessário que se construa um modelo de superfícies que se aproxime da
superfície real.
2.5.1 Estruturas de Dados para MDT's
Como já dito, para construir um MDT é necessário estabelecer as
relações topológicas entre os elementos amostrais, bem como o modelo de
interpolação para aproximar o comportamento da superfície real. Segundo El-
Sheimy (1999), um modelo de superfície deve:
§ Representar com acurácia a superfície;
§ Ser adequado para possibilitar a coleta eficiente de dados;
§ Minimizar a necessidade de armazenamento de dados;
§ Maximizar a eficiência na manipulação dos dados; e
§ Ser adequado para a análise da superfície.
Três métodos são comumente usados para representar superfícies
na forma digital: curvas de nível, malha regular e rede irregular de triângulos (TIN).
As seções seguintes descrevem de maneira simplificada estes modelos.
2.5.1.1 Curvas de Nível
Curvas de nível ou isolinhas são as representações mais comuns da
superfície. Como as curvas de nível são geradas a partir de pontos, a localização
das curvas deve ser interpolada entre valores conhecidos, no caso do traçado
automático ou semi-automático. Segundo El-Sheimy (1999), uma das maiores
desvantagens das curvas de nível é o fato de elas indicarem as elevações da
superfície somente ao longo das isolinhas. Desta forma, eventuais anomalias na
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
57
superfície entre os intervalos de duas curvas não podem ser representadas. Para
saber a elevação de pontos entre as curvas deve-se utilizar um método de
interpolação. A Figura 12 mostra um mapa altimétrico representado por curvas de
nível.
Figura 12 – Mapa altimétrico.
(Fonte: INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS, 2005).
2.5.1.2 Malha Regular
A malha regular ou grid é uma estrutura onde os dados são
arranjados em uma matriz de linhas e colunas descrevendo dados planimétricos (X e
Y) e os elementos desta matriz são os valores das elevações (Z). Desta forma, a
topologia da grade regular pode ser acessada diretamente (FELGUEIRAS, 2004).
A resolução deste modelo é determinada pelo espaçamento entre os
pontos amostrais do grid. Esta pode ser aumentada ou diminuída de acordo com a
complexidade do relevo e/ou de sua aplicação. Diminuindo o espaçamento entre os
pontos do grid, este possuirá uma melhor resolução, representando a superfície com
mais precisão.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
58
Um dos problemas deste modelo é que a densidade de pontos de
grids regulares não pode ser adaptada de acordo com a complexidade do relevo,
fazendo com que, para representar o terreno com uma determinada precisão, seja
necessário um número elevado de pontos (EL-SHEIMY, 1999). Desta forma, na
representação de áreas planas, uma grande quantidade de memória computacional
é desperdiçada. Outra desvantagem é que os pontos mais altos ou mais baixos do
terreno raramente são amostrados, a não ser que coincidam com a grade de
amostragem.
Para se gerar grades regulares a partir de amostras irregularmente
espaçadas é comum definir-se funções interpolantes com as quais as elevações dos
pontos da grade são calculados com base nos pontos mais próximos
(FELGUEIRAS, 2004). Exemplos de tais funções são a média ponderada, vizinho
mais próximo, interpolação bilinear, polinômios de Lagrange, splines cúbicas,
métodos de geoestatística, entre outras.
Após a estimação dos vértices de uma grade regular é necessário
definir-se superfícies de ajuste que determinam o comportamento do fenômeno
modelado dentro de cada retângulo do modelo. As superfícies de ajuste são
utilizadas para se determinar o valor do fenômeno para pontos dentro da região de
interesse que não fazem parte do modelo.
A Figura 13 ilustra uma superfície gerada a partir de uma grade
regular.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
59
Figura 13 – Superfície gerada a partir de grade regular.
(Fonte: INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS, 2005).
2.5.1.3 Rede Irregular de Triângulos (TIN)
O modelo TIN gera uma superfície a partir de um conjunto de pontos
irregularmente distribuídos. Ao contrário do modelo grid, nesta estrutura os pontos
amostrais irregularmente distribuídos podem ser adaptados ao terreno, com mais
pontos nas áreas mais acidentadas do terreno e menos pontos nas áreas mais
suaves do terreno (EL-SHEIMY, 1999). Desta forma, segundo Felgueiras (2004), a
amostragem irregularmente espaçada é mais eficiente na representação de
superfícies com variação de relevo do que a amostragem regularmente espaçada.
No modelo TIN os pontos amostrais são conectados por linhas que
formam triângulos e, em cada triângulo, a superfície é geralmente representada
como um plano. O modelo da superfície gerado é contínuo, uma vez que cada
superfície de triângulo é definida pelas elevações dos três vértices e os triângulos
são adjacentes.
Algumas das vantagens deste modelo, é que os pontos mais altos e
mais baixos do terreno são incluídos e que a taxa de pontos amostrais pode ser
aumentada em regiões de relevo acentuado.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
60
Um método muito usado para a construção de modelos TIN é a
triangulação de Delaunay. Segundo Wolf e Dewitt (2000), neste método, são
traçadas linhas entre pontos mais próximos, sem que nenhuma destas linhas se
intercepte. Desta forma, o conjunto de triângulos resultante tem a propriedade de
que, para cada triângulo, o círculo que passa pelos três vértices não contém os
vértices de nenhum outro triângulo. Outra forma de explicar a triangulação de
Delaunay é o critério de maximização dos ângulos mínimos de cada triângulo. Isto é
equivalente a dizer que, a malha final, deve conter triângulos o mais próximo
possível de equiláteros, evitando-se a criação de triângulos afinados, ou seja, com
ângulos internos muito agudos. A Figura 14 representa uma superfície formada
utilizando o modelo TIN.
Figura 14 – Superfície formada a partir de grade triangular irregular.
(Fonte: INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS, 2005).
O modelo TIN possibilita a inclusão de breaklines ou linhas de
quebra. Linhas de quebra são linhas que possuem inclinação constante e são
usadas onde há descontinuidades no terreno, tais como rios, cordilheiras, entre
outros. No modelo TIN, as linhas de quebra formam os lados de dois triângulos
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
61
adjacentes e nenhuma outra linha irá interceptá-la. Ao utilizar linhas de quebra no
modelo TIN, o terreno pode ser mais bem representado.
Considerando-se um comportamento linear dentro de cada triângulo
pode-se estimar, com facilidade, o valor de qualquer ponto da superfície plana
definida pela malha triangular. Uma vez que três pontos não colineares definem
univocamente um plano cuja equação pode ser expressa, na forma impícita, por Ax
+ By + Cz + D = 0, a determinação dos coeficientes A, B, C e D pode ser feita
diretamente a partir das coordenadas dos três pontos do triângulo. Dessa forma,
para qualquer ponto cujo valor de Z deve ser estimado, deve-se inicialmente buscar
o triângulo que o contém e, através de uma álgebra simples, determinar a cota deste
ponto. Este ajuste é conhecido como ajuste linear sobre a malha triangular e embora
garanta a continuidade entre as superfícies de triângulos vizinhos, não garante uma
suavidade na transição entre as superfícies.
2.5.1.4 Comparação entre as estruturas
O Quadro 1 apresenta as principais diferenças entre os modelos de
grade retangular e de grade irregular triangular, sintetizando as características de
cada modelo apresentadas nas seções anteriores.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
62
Quadro 1 – Comparação entre os modelos de dados. (Fonte: Adaptado de FELGUEIRAS, 2004)
GRADE REGULAR RETANGULAR
GRADE IRREGULAR TRIANGULAR
Apresenta regularidade na distribuição espacial
dos vértices das células do modelo
Não apresenta regularidade na distribuição espacial dos vértices das células do modelo
Os vértices dos retângulos são estimados a partir das amostras
Os vértices do triângulo pertencem ao conjunto amostral
Apresenta problemas para representar
superfícies com variações locais acentuadas
Representa de maneira mais adequada superfícies não homogêneas com variações
locais acentuadas
Estrutura de dados mais simples
Estrutura de dados mais complexa
Relações topológicas entre os retângulos são
explícitas
É necessário identificar e armazenar as relações topológicas entre os triângulos
2.6 CONTROLE DE QUALIDADE DE MODELOS DIGITAIS DE TERRENO
Segundo Schenk (1996), na maioria dos sistemas de geração de
MDT's, as etapas da correspondência de pontos e da densificação da superfície são
tarefas automáticas, que necessitam da intervenção do operador somente para
inicializar o processo, fornecendo os parâmetros necessários para sua execução.
Apesar de todos os controles realizados nas duas primeiras etapas, é essencial que
um operador verifique se o MDT é acurado e completo. A esta verificação dá-se o
nome de controle de qualidade. Esta etapa é crucial no processo de geração de
MDT's, uma vez que não afeta só a qualidade do modelo, mas também a economia
feita com a automação das outras duas etapas. Além disto, esta etapa é dificultada
pela não existência de normas específicas mundialmente aceitas para controle de
qualidade de MDT’s.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
63
A qualidade de um MDT é fundamental para seu uso posterior, uma
vez que tem influência sobre outros produtos, como por exemplo as ortoimagens.
Segundo Smith et al. (1997), há muitos fatores que influenciam a acurácia de um
MDT gerado automaticamente com o uso de imagens fotogramétricas, a saber:
1. Resolução da imagem digital;
2. Qualidade da imagem;
3. Parâmetros de controle da correlação;
4. Espaçamento dos pontos no MDT; e
5. Características do terreno.
Em Polidori (2002), os fatores que influenciam a qualidade do MDT
estão reunidos em dois grandes grupos:
1. Acurácia das coordenadas dos pontos, ou seja, da correspondência; e
2. Estrutura de dados escolhida para gerar o MDT.
Assim, os três primeiros fatores propostos por Smith et al. (1997) se
encaixam dentro do primeiro grupo proposto por Polidori (2002). De maneira
semelhante, os dois últimos fatores se encaixam dentro do segundo grupo. Nas
Seções 2.6.1 e 2.6.2 estes grupos serão mais bem detalhados.
2.6.1 Acurácia das Coordenadas dos Pontos
A acurácia das coordenadas dos pontos depende de alguns fatores,
desde os relacionados às imagens até os aspectos ligados aos processos
fotogramétricos, conforme descrição nas seções 2.6.1.1 e 2.6.1.2.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
64
2.6.1.1 Qualidade da imagem
A qualidade da imagem depende das técnicas de processamento
nela aplicadas, tais como contraste, equalização de histogramas, entre outras. A
qualidade da imagem é um fator determinante para o sucesso dos algoritmos de
correspondência.
Lam et al. (2001) investigaram o efeito da compressão de imagens
para o formato JPEG na acurácia de MDT's gerados automaticamente. Os
resultados obtidos mostram que quando o fator de compressão é inferior a 10, quase
não há danos e a qualidade visual das imagens reconstruídas é muito boa. Caso
fosse feita a medição manual de pontos, o resultado obtido com estas imagens não
seria afetado e o tamanho dos arquivos das imagens seria um décimo do tamanho
original. Já para o processo de medição totalmente automático, o resultado seria de
qualidade inferior. Esta redução de precisão cresce diretamente com o aumento da
taxa de compressão aplicada às imagens.
2.6.1.2 Parâmetros de Controle da Correlação
Cada algoritmo de correlação é controlado por um conjunto de
parâmetros configurados pelo usuário. Estes parâmetros têm um efeito significativo
na qualidade do MDT.
Seja por exemplo o sistema Erdas Imagine OrthoMAX. Gooch,
Chandler e Stojic (1999) analisaram o efeito dos parâmetros existentes neste
sistema na qualidade final do MDT. Estes parâmetros são também chamados de
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
65
parâmetros de estratégia. Segundo tais autores, a escolha equivocada destes
valores pode ter um efeito significantemente prejudicial na acurácia do MDT.
Alguns parâmetros presentes nos sistemas e os valores padrão do
sistema Erdas Imagine OrthoMAX são (GOOCH, CHANDLER e STOJIC, 1999):
§ Mínimo coeficiente de correlação: é o valor mínimo aceitável para o
coeficiente de correlação entre as duas janelas. O valor padrão no OrthoMAX
é 60%. Se o coeficiente de correlação para uma determinada janela for
inferior ao valor mínimo, a correlação é rejeitada. Conforme este valor
aumenta o algoritmo se torna mais seletivo, aceitando apenas pontos com
alto coeficiente de correlação. Isto aumenta a porcentagem de interpolação,
uma vez que são obtidos menos pontos no processo. Em contrapartida,
conforme este valor diminui, o algoritmo aceita mais pontos, aumentando a
probabilidade de falsas correlações.
§ Dimensões mínima e máxima da janela de referência: estes parâmetros
estabelecem as dimensões mínima e máxima, em pixels, da janela de
referência (template). No OrthoMAX, estes valores são respectivamente 7 e 9.
A correlação começa com a janela de referência do tamanho mínimo e a
aumenta caso não se encontre correlação bem sucedida. A escolha do
tamanho da janela deve se basear no tipo de cobertura do terreno, no
conteúdo da imagem e no deslocamento devido ao relevo. Geralmente,
imagens com pouco conteúdo e grande deslocamento devido ao relevo
requerem janelas de referência maiores.
§ Precisão mínima: uma vez que um par de pontos correlacionados foi aceito, é
estimada uma precisão em pixels para a correlação. Esta precisão é definida
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
66
como sendo a média geométrica dos eixos das elipses dos erros. O valor
padrão do OrthoMAX é de 5 pixels. Os pontos que não atenderem a esta
precisão recebem um rótulo e terão suas elevações interpoladas.
§ Máxima paralaxe em x e y: facilitam os movimentos da janela de busca na
imagem direita nas direções x e y respectivamente. Os valores padrão do
OrthoMAX são respectivamente 5 e 0 pixels. A máxima paralaxe permite uma
translação de duas vezes o valor adotado de pixels ao longo da linha epipolar.
A paralaxe em y é usada quando a triangulação não é bem sucedida.
§ Fator de borda: é usado para minimizar o número de pontos errados no MDT
devido a falsas correlações ao longo de feições lineares. Como já dito, são
calculadas elipses de erros para cada ponto após a correlação. Elipses
alongadas na região de feições lineares sugerem que a correlação não é
confiável. O fator de borda descreve a relação entre os semi-eixos maior e
menor da elipse dos erros. No caso do OrthoMAX, esta relação é de 2 a 5.
§ RRDS (Reduced Resolution Data Set) inicial e final: a maioria dos sistemas
utiliza a aproximação hierárquica com conjunto de dados de resolução
reduzida. Este parâmetro indica as resoluções mínimas e máximas utilizadas
no processo hierárquico. No OrthoMAX estes valores são 4 e 0
respectivamente. Para melhor acurácia, é indicado que o valor final seja zero,
ou seja, que as imagens originais sejam atingidas, uma vez que os detalhes
podem ser mais bem distinguidos nessas imagens.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
67
2.6.2 Estrutura de dados para a aquisição do MDT
Questões como o espaçamento dos pontos no MDT e as
características do terreno são importantes quando se trata da qualidade do MDT.
Uma grande variedade de modelos e padrões de amostragem é proposta na
literatura. Segundo Polidori (2002), deve-se considerar três abordagens principais,
que são:
§ Amostragem regular: todas as células da malha têm tamanho e forma
constantes, que geralmente é retangular;
§ Amostragem semi-regular: baseada em uma malha regular densa na qual
alguns pontos de interesse são selecionados; e
§ Amostragem irregular: onde os pontos do terreno (amostras) podem estar em
qualquer posição.
Outro aspecto a ser considerado é a densidade do MDT. Este valor
deve ser escolhido de modo que haja um balanço entre o custo computacional, que
geralmente limita a densidade, e a acurácia necessária. Ao reduzir a densidade de
um MDT, ou seja, sub-amostrando a malha de pontos, são removidas as inclinações
mais íngremes, tornando o modelo da superfície mais suave.
Além disto, segundo Smith et al. (1997) grandes diferenças de
acurácia podem ocorrer ao longo do modelo, dependendo das características do
terreno. Para diminuir este efeito, deve-se selecionar diferentes grupos de
parâmetros para cada sub-área do modelo correspondente a um determinado tipo
de terreno.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
68
2.6.3 Validação do MDT
Uma vez gerado o MDT, deve-se realizar sua validação, ou seja,
analisar se o produto gerado é compatível com as especificações desejadas. Não há
especificações geralmente aceitas sobre a acurácia dos MDT's. A avaliação de
MDT’s geralmente é subjetiva e pode variar significantemente dependendo das
diferentes condições de obtenção do modelo e de suas diferentes aplicações.
Nos Estados Unidos, existe a USGS (United States Geological
Survey), que é uma agência federal que tem a finalidade de adquirir e distribuir
dados cartográficos digitais. Esta agência desenvolveu um conjunto de
especificações e padrões para determinar se um MDT pode ou não integrar sua
base de dados. Os MDT’s gerados por eles obedecem estas normas e os gerados
por outras agências ou instituições são testados quanto aos padrões estabelecidos.
Se estiverem dentro das exigências impostas, estes MDT’s podem ser incorporados
na base de dados da USGS. Os MDT’s disponibilizados pela agência se encaixam
dentro de alguns grupos, de acordo com a forma de obtenção dos dados. Os
modelos gerados por correspondência se encaixam no Nível 1, segundo a United
States Geological Survey. É estabelecido pela agência que os MDT’s do nível 1
devem ser estatisticamente testados através do cálculo do erro médio quadrático
com pelo menos 28 pontos.
Existem dois tipos de validação de um MDT: a interna e a externa
(POLIDORI, 2002), que serão explicadas nas Seções 2.6.3.1 e 2.6.3.2.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
69
2.6.3.1 Validação Interna
É necessário verificar se o terreno descrito pelo MDT gerado é
possível, ou seja, se possui as propriedades básicas da superfície real. Tais
propriedades são imediatas, tais como a verticalidade das paredes de edifícios em
uma cidade. Verificar o quanto estas propriedades estão sendo respeitadas não
requer dados externos de referência, e sim um conhecimento genérico das feições
do terreno. Esta detecção visual, feita após a geração do MDT é o primeiro passo da
validação interna.
Outra etapa da validação interna de um MDT é a eliminação de erros
grosseiros (blunders). Em MDT’s gerados automaticamente por correspondência de
pontos, estes erros são conseqüência de correspondências erradas (UNITED
STATES GEOLOGICAL SURVEY, 1998).
2.6.3.2 Validação Externa
Se existem dados de elevações externos disponíveis e confiáveis,
pode-se considerar a validação externa do MDT, que consiste na comparação do
MDT com os dados de referência, ou seja, com informações de relevo pré-existentes
de maior exatidão em relação ao modelo gerado. Este é o método mais comum de
avaliar a qualidade de MDT's, porém é limitado por duas dificuldades.
A primeira dificuldade é a disponibilidade de um conjunto de dados
de referência adequado. Assim, os MDT's geralmente são validados com pontos de
controle. Além disto, pontos de controle já têm seu próprio erro, que na maioria dos
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
70
casos é desconhecido e pode possuir a mesma magnitude do erro do MDT que
estes pontos devem controlar.
A segunda dificuldade é a necessidade de um critério de
comparação explícito, que deve considerar as necessidades da aplicação.
Se existe um conjunto de dados de referência externa para realizar o
controle, pode-se aplicar o método descrito por Galo e Camargo (1994), baseado em
Merchant3 (1982), usado para o controle de qualidade de cartas. Este método
consiste numa análise estatística das discrepâncias através da análise de
tendências, baseada na distribuição t de Student, e da análise de precisão, baseada
na distribuição qui-quadrado.
3 MERCHANT, D. C. Spatial Accuracy Standarts for large scale line maps. In: TECHNICAL PAPERS OF AMERICAN CONGRESS ON SURVEYING AND MAPPING. Proceedings…, vol. 1 p. 222-231, 1982.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
71
3 MÉTODO PROPOSTO
Nesta seção será mostrado o método proposto para este trabalho,
bem como o desenvolvimento de todas as etapas que o envolvem.
A implementação do método foi desenvolvida em linguagem C++,
ambiente Builder 5.0. O programa, desenvolvido na forma de uma classe, contém os
métodos necessários para a execução de cada etapa do projeto.
Além dos códigos desenvolvidos, também estão sendo utilizados
módulos da biblioteca UPTk (Unesp Photogrammetric ToolKit). Esta biblioteca,
desenvolvida pelo grupo de pesquisa em Fotogrametria do Departamento de
Cartografia da Unesp, engloba funções e classes em linguagem C e C++ para a
execução de processos fotogramétricos e se encontra disponível para download na
internet. Para maiores detalhes sobre a biblioteca UPTk, ver Tommaselli, Hasegawa
e Galo (2003, 2005).
3.1 CONCEITO GERAL DA PROPOSTA
A Figura 15 apresenta um fluxograma que sintetiza o método
proposto, ilustrando as principais etapas do processo adotado neste trabalho para a
geração de Modelo Digital de Terreno.
De uma maneira geral, a partir de um estereopar de imagens digitais
e seus parâmetros de orientação exterior, o primeiro passo é realizar o processo de
normalização das imagens. Em seguida, é gerada a pirâmide de imagens com n
níveis e inicia-se o processo de correspondência de pontos utilizando a pirâmide de
imagens. Para cada nível da pirâmide, realiza-se o cálculo do potencial da
correlação, denominado neste trabalho como pré-análise. Na seqüência, é realizado
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
72
o adensamento do modelo gerado utilizando a pirâmide de imagens. No processo de
correspondência realizado nas imagens originais, as regiões de sombras são
excluídas com base no cálculo do índice de detecção de sombras, apresentado na
seção 2.3.2. Uma vez obtidas as coordenadas dos pontos por correspondência,
realiza-se então o processo de adensamento do modelo, realizando a exclusão de
áreas de sombra. Sem seguida, executa-se a interseção fotogramétrica, obtendo
assim as posições tridimensionais destes pontos no espaço objeto.
Figura 15 – Fluxograma do método proposto.
(A porção pontilhada corresponde às etapas aplicadas a todos os níveis da pirâmide).
O desenvolvimento de todas as etapas mostradas na Figura 15 será
explicado em detalhes nas seções seguintes.
Estereopar de imagens coloridas
orientado
Normalização do estereopar
Pré-análise
Correspondência de pontos
Interseção fotogramétrica
MDT
Geração da pirâmide de imagens com n níveis
Controle de qualidade
Adensamento do modelo com exclusão de áreas de sombra
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
73
3.1.1 Orientação do estereopar de imagens coloridas
Para a aplicação do método proposto são utilizados estereopares de
imagens coloridas (RGB) obtidos por câmara digital. O fato de as imagens serem
obtidas em três bandas espectrais torna possível o cálculo do índice de detecção de
sombras, permitindo que as áreas de sombra sejam excluídas do processo de
correspondência de pontos para a geração de MDT’s. Além disto, os estereopares
devem ser devidamente orientados, uma vez que os parâmetros de orientação são
necessários para realizar as etapas subseqüentes do processo. Tais parâmetros
podem ser obtidos realizando a orientação do estereopar em sistemas
fotogramétricos digitais, tais como o Socet Set, LPS, DVP, Z/I Imaging SSK, ISM, 3D
Mapper, ErMapper, PCI, dentre outros. Neste trabalho, os parâmetros de orientação
exterior são obtidos através da triangulação do modelo no software LPS. Outra
forma de obtê-los é através do uso de sensores embarcados na plataforma, como as
Unidades de Medida Inercial - IMU (Inertial Measurement Unit) e os sistemas de
posicionamento global, que permitem a obtenção direta destes parâmetros.
3.1.2 Normalização
Uma vez obtidos os parâmetros de orientação exterior do
estereopar, realiza-se o processo de normalização ou reamostragem epipolar das
imagens. Para esta etapa, são utilizadas as funções disponíveis na biblioteca UPTk.
Estas funções seguem a formulação proposta na Seção 2.4.3.2. Ao aplicar tais
funções, obtêm-se, além das imagens transformadas para suas posições
normalizadas, as matrizes de rotação destas imagens. Estas matrizes são
necessárias em etapas posteriores para realizar a transformação inversa, ou seja,
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
74
para a obtenção das coordenadas nas imagens originais a partir das coordenadas
obtidas nas imagens normalizadas.
3.1.3 Pré-análise
O processo de pré-análise consiste na determinação da
potencialidade do processo de correlação, verificando se o ponto em questão é ou
não um ponto de interesse para a correspondência. A pré-análise é aplicada em
todos os níveis da pirâmide de imagens. Para a execução desta etapa, foram
elaborados métodos de acordo com a formulação proposta na seção 2.4.4. Na
seqüência são mostrados os passos necessários para a realização deste
procedimento. Ressalta -se que a obtenção da estimativa dos parâmetros de
translação do processo de correlação é realizada a priori, ou seja, antes que a
correlação seja efetivamente calculada. Assim, esta etapa envolve somente a
imagem esquerda do estereopar.
Para cada janela de referência selecionada ao longo do modelo, são
calculados os seguintes elementos:
1. A matriz variância e covariância (MVC) dos parâmetros de translação da
correlação (Equação 36);
2. A variância da janela de referência; e
3. Somatórios dos gradientes nas linhas, nas colunas e cruzado (nas linhas e
colunas).
Obtida a MVC dos parâmetros de translação da correlação, calcula -
se seu traço, ou seja, a soma das variâncias das translações nas direções x e y.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
75
Realizados estes cálculos, estabelece-se um critério para decidir se
a janela de referência em questão será aceita ou rejeitada. Assim, rejeita-se uma
janela de referência se:
1. o traço da MVC dos parâmetros de translação da correlação for maior que o
traço máximo ou
2. a variância da janela de referência for menor que a variância mínima, ou
3. os somatórios dos gradientes nas linhas, nas colunas e cruzado forem nulos.
Desta forma, para que uma janela de referência seja rejeitada, basta
que apenas um dos itens acima seja satisfeito. Em contrapartida, para aceitá-la, é
necessário que nenhum item seja satisfeito. Nota-se que este critério envolve o uso
de limiares pré-estabelecidos para os dois primeiros itens. A obtenção destes
limiares baseia-se em testes realizados em pontos estratégicos das imagens, tais
como regiões homogêneas, bordas, entre outras.
3.1.4 Determinação de áreas de exclusão
Na seção 2.3 foram mostrados dois índices que permitem a
separação de alguns alvos em imagens aéreas coloridas, um para separar alvos
naturais dos artificiais e outro para a detecção de sombras. A idéia inicial deste
trabalho era calcular os dois índices para as imagens e criar um filtro utilizado para
excluir as regiões de sombra e as edificações do processo de correspondência. Os
procedimentos adotados são mostrados nas seções 3.1.4.1 e 3.1.4.2.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
76
3.1.4.1 Exclusão de áreas de sombra
Como mostrado na seção 2.3.2, a detecção de sombras em imagens
coloridas utiliza as componentes intensidade e saturação do modelo de cores HSI.
Para obter estas componentes, realiza-se a transformação das imagens do modelo
de cores RGB para o modelo HSI, utilizando as Equações 02 e 03. Uma vez obtidas
as imagens no modelo HSI, realiza-se o cálculo do índice detector de sombras
(Equação 04), que consiste na subtração, pixel a pixel, entre as componentes
intensidade e saturação.
Após o cálculo deste índice para todos os pixels da imagem, as
sombras se tornam mais escuras que os demais alvos, permitindo sua fácil
separação. Desta forma, a partir de um limiar pré-estabelecido, é gerada uma nova
imagem binária onde as sombras são caracterizadas por valor de brilho nulo e os
demais alvos com valor de brilho máximo. Esta imagem é o filtro utilizado para a
correspondência, evitando que ela seja realizada nestas áreas de sombras pré-
determinadas. Este procedimento será explicado na seção 3.1.5. Entretanto, ao
contrário do processo de pré-análise que é aplicado em todos os níveis da pirâmide
de imagens, este procedimento é aplicado somente no nível das imagens originais.
3.1.4.2 Exclusão de edificações
Foram realizados testes preliminares com o índice de artificialidade
proposto por Polidorio et al., (2003) e expresso pela Equação 05. Entretanto,
surgiram algumas dificuldades na aplicação deste índice. Primeiramente, não foi
possível adotar limiares para a separação satisfatória dos alvos naturais e artificiais.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
77
Outra dificuldade encontrada foi a separação dos alvos artificiais que se encontram
no terreno, tais como vias, calçadas, entre outros, das edificações, uma vez que
todos estes alvos seriam rotulados da mesma forma. Diante de tais dificuldades,
este procedimento não foi incorporado ao método. Visto que a detecção de alvos
artificiais é um assunto amplo e complexo, o desenvolvimento de uma metodologia
adequada para este processo não se inclui no escopo deste trabalho.
3.1.5 Transformação das imagens coloridas em tons de cinza
Uma vez obtido o filtro para a detecção de sombras, as imagens do
estereopar, que são coloridas, são convertidas para tons de cinza para a realização
das demais etapas. Isto é feito utilizando a conversão da imagem RGB para a
imagem de luminância, que pode ser obtida através da aplicação da Equação 40
(GONZALEZ e WOODS, 2000).
Ci = 0,299.R i + 0,587.Gi + 0,114.B i
Cada pixel i da imagem em tons de cinza (C) é obtido a partir de
uma determinada porcentagem das bandas R, G e B do respectivo pixel i na imagem
colorida.
3.1.6 Geração da pirâmide de imagens
Uma vez obtidas as imagens normalizadas em tons de cinza, é feita
a geração da pirâmide de imagens para o estereopar. Para a execução deste
processo, também são utilizadas as funções disponíveis na biblioteca UPTk.
(40)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
78
Para cada nível da pirâmide que se pretende gerar, são realizados
dois procedimentos:
1. Convolução das imagens do estereopar por um filtro Gaussiano; e
2. Reamostragem da imagem para a metade da resolução da imagem anterior.
Uma vez executados estes dois passos, as novas imagens do
estereopar são armazenadas em arquivos e o procedimento se repete até que se
obtenha o número de níveis desejados para a pirâmide.
A máscara de convolução Gaussiana utilizado neste procedimento é
mostrada na Equação 41.
=
121242
121
161
Máscara
No processo de reamostragem das imagens, o valor de brilho de
cada pixel da imagem é obtido pela média aritmética dos quatro pixels que
correspondem a ele na imagem suavizada.
3.1.7 Correspondência de pontos
Uma vez obtida a pirâmide de imagens do estereopar normalizado,
inicia-se o processo de correspondência de pontos. O método adotado neste
trabalho é a correlação baseada em áreas (area-based matching), explicada na
seção 2.4. Para iniciar o processo, são necessários alguns valores para o controle
da correlação.
(41)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
79
Assim, são fornecidos ao programa os seguintes parâmetros para
cada nível da pirâmide de imagens:
§ traço máximo da MVC das translações;
§ variância mínima aceita para janela de referência;
§ mínimo coeficiente de correlação a ser aceito no processo;
§ espaçamento entre as janelas de referência aceitas na pré-análise (Dx); e
§ espaçamento entre as janelas de referência rejeitadas na pré-análise (∆x).
Além destes valores, também são fornecidas ao programa as
coordenadas imagem dos cantos do modelo.
O método proposto neste trabalho para a obtenção dos pontos que
geram o MDT consiste nas seguintes fases:
1. Correlação na pirâmide de imagens;
2. Geração do mapa de paralaxes; e
3. Adensamento de pontos nas imagens originais.
Estas etapas serão detalhadas nas seções seguintes.
3.1.7.1 Correlação na pirâmide de imagens
A Figura 16 ilustra as etapas do processo de correlação utilizando a
pirâmide de imagens.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
80
Figura 16 – Correlação utilizando os n níveis da pirâmide de imagens.
A correlação se inicia no nível mais alto da pirâmide de imagens
(nível n), ou seja, no nível de resolução mais baixa. A varredura da imagem para a
Seleção da janela de referência
A janela atende aos critérios de
pré-análise?
Salva -se a correspondência
Chegou ao fim do modelo?
NÃO
SIM
NÃO
SIM
Nível n da pirâmide de imagens
Determinação do espaço de busca
Correspondência de pontos
Fim da varredura
Está no primeiro nível da pirâmide?
i = 1
Geração do mapa de paralaxes
Mapa de paralaxes
SIM
NÃO
Projeção das correspondências do ponto i
do nível anterior para o nível atual da pirâmide
Seleção da janela de referência no centro das coordenadas projetadas
A janela atende aos critérios de
pré-análise?
Seleção da janela de busca no centro das
coordenadas projetadas
Correspondência de pontos
Salva -se a correspondência
Chegou ao último ponto?
Fim da projeção de pontos
i pontos no nível n
n = n - 1
Coordenadas dos pontos no nível n-1 da pirâmide
SIM
NÃO
i=i+1
n=0?
NÃO Exclusão das
áreas de sombra
SIM
SIM
NÃO
i=i+1
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
81
obtenção dos pontos homólogos, no nível n, é realizada de acordo com o esquema
mostrado na Figura 17, onde (X i,Yi) com i={1,2,3,4} são as coordenadas dos cantos
da área de interesse para a extração do MDT.
Figura 17 – Varredura do modelo na imagem esquerda.
A primeira janela de referência (a) é selecionada no canto superior
esquerdo do modelo. Realiza-se então a pré-análise desta janela, verificando sua
potencialidade da correlação. A exclusão das sombras será realizada somente no
nível das imagens originais. Se esta janela for aceita na pré-análise, realiza-se a
correlação neste ponto com sua respectiva janela de busca. Feita a correlação,
analisa-se o valor obtido para o coeficiente. Se o valor for inferior ao valor mínimo
estabelecido este ponto não é aceito, caso contrário, a correlação é aceita e as
coordenadas dos pontos são salvas em arquivo. O próximo passo é estabelecer a
próxima janela de referência (b) a uma distância Dx em pixels da janela anterior que
foi aceita. Para a próxima janela, realizam-se os mesmos procedimentos. Caso a
janela de referência seja rejeitada na pré-análise (como a janela b), a correlação não
se realiza e a janela seguinte é estabelecida a uma distância ∆x em pixels da
anterior rejeitada. Caso o ponto seja aceito na pré-análise, porém, o coeficiente de
(x1,y1) (x2,y2)
(x4,y4) (x3,y3)
a b c d
e f g h
i j k l
m n o p
Dx ∆x
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
82
correlação obtido for inferior ao mínimo estabelecido, este ponto é descartado e a
janela de referência é deslocada ∆x pixels. O deslocamento ∆x é menor que Dx,
permitindo apenas uma pequena translação na varredura quando uma janela é
rejeitada. O processo se repete até a varredura alcançar o fim da linha. Desloca-se
então a janela de referência na direção das linhas de uma quantidade Dx pixels. Nas
linhas seguintes realizam-se os mesmos procedimentos até que a varredura alcance
a última linha do modelo. No exemplo da Figura 17, as janelas a, c, d, f, g, h, i, l, n, o,
p são aceitas e as janelas b, e, j, k, m são rejeitadas.
No nível n da pirâmide, a redução do espaço de busca é realizada
utilizando a formulação proposta na seção 2.4.3.3, que utiliza a paralaxe do ponto
anterior para determinar a janela da busca da janela seguinte. Uma vez terminada a
varredura no topo da pirâmide, tem-se um conjunto de coordenadas dos pontos que
foram correlacionados.
O próximo passo realizado é a projeção destas coordenadas para os
níveis inferiores, um a um, até atingir a base da pirâmide, ou seja, as imagens
originais. As coordenadas dos pontos no topo da pirâmide nas duas imagens são
multiplicadas por 2, obtendo-se as coordenadas (2xe,2ye) e (2xd,2yd), no nível
imediatamente abaixo do topo (nível n-1). Para realizar a correlação deste ponto no
nível n-1, seleciona-se a janela de referência no centro das coordenadas (2xe,2ye).
Se esta janela de referência for aceita na pré-análise, seleciona-se a janela de busca
no centro das coordenadas (2xd,2yd). Realiza-se então a correlação utilizando estas
janelas. Se o valor do coeficiente de correlação for maior que o coeficiente mínimo
estabelecido, se aceita a correlação e repete-se o processo para o próximo ponto
até projetar todos os pontos do nível n. As janelas que não forem aceitas pela pré-
análise ou cujos coeficientes de correlação forem inferiores ao valor mínimo
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
83
estabelecido são rejeitadas e, assim, não são projetadas para o próximo nível. De
maneira semelhante, as coordenadas do nível n-1 são projetadas para o nível n-2, e
assim por diante, até se atingir o nível 0, ou seja, as imagens originais. No nível 0 da
pirâmide, além da pré-análise que se repete em todos os níveis, é feita a exclusão
de áreas de sombra. Esta exclusão só é realizada no nível das imagens originais
uma vez que nas imagens suavizadas o cálculo do índice de detecção de sombras
seria prejudicado.
Ressalta-se que no processo de projeção são descartados pontos
em um nível n-1 que foram aceitos em um nível n. Isto se deve ao fato de que as
imagens vão se tornando cada vez mais detalhadas à medida que imagens próximas
à base da pirâmide (menores níveis) são processadas. Desta forma, pontos
potencialmente ruins que são correlacionados no topo da pirâmide podem ser
detectados e descartados nos níveis subseqüentes.
3.1.7.2 Geração do mapa de paralaxes
Ao término da projeção dos pontos para as imagens originais,
obtém-se um conjunto de coordenadas nas imagens originais. Este conjunto de
pontos é utilizado na geração do mapa de paralaxes, que consiste em uma
estrutura, com a mesma dimensão do modelo, que armazena valores de paralaxe
aproximada para todos os pontos a ele pertencentes. Desta forma, sabe-se, à priori,
a paralaxe aproximada de cada ponto do modelo. A Figura 18 ilustra este conjunto
de pontos.
O objetivo do mapa de paralaxes é reduzir o espaço de busca para a
próxima etapa do processo, que é a varredura das imagens originais. Assim, quando
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
84
um ponto for selecionado na imagem esquerda, é possível saber sua posição
aproximada na imagem direita através da consulta ao mapa de paralaxes naquela
determinada posição.
Figura 18 – Conjunto de pontos projetados dos níveis anteriores para a base da pirâmide.
Para gerar o mapa de paralaxes, são realizadas interpolações
lineares entre os pontos conhecidos, mostrados na Figura 18. O processo se inicia
com a seleção dos dois primeiros pontos do modelo e o cálculo de suas paralaxes.
Interpola-se linearmente as paralaxes para todos os pixels entre estes pontos. Em
seguida, o próximo ponto é selecionado e os procedimentos são repetidos. Ao
terminar a linha, parte-se para a próxima linha com valores conhecidos. Desta forma,
todas as linhas que possuíam valores de paralaxe conhecidos, marcados em
vermelho na Figura 19, ficam com todas as colunas interpoladas, como também
pode ser visto na Figura 19. Para os pontos anteriores ao primeiro ponto e
posteriores ao último ponto de cada uma das linhas, os valores de paralaxe são
replicados.
(x2,y2) (x1,y1)
(x4,y4) (x3,y3)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
85
Figura 19 – Pontos interpolados nas linhas com paralaxes conhecidas.
Após interpolar todos os pixels ao longo das linhas que possuíam
pontos com paralaxe conhecida, interpola-se as linhas vazias utilizando as linhas
diretamente acima e abaixo da linha em questão. A Figura 20 mostra os pixels
interpolados entre a primeira e a segunda linha com paralaxes conhecidas. Os pixels
marcados em verde foram utilizados para a interpolação de cada coluna neste
intervalo de linhas.
Figura 20 – Pontos interpolados entre as duas primeiras linhas com paralaxes conhecidas.
(x2,y2) (x1,y1)
(x4,y4) (x3,y3)
(x2,y2) (x1,y1)
(x4,y4) (x3,y3)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
86
Assim como nas colunas, os pontos acima da primeira linha com
valores conhecidos e abaixo da última linha são replicados.
Antes de utilizar dois pontos para realizar a interpolação, é calculada
a declividade entre estes dois pontos (α) através da relação expressa na Equação
42.
−−
=α+
+
i1i
i1i
xxpxpx
arctg
onde: pxi e pxi+1 são as paralaxes dos pontos em pixels; e
(xi -xi+1) é a distância entre os dois pontos em pixels.
Assim, pontos com declividade maior que um limite pré-estabelecido
são desconsiderados no processo de interpolação.
Terminadas as interpolações, o mapa de paralaxes está completo e
pronto para ser utilizado na etapa seguinte.
3.1.7.3 Adensamento de pontos nas imagens originais
O adensamento de pontos nas imagens originais é executado
fazendo uma varredura das imagens originais semelhante à realizada no topo da
pirâmide, mostrada na Figura 17. A diferença entre os processos é que a redução do
espaço de busca nesta etapa é realizada utilizando o mapa de paralaxes. A Figura
21 ilustra este processo.
(42)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
87
Figura 21 – Redução do espaço de busca utilizando o mapa de paralaxes.
Para um determinado ponto (xe,ye) aprovado pela pré-análise na
imagem esquerda, consulta -se no mapa de paralaxes qual é a paralaxe (px)
aproximada para aquele ponto. Obtido o valor da paralaxe, estima-se a posição
central da janela de busca, bem como seus extremos, na imagem direita, com base
na Equação 22.
A varredura das imagens originais utilizando o mapa de paralaxes
para a redução do espaço de busca é realizada seguindo o esquema mostrado na
Figura 22.
Outro fator que difere esse processo de varredura do processo
realizado nas imagens do topo da pirâmide é que além da pré-análise que permite a
exclusão de áreas com baixa potencialidade para a correlação, também é realizada
a exclusão das áreas de sombra. Assim, cada janela de referência aceita para a
correlação possui alto potencial e nenhum pixel de sombra.
x x
xe
px Y Y
ye ym
xm
yd
Y
x xd
Imagem esquerda Mapa de paralaxes Imagem direita
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
88
Figura 22 – Varredura das imagens originais utilizando o mapa de paralaxes para a redução do
espaço de busca.
O conjunto de pontos resultante desta etapa, após passar por um
controle de qualidade, será usado para a geração do Modelo Digital de Terreno.
Este controle de qualidade será explicado na seção 3.1.10.
Coordenadas dos pontos ao longo do modelo nas imagens originais
Mapa de paralaxes
Seleção da janela de referência
A janela atende aos critérios de
pré-análise?
Salva -se a correspondência
Chegou ao fim do modelo?
NÃO
SIM
NÃO
SIM
Imagens originais
Redução do espaço de busca
Determinação dos pontos homólogos
Fim da varredura
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
89
3.1.8 Interseção fotogramétrica
Obtidas as coordenadas imagens dos pontos ao longo do modelo na
base da pirâmide, faz-se necessário realizar a transformação destas coordenadas
para o espaço objeto. Este procedimento é realizado utilizando uma função da
biblioteca UPTk, que segue a formulação proposta na seção 2.4.5.
As coordenadas imagem obtidas nas etapas anteriores estão no
referencial das imagens normalizadas, e portanto, já corrigidas dos erros
sistemáticos da imagem. Para gerar o MDT, é necessário que estas coordenadas
sejam transformadas para o sistema de referência das imagens originais. Assim, o
primeiro passo realizado é esta transformação, expressa pela Equação 18. Os
elementos necessários para este cálculo são as matrizes de rotação do estereopar
de imagens obtidas na etapa de normalização. Como mencionado na seção 3.1.2,
estas matrizes são fornecidas pela função de normalização.
Uma vez disponíveis as coordenadas dos pontos transformadas
para o sistema de referência das imagens originais, calcula-se a posição
tridimensional de cada ponto no espaço objeto, obtendo assim o conjunto de pontos
que formam o MDT.
3.1.9 Controle de qualidade
Como mostrado na seção 2.6, a etapa do controle de qualidade é de
fundamental importância na geração de MDT’s. Neste trabalho são feitos dois tipos
de controle: o interno e o externo. Ambos os controles serão explicados nas seções
seguintes.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
90
3.1.9.1 Controle interno
Apesar de todos os cuidados tomados e todas as restrições
impostas ao processo de correspondência, ele, geralmente, ainda apresenta falhas.
Assim, deve-se estabelecer uma forma de tentar eliminar do conjunto de dados
obtidos os pontos que apresentarem comportamento muito diferente dos demais.
Neste caso, assume-se que os comportamentos muito diferentes em Z, em uma
determinada vizinhança, sejam provocados por problemas de correspondência.
Existem inúmeras formas de realizar este controle. Neste trabalho, o
controle realizado consiste em uma análise de vizinhanças. Para um determinado
ponto i em uma linha que se deseja testar, seus vizinhos próximos nesta linha são
utilizados para o ajuste de uma função. Desta forma, pode-se comparar a paralaxe
deste ponto obtida pela correspondência com um valor de paralaxe interpolado
através de uma função ajustada numa certa vizinhança deste ponto. Pela análise da
diferença entre estes dois valores de paralaxe e dos resíduos do ajuste da função
este ponto é ou não eliminado do MDT.
A Figura 23 ilustra o conjunto de pontos obtidos em uma linha da
região de interesse com o término do adensamento das imagens originais.
Figura 23 – Distribuição dos pontos correlacionados na etapa de adensamento ao longo de uma linha
da área de interesse.
Devido ao descarte de vários pontos pelas etapas de pré-análise e
de exclusão de áreas de sombra existe uma irregularidade na distribuição dos
(X2,Y2) (X1,Y1)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
91
pontos obtidos no adensamento ao longo das colunas de cada linha. Como o
controle interno proposto neste trabalho é baseado em vizinhança, a primeira etapa
a ser realizada para o controle de um ponto é o teste de vizinhança. Caso um
determinado ponto não possua vizinhos próximos, ele não pode ser controlado.
As situações em que o controle interno para um determinado ponto é
realizado podem ser observadas na Figura 24.
Figura 24 – Situações onde o controle de qualidade interno pode ser aplicado.
Na Figura 24, os pontos azuis são os que se pretende controlar.
Nota-se, portanto, que existem 3 situações onde a geometria de distribuição dos
pontos permite que o controle seja realizado.
Na primeira situação, existem 4 pontos próximos aos seus vizinhos,
2 à esquerda e 2 à direita do ponto a ser controlado. Esta é a situação ideal para o
controle. É realizado o ajuste de uma função quadrática utilizando as paralaxes
destes 4 pontos. Esta função quadrática é expressa pela Equação 43.
2cxbxa)x(f ++=
Situação 1
Situação 2
Situação 3
(43)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
92
Uma vez obtidos os parâmetros desta função, onde x representa a
coluna, é estimado o valor da paralaxe (f(x)) do ponto a ser controlado. Se a
diferença entre a paralaxe estimada e a paralaxe conhecida para este ponto for
maior que uma tolerância pré-estabelecida, este ponto é eliminado do conjunto de
dados. Caso contrário, ele é mantido. O cálculo da tolerância para a eliminação dos
pontos será mostrado na seqüência.
Já na segunda e na terceira situações, existe um ponto cuja
distância ao ponto vizinho é maior que uma distância máxima pré-estabelecida.
Nestas situações, os pontos distantes não são utilizados para o ajuste da função.
Como pode ser visto na Figura 25, na situação 2, descarta-se o ponto que está
distante (vermelho) e utiliza-se um ponto anterior ao primeiro (verde), caso a
distância entre este e seu vizinho também seja menor que a distância máxima pré-
estabelecida. Na situação 3, o ponto distante também é descartado (vermelho) e é
utilizado um ponto posterior ao último (verde), caso este ponto também não seja
distante de seu vizinho. Nestes novos conjuntos de 4 pontos, realiza-se o ajuste da
função quadrática de maneira análoga ao processo descrito para a situação 1.
Figura 25 – Situações onde existe um ponto muito distante do ponto a ser controlado.
Entretanto, os novos pontos adotados na Figura 25 também podem
estar a uma distância maior que a distância máxima pré-determinada dos seus
Situação 2
Situação 3
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
93
vizinhos. Caso isso ocorra, eles também são descartados e, como não é mais
possível obter um conjunto de 4 pontos para o ajuste de uma superfície quadrática,
utiliza-se somente os 3 pontos próximos para o ajuste de uma função linear, como
pode ser visto na Figura 26.
Figura 26 – Situações onde é realizado o ajuste de uma função linear.
A função linear utilizada nestas situações é expressa através da
Equação 44 (equação da reta).
bxa)x(f +=
Para pontos cujos vizinhos possuem outras geometrias de
distribuição, o controle interno não pode ser realizado.
O ajuste das funções quadráticas e lineares para o controle dos
pontos é realizado utilizando o método paramétrico de ajustamento de observações
sem iterações, descrito por Gemael (1994).
Para cada ponto controlado, são obtidos dois valores: a paralaxe
interpolada utilizando a função ajustada e a variância à posteriori do ajustamento,
que é função dos resíduos das observações, como pode ser visto na Equação 45.
Situação 2
Situação 3
(44)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
94
unPVV
ˆT
20 −
=σ
onde: V é o vetor dos resíduos;
P é a matriz peso;
n é o número de observações ajustadas; e
u é o número de parâmetros ajustadas.
Neste caso, a matriz peso é a matriz identidade, uma vez que é
considerado que todas as observações são não correlacionadas e possuem a
mesma precisão. A diferença entre o número de observações e o número de
parâmetros do ajustamento expressa os graus de liberdade do processo. Assim,
tanto para o ajuste da função quadrática, que possui 3 parâmetros, quanto para o
ajuste da função linear, que possui dois parâmetros, a diferença n-u, ou seja, o
denominador da Equação 45, é sempre igual a 1, uma vez que são usados 4 e 3
pontos para cada ajuste respectivamente. Assim, a Equação 45 pode ser
simplificada e reescrita na forma da Equação 46.
VVˆ T20 =σ
O fator de variância à posteriori será utilizado para o cálculo do
critério para a exclusão de pontos.
(45)
(46)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
95
3.1.9.1.1 Critério para a exclusão de pontos
Esta seção mostra o desenvolvimento de um critério para determinar
se um ponto deve ou não ser excluído do conjunto de pontos.
A Equação 47 expressa a diferença de paralaxe entre dois pontos
(WOLF, 1983).
Zhb
p∆⋅
=∆
Nota-se na Equação 47 que a diferença de paralaxe entre dois
pontos é calculada em função do desnível aproximado entre estes pontos ∆h, da
altura de vôo Z e da fotobase b, que pode ser calculada pela Equação 48.
pix
pix
tn
avb ⋅=
onde av é o avanço longitudinal entre as imagens;
npix é o número de pixels da imagem no sentido do vôo; e
tpix é o tamanho do pixel.
Considerando uma sobreposição de 60% entre as imagens
esquerda e direita do estereopar a variável av na Equação 48 pode ser escrita como
1-0,6. O valor da fotobase obtido utilizado a Equação 48 é expresso na mesma
unidade do tamanho do pixel. Para obter a fotobase em pixels, basta eliminar o
denominador da Equação 48. Desta forma, a Equação 47 pode ser reescrita na
forma da Equação 49.
(47)
(48)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
96
Z
hnavp pix ∆⋅⋅
=∆
Aplicando a Equação 49, o valor da diferença de paralaxe já é obtido
diretamente em pixels.
A tolerância do critério de exclusão de pontos utiliza a Equação 49.
Desta forma, torna-se possível eliminar pontos cuja diferença entre as paralaxes
exceda o valor calculado para uma determinada variação máxima de altitude.
Entretanto, também deve ser considerado algum tipo de informação
do ajustamento realizado no estabelecimento da tolerância devido ao fato de que
pode haver situações onde os pontos utilizados para o ajuste das funções estejam
incorretos ou onde os pontos estejam naturalmente espalhados em Z. Assim, a
tolerância deve associar a Equação 49 e o valor da variância à posteriori do
ajustamento, expressa pela Equação 46, que é função dos resíduos das
observações. Desta forma, definiu-se empiricamente um critério máximo para a
exclusão de pontos que é função destes dois elementos, como pode ser visto na
Equação 50.
)ˆ,p(fCritério 20σ∆≈
Com isso, para ajustes onde foram utilizados pontos incorretos como
observações, o valor da variância à posteriori é alto. Como conseqüência, não é
possível saber se o ponto testado é um ponto correto ou incorreto apenas pela
diferença de paralaxes. Assim, estabelece-se um valor máximo para a variância à
(49)
(50)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
97
posteriori ( 20máx
σ̂ ) baseado na distribuição Qui-quadrado e nos graus de liberdade do
ajustamento.
Em síntese, o critério para a exclusão de um ponto do conjunto de
dados pode ser estabelecido através das comparações estabelecidas na expressão
51.
Se |pinter – pcorr| > ∆pmáx e 20σ̂ > 2
0máxσ̂ à ponto excluído;
Se |pinter – pcorr| < ∆pmáx e 20σ̂ < 2
0máxσ̂ à ponto mantido.
Na expressão 51, p inter é o valor interpolado de paralaxe para o ponto
que está sendo testado e pcorr é o valor de paralaxe obtido por correlação, para o
mesmo ponto.
3.1.9.2 Controle externo
O controle externo do MDT é realizado utilizando dados externos de
referência do terreno, que sejam de exatidão superior a do modelo gerado. Desta
forma, torna-se possível comparar as coordenadas obtidas através do método
proposto com a realidade de terreno, ou seja, com o verdadeiro relevo da região em
questão.
Para este processo, podem ser utilizados MDT’s já existentes desta
região, em escala igual ou maior do que a do MDT que se pretende controlar. Além
disto, pode-se utilizar também pontos de controle existentes na região de interesse.
(51)
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
98
Neste trabalho, utiliza-se para este controle pontos extraídos
estereoscopicamente no modelo da região, orientado no sistema fotogramétrico
digital LPS (Leica Photogrametric Suite).
3.1.10 Interpolação da malha regular de pontos
Como já mencionado anteriormente, o conjunto de pontos que forma
o MDT possui uma geometria irregular ao longo das colunas, devido ao descarte de
vários pontos pela pré-análise e pela exclusão de áreas de sombra. Desta forma,
com o auxílio de um software, realiza-se a interpolação de uma malha regular de
pontos a partir do conjunto de pontos existente. Existe uma grande variedade de
softwares que realizam esta tarefa, tais como ArcView, Gnuplot, Spring, Surfer, entre
outros. Neste trabalho é usado o software Spring, versão 4.2, que é gratuito e se
encontra disponível para download no site do INPE (Instituto Nacional de Pesquisas
Espaciais). Foram geradas grades regulares para os experimentos realizados
utilizando interpolação por média ponderada.
Uma vez gerada a malha regular de pontos, pode-se realizar a
interpolação de isolinhas. Outra possibilidade é a geração de uma imagem em tons
de cinza que representa o relevo da região em questão através das diferentes
tonalidades.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
99
4 EXPERIMENTOS E RESULTADOS
Nesta seção serão mostrados os experimentos realizados utilizando
o método proposto, bem como os resultados obtidos.
4.1 DADOS UTILIZADOS
Para a realização dos experimentos foi utilizado um estereopar de
imagens proveniente de um vôo realizado sobre a cidade de Assis/SP, empregando
a câmara Hasselblad H1D. Este par de imagens faz parte de um bloco
fotogramétrico que possui as características abaixo.
§ Altura de vôo: 2230m;
§ Distância focal nominal da câmara: 50,00mm;
§ Resolução da imagem: 4080 x 5440 pixels;
§ Tamanho do sensor CCD: 36,7 x 49mm;
§ Tamanho do pixel na imagem: 0,009mm; e
§ Tamanho do pixel no terreno (GSD – Ground Sample Distance): 0,40m.
Foi realizada a calibração desta câmara para a obtenção dos
parâmetros de orientação interior. Esta calibração foi feita em um campo de testes à
curta distância, com a câmara focalizada para o infinito, tendo sido obtidos os
parâmetros mostrados na Tabela 1.
Tabela 1 – Parâmetros da calibração.
Parâmetro Valor obtido na calibração
Desvio padrão
Distância focal f 50,201mm 0,1128.10-1mm x0 -0,4111mm 0,5257.10-2mm Deslocamento do ponto
principal y0 0,1862mm 0,6543.10-2mm k1 -0,29162.10-4mm-2 0,3580.10-6mm-2 Coeficientes da distorção
radial simétrica k2 0,16623.10-7mm-4 0,9130.10-9mm-4
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
100
4.2 EXPERIMENTOS
O estereopar disponível foi orientado no sistema fotogramétrico
digital LPS para a obtenção dos parâmetros necessários à etapa de normalização.
Para esta orientação foram utilizados 9 pontos de apoio planimétricos extraídos de
uma ortoimagem e foi realizada a triangulação do estereopar. A altimetria foi extraída
de curvas de nível com eqüidistância de 5m já existentes da região, porém de
qualidade desconhecida.
Os parâmetros de orientação exterior para as imagens e seus
respectivos desvios-padrão estimados podem ser vistos na Tabela 2.
Tabela 2 – Parâmetros de orientação exterior das imagens e desvios padrão estimados. Imagem ω (°) ϕ (°) κ (°) XCP (m) YCP (m) ZCP (m) Esquerda 2,2971 -1,5541 0,1085 557136,601 7494614,489 2312,251
Direita 2,6256 -1,4508 -0,2310 557532,323 7494621,816 2314,921 Imagem σω (°) σϕ (°) σκ (°) σXCP (m) σYCP (m) σZCP (m) Esquerda 0,0229 0,0339 0,0171 1,0720 0,7794 0,6397
Direita 0,0232 0,0342 0,0170 1,0769 0,7770 0,5991
As figuras 27 e 28 mostram o estereopar de imagens originais.
Figura 27 – Imagem esquerda do estereopar. Figura 28 – Imagem direita do estereopar.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
101
Uma vez obtidos os parâmetros de orientação exterior, as imagens
foram normalizadas. As figuras 29 e 30 mostram o estereopar normalizado.
Figura 29 – Imagem esquerda normalizada.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
102
Figura 30 – Imagem direita normalizada.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
103
Obtidas as imagens coloridas normalizadas, foi selecionada a área
de interesse no modelo para a realização dos experimentos. A área de interesse
selecionada possui 2250x2300 pixels e pode ser vista através de um recorte na
imagem normalizada esquerda, mostrado na Figura 31.
Figura 31 – Área de interesse na imagem esquerda normalizada.
Esta área foi escolhida por apresentar dois tipos distintos de regiões:
áreas rural e urbana. Além disto, apresenta uma grande quantidade de árvores.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
104
Não foi considerada a variação de relevo na região para a escolha
da área de interesse.
Obtida a área de interesse, foi realizada a detecção de sombras
nesta região. O resultado deste processo de detecção foi armazenado em uma
imagem que será utilizada posteriormente para a exclusão das áreas sombreadas do
processo de correspondência. A Figura 32 ilustra a imagem resultante, na qual as
sombras detectadas são mostradas na cor branca.
Figura 32 – Imagem resultante do processo de detecção de sombras.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
105
O limiar utilizado para a separação das sombras foi obtido através
da observação do efeito da aplicação do índice sobre os alvos da imagem. Pode-se
notar que as sombras se tornaram bem mais escuras que os demais alvos. Assim,
foi adotado o limiar de 90, na imagem gerada com a Equação 4, para detectar
sombras, ou seja, os pixels cujo valor de brilho são inferiores a 90 são rotulados
como sombra. Pode-se verificar na Figura 32 que este algoritmo se mostrou eficaz,
detectando inclusive os pixels de sombra presentes nas árvores. Isto se deve as
condições de iluminação no horário da aquisição da cena. Provavelmente, não será
em todas as situações que este algoritmo apresentará este resultado, ou seja, a
detecção de sombras em árvores.
Uma vez realizada a detecção de sombras, as imagens coloridas
foram convertidas para tons de cinza conforme a Equação 40 apresentada na seção
3.1.5. A partir destas imagens em tons de cinza, foi gerada a pirâmide de imagens
com 4 níveis diferentes de resolução, sendo a imagem original a base da pirâmide. A
Figura 33 mostra o nível 4 da pirâmide de imagens.
(a) (b)
Figura 33 – Imagens esquerda (a) e direita (b) do nível 4 da pirâmide de imagens.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
106
Obtidos todos estes dados, foram realizados alguns experimentos,
de acordo com o método apresentado e detalhado no Capítulo 3. Nestes
experimentos foram testadas diferentes estratégias de correlação, que serão
descritas a seguir.
Para todos os experimentos serão adotadas as notações para os
parâmetros, conforme mostra o Quadro 2.
Quadro 2 – Notações adotadas nos experimentos. Parâmetro Notação 1 Dimensão da janela de referência djr
2 Espaçamento entre as janelas de referência aceitas na pré-análise Dx 3 Espaçamento entre as janelas de referência rejeitadas na pré-análise ∆x 4 Mínimo coeficiente de correlação a ser aceito no processo coefmín
5 Traço máximo da MVC das translações Trmáx
6 Variância mínima aceita para janela de referência Varmín
Os parâmetros 5 e 6 do Quadro 2, referentes à pré-análise do
processo de correlação, são obtidos com base em testes realizados para algumas
regiões das imagens onde se sabe, à priori, se o processo de correlação é bem ou
mal sucedido e são válidos para as imagens utilizadas neste trabalho.
4.2.1 Experimento 1
Para este experimento, foram considerados os valores descritos na
Tabela 3 para os parâmetros de controle da correlação.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
107
Tabela 3 – Parâmetros adotados para o experimento 1. Níveis da pirâmide de imagens
Parâmetros 4 3 2 1 Base Base (adensamento)
djr (pixels) 9 9 9 11 13 13 Dx (pixels) 1 - - - - 5 ∆x (pixels) 1 - - - - 1 coefmín 0,80 0,80 0,80 0,80 0,80 0,80
Trmáx (pixels2) 0,09 0,09 0,09 0,09 0,09 0,09 Varmín 100 100 100 100 100 100
Como este experimento considera uma janela de referência grande
no nível da base da pirâmide, o valor do coeficiente de correlação mínimo aceitável
não pode ser muito elevado, devido à diferença entre as janelas de referência e de
busca ocasionada pela presença de distorções geométricas nas imagens.
O número de pontos selecionados automaticamente como
correspondentes, para cada um dos níveis da pirâmide, inclusive para a base, pode
ser visto na Tabela 4.
Tabela 4 – Número de pontos projetados ao longo da pirâmide no experimento 1. Níveis da pirâmide de imagens 4 3 2 1 Base
Número de pontos projetados em cada nível 12168 10609 8904 7625 2818
Nota-se que o número de pontos diminui muito ao longo da projeção
para os níveis inferiores da pirâmide. Isto se deve ao fato de que a pré-análise é
aplicada em todos os níveis. Além disto, no nível da base a redução no número de
pontos é bem maior devido à exclusão de áreas de sombra apenas neste nível da
pirâmide.
Os pontos correlacionados no nível 4 da pirâmide estão marcados
em amarelo na Figura 34.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
108
Imagem esquerda Imagem direita
Figura 34 – Pontos correlacionados na área de interesse no nível 4 da pirâmide.
A varredura de pontos nas imagens do nível 4 é feita pixel a pixel, e
para este nível de resolução, quase todos os pontos são aceitos para a correlação,
salvo aqueles que possuíam baixa potencialidade detectada pelo processo de pré-
análise.
Nota-se na Figura 34 que a área rural neste nível foi toda excluída
pelo processo de pré-análise. Pequenos detalhes nesta área que poderiam ser
pontos potenciais para a correlação são perdidos devido ao processo de suavização
que ocorre na geração da pirâmide de imagens. Também devido à suavização das
imagens, a região com alta densidade de árvores tornou-se homogênea e, portanto,
também foi descartada pela pré-análise.
Os pontos correlacionados nas imagens esquerda e direita da base
da pirâmide podem ser vistos nas Figuras 35 e 36, respectivamente.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
109
Figura 35 – Pontos correlacionados na área de interesse na imagem esquerda da base da pirâmide.
Figura 36 – Pontos correlacionados na área de interesse na imagem direita da base da pirâmide.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
110
Nota-se através das Figuras 35 e 36 que os pontos nas áreas de
sombra, que foram selecionados no nível 4 da pirâmide, são descartados na base.
Uma vez que a projeção alcançou a base da pirâmide, foi gerado o
mapa de paralaxes com os pontos mostrados nas Figuras 35 e 36. A partir dos
valores de paralaxes interpoladas no mapa foi gerada uma imagem, permitindo
assim sua visualização. Esta imagem pode ser observada na Figura 37.
Figura 37 – Imagem gerada a partir do mapa de paralaxes.
Ao observar a Figura 37 pode-se perceber mudanças abruptas de
tons de cinza. Para gerar a imagem, o menor valor de paralaxe recebeu o tom de
cinza 0 e o maior valor 255. Como a diferença entre estes valores máximo e mínimo
de paralaxe não foi grande, pequenas variações de paralaxe causam grandes
variações de tom de cinza na imagem do mapa de paralaxes. Além disto, a análise
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
111
visual desta imagem é prejudicada devido a sua baixa resolução, uma vez que ela
representa o mapa de paralaxe de toda a área de interesse.
Uma vez obtido o mapa de paralaxes, foi realizado o adensamento
do modelo com a varredura das imagens originais. O adensamento resultou em um
total de 40955 pontos correlacionados. Depois de adensado, foi realizado o controle
interno no modelo gerado. Foram realizados testes considerando dois desníveis
como limiares para a exclusão de pontos potencialmente errados ou edificações e
árvores. Os dois desníveis considerados entre os pontos foram de 5 metros e de 1
metro, aplicados conforme explicado na seção 3.1.9.1.1. O desnível de 5 metros foi
aplicado com a intenção de eliminar apenas edificações mais altas que este limiar.
Já o desnível de 1 metro foi aplicado com o intuito de suavizar o modelo. Por
propagação de erros (KRAUSS, 1993), pode-se estimar o erro em altitude associado
somente à paralaxe de um determinado ponto, ou seja, ao erro de medida de um
ponto. Considerando um erro de meio pixel na medida do ponto, o erro em altitude
associado à essa medida é da ordem de 0,4 metro. Já para um erro de um pixel na
medida do ponto, o erro estimado em altitude é de aproximadamente 0,8 metro,
valor muito próximo do adotado no controle para desnível de 1 metro entre os
pontos. Desta forma, o controle considerando 1 metro de desnível entre os pontos é
bem mais rigoroso que o controle considerando 5 metros.
A Figura 38 mostra os pontos correlacionados em uma região após o
adensamento do modelo. A Figura 39 mostra os pontos correlacionados após a
realização do controle interno, considerando desnível de 5 metros entre os pontos e
a Figura 40 considerando desnível de 1 metro.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
112
Imagem esquerda
Imagem direita
Figura 38 – Pontos correlacionados em uma região da área de interesse.
Imagem esquerda
Imagem direita
Figura 39 – Pontos correlacionados após controle interno para desnível de 5 metros.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
113
São marcadas com um retângulo vermelho na Figura 38 algumas
regiões onde a correlação foi mal-sucedida.
Pode-se notar que o controle interno, utilizando desnível de 5
metros, não excluiu os pontos marcados como errados na Figura 38.
Imagem esquerda
Imagem direita
Figura 40 – Pontos correlacionados após controle interno para desnível de 1 metro.
Ao observar o resultado do controle interno utilizando desnível de 1
metro, nota-se que restaram apenas 3 pontos incorretos, na região selecionada mais
à esquerda na Figura 38. Entretanto, percebe-se também que foram eliminados
alguns pontos corretos. Assim, ao aumentar o rigor do controle interno, deve-se
atentar para a possibilidade de eliminar pontos cuja correspondência é correta.
As Figuras 41, 42 e 43 ilustram um outro exemplo em uma região
urbana da área de interesse.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
114
Imagem esquerda Imagem direita
Figura 41 – Pontos correlacionados em uma região da área de interesse.
Imagem esquerda Imagem direita
Figura 42 – Pontos correlacionados após controle interno para desnível de 5 metros.
Pela Figura 41, nota-se que os pontos dentro do retângulo vermelho
estão correlacionados incorretamente. Aplicando o controle interno para desníveis
de 5 metros, foram eliminados alguns destes pontos, como pode ser visto na Figura
42. Entretanto, ainda restam pontos errados.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
115
Imagem esquerda Imagem direita
Figura 43 – Pontos correlacionados após controle interno para desnível de 1 metro.
Com o limiar de 1 metro, foram descartados quase todos os pontos
errados dos retângulos vermelhos da Figura 41. Entretanto, também foram
eliminados mais pontos corretos quando comparado ao controle interno com limiar
de desnível de 5 metros. Pode-se notar que, neste caso, foram eliminados mais
pontos nas edificações mesmo quando estes pontos estão corretos, também quando
comparado ao controle interno de 5 metros. Este fato é um ponto positivo uma vez
que as edificações não devem estar presentes em MDT’s.
A Tabela 5 mostra o número de pontos obtidos após a aplicação de
cada um dos controles internos.
Tabela 5 – Número de pontos correlacionados após o controle interno
Controle interno Adensamento 5 metros 1 metro
Número de pontos 40955 40472 37599
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
116
4.2.2 Experimento 2
Para este experimento, foram considerados os valores descritos na
Tabela 6 para os parâmetros de controle da correlação.
Tabela 6 – Parâmetros adotados para o experimento 2.
Níveis da pirâmide de imagens
Parâmetros 4 3 2 1 Base Base (adensamento)
djr (pixels) 7 7 7 7 9 9 Dx (pixels) 1 - - - - 5 ∆x (pixels) 1 - - - - 1 coefmín 0,90 0,90 0,90 0,90 0,90 0,90
Trmáx (pixels2) 0,09 0,09 0,09 0,09 0,09 0,09 Varmín 100 100 100 100 100 100
Ao contrário do experimento 1, este experimento considera uma
janela de referência pequena no nível da base da pirâmide, o que induz a escolher
um valor maior para o coeficiente de correlação mínimo aceitável, devido à menor
influência das distorções geométricas nas janelas de referência e de busca.
O número de pontos correlacionados em todos os níveis, após o
término da projeção para a base da pirâmide, é apresentado na Tabela 7.
Tabela 7 – Número de pontos projetados ao longo da pirâmide no experimento 2. Níveis da pirâmide de imagens 4 3 2 1 Base
Número de pontos projetados em cada nível 10938 8630 6358 4323 1686
É nítida a diminuição no número de pontos obtidos neste
experimento, quando comparado ao Experimento 1. Isto se deve ao aumento de
10% no valor do mínimo coeficiente de correlação a ser aceito.
Os pontos correlacionados no nível 4 da pirâmide estão marcados
em amarelo na Figura 44.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
117
Imagem esquerda Imagem direita
Figura 44 – Pontos correlacionados na área de interesse no nível 4 da pirâmide.
Como a janela de referência neste experimento é menor, nota-se
que, ao comparar com as imagens da Figura 34, são detectadas regiões
homogêneas de menor tamanho.
Os pontos correlacionados nas imagens esquerda e direita da base
da pirâmide podem ser vistos nas Figuras 45 e 46, respectivamente.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
118
Figura 45 – Pontos correlacionados na área de interesse na imagem esquerda da base da pirâmide.
Figura 46 – Pontos correlacionados na área de interesse na imagem direita da base da pirâmide.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
119
A imagem gerada a partir do mapa de paralaxes para este
experimento é apresentada na Figura 47.
De maneira semelhante ao procedimento realizado no Experimento
1, foi realizado o adensamento do modelo com a varredura das imagens originais,
resultando em um total de 34407 pontos correlacionados. Também foi realizado o
controle interno no modelo gerado, utilizando desníveis de 1 metro e 5 metros.
Figura 47 – Imagem gerada a partir do mapa de paralaxes.
O controle interno para os dois valores de desníveis apresentou o
mesmo comportamento explicado no Experimento 1. A Tabela 8 mostra o número de
pontos obtidos após a aplicação de cada um dos controles internos neste
experimento.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
120
Tabela 8 – Número de pontos correlacionados após o controle interno.
Controle interno Adensamento 5 metros 1 metro
Número de pontos 34407 33190 29592
4.2.3 Interpolação de malha regular de pontos
4.2.3.1 Curvas de nível de referência
Como o estereopar original foi orientado no LPS, foi possível utilizar
seu módulo de extração de MDT para gerar as curvas da região em questão. Assim,
pode-se estabelecer, inicialmente, uma comparação visual das curvas geradas nos
experimentos com as curvas geradas no software. No LPS foram gerados 3 modelos
com estratégias diferentes, mostrados nas Figuras 48, 49 e 50. Eles estão
sobrepostos à ortoimagem gerada no LPS, utilizando como referência a imagem
esquerda do estereopar original. As curvas de nível foram geradas automaticamente
com intervalo de 5 metros.
O primeiro modelo, cujas curvas de nível podem ser vistas na Figura
48, foi gerado sem nenhum tipo de restrição (como tamanho mínimo de curva,
exclusão de sombras, etc.). O segundo modelo, mostrado na Figura 49, foi gerado
considerando uma estratégia de suavização. Desta forma, foram eliminados pontos
muito diferentes dos vizinhos. Além disto, foram utilizados parâmetros diferentes
para a área urbana, o que permitiu que o algoritmo eliminasse pequenas curvas que
se formariam nesta região devido à elevação das edificações. O terceiro modelo de
referência foi gerado com um alto nível de suavização, como pode ser visto na
Figura 50. As curvas de nível que representam este modelo mostram somente a
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
121
tendência de desnível do terreno, desconsiderando quase toda a influência das
árvores e das edificações.
Figura 48 – Curvas de nível geradas no LPS – estratégia 1.
Figura 49 – Curvas de nível geradas no LPS – estratégia 2.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
122
Figura 50 – Curvas de nível geradas no LPS – estratégia 3.
A ortoimagem mostrada nas Figuras 48, 49 e 50 foi gerada
considerando as informações altimétricas do primeiro modelo, apresentado na
Figura 48.
4.2.3.2 Curvas de nível para os Experimentos 1 e 2
Uma vez gerados os MDT’s para os 2 experimentos, foi realizada a
interpolação de grade regular para cada um deles. Esta etapa foi realizada utilizando
o software Spring, versão 4.2. O método de interpolação utilizado foi a média
ponderada pela distância. Com este interpolador, o valor de cota de cada ponto da
grade é calculado a partir da média ponderada das cotas dos 8 vizinhos mais
próximos. São atribuídos pesos variados para cada ponto amostrado através de uma
função que considera a distância euclidiana do ponto cotado ao ponto da grade.
Geradas as grades regulares, foram criadas as curvas de nível da região, com
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
123
espaçamento de 5 metros. As curvas de nível para os dois modelos gerados no
Experimento 1, referentes ao controle interno com limiares de 5 metros e 1 metro de
desnível, podem ser vistas nas Figuras 51 e 52, respectivamente.
Figura 51 – Curvas de nível para o modelo do experimento 1 com limiar de desnível de 5 metros.
Figura 52 – Curvas de nível para o modelo do experimento 1 com limiar de desnível de 1 metro.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
124
Nestas figuras, as curvas estão novamente sobrepostas à
ortoimagem gerada no LPS com o modelo apresentado na Figura 48.
Pode-se notar que o comportamento das curvas de nível nas Figuras
51 e 52 são semelhantes. A diferença entre as duas é que, como o controle interno
com limiar de desnível de 1 metro descartou mais pontos nas edificações, a Figura
52 apresenta menos curvas pequenas referentes a estas áreas. Nota-se também
que as duas curvas principais nestas figuras são compatíveis com a tendência de
desnível do terreno, observada através das curvas da Figura 50. Além disto, o
comportamento das curvas nas árvores é diferente do comportamento das curvas
mostradas na Figura 48, ou seja, no modelo sem controle gerado pelo LPS. Isto se
deve ao fato de que o algoritmo de detecção de sombras, como já dito, permitiu a
exclusão de muitos pontos nas árvores, porém não todos. Assim, as curvas nas
árvores foram geradas somente com os pontos que não foram detectados, que
podem ser vistos na Figura 53. Nas áreas urbanas, assim como na Figura 48,
também foram geradas curvas referentes às elevações das edificações que não
foram eliminadas pelo controle interno.
A Figura 53 mostra, além das curvas já mostradas na Figura 51, os
pontos utilizados para a geração da grade, representados em amarelo.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
125
Figura 53 – Pontos utilizados para a geração da grade.
Pode-se perceber que existe um comportamento incorreto das
curvas à extrema esquerda e na parte inferior da área de interesse. Isto se deve a
erros no processo de interpolação, uma vez que os pontos na região foram excluídos
pelo algoritmo de pré-análise. Pode ser visto, nos retângulos vermelhos marcados
na Figura 53, que na área onde a interpolação foi mal-sucedida não existem pontos.
Além disto, nota-se que o comportamento irregular das curvas é influenciado por
pontos de árvores e edificações que não foram eliminados na geração do modelo.
As curvas de nível para os dois modelos gerados no Experimento 2,
referentes ao controle interno com limiares de 5 metros e 1 metro de desnível,
podem ser vistas nas Figuras 54 e 55, respectivamente.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
126
Figura 54 – Curvas de nível para o modelo do experimento 2 com limiar de desnível de 5 metros.
Figura 55 – Curvas de nível para o modelo do experimento 2 com limiar de desnível de 1 metro.
Como a janela de referência no Experimento 2 é menor, são aceitos
mais pontos nas árvores e nas edificações, o que altera o formato das curvas de
nível nestas regiões, quando comparadas às curvas do Experimento 1. Quando
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
127
comparadas entre si, de maneira semelhante às curvas do Experimento 1, a Figura
55 referente ao controle interno com limiar de desnível de 1 metro apresenta menos
curvas pequenas devido às edificações do que a Figura 54.
A eliminação de curvas de nível pequenas pode ser feita em
procedimentos posteriores à sua geração, aplicando um processo de suavização.
4.2.4 Controle externo
A comparação entre as curvas de nível permite uma comparação
visual dos resultados obtidos. Entretanto, ainda se faz necessário um controle
externo numérico, ou seja, o cálculo de uma estatística que compare os produtos
gerados com dados de referência externos.
Desta forma, uma vez que não se dispõe de pontos de apoio
medidos em campo, na região de trabalho, foram medidos manualmente alguns
pontos no modelo estereoscópico orientado no LPS para serem usados como dados
de referência externa. Não foram utilizados pontos dos MDT’s gerados
automaticamente no LPS uma vez que, no processo de geração da grade, existe o
processo de interpolação. Assim, estariam sendo utilizados pontos interpolados para
o controle, o que não é desejado.
Foram controlados os modelos gerados nos Experimentos 1 e 2 com
controle interno considerando limiar de 1 metro para os desníveis. Considerando
como valor de referência as coordenadas medidas no LPS, foi calculado o erro
médio quadrático dos modelos.
Para a realização deste controle foram medidos pontos, no terreno,
em regiões com três características distintas: regiões sem árvores e edificações,
regiões com árvores, e regiões com edificações. No total foram medidos 24 pontos,
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
128
8 em cada região. Foram calculados então quatro erros médios quadráticos (EMQ):
um considerando todos os 24 pontos juntos e um para cada região individualmente,
considerando 8 pontos.
A Tabela 9 mostra as elevações de referência e as obtidas por
interpolação nas grades geradas para os modelos dos Experimentos 1 e 2. Além
disto, apresenta a diferença entre esses valores. A Tabela 10 apresenta a média e o
desvio padrão das diferenças entre os valores de referência e os valores obtidos,
bem como os erros médios quadráticos calculados para as regiões individualmente e
em conjunto.
Observando a Tabela 9, pode-se perceber que as maiores
diferenças entre os valores de referência e os interpolados são nas áreas onde há
presença de árvores.
Tabela 9 – Comparação dos Experimentos 1 e 2 com os dados de referência. Regiões sem edificações e árvores
Referência (m) Experimento 1 (m) Experimento 2 (m) Exp 1- Ref (m) Exp 2 – Ref (m)
571,361 573,625 574,662 2,264 3,301 572,111 575,027 575,005 2,916 2,894 571,611 574,022 573,799 2,411 2,188 568,528 570,617 570,575 2,088 2,047 565,150 567,598 567,583 2,448 2,433 568,525 570,445 570,437 1,920 1,912 565,746 567,079 567,085 1,333 1,339 568,228 566,889 566,854 -1,339 -1,374
Regiões com edificações Referência (m) Experimento 1 (m) Experimento 2 (m) Exp1 – Ref (m) Exp2 – Ref (m)
567,931 570,822 570,824 2,891 2,893 569,564 571,520 571,498 1,956 1,934 569,861 569,470 569,752 -0,391 -0,109 567,338 569,964 569,967 2,626 2,628 570,982 570,648 570,654 -0,334 -0,328 568,179 569,009 569,013 0,830 0,833 570,001 570,992 571,008 0,991 1,007 568,600 570,055 570,042 1,455 1,442
Regiões com árvores Referência (m) Experimento 1 (m) Experimento 2 (m) Exp1 – Ref (m) Exp2 – Ref (m)
574,417 577,879 577,867 3,463 3,450
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
129
574,593 580,016 579,327 5,423 4,734 571,596 575,986 575,732 4,390 4,136 573,183 576,554 575,518 3,371 2,336 570,715 573,938 572,982 3,223 2,267 565,779 572,426 573,120 6,646 7,341 572,302 576,547 576,452 4,246 4,150 572,478 578,873 578,267 6,396 5,789
Tabela 10 – Estatísticas para os MDT’s dos Experimentos 1 e 2. Geral Áreas sem
edificações e árvores Áreas com edificações
Áreas com árvores
Exp 1 2,551 1,755 1,253 4,645 Média (m) Exp 2 2,468 1,842 1,288 4,275 Exp 1 1,973 1,331 1,229 1,360 Desvio (m) Exp 2 1,920 1,432 1,174 1,708 Exp 1 3,199 2,152 1,700 4,815 EMQ (m) Exp 2 3,102 2,277 1,692 4,564
Na Tabela 10, nota-se que o EMQ para as regiões sem edificações e
árvores é maior que o EMQ para as regiões onde existem edificações. Isto decorre
do fato de que nas áreas sem edificações e árvores, o processo de pré-análise
descartou muitos pontos, como pode ser observado na Figura 53. Desta forma, a
maioria dos pontos nestas regiões foram obtidos por interpolação. Nestas áreas,
poderiam ter sido utilizados critérios mais flexíveis para o processo de pré-análise.
Porém, fazendo isto, pontos problemáticos para a correspondência podem ser
aceitos, o que ocasionaria erros no modelo. Estes erros também seriam propagados
pelo processo de interpolação da grade. Assim, ao adotar os parâmetros para a pré-
análise, estas questões devem ser consideradas.
Na região com edificações, devido a grande quantidade de pontos
de interesse presentes no terreno, ele foi mais bem representado.
Quanto à região com presença de árvores, o EMQ é maior. Os
algoritmos de detecção de sombras e de controle interno não descartaram todas as
árvores. Assim, ao gerar a grade para o modelo, também são utilizadas as
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
130
coordenadas destes pontos para a interpolação. Além disto, as correspondências
realizadas nestes pontos têm grande chance de estarem erradas, uma vez que as
regiões de árvores são potencialmente problemáticas para a correlação.
Além destes fatos, nota-se na Tabela 10 que as médias das
discrepâncias entre os valores de referência e os valores dos experimentos é
diferente de zero, indicando a presença de tendência nestas coordenadas.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
131
5 CONSIDERAÇÕES FINAIS
5.1 CONCLUSÕES
Ao aplicar o método proposto na elaboração dos experimentos,
pode-se observar que os resultados obtidos foram satisfatórios.
A redução do espaço de busca é de extrema importância para o
sucesso da correlação, além de diminuir muito o esforço computacional do processo.
Na etapa de correspondência de pontos, pode-se notar que a redução do espaço de
busca foi realizada de maneira eficaz. Foram três as estratégias de redução do
espaço de busca utilizadas: o uso das imagens após a reamostragem epipolar
(imagens normalizadas), a pirâmide de imagens e o uso da paralaxe do ponto
anterior.
As imagens normalizadas permitiram que a busca em y para a
varredura se reduzisse a algumas linhas, o que não acontece nas imagens originais.
Também foi de grande utilidade no processo o uso das pirâmides de
imagens, utilizadas na geração do mapa de paralaxes. Ao realizar a
correspondência em imagens de menor resolução, o processo se torna mais rápido,
uma vez que as imagens possuem menor tamanho. Além disto, foi o processo de
projeção dos pontos ao longo dos níveis da pirâmide que permitiu a geração do
mapa de paralaxes, utilizado para a redução do espaço de busca em x na etapa de
adensamento no nível mais baixo da pirâmide.
Para a varredura do nível mais alto da pirâmide de imagens foi
utilizado o processo de redução do espaço de busca em x a partir da paralaxe do
ponto anterior. Este processo mostrou bons resultados, uma vez que o relevo da
região não apresenta mudanças abruptas e os pontos, na maioria das vezes, são
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
132
selecionados bem próximos aos anteriores. Para regiões onde existam variações
acentuadas de relevo, esta técnica pode apresentar problemas. Por esta razão
recomenda-se atribuir à variável declividade, um valor compatível com a declividade
máxima da região. Além disto, ressalta -se que o espaçamento entre os pontos para
a utilização desta técnica deve ser pequeno.
Além das estratégias de redução do espaço de busca, foram
utilizadas duas estratégias para a exclusão de regiões potencialmente problemáticas
para a correspondência: a pré-análise do processo de correlação e a detecção de
sombras.
Em todos os níveis da pirâmide de imagens foi utilizado o processo
de pré-análise da correlação. Este procedimento se mostrou eficaz e foi muito útil
para a exclusão de áreas potencialmente problemáticas para a correlação.
Entretanto, surgiram problemas de interpolação nas áreas homogêneas descartadas
pelo processo de pré-análise, uma vez que devido à presença de poucos pontos
obtidos nestas regiões, a maioria dos pontos da grade foi obtida por interpolação.
A utilização do índice de detecção de sombras também foi de
extrema importância. Para as imagens aéreas utilizadas nos experimentos, o índice
foi capaz de detectar os pixels de sombra presentes nas árvores. Isto permitiu que
quase todas as árvores do modelo fossem excluídas do processo de
correspondência. Ressalta-se que o índice apresentou estes resultados devido às
condições de iluminação no momento da aquisição das imagens. Para imagens
adquiridas em outras condições, o desempenho deste índice pode ser diferente. O
método proposto utilizou a detecção de sombras somente no nível das imagens
originais. A possibilidade de detecção de sombras ao longo dos níveis da pirâmide
foi descartada devido ao fato de que as imagens da pirâmide possuem resolução
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
133
menor. Assim, ao projetar os pixels de sombra da imagem original para os demais
níveis da pirâmide, as posições reais de sombras seriam perdidas, o que acarretaria
em correlações realizadas nestas áreas ou a exclusão de áreas que não são
sombras.
O controle interno dos modelos gerados apresentou resultados
intermediários. Ao adotar limiares de desníveis entre os pontos mais elevados para a
exclusão, são eliminados poucos pontos errados e poucos pontos nas edificações e
árvores. Em contrapartida, ao adotar limiares mais rigorosos para o desnível entre os
pontos, é eliminada uma maior quantidade de pontos errados, além dos pontos nas
edificações e árvores. Porém, também são eliminados pontos corretos. Assim, ao
adotar limiar de desnível de 1 metro, pontos no terreno com este desnível e cuja
correspondência esteja correta são eliminados do modelo.
O controle externo realizado neste trabalho considerou como dados
de referência externa as coordenadas de alguns pontos medidas no modelo
estereoscópico orientado no LPS. Uma vez que o modelo foi orientado utilizando
pontos de apoio retirados de uma ortoimagem e de curvas de nível de qualidade
desconhecida, não se pode garantir que o modelo esteja devidamente orientado.
Assim, comparar os dados obtidos neste trabalho com estes dados de referência
não é adequado. Este procedimento foi realizado desta maneira devido à
inexistência de pontos de apoio disponíveis da região de interesse.
5.2 RECOMENDAÇÕES PARA TRABALHOS FUTUROS
Diante do exposto, podem ser feitas algumas recomendações para
trabalhos futuros em pesquisas correlacionadas.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
134
Primeiramente, ressalta-se a importância de se aplicar ao processo
desenvolvido uma metodologia adequada para a separação de áreas edificadas dos
demais alvos. Nota-se pelos resultados apresentados que muitos pontos são obtidos
nas edificações. Para a geração de Modelos Digitais de Terreno, estas feições não
devem estar presentes. Pode-se realizar a integração dos dados com informações
provenientes de outras fontes e sensores. Por exemplo, uma quarta banda espectral
na região do infravermelho, aliada às demais bandas do espectro visível, pode ser
utilizada para realizar uma classificação prévia nas imagens.
Na etapa de projeção de pontos ao longo dos níveis da pirâmide é
utilizada a pré-análise para descartar pontos com baixo potencial para a correlação.
Entretanto, neste processo, quando um ponto é descartado, a informação
proveniente do nível anterior é simplesmente perdida. Outro ponto a se considerar é
fazer novamente a busca de um ponto de interesse nas vizinhanças do ponto
descartado no nível em questão. Assim, o mapa de paralaxes ficaria mais denso,
permitindo, consequentemente, uma melhor predição da paralaxe dos pontos para a
etapa de adensamento do modelo.
Quanto ao processo de correlação, pode-se adotar o procedimento
de refinamento subpixel das coordenadas obtidas. Pode-se também utilizar múltiplas
imagens para a correlação, permitindo a obtenção de múltiplas interseções para a
geração do MDT. Estas imagens são obtidas a partir de vôos com altos valores de
superposição entre as imagens. Este processo vem sendo utilizado em alguns
softwares e tem se mostrado muito eficiente.
Como a varredura das imagens é realizada ao longo das linhas, o
processo de pré-análise pode ser aplicado considerando apenas a precisão da
correlação na direção x, ou seja, o primeiro elemento da matriz variância e
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
135
covariância das translações. Deste modo, pontos que possuem alto potencial para a
correlação na direção x e baixo potencial na direção y não seriam eliminados do
modelo.
O mapa de paralaxe é gerado a partir de interpolações lineares
primeiramente realizadas ao longo das linhas e em seguida entre as linhas. Para
evitar esta interpolação em duas etapas e principalmente levar em conta uma
vizinhança mais abrangente, recomenda-se o uso de um método de interpolação
bidimensional para preencher o mapa de paralaxe.
O procedimento de controle interno realizado neste trabalho
considerou o ajuste de um polinômio somente ao longo das linhas onde foi realizada
a varredura das imagens. Para eliminar um maior número de edificações, pode-se
utilizar uma estratégia de suavização com o ajuste de superfícies aplicado em áreas
das imagens.
Recomenda-se também a utilização de dados de referência
adequados para a realização do controle de qualidade externo deste trabalho,
obtendo, assim, parâmetros mais adequados de controle do modelo gerado.
Além destas questões referentes ao método propriamente, existe a
possibilidade do uso de imagens coloridas para a realização das correspondências,
uma vez que os algoritmos podem ser adaptados e otimizados de modo a incorporar
a informação radiométrica das diferentes bandas, com o objetivo de tornar este
processo mais robusto.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
136
REFERÊNCIAS
ACKERMANN, F. Digital image correlation: performance and potential application in photogrammetry. Photogrammetric Record, v.11, p. 429-439, oct.1984. ANDRADE, J. B. Fotogrametria . Curitiba: SBEE, 1998. 258 p. ______________. High precision digital image correlation. In: PHOTOGRAMMETRIC WEEK, 39, 1994, Stuttgart. Proceedings of the 39th Photogrammetric Week, 1994. p. 231-243. ATKINSON, K. B. (Ed.). Close range photogrammetry and machine vision. Caithness, UK: Whittles Publishing, 1996. COSTA, E. R.; TOMMASELLI, A. M. G.; GALO, M. Incorporação da pré-análise no processo de correspondência de pontos em Fotogrametria Digital. In: CONGRESSO BRASILEIRO DE CARTOGRAFIA, 21, 2003, Belo Horizonte. Anais do XXI Congresso Brasileiro de Cartografia, 2003. CHO, W.; SCHENK, T.; MADANI, M. Resampling digital imagery to epipolar geometry. In: ISPRS, 1992, Washington. ISPRS Proceedings, v.29, part. B3, Com. III, 1992. EGELS, Y.; KASSER, M. Digital Photogrammetry. New York: Taylor & Francis, 2002. 351p. EL-SHEIMY, N. Digital terrain modelling. Calgary: Department of Geomatics Engineering of the University of Calgary, 1999.
FELGUEIRAS, C. A. Modelagem Numérica do Terreno. In: CÂMARA, G.; MONTEIRO, A. M.; DAVIS, C. Introdução à ciência da geoinformação. São José dos Campos: Inpe, 2004. c.7. Disponível em: <www.dpi.inpe.br/gilberto/livro>. Acesso em: mar. 2005. FÖRSTNER, W. A feature based correspondence algorithm for image matching. International Archives of Photogrammetry and Remote Sensing, Rovaniemi, v.26, part. B3, Com. III, p.150-166, 1986.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
137
GALO, M.; CAMARGO, P. O. Utilização do GPS no controle de qualidade de cartas. In: COBRAC – CONGRESSO BRASILEIRO DE CADASTRO TÉCNICO MULTIFINALITÁRIO, 1, 1994, Florianópolis. Anais.... Florianópolis, 1994.
GEMAEL, C. Introdução ao ajustamento de observações: aplicações geodésicas. Curitiba: Ed. UFPR, 1994. 319p. GONZALEZ, R. C.; WOODS, R. E. Processamento de imagens digitais . 3. ed. São Paulo: Edgard Blücher, 2000. 509p. GOOCH, M. J.; CHANDLER, J. H.; STOJIC, M. Accuracy assessment of digital elevation models generated using the Erdas Imagine Orthomax digital photogrammetric system. Photogrammetric Record, v.16, p. 519-531, abr.1999. HANNAH, M. J. Digital stereo image matching techniques. In: ISPRS, 1988, Kyoto. ISPRS Proceedings, v.27, part. B3, Com III, 1988. HARALICK, R; SHAPIRO, L.G. Computer and robot vision. New York: Addison-Wesley, 1993. v.2. HEIPKE, C. Overview of image matching techniques. In: WORKSHOP ON THE APPLICATION OF DIGITAL PHOTOGRAMMETRIC WORKSTATIONS, 1996, Lausanne. Proceedings…. Lausanne: OEEPE, 1996. HUNG, Y. P.; CHEN, C. S.; HUNG, K. C.; CHEN, Y. S.; FUH, C. S. Multipass hierarchical stereo matching for generation of digital terrain models from aerial images. Machine Vision and Applications, v.10, p. 280-291, out.1997. INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS. Ajuda on-line do software Spring. Disponível em: <www.dpi.inpe.br/usuario/menusprajuda.htm>. Acesso em mar. 2005. KAISER, B.; SCHMOLLA, M.; WROBEL, B.P. Application of image pyramid for surface reconstruction with fast vision. In: ISPRS, 1992, Washington. ISPRS Proceedings, v.29, part. B3, Com. III, 1992. KRAUSS, K. Photogrammetry: fundamentals and standart processes. Dummler/Bonn, 1993. v.1.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
138
LAM, K. W. K.; LI, Z.; YUAN, X. Effects of JPEG compression on accuracy of DTMs derived from aerial images. Photogrammetric Record, v.17, p. 331-342, out.2001. LARSSON, R. Hierarchical data structures and algorithms for digital stereoscopical mensuration. In: ISPRS, 1984, Rio de Janeiro. ISPRS Proceedings, v.25, part. A3b, Com. III, 1984. LEICA GEOSYSTEMS GIS & MAPPING. Manual do usuário do OrthoBASE e OrthoBASE Pro. Georgia: Leica Geosystems Gis & Mapping, 2003. 490 p.
MIKHAIL, E. M., BETHEL, J. S., MCGLONE, J. C. Introduction to modern Photogrammetry. John Wiley & Sons, 2001. 479 p.
NORVELLE, R. Using iterative orthophoto refinements to generate and correct DEMs. In: Manual of Photogrammetry Addendum. USA: American Society for Photogrammetry and Remote Sensing, 1996.
POLIDORI, L. DSM quality: internal and external validation. In: EGELS, Y.; KASSER, M. Digital Photogrammetry. 1. ed. New York: Taylor & Francis, 2002. 351p.
POLIDORIO, A. M.; TOMMASELLI, A. M. G.; IMAI, N. N.; FLORES, F. C.; FRANCO, C. Realce do grau de artificialidade de feições em imagens aéreas coloridas. In: III COLÓQUIO BRASILEIRO DE CIÊNCIAS GEODÉSICAS, 2003, Curitiba. Anais do III Colóquio Brasileiro de Ciências Geodésicas, 2003.
RUY, R. S.; TOMMASELLI, A. M. G.; COSTA, E. R.; ALBUQUERQUE, L. G.; GALO, M. An approach for automatic stereo model generation using non-metric digital images. In: SEMANA DE GEOMÁTICA, 2005, Barcelona. Anais da Semana de Geomática, 2005.
SCHENK, T. Automatic Generation of DEM’s. In: Manual of Photogrammetry Addendum. USA: American Society for Photogrammetry and Remote Sensing, 1996. _________. Digital Photogrammetry. v.I. Ohio: Terra Science, 1999. 428 p.
SMITH, M. J.; SMITH, D. G.; TRAGHEIM, D. G.; HOLT, M. DEMs and ortho-images from aerial photographs. Photogrammetric Record, v.15, out.1997. p. 945-950.
Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais
Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP
139
STRAUCH, J. C. M. Correlação de Imagens Digitais. Dissertação (Mestrado em Ciências Geodésicas) – Curso de Pós Graduação em Ciências Geodésicas, Universidade Federal do Paraná, Curitiba, 1991. TOMMASELLI, A. M. G.; HASEGAWA, J. K.; GALO, M. Modernas tecnologias de aquisição de dados em Fotogrametria. Boletim de Ciências Geodésicas, Curitiba, v.6, n.1, p. 49-64, 2000. ______________________________________________. Desenvolvimento de uma biblioteca de funções e classes para fotogrametria. In: CONGRESSO BRASILEIRO DE CARTOGRAFIA, 21, 2003, Belo Horizonte. Anais do XXI Congresso Brasileiro de Cartografia, 2003. ______________________________________________. UPTK: a free toolkit to support cooperative research in photogrammetry. In: GEOMATIC WEEK, 6, 2005, Barcelona. Proceedings… Barcelona, v.1, p.1-9, 2005.
UNITED STATES GEOLOGICAL SURVEY (USGS), 1998. Disponível em <rockyweb.cr.usgs.gov/nmpstds/demstds.html>. Acesso em mar. 2006. WOLF, P. R. Elements of photogrammetry: with air photo interpretation and remote sensing. 2.ed. Singapore: McGraw-Hill, 1983. 628p. WOLF, P. R; DEWITT, B. A. Elements of photogrammetry: with applications in GIS. 3.ed. McGraw-Hill, 2000. 608p.
Top Related