Traçado de Raios de Cenas Dinâmicas na GPU Autor: Paulo Ivson Netto Santos Orientador: Waldemar...

Traçado de Raios de Cenas Dinâmicas na GPU

Autor: Paulo Ivson Netto SantosOrientador: Waldemar Celes Filho

23 de Março de 2009

psantos@tecgraf.puc-rio.br

Sumário

Motivação Estado da Arte Contribuições do Trabalho Construção da Grade Uniforme Traçado de Raios Resultados Conclusão Trabalhos Futuros

Motivação

Por que o traçado de raios?

Por que usar a GPU?

Vantagens

Eficiência O(log(n)) na complexidade da cena Descarte de visibilidade e oclusão Instanciação

Imagens: [Wald et al. 2003]

Vantagens

Alta qualidade de imagem Efeitos de sombreamento Cálculos fisicamente corretos Iluminação Global

Iluminação Global

Placa Gráfica GPUs se tornaram eficientes e flexíveis

Centenas de processadores em paralelo Suporta precisão de 32-bits de ponto flutuante Oferece muitos GFLOPS

Placas gráficas em cada PC e estação de trabalho

G80 = GeForce 8800 GTX

NV40 = GeForce 6800 Ultra

NV35 = GeForce FX 5950 Ultra

NV30 = GeForce FX 5800

Imagens: Nvidia

Desafios Constantes enormes

1 raio ~ 1.000 ciclos da CPU Precisa de muitos raios

~1M pixels/quadro 4x anti-serrilhamento 25 quadros/seg 10 raios/pixel Um bilhão de raios por segundo…

Sem hardware especializado Rasterização tem evoluído há 20 anos!

Sem API unificada OpenGL vs OpenRT

Estado da Arte

Como obter desempenho interativo

Explorar Paralelismo

Agrupar raios próximos Instruções SIMD Raios primários

Utilizar vários processadores Clusters de PCs Placas gráficas

Reduzir Interseções

Interseção com primitivas 90% do processamento

Estrutura de Aceleração (EA) Minimizar interseções

Trocar pelo custo de percorrer a estrutura Reduzir complexidade do algoritmo

O(n) → O(log(n))

Cenas Dinâmicas

Movimento de corpo rígido Transformar raio para espaço local do objeto

Animação estruturada Pré-construir EAs para cada quadro-chave Deformar volumes envolventes da EA

Não estruturada Reconstruir ou adaptar EA a cada quadro

Trabalhos Relacionados CPU

Ray Tracing Animated Scenes using Coherent Grid Traversal [Wald et al. 2006]

Ray Tracing Deformable Scenes using Dynamic Bounding Volume Hierarchies[Wald et al. 2007]

Highly Parallel Fast KD-Tree Construction for Interactive Ray Tracing of Dynamic Scenes[Shevtsov et al. 2007]

GPU Real-Time KD-Tree Construction on Graphics Hardware

[Zhou et al. 2008]

Contribuições do Trabalho

Solução proposta

Objetivos

Explorar paralelismo da GPU Cenas dinâmicas

Movimento de corpo rígido Deformações Movimento não-estruturado

Estrutura de Aceleração Grade Uniforme Reconstruir quando houver movimento

Algoritmos na GPU

Construção da Grade Uniforme em paralelo Percurso e interseção de raios Cálculo de sombreamento

Texturas Sombras Reflexões

Resumo da SoluçãoMateriais

Coords TexCena

Normais

Vértices

Configurargrade

Enviar dados para GPU

Reconstruir grade

Traçar raios

Inicialização

Visualização

laçoprincipal

Novo quadro-chave?

Construção da Grade Uniforme

Implementação em paralelo

Algoritmo Básico

1. Encontrar AABB da cena

2. Determinar no. de células

3. Construir listas de triângulos contidos em cada célula

4. Construir índice ID célula → lista de primitivas

kNdxNx 3

kNdyNy 3

kNdzNz

Percurso de Raios

ID célula(1)

Início da lista atualInício da próx. lista

(2, 6)

ID primitivas(7, 1, 3, 9)

0 2 6 11 15

3 2 7 1 3

9 11 6 2 4

5 7 4 6 8

8 3 7 5 13

12 11 14 21 5

Desafios em Paralelo

Como paralelizar a construção das listas? Por primitiva

Conflitos de escrita na mesma célula Por célula

Inúmeros acessos a muitos dados

Como construir índice para as listas? Determinar início e tamanho de cada lista

Observação

Difícil Obter primitivas ocupadas por cada célula

Fácil Obter células ocupadas por cada primitiva

Idéia Fundamental

Escrever pares (ID célula, ID primitiva) Ordenados por ID primitiva Reordenar pares de acordo com ID célula

4 7 9 7 13

7 14 7 9 12

10 12 4 5 4

8 14 8 10 2

Ordenar por ID célula4 5 4 7 4

8 9 7 9 12

10 2 10 12 13

7 14 7 14 8

(ID célula, ID primitiva)

Algoritmo

1. Obter quantas células cada primitiva ocupa

2. Acumular valores da Etapa 1

3. Escrever pares (ID célula, ID primitiva) usando índices da Etapa 2

4. Ordenar pares da Etapa 3

5. Dado ID célula, encontrar sua lista dentre pares ordenados da Etapa 4

Etapa 1

Objetivos Obter quantas células cada primitiva ocupa

Implementação Fragment shader Estimativa pela AABB de cada triângulo Escrever total de células em cada pixel

Exemplo

Etapa 2

Objetivos Acumular valores da Etapa 1 Índices para listas de células ocupadas por primitiva

Implementação Soma de prefixos em paralelo CUDA Data-Parallel Primitives (CUDPP) Acumular um valor adicional no final

Exemplo

Etapa 3 – Considerações

Objetivos Escrever pares (ID célula, ID primitiva) Usar índices acumulados da Etapa 2

Uma operação de escrita

Várias operações de escrita

Uma passada Fragment shaderCUDA

Geometry shader

Várias passadas

Vertex shader -

Etapa 3 – Solução Proposta

Dado ID par na saída Obter ID célula e ID primitiva

Dentre os valores da Etapa 2 Busca binária pelo maior valor Vmáx menor que ID par

ID primitiva = índice de Vmáx na Etapa 2

ID célula = ID célula inicial + (ID par – Vmáx)

Exemplo

Etapa 4

Objetivos Ordenar pares da Etapa 3 de acordo com ID célula

Implementação CUDA Radix-sort

Exemplo

Etapa 5

Objetivos Construir índices para acessar listas da Etapa 4

Implementação Busca binária pelo ID célula nas listas ordenadas Obter início e tamanho de cada lista Fragment shader

Exemplo

Vantagens

Paralelismo Sem conflitos de escrita Sem múltiplos valores de saída

Banda de memória Poucos acessos a dados

Implementação eficiente na GPU Soma de prefixos Ordenação Busca binária

Traçado de Raios

Implementação na GPU

Algoritmo ConceitualEnviar dados

para GPU

Materiais

Coords Tex

Normais

Vértices

Reconstruir grade Dados da Grade

Índices da Grade

Inicializar percurso de

Obter próx. célula não-

Obter interseção

mais próxima

Sombreamento

Cor de fundo

sombra, reflexão

Novo quadro-chave?

Índices da Grade

Vértices

Dados da Grade

Materiais

Coords Tex

Normais

Rotinas Principais

Percurso de raios 3D-DDA [Amanatides and Woo 1987]

Interseção raio x triângulo Coordenadas baricêntricas [Möller and Trumbore 1997]

Sombreamento Phong + texturas Raios de sombra Raios de reflexão

Implementação na GPU

Várias etapas

Raiosprimários

Raios de

sombraSombreamento

interseçõesinterseções em sombra cor final

Reflexão: passada adicional com blend

Resultados

Análise de desempenho

Roteiro Construção da Grade Uniforme Cenas de Teste Desempenho

Cenas Estáticas Cenas Dinâmicas

Trabalhos Relacionados Etapas de Visualização

Configuração de testes Nvidia GeForce 8800 Ultra Resolução de 1024 x 1024

Construção da Grade Uniforme

De 2x a 3x mais rápido que CPU Lento para cenas pequenas (API gráfica)

Tempo para reconstrução (ms)

Cenas de Teste - CAD

Boat(50K tris)

MonoBR(112K tris)

P40(470K tris)

Cenas de Teste - Benchmarks

Ben(78K tris)

Hand(16K tris)

Wood-doll(5K tris)

Cenas de Teste - Benchmarks

Toys(11K tris)

Marbles(9K tris)

Forest(174K tris)

Cenas Estáticas - CAD

Resultados P-40 Escalabilidade Descarte por oclusão

Sombras Cerca de 50% mais lento

Reflexões Pior para modelos grandes

Quadros por segundo (fps)

Cenas Estáticas - Benchmarks

“Forest” é pior caso para Grade Uniforme “Teapot in a stadium”

Sombras Até 50% mais lento

Reflexões Até 85% mais lento “Forest” pior (modelo grande)

Cenas Dinâmicas - Benchmarks

Reconstrução da Grade Uniforme Custo pequeno (-10%) Exceto “Forest” (-30%)

Trabalhos Relacionados

Desempenho até 4x mais rápido que BVH e Grade na CPU “Toys”

Melhor que CPU kd-tree e pior que GPU kd-tree “Forest”

Pior que ambas pesquisas com kd-tree

Etapas de Visualização

Enviar dados para GPU é rápido Construção da Grade mais rápida que CPU Kd-tree mais lenta para ser construída Gargalo: etapa de traçado de raios

Tempo de cada etapa (ms)

Demonstração

Vídeos

Conclusão

Revisão dos resultados e proposta inicial

Objetivos Atingidos

Construção da Grade Uniforme na GPU Implementação em paralelo Rápida e escalável

Traçado de raios de cenas dinâmicas Desempenho interativo Sombras, reflexões

Contribuições

Construção da Grade Uniforme na GPU Mais rápido que pesquisas similares na CPU

Traçado de raios na GPU Mais rápido que Grade e BVH na CPU Cenas esparsas

Mais lento que kd-tree na CPU e GPU Várias melhorias possíveis

Trabalhos Futuros

Melhorias e novas pesquisas

Próximos Passos

Grades hierárquicas Várias Grades (movimento de corpo rígido) Distância até próxima célula ocupada Outras estruturas na GPU (BIH, BVH) Traçar pacotes de raios Simulação física

Bibliografia AMANATIDES, J.; WOO, A. A fast voxel traversal algorithm for ray tracing. In: IN EUROGRAPHICS

'87, p. 3-10, 1987.

MOLLER, T. A.; TRUMBORE, B. Fast, minimum storage ray-triangle intersection. JGTOOLS: Journal of Graphics Tools, 2, 1997.

SHEVTSOV, M.; SOUPIKOV, A. ; KAPUSTIN, A. Highly parallel fast kd-tree construction for interactive ray tracing of dynamic scenes. Comput. Graph. Forum, 26(3):395-404, 2007.

WALD, I.; PURCELL, T. J.; SCHMITTLER, J.; BENTHIN, C. ; SLUSALLEK, P. Realtime Ray Tracing and its use for Interactive Global Illumination. In: Eurographics State of the Art Reports, 2003.

WALD, I.; IZE, T.; KENSLER, A.; KNOLL, A. ; PARKER, S. G. Ray Tracing Animated Scenes using Coherent Grid Traversal. ACM Transactions on Graphics, p. 485-493, 2006. (Proceedings of ACM SIGGRAPH 2006).

WALD, I.; BOULOS, S. ; SHIRLEY, P. Ray Tracing Deformable Scenes using Dynamic Bounding Volume Hierarchies. ACM Transactions on Graphics, 26(1), 2007.

ZHOU, K.; HOU, Q.; WANG, R. ; GUO, B. Real-time kd-tree construction on graphics hardware. In: SIGGRAPH ASIA '08: ACM SIGGRAPH ASIA 2008 PAPERS, p. 1-11, New York, NY, USA, 2008. ACM.

Traçado de Raios de Cenas Dinâmicas na GPU Autor: Paulo Ivson Netto Santos Orientador: Waldemar...

Documents

Transcript of Traçado de Raios de Cenas Dinâmicas na GPU Autor: Paulo Ivson Netto Santos Orientador: Waldemar...

ESCOLA DE APERFEIÇOAMENTO DE OFICIAIS Cap Inf IVSON ... CAP MA… · Aos meus camaradas de turma, Cap Inf FELIPE VIEIRA, e Cap Inf TERTULIANO, por terem contribuído diretamente

Síntese de Imagens Fisicamente Correctas: Aplicações e ...gec.di.uminho.pt/psantos/docs/Presentations/SImgFisCorr.pdf• Algoritmos mais eficientes • Computação Paralela •

RELATÓRIO FINAL DE ESTÁGIO SUPERVISIONADO©trio.pdf · O CELES oferece cursos de espanhol com custo reduzido para estudantes, ... o utilizado atualmente pelo CELES, conta com 60

Lab Manejo Florestal L M F - icmbio.gov.br · 1. Adriano José Nogueira Lima, Eng Florestal, MSc Manejo Florestal 2. Armando Nunes Colares, mateiro 3. Carlos Henrique Celes, Eng Florestal,

UNIVERSIDADE ESTADUAL DA PARAÍBA CENTRO DE …dspace.bc.uepb.edu.br/jspui/bitstream/123456789/11198/1/PDF - Ivson... · mostrando seu surgimento e seus principais precursores na

RECONSTRUÇÃO 3D Equipe: Amora Cristina (acat) Anália Lima (alc5) Caio César (ccss2) Irineu Martins (imlm2) Ivson Diniz (ids) Lais Sousa (lsa)

Fundamentos da Computação Gráfica Trabalho 1 – Cor Eduardo Telles Carlos Paulo Ivson Netto Santos.

Professor(a): Eliana Salgado Alunos: Camila Celes (11) Isabella Vilas Bôas (22) Lucas Santini (27)

AGÊNCIA DE GESTÃO DA TESOURARIA E DA DÍVIDA PÚBLICA – … · 2016-11-17 · Title (Microsoft Word - Decreto_200_2012_estatutos Ag\352ncia.doc) Author: psantos Created Date:

Um Pouco de História Míriam Rêgo de Castro Leão Rebeca Celes.

Estruturas de Dados - facom.ufu.brguliato/disciplinas/PP/modulo2/capitulo02[1].pdf9/8/2005 (c) Marco A. Casanova - PUC-Rio 3 Referências Waldemar Celes, Renato Cerqueira, José Lucas

INF2604 { Geometria Computacional Waldemar Celes

IVSON RIBEIRO DA SILVA - Cursos de capacitaçãosolenerg.com.br/files/monografia_ivson.pdf · 4.2.2 Descargas Elétricas ... 4.4.1.1 Unidade de Medida da Potência ... Tabela 6 -

Professora Doutora Sónia Maria Aniceto Morgado - PSantos... · Para fazer face a esse tipo de situação conflitual pretendemos deste modo, Gestão de Conflito Organizacional: Uma

Alberto B. Raposo Flávio Szenberg Marcelo Gattass Waldemar Celes INF 1366 Visão Estereoscópica.

Estruturas de Dados Aula 15: Árvores 09/06/2014. Fontes Bibliográficas Livros: –Introdução a Estruturas de Dados (Celes, Cerqueira e Rangel): Capítulo.

noemi/coord-ecp/docs/roteiroprojetosgrad.docx · Web viewProf. Luiz Fernando Bessa Seibel. Prof. Waldemar Celes Filho. Supervisão de Projeto Final. Prof. Joisa de Souza Oliveira.

BOLETIM - Primeira Igreja...Rev. Augustus Nicodemus Lopes, Lucas Leite Feitosa e Victor Henrique Galvão Albuquerque Comissão de Exame de Contas: Ivson Vilela Guerra; Fernando A.

Encontro III Leilão Virtual Marchas - leilonorte.com · Ivson Lopes (71) 98153.7372 Vinícius Madeira ... Edson BH (31) 98403-2521 Fábio Rios (71) ... VIOLÃO DA SANTA ESMERALDA

Traçado de raios em tempo real Paulo Ivson 20-10-2008.