CUDA - Programação Paralela

Trabalho 2

Aluno: José Bonifacio da Silva JúniorProfessor: Marco Túlio Chella

Histórico

• Antes do CUDA 6.5...• Cálculo da ocupância era complicado.• Leva em consideração as capacidades da GPU.• Uso da planilha calculadora de ocupância em

vez da implementação.

Cenário atual• Cuda 6.5 oferece funções em tempo de execução para calcular a

ocupância.• A API núcleo da calculadora de ocupância:

cudaOccupancyMaxActiveBlocksPerMultiprocessor.• Prediz a ocupância em termos do tamanho do bloco e uso de

memória compartilhada de um kernel.• Multiplicando-a pelo número de warps por bloco produz o número de

warps por multiprocessador simultâneos; Além disso dividindo os warps simultâneos pelo máximo de warps por multiprocessador temos a ocupancia como uma porcentagem.

• Fonte: http://devblogs.nvidia.com/parallelforall/cuda-pro-tip-occupancy-api-simplifies-launch-configuration/

• Documentação do CUDA 7.5Assinatura:CUresult cuOccupancyMaxActiveBlocksPerMultiprocessor ( int* numBlocks, CUfunction func, int blockSize, size_t dynamicSMemSize )

• Retorna a ocupância de uma função.

• Parâmetros• numBlocks- Ocupância retornada;• func- Kernel para qual a ocupância será calculada;• blockSize- Tamanho do bloco o qual o kernel está tentado ser lançado;• dynamicSMemSize- Memória dinâmica compartilhada por bloco usada, em bytes.

Fonte: http://docs.nvidia.com/cuda/cuda-driver-api/index.html#ixzz3oDWa7dlZ

• Além disso disponibiliza as APIs cudaOccupancyMaxPotentialBlockSize e cudaOccupancyMaxPotentialBlockSizeVvariableSMem para calcular dinamicamente tamanhos de blocos que atinjam teoricamente uma ocupância máxima.

• Fonte: http://devblogs.nvidia.com/parallelforall/cuda-pro-tip-occupancy-api-simplifies-launch-configuration/

CUDA - Programação Paralela

Documents

Transcript of CUDA - Programação Paralela

Padrões e Frameworks de Programação Paralela em Arquiteturas … · 2016. 6. 29. · proﬁssionais tentam ignorar a programação paralela, pelos problemas que esta abordagem

Slides sobre CUDA

Programação paralela aplicada ao método N-Scheme para solução ...

Mini Curso Programação Paralela utilizando OpenMP - SACTA 2013

INE 5645 Programação Paralela e Distribuídabosco.sobral/ensino/ine5645/Unidade1_urian.pdf · programas paralelos: uma abordagem axiomática. ... Programação Paralela “É uma

Tópicos - Computacao Paralela Programação (Visão geral)

CUDA - UFSCbosco.sobral/ensino/ine5645/CUDA-Aula...Em 2003, um grupo de pesquisadores liderado por Ian Buck desenvolveu o primeiro modelo de programação a adotar a linguagem C em

15ª Jornada - Programação Paralela - UPFjornadasliterarias.upf.br/15jornada/index.php/15o... · 2020. 6. 20. · 15ª Jornada - Programação Paralela 28/08/2013 9h30min Literatura

Mini-curso Programação Paralela e Distribuída

MiniCurso Programação Paralela com OpenMP - SACTA 2013

Programação Paralela e Distribuída Métricas de Desempenhoricroc/aulas/0708/ppd/apontamentos/metricas.pdf · 2 Ricardo Rocha DCC-FCUP Programação Paralela e Distribuída 2007/08

Ambientes de Programação Paralela Híbrida

Por que programação paralela? - IME-USPoberlan/DCE11720/Aulas/Aula02.pdf · Por que programação paralela? ProcessamentoParalelo Prof. OberlanRomão DepartamentodeComputaçãoeEletrônica–DCEL

Porquê Programação Paralela?ricroc/aulas/0809/ppd/... · 2008. 9. 29. · 6 Ricardo Rocha DCC-FCUP Programação Paralela e Distribuída 2008/09 Fundamentos 11 O paralelismo diz-se

Programação Paralela Avançada

Conceitos de Programação Paralela - 2 MO801/MC972.

Modelo de Programação Paralela - UFF

Computação Paralela (CUDA)home.ufam.edu.br/lucascordeiro/ptr/slides/13-parallel-cuda-gpu.pdf · Vantagens / Desvantagens: (+) ... Comunicação Síncrona e Assíncrona Síncrona:

Programação em GPUs (OpenGL/GLSL CUDA)

Programação Paralela em OpenCL