High Perfomance Computing in the Multi-Core...

33
High Perfomance Computing in the Multi-Core Area

Transcript of High Perfomance Computing in the Multi-Core...

Page 1: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

High Perfomance Computing in the Multi-Core Area

Page 2: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Grupo Jumento

Alexandre MacedoDaniel GreccoEdson Kenji

Marcos BonciJosé Antonio Marum

Pedro PauloRafael Sato Suguiura

Page 3: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Introdução

Lei de Moore - Evolução dos processadores monolíticos - Maior poder computacional

Problema - Demanda por energia - Dissipação de calor - Perda de eficiência Alternativa: Múltiplos núcleos

Page 4: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Introdução

Multi-core: novas possibilidades - processamento paralelo - maior vazão - threads - popularização

Multi-core: novos problemas - processamento concorrente - escolha de arquitetura - pouco suporte

Page 5: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Execução de Processos

Balanceamento de Carga - Distribuição de tarefas - Busca por um uso ótimo dos recursos Tolerância a Falhas - Tolerância a Falhas Bizantina

Virtualização ao nível de sistema - Sistema operacional

Page 6: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Esquemas para Sistemas Petaflop

Mega-multi-core (Aplicações gerais) Multi-core com aceleradores Especializados Reconfigurável e adaptível

Page 7: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Multiprocessamento assimétrico

Também conhecida como SMP (symmetric multiprocessing ), trata os múltiplos processadores como processadores iguais que utilizam uma memória principal compartilhada.

Usado normalmente em computadores de até 8 núcleos, reflete uma melhor performance em programas que utilizam o sistema multithreads. Uma aplicação desenvolvida para sistemas single-core tem um grande desempenho em SMP, fato que o tornou o padrão de desenvolvimento entre as fabricantes.

Page 8: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Multiprocessamento simétrico

Conhecida como ASMP (assymmetric multiprocessing ), cada processador possui tarefas específicas pré-determinadas. Um processador chamado master é responsável pela distribuição das tarefas entre os demais processadores, chamados slaves. Esta arquitetura é melhor aplicada em sistemas previsíveis, onde os processadores e memórias podem ser dimensionados de maneira ótima.Em sistemas de uso convencional, pode haver até mesmo perda de performance.

Page 9: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Computação de alto desempenho

A computação de alto desempenho (high performance computing - HPC) utiliza super-computadores e clusters para resolver problemas computacionais de grande porte.

Hoje em dia, computadores que se aproximam da ordem de Teraflops (TFLOPS) de processamento, são considerados como computadores de alta performance.

O termo é principalmente associado à computação utilizada para pesquisa científica.

Page 10: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Super-computadores

Super-computadores são utilizados para tarefas que exigem cálculo intenso, como problemas envolvendo mecânica quântica, previsão do tempo, pesquisas sobre o clima (aquecimento global), criptanálise, simulações (engenharia), etc.

Alguns estudiosos afirmam que um super-computador só pode ser considerado assim, se estiver na lista do TOP500, os 500 computadores mais rápidos do mundo.

Page 11: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Top 500

Page 12: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Sistemas Operacionais utilizados

Há cerca de 10 anos atrás, quase todos os super-computadores presentes na lista do TOP500 utilizavam alguma variante do UNIX. Hoje em dia, apesar do UNIX ainda possuir uma parcela significativa (cerca de 20%), o sistema operacional dominante é o Linux com cerca de 70%. As razões para o crescimento são a compatibilidade com a maior quantidade de arquiteturas de hardware e a extensa possibilidade de configuração do sistema.

Page 13: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Sistemas Operacionais utilizados

Page 14: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

IBM Roadrunner

O IBM Roadrunner é o atual primeiro colocado da lista do TOP500. Ocupa um andar inteiro (560 metros quadrados) do Laboratorio de Los Alamos, na Califórnia. Custou cerca de 133 milhões de dólares e levou cerca de 6 anos para ficar inteiramente funcional.Sua capacidade de processamento pode chegar até 1,7 PetaFLOPS. Possui quase 20 mil processadores, 6.480 são AMD Opteron dual-core, e 12.960 são IBM Cell 8-core.

O DOE planeja utilizá-lo para simulações do decaimento de material nuclear. Mas as indústrias automotiva, financeira, científica e aeroespacial também possuem planos para ele.

Page 15: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

IBM Roadrunner

Page 16: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Beowulf

Consiste de clusters para computação paralela de alta performance.

Duas características importantes: utilização de microcomputadores comerciais e possibilidade de expansão do conjunto de máquinas sem a preocupação de identificar fabricantes.

A escalabilidade inerente ao Beowulf não impõe limites às possibilidades futuras de expansão.

A disponibilidade de compiladores e bibliotecas gratuitos para utilização no paradigma de distribuição de dados permite ao Beowulf ter a melhor relação custo/desempenho disponível no mercado.

Page 17: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Beowulf

The Borg - um cluster Beowulf usado pela universidade McGill para procurar por pulsares.

Page 18: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Super-computadores, mais perto do que você imagina...Na ISC'08 a NVIDIA apresentou seus novos processadores GPU, os T10P, que conseguem desempenho 2 vezes maior do que as da tecnologia anterior, utilizado nas séries 8 e 9. O T10P consegue executar entre 500 GFLOPS e 1 TFLOP com precisão simples.

O segundo colocado do TOP500, o Jaguar possui 45.000 processadores AMD Opteron Quad, que chegam a 1 PFLOP. O detalhe é que a arquitetura é x86, a mesma utilizada na maioria dos computadores pessoais.

Page 19: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Eficiência Energética

Se observamos as estatísticas dos Top20 dos últimos três anos, podemos notar que há uma grande defasagem do avanço da eficiência energética (aparentemente linear) em relação ao avanço do poder computacional (aparentemente exponencial). Agora também existe a Green500, uma reordenação do Top500, em que o critério de eficiência energética se sobrepõe ao critério simples do poder total de processamento. Isso demonstra que existe uma preocupação crescente e atual do mercado em relação à eficiência dos computadores.

Page 20: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Eficiência Energética

Page 21: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Eficiência Energética

Page 22: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Precisamos de uma linguagem para programação paralela?Nossas linguagens de programação, ambientes e ferramentas possuem um modelo conceitual baseado na antiga arquitetura de computadores monolíticos. Uma nova linguagem que adote um modelo mais adequado à nova realidade seria muito interessante.

No entanto, migrar todo o código de todos os softwares desenvolvidos até hoje para essa nova linguagem é virtualmente utópico.

Page 23: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Tendências e Futuro

Atualmente, aumentar o desempenho do processador não é mais suficiente. Os computadores precisam operar mais rápido e mais refrigerados, ocupar menos espaço e consumir menos energia.

Entre tantas melhorias necessárias para as próximas gerações, cada fabricante parece tomar posturas diferentes.

Page 24: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Tendências e Futuro

A AMD tem investido em novas arquiteturas. Uma delas foi implementada nos novos processadores de quatro núcleos, e é chamada de arquitetura de conexão direta.

Nesta arquitetura, os processadores, o controlador de memória e o I/O ficam conectados diretamente à CPU e se comunicam na mesma velocidade, aumentando o desempenho do processamento.

Outra novidade são os dispositivos de controle de energia, na qual o processador pode desligar ou ligar algumas regiões que não estão operando, economizando energia.

Page 25: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Tendências e Futuro

Page 26: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Tendências e Futuro

A Intel investe pesado em microarquitetura. Sua próxima geração de processadores possui 2-bilhões de transistores (primeiro a atingir esta marca).

Ela também demonstrou um processador que utiliza a tecnologia de 32nm, o que irá aumentar ainda mais a capacidade computacional dos processadores atuais (45nm).

Esta nova geração ainda conta com algumas novidades como acesso à memória não uniforme e uma arquitetura semelhante à da conexão direta da AMD.

Page 27: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Tendências e Futuro

A Sun aposta em uma linha de desenvolvimento nova chamada System on a Chip .

Com 8 núcleos, o UltraSPARC T2 garante alta performance e maior velocidade em transferência de dados, além de integrar networking, dispositivos de segurança, unidades de processamento de ponto flutuante e criptografia.

Page 28: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Tendências e Futuro

O recentes investimentos da IBM foram principalmente na área de multimídia.

Temos como exemplo o desenvolvimento do Cell, um processador com alta capacidade de realizar operações em ponto flutuante e otimizações para uso multimídia. Além de ser o núcleo do Playstation 3, espera-se que também seja aproveitado em televisões digitais de alta definição.

A IBM também contribuiu com o processador do Xbox 360, um processador de 3 núcleos derivado do PowerPC, com um barramento que pode transmitir até 21,6 GB de dados por segundo.

Page 29: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

IBM Cell

Page 30: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Referências

http://hermes2.dpi.inpe.br:1905/col/lac.inpe.br/worcap/2004/09.06.11.06/doc/artigo%2002%20pp%2070-72%20D%20ricardo%20varela_slb.pdf

http://www.beowulf.org/overview/history.html

http://arstechnica.com/news.ars/post/20070227-8931.html

http://www.computer.org/portal/site/computer/menuitem.5d61c1d591162e4b0ef1bd108bcd45f3/index.jsp?path=computer/homepage/0506&file=cover.xml&xsl=article.xsl

http://software.intel.com/en-us/blogs/2007/02/23/do-we-need-another-parallel-programming-language/http://www.amd.com/us-en/Corporate/VirtualPressRoom/0,,51_104_543~129241,00.html

Page 31: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Referências

http://www.hpcwire.com/specialfeatures/isc/features/NVIDIA_Unveils_Teraflop_GPU_Computing.htmlhttp://en.wikipedia.org/wiki/High-performance_computinghttp://www.eetimes.com/news/design/showArticle.jhtml?articleID=212100092http://www.lanl.gov/roadrunner/http://www.scientificcomputing.com/whos-who-in-high-performance.aspxhttp://multicore.amd.com/br-pt/AMD-Multi-Core/Multi-Core-Advantages/Quad-Core-Advantage/For-Business.aspxhttp://www.intel.com/pressroom/archive/releases/20070918corp_a.htm?iid=tech_arch_32nm+body_pressrelease

Page 32: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Referências

http://www.intel.com/technology/architecture-silicon/http://www.ic.unicamp.br/~rodolfo/Cursos/mo401/2s2005/Trabalho/049180-multicores.pdfhttp://techresearch.intel.com/articles/Tera-Scale/1449.htm

Page 33: High Perfomance Computing in the Multi-Core Areagrenoble.ime.usp.br/~gold/cursos/2008/mac412/HPFinMultiCoreArea.pdf · Introdução Lei de Moore - Evolução dos processadores monolíticos

Perguntas?