NEC Earth Simulator. Apresentação Hardware Software Instalações Desempenho.

Post on 17-Apr-2015

111 views 5 download

Transcript of NEC Earth Simulator. Apresentação Hardware Software Instalações Desempenho.

NEC Earth Simulator

Apresentação

Hardware Software Instalações Desempenho

Hardware

Decisões de Projeto

Sistema paralelo distribuído Processamento vetorial Chip LSI Memória principal distribuída Rede single-stage crossbar

Configuração do Sistema

Característica Valor

Numero total de PN 640

Numero de AP / PN 8

Desempenho de pico / AP 8 Gflops

Desempenho de pico total 40 Tflops

Quantidade de memória/PN 16 GB

Quantidade de memória total 10 TB

Rede de Interconexão

Rede de Interconexão

Arithmetic processors (AP)

4-way super-scalar unit Vector unit

6 tipos de pipeline: adição/shifting, multiplicação, divisão, operações lógicas, masking, load/store

Processamento simultâneo de vetor de instruções

Data prefetching Branch Prediction Out-of-order instruction execution

Arithmetic processors (AP)

Arithmetic processors (AP)

Arithmetic processors (AP)

Hardware

Processor Node Cabinets (PN)

Processor Node Cabinets (PN)

Interconnection Network

Interconnection Network

Interconnection Network

Software

Sistema Operacional

Unix-based OS – “Super-UX” Alta escalabilidade Gerenciamento de memória, processos e

arquivos otimizados Comunicação de alta velocidade no

Interconnection Network Espaço de endereçamento global Sistema de super-cluster

Super-cluster

Sistema de Arquivos

Problemas: Acesso ao disco sequencialmente Gerenciamento de grande número de partes

de arquivo Solução:

Parallel File System Trata arquivos distribuídos fisicamente

como um

Parallel File System

Escalonador

Batch-job system Agrupa programas em duas filas:

S – processamentos menores L – processamentos maiores

Execução eficiente Facilidade em estimar término do trabalho

Escalonador

Instalações

Instalações

Instalações

Instalações

Instalações

Instalações

Desempenho

Desempenho

Desempenho TeóricoCaracterística Valor

Desempenho teórico de pico total 40 Tflops

Desempenho de pico / PN 64 Gflops

Desempenho de pico / AP 8 Gflops

Memória total 10 TB

Memória total / PN 16 GB

Desempenho

Benchmark LinpackComparar performance de

supercomputadoresResolução de equações lineares

18 de Abril de 2002 recorde de 35,61 Tflops

Desempenho Prático

Característica Valor

Desempenho prático 35.86 Tflops

Eficiência sustentável 87,5 %

Velocidade de transmissão entre PN

12,3 GB/s

Desempenho

Autores

Edgar Kenji Tanaka – RA 023577 Fábio Caraca Smirmaul – RA Mário San Felice – RA