New Patterson & Hennessy – Capítulo 9 Arquitetura e Organização … · 2015. 2. 22. ·...

Multiprocessamento

Patterson & Hennessy – Capítulo 9

Tópicos Abordados

Tipos comuns SMP (processamento paralelo) NUMA (placas de alto desempenho) Clusters (computação distribuída e nuvem)

Comunicação Memória Compartilhada Mensagens

Coerência de cache Multithreading

Symmetrical Multiprocessing (SMP)

Típico de Multicore Um chip, vários núcleos

Sem memória privada para o µP

Taxonomia de Flynn SISD (Single Instruction Single Data) SIMD (Single Instruction Multiple Data) MIMD (Multiple Instruction Multiple Data) MISD (Multiple Instruction Multiple Data)

SIMD: típico de processamento paralelo Elementos idênticos

Mesmo programa em todos os µP

Algoritmos: O( O(single) / núm µP)

Algumas Topologias SIMD

Anel Grade 16 nós

Rede ômega

n-cubo (n=3)

Non-Uniform Memory Access Tempo de acesso à memória

Varia conforme a localização do dado

Um µP pode ter vantagens sobre outro

Típico de “multiprocessamento” Uma placa, mais de um chip

Rede de memória compartilhada distribuída Load/Store remotos: menos overhead que

send/receive

Exemplo de NUMA

Cada CPU tem uma memória local Acesso à memória de outro nó:

Indireto, via barramento Bem mais lento que acesso local

Cluster

Tipicamente, várias placas mãe Conexão via bus local ou rede

As placas possuem memórias privadas Comunicação via mensagens, usualmente

MotherBoard MotherBoard

MotherBoard MotherBoard MotherBoard

Bus Local ou Rede

Coerência de Cache

Quando um µP altera um dado, outro µP pode estar com uma cópia antiga

Problema de consistência dos dados

Protocolo MESI Modified, Exclusive, Shared, Invalid

Exemplo com Memória Compartilhada

sum[Pn] = 0;for (i = 1000*Pn; i < 1000*(Pn+1); i = i + 1) sum[Pn]=sum[Pn]+A[i];/* soma áreas atribuídas*/

half = 100; /* 100 processadores */do{ synch(); /* espera conclusão da soma parcial */ if (half%2 != 0 && Pn == 0) sum[0] = sum[0] + sum[half1]; /* soma condicional necessária quando half é ímpar; Processor0 obtém elemento ausente */ half = half/2; /* linha divisora quem soma */ if (Pn < half) sum[Pn] = sum[Pn] + sum[Pn+half];}while (half == 1); /* soma final em Sum[0] */

Exemplo com Troca de Mensagens

sum = 0;for (i = 0; i<1000; i = i + 1) sum = sum + A1[i]; /* soma os arrays locais */

limit = 100; half = 100; /* 100 processadores */do{ half = (half+1)/2; /* linha divisória entre send e receive */ if (Pn >= half && Pn < limit) send(Pn – half, sum); if (Pn < (limit/2)) sum = sum + receive( ); limit = half; /* limite superior emissores */}while (half == 1); /* sai com a soma final */

Processador Cell (derivado do PowerPC)

Usado em videogames e supercomputação PPE: processador genérico, controla os outros SPE: processadores específicos, subtarefas

Multithreading

Um processo é um programa Memória privada, comunicação com outros

processos (IPC) “complexa” Vários processos simultâneos num Sist. Op.

Uma thread é um “processo light” Um processo pode ter várias threads Todos acessam a mesma área de memória Comunicação mais fácil Podem ser executadas em simultâneo

Várias formas de multihtreading (SW, HW)

Suporte do µP a Multithreading

No Meu Laptop!

Intel Core i5-460M

Dois núcleos no encapsulamento (dois µP)

Intel Hyperthreading: Multithreading SMT Tanto Windows como Linux enxergam 4

processadores No chaveamento, o processo/thread vai para o

processador mais desocupado Threads são praticamente processos (Linux) Duas threads de um programa não

necessariamente acessam a mesma cache!

Benchmarking

Desempenho agora depende de: Quantidade de processadores Escalabilidade do algoritmo

Problema divisível? Memória compartilhada

Sistema operacional vs Processador vs Algoritmo Velocidade? Consumo? Trade off?

EEMBC (embassy) Consórcio para benchmarking de sistemas

embarcados

Dimensionamento vs. Algoritmo

Linha 1 Linha 2 Linha 3 Linha 40

Coluna 1Coluna 2Coluna 3

Dimensionamento vs. Processador

Benchmarks: coleção de tarefas Desempenho depende também do

processador!

Futuro

A Intel e a Universidade da Califórnia prevêem aumento significativo

Centenas ou até milhares (!) de cores num PC comum

Exigirá algoritmos especializados Limites inerentes de paralelização?

A lei de Amdahl não tem extensão clara

New Patterson & Hennessy – Capítulo 9 Arquitetura e Organização … · 2015. 2. 22. ·...

Documents

Transcript of New Patterson & Hennessy – Capítulo 9 Arquitetura e Organização … · 2015. 2. 22. ·...

James Patterson - Editora Arqueiro · O Diário de Suzana para Nicolas James Patterson OO diario de Suzana_CS5.indd 3 diario de Suzana_CS5.indd 3 226/09/11 12:376/09/11 12:37

O grande mérito desta obra de Köstenberger e Patterson é ......pretes das Sagradas Escrituras, produziram uma obra de primeira grandeza sobre hermenêutica bíblica. Com abordagem

AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC. .

Rganização de Computadores Melhorias de Desempenho com Pipelines - Parte B - Capítulo 6 – Patterson & Hennessy Organização de Computadores Melhorias de.

Pipeline (Patterson) - UFFbazilio/cursos/arqcomp/pipeline.pdf · Parar o pipeline. Unidades de Adiantamento e Detecção de Conflitos. Execução de Seqüência de Instruções (1/7)

Rganização de Computadores A Interface entre o Processador e os Periféricos Capítulo 8 – Patterson & Hennessy (seções 8.4 e 8.5) Organização de Computadores.

Biologia Estrutural - Laboratory of BioMolecular Systems · alguma informação estrutural, visto que a partir da interpretação do mapa de Patterson ... assim a representação

James Patterson - Travessa.com.br

James Patterson - fnac-static.com

Relatório de Gestão 2005-2009 - prefeiturarp.usp.br Relat Gestao.pdf · o tempo em que o imóvel fica desocupado, por conta da reforma, assim, a Prefeitura do Campus contratará

Organização e Projeto de Computadores - David a. Patterson - 3ed

Excelentíssimo Senhor Doutor Juiz de Direito da 6° Vara ... · O apartamento tipo n° 222, localizado no 22° andar do Bloco B, encontra-se desocupado. ... O imóvel está localizado

#3. O Fogo - James Patterson

Atendimento telefônico (11) 3838-4000 - opção 1 Sistema automatizado distribui as ligações da fila para o próximo ramal desocupado.

A PAtterson dedicA-se A criAr equiPAmentos mAis seguros ...

· BBC ENGENHARIA LAUDO TÉCNICO DE AVALIAÇÃO- NO 012-01 Localizaçåo Estado Obj etivo Solicitante do ... Trata-se de um com vocaçäo residencial atualmente desocupado e com

James Patterson - · PDF filecabelo penteado para trás, usava calça cáqui e uma camisa de brim, as mangas arregaçadas, ... repentinos, não se sentiam mais seguros

CASO CLÍNICO Síndrome de Plummer-Vinson · Breve Revisão de Tema Sindrome de Plummer-Vinson / Patterson Kelly / Anemia Sideropénica Disfagia Anemia Ferropénica Membrana Esofágica

Evolução do Desemprego no Brasil no Período análise ... · probabilidade de um ocupado perder (ou desligar-se do) trabalho e a probabilidade de um desocupado encontrar trabalho

FACULDADE MERIDIONAL IMED ESCOLA DE ARQUITETURA E … Konzenti(1).pdf · 2018-10-02 · na cidade de Passo Fundo/RS, bairro Cidade Nova, em terreno desocupado com facilidade de acesso