Evolução das CPUs: Dual e Quad Core
... os computadores sequenciais estão se aproximando do limite físico fundamental em sua energia potencial computacional. Tal limite é a velocidade da luz...
Angel L. DeCegama
Cesar SpositoMário J. Filho
Rodrigo Ferrassa
EACH
Introdução – Limite: Pentium IV
Desafio: Aumento frequência de clock. Corrida por clock (Intel X AMD). Athlon Thunderbird X Pentium III. Intel: Movimento arriscado. Investimento em um processador com um longo pipeline. Pentium IV.
EACH
Pentium IV: longo pipeline
Pipeline é uma técnica de hardware que permite que a CPU realize a busca de uma ou mais instruções além da próxima a ser executada.
Pentium III: 10 estágios. Pentium IV: 20 estágios a 31 estágios. Dobrar o número de estágios no
processador é como dobrar o número de funcionários de uma empresa.
EACH
Longo pipeline: Consequencias
Com mais estágios, o processador seria capaz de atingir freqüências mais altas.
Adicionar mais estágios tornou o processador menos eficiente, pois as instruções precisavam do dobro do número de ciclos do processador para serem processadas.
Possuir o dobro de estágios significa também possuir aproximadamente o dobro de transistores e consumir o dobro da eletricidade.
EACH
Mais consumo – Maior aquecimento
Maior consumo gera maiores desperdícios. Maior desperdicio gera maiores
aquecimentos. A dissipação térmica (W/cm^2) de um
Pentium 4, é próximo do núcleo de um reator nuclear.
Se a produção de processadores continuasse da mesma forma, num futuro não muito distante, teríamos um processador com dissipação térmica próxima a da superfície solar.
EACH
AquecimentoEACH
Fonte: http://blogs.intel.com
A barreira dos 3.4 GHZ
Desde 1983 até 2002, as taxas de frequência de clock aumentaram de 5 MHz para 3 GHz.
Aumento do clock 600 X em 19 anos. Na época, a Intel previa alcançar 5.2 GHz no
final de 2004 e planos para 10 GHz no final de 2005.
Porém, nada disso aconteceu. Os 3.4 GHz se tornaram uma barreira difícil de transpor.
Fim da Lei de Moore?
EACH
Hyper Treading: Inicio do processamento paralelo
Hyper Treading: simula em um único processador físico dois processadores lógicos.
Pode melhorar desempenho de até 30% Utiliza as partes ociosas dos recursos para
simular dois núcleos.
EACH
Evolução
Elevando, por exemplo, em 20% a freqüência do processador, aumentamos apenas em 13% o seu desempenho e como efeito colateral, também passa a consumir 73% mais energia.
Recíproca verdadeira.
EACH
EstratégiaEACH
Reduzindo a freqüência em 20%, perdemos apenas 13% de desempenho e reduzimos em 49% o consumo de energia.
Se reduzíssemos em 20% o clock e colocássemos dentro da mesma pastilha dois processadores?
Estratégia: Multiplos NúcleosEACH
Teríamos um processador de dois núcleos com 73% mais desempenho e consumindo praticamente a mesma coisa (~2% mais energia).
Processadores multicore podem simultaneamente executar múltiplas tarefas computacionais.
Single-Core X Dual-CoreEACH
Fonte: http://blogs.intel.com
Nova ArquiteturaEACH
“Caminhou bastante, porém para o lado e não para a frente” (National Instruments).
Pentium III
Pentium IV
Pentium D
Core 2 Duo
Quad Core
NetBurst Core
Arquitetura CoreEACH
Somando-se a estratégia de lançar processadores de múltiplos núcleos, a nova arquitetura interna do processador também foi importante.
Maior eficiência de execução de instruções por ciclo de CPU.
Maior desempenho e menor consumo. A arquitetura Core consegue desempenho
superior aos da microarquitetura Netburst (anterior) com o clock muito inferior.
Arquitetura CoreEACH
Derivada do Pentium III – Pentium M. Pipeline de 14 estágios. Cache de memória L2 é compartilhado. Pré-buscas são compartilhadas, se o
controlador de cache carregar um bloco de dados para ser usado pelo primeiro núcleo, o segundo núcleo também pode usar o dado já carregado.
Aprimoramento da unidade de pré-busca do processador (“Melhor Chute”).
Arquitetura CoreEACH
Quanto menor o número de instruções a serem executadas, mais rápido o computador realizará a execução da tarefa além de consumir menos.
O decodificador de instruções do Pentium IV pode decodificar três instruções por pulso de clock, já o do Core 2 Duo (Arquitetura Core) 4.
Arquitetura CoreEACH
Novo conceito: Fusão de instruçõesload eax, [mem1]
cmp eax, [mem2]
jne target
load eax, [mem1]
cmp eax, [mem2] + jne target
Graças ao conceito de fusão de instruções o decodificador de instruções da arquitetura Core consegue fundir 2 instruçoes enviar 5 por pulso de clock.
Arquitetura CoreEACH
E mais! Unidade de ponto flutuante (FPU) e uma
unidade lógica e aritmética (ALU) extras. Caminho de dados real de 128 bits. Desambiguação de memória. Chaveamento Elétrico Avançado. Etc.
EACH
Quad Core
Quad CoreEACH
- É uma das versões de processadores da Intel mais recente apresentada com núcleos Kentsfield(65nm) e Yorkfield(45nm).
- O clock pode alcançar até 3.33Ghz. Em overclocking, com cooler de ar, até 4.0Ghz, e na água até 5Ghz.
- Exemplos: Core 2 Quad, Core 2 Extreme: quad-core, Quad-Core Xeon.
Quad CoreEACH
- Multi-Chip: Duas pastilhas de silício (1 núcleo em cada) encapsuladas junto: Comunicação externa .
- Monolítica: Uma pastilha de silício integra 2 núcleos encapsulados: Comunicação interna.
- Monolítica Multi-Chip: Duas pastilhas de silício (2 núcleos em cada) encapsuladas: Comunicação interna e externa.
Quad CoreEACH
Quad Core – JogosEACH
Quad Core – JogosEACH
EACH
Quad Core - Exemplos
EACH
Aquecimento: Netburst X Core Pentium D
Pentium Extreme Edition
Aquecimento: Netburst X Core EACH
Core 2 Duo
Core 2 Extreme
Core 2 Quad
EACH
Arquitetura Core – Processadores
Dual/Quad/Six Core Xeon
Arquitetura Core – NúcleosEACH
EACH
AMD: Athlon 64 X2• Primeiro processador com dois núcleos da AMD.• Deriva do Athlon 64.
EACH
AMD: Athlon 64 X2
EACH
AMD: Athlon 64 X2
EACH
AMD: Phenom X3/X4
• Três ou Quatro núcleos independentes.• Os núcleos se comunicam internamente
dentro da pastilha.• Controlador de memória integrado.• Tecnologia HT.
EACH
AMD: Phenom X3/X4
Considerações FinaisEACH
Por 10 anos os aumentos de desempenho vieram à custa do uso cada vez mais ineficiente do uso de energia.
A partir de 2001, a taxa de crescimento de desempenho pareceu ter reduzido. Se essa diminuição será ou não temporária ainda é uma questão obscura.
Arquitetos estão usando técnicas cada vez mais complexas para tentar explorar mais paralelismo a nível de instrução.
J L Hennessy e D A Patterson
Considerações FinaisEACH
Com essa estratégia em mente, os fabricantes de processadores tem o desafio de continuar entregando a melhor relação desempenho/Watts.
A Intel propõem melhorar sempre, em um ano a microarquitetura, no ano seguinte a miniaturização, e assim por diante.
Considerações FinaisEACH
Fonte: http://blogs.intel.com
Considerações FinaisEACH
2007 a Intel lança os primeiros processadores para servidores fabricados com a tecnologia de 45nm.
2008 foi o ano do Nehalem, que foi o nome código da nova microarquitetura, que permitirá um outro passo importante, para manter viva a Lei de Moore.
Processadores Futuros (Roadmaps)
Arquitetura Processador Clock Núcleos Processo Cache TDP PrevisãoIntel
Nehalem Core i7 2,6 - 3,2 Ghz 4 por padrão 45nm 1 a 8mb 130W – 150W Novembro-08Westmere - - 6 por padrão 32nm 1 a 12mb - 2009/2010
Sandy Bridge - - 4 – 8 32nm 8 a 24mb - 2010/2011Haswell - - 8 por padrão 22nm - - 2012
AMDBarcelona Opteron - 4 65nm 2mb - 2008Shanguai Opteron/Phenom - 4 45nm 6mb - 2008/2009Istambu Phenom - 6 45nm 6mb - 2009Magny-Cours - - 12 45nm 12mb - 2010São Paulo - - 6 45nm 6mb - 2010
EACH
Considerações Finais
BibliografiaEACH
J L Hennessy e D A Patterson HENSON Valerie - The Kernel Hacker's
Bookshelf: Ultimate Physical Limits of Computation
INTEL - http://www.intel.com/portugues/ products/ processor/index.htm
BLOGS INTEL - http://blogs.intel.com FAPESP - http://www.agencia.fapesp.br NATIONAL INSTRUMENTS -
http://digital.ni.com/worldwide/brazil
BibliografiaEACH
CLUBE DO HARDWARE - http://www.clubedohardware.com.br/
PC FÓRUM - http://www.pcforum.com.br/ FÓRUM PC - http://forumpcs.ig.com.br/home Vasconcelos, Laércio – Introdução aos
processadores dual core e quad core
Top Related