Resumo sobre organização de computadores

13
Resumo sobre organização de computadores Processadores AMD Os primeiros processadores lançados pela AMD eram também chamados de 386, como os da Intel, sendo autênticas copias dos mesmos. Tais processadores foram produzidos nas versões DX e SX, como a Intel, inclusive com freqüência de operação superior à da Intel (esta produziu 386 até 33 MHz de velocidade, enquanto a AMD produziu processadores com 40 MHz, na versão DX apenas). Já no caso dos processadores de quarta geração, da família 486, a AMD pôde desenvolver e lançar no mercado produtos de sua própria lavra, e não mais simples cópias dos Intel. A AMD produziu o chamado AMD 5x86, processador semelhante aos Intel 486DX4, porém incrementou a multiplicação da freqüência do relógio interno, atingindo uma vez a mais e, por isso, sendo denominado 5x86. Embora utilizasse uma tecnologia de fabricação avançada, 0.35 mícron de espaçamento entre as “linhas” condutoras internas, ainda era um processador de quarta geração pelas suas características iguais as dos 486. O 5x86 foi produzido para funcionar com 133 MHz de velocidade, tendo um desempenho considerado muito bom para o tipo, sendo possível comparar seu desempenho ao de um Pentium 75 MHz, embora autores e analistas achem mais apropriado considerá- lo um 486DX4, com exceção da quantidade de memória cache L1, pois ele possui 16KB enquanto os 5x86 vinham com 8KB. Embora o AMD K5 tenha sido projetado com características internas mais avançadas que o Pentium original (algumas delas são típicas do Pentium Pro, de sexta geração), ele continuou a ser considerado de quinta geração devido às baixas velocidades de relógio com que foi fabricado (75 MHz até 116 MHz). Entre suas principais características pode-se citar:

Transcript of Resumo sobre organização de computadores

Page 1: Resumo sobre organização de computadores

Resumo sobre organização de computadores

Processadores AMD

Os primeiros processadores lançados pela AMD eram também chamados de 386, como os da Intel, sendo autênticas copias dos mesmos. Tais processadores foram produzidos nas versões DX e SX, como a Intel, inclusive com freqüência de operação superior à da Intel (esta produziu 386 até 33 MHz de velocidade, enquanto a AMD produziu processadores com 40 MHz, na versão DX apenas).

Já no caso dos processadores de quarta geração, da família 486, a AMD pôde desenvolver e lançar no mercado produtos de sua própria lavra, e não mais simples cópias dos Intel.

A AMD produziu o chamado AMD 5x86, processador semelhante aos Intel 486DX4, porém incrementou a multiplicação da freqüência do relógio interno, atingindo uma vez a mais e, por isso, sendo denominado 5x86. Embora utilizasse uma tecnologia de fabricação avançada, 0.35 mícron de espaçamento entre as “linhas” condutoras internas, ainda era um processador de quarta geração pelas suas características iguais as dos 486.

O 5x86 foi produzido para funcionar com 133 MHz de velocidade, tendo um desempenho considerado muito bom para o tipo, sendo possível comparar seu desempenho ao de um Pentium 75 MHz, embora autores e analistas achem mais apropriado considerá-lo um 486DX4, com exceção da quantidade de memória cache L1, pois ele possui 16KB enquanto os 5x86 vinham com 8KB.

Embora o AMD K5 tenha sido projetado com características internas mais avançadas que o Pentium original (algumas delas são típicas do Pentium Pro, de sexta geração), ele continuou a ser considerado de quinta geração devido às baixas velocidades de relógio com que foi fabricado (75 MHz até 116 MHz).

Entre suas principais características pode-se citar:

Arquitetura interna do tipo RISC, isto é, ele processa internamente em modo RISC; possui na entrada um decodificador x86, para que esse tipo de instruções possa ser convertido;

Seis unidades pipeline, o processador possui cinco unidades de execução de inteiros e uma de ponto flutuante (o Pentium somente possui duas unidades de inteiros);

Execução de instruções fora de ordem nas duas canalizações de inteiros; O pool de instruções é quatro vezes maior que o do Pentium, permitindo melhor

desempeno na previsão de desvios; O K5 possui uma cache de instruções com 16KB (o dobro dos 8KB do Pentium),

mas a cache de dados também tem 8KB, como nos Pentium; O mapeamento da memória cache no K5 é associativa por conjunto de 4, em vez

do conjunto de 2 da cache dos Pentium.

Page 2: Resumo sobre organização de computadores

O K5 não pode ser considerado um clone dos Pentium, pois é projetado com características próprias (não é cópia, como um clone se define) de funcionamento e desempenho, embora seja semelhante ao processador da Intel.

Com relação aos processadores de sexta geração, de características semelhantes aos Pentium, P6, da Intel, a AMD produziu o K6, modelos 2 e 3.

Entre as principais características do K6 pode-se mencionar:

Tamanho elevado da memória cache L1 - 64KB, sendo 32KB para dados e o restante para instruções. Isto significa o quádruplo da cache L1 do Pentium Pro e o dobro do Pentium II;

Mais decodificadores de instrução - o K6 possui quatro dispositivos decodificadores, um a mais que o Pentium Pro e o Pentium II;

Mais unidades de execução de operações com inteiros – o K6 possui seis dessas unidades, mais do que os processadores produzidos pelas Intel ou Cyrix; isso permitiu um maior paralelismo na execução dos programas, com o conseqüente aumento de velocidade.

O K6 foi produzido inicialmente com velocidades de 166MHz, 200MHz e 233 MHz, tendo um desempenho muito bom, exceto no que se refere ao dispositivo de execução de operações em ponto flutuante.

O AMD K6-2 possui tecnologia de 0,25 mícron de espaçamento ente suas trilhas internas e tem cerca de 9,3 milhões de transistores em sua pastilha. Suas primeiras versões operavam em 300 MHz, sendo posteriormente fabricados processadores com até 450 MH de freqüência.

Como os processadores Intel dessa geração, também o K6-2 incorpora em seu interior um núcleo de microarquitetura RISC. Além disso, o processador da AMD apresentou sensível aperfeiçoamento para a unidade de execução de instruções em formato ponto flutuante.

Com o K6-2, a AMD também progrediu no mercado de computação gráfica e jogos, introduzindo uma tecnologia denominada 3DNow! (uma boa estratégia de marketing), que consiste basicamente na incorporação de 21 instruções MMX ao conjunto de instruções do processador. Tais instruções efetuam processamento sofisticado em ponto flutuante, e são mais avançadas do que as primeiras instruções MMX lançadas pela Intel. Naturalmente, para que o programa do jogo posa tirar partido do aumento de desempenho que essas instruções acarretam é necessário que tenham o driver gráfico apropriado, que manipule diretamente essas instruções. Modelos anteriores àquele lançamento não lucram nada com a inovação.

Uma nova versão do K6, denominada K6-3, nome código Sharptooth, a qual introduziu algumas características novas na arquitetura da família K6 e até no mercado como um todo, a saber:

Incorporação do nível L2 no interior da pastilha (como o Pentium Pro), porém, diferentemente do processador da Intel, que só possuía dois níveis (L1 e L2), ambos internos, o K6-3 acrescentou um terceiro nível de cache, L3, externo ao processador;

Page 3: Resumo sobre organização de computadores

Utilização de um barramento local de 133 MHz, aumentando o desempenho das transferências de dados entre MP e UCP em relação ao barramento de 100 MHz.

O projeto de cache em três níveis torna melhor, sem dúvida, o desempenho do processador. No interior da pastilha do processador são inseridos os dois primeiros níveis, sendo L1 de 64 KB, como nos processadores anteriores (32 KB para dados e 32 KB para instruções) e L2 com 256KB, esta funcionando também na velocidade igual à do processador, como nos Pentium Pro, Celeron e Xeon. Além dessas memórias, a AMD aproveitou-se do fato de estar utilizando uma placa-mãe que possui espaço para uma cache e criou o nível L3 de cache, com até 2MB. Um considerável aumento de desempenho.

Posteriormente ao K6-3, a AMD ainda lançou um modelo denominado K6-2+ e, finalmente, o AMD K7, denominado Athlon, considerado o primeiro processador de sétima geração.

Componentes básicas do processador:

Cache L1 para instruções e Cache L1 para dados, ambas com 64B; Fetch/Decode Control – módulo para controle dos decodificadores de instruções; Instruction decoders – decodificadores de instruções; Instruction Control Unit – Unidade básica de controle do processador; Seis unidades de execução de cálculos com valores inteiros e três unidades de

cálculo de valores em ponto flutuante;

O K7, Athlon, possui um formato semelhante ao Pentium III, porém ele era inserido em um soquete específico da AMD, denominado slot A, pois a Intel não licenciou seu soquete 1. Embora semelhantes, os soquetes são eletronicamente incompatíveis.

As principais características do K7, um processador de 22 milhões de transistores, são:

Múltiplos decodificadores de instruções – três decodificadores para traduzir instruções x86 (CISC) em instruções tipo RISC, podendo se ter até nove instruções executadas simultaneamente o aumento de desempenho devido a esta facilidade é acentuado;

Memória cache L1 com 128KB, operando na velocidade do relógio e memória cache L2, também interna na pastilha, com até 8MB (um acréscimo considerábel). Até onde se pode verificar, no entanto, a AMD estará utilizando apenas 512KB dessa cache, cujo tamanho deverá crescer nos próximos lançamentos;

Velocidade inicial de 500 MHz; Capacidade de realizar multiprocessamento, o que acontece pela primeira vê nos

processadores da AMD, capacitando o emprego desses processadores no mercado de servidores, até então dominado pela Intel e outros processadores mais potentes, como o Alpha da Compaq (antiga DEC). Esta possibilidade decorre principalmente devido ao emprego no K7 da arquitetura do processador Alpha (protocolo EV6), o qual implementa a topologia do tipo ponto a ponto. Ou seja, se há vários processadores no sistema, cada um deles obtém uma conexão ponto a ponto com a pastilha de apoio (chipset);

Page 4: Resumo sobre organização de computadores

Novo projeto na área de processamento de números representados em ponto flutuante, as quais podem executar instruções em paralelo (se uma não depender da outra, é claro) ou mesmo fora de ordem;

Novo barramento de sistema de 200 MHz.

Introdução a Organização de Computadodores – Quinta edição, Mario A Monteiro.

Os principais modos de endereçamento de memória são:

Imediato: O campo operando contém o dado, desta forma o dado é transferido da memória juntamente com a instrução. Vantagem: Rapidez na execução da instrução, pois não requer acesso à memória principal, apenas na busca da própria instrução.

Desvantagem. Limitação do tamanho do campo operando das instruções reduzindo o valor máximo do dado a ser manipulado. Trabalho excessivo para alteração de valores quando o programa é executado repetidamente e o conteúdo das variáveis serem diferentes em cada execução.

Direto: O campo operando da instrução contém o endereço onde se localiza o dado.

Vantagem. Flexibilidade no acesso a variáveis de valor diferente em cada execução do programa.

Indireto: O campo de operando contém o endereço de uma célula, sendo o valor contido nesta célula o endereço do dado desejado.

Vantagem: Usar como “ponteiro”. Elimina o problema do modo direto de limitação do valor do endereço do dado. Manuseio de vetores (quando o modo indexado não está disponível).

Desvantagem: Muitos acesso à MP para execução, requer pelo menos 2 acessos à memória principal.

Por registrador: característica semelhante aos modos direto e indireto, exceto que a célula (ou palavra) de memória referenciada na instrução é substituída por um dos registradores da UCP. O endereço mencionado na instrução passa a ser o de um dos registradores.

Vantagens: Menor quantidade de bits para endereçar os registradores, por conseqüência, redução da instrução. E o dado pode ser armazenado em um meio mais rápido (registrador).

Desvantagens: Devido ao número reduzido de registradores existentes na UCP causa uma dificuldade em se definir quais dados serão armazenados nos registradores e quais permanecerão na UCP.

Indexado: consiste em que o endereço do dado é a soma do valor do campo operando (que é fixo para todos os elementos de um dado vetor) e de um valor armazenado em um dos registradores da UCP (normalmente denominado registrador índice).

Page 5: Resumo sobre organização de computadores

Vantagem: Rapidez de execução das instruções de acesso aos dados, visto que a alteração do endereço dos elementos é realizada na própria UCP.

Base mais deslocamento: o endereço é obtido da soma do campo de deslocamento com o conteúdo do registrador base. Este modo de endereçamento tem como objetivo permitir a modificação de endereço de programas ou módulos destes, bastando para isso alterar o registrador base.

Vantagem: Reduz o tamanho das instruções e facilita o processo de relocação de programas.

Compilação e Interpretação

A compilação consiste na análise de um programa escrito em linguagem de alto nível (programa fonte) e sua tradução em um programa em linguagem de máquina (programa objeto). A interpretação tem como vantagem sobre a compilação a capacidade de identificação e indicação de um erro no programa-fonte (incluindo erro da lógica do algoritmo) durante o processo de conversão do fonte para o executável.

Na interpretação cada comando do código fonte é lido pelo interpretador, convertido em código executável e imediatamente executado antes do próximo comando. A interpretação tem como desvantagem o consumo de memória devido ao fato de o interpretador permanecer na memória durante todo o processo de execução do programa. Na compilação o compilador somente é mantido na memória no processo de compilação e não utilizado durante a execução. Outra desvantagem da interpretação está na necessidade de tradução de partes que sejam executadas diversas vezes, como os loops que são traduzidos em cada passagem. No processo de compilação isto só ocorre uma única vez. Da mesma forma pode ocorrer para o programa inteiro, em caso de diversas execuções, ou seja, a cada execução uma nova interpretação.

Computadores Vetoriais e Computadores Matriciais

O termo computadores vetoriais que correspondem a sistemas compostos por processadores vetoriais que freqüentemente são associados a organização de ULAs com pipeline de operações.

E o termo computadores matriciais correspondem a sistemas compostos por processadores matriciais cuja organização é formada de ULAs paralelas.

Sistemas SMP (ou UMA) têm como característica o acesso a todas as partes da memória principal com tempo de acesso uniforme.

Sistemas NUMA, todos os processadores possuem também acesso a todas as partes da memória principal podendo diferir o tempo de acesso em relação às posições da memória e processador. Nos sistemas SMP o aumento no número de processadores tem como conseqüência problemas de tráfego no barramento comum degradando o desempenho. Uma solução para isto é a utilização de clusters, que tem, usualmente, como conseqüência alterações significativas na aplicação (software). Nos sistemas

Page 6: Resumo sobre organização de computadores

NUMA podem-se ter vários nós multiprocessadores, cada qual com seu próprio barramento, resultando em pequenas alteraçõ es na aplicação (software).

Arquiteturas Risc e Cisc

RISC: Reduced Instruction Set Computer – Computador com um conjunto reduzido de instruções.

CISC - Complex Instruction Set Computer: Computador com um conjunto complexo de instruções.

CISC: Principais características:

Possui microprogramação para aumento da quantidade de instruções incluindo novos modos de endereçamento, de forma a diminuir a complexidade dos compiladores e em conseqüência permitir linguagens de alto nível com comandos poderosos para facilitar a vida dos programadores. Em contrapartida, muitas instruções significam muitos bits em cada código de operação, instrução com maior comprimento e maior tempo de interpretação.

Exemplos: IBM/370-168 (exemplo antigo), Intel 80486, Intel Pentium, Intel Xeon.

RISC: Principais características:

Menor quantidade de instruções e tamanho fixo. Não há microprogramação. Permite uma execução otimizada, mesmo considerando que uma menor quantidade de instruções vá conduzir a programas mais longos. Uma maior quantidade de registradores e suas utilizações para passagem de parâmetros e recuperação dos dados, permitindo uma execução mais otimizada de chamada de funções. Menor quantidade de modos de endereçamento com o objetivo da redução de ciclos de relógio para execução das instruções. Instruções de formatos simples e únicos tiram maior proveito de execução com pipeline cujos estágios consomem o mesmo tempo.

Exemplos: Power PC, Série Sparc, Alpha 21064.

Barramento PCI

 PCI - Peripheral Component Interconnect (Interconexão de Componentes Periféricos).

Page 7: Resumo sobre organização de computadores

Uma placa PCI típica

O PCI é uma mistura do ISA e do VL-Bus. Fornece acesso direto à memória do sistema para dispositivos conectados, mas usa uma ponte para se conectar ao barramento frontal (frontside bus) e, portanto, ao processador. Basicamente, significa que tem um desempenho ainda melhor do que o VL-Bus, além de eliminar uma possível interferência com o processador.

Placas PCI têm 47 pinos

 

Tipo de barramento

Largura do barramento

Velocidade do barramento

MB/s

ISA 16 bits 8 MHz16

MBps

EISA 32 bits 8 MHz32

MBps

VL-bus 32 bits 25 MHz100

MBps

VL-bus 32 bits 33 MHz132

MBps

PCI 32 bits 33 MHz132

MBps

Page 8: Resumo sobre organização de computadores

PCI 64 bits 33 MHz264

MBps

PCI 64 bits 66 MHz512

MBps

PCI 64 bits 133 MHz 1 GBps

O PCI conecta mais dispositivos do que o VL-Bus, até cinco componentes externos. Cada um dos cinco conectores para um componente externo pode ser substituído por dois dispositivos fixos na placa-mãe. Além disso, você pode ter mais do que um barramento PCI no mesmo computador, apesar de ser raro. O chip da ponte do PCI regula a velocidade do barramento, independentemente da velocidade do processador. Isto torna o sistema mais seguro, e faz com que os fabricantes de hardware PCI saibam exatamente o que fazer.

O PCI no início operava a 33MHz, usando um caminho de 32 bits de largura. O padrão foi atualizado, e sua velocidade subiu de 33MHz para 66MHz, e sua largura dobrou para 64 bits. Atualmente, o PCI-X transfere em 64 bits a uma velocidade de 133MHz a uma incrível taxa de transferência de 1GBps (gigabyte por segundo).

  As placas PCI têm 47 pinos (49 para uma placa com "bus mastering", que controla o barramento PCI sem intervenção do processador). O barramento PCI consegue trabalhar com poucos pinos por causa da multiplexação de hardware, que significa que o dispositivo envia mais do que um sinal por pino. Além disso, o PCI é compatível com dispositivos que usam tanto 5 volts como 3,3 volts.

Podem ocorrer alguns problemas se dois dispositivos desejarem tornar-se mestres ao mesmo tempo. Para resolver esse conflito surge a necessidade de um mecanismo pra efetuar a arbitragem do barramento. No barramento PCI um único árbitro determina quem será o próximo mestre (arbitragem centralizada).

Arbitração:

Quando enxerga uma requisição de uso, o árbitro envia um sinal de garantia de uso do barramento por uma linha que está ligada a todos os dispositivos de E/S.

Passa a ser o mestre o dispositivo que fez uma requisição de uso e está mais próximo fisicamente do barramento. Esse procedimento é denominado Daisy chaining. Uma outra maneira de fazer a arbitragem do barramento, que evita a questão da distância física dos dispositivos, é a arbitragem por prioridades.

http://informatica.hsw.uol.com.br/pci-express2.htm

Tecnologia OLED

OLED (Organic Light-Emitting Diode ou Diodo Orgânico Emissor de Luz) essa tecnologia promete suprir os grandes problemas atuais dos dispositivos de vídeo à um custo aceitável para o mercado de produtos de consumo.

Page 9: Resumo sobre organização de computadores

O LED (Diodo emissor de luz) é um dispositivo eletrônico composto de materiais metálicos que quando excitado eletricamente emite um faixo de luz de uma freqüência bem específica. O OLED diferencia-se de seu primo (LCD) por usar em sua construção substâncias eletroluminescentes compostas de Carbono. Ao serem excitadas por uma corrente elétrica essas substâncias emitem luz em uma freqüência determinada por sua composição química. Painéis de vídeo compostos por OLEDs pode ser extremamente finos (como uma folha de papel) e flexíveis (executados em materiais plásticos, como polímeros). Essa possibilidade surge do fato de que as substâncias químicas que compõe o OLED podem ser impressas em um filme plástico (como um documento é impresso em papel) para marcar os pixels. Ao colar outro filme plástico sobre a impressão cria-se pequenas capsulas que aprisionam cada pixel. A aplicação de eletrodos minúsculos à cada célula permite que se leve à ela a corrente elétrica necessária para excitar cada uma das cores primárias que irão compor as imagens. Essa técnica permite a construção de monitores muito pequenos ou grandes, resistentes à água devido à sua natureza plástica, e flexíveis ou até mesmo dobráveis.

As primeiras aplicações de monitores OLED foram em dispositivos móveis, como celulares, PDAs e até mesmo notebooks; onde a pequena espessura e o baixo peso da tela são mais importantes que outros fatores. Entretanto o preço de produção de monitores com essa tecnologia tem caído bastante e hoje já é possível construir telas OLED mais baratas e tão duráveis quanto telas LCD equivalentes. Além da simplicidade construtiva e das vantagens físicas os monitores OLED ainda superam seus rivais em vários aspectos técnicos. Monitores OLED são capazes de criar a cor preta, gerando o chamado “real black” e conseguem taxas de contraste 10 vezes maiores que monitores LCD produzidos atualmente. Não são sucetíveis ao efeito burn-out que agride monitores CRT e Plasma, situação onde a exibição prolongada de uma mesma imagem marca a tela de forma definitiva, sim isso acontece com a maioria das telas de Plasma produzidas hoje em dia. Ainda que uma nova tecnologia de Plasma tenha sido desenvolvida para evitar o burn-out ela resulta em telas mais caras, razão que levou muitos fabricantes à ignorá-la. A rigor, ao comprar uma tela de Plasma, você dificilmente conseguirá saber se aquele modelo específico é resistente ou não ao efeito danoso. Isso pode levar à desagradável situação de, após pagar o valor de uma pequena moto em uma TV, você observar aquele pequeno símbolo da Globo no canto inferior direito da tela durante uma reprodução de DVD.

Além disso, o OLED dispensa iluminação de background, necessária nos LCDs, o que o torna a tecnologia mais econômica em termos de consumo de energia disponível atualmente. Além de ser ótimo para dispositivos que operam com baterias isso é um grande ponto a favor da técnica já que a economia de energia é uma preocupação global. O OLED é capaz de reproduzir cores tão bem quanto o Plasma e apresentar um tempo de resposta muito menor que o do LCD.

Entretanto alguns fatores continuam a atrasar a adoção em massa da nova tecnologia. Mesmo tendo custos de produção mais baixos que outras técnicas o OLED é relativamente recente. Muitas empresas, como a Kodak, que desenvolveram partes importantes da tecnologia, ainda cobram valores excessivamente altos pelas patentes e licenças de produção em busca de ressarcirem seus gastos em pesquisa e desenvolvimento. Além disso, os altos gastos na implementação das tecnologias atuais ainda não foram completamente amortizados. Muitos fabricantes não desejam

Page 10: Resumo sobre organização de computadores

tirar seus monitores LCD e Plasma de linha ainda por entenderem que ainda há muito dinheiro a ser feito com esses produtos antes que uma nova tecnologia possa ser levada ao mercado de massa. Entretanto a queda significativa nos preços dos monitores LCD e Plasma verificada em todos os mercados é uma mostra de que, assim que essas tecnologias tornem-se o padrão, estará aberto o caminho para que outra possa ser implementada.

Mas o OLED ainda tem alguns detalhes a resolver antes que seja a tecnologia usada em sua próxima TV. A fragilidade dos filmes plásticos, que se rompidos inutilizam o monitor, é uma delas. A durabilidade dos compostos, especialmente os que reproduzem freqüências azuis, é outra. Entretanto parece claro que é o OLED a tecnologia que irá assumir o lugar do LCD e do Plasma no futuro, por unir as qualidades de ambos e ainda apresentar características que nenhuma delas pode reproduzir.

http://meiobit.com/9595/a-tecnologia-oled-para-monitores-de-video/