Sistemas Distribuídos RAID

of 28 /28
Sistemas Distribuídos RAID Professor: Ricardo Quintão e-mail: [email protected] Site: www.rgquintao.com.br

Embed Size (px)

description

Sistemas Distribuídos RAID. Professor: Ricardo Quintão e-mail: [email protected] Site: www.rgquintao.com.br. RAID. - PowerPoint PPT Presentation

Transcript of Sistemas Distribuídos RAID

Apresentao do PowerPoint

Sistemas Distribudos

RAIDProfessor: Ricardo Quintoe-mail: [email protected]: www.rgquintao.com.brRedundant Array of Independent Drives (RAID) um meio de se criar um sub-sistema de armazenamento composta por vrios discos individuais, com a finalidade de ganhar segurana e desempenho. O sistema RAID consiste em um conjunto de dois ou mais discos rgidos com dois objetivos bsicos:Tornar o sistema de disco mais rpido (isto , acelerar o carregamento de dados do disco), atravs de uma tcnica chamada diviso de dados (data striping ou RAID 0);Tornar o sistema de disco mais seguro, atravs de uma tcnica chamada espelhamento (mirroring ou RAID 1).

Essas duas tcnicas podem ser usadas isoladamente ou em conjunto. RAIDNo striping, ou distribuio, os dados so subdivididos em segmentos consecutivos (stripes, ou faixas) que so escritos seqencialmente atravs de cada um dos discos de um array, ou conjunto.Cada segmento tem um tamanho definido em blocos. A distribuio, ou striping, oferece melhor desempenho comparado a discos individuais, se o tamanho de cada segmento for ajustado de acordo com a aplicao que utilizar o conjunto, ou array.No caso da aplicao armazenar pequenos registros de dados, preferem-se segmentos grandes.Se o tamanho de segmento para um disco grande o suficiente para conter um registro inteiro, os discos do array podem responder independentemente para as requisies simultneas de dados.RAID 0 Striping ou DistribuioCaso contrrio, se a aplicao armazenar grandes registros de dados, os segmentos de pequeno tamanho so os mais apropriados.Se um determinado registro de dados est armazenado em vrios discos do array, o contedo do registro pode ser lido em paralelo, aumentando o desempenho total do sistema.Uma vantagem em ter dois (ou mais) HDs ligados em RAID 0, a questo de espao de armazenamento, que ao contrrio do RAID 1 (veremos mais adiante), o RAID 0 soma o espao dos HDs.Por exemplo, se tivermos ligado numa mquina 2 HDs de 80GB, a capacidade total que poderemos usar ser de 160GB.

RAID 0 Striping ou DistribuioVantagens:Acesso rpido as informaes (at 50% mais rpido).Custo baixo para expanso de memria. Desvantagens:Caso algum dos setores de algum dos HDs venha a apresentar perda de informaes, o mesmo arquivo que est dividido entre os mesmos setores dos demais HDs no tero mais sentido existir, pois uma parte do arquivo foi corrompida, ou seja, caso algum disco falhe, no tem como recuperar. No usado paridade.

RAID 0 Striping ou DistribuioRAID 0 Striping ou DistribuioA1A3A5A7A2A4A6A8RAID 0RAID 1 o nvel de RAID que implementa o espelhamento de disco, tambm conhecido como mirror.Para esta implementao so necessrios no mnimo dois discos.O funcionamento deste nvel simples: todos os dados so gravados em dois discos diferentes; se um disco falhar ou for removido, os dados preservados no outro disco permitem a no descontinuidade da operao do sistema.Apesar de muitas implementaes de RAID 1 envolverem dois grupos de dados (da o termo espelho ou mirror), trs ou mais grupos podem ser criados se a alta confiabilidade for desejada.O RAID 1 o que oferece maior segurana, pois toda informao guardada simultaneamente em dois ou mais discos.RAID 1 Mirroring ou EspelhamentoSe ocorrer uma falha num dos discos do array, o sistema pode continuar a trabalhar sem interrupes, utilizando o disco que ficou operacional.Os dados ento so reconstrudos num disco de reposio (spare disk) usando dados do(s) disco(s) sobrevivente(s).O processo de reconstruo do espelho tem algum impacto sobre o desempenho de I/O do array, pois todos os dados tero de ser lidos e copiados do(s) disco(s) intacto(s) para o disco de reposio.Com o RAID 1 consegue-se duplicar o desempenho na leitura de informao, pois as operaes de leitura podem ser repartidas pelos dois discos.RAID 1 oferece alta disponibilidade de dados, porque no mnimo dois grupos completos so armazenados.

RAID 1 Mirroring ou EspelhamentoConectando os discos primrios e os discos espelhados em controladoras separadas, pode-se aumentar a tolerncia a falhas pela eliminao da controladora como ponto nico de falha.Entre os no-hbridos, este nvel tem o maior custo de armazenamento pois estaremos utilizando dois ou mais discos para a mesma informao.Este nvel adapta-se melhor em pequenas bases de dados ou sistemas de pequena escala que necessitem de confiabilidade.RAID 1 Mirroring ou EspelhamentoVantagens:Caso algum setor de um dos discos venha a falhar, basta recuperar o setor defeituoso copiando os arquivos contidos do segundo disco.Segurana nos dados (com relao a possveis defeitos que possam ocorrer no HD). Desvantagens:Custo relativamente alto se comparado ao RAID 0.Ocorre aumento no tempo de escrita.No usado paridade. RAID 1 Mirroring ou EspelhamentoRAID 1 Mirroring ou EspelhamentoA1A2A3A4A1A2A3A4RAID 1RAID 2 similar ao RAID 4, mas armazena informao ECC, que a informao de controle de erros, no lugar da paridade.Este fato possibilita uma pequena proteo adicional, porm o RAID 2 ficou obsoleto pelas novas tecnologias de disco que j possuem este tipo de correo internamente.O RAID 2 oferece uma maior consistncia dos dados se houver queda de energia durante a escritaBaterias de segurana e um encerramento correto podem oferecer os mesmos benefciosRAID 2Vantagem:Usa ECC; Desvantagem:Hoje em dia h tecnologias melhores para o mesmo fim; RAID 2RAID 2A1B1C1D1A2B2C2D2RAID 2A3B3C3D3EccAEccBEccCEccDFunciona com trs ou mais discos iguais.Um dos discos guarda a paridade (uma forma de soma de segurana) da informao contida nos discos.Se algum dos discos avariar, a paridade pode ser imediatamente utilizada para reconstituir o seu contedo.Os discos restantes, usados para armazenar dados, so configurados para usarem segmentos suficientemente grandes (tamanho medido em blocos) para acomodar um registro inteiro.Isto permite leituras independentes da informao armazenada, fazendo do RAID 4 um array perfeitamente ajustado para ambientes transacionais que requerem muitas leituras pequenas e simultneas.O RAID 4 assim como outros RAID's, cuja caracterstica utilizarem paridade, usam um processo de recuperao de dados mais envolvente que arrays espelhados, como RAID 1.RAID 4Este nvel tambm til para criar discos virtuais de grande dimenso, pois consegue somar o espao total oferecido por todos os discos, exceto o disco de paridade.O desempenho oferecido razovel nas operaes de leitura, pois podem ser utilizados todos os discos simultaneamente.Sempre que os dados so escritos no array, as informaes so lidas do disco de paridade e um novo dado sobre paridade deve ser escrito para o respectivo disco antes da prxima requisio de escrita ser realizada.Por causa dessas duas operaes de I/O, o disco de paridade o fator limitante do desempenho total do array.Devido ao fato do disco requerer somente um disco adicional para proteo de dados, este RAID mais acessvel em termos monetrios que a implementao do RAID 1.RAID 4Vantagens:Taxa de leitura rpida;Possibilidade do aumento de rea de discos fsicos. Desvantagens:Taxa de gravao lenta.Em comparao com o RAID 1, em caso de falha do disco, a reconstruo difcil, pois o RAID 1 j tem o dado pronto no disco espelhado.Tecnologia no mais usada por haver melhores para o mesmo fim. RAID 4RAID 4A1B1C1D1A2B2C2D2RAID 4A3B3C3D3ApBpCpDpO RAID 5 frequentemente usado e funciona similarmente ao RAID 4, mas supera alguns dos problemas mais comuns sofridos por esse tipo.As informaes sobre paridade para os dados do array so distribudas ao longo de todos os discos do array, ao invs de serem armazenadas num disco dedicado, oferecendo assim mais desempenho que o RAID 4, e, simultaneamente, tolerncia a falhas.O desempenho geral de um array RAID 5 equivalente ao de um RAID 4, exceto no caso de leituras sequenciais, que reduzem a eficincia dos algoritmos de leitura por causa da distribuio das informaes sobre paridade.A informao sobre paridade distribuda por todos os discos; perdendo-se um, reduz-se a disponibilidade de ambos os dados e a paridade, at recuperao do disco que falhou.RAID 5Isto causa degradao do desempenho de leitura e de escrita.Vantagem:Leitura rpida (porm escrita no to rpida).Desvantagem:Sistema complexo de controle dos HD's. RAID 5RAID 5A1B1C1DpA2B2CpD1RAID 5A3BpC2D2ApB3C3D3 um padro relativamente novo, suportado por apenas algumas controladoras. semelhante ao RAID 5, porm usa o dobro de bits de paridade, garantindo a integridade dos dados caso at 2 dos HDs falhem ao mesmo tempo.Ao usar 8 HDs de 20 GB cada um em RAID 6, teremos 120 GB de dados e 40 GB de paridade.Vantagem:Podem falhar 2 HD's ao mesmo tempo. Desvantagens:Precisa de N+2 HD's para implementar por causa dos discos de paridade.Escrita lenta.Sistema complexo de controle dos HD's. RAID 6O RAID 0 + 1 uma combinao dos nveis 0 (Striping) e 1 (Mirroring), onde os dados so divididos entre os discos para melhorar o rendimento, mas tambm utilizam outros discos para duplicar as informaes.Assim, possvel utilizar o bom rendimento do nvel 0 com a redundncia do nvel 1.No entanto, necessrio pelo menos 4 discos para montar um RAID desse tipo.Tais caractersticas fazem do RAID 0 + 1 o mais rpido e seguro, porm o mais caro de ser implantado.No RAID 0+1, se um dos discos vier a falhar, o sistema vira um RAID 0.RAID 0 + 1Vantagens:Segurana contra perda de dados.Pode falhar metade dos HD's ao mesmo tempo, porm deixando de ser RAID 0 + 1. Desvantagens:Alto custo de expanso de hardware (custo mnimo = 2N HD's).Os drivers devem ficar em sincronismo de velocidade para obter a mxima performance. RAID 0 + 1RAID 0 + 1A1A3A5A7A2A4A6A8RAID 1A1A3A5A7A2A4A6A8RAID 0RAID 0O RAID 1+0, ou 10, exige ao menos 4 discos rgidos.Cada par ser espelhado, garantindo redundncia, e os pares sero distribudos, melhorando desempenho.At metade dos discos pode falhar simultaneamente, sem colocar o conjunto a perder, desde que no falhem os dois discos de um espelho qualquer razo pela qual usam-se discos de lotes diferentes de cada lado do espelho. o nvel recomendado para bases de dados, por ser o mais seguro e dos mais velozes, assim como qualquer outro uso onde a necessidade de economia no se sobreponha segurana e desempenho.RAID 1 + 0Vantagens:Segurana contra perda de dados.Pode falhar metade dos HD's ao mesmo tempo. Desvantagens:Alto custo de expanso de hardware (custo mnimo = 2N HD's).Os drivers devem ficar em sincronismo de velocidade para obter a mxima performance. RAID 1 + 0RAID 1 + 0 ou RAID 10A1A3A5A7A1A3A5A7RAID 0A2A4A6A8A2A4A6A8RAID 1RAID 1