Post on 08-Feb-2016
description
Especializaçãoem Segurançada Informação
Segurança no Armazenamento1. Introdução
Márcio Aurélio Ribeiro Moreiramarcio.moreira@pitagoras.com.brhttp://si.lopesgazzani.com.br/docentes/marcio/
Márcio Moreira 1. Introdução – Slide 2 Segurança no Armazenamento de Informações
Objetivos da unidade
Explicitar a necessidade de armazenamentoAvaliar as alternativas de soluçãoRevisar os principais conceitos de
armazenamentoExplorar os tipos de RAIDMostrar as alternativas de redes de
armazenamento
Márcio Moreira 1. Introdução – Slide 3 Segurança no Armazenamento de Informações
O armazenamento não está resolvido?
O número total de livros produzidos desde o começo da imprensa não passa de 1 bilhão:Se cada livro tiver em média 500 páginas com
2000 caracteres cada. Logo, 1 MB é suficiente para armazenar cada livro sem compressão
Para armazenar todos os livros precisamos de 1 bilhão de MB ou 1 PetaByte (PB)
Considerando Us$20 / GB, 1 PB pode ser comprado por Us$20 milhões
Márcio Moreira 1. Introdução – Slide 4 Segurança no Armazenamento de Informações
O armazenamento nas organizaçõesBanco da Índia (2007):
14.000 filiais em todo o país11.000 escritórios conectados ao Data CenterMais de 20 milhões de clientes≈ 100 TB armazenados
Crescimento exponencialQuestões de segurança:
Compressão / CifragemAntivírusFirewall e IDS
Fonte: Ramakrishnan
Márcio Moreira 1. Introdução – Slide 5 Segurança no Armazenamento de Informações
Demanda de performance e espaço
1X
2X
3X
4X
5X
6X
7X
8X
Hoje 1 Ano 2 anos 3 anos 4 anos 5 anos
50%
100%
150%
200%
250%
300%
DemandaPerformance
DemandaEspaço
Demanda anual de 50% de espaço e
performance
1X 1.5X2.3X
3.4X5.1X
7.6X
253%
169%
113%
75%50%
Font
e: R
amak
rishn
an
Márcio Moreira 1. Introdução – Slide 6 Segurança no Armazenamento de Informações
Alternativas para a demanda
Podemos resolver com RAMs?Caras e voláteis só para processamento
Podemos utilizar fitas?Baratas e lentas por serem seqüenciais backups
Podemos resolver com CDs e DVDs?Baratos e aleatórios. Mas, lentos distribuição
Podemos resolver com HDs?Preço justo, aleatórios e rápidos muitos HDsOnde colocar tantos HDs? Fora do gabinete
Márcio Moreira 1. Introdução – Slide 7 Segurança no Armazenamento de Informações
Camadas de dadosComputadoresNotebooks
Dispositivos
Pessoas e Coisas
Camada de Banco de Dados
Camada web
Camada Aplicações
Camada de StorageFonte: Ramakrishnan
Márcio Moreira 1. Introdução – Slide 8 Segurança no Armazenamento de Informações
1º dispositivo magnético
A superfície do disco (ou fita) é coberta com uma substância magnética Movimento mecânico posiciona cabeça do dispositivo para:
Gravação: definir a polarização. Leitura: testar a polarização Por ser magnética, a polarização é mantida mesmo sem energia
Márcio Moreira 1. Introdução – Slide 9 Segurança no Armazenamento de Informações
Armazenamento em discos
Organiza os dados em áreas endereçáveis Devem ser formatados para serem endereçáveis
pelos sistemas operacionais O acesso direto provê performance adequada para
acessos seqüencial ou randômico O desempenho do disco é impactado pelo tempo
de posicionamento da cabeça para o acesso Os discos são conectados fisicamente ao sistema:
É inviável movê-los para um novo local ou novo sistemaComo conectar vários discos num mesmo sistema?
Márcio Moreira 1. Introdução – Slide 10 Segurança no Armazenamento de Informações
Vamos olhar os discos de perto
Márcio Moreira 1. Introdução – Slide 11 Segurança no Armazenamento de Informações
Formatação para acesso direto
Trilha Cada prato do disco é segmentado em vários anéis concêntricos chamados trilhas
O endereço único de uma área em um drive de disco é composto de: Cilindro, Cabeça e Setor.
Um setor é a menor parte endereçável de uma trilha
Setor
Fonte: EMC
Cilindro Um cilindro é o conjunto formato por uma trilha específica em todos os pratos juntas
Márcio Moreira 1. Introdução – Slide 12 Segurança no Armazenamento de Informações
Tempo de acesso ao drive de disco
Seek Time:Tempo de buscaMédia de tempo gasto
para mover o braço do atuador para a posição de leitura ou gravação da cabeça na trilha
Normalmente, informado em milissegundos (ms)
Fonte: EMC
Márcio Moreira 1. Introdução – Slide 13 Segurança no Armazenamento de Informações
Tempo de acesso ao drive de disco
Latency:Tempo de Latência ou
tempo de espera racionalMédia de tempo gasto
para esperar o disco girar e o setor desejado chegar o início da posição de acesso
Tempo de meia volta:50% * 1 / RPM / 60 * 1000
Fonte: EMC
Márcio Moreira 1. Introdução – Slide 14 Segurança no Armazenamento de Informações
Tempo de acesso ao drive de disco
Transfer Rate:Taxa de TransferênciaMédia de tempo gasto
para ler (ou escrever) e enviar (ou receber) os dados do setor para o drive de disco (MB)
Tempo de Transferência:Kbytes / (taxa * 1024) *
1000 (ms)
Fonte: EMC
Márcio Moreira 1. Introdução – Slide 15 Segurança no Armazenamento de Informações
Variáveis da performance de discos Tempo de Busca (TB) Tempo de Latência (TL):
Velocidade rotação RPM RPM Tempo de Latência RPM tem menor impacto na Taxa de
Transferência TL = 50% * 1 / RPM / 60 * 1000 (ms)
Taxa de Transferência (TT):Ultra SCSI: 40 MB/secCanal de fibra: 100 MB/secTT = Kb / (taxa * 1024) * 1000 (ms)
Tempo de Resposta (TR): TR = TB + TL + TT
Fonte: EMC
Márcio Moreira 1. Introdução – Slide 16 Segurança no Armazenamento de Informações
Evolução da tecnologia de discos A capacidade continua aumentando muito
com o aumento da densidade dos dados A performance aumenta marginalmente com:
Aumento da velocidade de rotação (RPM) Aumento do uso da memória e cache no nível de drive
As interfaces são dirigidas por padrões da indústria: ATA (Advanced Technology Attachment) Ultra SCSI (Small Computer System Interface) Canal de Fibra
Desafios da indústria: Aumentar a capacidade por disco reduzindo custo. Mas, … Reduzir o número de atuadores mantendo a capacidade
Fonte: EMC
Márcio Moreira 1. Introdução – Slide 17 Segurança no Armazenamento de Informações
Necessidades de armazenamentoHigh-EndUs$40/GB
Deman-da do
negócio
Alta Performance
Tempo Crítico Midrange Us$20/GB
SATAUs$5/GB
TapeUs$0.5/GB
Alta Capacidade
Custo Crítico
100%
99.999%
99.9%
Longo PrazoFonte: Ramakrishnan
Márcio Moreira 1. Introdução – Slide 18 Segurança no Armazenamento de Informações
Tecnologia RAID
Como obter performance e confiabilidade?RAID:
Redundant Array of Independent DisksUm conjunto de HDs é visto pelo SO como uma única unidade
de discoVantagens:
Grande capacidade de armazenamentoAcesso paralelo melhor performancePermite o espelhamento de dados
Desvantagens:Custo: requer hardware ou software especialSe espelhado: requer o dobro de espaço
Márcio Moreira 1. Introdução – Slide 19 Segurança no Armazenamento de Informações
Conexões físicas dos discos Variáveis para conexões físicas:
Tipos de cabos Número de vias Conectores físicos
Regras para conexões lógicas: Identificar os comandos (de leitura e
gravação) e os dados Formato do drive:
Esquema de endereçamento Sistema
controlador ouplaca de circuito: ESCON para mainframe Host Bus Adapter (placas para fibra
ótica) para sistemas abertos Placas proprietárias para o AS/400
System Bus
CPU
MAIN MEMORY(RAM)
ROM(Read Only Memory)
HBA
Fonte: EMC
Márcio Moreira 1. Introdução – Slide 20 Segurança no Armazenamento de Informações
Como a operação de I/O ocorre
System Bus
CPU
MAIN MEMORY(RAM)
ROM(Read Only Memory)
HBA
Fonte: EMC
Iniciando uma requisição de leitura:
Márcio Moreira 1. Introdução – Slide 21 Segurança no Armazenamento de Informações
Como a operação de I/O ocorre
System Bus
CPU
MAIN MEMORY(RAM)
ROM(Read Only Memory)
HBA
Fonte: EMC
Completando a requisição de leitura:
Márcio Moreira 1. Introdução – Slide 22 Segurança no Armazenamento de Informações
Usando melhor a CPU e a memória
System Bus
CPU
MAIN MEMORY(RAM)
ROM(Read Only Memory)
HBA
Fonte: EMC
“Vamos ver”:Acessamos o cliente 1Depois o cliente 2Qual será o próximo?Presumo o cliente 3
Técnica:CacheRead ahead
Customer 1 Meter Reading
Customer 2 Meter Reading
Customer 3 Meter Reading
Customer 1Meter Reading
Customer 2Meter Reading
CACH
ECustomer 3Meter Reading
Márcio Moreira 1. Introdução – Slide 23 Segurança no Armazenamento de Informações
Usar controladora no RAID:Libera processamentoLibera memória RAM
Melhorando ainda mais
System Bus
CPU
MAIN MEMORY(RAM)
ROM(Read Only Memory)
HBA
Fonte: EMC
Customer 1 Meter Reading
Customer 2 Meter Reading
Customer 3 Meter Reading
Customer 1Meter Reading
Customer 2Meter Reading
Customer 3Meter Reading
CACH
ECPU
Márcio Moreira 1. Introdução – Slide 24 Segurança no Armazenamento de Informações
Iniciando um comando de escrita:
Como a operação de I/O ocorre
System Bus
CPU
MAIN MEMORY(RAM)
ROM(Read Only Memory)
HBA
Fonte: EMC
Márcio Moreira 1. Introdução – Slide 25 Segurança no Armazenamento de Informações
Completando o comando de escrita:
Como a operação de I/O ocorre
System Bus
CPU
MAIN MEMORY(RAM)
ROM(Read Only Memory)
HBA
Fonte: EMC
Márcio Moreira 1. Introdução – Slide 26 Segurança no Armazenamento de Informações
Melhor uso da CPU e memória
System Bus
CPU
MAIN MEMORY(RAM)
ROM(Read Only Memory)
HBA
Fonte: EMC
Customer 1 Meter Reading
Customer 2 Meter Reading
Customer 3 Meter ReadingCA
CHECPU
Comando de escrita:“Grave a conta mensaldo cliente no disco”.A confirmação de escrita
é emitida assim que os dadose o comando de gravação estão
seguros dentro de uma áreacompletamente tolerante à
falha
Márcio Moreira 1. Introdução – Slide 27 Segurança no Armazenamento de Informações
Por dentro dos Disk Arrays
Fault TolerantCache Memory
Array Controller Array Controller
Disk Directors Disk Directors
Host Interface Host Interface
Fonte: EMC
Gaveta do sistemaoperacional
Gavetas de discos
Márcio Moreira 1. Introdução – Slide 28 Segurança no Armazenamento de Informações
RAID 0 - Striping ou Fracionamento Os dados são divididos em segmentos e estes são colocados nos HDs Não há redundância
Fonte: EMC
Volume 1End
Com RAID 0:Os volumes são divididos em blocos e movidos para balancear a carga de atividades.
Volume 1Middle
Volume 1BeginningSem RAID:
3 HDs num mesmo host.Cada HD contem um volume
Volume 2End
Volume 2Middle
Volume 2Beginning
Volume 3End
Volume 3Middle
Volume 3Beginning
Volume 1End
Volume 2End
Volume 3End
Volume 1Middle
Volume 2Middle
Volume 3Middle
Volume 1Beginning
Volume 2Beginning
Volume 3Beginning
Márcio Moreira 1. Introdução – Slide 29 Segurança no Armazenamento de Informações
RAID 1 - Mirroring ou Espelhamento Os dados de um HD são espelhados em outro gerando redundância
Fonte: EMC
Sem RAID:3 HDs num mesmo host.
Com RAID 1:Um espelho de cada HD é criado gerando um para de HDs.
Volume 1End
Volume 1Middle
Volume 1Beginning
Volume 2End
Volume 2Middle
Volume 2Beginning
Volume 3End
Volume 3Middle
Volume 3Beginning
Volume 1End
Volume 1Middle
Volume 1Beginning
Volume 1End
Volume 1Middle
Volume 1Beginning
Volume 2End
Volume 2Middle
Volume 2Beginning
Volume 2End
Volume 2Middle
Volume 2Beginning
Volume 3End
Volume 3Middle
Volume 3Beginning
Volume 3End
Volume 3Middle
Volume 3Beginning
Márcio Moreira 1. Introdução – Slide 30 Segurança no Armazenamento de Informações
RAID 1+0 - Performance e Redundância Os HDs (volumes físicos) são espelhados e os volumes lógicos
divididos
Fonte: EMC
Sem RAID:3 HDs num mesmo host.
Volume 1End
Volume 1Middle
Volume 1Beginning
Volume 2End
Volume 2Middle
Volume 2Beginning
Volume 3End
Volume 3Middle
Volume 3Beginning
Com RAID 1+0:HDs espelhados.Volumes lógicos fracionados para balancear carga.
Volume 1End
Volume 2End
Volume 3End
Volume 1End
Volume 2End
Volume 3End
Volume 1Middle
Volume 2Middle
Volume 3Middle
Volume 1Middle
Volume 2Middle
Volume 3Middle
Volume 1Beginning
Volume 2Beginning
Volume 3Beginning
Volume 1Beginning
Volume 2Beginning
Volume 3Beginning
Márcio Moreira 1. Introdução – Slide 31 Segurança no Armazenamento de Informações
Paridade de dados A paridade é utilizada para tentar recuperar dados perdidos
Fonte: EMC
Parity for 3rd
Group = 11 LOST DATA1
Parity for 2ndGroup = 1 010
Parity for 1st
Group = 00 1 1Group 1
Group 2
Group 3
Group 1 0 + 1 + 1 = 0
Group 2 0 + 1 + 0 = 1
Group 3 1 + 1 + ? = 1
DATA + DATA + DATA = Parity
Márcio Moreira 1. Introdução – Slide 32 Segurança no Armazenamento de Informações
RAID 5 - Fracionamento e paridade Divide os dados no nível de bloco e acrescenta um bloco de paridade Requer no mínimo 3 discos
Fonte: EMCParity for1st Group
Volume 1End
Volume 2End
Volume 3End
Parity for 2nd Group
Volume 1Middle
Volume 2Middle
Volume 3Middle
Parity for3rd Group
Volume 1Beginning
Volume 2Beginning
Volume 3Beginning
Sem RAID:3 HDs num mesmo host.
Volume 1End
Volume 1Middle
Volume 1Beginning
Volume 2End
Volume 2Middle
Volume 2Beginning
Volume 3End
Volume 3Middle
Volume 3Beginning
Com RAID 5:Um grupo de drives são agrupados como um volume físico.
Márcio Moreira 1. Introdução – Slide 33 Segurança no Armazenamento de Informações
Níveis de RAIDNível Técnica Mínimo
Discos Aplicação Comentários
0 Fracionamento em blocos 2 Alta performance Sem redundância
1 Espelhamento 2 Alta disponibilidade e performance Implantação simples
2 Fracionamento em bitsMonitoramento em RAM 2 Alta performance e disponibilidade Nenhum uso comercial
3 Fracionamento em bytesDisco de paridade 3 Alta performance e disponibilidade Menor custo
4 Fracionamento em blocos (Múltiplos I/O)Disco de paridade 3 Processamento de transações
Alta disponibilidadeAlta taxa de leituraBaixo uso comercial
5 Fracionamento em blocos (Múltiplos I/O)Discos de paridade independentes 3 Processamento de transações
Alta disponibilidade Alta taxa de leitura
6 Fracionamento em blocos (Múltiplos I/O)Múltiplos discos de paridade independentes 4 Processamento de transações
Alta disponibilidadeAlta taxa de leituraBaixo uso comercial
Fonte: EMC, IBM, Wikipedia e experiência.
Níveis mais usados comercialmente: 0, 1, 3, 5 e 10 (1+0): Múltiplos I/O Independência de leitura e gravação (acesso múltiplo). Custo comparado para níveis que oferecem mesmos benefícios.
Márcio Moreira 1. Introdução – Slide 34 Segurança no Armazenamento de Informações
Arquiteturas típicas de storage
DAS:Direct Attached Storage
NAS:Network Attached Storage
SAN:Storage Area Network
Direct Attached Storage (DAS)
Windows NT/2K Linux/UnixNetware
Network Attached Storage (NAS)
Windows NT/2K Linux/UnixNetware
Storage Area Network (SAN)
Netware
Windows NT/2K
Linux/Unix
Storage
FC Switch
NAS
Márcio Moreira 1. Introdução – Slide 35 Segurança no Armazenamento de Informações
Conexões típicas
HBA
HBA
NIC
HBA
System Bus
CPU
MAIN MEMORY(RAM)
ROM(Read Only Memory)
Storage Array Tape Drive DeviceNetworkRouter
SANSwitch
Márcio Moreira 1. Introdução – Slide 36 Segurança no Armazenamento de Informações
Symmetrix CLARiiON Centera
SAN / NAS
SAN / NAS /Backup-to-Disk CAS
Tape &Tape Emulation
DMX800DMX1000-M2
DMX1000DMX2000-M2
DMX2000DMX3000-M2
DMX3000
CX700
CX500
CX300
Centera
AX 100 Netwin 110
NS700/G
CelerraCNS
ADIC Scalar SeriesDL700
Produtos de Storage da EMC
Márcio Moreira 1. Introdução – Slide 37 Segurança no Armazenamento de Informações
Referências EMC. Storage Basics. EMC. Jun-2006. S. Ramakrishnan.
Management of large scale Terabyte Store information servers. IACITS 2007. Jul-2007.
Khattar, Murphy, Tarella e Nystrom. Introduction to Storage Area Network, SAN. IBM. Redbooks. SG24-5470-00. 1999.