FACULDADE DE TECNOLOGIA PADRE ANCHIETA ... tal informação? E quando a informação se encontra em...

33
FACULDADE DE TECNOLOGIA PADRE ANCHIETA Curso de SISTEMAS DE INFORMAÇÃO ARMAZENAMENTO DE DADOS: STORAGE AREA NETWORK Mariana Monteiro Monografia apresentada à disciplina Projeto de Final de Curso, do Curso de Sistemas de Informação da Faculdade de Tecnologia Padre Anchieta, sob a orientação do Prof. Carlos Eduardo Câmara, como exigência parcial para conclusão do curso de graduação. Orientador: Prof. Carlos Eduardo Câmara Jundiaí – São Paulo – Brasil 11/2005

Transcript of FACULDADE DE TECNOLOGIA PADRE ANCHIETA ... tal informação? E quando a informação se encontra em...

FACULDADE DE TECNOLOGIA

PADRE ANCHIETA

Curso de SISTEMAS DE INFORMAÇÃO

ARMAZENAMENTO DE DADOS: STORAGE AREA NETWORK

Mariana Monteiro

Monografia apresentada à disciplina Projeto de

Final de Curso, do Curso de Sistemas de

Informação da Faculdade de Tecnologia Padre

Anchieta, sob a orientação do Prof. Carlos

Eduardo Câmara, como exigência parcial para

conclusão do curso de graduação.

Orientador: Prof. Carlos Eduardo Câmara

Jundiaí – São Paulo – Brasil

11/2005

ii

Armazenamento de dados: Storage Area Network

Mariana Monteiro Monografia defendida e aprovada em 01 de dezembro de 2005 pela Banca Examinadora assim constituída: Prof Ms/Dr Carlos Eduardo Câmara (Orientador)

FATEPA – Faculdade de Tecnologia Padre Anchieta – Jundiaí – SP. Prof Ms/Dr Marcos Paulo Rebello (Membro Interno)

FATEPA – Faculdade de Tecnologia Padre Anchieta – Jundiaí – SP. Prof Ms Vanderlei Ienne (Membro Externo)

UNICAMP – Universidade Estadual de Campinas – Campinas – SP.

iii

Deus marcou o tempo certo para cada coisa. Ele nos deu o desejo de entender as coisas que já aconteceram e as que ainda vão acontecer, porém não nos deixa compreender completamente o que ele faz. Então entendi que nesta vida tudo o que a pessoa pode fazer é procurar ser feliz e viver o melhor que puder. (Eclesiastes 3:11-12)

iv

A meus amigos, sem os quais não chegaria até aqui, em especial Weber Abreu, Eduardo Ogura, Vitor Martins e Gerson Freire. A meus tios Luciano e Adriana pela ajuda em todos os sentidos. A meu namorado Bruno que sempre esteve presente nas horas mais difíceis. A minha mãe, pelo cumprimento fiel e perfeito de seu papel, cercando de carinho e incentivo todas as atitudes da minha vida. Aos meus cachorros Gugu e Bob, a quem tantas horas de brincadeiras adiadas sem que estes compreendessem o porquê. Agradeço em especial á Deus, pelos desafios lançados durante este período. Sou eternamente grata a todos.

v

AGRADECIMENTOS

Agradeço a Deus, em primeiro lugar, pela força e luz recebida nos meus maiores

momentos de dificuldades.

Agradeço ao Professor Carlos Eduardo Câmara, orientador, que acreditou em mim e

incentivou-me para a conclusão deste trabalho, face aos inúmeros percalços do trajeto.

Alguns experimentos e vários “entendimentos” não teriam sido possíveis sem a

colaboração de Eduardo Ogura, Gerson Freire e Weber Abreu.

Eu agradeço fraternalmente a todos.

vi

SUMÁRIO

AGRADECIMENTOS ............................................................................................................................................. v

SUMÁRIO ................................................................................................................................................................ vi

Lista de Siglas.......................................................................................................................................................... vii

Lista de Figuras......................................................................................................................................................viii

RESUMO .................................................................................................................................................................. ix

ABSTRACT.............................................................................................................................................................. ix

1. INTRODUÇÃO............................................................................................................................................... 1

2. STORAGE: ARMAZENAMENTO DE DADOS......................................................................................... 2

3. TIPOS DE TOPOLOGIAS............................................................................................................................ 3 3.1. DAS :Direct Attached Storage ................................................................................................................ 3 3.2. NAS: Network Attached Storage............................................................................................................. 4 3.3. SAN: Storage Area Network ................................................................................................................... 4 3.4. História.................................................................................................................................................... 6 3.5. Benefícios da Tecnologia SAN................................................................................................................ 7 3.6. Protocolos................................................................................................................................................ 8

3.6.1. Fibre Channel..................................................................................................................................... 8 3.6.2. Hardware............................................................................................................................................ 9

3.7. Software ................................................................................................................................................. 11 3.8. RAID (Redundant Array of Independent Disks) ................................................................................... 12

3.8.1. Raid 0................................................................................................................................................ 13 3.8.2. Raid 1................................................................................................................................................ 13 3.8.3. Raid 5................................................................................................................................................ 14 3.8.4. RAID 0 + 1 ou RAID 10 .................................................................................................................. 15

3.9. Gerenciamento da SAN......................................................................................................................... 15 3.10. Topologias ............................................................................................................................................. 16

4. SAN X NAS.................................................................................................................................................... 19

5. CONFIGURAÇÃO DO SISTEMA DE ARMAZENAMENTO.............................................................. 20

6. CONCLUSÃO ............................................................................................................................................... 22

Referência Bibliográfica........................................................................................................................................ 23

Bibliografia Consultada ......................................................................................................................................... 24

vii

Lista de Siglas

DAS….. ........................................................................Direct Attached Storage

NAS ..............................................................................Network Attached Storage

SAN .............................................................................Storage Area Network

LAN ..............................................................................Local Area Network

WAN.............................................................................Wide Area Network

Storage ..........................................................................Armazenamento

FC .................................................................................Fibre Channel

Cabling..........................................................................Cabeamento

Hba................................................................................Host Based Adapter

Raid...............................................................................Redundante

Tools of Management ...................................................Ferramentas de Gerenciamento

Servers ..........................................................................Servidores

Operating Systems ........................................................Sistemas Operacionais

Data...............................................................................Dados

Information ................................................................... Informação

viii

Lista de Figuras

I. Exemplo de SAN.............................................................................................................................................. 5

II. Exemplo de Raid 0 ........................................................................................................................................ 13

III. Exemplo de Raid 1 ........................................................................................................................................ 14

IV. Exemplo de Raid 5 ........................................................................................................................................ 15

V. Exemplo de Raid 10 ...................................................................................................................................... 15

VI. Exemplo de Ligação Ponto-a-ponto ............................................................................................................ 16

VII. Exemplo de TopologiaFC-AL...................................................................................................................... 17

VIII. Exemplo de Topologia Fabric...................................................................................................................... 18

IX. Exemplo de Topologia Mista ....................................................................................................................... 18

X. Tabela Comparativa entre as Tecnologias................................................................................................. 19

XI. Exemplo de Topologia Interna do Storage................................................................................................. 20

ix

RESUMO

Storage Area Network ou rede de armazenamento de dados é uma rede de alta

velocidade dedicada a fornecer benefícios diversos relacionados ao acesso a dados. Vem

popularizando-se enormemente no meio corporativo nos últimos anos por trazer vantagens

como altas taxas de transferência para o acesso aos dados, redundâncias que garantem a

continuidade dos negócios em caso de falhas e facilidade para aumentar o espaço em disco

destinado aos servidores integrantes da rede.

Este trabalho tem por objetivo explicar os fundamentos básicos que compõem uma

SAN, assunto de bibliografia ainda escassa, a fim de que todos conheçam esta tecnologia que

vem sendo cada vez mais adotada por empresas em todo o mundo.

ABSTRACT

Storage Area Network is a high-speed network design to provide fast and reliable

access to the data. It is becoming more and more common on IT environments because its

advantage, such as great transfers rates, high availability for business continuance and

scalability to grow the storage to the hosts.

This assignment has the goal to explain the foundations of a SAN (issue with a rare

study material) for all to get to know this technology that has been adopted for companies

around the world.

1

1. INTRODUÇÃO

Nas últimas duas décadas conhecemos a descentralização tanto do armazenamento de

dados e informações quanto do processamento destas, com a proliferação de redes locais e

servidores. Parecia de fato uma grande idéia, até que nos descobrimos envolvidos por

inúmeras ilhas tecnológicas. O cenário distribuído trouxe, em conseqüência, uma

descentralização do armazenamento das informações. A falta de controle deste ambiente está

levando às altas taxas de crescimento de Terabytes (TB), ao mesmo tempo em que continuam

ocorrendo, com mais incidência, problemas de 1disk full e dificuldades de se localizar

determinada informação. Além disso, essas informações não possuem cópias, muito menos

replicação em lugares distintos. Em que servidor e em que banco de dados ou arquivos se

encontra tal informação? E quando a informação se encontra em estações de trabalho?

Dentro de poucos meses, um PC poderá ter discos de mais de 200GB e se supormos uma

empresa com mil destas maquinas, teremos mais de 200.000GB de espaço sem controle de

seu conteúdo. Este crescimento apenas aumenta a dificuldade de gerenciamento. Está claro

que este modelo de armazenamento de dados está alcançando seus limites. O que precisamos

é de um novo modelo que nos permita, de modo fácil, e gerenciável, administrar as

informações.

A necessidade básica é a consolidação das informações de toda a empresa em um

determinado local, permitindo que todos compartilhem estas informações, diminuindo

significativamente os custos de gerenciamento e tornando a informação ema real vantagem

competitiva. Esse novo modelo já existe, é chamado Storage Area Network (SAN), que

resumindo o conceito numa infra-estrutura de fibra que permite o compartilhamento de

unidades de disco e banda por vários sistemas heterogêneos que também participam nessa

infra-estrutura. Uma rede de propósito especial e de alta velocidade que conecta diferentes

dispositivos de armazenamento a servidores. As redes SAN podem oferecer recursos de

armazenamento para backup e arquivamento para localidades múltiplas e remotas. Um grupo

de serviços de armazenamento de dados ligados com um servidor ou estação gráfica

host, freqüentemente através de switches, utilizando a tecnologia Fibre Channel. A SAN traz

benefícios imediatos á uma empresa, como a redução do custo utilizados para gerir e proteger

dados, a melhora do acesso aos dados, o aumento da capacidade de armazenamento e

escalabilidade.

1 Termo utilizado quando o disco rígido está completo com dados

2

2. STORAGE: ARMAZENAMENTO DE DADOS

Storage, de modo simplista, é armazenamento de dados. Os dados podem ser

armazenados de diversas maneiras, dos modos mais primitivos até ao que há de melhor em

tecnologia de armazenamento de dados.

Guardar documentos impressos em papel, informações anotadas em cadernos,

enciclopédias... tudo isso são formas de se armazenar dados, também chamados de

informação.

Porém, quando falamos de storage, falamos no armazenamento de grandes

quantidades de dados de corporações em geral, visando à segurança, disponibilidade e fácil

acesso e gerenciamento. Falamos de grandes infra-estruturas de armazenamento que visam o

mercado corporativo, oferecendo elevados níveis de segurança, performance, disponibilidade,

em casos até mesmo de desastres inesperados.

Storage não é somente armazenar é também:

���� Servir (aplicações, usuários, serviços…).

���� Disponibilizar (sistemas que não param!).

���� Proteger (informações que não podem ser perdidas)

���� Gerenciar (recursos, investimentos, crescimento…).

���� Flexibilizar (crescimento, recursos, investimentos…).

Hoje os sistemas de storage não são vistos apenas do ponto de vista técnico e

tecnológico e sim como ferramenta essencial para o crescimento das corporações,

continuidade de negócios, redução de custos e investimentos, além, claro de melhores

resultados e maiores lucros.

3

3. TIPOS DE TOPOLOGIAS

Os Subsistemas de Discos são sistemas inteligentes que agregam grandes quantidades

de discos e softwares, formando grandes repositórios de dados com grandes, porém variáveis

níveis de proteção. [1]

Entre suas características estão vantagens como a redundância total do hardware,

através de fontes e ventiladores redundantes, memória cache espelhada, placas processadoras

redundantes, níveis de RAID e caminhos duplos de fibra. Além disso, contam com sistemas

de proteção via software, como 2snapshots, volumes espelhados e sites espelhos remotos.

Subsistemas de Discos oferecem também toda a centralização e consolidação dos

dados da empresa, aumentando a performance, melhorando e centralizando o gerenciamento

da infra-estrutura e da informação, consolidando servidores e reduzindo custos.

Os Subsistemas de Discos podem ser conectados de três maneiras diferentes:

1) DAS- Direct Attached Storage 2) NAS- Network Attached Storage 3) SAN-Storage Area Network

3.1. DAS :Direct Attached Storage

Nesta topologia os servidores são conectados diretamente ao subsistema de discos.

Mesmo que exista mais de um servidor conectado diretamente ao subsistema, se não houver

um dispositivo de rede no caminho ainda assim trata-se de uma topologia DAS (Storage

conectado diretamente).

2 Fotografia de determinada área de disco

4

3.2. NAS: Network Attached Storage

Um NAS ou Network Attached Storage é uma unidade ou servidor de armazenamento

que se liga como qualquer outro servidor à rede da empresa, onde tem a função de servidor de

arquivos. Um servidor NAS entende vários protocolos de rede, adapta-se a vários tipos de

rede e sabe dialogar com sistemas como UNIX, NT ou Netware.

Um dispositivo NAS combina a tecnologia dos 3arrays de discos com a inteligência de

uma pequena unidade de processamento. É comum a familiaridade com o conceito de

“impressora de rede”, ou seja, aquela onde o usuário pode imprimir. Do mesmo modo o NAS

é uma unidade partilhada através da LAN e todos os usuários com os direitos e permissões de

acessos adequados podem montar sistemas de arquivos diretamente sem ter que veicular os

dados através do servidor. [1]

3.3. SAN: Storage Area Network

Uma SAN é de modo simplificado, uma rede dedicada ao armazenamento de dados,

que conecta dispositivos armazenadores de discos conhecidos por storages aos servidores da

rede. É uma tecnologia relativamente nova e que vem se popularizando bastante no meio

corporativo nos últimos anos, trazendo cada vez mais benefícios para as empresas que a

adotam. O mercado brasileiro de armazenamento de dados cresceu 44,4% em 2003, com uma

movimentação no setor de 1,3 bilhões de dólares. No mundo, este mercado movimentou 25,5

bilhões de dólares em 2003. As perspectivas para 2004 são ainda maiores. [2]

Em linhas gerais, pode-se definir SAN como uma infra-estrutura que permite que

diversos servidores tenham acesso a discos externos de modo rápido e confiável. O conceito

de discos externos já é, há algum tempo, uma tendência mundial, e vem sendo cada vez mais

adotado. Os discos externos não são limitados em espaço como um disco interno, são mais

fáceis de manusear quando necessário e trazem facilidades para o compartilhamento por

3 Agrupamento de elementos

5

vários servidores. A figura central de uma SAN, de fato, é o servidor de discos ou, como é

popularmente conhecido, o storage.

A centralização das operações de armazenamento de dados e seu gerenciamento são as

razões principais pela popularização das SANs. Administrar todos os recursos de

armazenamento em ambientes críticos e de crescimento elevado não é uma tarefa fácil e pode

ser muito dispendioso. Imagine, por exemplo, uma empresa com centenas de servidores que

possuem importante demanda por espaço em disco. Acompanhar máquina a máquina e

gerenciar seus volumes, com certeza não será um tarefa fácil. Com a centralização oferecida

pela SAN, tanto o tempo quanto o custo de gerenciamento destes ambientes é muito reduzido.

Além disso, uma SAN provê uma série de outras vantagens para o acesso a áreas de discos,

como sua alta escalabilidade e confiabilidade.

Uma SAN é implementada utilizando-se componentes de hardware e também

importantes softwares, sem os quais a SAN não traria tantos benefícios quanto conhecemos

hoje. Como veremos no decorrer deste trabalho o conjunto de hardware e software certo é que

vai definir a qualidade da SAN.

Abaixo, vemos uma SAN, representada por uma nuvem e diversos de seus

equipamentos, ao lado de outras redes. A figura nos dá uma idéia de como as tecnologias não

são isoladas, mas se integram.

I. Exemplo de SAN

6

3.4. História

A idéia da SAN nasceu em 1987, quando Patterson, Gibson e Katz, da Universidade

da Califórnia, publicaram o artigo A Case for Redundant Arrays of Inexpensive Disks (RAID).

As idéias apresentadas e explicadas no artigo sugeriam combinar vários discos de pequeno

porte, não muito caros, em uma matriz a fim de obter características que discos isolados não

eram capazes de oferecer. Estas novas características tratavam, principalmente, de melhorar a

performance de leitura e escrita e preservar automaticamente o conteúdo dos discos durante e

depois da falha de componentes do disco. Com os discos em RAID, nasceram os servidores

de discos, os storages, que são o centro de uma SAN.

Um acontecimento que também foi muito importante para o surgimento desta

arquitetura foi o desenvolvimento do padrão Fibre Channel (FC), utilizado nas SANs. Fibre

Channel é um protocolo de transferência de dados, que faz uso do meio físico de fibra ótica.

Acompanhando o processo de popularização das SANs, os diferentes fornecedores

começaram a tentar definir seus próprios padrões FC, o que estava atrapalhando o

desenvolvimento do padrão. Assim, foram criadas algumas organizações para definir as regras

para o novo padrão. Entre elas, destacam-se a FCIA (Fibre Channel Industry Organization) e

a SNIA (Storage Networking Industry Association).

A FCIA foi criada em agosto de 1999, da fusão da Fibre Channel Association e Fibre

Channel Community. É uma organização de benefício mútuo, sem fins lucrativos, formada

por fabricantes, integradores de sistemas, desenvolvedores, vendedores, profissionais da

indústria e usuários. O objetivo da FCIA é criar bases para a tecnologia de infra-estrutura FC,

a fim de que várias aplicações dentro dos complicados mercados de Storage e TI possam ser

suportadas. [2]

A SNIA foi criada em Dezembro de 1997 ,é uma associação sem fins lucrativos que

dedica-se a garantir que as redes de armazenamento de dados tornem-se soluções completas e

confiáveis dentro da comunidade de tecnologia.[2]

7

3.5. Benefícios da Tecnologia SAN

Podem-se citar como principais benefícios proporcionados por uma arquitetura de

SAN:

���� Alta performance no acesso aos dados: as taxas de transferência nas SAN mais

modernas podem chegar a até 2 Gbp/s. Além disso, dependendo do arranjo dos discos

(RAID), pode haver grande ganho de performance na leitura e/ou escrita, como veremos

adiante neste trabalho;

���� Alta disponibilidade e confiabilidade: uma SAN possui diversas formas de

aumentar a disponibilidade dos dados de modo que, mesmo em caso de falha de alguns

discos, a produção na seja interrompida. Opções como caminhos redundantes para acesso aos

dados e espelhamento de dados em tempo real pode assegurar a disponibilidade dos dados e

aplicações.

���� Escalabilidade: capacidade de adicionar mais capacidade de armazenamento e

outros recursos à infra-estrutura já existente. Isto é feito facilmente dentro de uma SAN,

freqüentemente sem a necessidade de desligar o(s) servidor(s) ou seus clientes de rede;

���� Centralizar a administração dos recursos: nos ambientes atuais, cada vez mais

complexos, isto pode ser a única solução para a administração dos recursos de discos,

trazendo grandes economias para as empresas.

���� Descongestionamento da LAN: em muitos casos a rede local é lenta devido ao

grande fluxo de informações que trafega por ela. Com uma SAN, este fluxo é bastante

reduzido, o que alivia a rede local, beneficiando os usuários. Isto também é muito importante

para o backup corporativo, que também pode ser feito sem utilizar a rede local.

Além destes ganhos, há outros que variam um pouco dependendo da solução adotada e

dos fornecedores escolhidos, tal como balanceamento de carga e facilidades para backup.

Estas facilidades focam em alternativas para aplicações em que não há janela para backup

disponível, já que elas exigem disponibilidade integral.

8

3.6. Protocolos

SANs podem ser implementadas utilizando interfaces, de diferentes tipos. Os

protocolos suportados por SAN são os seguintes:

���� FCP: Fibre Channel Protocol

���� FCIP: Fibre Channel sobre TCP/IP

���� IFCP: Internet Fibre Channel Protocol

���� SCSI: Small Computer System Interface

���� ISCSI: Internet Small Computer System Interface

���� ISNS: Internet Storage Name Service

���� SAS: Serial Attached SCSI

Atualmente, Fibre Channel é o padrão utilizado na maioria das SANs.

3.6.1. Fibre Channel

A tecnologia Fibre Channel está se tornando o elemento chave para viabilizar uma

Storage Network. As características do Fibre Channel permitem que topologias do tipo de

redes possa ser aplicadas no ambiente de armazenamento de dados como a base do paradigma

emergem do Storage Network. [3]

O surgimento de plataformas que empregam componentes de rede com base no Fibre

Channel, tais como hubs e switches, oferecem melhorias dramáticas na forma com que as

empresas gerenciam, protegem e compartilham volumes crescentes de informações com

missão crítica.

O Fibre Channel oferece vários benefícios para os servidores de armazenamento de

informações: distância maior entre os sistemas, consolidação de dados, conectividade aberta e

maior taxa de transferência de dados.

O Fibre Channel permite interligar servidores e sistemas de armazenamento de dados

através de distâncias maiores. As atuais implementações de SCSI impõem uma limitação na

distância de apenas 25 metros entre os servidores e os sistemas de armazenamento de dados.

9

O Fibre Channel permite que os dispositivos da rede de Storage possam ser separados por

distâncias de até 10 km, ou seja, 400 vezes com relação à SCSI. [3]

A conectividade Fibre Channel permite que as organizações possam consolidar dados

entre servidores e sistemas de armazenamento de dados bastante dispersos, e ao mesmo

tempo, dar suporte para os crescentes volumes e tipos de dados corporativos. Até agora, a

conectividade era restrita a esquemas de conexão ponto-a-ponto relativamente lentas. A SCSI,

que tem sido largamente implementada, seja talvez a melhor forma de exemplificar essas

limitações.

A consolidação de múltiplos tipos de servidores com múltiplas opções de

conectividade exige no mínimo de flexibilidade do sistema. A capacidade de uma única

plataforma Fibre Channel para lidar simultaneamente não apenas com conexões de canais

paralelos e seriais de mainframes, mas também com servidores de sistemas abertos SCSI e

Fibre Channel, permitem um excesso de conexões entre hosts mainframe e sistemas abertos.

3.6.2. Hardware

Talvez a parte mais importante para a implantação de uma SAN seja referente ao

hardware. É importante selecionar com cuidado os dispositivos de hardware para uma SAN,

pois há diferenças muito grande entre os equipamentos fornecidos por diferentes empresas do

ramo. Além disso, devido às SANs serem bastante dependentes de alguns softwares para

funcionar corretamente, é muito importante garantir as atualizações de softwares, firmwares e

outras questões ligadas à compatibilidade. Os fabricantes de equipamentos para SAN

costumam divulgar matrizes de compatibilidade para seus produtos em seus sites. Nelas há

uma quantidade muito grande de informações, contendo diversas combinações de hardware e

software, como storage, 4switch, 5HBA, servidor e sistema operacional, que foram

homologados pelo fabricante. Os principais componentes de hardware são:

4 Um dispositivo de rede que seleciona um caminho ou circuito para enviar dados entre destinos 5 Adaptador de barramento do host

10

���� Servidor de discos

Servidores de discos, também chamados de storages são dispositivos que

armazenam discos compartilhados pelos 6hosts da rede. Eles possuem, em geral, diversas

áreas diferentes, com esquemas de RAID diferentes ou discos específicos para a realização de

espelhamentos para backup, os chamados BCV (business continuance volumes). Os BCVs

facilitam muito tanto o backup quanto a restauração dos dados. O seu conteúdo é sincronizado

com o conteúdo do disco principal, até que se faça uma quebra do sincronismo, o chamado

split. Neste momento, o BCV guarda uma imagem do disco antes do split, e pode ser usado

para backup, enquanto o servidor continua trabalhando, sem impactos na produção. Este

procedimento pode ser feito com a freqüência mais conveniente para o usuário e, em muitos

casos, o BCV é utilizado também para restauração de dados perdidos, que é muito mais rápido

do que acessar fitas de backup.

Muitos storages, além de discos, possuem também uma espécie de processador e memórias,

onde é armazenado o 7firmware do equipamento.

���� Switches:

Switches fibre channel são bem mais complexos que os hubs, tanto em seu projeto

quanto em funcionalidade. Enquanto os hubs são apenas um concentrador de cabos para um

segmento compartilhado, um switch é um dispositivo de rápido roteamento dos dados e possui

uma taxa de transferência de dados exclusiva para cada porta. As taxas de transferência

variam bastante dependendo do switch, que vêm evoluindo rapidamente. Atualmente, a

velocidade máxima está em 400 MB/s para cada porta.

Enquanto os hubs não participam de atividades no nível do protocolo Fibre Channel, os

switches participam ativamente, tanto para fornecer serviços quanto para supervisionar o

fluxo de frames entre a origem e o destino.

6 Computador central. Também chamado de servidor ou nó. 7 Também conhecido como software embarcado, trata-se de um software que controla o hardware diretamente

11

���� HBA (Host Bus Adapter):

Uma HBA é um dispositivo capaz de conectar dispositivos externos a um servidor.

Por exemplo: para conectarmos um disco SCSI a um micro (barramento interno PCI), será

necessário utilizar uma HBA SCSI-PCI. No caso da SAN, é necessário instalar em todos os

servidores participantes dela uma HBA Fibre Channel, que se encarregará de fazer as

conversões dos diferentes meios internos e externos ao servidor.

As HBAs FC possuem, ainda, uma espécie de processador (um chip) capaz de fazer a

conversão de protocolos para poupar a CPU do servidor deste trabalho.

3.7. Software

Um dos componentes indispensáveis para uma SAN são os softwares envolvidos.

Normalmente, as empresas fornecedoras de SAN são também produtoras de softwares que

gerenciam seus produtos de hardware. Embora não se tenha muitas pesquisas e estatísticas

que meçam o estado deste componente, a parte de software é um campo em expansão, como

pode ser visto em diversas empresas que vêm ampliando sua infra-estrutura de dados.

Estes softwares possuem diversas funções, entre elas:

���� Organizar o acesso às diferentes áreas do storage por parte dos servidores:

muitos storages hoje em dia possuem diferentes áreas de discos, que possuem controladoras

diferentes, além, de outras características diferentes, como, por exemplo, o esquema de RAID.

O planejamento do local no storage para alocar discos para os servidores, conforme suas

necessidades e características é muito importante, e os softwares atuais provêm cada vez mais

facilidades para este trabalho.

���� Prover diversos sistemas de contingência para o caso de falhas: como a maioria

dos dados em storage são críticos, há uma preocupação muito grande com um esquema de

contingência em caso de falhas. Um dos principais esquemas deste tipo é o chamado failover.

O failover é um termo genérico utilizado quando há redundância entre caminhos de acesso e,

caso haja falha em um deles, o outro é automaticamente acionado e passa a ser utilizado, o

que é controlado pelo software.

12

���� Aumentar a performance de acesso aos dados: há algumas ferramentas para

aumentar a performance de acesso aos dados em um software de um SAN, dependendo da

arquitetura utilizada. Uma muito utilizada é o balanceamento de carga (load balance), que

utiliza caminhos redundantes de acesso ao storage, e controla por software a melhor maneira

de acessá-lo, o que traz um grande aumento de performance.

���� Prover facilidades para o backup de servidores: quanto mais crítico um

servidor, mais complicado é o seu backup. Algumas aplicações não podem parar jamais e

possuem uma janela de backup muito pequena. Além disso, o backup não pode interferir na

performance do servidor, principalmente em casos de aplicações com alto índice de acesso.

Com ferramentas de software como o snapshot, é possível gravar imagens da área de discos

utilizadas pelo servidor, e fazer o backup em outro horário qualquer, sem impactar em nada a

produção. Isto é feito, em geral, guardando-se ponteiros para os dados e utilizando-se áreas

extras do storage para guardarem dados que sejam modificados após o snapshot, quando os

ponteiros que apontavam para a área original, passam a apontar para esta área temporária.

Normalmente, estes softwares possuem duas interfaces, uma gráfica, ou web, e outra

por linha de comando, o que é extremamente útil para a confecção de scripts para automatizar

alguns processos.

3.8. RAID (Redundant Array of Independent Disks)

A maior parte das SANs atuais utiliza sistemas de 8RAID em seus principais

equipamentos de armazenamento de dados. Estes sistemas oferecem proteção dos dados,

tolerância à falhas, no caso de um componente ou um caminho de I/O falhar, alta

performance, capacidade de armazenamento e escalabilidade. Outras características para

garantir a confiabilidade dos sistemas de RAID mais modernos incluem redundância de

sistemas de refrigeração, fontes de alimentação, controladoras e até de circuitos de

monitoramento.

8 Redundant Array of Independent Disks, discos independentes de array redundante

13

A idéia do RAID é combinar múltiplos discos em uma matriz a fim de obter

características que discos isolados não poderiam fornecer como alto desempenho e tolerância

à falhas.

Os computadores conectados a um servidor RAID enxergam suas áreas como um

disco físico, que, para o servidor RAID é uma unidade lógica de armazenamento (Logical

Storage Unit - LUN).

Existem várias maneiras de obter as características de tolerância à falhas, redundância

dos dados e alta performance, que constituem os chamados níveis de RAID.

3.8.1. Raid 0

Os dados são distribuídos através dos discos, método conhecido por data striping, sem

gerar paridade ou redundância. A gravação e a leitura dos dados é feita paralelamente, uma

vez que cada disco possui a sua controladora. Com isto, há um grande ganho de performance,

porém, por não haver redundância alguma, se um dos discos falhar, os dados são perdidos.

RAID 0 é utilizado quando máxima performance é mais importante do que possíveis perdas

de dados.

II. Exemplo de Raid 0

3.8.2. Raid 1

Os discos da matriz são divididos em 2 grupos. Na escrita, os dados são gravados

igualmente nos 2 grupos. Na leitura, os dados podem ser lidos de qualquer um dos grupos.

14

Normalmente, ela é feita alternando-se os discos, processo conhecido por 9round robin, mas

pode haver um disco preferencial para leitura, no caso de haver um disco mais rápido que

outro. Não há geração de paridade, mas sim uma redundância completa dos dados. Este

método tem se tornado popular pela sua simplicidade e praticidade em caso de falha de um

dos discos. Porém possui as desvantagens de utilizar apenas metade da capacidade total de

discos, além de não trazer nenhum aumento de performance.

III. Exemplo de Raid 1

3.8.3. Raid 5

Este nível de RAID também utiliza o conceito de data striping, mas acrescenta uma

forma de obter redundância dos dados, através do gerador de paridade. Para cada escrita, é

gerada uma paridade calculada pela operação de ou exclusivo dos bits gravados. A paridade

fica espalhada pelos 3 discos, ou seja, a cada gravação ela é gravada em um disco diferente.

São necessários, no mínimo, 3 discos para sua implementação, sendo o espaço "desperdiçado"

do conjunto devido ao armazenamento da paridade é equivalente ao espaço de um disco.

Pode-se, com este esquema, perder até um disco que, a partir dos outros e da paridade,

reconstitui-se os dados do disco perdido. Caso mais de um disco falhe ao mesmo tempo, os

dados não poderão ser recuperados. É um método muito empregado nos storages atuais,

porque alia aumento de performance à segurança oferecida pela redundância com um ótimo

aproveitamento de recursos.

9 Round-Robin é um termo usado em tecnologia para indicar eventos que se alternam..

15

IV. Exemplo de Raid 5

3.8.4. RAID 0 + 1 ou RAID 10

A combinação de níveis de RAID é uma prática comum hoje em dia. A mais utilizada

é a que combina os níveis 1 e 0, o que alia a alta performance do RAID 0 com a segurança

dos dados do RAID 1.

V. Exemplo de Raid 10

3.9. Gerenciamento da SAN

Hoje em dia, até mesmo os administradores inexperientes podem gerenciar uma SAN

de forma pró-ativa e segura e manter níveis ideais de serviço.

Existem no mercado vários softwares de gerenciamento, onde o escolhido para

demonstração é o VisualSAN Edition que fornece visibilidade de SAN física e lógica

completa e recursos que os administradores precisam para operar com eficiência.

O VisualSAN Edition oferece suporte a uma maior quantidade de portas e simplifica

ainda mais o trabalho administrativo. Ele acrescenta recursos de fornecimento automático de

armazenamento para host e percepção de aplicativos.

16

Usando uma comparação de configurações para isolar problemas e reduzindo a complexidade

e onde alguns alertas são emitidos para realizar ajustes rápidos.

3.10. Topologias

As SANs atuais são todas construídas em uma topologia física de estrela. Um switch é

conectado ao storage e neles conectamos todos os outros servidores da rede. A exceção fica

com a ligação ponto-a-ponto, como veremos a seguir.

Assim, analisaremos as topologias existentes:

���� Ligação ponto-a-ponto (point-to-point):

Para alguns não é considerada uma topologia de SAN, uma vez que não possui

escalabilidade alguma. Neste tipo de ligação, os servidores são ligados diretamente ao

storage, sem nenhum equipamento intermediário, como switch. O número máximo de

servidores envolvidos é igual ao número de portas que o storage possui. Comparado com a

ligação SCSI, no entanto, esta topologia, que utiliza Fibre Channel, apresenta uma

performance muito melhor e atinge distâncias maiores.

VI. Exemplo de Ligação Ponto-a-ponto

17

���� Loops ou anéis: Fibre Channel Arbitrated Loop (FC-AL):

Nesta topologia utiliza-se hub, cuja largura de banda de no máximo de 100 MB/s é

compartilhada por todos os seus membros. Teoricamente suporta loops com até 126

dispositivos, mas na prática este número é bem menor. Esta topologia está sendo muito pouco

utilizada nas SANs modernas. Algumas pessoas comparam esta topologia como uma rede

Token Ring, em que a largura de banda é dividida por todos os dispositivos do loop.

Entretanto há equipamentos antigos que não suportam o modo fabric e, assim, é utilizado o

modo em loop.

VII. Exemplo de TopologiaFC-AL

���� Malha (Switched fabric ou apenas fabric):

Nesta topologia, utiliza-se switches Fibre Channel, o que permite um grande número

de dispositivos interconectados. Dedica largura de banda integral a cada uma das portas e

permite transferências de dados simultaneamente para um único nó. É a topologia que permite

mais escalabilidade e crescimento. Teoricamente, pode conter mais de 7,7 milhões de nós.

18

VIII. Exemplo de Topologia Fabric

���� Topologia mista:

Na literatura, encontramos, ainda, a possibilidade de combinar as duas topologias, o

que não é comum de se fazer:

IX. Exemplo de Topologia Mista

19

4. SAN X NAS

Vistas como concorrentes, as SANs – Storage Area Network e as NAS – Network

Attached Storage são tecnologias complementares: Enquanto as primeiras são otimizadas para

transferências de altos volumes de dados orientadas em bloco, as NAS oferecem acesso a

dados em nível de arquivo. Baseadas em protocolos abertos, como Fibre Channel e TCP/IP,

oferecem varias vantagens em relação ao sistema de armazenamento ligado ao servidor.

As SANs – Storage Area Networks e NAS – Network Attached Storage estão cada vez

mais substituindo ou complementando as tradicionais aplicações dedicadas a servidores em

muitos data centers. Como resultado, as corporações estão obtendo muitos benefícios,

inclusive aumento de flexibilidade, instalação facilitada de sistemas de armazenamento e

redução geral de custos de armazenamento. Embora ambas as tecnologias possam oferecer

vantagens competitivas, cada uma é designada para tipos específicos de ambientes e

aplicações. [4]

Tab. I – Características das SANs e NAS SAN NAS Protocolo • Fibre Channel

• Fibre Channel para SCSI • TCP/IP

Aplicações • Processamento de aplicações de banco de dados de missão critica.

• Backup de dados centralizado • Operações de recuperação de

desastres • Consolidação de armazenamento

• Compartilhameto de arquivo em NFS e CIFS

• Transferência de pequenos blocos de dados a longas distancias

• Acesso ao banco de dados limitado somente a leitura

Vantagens • Alta disponibilidade

• Confiabilidade na transferência de dados

• Trafego reduzido na rede primaria • Flexibilidade de configuração • Alto desempenho • Alta escalabilidade • Gerenciamento centralizado • Oferta de múltiplos fornecedores

• Poucas limitações de distancia

• Adição simplificada da capacidade de compartilhamento de arquivo

• Fácil instalação e menutenção

X. Tabela Comparativa entre as Tecnologias

20

5. CONFIGURAÇÃO DO SISTEMA DE ARMAZENAMENTO

XI. Exemplo de Topologia Interna do Storage

Para maior confiabilidade, a arquitetura dos Storages mais modernos incluem dois

processadores ativos de armazenamento, cada um capaz de acessar de forma independente

todos os drives no array. Esse projeto garante as operações contínuas, por meio do failover

automatizado no caso de um processador de armazenamento tornar-se indisponível. Além

disso, o ambiente operacional de armazenamento proporciona à arquitetura flexibilidade

necessária para dar suporte a várias gerações de hardware e a diversos tipos de interconexões

com funcionalidade consistente, garantindo assim a proteção do investimento.[5]

O ambiente operacional de armazenamento fornece também a funcionalidade

avançada necessária para melhorar a relação custo/benefício e aumentar a disponibilidade de

aplicativos, por meio de diversos recursos como:

Fan Fan Fan

Power supply

Power supply SPS SPS

CMI

Block Diagram

Storage Processor

Storage Processor

LCC

LCC LCC

Mirrored cache

Fibre Channel or Gigabit Ethernet

Mirrored cache

Fibre Channel or Gigabit Ethernet

FC FC

CPU CPU

LCC

LCC LCC

21

���� Grupos de LUNs que, por meio de striping ou concatenação, dão ao usuário

flexibilidade e controle do layout de dados no array.

���� Os metaLUNs melhoram o desempenho, permitindo que um volume englobe

um grande número de drives, além de possibilitar o uso mais eficiente da capacidade,

expandindo-a sem interrupções em qualquer local do array.

���� Movimentação dinâmica de dados entre drives FC e ATA, além de fornecer

recursos do tipo ILM( Information Lificycle Management) dentro de um único array Os

dados também podem ser movidos de um volume de um tipo de RAID para outro de um tipo

diferente, atendendo aos requisitos de desempenho de um aplicativo específico.

Alem de alta disponibilidade em todos os dispositivos de hardware como:

���� Cache de gravação, sendo que cada processador de armazenamento contém os

principais dados em cache dos seus LUNs, bem como uma cópia secundária do cache do

processador de armazenamento de mesmo nível.

���� Bateria de reserva para controladores e discos com compartimentos de cache, o

que permite um desligamento ordenado, de forma a garantir a proteção em caso de uma falha

de energia.

���� Proteção de RAID nos níveis 1/0, 0, 1, 3 e 5, todos podendo existir

simultaneamente no mesmo array para atender aos diferentes requisitos de proteção dos

dados.

22

6. CONCLUSÃO

A SAN é hoje uma alternativa para suprir as necessidades de armazenamento de

dados, que por sua vez deve ser analisada de forma real, pois ainda se trata de uma solução

cara para as empresas.

As empresas devem entender bem o conceito dessa nova rede de armazenamento e

procurar não usar apenas o hardware dessa solução, mas todo o conjunto que se baseia no

software e serviços de implementação dessa solução.

Os acessos aos recursos da rede são dinâmicos, uma vez que todos os recursos estão

disponíveis para a rede como um todo e não ligados fisicamente a um servidor, beneficiando a

criação de sistemas de redundâncias .

Com a centralização das informações, facilitando a administração, bem como cuidar

da segurança, além de se ter uma rede com escalabilidade, flexibilidade, disponibilidade e

menos tempo de 10downtime .

Não podemos confundir problemas de espaço com problemas de não se ter regras com

o que se armazena nos servidores hoje em dia, pois não adianta ter um sistema eficaz e

eficiente disponível e continuar sem regras sobre o que se deve armazenar.

Tudo que as pessoas precisam fazer na rede é alimentado por dados, voltado para

dados e dependente de dados. Enquanto a utilização da rede aumenta, você precisa ter certeza

de que terá a capacidade de armazenagem de dados confiável e de alto desempenho de que vai

precisar - no momento em que precisar dela. A STORAGE AREA NETWORK, surgiu como

uma alternativa simples e eficiente para ser usada nesse momento e deve ser o padrão de tipo

de armazenamento dos próximos anos.

10 Tempo de parada de aplicações e servidores críticos.

23

Referência Bibliográfica

[1] EMC Brasil Inc .URL: http://www.emc2.com.br. Recuperado em 10/10/2005, 15:00.

[2] Storage Networking Industry Association. URL: http://www.snia.org/. Recuperado em

20/04/2005, 21:00.

[3] URL: http://www.fibrechannel.org/. Recuperado em 10/04/2005, 15:40

[4] URL: http://www.nas-san.com. Recuperado em 01/09/2005, 20:35.

[5] NEMETH, Evi.; SNYDER, Garth.; SEEBASS, Scott.; HEIN, Trent R. Manual de

Administração do Sistema UNIX, 3a edição

24

Bibliografia Consultada

http://www.dothill.com/tutorial/index.htm. Recuperado em 01/04/2005, 13:52

http://eval.veritas.com/webfiles/docs/san-whitepaper.pdf. Recuperado em 03/04/2005, 22:10.

http://www.qlogic.com/documents/datasheets/knowledge_data/whitepapers/whitepapers.zonin

g.pdf. Recuperado em 10/04/2005, 15:30.

http://www.networkcomputing.com/1109/1109ws1.html. Recuperado em 10/04/2005, 15:30.

http://www.networkmagazine.com/shared/article/showArticle.jhtml?articleId=17601008&pgn

o=2. Recuperado em 20/04/2005, 21:00.

http://www.sun.com/storage/white-papers/fc_comp.html. Recuperado em 01/09/2005, 20:35.

http://www.ibm.com. Recuperado em 10/10/2005, 16:00.

http://www.hitachi.com. Recuperado em 20/09/2005, 22:00

http://www.hp.com. Recuperado em 20/09/2005,22:00.

.