EMC VMAX3 — confiabilidade, disponibilidade e facilidade ... · de rastreamento proativo de erros...

Este documento de notas técnicas contém informações sobre os seguintes tópicos:

Resumo executivo ................................................................................. 4

Público ................................................................................................ 6

Introdução ............................................................................................ 6

Suporte remoto .................................................................................... 7

Capacidade de suporte por meio da Control Station do módulo de gerenciamento .................................................................................... 8

Secure Service Credential (SSC), protegida pela RSA ............................ 8

Detecção de erros ................................................................................ 9

Verificações de erros de CRC no block .................................................. 9

Verificações da integridade dos dados ................................................ 9

Monitoramento e correção dos drives ................................................ 10

Verificação de erros e correção de erros na memória física ................. 10

Componentes confiáveis .................................................................... 11

Redundância ao nível de componente do VMAX3 ................................. 11

Componentes da engine redundante ................................................. 11

Director boards redundantes ............................................................. 12

Control Station do módulo de gerenciamento (MMCS) e módulo de gerenciamento (MM) .......................................................................... 14

Control Station do módulo de gerenciamento (MMCS) ....................... 14

Módulo de gerenciamento (MM) ........................................................ 15

Módulo de I/O de flash ...................................................................... 16

Módulo de I/O de front-end ............................................................... 16

Módulo de I/O de back-end ............................................................... 16

EMC® VMAX3™

Confiabilidade, disponibilidade e facilidade de manutenção Número da peça H13807 REV A03 Fevereiro de 2015

NOTAS TÉCNICAS

Resumo executivo

2 EMC® VMAX3 — confiabilidade, disponibilidade e facilidade de manutenção

Módulo InfiniBand (IB) ....................................................................... 17

Memória física compartilhada ............................................................ 17

Visão geral da tecnologia de memória global ..................................... 17

Numeração das portas físicas ............................................................ 17

Numeração das portas lógicas ........................................................... 18

Redundância de front-end do canal ................................................... 19

Redundância de back-end SAS .......................................................... 20

Conectividade redundante do director do back-end ........................... 20

Caminhos redundantes de cabeamento ............................................. 21

Caminhos redundantes de drive ........................................................ 21

Back-end ponto a ponto .................................................................... 21

Gaveta Disk Array Enclosure (DAE) ..................................................... 21

Recurso de iniciador dual .................................................................. 24

Dynamic virtual matrix ....................................................................... 25

Conectividade Ethernet interna para dados ambientais ..................... 26

Subsistema de alimentação redundante ............................................ 27

Módulos de unidade de bateria reserva ............................................. 27

Compartimentação ............................................................................ 28

Acionadores da compartimentação .................................................... 28

Operação de desligamento ................................................................ 29

Operação de inicialização .................................................................. 29

Métodos de proteção de dados ........................................................... 30

RAID 1 (espelhamento) ...................................................................... 30

RAID 5 ............................................................................................... 31

RAID 6 ............................................................................................... 31

RAID local .......................................................................................... 32

Provisionamento thin ......................................................................... 32

Sparing de drive ................................................................................ 33

Serviço postergado ............................................................................ 34

Replicação local com o TimeFinder ..................................................... 34

Replicação remota com o SRDF .......................................................... 35

Resumo executivo


D@RE (Data at Rest Encryption) ......................................................... 37

Facilidade de manutenção do VMAX3 ao nível de componente ............. 38

Upgrades não disruptivos do HYPERMAX OS ...................................... 39

Luzes azuis intermitentes do rack ...................................................... 40

Conclusão .......................................................................................... 40

Referências ........................................................................................ 41

Resumo executivo


Resumo executivo

O setor de TI tem crescido e mudado em ritmo intenso, com um grande foco na computação em nuvem e nos modelos de consumo semelhantes à nuvem. As organizações de TI estão descobrindo que precisam ter a capacidade de atender às necessidades de armazenamento de clientes internos e externos ao mesmo tempo em que se mantêm alinhadas ao orçamento fornecido.

O VMAX3 é uma plataforma que pode acomodar todas essas necessidades. Ele fornece um modelo de provisionamento simples e baseado em nível de serviço que altera a maneira como os usuários consomem armazenamento, tirando o foco das etapas de configuração de back-end e permitindo que eles se concentrem em outras funções importantes.

Embora seja essencial simplificar o consumo de armazenamento, existem outros recursos que também tornam o VMAX3 uma plataforma avançada que deve ser levada em consideração. Empregando componentes redundantes de hardware e arquitetura inteligente de software, o VMAX3 oferece desempenho extremo ao mesmo tempo em que fornece níveis de alta disponibilidade próximos de 6 noves. Além de tornar o sistema excepcionalmente confiável, essa combinação também aproveita os componentes de maneiras novas e inovadoras que diminuirão o custo total de propriedade de cada sistema.

Funcionalidades importantes — como a replicação local e remota de dados usada para oferecer continuidade de negócios — precisam lidar com mais dados do que nunca sem afetar as atividades de produção. Além disso, ao fim do dia, todos esses desafios precisam ser superados sem deixar de lado o aprimoramento contínuo dos aspectos econômicos.

Os destaques do VMAX3 incluem:

• Provisionamento baseado em nível de serviço: os requisitos de um consumidor de armazenamento giram em torno de capacidade e desempenho. É importante que eles recebam a quantidade certa de capacidade para atender adequadamente às respectivas necessidades e níveis de desempenho. O provisionamento baseado em nível de serviço permite que os usuários tenham a oportunidade de selecionar um nível de serviço predefinido, provisionar armazenamento para tal nível e obter o desempenho que precisam sem se preocupar com todas as configurações de back-end.

• Desempenho: o poder de processamento, a memória e a largura de banda disponíveis no VMAX3 fornecem altos níveis de desempenho previsível. Isso significa fornecer o desempenho adequado para atender às necessidades de IOPS (Input/Output per Second) e MB/s dos aplicativos mais exigentes do mundo. O VMAX3 também oferece a capacidade de absorver picos de I/O decorrentes de cargas de trabalho imprevisíveis, como as que surgem durante o processamento de fechamento de trimestre e consultas ad hoc intensas, ao mesmo tempo em que continua garantindo a consistência nos tempos de resposta de aplicativos.

Resumo executivo


• Segurança integrada e centrada em informações: o VMAX3 e a tecnologia RSA integrada oferecem segurança centrada em informações e líder do setor para proteger pessoas, infraestrutura e dados. Os recursos de segurança do VMAX3

reduzem riscos e protegem informações. As organizações podem autenticar, autorizar e auditar atividades nos sistemas e devices VMAX3.

• Disponibilidade ininterrupta (HA/RAS): a funcionalidade RAS (Reliability, Availability and Serviceability, confiabilidade, disponibilidade e facilidade de manutenção) da família VMAX3 faz com que ela seja a plataforma ideal para ambientes corporativos que precisam de disponibilidade ininterrupta. A família VMAX3 foi desenvolvida para proporcionar disponibilidade de 6 noves (99,9999%) nos ambientes cruciais mais exigentes. Os diversos recursos redundantes da arquitetura VMAX3 e discutidos neste documento são levados em consideração no cálculo da disponibilidade geral do sistema. Isso inclui redundância no back-end, na memória cache, no front-end e no fabric, bem como os tipos de proteção do RAID fornecidos a volumes no back-end, além de recursos de software de replicação local e remota, como TimeFinder e SRDF (Symmetrix Remote Data Facility). Os cálculos também podem incluir o tempo necessário para a reposição de FRUs (Field Replaceable Unit, unidade substituível em campo) com defeito ou apresentando defeito — que também é contabilizado nos níveis de serviço oferecido ao cliente — taxas de substituição das várias FRUs e a capacidade de hot sparing no caso de drives.

Sempre ativo com o VMAX3

O VMAX3 elevou as expectativas dos clientes em relação à disponibilidade, desempenho, replicação, escalabilidade e gerenciamento do armazenamento high-end. A disponibilidade high-end é muito mais do que simplesmente redundância; ela significa operações e upgrades não disruptivos, e uma operação “sempre on-line”. O fornecimento de desempenho high-end significa manusear todas as cargas de trabalho, previsíveis ou não, independentemente das condições. A replicação high-end significa qualquer volume de dados a qualquer momento, e enviar tais volumes independentemente da distância. A escalabilidade high-end significa mais do que capacidade; significa ter a flexibilidade de manipular qualquer nível de serviço ou aplicativo com economia independentemente das mudanças em seus negócios. E o gerenciamento de armazenamento high-end vai além do monitoramento de arrays de

Introdução


armazenamento; ele significa gerenciar os níveis de serviço que os negócios esperam, do provisionamento à continuidade de negócios. Assim como seus antecessores, o VMAX3 redefiniu o padrão no armazenamento high-end.

Público Este documento de notas técnicas se destina a qualquer pessoa que precise entender como os componentes e a tecnologia nos sistemas VMAX3 fornecem uma plataforma altamente confiável e disponível. Ele também se destina a pessoas que gostariam de saber mais sobre os aspectos de facilidade de manutenção dos sistemas VMAX3. Este documento se destina especificamente aos clientes e ao pessoal de vendas e atendimento de campo da EMC que estão trabalhando ou planejam trabalhar com um sistema VMAX3.

Introdução

A vinculação de SLAs (Service Level Agreement, contratos de nível de serviço) obriga as organizações de TI a fornecer medições de suporte consensuais e mensuráveis para desempenho do aplicativo, tempo de resposta de usuário final e disponibilidade do sistema. Em caso de falha de um componente, como um drive de disco ou fonte de alimentação defeituoso, tais organizações precisam fornecer os mais altos níveis de desempenho, disponibilidade e facilidade de manutenção — tudo sem comprometimento.

Executivos de TI em todo o mundo reconheceram que o tempo de inatividade não é medido apenas em minutos ou horas, mas também é calculado como potencial perda de receita, perda de oportunidades ou clientes insatisfeitos. Qualquer impacto operacional resultante da falha de um componente precisa ser completamente transparente para os aplicativos e usuários individuais que contam com a disponibilidade das informações para impulsionar os negócios.

Os ambientes de missão crítica dos dias de hoje exigem uma solução de armazenamento high-end que garanta níveis integrais de serviço, respaldados por um fornecedor que ofereça suporte de qualidade e um caminho de migração perfeito para novas tecnologias. Tal solução precisa incluir um projeto com arquitetura robusta, que enfrente todo e qualquer potencial defeito sem afetar a disponibilidade dos dados.

A série VMAX3 se baseia em um projeto revolucionário e inclui aprimoramentos importantes que melhoram a confiabilidade, a disponibilidade e a facilidade de manutenção dos novos sistemas — tornando o VMAX3 a opção ideal para aplicativos cruciais e ambientes que são executados 24 horas por dia, 7 dias por semana e exigem acesso ininterrupto às informações.

O objetivo desta nota técnica é oferecer uma visão geral das funcionalidades RAS (Reliability, Availability and Serviceability, confiabilidade, disponibilidade e facilidade de manutenção) presentes na arquitetura VMAX3.

Suporte remoto


Suporte remoto

O suporte remoto é uma parte importante e integral do Atendimento ao Cliente EMC. Cada unidade VMAX3 tem duas MMCSs (Management Module Control Stations, Control Stations do módulo de gerenciamento) que monitoram continuamente o ambiente do VMAX3. As MMCSs podem se comunicar com o EMC Customer Support Center por meio de uma conexão de rede para o ESRS (EMC Secure Remote Support) Gateway.

Por meio do MMCS, o sistema VMAX3 monitora ativamente todas as operações de I/O em busca de erros e falhas. Ao rastrear esses erros durante a operação normal, o sistema VMAX3 pode reconhecer padrões de atividade de erro e prever uma possível falha de hardware antes que ela ocorra. Muitas vezes esse recurso de rastreamento proativo de erros pode evitar falhas de componentes ao isolar ou retirar de serviço um componente suspeito antes que a falha ocorra. Os recursos do Call Home permitem que o sistema VMAX3 notifique automaticamente o Atendimento ao Cliente EMC sobre potenciais problemas antes que o defeito realmente ocorra. Um engenheiro de suporte técnico da EMC atende tais chamados e pode enviar um representante técnico da EMC para substituir um componente sem a interrupção do acesso aos dados.

Para oferecer os recursos de suporte remoto, o sistema VMAX3 está configurado para executar o processo de Call Home e alertar o Atendimento ao Cliente EMC sobre um potencial defeito. Um engenheiro autorizado de suporte técnico da EMC pode executar o diagnóstico do sistema remotamente para solução de problemas e resoluções adicionais. Configurar os produtos EMC de modo a permitir conectividade de entrada também permite que o Atendimento ao Cliente EMC se conecte proativamente aos sistemas para coletar os dados de diagnóstico necessários ou cuidar de problemas já identificados. O atual programa de conexão de entrada para o suporte do sistema VMAX3 emprega a última palavra em tecnologia de troca de chaves digitais, proporcionando autenticação sólida, segurança de aplicativo em camadas e uma infraestrutura centralizada de suporte que posiciona as ligações por um túnel criptografado entre o Atendimento ao Cliente EMC e a MMCS localizada dentro do sistema VMAX3.

Antes que qualquer pessoa do Atendimento ao Cliente EMC possa iniciar uma conexão para um sistema no site do cliente, tal pessoa precisa estar autenticada individualmente e ter sido reconhecida como um membro adequado da equipe do Atendimento ao Cliente EMC. Até mesmo o pessoal de campo, que pode ser conhecido pelo cliente, precisa estar adequadamente vinculado à conta do cliente específico.

Uma parte essencial do projeto do programa de suporte à conectividade é que a conexão à MMCS do VMAX3 do cliente precisa ter origem a partir de uma das várias Remote Support Networks especificamente projetadas na EMC. Em cada um desses EMC Support Centers, criamos o sistema de rede e a infraestrutura de segurança necessários para habilitar tanto a função call-EMC quanto a função call-device.

Suporte remoto


Capacidade de suporte por meio da Control Station do módulo de gerenciamento

A geração anterior do VMAX tinha um único Service Processor em cada sistema, que era usado para monitoramento de falhas, assim como para conectividade e manutenção remotas fornecidas pelo Atendimento ao Cliente EMC. No VMAX3, ampliamos tal característica para duas MMCSs na primeira engine de cada sistema (uma por director). Cada MMCS é alimentada pelas fontes de alimentação redundantes localizadas em seus respectivos director boards.

A MMCS localizada no director 1 é conhecida como a MMCS primária, e a MMCS localizada no director 2 é conhecida como a MMCS secundária. A MMCS primária fornecerá toda a funcionalidade de Control Station quando estiver operando normalmente, enquanto a MMCS secundária fornecerá um subconjunto dessa funcionalidade. Caso a MMCS primária apresente falha, a MMCS secundária será colocada em um estado secundário elevado, que permitirá uma funcionalidade elevada enquanto esse estado durar. As duas MMCSs estarão conectadas á rede do cliente, permitindo que o sistema tenha a capacidade redundante de informar sobre qualquer erro ao Atendimento ao Cliente EMC e também de permitir que o Atendimento ao Cliente EMC se conecte remotamente ao sistema.

A MMCS está envolvida com as seguintes tarefas de suporte e manutenção:

• Solução de problemas por parte do Atendimento ao Cliente EMC

• Scripts de substituição de componentes

• Carregamentos de código e scripts de configuração e instalação

• Tarefas do agendador interno, que monitoram a integridade do sistema

• Coleta e registro de erros

• Relato de erros e conectividade remota

Para mais informações sobre a MMCS e a redundância ao nível de componente, consulte a seção Control Station do módulo de gerenciamento (MMCS) deste documento.

Secure Service Credential (SSC), protegida pela RSA A tecnologia Secure Service Credential se aplica exclusivamente a atividades do Service Processor e ações não iniciadas pelo host em devices VMAX3. Essas credenciais de serviço descrevem quem está acessando, quais capacidades a pessoa tem, um intervalo de tempo durante o qual a credencial é válida e a auditoria de quais ações o pessoal do atendimento executou (e que podem ser encontradas nos registros symaudit). Caso essas credenciais não sejam validadas pelo VMAX3, o usuário não conseguirá acessar a MMCS ou outras funções internas. A SSC é aplicável para operações locais ou remotas de log-in no VMAX3.

Suporte remoto


Alguns dos recursos de segurança são transparentes para o cliente, como a autenticação e a autorização de acesso de serviço por parte do Atendimento ao Cliente EMC e acesso restrito (funções internas da MMCS e do Atendimento ao Cliente EMC) por SC (Service Credential, credencial de serviço — informações de ID do usuário). O acesso pode ser definido ao nível de usuário, e não apenas ao nível de host. Todas as informações de ID do usuário do VMAX3 serão criptografadas para armazenamento seguro no VMAX3.

As funções baseadas na MMCS seguirão as configurações de controle de acesso por usuário autenticado do Solutions Enabler a fim de limitar a visualização/controle de devices não particulares em ambientes compartilhados, como os de sistemas VMAX3 ou de sistemas conectados por SRDF.

Detecção de erros O VMAX3 fornece um pacote de verificações de integridade e erro para garantir que a integridade de dados seja mantida em caso de falha do sistema ou interrupção no fornecimento de energia. O sistema VMAX3 foi projetado com os seguintes recursos de integridade de dados:

• Verificações de erros de CRC no block

• Verificações da integridade dos dados

• Monitoramento e correção dos drives

• Erro de memória física

Verificações de erros de CRC no block

Os arrays VMAX3 comportam e oferecem:

• CRC (Cyclic Redundancy Code, código de redundância cíclica) do block T10 DIF (Data Integrity Field) padrão do setor para formatos de trilha.

Para sistemas abertos, isso permite que as CRCs de DIF sejam armazenadas com dados do usuário pelos arrays VMAX3 e usados para validação completa da integridade dos dados.

• Proteções adicionais para modos de falha de endereço/controle para obter níveis mais altos de proteção contra falhas. Essas proteções são definidas em blocks que podem ser definidos pelo usuário compatíveis com o padrão T10.

• Informações de status de gravação e endereço nos bytes extra na tag do aplicativo e na parte da tag de referência da CRC de block.

Verificações da integridade dos dados

Os arrays VMAX3 validam a integridade dos dados mantidos em qualquer lugar possível durante a vida útil dos dados. A partir do momento em que os dados são informados em um array VMAX3, eles são continuamente protegidos por

Suporte remoto


metadados de detecção de erros. Esses metadados de proteção são verificados por mecanismos de hardware e software sempre que acontece uma movimentação de dados no subsistema VMAX3, permitindo que o array forneça verificação completa e verdadeira da integridade e proteção contra a compartimentação de hardware ou software.

Os metadados de proteção são acrescentados ao fluxo de dados e contêm informações que descrevem o local esperado dos dados, bem como a representação CRC do conteúdo dos dados propriamente ditos. Os valores que se esperam encontrar nos metadados de proteção são armazenados continuamente em uma área separada do fluxo de dados. Os metadados de proteção são usados para validar a precisão lógica dos dados que estão sendo movidos no array VMAX3 sempre que os dados transitam entre chips de protocolo, buffers internos, endpoints internos do fabric de dados, cache do sistema e discos do sistema.

Monitoramento e correção dos drives

Os arrays VMAX3 monitoram defeitos nas mídias examinando o resultado de cada transferência de dados de disco e verificando proativamente todo o disco durante os tempos de inatividade. Se um block do disco for considerado defeituoso, o director:

1. Reconstrói os dados na memória física, se necessário.

2. Remapeia o block defeituoso para outra área do disco separada para essa finalidade.

3. Regrava os dados da memória física de volta no block remapeado do disco.

O director mapeia os blocks defeituosos detectados, evitando assim defeitos na mídia. Ele também rastreia cada block defeituoso detectado em um disco. Se o número de blocks inválidos exceder um limite predefinido, a MMCS (Management Module Control Station, Control Station do módulo de gerenciamento) primária invocará uma operação de sparing para substituir o drive com defeito e alertará automaticamente o atendimento ao cliente da EMC para tomar a ação corretiva.

Verificação de erros e correção de erros na memória física

O HYPERMAX OS, executado nos arrays VMAX3, é capaz de corrigir erros de bit único e informar um código de erro quando esses erros atingem um limite predefinido. Quando ocorre um erro de vários bits, o array VMAX3 segrega o segmento de memória física (o retirando de serviço) e recupera os dados a partir da memória espelhada (caso não tenham sido gravados) ou a partir do drive físico. No evento improvável de que seja necessário fazer uma substituição da memória física, o array VMAX3 notifica o suporte da EMC e haverá a solicitação da substituição. Então a FRU (Field Replaceable Unit, unidade substituível em campo) é enviada de volta à EMC para uma análise do defeito.

Redundância ao nível de componente do VMAX3


Componentes confiáveis Os sistemas VMAX3 utilizam componentes com um MTBF (Mean Time Between Failure, tempo médio entre falhas) de várias centenas de milhares a milhões de horas para uma taxa mínima de defeito de componente. Um projeto redundante permite que os sistemas VMAX3 permaneçam on-line e operacionais durante o reparo de componentes.

Uma verificação periódica do sistema testa a integridade de todos os componentes e do HYPERMAX OS 5977. Os sistemas VMAX3 informam sobre erros e condições ambientais ao sistema host e aos Centros de atendimento ao cliente EMC.


Todos os componentes cruciais do VMAX3 são totalmente redundantes, inclusive director boards, memória global, caminhos internos de dados, fontes de alimentação, bateria reserva e todos os componentes do back-end SAS. Abaixo apresentamos uma visão geral da redundância de cada um desses componentes.

Componentes da engine redundante A engine é um componente modular crucial de um sistema VMAX3. Ela consiste basicamente em dois director boards redundantes, que alojam memória global, conectividade front-end, conectividade back-end e componentes internos de comunicação de rede. As configurações de engine única do VMAX3 são totalmente redundantes.

Os diferentes modelos dos sistemas VMAX3 comportam diferentes contagens de engine. A tabela abaixo exibe o número de engines que cada modelo do VMAX3 comporta.

Tabela 1. Número de engines comportado por modelo de VMAX3



Figura 1. Visão frontal da engine

Figura 2. Visão posterior da engine

Director boards redundantes Como mencionado acima, cada engine consiste em dois director boards. Cada director board tem um sistema exclusivo de alimentação e refrigeração. A tabela abaixo lista os componentes em um director, duas quantidades e suas finalidades.



Tabela 2. Componentes do director

Figura 3. Visão frontal dos componentes do director



Figura 4. Visão posterior dos componentes do director

Control Station do módulo de gerenciamento (MMCS) e módulo de gerenciamento (MM)

Existem dois tipos diferentes de módulos de gerenciamento nos sistemas VMAX3, as MMCSs (Management Module Control Stations, Control Stations do módulo de gerenciamento) e os MMs (Managamente Modules, módulos de gerenciamento) padrão. A primeira engine de cada sistema VMAX3 será implementada com uma MMCS em cada director. Cada engine posterior (engines 2 a 8) será implementada com um módulo de gerenciamento em cada director, e não uma MMCS.

Control Station do módulo de gerenciamento (MMCS)

A MMCS combina o hardware do módulo de gerenciamento e da Control Station (Service Processor) em um único módulo. Ela fornece recursos de monitoramento ambiental para alimentação, refrigeração e conectividade. Cada MMCS monitora uma das SPSs (Standby Power Supplies, fontes de alimentação em standby) do sistema por meio de uma conexão RS232. Cada MMCS também está conectada aos dois switches Ethernet internos no sistema VMAX3 como parte do sistema interno de comunicação e controle ambiental.

Para mais informações sobre a comunicação e os controles ambientais internos, consulte a seção Conectividade Ethernet interna para dados ambientais deste documento.

A MMCS também oferece funcionalidade de compatibilidade. Cada MMCS se conectará à LAN do cliente para permitir o monitoramento do sistema e conectividade remota para a equipe do Atendimento ao Cliente EMC. A MMCS primária estará conectada ao KVM (Keyboard/vídeo/mouse, teclado/vídeo/mouse) no sistema VMAX3 e a MMCS secundária terá esses recursos de conexão como opção de backup. Elas também podem ser conectadas a um laptop externo ou a uma fonte externa de KVM.

Para mais informações sobre compatibilidade por meio da MMCS, consulte a seção Capacidade de suporte por meio da Control Station do módulo de gerenciamento deste documento.



A MMCS também controla as barras de LED azul na parte frontal e posterior de cada gabinete. Elas podem ser usadas para fins de identificação do sistema pelo Atendimento ao Cliente EMC. Para mais informações, consulte a seção Recurso de LED intermitente do gabinete para de identificação do sistema deste documento.

Figura 5. Conectividade da Control Station do módulo de gerenciamento

Módulo de gerenciamento (MM)

O módulo de gerenciamento tem um subconjunto de recurso da MMCS que não inclui a funcionalidade da Control Station. Cada módulo de gerenciamento terá uma conexão RS232 com uma SPS. O módulo de gerenciamento A se conectará apenas ao switch Ethernet A, e o módulo de gerenciamento B se conectará apenas ao switch Ethernet B. Assim como a MMCS, cada módulo de gerenciamento é responsável pelo monitoramento e geração de relatórios de qualquer problema ambiental, como problemas de alimentação, refrigeração ou conectividade.



Figura 6. Conectividade do módulo de gerenciamento

Módulo de I/O de flash Os módulos de I/O de flash do VMAX3 são utilizados durante a sequência de compartimentação. Para mais informações, consulte a seção Compartimentação deste documento.

Módulo de I/O de front-end Os módulos de I/O de front-end do VMAX3 são utilizados para conectividade de canal. Há diferentes tipos de módulos de I/O de front-end, que possibilitam a conectividade com várias interfaces diferentes. Entre elas estão SAN, SRDF e embedded NAS (eNAS). Para mais informações, consulte a seção Redundância front-end de canal deste documento.

Módulo de I/O de back-end Os módulos de I/O de back-end do VMAX3 são utilizados para conectar as director boards ao back-end do sistema, possibilitando o I/O até os drives do sistema. Para mais informações, consulte a seção Redundância de back-end SAS deste documento.



Módulo InfiniBand (IB) Os módulos InfiniBand (IB) do VMAX3 fornecem conectividade aos MIBEs (Matrix Interface Board Enclosures, compartimentos para placa de interface matriz) como parte da Dynamic Virtual Matrix. Para mais informações, consulte a seção Dynamic Virtual Matrix deste documento.

Memória física compartilhada No VMAX3, a memória pode ser acessível por qualquer director no array.

• Caso um array tenha uma engine única, os pares de memória física são internos à engine.

• Caso um array tenha várias engines, a memória física é pareada entre as engines.

A tecnologia de gravação dual é mantida pelo array. Em caso de falha de um director ou da memória, os dados continuam disponíveis a partir da cópia redundante.

Visão geral da tecnologia de memória global

A memória global é um componente bastante crucial no array VMAX3. Todas as operações de leitura e gravação são transferidas para ou a partir da memória global. O VMAX3 permite a qualquer transferência entre o processador do host e channel directors, permitindo que elas sejam processadas a velocidades eletrônicas muito maiores do que as transferências que envolvem discos físicos. O VMAX3 utiliza algoritmos estatísticos complexos de prefetch que podem se ajustar às condições próximas no array VMAX3. Os algoritmos inteligentes da EMC se ajustam automaticamente à carga de trabalho ao monitorar, avaliar e otimizar constantemente as decisões sobre cache.

O array VMAX3 utiliza a tecnologia DRAM DDR3 (16 slots por director), que permite que o array VMAX3 seja configurado com até 2 TB de memória por engine e até 16 TB por array.

Numeração das portas físicas A numeração das portas físicas na engine do VMAX3 é empregada para determinar quantos cabos serão conectados aos módulos de front-end, back-end e I/O de fabric. A numeração de portas físicas em cada director board do VMAX3 segue as mesmas regras. Veja a seguir uma lista dessas regras:

• Os slots do módulo de I/O são numerados de 0 a 10 da esquerda para a direita

• Os módulos de I/O com 4 portas são numerados de 0 a 3 de baixo para cima

• Os módulos de I/O com 2 portas são numerados de 0 a 1 de baixo para cima



Figura 7. Visão posterior da engine com a numeração das portas físicas

Numeração das portas lógicas A numeração das portas lógicas na engine do VMAX3 é empregada para determinar como o HYPERMAX OS vai interpretar o que está conectado às portas de front-end, back-end e fabric. A numeração de portas lógicas em cada director board do VMAX3 segue as mesmas regras. Veja a seguir uma lista dessas regras:

• Comporta 32 portas lógicas (portas 0 a 31)

• As portas lógicas são numeradas da esquerda para a direita, de baixo para cima

• As portas 0 a 3 e 20 a 23 são internamente exclusivas para os módulos de I/O do compartimento

Figura 8. Visão posterior da engine com a numeração das portas lógicas



Redundância de front-end do canal A redundância de canal é fornecida ao configurar várias conexões a partir dos servidores host (conexão direta) ou FC switch (conexão SAN) para o sistema VMAX3. Com a conectividade SAN, por meio de FC switches, cada porta do VMAX3 pode comportar várias conexões de host, possibilitando a consolidação do armazenamento em um grande número de plataformas de host. As conexões múltiplas devem ser distribuídas em directors separados para garantir acesso ininterrupto em caso de uma falha de canal. São necessárias pelo menos duas conexões por servidor ou SAN para oferecer redundância completa.

A conectividade de host com as portas do director front-end deve ser espalhada entre componentes físicos, tendo como objetivo a forma de redundância mais eficiente.

Ao conectar um host ou um cluster ao VMAX3, recomendamos:

• A configuração de 2 a 4 caminhos de front-end no grupo de portas com mascaramento e zonas para o host (recomenda-se um zoneamento com iniciador único)

• Para opções de cabeamento, uma das abordagens é conectar todas as portas pares ao fabric A e todas as portas ímpares ao fabric B.

• Em sistemas com engine única que adotam essa abordagem, selecione duas portas de I/O que abranjam ambos os SAN fabrics em cada director.

Exemplo: porta 28 e 29 tanto no director 1 quanto no director 2.

• Em um sistema com várias engines, a seleção de uma porta ímpar e uma porta par em ao menos dois directors diferentes abrangendo engines diferentes servirá para distribuir a carga, proporcionando desempenho e garantindo redundância do fabric.

Exemplo: porta 28 e 29 nos directors 1 e 3.



Figura 9. Conectividade SAN em ambiente VMAX3 com engine única

Redundância de back-end SAS A arquitetura VMAX3 incorpora um projeto de back-end SAS de 6 Gb/s para garantir alto desempenho e redundância total. O SAS é um protocolo high-end confiável que utiliza uma estrutura ramificada sem conexões com caminhos exclusivos para dispositivos individuais. Os caminhos são armazenados em tabelas de roteamento que são criadas durante a fase de detecção e utilizadas para rotear o I/O para o endpoint desejado.

O subsistema do back-end SAS fornece caminhos redundantes independentes até os dados armazenados em drives físicos, garantindo acesso ininterrupto às informações, mesmo em casos de falha e/ou substituição.

A seguir apresentamos uma visão geral dos componentes redundantes do subsistema de back-end do VMAX3.

Conectividade redundante do director do back-end

Um par de directors na mesma engine é utilizado para acessar cada drive. Um director está conectado ao caminho físico primário até o drive, e o outro director está conectado ao caminho físico secundário até o drive. Os directors estão conectados por um par de módulos e cabeamento independentes de I/O de back-end que permitem que os dados sejam movimentados entre a memória global e os drives. Cada director está conectado à memória global por meio de caminhos primários e secundários, eliminando possíveis pontos únicos de falha. Para mais informações sobre pontos únicos de falha, consulte a seção Recurso de iniciador dual deste documento.



Caminhos redundantes de cabeamento

Cada módulo de I/O de back-end está conectado à sua LCC (Link Control Card, placa de controle de link) associada e cadeia de DAE (Disk Array Enclosure, gaveta Disk Array Enclosure) por meio de um conjunto de cabos completamente independente. Cada conexão conta com quatro caminhos, fornecendo um aumento na confiabilidade e no throughput.

Caminhos redundantes de drive

Cada drive SAS tem duas portas, que estão conectadas por um caminho totalmente independente. Na arquitetura VMAX3, cada uma dessas portas está conectada por meio de directors, cabos e LCCs separados.

Back-end ponto a ponto

Os sistemas VMAX3 empregam uma rede SAS ponto a ponto e sem conexões que tem uma relação independente com cada drive. Essa relação entre a controladora back-end e cada drive permite que o VMAX3 analise a integridade do drive e aprimore sua facilidade de manutenção.

A rede SAS ponto a ponto e sem conexão consiste em controladoras SAS nos módulos de I/O de back-end e expansores SAS nas LCCs (VMAX DAE60 ICM/LCC e VMAX DAE120 LCC). Esses pontos de controle da rede SAS contêm as tabelas de roteamento necessárias para movimentar dados do ponto A para o ponto B na rede. As tabelas de roteamento são criadas durante a fase de detecção, enquanto a rede SAS é inicializada ou durante eventos de mudança da topologia. Por exemplo, uma alteração de topologia pode consistir na inserção/retirada de um drive, na conexão/desconexão de um cabo ou na instalação/desinstalação de uma LCC.

Gaveta Disk Array Enclosure (DAE)

O VMAX3 pode ser equipado com dois tipos diferentes de DAE. A VMAX DAE60 é compatível com drives de 3,5 pol. e 2,5 pol. em uma transportadora de 3,5 pol. A VMAX DAE120 é compatível com drives de 2,5 pol. Os dois tipos podem ser misturados em um sistema único. A DAE aloja tanto os drives físicos quanto as LCCs.

Componentes da DAE

A DAE60 pode ser preenchida com no máximo 60 drives e conta tanto com ICMs (Inter-Connect Modules, módulos de interconexão) e LCCs para oferecer a comunicação dos drives físicos para os módulos de I/O de back-end e vice-versa. O ICM contém expansores que fazem interface com o resto do sistema, inclusive cabos para os módulos de I/O de back-end e para as DAEs de expansão. As LCCs contêm dois expansores, cada um deles faz interface com o ICM e com os drives. A LCC A se conectará com um conjunto de 60 drives e a LCC B se conectará com a segunda porta dos mesmos drives. Cada um dos 2 expansores de drive em cada LCC A e LCC B (cada um conectado a 30 drives) resultarão em um total de até 60 drives conectados às 2 portas de cada drive para fins de redundância.



Figura 10. VMAX DAE60

O DAE120 pode ser preenchido com no máximo de 120 drives. Há quatro expansores de drive em cada LCC. Cada um dos expansores de drive se conecta a 30 drives. Um total de 4 expansores de drive conectados a 30 drives cada resultará em um total de 120 drives. LCC A e LCC B se conectarão às duas portas em cada drive para fins de redundância.

Figura 11. VMAX DAE120

Zonas de falha para DAEs

As DAEs do VMAX3 são projetadas para oferece proteção completa contra zona de falha em caso de interrupções imprevista no fornecimento elétrico. Os dois tipos de DAEs têm várias zonas de falha, que fornecem efetivamente quatro compartimentos virtuais de drive em uma única DAE.



Figura 12. Zonas de falha para o modelo DAE60



Figura 13. Zonas de falha para o modelo DAE120

Recurso de iniciador dual

Os sistemas VMAX3 têm um recurso de iniciador dual que garante a disponibilidade contínua de dados no improvável evento de uma falha do hardware de gerenciamento de drive. O iniciador dual não fornece disponibilidade dos dados em caso de falha de drive. Observe que os drives são configurados em grupos de RAID que fornecem proteção aos mesmos. Para mais informações sobre o RAID, consulte a seção Métodos de proteção de dados deste documento.

Este recurso funciona ao fazer com que os dois directors em uma engine única se conectem a caminhos redundantes na DAE. Um único director pode se conectar tanto à LCC A quanto à LCC B da mesma DAE. O outro director na engine, o iniciador dual, pode se conectar ao outro lado tanto da LCC A quanto da LCC B. Esse esquema de cabeamento fornecerá redundância completa para fins de disponibilidade.

Caso os mecanismos sofisticados de isolamento do sistema VMAX3 detectem uma falha no director do back-end, o sistema pode processar leituras e gravações nos drives por meio de um caminho completamente independente a partir do iniciador dual e sem interrupções.



Figura 14. Exemplo de cabeamento SAS para o VMAX3

Dynamic virtual matrix A Dynamic Virtual Matrix utiliza tecnologia Infiniband (56 Gbps) para transportar dados de controle, metadados e dados do usuário pelo sistema VMAX3. Essa tecnologia conecta todas as engines no sistema, fornecendo uma forma avançada de redundância e desempenho. Isso permite que as engines compartilhem os recursos e atuem como uma única entidade enquanto se comunicam. Em qualquer sistema VMAX3 com duas engines ou mais, existem dois MIBEs que se conectam aos módulos de I/O de fabric de cada director board. A finalidade da Dynamic Virtual Matrix é criar uma interconexão de comunicação entre todas as engines, portanto, um sistema com engine única não requer uma Dynamic Virtual Matrix ou MIBEs.

As plataformas VMAX 100K e 200K contêm 2 MIBEs com 12 portas e fontes de alimentação redundantes e que não são FRUs.

Figura 15. Visão frontal do MIBE nos modelos VMAX 100K e 200K



A plataforma VMAX 400K contém 2 MIBEs com 18 portas e fontes de alimentação redundantes e hot pluggable, assim como ventiladores que podem ser substituídos.

Figura 16. Visão frontal (superior) e posterior (inferior) do MIBE do VMAX 400K

Conectividade Ethernet interna para dados ambientais O sistema VMAX3 transporta informações ambientais por meio de dois switches Ethernet redundantes. Cada MMCS se conecta aos dois switches Ethernet, e cada módulo de gerenciamento se conecta a um switch (directors ímpares a um, directors pares ao outro). Eles fornecem comunicações e controle ambiental de nível básico em todo o sistema para a execução de aplicativos, monitoramento e diagnóstico do sistema a partir da MMCS.

Obs.: eles estão separados dos MIBEs Infiniband que fazem parte da Dynamic Virtual Matrix.

A rede interna de conectividade Ethernet monitora e registra eventos ambientais em todos os componentes cruciais e informa sobre qualquer problema operacional. Os componentes cruciais incluem director boards, memória global, fontes de alimentação, módulos de entrada de alimentação, ventiladores e diversos interruptores liga/desliga. O recurso de controle ambiental dessa rede é capaz de monitorar as tensões locais de cada componente, garantindo o fornecimento ideal de energia. A temperatura dos director board e da memória também é monitorada continuamente. A verificação da fonte principal de alimentação AC monitora:

• Falhas de AC

• Transferência para a fonte auxiliar

• Falhas de CC

• Compartilhamento atual entre fontes CC

• Tensão de saída CC

• Notificação específica de condição de sobretensão



• Corrente de cada fonte CC

• Quedas de tensão entre os conectores principais

É possível detectar e substituir componentes que estão apresentando defeito antes de uma falha.

Figura 17. Conectividade Ethernet interna

Subsistema de alimentação redundante O VMAX3 tem um subsistema modular de alimentação com uma arquitetura redundante que facilita a substituição em campo de qualquer um de seus componentes sem nenhuma interrupção no processamento.

O subsistema de alimentação do VMAX3 tem duas zonas de alimentação para fins de redundância. Cada zona de alimentação se conecta a uma linha de alimentação AC exclusiva ou isolada. Caso a alimentação AC falhe em uma zona, o subsistema de alimentação continua operando por meio da outra zona de alimentação. Em caso de falha de qualquer módulo individual de fonte de alimentação do VMAX3, as fontes de alimentação restantes continuam compartilhando a carga. O sistema VMAX3 detecta a falha e o relata como um erro ambiental.

Módulos de unidade de bateria reserva

Agora o VMAX3 utiliza módulos SPS de íon de lítio para fins de bateria reserva. Eles são mais leves e têm uma vida útil maior do que os módulos SPS de ácido de chumbo. Os gabinetes do sistema dos modelos 100K, 200K e 400K da família VMAX3 podem incluir até seis módulos SPS de íon de lítio. A quantidade e a localização dos módulos SPS depende do tipo de gabinete do sistema e do número de engines no array. As seguintes regras são aplicadas às configurações SPS:

• Os módulos SPS 3A e 3B fornecem alimentação reserva para a primeira engine (ímpar) no gabinete. Eles também fornecem alimentação reserva para os dois MIBES, caso eles estejam configurados no sistema.



• Os módulos SPS 2A e 2B alimentam a segunda engine (par) em um gabinete do sistema com duas engines, e são obrigatórios em todos os gabinetes do sistema com duas engines.

• Os módulos SPS 1A e 1B fornecem alimentação reserva para os dois MIBEs e para a primeira engine (ímpar). Eles só são obrigatórios em configurações com MIBEs, que incluem configurações com duas engines e em configurações com engine única e dois gabinetes ou mais.

Compartimentação O tempo necessário para transferir todos os dados do array para um estado persistente aumentou junto com o tamanho do cache. A compartimentação foi projetada para limitar o tempo durante o qual é necessário desligar o sistema caso ele precise usar uma bateria como fonte de alimentação. Ao contrário das plataformas anteriores, a plataforma VMAX3 não faz compartimentação para os discos. Agora ela faz a compartimentação para módulos exclusivos de I/O, conhecidos como módulos de I/O flash, economizando espaço em disco. A compartimentação para o flash também simplifica o processo de compartimentação, além de centralizá-lo nos componentes da engine, removendo a necessidade de baterias reserva para discos, criando uma configuração geral mais densa do que as dos sistemas anteriores.

Acionadores da compartimentação

Mudanças de estado no sistema VMAX3 que obriguem o sistema a compartimentar são chamadas de acionadores da compartimentação. Existem dois tipos de acionadores da compartimentação: acionadores de disponibilidade interna e acionadores de disponibilidade externa.

Acionadores de disponibilidade interna

Os acionadores de disponibilidade interna são iniciados quando há o comprometimento dos dados da memória global em decorrência de indisponibilidade de componentes. Assim que tais componentes se tornam indisponíveis, o sistema acionará o estado NTV (Need To Vault, necessidade de compartimentação) e a compartimentação será executada. Existem três acionadores internos:

1. Disponibilidade de flash para compartimentação — os módulos de I/O flash são usados para armazenamento de metadados sob condições normais, assim como para o armazenamento de qualquer dado que esteja sendo salvo durante o processo de compartimentação. O processo NTV será acionado quando o espaço geral disponível do flash nos módulos de I/O flash alcançar o mesmo tamanho da N cópia da memória global. Isso serve para garantir que todos os dados serão salvos antes que ocorra uma potencial perda adicional do espaço em flash para compartimentação.



2. Disponibilidade de memória global (GM) — quando qualquer um dos pares espelhados de director está sem integridade lógica ou ambiental, o NTV será acionado em decorrência de indisponibilidade da GM (Global Memory, memória global).

3. Disponibilidade do fabric — quando os dois switches fabric estão sem integridade ambiental, o NTV será acionado em decorrência de indisponibilidade do fabric.

Acionadores de disponibilidade externa

Os acionadores de disponibilidade externa são iniciados em situações nas quais não há o comprometimento de dados da memória global, mas foi determinado que a preservação do sistema será melhorada mediante a compartimentação. Nesse contexto, a compartimentação é usada como um mecanismo para interromper a atividade do host, facilitar uma recuperação ou servir como uma tentativa de iniciativa proativa para prevenir uma potencial perda de dados. Existem dois acionadores externos:

1. Acionador da engine — o sistema VMAX3 executará a compartimentação quando houver a falha de uma engine inteira.

2. Acionador da DAE — caso o sistema tenha perdido o acesso a toda a DAE ou a todas as DAEs e tal perda cause a inacessibilidade dos membros configurados do RAID, o sistema executará a compartimentação.

Operação de desligamento

Quando um sistema VMAX3 é desligado ou colocado em modo off-line, ou quando as condições ambientais acionam uma situação de compartimentação, o procedimento de compartimentação é iniciado. Durante o desligamento ou uma perda de energia, a parte da memória global que é salva primeiro alcança uma imagem consistente (sem mais gravações). Então os directors gravam as seções adequadas da memória global nos módulos de I/O flash, salvando duas cópias dos dados lógicos. Os módulos BBU (Battery Backup Unit, unidade de bateria reserva) mantém a alimentação do sistema por até 5 minutos durante o processo de desligamento.

Operação de inicialização

Durante a inicialização, os dados são gravados novamente na memória global para restaurar o sistema. Quando o sistema VMAX3 é acionado no programa de inicialização, ele faz o seguinte:

• Inicializa o hardware e o sistema ambiental.

• Restaura a memória global a partir dos dados salvos enquanto verifica a integridade dos dados. Isso é feito retirando seções de cada cópia da memória global que foi salva durante a operação de desligamento e as combinando em uma única cópia completa da memória global. Caso haja qualquer problema de integridade dos dados em uma seção da primeira

Métodos de proteção de dados


cópia que foi salva, a seção será extraída da segunda cópia durante este processo.

• Executa uma limpeza, verificação de integridade da estrutura de dados e reinicialização das estruturas de dados necessárias da memória global.

Ao fim do programa de inicialização, o sistema retoma a operação normal quando as BBUs estiverem carregadas o bastante para atender outra compartimentação. Se alguma condição não for segura, o sistema não retomará a operação e entrará em contato com o Atendimento ao Cliente para fins de diagnóstico e reparo. Nessa situação, o Atendimento ao Cliente poderá se comunicar com o sistema VMAX3 e descobrir o motivo para a não retomada da operação normal.


Embora o sistema VMAX3 tenha recursos padrão que oferecem um maior nível de disponibilidade dos dados em relação às DASDs (Direct Access Storage Devices, devices de armazenamento com acesso direto) convencionais, as seguintes opções de proteção de dados garantem um nível ainda maior de capacidade de recuperação e disponibilidade de dados:

• RAID 1 (espelhamento)

• RAID 5

• RAID 6

• RAID local

• Provisionamento thin

• Sparing de drive

• Replicação local com o TimeFinder

• Replicação remota com SRDF (Symmetrix Remote Data Facility)

Essas opções de proteção de dados (com exceção do sparing de disco) são configuráveis ao nível de volume físico, sendo possível aplicar diferentes níveis de proteção a diferentes conjuntos de dados no mesmo sistema VMAX3.

RAID 1 (espelhamento) As configurações RAID 1 têm maior desempenho em praticamente todos os aplicativos porque cada drive tem uma cópia dos dados. Dessa maneira, é possível que o sistema atenda duas solicitações simultâneas de I/O, enviando ou recebendo cada uma delas a partir de uma das duas cópias. Os volumes espelhados também terão menores tempos de resposta devido à DMSP (Dynamic Mirror Service Policy, política de serviço de espelhamento dinâmico) do VMAX3, que determina automaticamente o disco ideal a ser lido para alcançar o



desempenho máximo. Volumes espelhados também terão menores tempos de resposta, já que o sistema VMAX3 pode acessar os dados em qualquer um dos drives espelhados.

Configurações espelhadas também oferecem maior desempenho caso haja uma falha do disco, já que há outra cópia completa dos dados imediatamente disponível. Além disso, como apenas dois discos são usados para o espelhamento, a chance de falha em vários drives contendo os mesmos dados é reduzida.

RAID 5 A família VMAX3 é compatível com a proteção de dados do RAID 5. Essa é uma implementação da técnica de proteção de dados RAID 5 padrão do setor com paridade rotacional entre todos os membros do conjunto do RAID 5. Em caso de uma falha de drive físico, os dados perdidos são reconstruídos a partir da leitura dos drives restantes no grupo de RAID e da realização de cálculos XOR (operação lógica).

O RAID 5 oferece proteção de dados econômica contra falhas de drive. Enquanto os ambientes mais exigentes continuam optando por armazenamento espelhado para o desempenho máximo, as configurações tipo RAID 5 oferecem uma alternativa extremamente atrativa para o armazenamento de informação quando o preço é mais importante do que o desempenho.

Para o VMAX3, o RAID 5 está disponível em 2 configurações:

• RAID 5 (3+1) — dados e paridade fracionados entre 4 drives (3 para dados, 1 para paridade)

• RAID 5 (7+1) — dados e paridade fracionados entre 8 drives (7 para dados, 1 para paridade)

RAID 6 Esquemas de proteção como RAID 1 e RAID 5 podem proteger um sistema contra a falha de um único drive físico dentro de um par espelhado ou grupo de RAID. O RAID 6 permite a capacidade de reconstruir dados quando houver a falha de dois drives em um grupo de RAID.

A implementação da EMC para o RAID 6 calcula dois tipos de paridade. Isso é importante durante eventos de falha de dois drives no mesmo grupo de RAID, porque ainda permite que os dados sejam reconstruídos nesse cenário. A paridade horizontal é idêntica à paridade do RAID 5, que é calculada a partir dos dados entre todos os discos no grupo de RAID. A paridade diagonal é calculada em um subconjunto diagonal de membros de dados. O RAID 6 fornece a mais alta disponibilidade dos dados para as aplicações que não exigem desempenho.



RAID local O RAID local é um novo conceito que foi apresentado no VMAX3 e está implementado em todos os ambientes VMAX3. O RAID local coloca todos os membros de um grupo de RAID sob uma engine única. Isso melhora o desempenho de back-end ao mesmo tempo em que respalda o modelo de failover/failback com iniciador dual. As seguintes regras de distribuição de membros se aplicam às configurações de RAID local:

• Não é possível colocar dois membros do mesmo grupo de RAID no mesmo disco

• Os discos residirão nos grupos de disco

• Cada grupo de disco suporta apenas um tipo de RAID

• Como padrão, é criado um grupo de disco por tipo de disco

• Cada grupo de disco será provisionado com seus próprios discos sobressalentes

Além do melhor desempenho, também há outros benefícios associados ao RAID local, entre eles:

• Eliminação do cabeamento entre gabinetes para cabeamento DAE direto/encadeamento em série

• Dispersão ao nível de engine/gabinete

• Configuração de novos sistemas ou upgrades com qualquer combinação de engines/gabinetes contíguos ou dispersos

• É possível posicionar engine/gabinete em qualquer lado do gabinete nº 1 do sistema

• A capacidade de planejamento de piso mais flexível do setor

Provisionamento thin O provisionamento virtual possibilita um aumento na utilização da capacidade ao permitir que um host possa receber a oferta de mais armazenamento do que o consumido fisicamente e ao alocar o armazenamento apenas conforme exigido de um pool virtual compartilhado. O provisionamento virtual também simplifica o gerenciamento de armazenamento ao facilitar o layout dos dados por meio de fracionamento abrangente automatizado e ao reduzir as etapas necessárias para acomodar o crescimento.

O provisionamento virtual utiliza um tipo de device acessível pelo host chamado de device provisionado virtualmente, também conhecido como thin device, e que não exige a alocação completa de armazenamento físico no momento da criação e da apresentação dos devices para um host. O armazenamento físico utilizado para



suprir o espaço de drive para um device provisionado virtualmente vem do pool de armazenamento compartilhado, também conhecido como SRP (Storage Resource Pool, pool de recursos de armazenamento). O SRP é composto por um ou mais pools de dados com devices internos chamados de devices de dados. Tais devices de dados servem exclusivamente ao propósito de fornecer o armazenamento físico realmente utilizado pelos devices provisionados virtualmente.

Quando uma gravação de dados ocorre em uma parte do device provisionado virtualmente, o array VMAX3 aloca um lote mínimo de armazenamento físico a partir do pool e mapeia tal armazenamento para uma região do device provisionado virtualmente, inclusive a área de destino da gravação. Essas operações de alocação de armazenamento são realizadas em pequenas unidades de armazenamento denominadas extents de device provisionado virtualmente. Os extents também podem ser chamados de fragmentos.

O tamanho de um extent em um device provisionado virtualmente é de uma trilha (128 KB).

Quando uma leitura é executada em um device provisionado virtualmente, os dados lidos são recuperados a partir do devices de dados apropriado no SRP ao qual o device provisionado virtualmente está ligado. Leituras direcionadas para uma área de um device provisionado virtualmente que não foi mapeado não acionam operações de alocação. O resultado da leitura de um block não mapeado será o retorno de um block no qual cada byte é igual a zero. Quando for necessário mais armazenamento para atender a devices provisionados virtualmente futuros ou existentes, é possível adicionar devices de dados aos pools de dados provisionados virtualmente no SRP.

Para mais informações sobre provisionamento virtual no VMAX3, consulte as notas técnicas EMC® VMAX3 — provisionamento de nível de serviço com FAST (Fully Automated Storage Tiering).

Sparing de drive Os sistemas VMAX3 com HYPERMAX OS são compatíveis com sparing direto para a substituição automática de um drive defeituoso por um drive sobressalente. O sparing direto no VMAX3 é compatível com todos os tipos de proteção, inclusive RAID 6 (14+2).

Dois fatores tradicionais de sparing, discos de compartimento e a localização do drive no loop fibre, não se aplicam aos sistemas VMAX3. Os sistemas VMAX3 executam a compartimentação para módulos de I/O flash na engine e não para drives de compartimento, e o HYPERMAX OS pode realocar dinamicamente os drives sobressalentes entre directors back-end na mesma engine.

O principal fator do sparing direto no VMAX3 é a zona de alimentação no compartimento de disco no qual o drive sobressalente, o drive defeituoso e outros membros do RAID estão. Os modos de proteção RAID 1 e RAID 5 só podem ter um membro por zona de alimentação, e o RAID 6 pode ter até dois membros por zona de alimentação.



O HYPERMAX OS utiliza a mesma categoria para drives sobressalentes; preferencial, comum e não preferencial. O script de sparing de disco seleciona o melhor drive disponível utilizando as regras descritas na tabela abaixo.

Serviço postergado

Com o indicador de serviço postergado ativado, os drives sobressalentes serão marcados para substituição quando qualquer drive no sistema não tiver mais um drive sobressalente após a ocorrência de uma operação de sparing. Isso permite que clientes agendem a manutenção de substituição de drives menos vezes com o Atendimento ao Cliente EMC, já que vários drives serão substituídos ao mesmo tempo.

Para mais informações sobre sparing de drives, consulte o white paper Drive Sparing in EMC® Symmetrix® VMAX3 Family Systems.

Replicação local com o TimeFinder O software TimeFinder® fornece cópias point-in-time de volumes que podem ser usadas para backups, suporte a decisões, atualizações de data warehouse ou qualquer outro processo que exige acesso paralelo a dados de produção.

Famílias anteriores do VMAX forneceram diversas ofertas diferentes do TimeFinder, cada uma com suas próprias características e casos de uso ideais. Tais ofertas também têm várias semelhanças, e a principal delas é que todas precisam de um volume de destino para a retenção de snapshot ou dados de clone.

O TimeFinder no HYPERMAX OS 5977 para VMAX3 apresenta o TimeFinder SnapVX, que combina os melhores aspectos das ofertas anteriores do TimeFinder, aumenta a escalabilidade e acrescenta alguns recursos que facilitam o uso.

O SnapVX fornece snapshots e clones de baixíssimo impacto para volumes de dados do VMAX3. O SnapVX comporta até 256 snapshots por dispositivo de origem, que são controlados como versões com menos sobrecarga e controle simples de relacionamento. Os usuários podem atribuir nomes para identificar os snapshots, e têm a opção de definir datas de expiração automática em cada snapshot.

O SnapVX permite gerenciar cópias point-in-time consistentes para grupos de armazenamento com uma só operação. É possível vincular até 1.024 volumes de destino por volume de origem, fornecendo acesso de leitura/gravação como indicador ou cópias completas.

O TimeFinder no HYPERMAX OS também oferece modos de compatibilidade para usuários que contam com scripts de comando para TimeFinder Mirror, Snap, Clone ou VP Snap. Isso permitirá que os usuários utilizem seus scripts existentes enquanto aprendem como aproveitar os novos recursos do SnapVX.

Para mais informações sobre o TimeFinder SnapVX, consulte as notas técnicas EMC® VMAX3 Local Replication Suite.



Replicação remota com o SRDF As soluções EMC SRDF oferecem soluções para recuperação de desastres e mobilidade de dados para os arrays VMAX e VMAX3. Os serviços do SRDF são fornecidos pelos seguintes ambientes operacionais:

• HYPERMAX OS para os arrays VMAX3 100K, 200K e 400K

• Enginuity para arrays VMAX 10K, 20K e 40K

O SRDF replica dados entre dois, três ou quatro arrays localizados na mesma sala, no mesmo campus ou a milhares de quilômetros de distância.

• O SRDF síncrono (SRDF/S) mantém uma cópia em tempo real nos arrays localizados a até 200 quilômetros. As gravações do host de produção são reconhecidas pelo array local quando são realizadas em cache no array remoto.

• O SRDF/asynchronous (SRDF/A) mantém uma cópia consistente dependente de gravação nos arrays localizados a distâncias ilimitadas. As gravações do host de produção são reconhecidas imediatamente pelo array local, assim, a replicação não tem impacto sobre o desempenho do host. Geralmente, os dados do array remoto ficam somente segundos atrasados em relação ao local principal.

As soluções de recuperação de desastres do SRDF utilizam espelhamento “ativo, remoto” e lógica dependente de gravação para criar cópias consistentes dos dados. A consistência de gravação dependente garante a consistência transacional quando os aplicativos são reiniciados no local remoto. É possível personalizar sua solução do SRDF para que atinja diversos objetivos de ponto de recuperação/objetivos de tempo de recuperação.

Utilizando somente o SRDF, você pode criar soluções completas para:

• Criar cópias em tempo real (SRDF/S) ou cópias consistentes dependentes de gravação (SRDF/A) em um, dois ou três arrays remotos.

• Mover dados rapidamente por longas distâncias.

• Oferecer recuperação de desastres em três locais com recuperação de perda de dados nula, proteção da continuidade de negócios e reinicialização em caso de desastre.

Você pode integrar o SRDF a outros produtos da EMC para criar soluções completas para:

• Reiniciar operações após um desastre com perda de dados nula e uma proteção da continuidade de negócios.



• Reiniciar operações em ambientes em cluster. Por exemplo, Microsoft Cluster Server com Microsoft Failover Clusters.

• Monitorar e automatizar as operações de reinicialização em um local alternativo ou em um servidor remoto.

• Automatizar as operações de reinicialização em ambientes VMware.

Compatibilidade com SRDF/Cascade e SRDF/Star: o Service Release do 1º trim. de 2015 do HYPERMAX OS 5977 apresenta a compatibilidade com configurações SRDF/Cascaded e SRDF/Star.

As configurações SRDF/Cascade utilizam replicação remota em três sites com espelhamento SRDA/A entre os sites B e C, proporcionando flexibilidade adicional de reinicialização em caso de desastre. A figura 18 apresenta um exemplo de uma solução SRDF/Cascade.

Figura 18. SRDF/Cascade

Geralmente, o SRDF/Star é usado para oferecer a maior resiliência na recuperação de desastres. O SRDF/Star é configurado com três sites, possibilitando a retomada de SRDF/A sem perda de dados entre dois sites remanescentes, fornecendo espelhamento remoto contínuo dos dados e preservando os recursos de reinicialização em caso de desastre. A figura 19 apresenta exemplos de soluções SRDF/Star em cascata e simultâneo.



Figura 19. SRDF/Star

Para mais informações sobre o SRDF, consulte o Guia de Produto da Família EMC®VMAX3 com HYPERMAX OS.

D@RE (Data at Rest Encryption) O Service Release do 1º trim. de 2015 do HYPERMAX OS 5977 apresenta compatibilidade com D@RE (Data at Rest Encryption, criptografia de dados em repouso), que protege a confidencialidade dos dados mediante a adição de criptografia de back-end a todo o array. A D@RE fornece criptografia de back-end no array e baseada em hardware para sistemas VMAX3. A criptografia de back-end protege as informações contra acesso não autorizado quando os drives são removidos do sistema.

A D@RE fornece criptografia no back-end utilizando módulos de I/O Fibre Channel que incorporam a criptografia de dados em repouso XTS-AES de 256 bits. Esses módulos de I/O criptografam e decriptam os dados enquanto eles estão sendo gravados ou lidos em um drive. Todos os drives configurados são criptografados, inclusive drives de dados, sobressalentes e drives sem volumes provisionados.

A D@RE incorpora o RSA® Embedded Key Manager para gerenciamento de chaves. Com a D@RE, a chaves são autogerenciadas, e não é necessário replicar chaves entre snapshots de volumes ou sites remotos. O RSA Embedded Key Manager fornece uma DEK (Data Encryption Key, chave de criptografia de dados) individual e exclusiva para cada drive no array, inclusive para os drives sobressalentes.

Ao proteger os dados no armazenamento corporativo, a D@RE garante a redução ou a eliminação da potencial exposição de dados confidenciais em mídias descartadas, extraviadas ou roubadas. Enquanto a chave utilizada para criptografar os dados estiver protegida, os dados criptografados não podem ser

Facilidade de manutenção do VMAX3 ao nível de componente


lidos. Além de proteger contra ameaças relacionadas à remoção física de mídia, a mídia pode ser prontamente realocada mediante a destruição da chave de criptografia utilizada para proteger os dados previamente armazenados em tal mídia.

A D@RE é compatível com todos os recursos do VMAX3, permite a criptografia de qualquer tipo compatível de drive local ou emulação de volume, e oferece criptografia avançada sem degradação no desempenho ou interrupção dos aplicativos ou infraestrutura existentes.

Para mais informações sobre a D@RE, consulte o white paper EMC® VMAX3 Data at Rest Encryption.


Os sistemas VMAX3 empregam um projeto modular com baixo número de peças que melhora a facilidade de manutenção ao permitir que componentes sejam trocados sem interrupções em caso de falhas. Esse baixo número de peças minimiza o número de pontos de falha.

Os sistemas VMAX3 oferecem substituição não disruptiva de seus principais componentes, que podem ser substituídos enquanto o sistema está ligado, inclusive:

• Componentes da engine:

o Director boards

Módulos de I/O

• Fibre Channel (front-end)

• Embedded NAS (eNAS)

• SAS (back-end)

• Flash (compartimento)

• Compactação (compactação SRDF)

Control Stations de módulo/módulos de gerenciamento

Módulo InfiniBand (IB)

As fontes de alimentação

Ventiladores



• Componente da DAE:

o LCC (Link Control Cards, placas de controle de link)

o As fontes de alimentação

o Drives SAS e flash

o Ventiladores

o SSC (System Status Card, cartão de status do sistema)

• MIBE (Matrix Interface Board Enclosures, compartimentos para placa de interface matriz)

o Ventiladores (apenas 400K)

o Fontes de alimentação (apenas 400K)

• Switches Ethernet

• SPS (Standby Power Supply, fonte de alimentação em standby) — baterias de íon de lítio

• PDUs (Power Distribution Units, unidades de distribuição de energia)

O sistema VMAX3 oferece redundância completa ao nível de componente, protegendo contra falha de componentes e garantindo acesso contínuo e ininterrupto às informações. Esse recurso de substituição não disruptiva permite que o CSE (Customer Support Engineer, engenheiro de suporte ao cliente) da EMC instale, inicialize e coloque um novo componente on-line (se for o caso), sem:

• Interromper o acesso a volumes não afetados

• Desligar a unidade VMAX3

• Interromper o sistema operacional

• Tirar caminhos de canais não afetados do ar

• Tirar devices do ar (que não sejam os devices afetados)

Upgrades não disruptivos do HYPERMAX OS É possível realizar updates provisórios do sistema operacional HYPERMAX remotamente por meio do grupo EMC RCM (Remote Change Management). Esses updates fornecem melhorias para algoritmos de desempenho, técnicas de recuperação de erros e geração de relatórios, diagnósticos, além de correções do HYPERMAX OS. Eles também fornecem novos recursos e funcionalidades para o HYPERMAX OS. Durante um carregamento on-line de código do HYPERMAX OS, um membro da equipe EMC RCM descarrega o novo código do HYPERMAX OS para a MMCS. O novo código do HYPERMAX OS é carregado nas áreas EEPROM dos


directors e permanece ocioso até que haja a solicitação de um carregamento dinâmico no armazenamento de controle, conforme descrito no próximo parágrafo.

O sistema VMAX3 não exige nenhuma ação do cliente durante a execução dessa função. Todos os directors permanecem em estado on-line para o processador do host, mantendo o acesso ao aplicativo. O sistema VMAX3 vai carregar o código executável do HYPERMAX OS nos recursos de hardware de cada director até que todos os directors tenham sido carregados. Assim que o código executável do HYPERMAX OS for carregado, o processamento interno será sincronizado e o novo código se tornará operacional.

Luzes azuis intermitentes do rack Cada gabinete do VMAX3 tem uma barra de LED azul na parte frontal e na parte traseira que executam funções valiosas durante as atividades de serviço. Procedimentos como instalação, substituição de componentes e verificação de conectividade de cabos enviarão um sinal para as barras de LED adequadas, iniciando um processo de acionamento intermitente do LED, ajudando a equipe de manutenção da EMC a se dirigir para o gabinete correto. LEDs indicadores adicionais dentro do gabinete, junto com instruções detalhadas fornecidas pelo procedimento de manutenção nas MMCS, servirão de orientação adicional para que a equipe de manutenção encontre os componentes corretos. Esse é um recurso muito valioso nos datacenters dos dias de hoje, especialmente em sistemas com gabinetes dispersos.

O estado da barra de LED no gabinete também pode ser alterado por meio do comando symcfg set –led do Solutions Enabler e por meio do menu de hardware do sistema do Unisphere for VMAX.

Cada barra de luz está conectada às duas zonas de alimentação, garantindo uma alimentação redundante. É possível substituir as barras de luz e seu cabeamento sem disrupções.

Conclusão

O VMAX3 é uma plataforma que aprimora cada aspecto da já incrível linha de produtos VMAX. Ele é um sistema com componentes altamente redundantes de hardware, criando um ambiente extraordinariamente confiável que também foi condensado em uma configuração que minimiza a pegada de carbono no datacenter e aumenta o TCO (Total Cost of Ownership, custo total de propriedade). A introdução do HYPERMAX OS aprimora a experiência do cliente por meio de novas tecnologias, como o provisionamento baseado em nível de serviço, tornando o gerenciamento de armazenamento mais fácil ao mesmo tempo em que aumenta a disponibilidade dos dados por meio da melhoria de

Conclusão


conceitos como compartimentação, sparing de disco e RAID. Os pacotes de replicação local e remota do VMAX3 também permitem que o sistema tenha um alto nível de disponibilidade por meio do TimeFinder SnapVX e do SRDF, respectivamente. O aspecto de facilidade de manutenção do VMAX3 é igualmente notável, transformando a substituição de peças em um processo fácil e rápido.

O VMAX3 inclui aprimoramentos importantes que melhoram a confiabilidade, a disponibilidade e a facilidade de manutenção dos sistemas, tornando o VMAX3 a opção ideal para aplicativos cruciais e ambientes que são executados 24 horas por dia, 7 dias por semana e exigem acesso ininterrupto às informações.

Referências É possível encontrar informações de referência e documentação de produtos em support.EMC.com, entre elas:

EMC®VMAX3 Local Replication Suite

Guia de Produto da Família EMC® VMAX3 com HYPERMAX OS

EMC® VMAX3 — provisionamento de nível de serviço com FAST (Fully Automated Storage Tiering™)

Conclusão


Copyright © 2015 EMC Corporation. Todos os direitos reservados.

A EMC assegura que as informações apresentadas neste documento estão corretas na data da publicação. As informações estão sujeitas a alterações sem prévio aviso.

As informações contidas nesta publicação são fornecidas no estado em que se encontram. A EMC Corporation não garante nenhum tipo de informação contida nesta publicação, assim como se isenta de garantias de comercialização ou adequação de um produto a um propósito específico. O uso, a cópia e a distribuição de qualquer software da EMC descrito nesta publicação exigem uma licença de software.

EMC2, EMC, o logotipo da EMC, FAST, SRDF, TimeFinder, Unisphere, VMAX e VMAX3 são marcas registradas ou comerciais da EMC Corporation nos Estados Unidos e em outros países. Todas as outras marcas comerciais aqui utilizadas pertencem a seus respectivos proprietários.

Para obter a documentação normativa mais atualizada para sua linha de produtos, visite o suporte on-line da EMC.

EMC VMAX3 — confiabilidade, disponibilidade e facilidade ... · de rastreamento proativo de erros...

Documents

Transcript of EMC VMAX3 — confiabilidade, disponibilidade e facilidade ... · de rastreamento proativo de erros...