Post on 06-Jul-2015
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 1/33
Módulo 10 Gerenciamento de Disponibilidade
Todos os direitos de cópia reservados. Não é permitida a distribuição física ou eletrônicadeste material sem a permissão expressa do autor.
www.tiexames.com.br
Módulo 10
Gerenciamento deDisponibilidade
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 2/33
Objetivos do móduloNeste módulo, vamos estudar o Gerenciamento de Disponibilidade, um processo que éfocado em otimizar a habilidade da infra-estrutura de TI, serviços e equipes de suportepara entregar um nível de Disponibilidade que satisfaça o negócio.
Durante este módulo iremos:
Apresentar o propósito do processo
Entender os motivos para implementar este processo
Aprender como estimar a disponibilidade dos serviços
Apresentar as principais ferramentas
Apresentar os principais problemas e benefícios
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 3/33
Missão
Assegurar a entrega dos serviços de TI, com o maiornível de disponibilidade, através do planejamento econstrução de uma infra-estrutura confiável esustentável de acordo com as necessidades donegócio.
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 4/33
Objetivos Projetar os serviços de TI para entregar níveis de disponibilidade exigidas pelo
negócio
Fornecer relatório de disponibilidade para demonstrar a confiança e
sustentabilidade Reduzir excesso de freqüência e duração dos incidentes que impactam a
disponibilidade
Realizar ações corretivas para as paradas não programadas
Elaborar o Plano de Disponibilidade
Otimizar a disponibilidade da infra-estrutura e ajudar a entregar um nível dedisponibilidade a um custo aceitável ao negócio
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 5/33
EscopoO Gerenciamento de Disponibilidade pode ser aplicado a:
Todos os novos serviços de TI
Serviços existentes com ANSs implementados
Fornecedores de TI (internos e externos)
Todos os aspectos da infra-estrutura de TI que possam afetar adisponibilidade
Não é Gerenciamento da Continuidade dos Serviços de TI
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 6/33
Porque uma organização precisa gerenciar a
disponibilidade? Dependência dos serviços de TI para o negócio funcionar
Necessidade de funcionar 24 horas
Serviços online
Foco em atender o negócio e o usuário final
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 7/33
Quanto custa a não disponibilidade?
Tangíveis:
Perda de produtividade do usuário
Perda da produtividade da equipe de TI
Perda de receita em vendas
Atraso nos pagamentos
Perda de produtos e matéria-prima
Implicação em penalidades
Intangíveis:
Insatisfação do cliente
Perda de Clientes
Perda de oportunidade (deixar de vendar ou ganhar novos clientes) Perda de reputação
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 8/33
Causas da indisponibilidade
Downtime não
planejado
Downtime
planejado
Precisamosconsiderar tudo
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 9/33
Disponibilidade é mais do que tecnologia
Para alcançar altos níveis de Disponibilidade dos serviços de TI precisamos:
Alinhamento do negócio com as metas e métricas de TI
Planejar a infra-estrutura de TI
Processos de gerenciamento de serviços de TI
Estratégia de manutenção
Planos de testes e procedimentos
Tecnologias com alta disponibilidade
Tecnologias com alta disponibilidade não serão bem sucedidas se nãotivermos processos de TI, manutenção, práticas de testes.
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 10/33
Conceitos
Princípio 1: a disponibilidade é essencialpara o negócio e para obter a satisfaçãodo usuário.
Princípio 2: reconhecer quando as coisasestão dando errado é ainda possívelalcançar a satisfação do negócio e dosusuários.
Princípio 3: a melhoria da disponibilidadepode apenas ser iniciada quando houver
o entendimento de como os serviços deTI suportam o negócio.
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 11/33
Definições
Disponibilidade (Availability): medido pela Média de Tempo entre Falhas(MTBF – Mean Time Between Failures).
Habilidade de um serviço de TI ou componente realizar sua funçãorequisitada em determinado instante ou durante um período de tempo.
Apoiado pela confiança, sustentabilidade, capacidade de serviço etolerância de falhas na Infra-estrutura de TI.
Confiabilidade (Reliability): medido pela Média de Tempo entre Incidentes do
Sistema (MTBSI – Mean Time Between System Incidents)Habilidade de trabalhar sem falha operacional.
Depende da probabilidade de uma falha de cada componente emanutenção aplicada para prevenir a ocorrência de falhas.
Habilidade de Manutenção (Maintainability): medido pela Média de Tempopara Reparar (MTTR – Mean Time To Repair)
Habilidade para segurar e restaurar um estado operacional.
Depende de antecipação, detecção, diagnóstico, resolução, recuperação
de falhas, restauração dos dados e serviço de TI.
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 12/33
Definições
Habilidade de obter Serviço (Serviceability): não pode ser medido pormétrica
Habilidade de manter a disponibilidade, confiança e manutençãofornecida pelos acordos com os provedores de serviços de TI.
Redundância (Resilience): ou Tolerância a Falhas
Habilidade de um serviço de TI permanecer operacional devido a máfunção de um ou mais sub-componentes.
Segurança: definida em termos de Confiabilidade, Integridade eDisponibilidade dos dados associados ao serviço.
Função de Negócio Vital: são funções de negócio consideradas como sendocríticas para a organização, identificadas através de um processo formal como
a Avaliação de Risco.
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 13/33
Infra-estrutura e organizações de suporte de TI
Usuário Usuário Usuário Usuário
Serviços de TI
Sistemas de TI Sistemas de TI
Desenvolv. deSoftware
Manutençãode Software
Outros Tipos deManutenção
Hardware Fornecedoresde Software
Telefonia
Fornecedores Internos e Mantenedores
Provedorde Serviço
de TI
Usuários
Disponibilidade (SLA)
Confiabilidade + Capacid.de Gerenciamento (OLA)
Habilidadede Obter
Serviço(contratos)
Fornecedores Externos
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 14/33
Entradas, Saídas e Atividades
- Planejar- Aperfeiçoar- Medir e reportar
Requisitos deNegócio relacionadosc/ a disponibilidade
Requisitos dedisponibilidade,
confiabilidade esustent.
Níveis de Serviçoacordados
Critérios para projetode disponib. E de
recuperação
Redundância eavaliação da infra-
estrutura de TI
Objetivos acordados p/
disponib. Confiab.,sustentab.
Relatórios sobreconfiab., disponib.,sustentab. obtidas
Monitoramento dadisponibilidade
Plano de melhoria dadisponibilidade
Avaliação do impactono negócio
Dados de Problemase incidentes
Dados deconfiguração emonitoramento
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 15/33
Atividades
Gerenciamentode
Disponibilidade
Planejamento
Aperfeiçoamento
Medição &Relatório
Determinar os requisitos de disponibilidade
Projetar a disponibilidade
Projetar a recuperação
Questões sobre segurança
Gerenciamento da Manutenção
Desenvolvimento de um plano de disponibilidade
Medição e emissão de relatórios
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 16/33
Conteúdo do Plano de Disponibilidade
Disponibilidade atual x acordada
Deficiências na disponibilidade
Mudança de requerimentos de disponibilidade
Para serviços existentes Para novos serviços
Programação de tarefas planejadas da AIS
Recomendações futura de tecnologia
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 17/33
Quando um serviço não está disponível?
Um serviço não está disponível para o cliente se as funções requisitadas nãopodem ser utilizadas, embora as condições acordadas pela provisão do serviçosão cumpridas.
Calculo simples de disponibilidade %:
Ser um serviço foi acordado que ele deve ter 98% de disponibilidade durante os dias úteisdas 07:00 às 19:00hs, e o serviço ficou fora por 2 horas durante este período, qual foi opercentual de disponibilidade?
Resolução: 12h x 5 dias – 2 h / 60 h = 96,66%
Tempo acordado - Downtime 100
X Tempo acordado
1
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 18/33
Cálculos da Disponibilidade
Serial Paralelo
Disk A Disk B
Disk A
Disk BDisponibilidade = 90% Disponibilidade = 90%
Disponibilidade apenas se ambos
estiverem em operação
A x B = 0.9 * 0.9 = 0.81 ou 81%
Disponibilidade = 90%
Cálculo
1 – (A não disponível) x (B não disponível)
1 – 0.1 * 0.1 = 0.99 ou 99%
Disponibilidade = 90%
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 19/33
Calculando a disponibilidade ponta-a-ponta
Exemplos de disponibilidade serial e paralela
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 20/33
Tecnologia disponível
Redundância de servidores
Servidores com discos RAID
Servidores com alta disponibilidade
Espelhamento de discos Servidores em Cluster
Balanceamento de Carga
Geradores de energia
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 21/33
Métodos e Técnicas
Métodos e técnicas recomendadas pela ITIL no apoio do Gerenciamento deDisponibilidade:
Análise de Impacto em Falhas de Componentes (AIFC)
Análise de Tolerância a Falhas (ATF) Análise de Interrupção de Serviço (AIS)
Posto de Observação Técnico (POT)
Ciclo de Vida Expandido do Incidente
Análise de Riscos (CRAMM) – Ver módulo de Continuidade
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 22/33
Análise de Impacto em Falhas de Componentes (AIFC)Component Failure Impact Analysis (CFIA)
Está técnica pode ser usada para predizer e avaliar o impacto sobre os Serviçosde TI que surgem a partir de falhas de componentes dentro da infra-estrutura deTI.
XService Desk
XXPCP
XXSegurança
XImpressão
XIntranet
XFolha de Pagamento
XXE-mail
DCBASistema / Componentes Servidores
4
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 23/33
Análise de Tolerância a Falhas (ATF)Fault Tree Analysis (FTA)
É uma técnica que pode ser usada para determinar a cadeia de eventos que causa umainterrupção nos Serviços de TI.
1. Isto ocorre
3. Isto ocorre2. Isto ocorre
4. Provocando isto
Estas duas coisas (4 e C)
Combinam-se paraProvocar isto
Provocandoesta falha
E. Isto acontece
C. Provocando isto
B. Em seguida,Isto ocorreA. Isto ocorre
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 24/33
Análise de Interrupção de Serviços (AIS)Systems Outage Analysis (SOA)
Identifica a causa raiz da interrupção
Conduz análise de dados
Faz recomendações para melhoria da Disponibilidade
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 25/33
Ciclo de vida expandido do incidente
MTTR - Mean Time to Repair DOWNTIME Maintainability (Serviceability)MTBF - Mean Time Between Failure UPTIME Reliability, Availability
MTBSI - Mean Time Between System Incident
Média de Confiabilidade
Reliability
Incidente
Reparo
Diagnóstico Recuperação
Restauração
Incidente
Tempo
Detecção
MTTR
MTBF
MTBSI
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 26/33
Posto de Observação Técnico (POT)Technical Observation Post (TOP)
Equipe formada por especialistas quefocam nos aspectos específicos dadisponibilidade
Monitoramento de eventos paraidentificar problemas e oportunidadesde melhoria dentro da infra-estrutura deTI.
Fornece uma visão completa da
entrega de serviços proveniente dasperspectivas operacionais, de suporte ede desenvolvimento.
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 27/33
Funções
Gerente de Disponibilidade
O Gerente de Disponibilidade tem uma função orientativa e tem uma visãogeral sobre a infra-estrutura de TI. Irá se reunir e analisar dados a partir dos
processos como Gerenciamento de Problema, Gerenciamento de Mudança,Service Desk e Gerenciamento de Capacidade para assistir no gerenciamentoe planejamento relacionado à disponibilidade.
Usando os resultados destes dados ele pode dirigir os processos deGerenciamento de Serviços para assegurar a disponibilidade acordada, desta
forma, ajudando a prevenir problemas. Por exemplo, ele pode estar presentenas reuniões do Comitê de Controle de Mudanças dentro do Gerenciamentode Mudança.
O Gerente de Disponibilidade comunica suas descobertas para o Gerente de
Nível de Serviço e, desta forma, faz uma contribuição importante para oestabelecimento dos SLA’s. Ele implementa políticas do Gerenciamento deSegurança em relação à segurança dos dados.
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 28/33
Relacionamentos
Gerenciamento deDisponibilidade
Gerenciamentode
Nível de Serviço
Gerenciamentode
Mudança
GerenciamentoFinanceiro de TI
Gerenciamentode
Capacidade
GerenciamentoContinuidadedos Serviços
Sugere níveis de
disponibilidade
SLAS à serem
monitoradas
Programação deMudanças
Informações deImpacto dos
componentes
Avisos Orçamento
Análise de
Impacto
Planos derecuperação
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 29/33
Problemas Comuns
Como todo processo, existe algumas questõesque precisam ser levadas em consideração paraque o processo tenha sucesso.
Para o gerenciamento de Disponibilidade, estasquestões são:
Requisitos do negócio em relação àdisponibilidade esperada do serviço de TI devemser claros.
Contratos de apoio devem ser desenhados paraespecificar a disponibilidade acordada de cadaserviço.
Comprometimento com o processo.
O negócio e a organização de TI precisamcompartilhar um entendimento comum sobre adisponibilidade e definição do que é downtime.
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 30/33
Principais Benefícios
Constante empenho para aperfeiçoar adisponibilidade, teremos um ponto único deresponsabilidade por disponibilidade na organização
Serviços são projetados para atender os requisitosde disponibilidade
Os níveis de disponibilidade do serviço serãofornecidos a um custo justificável
Em caso de indisponibilidade no serviço, uma açãocorretiva será tomada
Redução de perdas no negócio devido a paradasprolongadas nos sistemas mais críticos da TI
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 31/33
IPDs – Indicadores Principais de Desempenho
Índice de variação do tempode restabelecimento dosserviços
Índice de variação do tempomédio entre falhas
Duração da indisponibilidade
Impacto da falha
Índice de serviços que estãodentro das metas de SLA
Índice de investimentos emdisponibilidade
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 32/33
Retorno sobre o Investimento - ROI
Com a implantação deste processo podemos evitar queum Erro físico em um disco de um Servidor de aplicaçãoafete 100 usuários.
Exemplo do Benefício:Suponha que se o Erro acima descrito afete 100usuários por 3 horas, isso causará uma perda de R$15.000,00 (100 usuários x 3 horas x R$ 50,00)
5/8/2018 10 Disponibilidade - slidepdf.com
http://slidepdf.com/reader/full/10-disponibilidade 33/33