Post on 30-Jul-2018
Confiabilidade
Predição e Modelagem Alessandro L. Koerich
Introdução
• Desejo: Uma predição precisa da confiabilidade de um novo produto!
• Por quê? – permite previsão do custo de suporte, requisitos de peça de reposição, custo de garanGa, markeGng, etc.
• Porém... dificilmente é possível fazer uma predição da confiabilidade com precisão.
Introdução
• A abordagem mais comum para predizer a confiabilidade é esGmar a contribuição de cada componente, e trabalhar progressivamente a nível global ou de sistema.
• O método de levantamento de componentes é amplamente uGlizado, mas é fortemente dependente da disponibilidade de dados confiáveis.
Introdução • Existem diversas bases de dados que fornecem
informações sobre taxas de falhas a nível de componentes.
• Entretanto, isso não é o suficiente, pois, a confiabilidade de um sistema é afetada por: – conhecimento e moGvação dos engenheiros de projeto e de teste
– a quanGdade e a qualidade dos testes – ações sobre as falhas descobertas durante os testes – qualidade da produção
• Normalmente estes fatores são mais significaGvos do que dados passados.
Limitações na Predição da Confiabilidade
• Usamos modelos matemáGcos para predição.
• Exemplo: O consumo de um novo sistema eletrônico pode ser predito usando a lei de Ohm e o modelo p=vi.
• Contudo, a maioria das lei Tsicas pode ser considerada determinísGca para aspectos práGcos, mas os mecanismos são estocásGcos.
Predição de Confiabilidade Baseada em Padrões
• É uma metodologia baseada em esGmaGvas de taxas de falhas disponíveis em padrões comerciais e militares reconhecidos.
• Um padrão Wpico trata disposiGvos como um serial, ou seja, a falha de um componente implica na falha do sistema completo.
• Outra suposição chave é que as taxas de falha são constantes e modeladas por uma distribuição exponencial.
Predição de Confiabilidade Baseada em Padrões
• A abordagem mais comum é estabelecer taxas de falha, expressas como falhas por unidade de tempo, geralmente milhões (ou bilhões) de horas.
• Uma falha por bilhão de horas (109 horas) é normalmente descrita como uma FIT.
• Entretanto, esta medida não é universalmente aceita.
• Os padrões usados normalmente são MIL-‐HDBK-‐217, Bellcore/Telcordia SR-‐332, NSWC-‐06/LE10, China 299B, RDF 2000 dentre outros.
Predição de Confiabilidade Baseada em Padrões
• Os métodos de análise Wpicos uGlizados pelos padrões inclui os métodos: – Contagem de componentes – Análise do stress dos componentes
• O primeiro método necessita de menos informação, geralmente a quanGdade de componentes, níveis de qualidade e ambiente de aplicação. É mais aplicado nos estágios iniciais de um projeto.
US MIL-‐HDBK-‐217 (1995) • É a fonte mais conhecida de dados de falhas para
componentes eletrônicos.
• É baseada em taxas de falhas genéricas para componentes eletrônicos coletadas ao longo dos anos pelos militares dos EUA.
• UGliza dois métodos para a predição de confiabilidade: – Contagem de componentes – Análise do stress de componentes
• Ver PDF US MIL-‐HDBK-‐217F
US MIL-‐HDBK-‐217 (1995) – Contagem de componentes:
• Assume níveis médios de stress de modo a fornecer uma esGmaGva prévia da taxa de falhas.
• A taxa de falhas do equipamento pode ser calculada como:
onde: n = número de categorias de componentes Ni = quanGdade do i-‐ésimo componente πQi = fator de qualidade do i-‐ésimo componente λbi = taxa de falhas do i-‐ésimo componente
λ = NiπQiλbii=1
n
∑
US MIL-‐HDBK-‐217 (1995) – Stress de componentes:
• Requer um maior grau de informação detalhada. • É aplicado nas fases finais do projeto. • Leva em conta mais informação e as equações de taxas de falha para cada
componente contém mais fatores , refleGndo ambiente, stress elétrico, fator de temperatura, ambiente de aplicação etc.
• A taxa de falhas para micro circuitos pode ser calculada como:
onde: • πQ, πE , πT , e πL são os fatores de qualidade, ambiental, temperatura e de
aprendizagem respecGvamente. • C1 é um fator de complexidade baseado no número de portas ou número de
transistores ou bits para memórias. • C2 é um fator de complexidade baseado em aspectos do empacotamento
(numero de pinos, Gpo de empacotamento, etc.)
λp = πQπ L C1πT +C2π E[ ]
US MIL-‐HDBK-‐217 (1995) • As críGcas à MIL-‐HDBK-‐217, que são comuns a outros
métodos baseados em padrões para eletrônica, incluem as seguintes: – A experiência mostra que somente uma proporção das falhas dos sistemas eletrônicos modernos são devidos a falhas nos componentes.
– A dependência da temperatura da taxa de falhas não é sempre suportado por experiências modernas ou por considerações da Tsica das falhas.
– Diversos outros parâmetros usados nos modelos possuem validade duvidável.
– Os modelos não levam em conta muitos fatores que afetam a confiabilidade, como sobre stress devido a transientes, ciclos de temperatura, variação, EMI/EMC, controle de montagem, teste e manutenção.
Telcordia SR-‐332 (Bellcore) • Padrão produzido e publicado por organizações não militares.
• UGlizada largamente na Europa
• Atualização do modelo Bellcore produzido pela AT&T Bell Labs que se baseia na MIL-‐HDBK-‐217, modificado para indústria das telecomunicações.
• Não tem acesso livre!
Telcordia SR-‐332 (Bellcore) • UGliza três métodos diferentes:
– Método I: permite a obtenção de taxas de falha genéricas que são propostas pelos dados de predição padrão Bellcore/Telcordia.
– Método II: permite que o usuário combine dados de teste em laboratório com as taxas de falha genéricas.
– Método III: permite que o usuário combine dados de campo com as taxas de falha genéricas.
• Adicionalmente, estressa a vida inicial e usa o burn-‐in para idenGficar problemas de mortalidade infanGl.
• Possui outras ferramentas...
IEC 62380 (RDF 2000) • É um “melhoramento” da MIL-‐HDBK-‐217 onde o modelo de taxa de falhas mulGplicaGvo foi subsGtuído por combinações adiGvas e mulGplicaGvas dos fatores π e das taxas de falhas.
• Permite a especificação de um perfil de temperatura de operação com diferentes fases.
• Ver PDF IEC-‐TR-‐62380E
PRISM e 217PLUS • Tenta superar as limitações da MIL-‐HDBK-‐217 – Produz resultados pessimistas em razão do efeito combinado da mulGplicação dos fatores π.
• IdenGficou que mais de 78% das falhas de um sistema
não tem como causa os componentes, mas: – deficiências no projeto – defeitos de fabricação – técnicas de gerenciamento do sistema pobres, como:
• requisitos inadequados • excesso de uso • soxware • falhas induzidas
PRISM e 217PLUS • O modelo PRISMA foi desenvolvido para esGmar a taxa de
falhas de sistemas eletrônicos.
• Foi baseado em uma grande quanGdade de dados de campo e de teste de aplicações comerciais e militares.
• Ao invés do modelo de taxa de falhas mulGplicaGvo uGliza combinações adiGvas e mulGplicaGvas dos fatores π e taxas de falhas λ para cada classe de mecanismo de falha.
• Similar ao método da IEC 62380
PRISM e 217PLUS • Incorpora novos modelos de predição de confiabilidade de
componentes.
• Incorpora uma processo para levantar a confiabilidade de sistemas devido a variáveis não associadas aos componentes
• Inclui um modelo de confiabilidade de soxware.
• O modelo PRISMA permite também que o usuário ajuste a predição com base em todos os dados disponíveis, incluindo dados de campo de uma sistema predecessor similar, e dados de teste a nível de componente.
PRISM e 217PLUS • O modelo de taxa de falhas predito do PRISMA assume a
forma:
onde: n = número de categorias de componentes. Ni = quanGdade do i-‐ésimo componente. m = número dos mecanismos de falha apropriados para a i-‐ésima categoria de componente. πij = fator de qualidade do i-‐ésimo componente e j-‐ésimo mecanismo de falha. λij = taxa de falhas do i-‐ésima categoria de componente e j-‐ésimo mecanismo de falha.
λ = Nii=1
n
∑ π ijλijj=1
m
∑
China 299B (GJB/z 299B) • Este padrão é uma programa de predição da confiabilidade similar
a MIL-‐HDBK-‐217 desenvolvida pelos militares chineses.
• Inclui tanto os métodos de contagem de componentes quanto de análise de stress.
• UGliza uma série de modelos para diversas categorias de componentes eletrônicos, elétricos, e eletromecânicos para predizer as taxas de falhas que são afetadas por condições ambientais, níveis de qualidade, condições de stress e diversos outros parâmetros.
• Fornece uma metodologia para o cálculo da taxa de falhas de componentes e de sistemas.
IEEE Standard 1413 • É um padrão que foi criado para estabelecer um arcabouço
no qual a predição da confiabilidade deve ser realizada para sistemas eletrônicos.
• Os resultados obGdos são acompanhados por respostas a um conjunto de questões idenGficadas no padrão.
• Ela idenGfica elementos necessários para uma predição de confiabilidade compreensível e crível com informação para uGlização efeGva dos resultados da predição.
• Não fornece instruções de como realizar a predição de confiabilidade!
IEEE Standard 1413 • Em parGcular, fornece documentação sobre:
– Predição de resultados – Uso pretendido dos resultados – Método usado – Entradas necessárias para o método selecionado – A abrangência na qual cada entrada é conhecida – A fonte dos dados de entrada conhecidos – Suposições sobre dados de entrada desconhecidos – Figuras de mérito – Confiança na predição – Fontes de incerteza – Limitações – RepeGbilidade
Ferramentas de Soxware • Existem pacotes de soxware comerciais que permitem
realizar predição de confiabilidade com base em uma lista de materiais, ambientes operacionais, aplicações, dados de stress de componentes e outra informações. – Lambda Predict da Reliasox – CARE da BQR – ITEM Toolkit – Reliability Workbench da Isograph – RAM COMMANDER da Reliass
• A maioria deles permite a inserção de dados de taxas de falhas definidas pelos usuários em adição aos dados das normas padrão vistas anteriormente.
Outros Métodos para Predição de Confiabilidade
• Métodos baseados em dados de campo
• Fusão de dados de campo e padrões de predição de confiabilidade
• Métodos baseados na Tsica das falhas
• Método TOP-‐DOWN
Método Top-‐Down de Predição de Confiabilidade
• Como predizer a confiabilidade de um novo sistema?
• É possível fazer um predição com credibilidade razoável sem uGlizar os métodos anteriores em certas circunstâncias: – O sistema é similar a sistemas desenvolvidos e construídos previamente
– O novo sistema não envolve risco tecnológico significaGvo – O sistema será produzido em grandes quanGdades, ou é complexo, ou será uGlizado por longo tempo, ou uma combinação destes fatores.
– Existe um forte compromisso para aGngir a confiabilidade predita.
Método Top-‐Down de Predição de Confiabilidade
• A predição pode ser feita sem recorrer a modelos matemáGcos empíricos ou estaWsGcos a nível de componentes individuais.
• Pode se basear no conhecimento do desempenho passado a nível de sistema, nos possíveis efeitos de mudanças e no gerenciamento de metas e prioridades.
Modelos de Confiabilidade de Sistemas
• Modelo Básico Série
• Redundância AGva
• Redundância m de n
• Redundância de Espera
Modelos de Confiabilidade de Sistemas
• Modelo Básico Série – Sistema composto de dois componentes independentes, cada um com uma taxa de falha constante (λ1 e λ2).
Modelos de Confiabilidade de Sistemas
• Modelo Básico Série – Sistema composto de dois componentes independentes, cada um com uma taxa de falha constante (λ1 e λ2).
– A taxa de falhas do sistema será λ1+λ2
– Como as taxas de falha são constantes, as confiabilidades dos componentes (R1 e R2) ao longo do tempo de operação t, são:
. R1 = e
−λ1t R2 = e−λ2t
Modelos de Confiabilidade de Sistemas
• Modelo Básico Série – A confiabilidade do sistema é a probabilidade combinada de não falhar de cada componente, ou seja:
– Em geral, para uma série de n componentes independentes:
onde Ri é a confiabilidade do i-‐ésimo componente.
R1R2 = e−λ1te−λ2t = e−(λ1+λ2 )t
R = Rii=1
n
∏
Modelos de Confiabilidade de Sistemas
• Modelo Básico Série – Este é o modelo básico mais simples no qual a predição de confiabilidade baseada na contagem das partes é baseada.
• O modelo lógico de falhas de um sistema completo será mais complexo se exisGrem componente ou subsistemas redundantes.
• Além disso, se as falhas puderem ser causadas por outros eventos, como por interfaces, o modelo deve incluí-‐los, como, por exemplo, blocos adicionais.
Modelos de Confiabilidade de Sistemas
• Redundância AGva – O diagrama de blocos da confiabilidade para o sistema redundante mais simples.
– Neste sistema composto de dois componentes independentes com confiabilidades R1 e R2, uma operação saGsfatória ocorre se um ou ambos os componentes funcionarem.
.
Modelos de Confiabilidade de Sistemas
• Redundância AGva – Portanto, a confiabilidade R do sistema é igual a probabilidade do componente 1 ou do componente 2 sobreviver.
– Para o caso de taxas de falha constantes: R = e−λ1t + e−λ2t − e−(λ1+λ2 )t
R1 + R2( ) = R1 + R2 − R1R2
Modelos de Confiabilidade de Sistemas
• Redundância AGva – A expressão geral para a redundância paralela aGva é:
onde Ri é a confiabilidade da i-‐ésima unidade e n é o número de unidades em paralelo.
R =1− 1− Ri( )i=1
n
∏
Modelos de Confiabilidade de Sistemas
• Redundância m de n – Em algumas configurações redundantes paralelas aGvas, é necessário que m de n unidades operem para que o sistema funcione.
– Isso é chamado de redundância paralela m de n (ou m/n)
– A confiabilidade de um sistema m/n com n componentes independentes onde todas as confiabilidades dos componentes são iguais, é:
.
RSYS =1−ni
"
#$
%
&'Ri 1− R( )n−i
i=0
m−1
∑
Modelos de Confiabilidade de Sistemas
• Redundância m de n – Para um taxa de falhas constante, temos:
.
RSYS =1−1
λt +1( )nni
"
#$
%
&' λt( )n−i
i=0
m−1
∑
Modelos de Confiabilidade de Sistemas
• Redundância de Espera – Uma unidade não opera conGnuamente, mas é acionada somente quando a unidade primária falha.
Modelos de Confiabilidade de Sistemas
• Redundância de Espera – Levando em conta o caso de um sistema sem manutenção, que as unidades tem um taxa de falhas λ constante, que não existem falhas latentes e que Rs=1, então.
– A fórmula geral para a confiabilidade para n unidades iguais em uma configuração redundante de espera (com chaveamento perfeito) é:
.
RSYS = e−λt +λte−λt
RSYS =λt( )i
i!e−λt
i=0
n−1
∑
Disponibilidade de Sistemas Reparáveis
• Existe uma diferença fundamental no tratamento matemáGco de sistemas reparáveis e não-‐reparáveis.
• As distribuições estaWsGcas não podem ser aplicadas a sistemas reparáveis, pois, as unidades com falhas não são removidas da população.
• Se um sistema puder ser reparado para a condição “tão bom quanto novo”, então o modelo apropriado para descrever a ocorrência de falhas é chamado de Processo de Renovação Ordinário.
Disponibilidade de Sistemas Reparáveis
• Se um sistema reparado retém as mesmas caracterísGcas de envelhecimento de antes, ele é chamado de “mesmo que o anGgo” e é modelado por um processo de Poisson não homogêneo.
• Se a condição após a reparação é melhor que o anGgo, mas pior que um novo, os sistema é modelado por um Processo de Renovação Generalizado.
• Portanto, para um sistema reparável, a definição clássica de confiabilidade se aplica somente até o momento da primeira falha.
Disponibilidade de Sistemas Reparáveis
• Ao invés disso, o equivalente à confiabilidade em um sistema reparável é chamado de disponibilidade
• Disponibilidade é definida como a probabilidade de que um item estará disponível quando necessário, ou como a proporção do tempo total que o item está disponível para uso.
• Portanto, a disponibilidade de um item reparável é uma função de sua taxa de falha λ e de sua taxa de reparação ou subsGtuição μ.
Disponibilidade de Sistemas Reparáveis
• Sistema reparável X sistema não-‐reparável
Figure 6.4 (a) Non-‐repairable system and (b) Repairable system.
Disponibilidade de Sistemas Reparáveis
• A proporção total de tempo que um item está disponível (funcional) é a disponibilidade em regime permanente.
• Para uma unidade simples com taxa de falha λ e uma taxa de reparação μ constantes, onde:
µ =1
MTTR
Disponibilidade de Sistemas Reparáveis
• A disponibilidade em regime permanente é:
• A disponibilidade instantânea ou probabilidade com que o item estará disponível no tempo t é igual a:
• A equação anterior aproxima a disponibilidade em regime permanente a medida em que t torna-‐se grande.
A = MTBFMTBF +MTTR
=µ
λ +µ
A = µλ +µ
+λ
λ +µe−(λ+µ )t
Disponibilidade de Sistemas Reparáveis
• Geralmente é mais interessante considerar a indisponibilidade quando comparamos opções de projeto:
e
• Disponibilidade é importante em sistemas complexos. Exemplo: telecom, potência, industrias químicas, sistemas de radar.
Indisponibilidade em Regime Permanente =1− A = λλ +µ
Indisponibilidade Instantânea = λλ +µ
−λ
λ +µe−(λ+µ )t
Disponibilidade de Sistemas Reparáveis
• Alta confiabilidade não é o suficiente para assegurar que um sistema estará disponível quando necessário.
• É necessário também garanGr que ele pode ser reparado rapidamente e que manutenções agendadas possam ser realizadas rapidamente sem uma parada do sistema.
• Portanto, mantenabilidade é um importante aspecto no projeto para máxima disponibilidade e compromissos são normalmente necessários entre as caracterísGcas de confiabilidade e mantenabilidade.
• Disponibilidade também é afetada pela redundância.
Disponibilidade de Sistemas Reparáveis
Projeto Modular
• Disponibilidade e mantenabilidade podem ser influenciadas pela maneira como o projeto é parGcionado.
• O projeto modular é normalmente usado para facilitar a reparação de uma falha através da subsGtuição do módulo com defeito ao invés da subsGtuição da unidade completa.
Projeto Modular
• Exemplo:
Análise de Diagrama de Blocos • A lógica de falhas de um sistema pode ser mostrada como um diagrama de blocos de confiabilidade, que mostra as conexões lógicas entre componentes de um sistema.
• A análise de diagrama de blocos consiste em reduzir um diagrama de blocos de confiabilidade em um sistema simples que pode então ser analisado usando as fórmulas para arranjos em série e paralelo.
• É necessário assumir a independência das confiabilidade dos blocos.
Análise de Diagrama de Blocos
Análise de Diagrama de Blocos • A lógica de falhas de um sistema pode ser mostrada como um diagrama de blocos de confiabilidade, que mostra as conexões lógicas entre componentes de um sistema.
• A análise de diagrama de blocos consiste em reduzir um diagrama de blocos de confiabilidade em um sistema simples que pode então ser analisado usando as fórmulas para arranjos em série e paralelo.
• É necessário assumir a independência das confiabilidade dos blocos.
Análise de Diagrama de Blocos
• Conjuntos de Corte e Costura – Um conjunto de corte é produzido traçando uma linha através dos blocos em um sistema para mostrar o número mínimo de blocos com falha que levaram a uma falha do sistema.
– Conjuntos de costura são produzidos traçando linhas através de blocos, que se todos esGverem funcionando, permiGram o sistema funcionar.
Análise de Diagrama de Blocos • Conjuntos de Corte e Costura – Limites aproximados na confiabilidade do sistema pode ser derivado dos conjuntos de corte e costura respecGvamente e são dados por:
onde N é o número de conjuntos de corte, T é o número de conjuntos de costura e nj é o número de blocos no j-‐ésimo conjunto de corte ou conjunto de costura.
RS >1− 1− Ri( )i
n j
∏j
N
∑
RS < Rii
nj
∏j
T
∑
Análise de Diagrama de Blocos
• Exemplo: Conjuntos de Corte e Costura
Figure 6.6 (a) Cut sets and (b) Ge sets.
Análise de Diagrama de Blocos • Falhas de Modo Comum
– É aquela que pode levar a falha todos os caminhos de uma configuração redundante.
– No projeto de sistemas redundantes é importante idenGficar e eliminar fontes de falha de modo comum, ou reduzir a probabilidade de ocorrência a níveis inferiores do que outros modos de falha.
– Exemplo:
.
Análise de Diagrama de Blocos
• Falhas de Modo Comum – Exemplos de fontes de falhas de modo comum:
1. Sistemas de chaveamento para aGvar unidades standby redundantes
2. Sistemas de sensores para detectar falhas de um caminho 3. Suprimentos de força ou combusWvel comuns a diferentes
caminhos 4. Sistemas indicadores para alertar sobre a falha de um caminho 5. Ações de manutenção que são comuns a diferentes caminhos 6. Ações operacionais comuns a diferentes caminhos 7. Soxware comum a todos os caminhos, ou problemas de
temporização de soxware entre processadores paralelos 8. Falhas devido ao “próximo item mais fraco”
Análise de Diagrama de Blocos
• Evento Desencadeador – Um evento desencadeador é aquele, que mesmo não sendo uma falha ou uma causa direta de falha, irá causar um evento de falha de alto nível.
– Exemplos de eventos desencadeadores: 1. Sistemas de alerta desabilitados para manutenção ou por
gerar falsos alertas 2. Controles ajustados incorretamente 3. Procedimentos de operação ou manutenção seguidos de
maneira incorreta ou não observados 4. Elementos de espera fora de ação devido a manutenção
Analise da Árvore de Falhas (FTA) • É uma técnica de análise de projetos de confiabilidade/segurança
que inicia considerando os efeitos da falha do sistema, indicados como “top events”.
• A análise busca determinar como estes eventos podem ser causados por eventos individuais ou combinados de falhas ou eventos de baixo nível.
• Símbolos padrão são uGlizados na construção de uma FTA para descrever eventos e conexões lógicas.
• Além de mostrar as conexões lógicas entre eventos de falha em relação aos eventos superiores, FTA pode ser uGlizada para quanGficar as probabilidades dos eventos superiores da mesma maneira que a análise de diagrama de blocos.
Analise da Árvore de Falhas (FTA)
Analise da Árvore de Falhas (FTA)
Figure 6.9 Reliability block diagram of engine.
Analise da Árvore de Falhas (FTA)
Figure 6.10 FTA for engine (incomplete).