DETERMINAÇÃO DO TEMPO MÉDIO ATÉ A FALHA PARA UM SISTEMA … · 2016-08-11 · É importante...

DETERMINAÇÃO DO TEMPO MÉDIO ATÉ A

FALHA PARA UM SISTEMA EM COLD STANDBY

COM MANUTENÇÃO CORRETIVA BASEADO NA

TEORIA DE SEMI-MARKOV

Angelica Alebrant Mendes (UFRGS)

[email protected]

Jose Luis Duarte Ribeiro (UFRGS)

[email protected]

Este artigo desenvolve um método para estabelecer o tempo médio até a falha

para um sistema formado por dois componentes idênticos em cold standby com

manutenção corretiva. Processos de semi-Markov e regenerativo são usados

para definir os estados do sistema e a probabilidade de transição entre os

estados. Na sequência, transformadas de Laplace são aplicadas para determinar

a função da distribuição cumulativa do tempo até a primeira falha do sistema.

Finalmente, o tempo médio até a falha do sistema, como uma função da taxa de

falha e de reparo dos componentes, é obtido através da fórmula de ganho de

Mason. Um exemplo numérico é apresentado e resultados para diferentes

parâmetros são comparados. A análise revela o efeito da taxa de falha e reparo

dos componentes no tempo médio até a falha do sistema. Ainda que

amplamente utilizados na indústria, modelos para a otimização da manutenção

de sistemas reparáveis em cold standby ainda são pouco explorados na literatura

brasileira. A determinação do tempo médio até a falha do sistema constitui-se no

primeiro passo para a otimização da manutenção desses sistemas.

Palavras-chave: confiabilidade, manutenção, cold standby, processos de semi-

Markov

XXXV ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO

Perspectivas Globais para a Engenharia de Produção

Fortaleza, CE, Brasil, 13 a 16 de outubro de 2015.




2

1. Introdução

Um sistema em cold standby é um sistema com dois ou mais componentes, onde m de n

componentes estão em operação e os outros n - m componentes podem iniciar a operação assim

que um ou mais componentes em operação falharem. Sistemas em cold standby têm sido

amplamente utilizados em locais onde a segurança operacional é muito importante, como, por

exemplo, em controles de aeronaves, plantas nucleares e grandes redes de telecomunicações.

Estas estruturas são usadas para aumentar a confiabilidade do sistema, visto que, quando o

componente em operação falha, o componente em posição de standby inicia a operação

imediatamente, evitando a falha do sistema. Falhas em sistemas em cold standby normalmente

possuem impactos significativos em termos de custos de produção, segurança humana e

segurança ambiental.

Em muitos sistemas em cold standby, os componentes podem ser reparados após a falha por

custos menores que aqueles incorridos com a sua substituição. A determinação da confiabilidade

e do tempo médio até a falha nesses sistemas se torna mais complexa do que em sistemas não

reparáveis, visto que componentes em falha são reparados e repostos no sistema muitas vezes

antes da falha completa do sistema.

Um processo regenerativo é um processo estocástico que possui pontos no tempo onde o

processo se reinicia probabilisticamente. Ou seja, existe um tempo T1 onde a continuação do

processo além de T1 é probabilisticamente igual ao do processo iniciando em t = 0 (ROSS, 2007).

Um sistema em cold standby em que o componente que falha é reparado, pode ser considerado

como um processo regenerativo.

Supondo-se que um processo pode estar em qualquer um dos N estados 1, 2,...., N, e que cada vez

que ele entre no estado i ele permanece neste estado por uma quantidade de tempo aleatório e

então faz uma transição para o estado j com probabilidade Pij. Este tipo de processo é chamado

processo de semi-Markov. Se a quantidade de tempo gasta em cada estado antes da transição for




3

igual a 1, tem-se uma Cadeia de Markov (ROSS, 2007).

Muitas publicações internacionais já há algum tempo utilizam estes métodos para modelar e

otimizar diferentes sistemas redundantes. Exemplos são os trabalhos desenvolvidos por Osaki

(1972) e por Zhong e Jin (2014). Osaki (1972) desenvolveu um modelo para determinar a política

de manutenção mais apropriada para um sistema em cold standby com reparo. Neste sistema,

manutenções preventivas são aplicadas no componente em operação para manter o nível de

confiabilidade do sistema. Quando este componente falha, o componente em standby se torna

ativo e o componente em falha é enviado para reparo imediatamente. O autor usou processos de

renovação de Markov e transformada de Laplace-Stieltjes para determinar o tempo até a primeira

falha do sistema como uma função do tempo entre manutenções preventivas. Por sua vez, Zhong

e Jin (2014) desenvolveram um modelo similar para um sistema equivalente, com exceção de que

os tempos até a falha dos componentes seguem uma distribuição de Weibull. Os autores

utilizaram processos de semi-Markov e processos regenerativos para determinar as

probabilidades de transição e transformadas de Laplace para resolver as equações de renovação

de Markov. O ciclo ótimo de manutenção preventiva é definido maximizando-se o tempo médio

entre o início do sistema no estado inicial até sua falha.

É importante salientar que Processos de Markov é o método mais utilizado para modelar sistemas

reparáveis com diferentes políticas de manutenção, fato que se justifica pelo fato deste método

possuir a capacidade de caracterizar estes sistemas e facilitar o seu modelamento (ZHONG; JIN,

2014).

Desta forma, este artigo tem por objetivo determinar o tempo médio até a falha de um sistema em

cold standby com manutenção corretiva baseando-se na teoria de semi-Markov. A determinação

deste parâmetro é o primeiro passo para a otimização das manutenções deste tipo de sistema e

ainda é pouco abordada na literatura brasileira.

Neste estudo, Processo de semi-Markov e a técnica do ponto de regeneração foram utilizadas

para definir os possíveis estados e suas probabilidades de transição. Na sequência, transformadas

de Laplace foram aplicadas para determinar a distribuição da função cumulativa (cdf) para a




4

primeira falha do sistema. Finalmente, a fórmula do ganho de Mason (OSAKI, 1972) foi aplicada

para calcular o tempo médio até a falha do sistema. Ainda, exemplos numéricos comparando

resultados para diferentes parâmetros do sistema são apresentados e analisados. Através destas

análises é possível identificar o efeito doa tempos de reparo e falha dos componentes no tempo

médio até a falha do sistema.

Este artigo está organizado da seguinte forma: na Seção 2 são descritas as suposições básicas para

o modelamento do sistema e seus estados são determinados. Na Seção 3, são calculadas as

probabilidades de transição entre os estados. Na Seção 4, o tempo médio até a falha do sistema é

determinado. Na Seção 5, um exemplo numérico é apresentado juntamente com uma análise de

sensibilidade do efeito do tempo de reparo e tempo até a falha do componente no tempo médio

até a falha do sistema. Na Seção 6 são apresentadas as conclusões do trabalho.

As notações utilizadas neste artigo são as seguintes:

Nomenclatura

Componente i, i = 1, 2

Função distribuição cumulativa (CDF) do tempo de sobrevivência do

componente

Função distribuição cumulativa (CDF) do tempo de reparo do componente em

falha

X Variável aleatória que representa o tempo de sobrevivência do componente

R Variável aleatória que representa o tempo de reparo

Parâmetro da distribuição exponencial de F(t), taxa de falha

Parâmetro da distribuição exponencial de G(t), taxa de reparo

CDF da transição do sistema do estado Si para Sj

CDF do tempo entre a entrada no estado Si e a falha do sistema

Tempo médio da distribuição incondicional desconsiderando o próximo estado

visitado

Tempo médio para a primeira falha do sistema dado que o sistema iniciou no

estado Si

* Operador da convolução de integrais

^ Símbolo denotando o resultado da transformada de Laplace para uma variável

MTTF Tempo médio entre falhas




5

2. Descrição do sistema e suposições

O sistema estudado neste artigo é composto por dois componentes idênticos onde um está em

operação e o outro está em posição de cold standby. Visto que os componentes são idênticos, eles

possuem as mesmas características e a mesmas distribuições de probabilidade de tempos falha e

de reparo. Um mantenedor está disponível e pode reparar somente um componente por vez. As

seguintes suposições são consideradas neste estudo:

Suposição 1. Inicialmente, os dois componentes são novos. O componente C1 inicia a operação

enquanto o componente C2 é mantido inoperativo. Uma vez que o componente C1 falha, o

componente C2 assume a operação até que este também falhe. O reparo do componente em

estado de falha inicia imediatamente após sua falha.

Suposição 2. O tempo de transição entre operações do componente C1 para o componente C2 e

vice-versa é negligenciável. A transição é perfeita e não afeta a confiabilidade do sistema.

Também se assume que o componente enquanto em cold standby não se deteriora e nem falha.

Suposição 3. Os tempos de reparo são variáveis aleatórias que seguem uma distribuição de

probabilidade exponencial. Distribuições exponenciais têm sido utilizadas em muitos trabalhos

similares como Osaki (1972), Mahmoud & Moshref (2010) e Zhong & Jin (2014), o que

confirma a habilidade desta distribuição para caracterizar tempos de reparo.

Suposição 4. O reparo dos componentes é considerado perfeito, ou seja, após o reparo o

componente volta a ser considerado “tão bom quanto novo” e é enviado para a posição de cold

standby. Quando o componente está em reparo, o sistema opera em nível inferior de

confiabilidade, dado que a falha de um único componente leva a falha do sistema.

Considerando estas suposições, três estados foram definidos para o sistema em estudo:

S0: um componente em operação (O) e o outro em cold standby (S);

S1: um componente em operação (O) e outro em reparo (R);




6

S2: um componente em reparo (R) e outro em estado de falha (F). Esse estado representa a

falha do sistema.

O diagrama de transição de estados é apresentado na Figura 1. O sistema inicia a operação e entra

no estado S0 em t = 0. Quando o componente em operação falha, o componente em cold standby

inicia a sua operação e o componente em falha é enviado para reparo. O sistema vai para o estado

S1. O sistema permanecerá neste estado até que o reparo seja concluído ou que o componente em

operação falhe. Se o componente em operação sobreviver até a conclusão do reparo do outro

componente, o componente reparado é colocado em posição de cold standby e o sistema vai para

o estado S0, iniciando todo o processo novamente. Contudo, se o componente falhar antes da

conclusão do reparo, o sistema falha e vai para o estado S3. Uma vez no estado S3, o processo é

finalizado. Este estado é chamado de estado de absorção.

Figura 1 – Diagrama de transição de estados

S0

O,S

S1

R,O

S2

R,F

3. Formulação do problema

Considerando que são tempos em que o sistema entra em qualquer estado Si e Zn é o




7

estado visitado no período , é o processo de renovação de Markov

com espaço de estados E e é o semi-Markov kernel

em E (MAHMOUD e MOSHREF, 2010).

Inicialmente, o sistema está no estado S0 com um componente em operação e outro em posição de

cold standby. O sistema realiza uma transição para o estado S1 quando o componente em

operação falha. O componente em cold standby inicia a operação imediatamente após a falha e

não interfere nas probabilidades de transição entre estados. O reparo é iniciado imediatamente

após a falha do componente. Assim, a probabilidade de transição do estado S0 para S1 é baseada

na probabilidade de falha do componente em operação e pode ser expressa por:

Dado que o sistema está no estado S1, onde um componente está em operação e outro em reparo,

o sistema muda para o estado S0 quando o reparo é finalizado se o componente em operação se

mantiver em funcionamento. O componente reparado vai para a posição de cold standby em S0.

Consequentemente, a probabilidade de transição do sistema do estado S1 para o estado S0 é a

probabilidade do reparo do componente ser concluído antes da falha do componente em

operação. Esta probabilidade é representada pela Equação 2.

Contudo, se o componente em operação falhar antes da finalização do reparo, o sistema como um

todo irá falhar, pois não haverá componente disponível para continuar a sua operação. Esta

probabilidade pode ser representada pela probabilidade do reparo do componente não ser

concluído antes do tempo de falha do componente em operação. A probabilidade de transição do

estado S1 para o estado S2 é dada pela Equação 3:

Pode-se observar que as probabilidades definidas estão de acordo com a propriedade fundamental




8

de Markov que estabelece . Visto que todas as probabilidades de transição entre

estados foram determinadas, o semi-Markov kernel do sistema foi estabelecido. O próximo passo

é determinar o tempo médio até a falha do sistema.

4. Tempo médio até a falha do sistema

As Equações 1, 2 e 3 mostram que o tempo até a falha de cada componente, bem como o tempo

de reparo afetam o tempo até a falha do sistema. O objetivo é determinar a intensidade do efeito

dessas duas variáveis no tempo médio até a falha do sistema.

Para solucionar este problema, os argumentos da teoria do ponto de regeneração e as equações

estabelecidas na seção anterior são utilizadas para determinar a distribuição de tempo até a

absorção do sistema (S2), iniciando no estado Si (i = 0 ou 1), onde * é o símbolo da convolução de

integrais:

Aplicando a transfomada de Laplace nas Equações 4 e 5, é possível substituir a convolução por

multiplicações, resultando em:

Dado que o tempo médio entre a entrada no estado Si até a falha é dado por:

Há duas maneiras de solucionar este problema e ambas conduzem a mesma solução. Uma é a

diferenciação das Equações 6 e 7 em função de s e igualar s = 0 (ZHONG e JIN, 2014). Outra

maneira é a utilização da fórmula de ganho de Mason (Equação 9), como apresentado por Osaki




9

(1972), onde é a transformada de Laplace de fixando s = 0.

Resolvendo as equações lineares, o tempo médio até a falha do sistema, dado que ele inicia em

S0, é expressado pela Equação 10:

Onde é o tempo médio da distribuição incondicional desconsiderando-se o próximo estado

visitado. pode ser interpretado como o tempo médio em que o sistema permanece no estado Si,

podendo ser calculado por:

Para o modelo estudado neste artigo, e são expressados como:

Usando as Equações 12 e 13, é possível calcular o tempo médio até a falha do sistema, dado que

ele inicia em S0, aplicando a Equação 10.

5. Exemplo Numérico

Nesta seção um exemplo numérico é apresentado para validar o modelo proposto e uma análise

de sensibilidade é conduzida para verificar os efeitos das taxas de falha e reparo dos componentes

na confiabilidade do sistema. Assume-se que F(t) e G(t) seguem uma distribuição exponencial




10

com parâmetros e , respectivamente. A probabilidade de falha do componente é igual a

e a probabilidade de reparo é igual a . As transformadas de

Laplace das Equações 1, 2 e 3 são:

Aplicando a transformada de Laplace e fixando-se s = 0, obtém-se:

O próximo passo é resolver as Equações 12 e 13 para calcular o tempo médio que o sistema irá

permanecer em cada estado Si. Os seus resultados são: e . Calculando-se a

Equação 10, pode-se determinar o tempo médio até a falha do sistema em termos dos parâmetros

e . A Equação 10 pode ser reescrita como:

A Figura 2 apresenta uma análise de sensibilidade do tempo médio até a falha do sistema em

termos do parâmetro para = 1, 2 e 10. Como esperado, valores menores de taxa de falha




11

proporcionam um maior tempo médio até a falha do sistema, visto que os componentes possuem

uma vida mais longa, independentemente do tempo de reparo. Taxas de reparo maiores também

elevam o tempo médio até a falha do sistema, visto que o sistema fica desprotegido (trabalhando

com apenas um componente) por menos tempo.

Figura 2 – Tempo médio até a falha do sistema em função do parâmetro

Tem

po m

édio

até

a f

alh

a d

o s

iste

ma

Figura 3 – Tempo médio até a falha do sistema em função do parâmetro




12

Tem

po m

édio

até

a f

alh

a d

o s

iste

ma

A Figura 3 apresenta uma análise do tempo até a falha do sistema em função de para = 0,5, 1

e 2. As Figuras 2 e 3 mostram que melhorias no componente são mais eficazes para aumentar o

tempo médio até a falha do sistema do que melhorias no processo de reparo. Ainda, para que o

reparo seja eficiente no sistema, é necessário que este tenha uma taxa maior que a taxa de falha,

ou seja, seja realizado, em média, em tempo inferior ao tempo de falha do componente.

6. Conclusão

O modelo desenvolvido neste artigo possibilita a determinação e análise do tempo médio até a

falha de sistemas em cold standby que sofrem manutenção corretiva de componentes. A

determinação deste índice para este tipo de sistema não pode ser realizada de maneira trivial,

visto os reparos realizados nos componentes que falham. Tanto os tempos até a falha dos

componentes, como os tempos de reparo são variáveis aleatórias que seguem uma distribuição de

probabilidade.

Neste estudo, processos de semi-Markov e a técnica do ponto regenerativo foram usados para

definir os estados e suas probabilidades de transição. Na sequencia, transformadas de Laplace

foram aplicadas para determinar a distribuição de probabilidade da primeira falha do sistema. Por

fim, a fórmula de ganho de Mason foi utilizada para calcular o tempo médio até a falha do

sistema como função dos parâmetros e . Exemplos numéricos foram apresentados e seus




13

resultados foram analisados. Através destas análises é possível identificar o efeito dos tempos até

a falha e de reparo dos componentes no tempo médio até a falha do sistema.

Para pesquisas futuras, sistemas mais complexos com maior número de componentes e diferentes

políticas de manutenção podem ser modelados.

REFERÊNCIAS

MAHMOUD, M. A. W.; Moshref, M. E. On a two-unit cold standby system considering hardware, human error

failures and preventive maintenance. Mathematical and Computer Modelling, vol. 51, p. 736-745. 2010.

OSAKI, S. Reliability Analysis of a Two-Unit Standby-Redundant System with Preventive Maintenance. IEEE

Transaction on Reliability, vol. R-21, n. 1, p. 24-29. 1972.

ROSS, S. M. Introduction to Probability Models. 9th

Ed. Burlington: Academic Press, 2007.

ZHONG, C.; JIN, H. A novel optimal preventive maintenance policy for a cold standby system based on semi-

Markov theory. European Journal of Operational Research, vol. 232, p. 405-411. 2014.

DETERMINAÇÃO DO TEMPO MÉDIO ATÉ A FALHA PARA UM SISTEMA … · 2016-08-11 · É importante...

Documents

Transcript of DETERMINAÇÃO DO TEMPO MÉDIO ATÉ A FALHA PARA UM SISTEMA … · 2016-08-11 · É importante...