UNIVERSIDADE FEDERAL DO PARANÁ ANDRÉ LUIZ EMIDIO DE …
Transcript of UNIVERSIDADE FEDERAL DO PARANÁ ANDRÉ LUIZ EMIDIO DE …
UNIVERSIDADE FEDERAL DO PARANÁ
ANDRÉ LUIZ EMIDIO DE ABREU
INTERVALO DE CONFIANÇA BOOTSTRAP PARA VALORES DA FUNÇÃO DE
CONFIABILIDADE ESTIMADOS PELO MÉTODO DE KAPLAN-MEIER
CURITIBA
2011
ANDRÉ LUIZ EMIDIO DE ABREU
INTERVALO DE CONFIANÇA BOOTSTRAP PARA VALORES DA FUNÇÃO DE
CONFIABILIDADE ESTIMADOS PELO MÉTODO DE KAPLAN-MEIER
Dissertação apresentada como requisito parcial a obtenção do grau de Mestre em Ciências pelo Programa de Pós-Graduação em Métodos Numéricos em Engenharia, do Departamento de Construção Civil e do Departamento de Matemática da UFPR, na Área de Concentração em Programação Matemática e na Linha de Pesquisa em Métodos Estatísticos Aplicados a Engenharia. Orientador: Prof. Dr. Anselmo Chaves Neto
CURITIBA
2011
TERMO DE APROVAÇÃO
André Luiz Emidio de Abreu
“Intervalo de Confiança “Bootstrap” para Valores da Função de Confiabilidade Estimados pelo Método de
Kaplan-Meier”Dissertação aprovada como requisito parcial para obtenção do grau de Mestre no
Curso de Pós-Graduação em Métodos Numéricos em Engenharia - Área de Concentração
em Programação Matemática, Setores de Tecnologia e de Ciências Exatas da Universidade
Federal do Paraná, pela seguinte banca examinadora:
Programa de Pós-Graduação em Métodos Numéricos em Engenharia - PPGMNE da UFPR
Prof. Leandro dos Santos Coelho, D.Eng. PPGEPS / PUC-PR e PPGEE/UFPR
Prof. Lednardg^amo^Emmendorfer, D.Sc.PPGMC/ FURG /
Prof. Alexandre Rasi Aoki, c EnPPGEE / UFPR e Inst. De TEc. Para o Desenv. - LACTEC
Curitiba, 04 de abril de 2011.
AGRADECIMENTOS
Agradeço em primeiro lugar a Deus pela força que me deu durante o
percurso de mais uma etapa vencida com sucesso na minha vida.
Ao professor Dr. Anselmo Chaves Neto, pela orientação e disposição para
com este trabalho.
Aos meus familiares, principalmente minha avó Venina Emidio pelo apoio
irrestrito na minha trajetória, propiciando as condições para a conclusão deste curso.
Aos professores do Programa de Pós-Graduação em Métodos Numéricos
em Engenharia (PPGMNE) da Universidade Federal do Paraná pelo esforço e
dedicação no decorrer das disciplinas.
Aos colegas do mestrado pela ajuda prestada no decorrer do curso.
A CAPES pelo apoio financeiro.
Agradeço a todos que direta ou indiretamente contribuíram para a conclusão
deste trabalho.
RESUMO
A análise de confiabilidade é uma área importante, tanto para a indústria que lança novos produtos quanto para os consumidores que sempre exigem produtos cada vez melhores e que tenham uma grande durabilidade. Com isso varias técnicas foram, e ainda são, desenvolvidas para esta finalidade. Uma delas é o estimador de Kaplan-Meier, estimador da função de confiabilidade, o estimador de Kaplan-Meier é um estimador não-paramétrico assintótico, pois a assintoticidade exige que as amostras sejam grandes para que as estimativas dos valores da confiabilidade fiquem próximas aos valores reais. Uma maneira de tentar corrigir isso é a utilização de técnicas computacionalmente intensivas, tais como o método bootstrap, que é uma técnica de reamostragem proposto por Efron em 1979, que foi utilizado para avaliar a variabilidade de uma estatística qualquer. O trabalho apresenta a aplicação do método bootstrap ao estimador não-paramétrico Kaplan-Meier, e assim obter intervalos de confiança bootstrap para os valores das estimativas da confiabilidade. Foi desenvolvido um programa computacional em linguagem Fortran do método bootstrap aliado ao estimador de Kaplan-Meier, foram testadas diversas amostras de tempo de falha e comparados os resultados com os do estimador. Ao final concluiu-se que a aplicação do método resultou em resultados satisfatórios. PALAVRAS-CHAVE: Análise de confiabilidade. Bootstrap. Kaplan-Meier.
ABSTRACT
The reliability analysis is a important field for the industrial as it launches new products and for consumers who demand products always better and that have a great durability. So many techniques have been and still are developed to apply this study. One is the Kaplan-Meier estimator, estimator of the reliability function. The Kaplan-Meier estimator is a estimator nonparametric asymptotic, to be asymptotic requires that the samples are large for the estimates of the reability remain close to actual values. One way of trying to fix this is to use computationally intensive techniques, such as the bootstrap method, which is a resampling technique proposed by Efron in 1979, which was used to assess the variability of a statistic any. The paper presents the application of the bootstrap method to the nonparametric Kaplan-Meier estimator, and thereby obtain confidence intervals bootstrap for values the estimates of reliability. A computer program was developed in Fortran of bootstrap method applied to Kaplan-Meier estimator, were tested several samples of failure time and compared the results with the results of estimator. In the end it was concluded that the method achieved satisfactory results. KEYWORDS: Reability Analysis. Bootstrap. Kaplan-Meier.
LISTA DE FIGURAS
FIGURA 1 – CRONOGRAMA DE PLANEJAMENTO DA QUALIDADE DO PRODUTO ................................................................................................................ 22
FIGURA 2 – EVOLUÇÃO DA CONFIABILIDADE NO DESENVOLVIMENTO DE PRODUTOS .............................................................................................................. 23
FIGURA 3 – CLASSIFICAÇÃO DAS FALHAS .......................................................... 26
FIGURA 4 – CURVA DA BANHEIRA E CICLO DE VIDA DE EQUIPAMENTOS ...... 27
FIGURA 5 – TIPOS DE CENSURA ........................................................................... 31
FIGURA 6 – QUATRO FUNÇÕES BÁSICAS DA CONFIABILIDADE ....................... 33
FIGURA 7 – FUNÇÕES DE CONFIABILIDADE )(1 tR E )(2 tR ................................. 34
FIGURA 8 – PROCEDIMENTO GERAL DE FMEA ................................................... 42
FIGURA 9 – FORMULÁRIO FMEA ........................................................................... 42
FIGURA 10 – HISTOGRAMA DA DISTRIBUIÇÃO DE FREQUÊNCIAS DOS TEMPOS DE FALHA POR ANO ............................................................................... 44
FIGURA 11 – VALORES DAS ESTIMATIVAS DA CONFIABILIDADE E LIMITES DE CONFIANÇA ............................................................................................................. 49
FIGURA 12 – CONFIABILIDADE ESTIMADA ........................................................... 49
FIGURA 13 – ALGORITMO DA DISTRIBUICAO BOOTSTRAP DA ESTATISTICA Tn(x,F) ....................................................................................................................... 59
FIGURA 14 – HISTOGRAMA DA AMOSTRA COM 10 CATEGORIAS DE TEMPOS DE FALHA ................................................................................................................. 76
FIGURA 15 – INTERVALOS DA AMOSTRA COM 10 CATEGORIAS K-M E BOOTSTRAP-T ......................................................................................................... 78
FIGURA 16 – INTERVALOS DA AMOSTRA COM 10 CATEGORIAS K-M E B. PERCENTIS .............................................................................................................. 78
FIGURA 17 – HISTOGRAMA DA AMOSTRA COM 11 CATEGORIAS DE TEMPOS DE FALHA ................................................................................................................. 79
FIGURA 18 – INTERVALOS DA AMOSTRA COM 11 CATEGORIAS K-M E BOOTSTRAP-T ......................................................................................................... 81
FIGURA 19 – INTERVALOS DA AMOSTRA COM 11 CATEGORIAS K-M E B. PERCENTIS .............................................................................................................. 81
FIGURA 20 – HISTOGRAMA DA AMOSTRA COM 22 CATEGORIAS DE TEMPOS DE FALHA ................................................................................................................. 83
FIGURA 21 – INTERVALOS DA AMOSTRA COM 22 CATEGORIAS K-M E BOOTSTRAP-T ......................................................................................................... 85
FIGURA 22 – INTERVALOS DA AMOSTRA COM 22 CATEGORIAS K-M E B. PERCENTIS .............................................................................................................. 85
FIGURA 23 – HISTOGRAMA DA AMOSTRA COM 13 CATEGORIAS DE TEMPOS DE FALHA ................................................................................................................. 86
FIGURA 24 – INTERVALOS DA AMOSTRA COM 13 CATEGORIAS K-M E BOOTSTRAP-T ......................................................................................................... 87
FIGURA 25 – INTERVALOS DA AMOSTRA COM 13 CATEGORIAS K-M E B. PERCENTIS .............................................................................................................. 88
FIGURA 26 – HISTOGRAMA DA AMOSTRA COM 10 CATEGORIAS DE TEMPOS DE FALHA ................................................................................................................. 89
FIGURA 27 – INTERVALOS DA AMOSTRA COM 10 CATEGORIAS K-M E BOOTSTRAP-T ......................................................................................................... 90
FIGURA 28 – INTERVALOS DA AMOSTRA COM 10 CATEGORIAS K-M E B. PERCENTIS .............................................................................................................. 91
FIGURA 29 – HISTOGRAMA DA AMOSTRA COM 12 CATEGORIAS DE TEMPOS DE FALHA ................................................................................................................. 92
FIGURA 30 – INTERVALOS DA AMOSTRA COM 12 CATEGORIAS K-M E BOOTSTRAP-T ......................................................................................................... 93
FIGURA 31 – INTERVALOS DA AMOSTRA COM 12 CATEGORIAS K-M E B. PERCENTIS .............................................................................................................. 93
LISTA DE TABELAS
TABELA 1 – EQUAÇÕES DAS FUNÇÕES )(tf , )(tR E )(th PARA DIFERENTES
MODELOS DE PROBABILIDADE ............................................................................. 35
TABELA 2 – RELAÇÕES ENTRE AS FUÇÕES )(tF , )(tf , )(tR E )(th .................. 36
TABELA 3 – AMOSTRAS BOOTSTRAP OBTIDAS DA ORIGINAL .......................... 65
TABELA 4 – ESTIMATIVAS BOOTSTRAP DA CONFIABILIDADE .......................... 65
TABELA 5 – ESTATÍSTICAS BOOTSTRAP PARA CADA CATEGORIA DE TENPOS DE FALHA ................................................................................................................. 65
TABELA 6 – INTERVALOS DE CONFIANÇA DE KAPLAN-MEIER E BOOTSTRAP ............................................................................................................ 66
TABELA 7 – CATEGORIAS DE TEMPOS DE FALHA, NÚMERO DE FALHAS E CONFIABILIDADE ESTIMADA PELO ESTIMADOR DE KAPLAN-MEIER PARA 10 CATEGORIAS ........................................................................................................... 77
TABELA 8 – INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP PERCENTILICO PARA 10 CATEGORIAS ........... 77
TABELA 9 – AMPLITUDE DOS INTERVALOS DE CONFIANÇA 10 CATEGORIAS ...................................................................................................... 77
TABELA 10 – CATEGORIAS DE TEMPOS DE FALHA, NÚMERO DE FALHAS E CONFIABILIDADE ESTIMADA PELO ESTIMADOR DE KAPLAN-MEIER PARA 11 CATEGORIAS ........................................................................................................... 80
TABELA 11 – INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP PERCENTILICO PARA 11 CATEGORIAS ........................................................................................... 80
TABELA 12 – AMPLITUDE DOS INTERVALOS DE CONFIANÇA 11 CATEGORIAS ...................................................................................................... 80
TABELA 13 – CATEGORIAS DE TEMPOS DE FALHA, NÚMERO DE FALHAS E CONFIABILIDADE ESTIMADA PELO ESTIMADOR DE KAPLAN-MEIER PARA 22 CATEGORIAS ........................................................................................................... 83
TABELA 14 – INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP PERCENTILICO PARA 22 CATEGORIAS ........................................................................................... 84
TABELA 15 – AMPLITUDE DOS INTERVALOS DE CONFIANÇA 22 CATEGORIAS ...................................................................................................... 84
TABELA 16 – CATEGORIAS DE TEMPOS DE FALHA, NÚMERO DE FALHAS E CONFIABILIDADE ESTIMADA PELO ESTIMADOR DE KAPLAN-MEIER PARA 13 CATEGORIAS ........................................................................................................... 87
TABELA 17 – INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP PERCENTILICO PARA 13 CATEGORIAS ........................................................................................... 87
TABELA 18 – AMPLITUDE DOS INTERVALOS DE CONFIANÇA 13 CATEGORIAS ...................................................................................................... 88
TABELA 19 – CATEGORIAS DE TEMPOS DE FALHA, NÚMERO DE FALHAS E CONFIABILIDADE ESTIMADA PELO ESTIMADOR DE KAPLAN-MEIER PARA 10 CATEGORIAS ........................................................................................................... 89
TABELA 20 – INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP PERCENTILICO PARA 10 CATEGORIAS ........................................................................................... 90
TABELA 21 – AMPLITUDE DOS INTERVALOS DE CONFIANÇA 10 CATEGORIAS ...................................................................................................... 90
TABELA 22 – CATEGORIAS DE TEMPOS DE FALHA, NÚMERO DE FALHAS E CONFIABILIDADE ESTIMADA PELO ESTIMADOR DE KAPLAN-MEIER PARA 10 CATEGORIAS ........................................................................................................... 92
TABELA 23 – INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP PERCENTILICO PARA 12 CATEGORIAS ........................................................................................... 92
TABELA 24 – AMPLITUDE DOS INTERVALOS DE CONFIANÇA 12 CATEGORIAS ...................................................................................................... 93
SUMÁRIO
1 INTRODUÇÃO ....................................................................................................... 12
1.1 PROBLEMA ........................................................................................................ 14
1.2 OBJETIVO ........................................................................................................... 15
1.3 JUSTIFICATIVA .................................................................................................. 15
1.4 ESSTRUTURA DA DISSERTAÇÃO ................................................................... 16
2 REVISÃO DE LITERATURA ................................................................................. 17
2.1 CONFIABILIDADE DE PRODUTOS E SISTEMAS ............................................. 17
2.1.1 Aplicação da confiabilidade no desenvolvimento de produtos ......................... 18
2.1.2 Evolução da confiabilidade de um produto ....................................................... 22
2.1.3 Definição de confiabilidade ............................................................................... 24
2.1.3.1 Falha ............................................................................................................. 25
2.1.3.2 Taxa de falha ................................................................................................. 26
2.1.3.3 Curva da banheira ......................................................................................... 27
2.1.3.4 Tempo médio entre falhas (MTBF) ................................................................ 29
2.1.4 Censura ............................................................................................................ 30
2.1.5 Função de confiabilidade .................................................................................. 31
2.1.5.1 Definição matemática da confiabilidade ........................................................ 31
2.1.5.2 Funções básicas de confiabilidade ................................................................ 32
2.1.6 Função de taxa de falha ................................................................................... 34
2.2 TESTES ACELERADOS ..................................................................................... 36
2.2.1 Tipos de testes acelerados ............................................................................... 37
2.3 ANÁLISE DOS EFEITOS E MODOS DE FALHA (FMEA)................................... 39
2.4 TÉCNICAS NÃO-PARAMÉTRICAS .................................................................... 43
2.4.1 Estimação na ausência e presença de censura ............................................... 43
2.4.2 Estimador de Kaplan-Meier .............................................................................. 45
2.4.2.1 Kaplan-Meier com estratificação ................................................................... 50
2.4.3 Testes para comparação de curvas de confiabilidade ..................................... 50
2.4.3.1 Teste de log-rank .......................................................................................... 50
2.4.3.2 Teste de Gehan ............................................................................................. 52
2.4.3.3 Teste de Peto ................................................................................................ 53
2.5 TÉCNICAS COMPUTACIONALMENTE INTENSIVAS ....................................... 54
2.5.1 Método Jackknife ............................................................................................. 55
2.5.2 Obtenção da amostra Jackknife ....................................................................... 55
2.5.3 Método bootstrap ............................................................................................. 56
2.5.3.1 Método bootstrap não-paramétrico ............................................................... 57
2.5.3.1.1 Definição e propriedades ............................................................................ 57
2.5.3.2 Método bootstrap paramétrico ....................................................................... 62
3 MATERIAL E MÉTODO ......................................................................................... 63
3.1 SEQUÊNCIA DA APLICAÇÃO DO MÉTODO BOOTSTRAP .............................. 64
3.2 ERRO PADRÃO BOOTSTRAP ........................................................................... 66
3.3 INTERVALOS DE CONFIANÇA BOOTSTRAP ................................................... 67
3.3.1 Intervalo bootstrap-t ......................................................................................... 67
3.3.2 Intervalo de confiança baseado nos percentis bootstrap ................................. 68
3.3.3 Intervalo de confiança bootstrap BCPB ............................................................ 69
3.3.4 Intervalos de confiança percentis aBC ............................................................. 70
3.4 GERADOR ALEATÓRIO DE AMOSTRAS DE FALHAS ..................................... 72
3.5 OBTENÇÃO DO INTERVALO DE CONFIANÇA BOOTSTRAP .......................... 73
3.6 COMPARAÇÃO DOS INTERVALOS DE CONFIANÇA DE KAPLAN-MEIER E O BOOTSTRAP ............................................................................................................ 74
4 RESULTADOS ....................................................................................................... 76
4.1 APLICAÇÃO DO MÉTODO BOOTSTRAP DOS INTERVALOS DE CONFIANÇA ............................................................................................................. 76
4.1.1 Amostra gerada com 10 observações com 33 itens, censurada ...................... 76
4.1.2 Amostra gerada com 11 observações com 39 itens, não censurada ............... 79
4.1.3 Amostra gerada com 22 observações com 70 itens, censurada ...................... 82
4.1.4 Amostra gerada com 13 observações com 46 itens, censurada ...................... 86
4.1.5 Amostra gerada com 10 observações com 34 itens, não censurada ............... 89
4.1.6 Amostra gerada com 12 observações com 56 itens, censurada ...................... 91
5 CONCLUSÃO ........................................................................................................ 95
REFERÊNCIAS ......................................................................................................... 97
APÊNDICES ........................................................................................................... 102
APÊNDICE A .......................................................................................................... 102
APENDICE B .......................................................................................................... 104
12
1. INTRODUÇÃO
Durante a 2a Guerra Mundial, pesquisas científicas foram desenvolvidas e
aplicadas ou, ainda, outras já desenvolvidas foram aplicadas. Um exemplo que pode
ser citado é o radar (desenvolvido pelo inglês Watson Watt em 1938-1940), outro
seria o método de otimização simplex (desenvolvido pelo americano George Bernard
Dantzig, com resultados publicados em 1947) e, é o caso também do
desenvolvimento da confiabilidade. Nessa época, os sistemas eletrônicos tiveram
uma vasta aplicabilidade e, então, evoluíram e se tornaram complexos surgindo
vários problemas operacionais. A solução desses problemas exigia abordagens
metódicas e bem formuladas. Assim, as forças armadas americanas criaram comitês
de avaliação de problemas de confiabilidade.
No ano de 1952, o Departamento de Defesa americano coordenou os
esforços do exército americano, força aérea e marinha e criou o Advisory Group on
Reability of Electronic Equipment (AGREE). Este grupo influenciou decisivamente
toda a abordagem científica sobre confiabilidade e publicou muitos artigos relatando
trabalhos realizados, principalmente sobre equipamentos eletrônicos militares.
O emprego das técnicas de qualidade no Japão (1947-1950) e nos países
desenvolvidos fez com que a confiabilidade fosse utilizada cada vez mais, não só na
indústria bélica, mas também (e principalmente) na indústria de bens e serviços.
Dessa forma, passou a ser importante nas fases industriais ou de serviços
seguintes: operação, manutenção, assistência técnica e satisfação do cliente
(Chaves Neto, 2010).
Seguindo essa tendência, a análise de confiabilidade foi uma das áreas da
Estatística que mais cresceu nas últimas duas décadas do século passado. Isso se
deve ao desenvolvimento e ao aperfeiçoamento de técnicas estatísticas em conjunto
com computadores cada vez mais velozes. Essa é a área da Estatística, segundo
Bailar III e Mosteller (1992), que mais se destacou no período de 1979 até 1989,
tanto na área da Engenharia, quanto na área da Medicina onde é conhecida como
análise de sobrevivência. Os dois artigos mais citados em toda literatura estatística
no período de 1987 a 1989 foram, segundo Stigler (1994), o do estimador de
Kaplan-Meier para a função de confiabilidade (1958) (sobrevivência) e o modelo de
Cox (1972).
13
Na análise de confiabilidade, a variável resposta é, geralmente, o tempo até
a ocorrência de algum evento de importância relacionada com falha. Esta variável é
denominada como tempo de falha e é considerada até o tempo em que, por
exemplo, o produto falhe, uma estrutura vá a colapso, ou um paciente morra, no
caso da Medicina.
Uma das características dos dados de tempo de falha é a presença de
censura, que é a observação parcial da resposta. A censura aparece geralmente
quando um item, neste caso item pode ser considerado um componente de um
sistema, uma peça de um produto ou até mesmo o produto, ou sistema, como um
todo, acaba ultrapassando o ponto, ou tempo, limite do teste de vida. Geralmente,
este ponto se refere ao tempo de uso, número de vezes que o produto é utilizado até
atingir um número pré-estabelecido de falhas ou quando a falha ocorre de uma
forma que não era esperada, por exemplo, em um teste de vida em que um monitor
está sendo testado para avaliar o tempo em que o tubo de imagem suporta, em altas
temperaturas, até que seu sistema eletrônico acabe falhando. Neste caso ocorreria
censura do item por que a falha ocorreu no sistema eletrônico, e não no tubo. Na
Medicina, seja o caso de um paciente que está sendo tratado de câncer de pulmão,
mas acaba morrendo atropelado, ou de outra forma que não esteja ligada ao câncer.
O paciente é retirado do estudo por censura.
Nos casos em que não ocorrem censuras, as técnicas estatísticas clássicas,
como análise de regressão e outras de planejamento de experimentos, podem ser
utilizadas na análise dos dados. Infelizmente isso não acontece com frequência, logo
não se pode utilizar tais técnicas, uma vez que elas necessitam de todos as
categorias de tempos de falha. Logo se faz necessário o uso de métodos de análise
de confiabilidade, sobrevivência, que possibilitam incorporar na análise estatística a
informação contida nos dados censurados. Para esses problemas foram
desenvolvidas diversas técnicas estatísticas, um exemplo são os estimadores não-
paramétricos, que tentam aproximar os valores da função de confiabilidade. Um
muito conhecido e usado é o estimador não-paramétrico de Kaplan-Meier, outro
também conhecido é o estimador não-paramétrico de Nelson-Aalen (Colossimo,
2006). O primeiro, Kaplan-Meier, é o estimador utilizado neste trabalho, por ter sido
comparado com o de Nelson-Aalen e obtido valores mais próximos da função de
confiabilidade real.
14
As aplicações do estimador de Kaplan-Meier são diversas, tanto na
Medicina, quanto na Engenharia e na Economia, além de outras áreas da ciência
moderna. Alguns exemplos de aplicações em outras áreas podem ser observados,
por exemplo, na área criminalista, onde estudam o tempo entre a liberação de
presos e a ocorrência de novos crimes; estudiosos do trabalho se concentram em
mudanças de emprego, desempregos, promoções e aposentadorias; demógrafos,
com nascimentos, mortes, casamentos, divórcios e migrações. Mas, neste trabalho,
a abordagem será estritamente na análise de confiabilidade de produtos e sistemas.
Portanto, a maioria das definições, exemplos, ilustrações ou até mesmo citações são
voltados à confiabilidade de produtos e sistemas.
1.1 PROBLEMA
Como mencionado anteriormente, o estudo da confiabilidade vem crescendo
muito (Bailar III e Mosteller, 1992), demonstrando o interesse dos fabricantes em
fornecer produtos cada vez mais confiáveis e seguros. Para isso, várias técnicas
foram e ainda estão sendo desenvolvidas, e a análise de confiabilidade é uma área
da estatística que tem recebido uma atenção acentuada de pesquisadores.
Com esse crescimento, várias técnicas estatísticas foram desenvolvidas, tais
como os estimadores não-paramétricos da função de confiabilidade. Um método de
estimação da função de confiabilidade que vem sendo utilizado por vários
estatísticos e engenheiros, é o estimador não-paramétrico de Kaplan-Meier,
proposto em 1958, também denominado estimador Limite-produto é uma adaptação
da função de confiabilidade empírica. Embora seja um estimador muito confiável, ele
é assintótico, logo necessita de uma amostra grande de dados de falha, mas para
produtos que ainda serão lançados, o fabricante não possui tantos dados dos
tempos de falha, ou possui dados coletados do tempo de garantia que geralmente
não são muitos, impondo ao fabricante que faça vários testes de vida acelerados.
Mas isso pode levar a uma tabela de valores tendenciosos, sendo pouco confiável.
Logo, o principal problema é encontrar estimativas razoáveis, perto dos
valores das estimativas reais, mesmo com amostras de falha de tamanho pequeno.
Isso mostra que é de extrema importância a utilização de técnicas junto aos
estimadores não-paramétricos para se obter estimativas cada vez melhores e mais
15
confiáveis, além, também, do ganho de tempo que isso pode proporcionar com o
auxílio de computadores.
1.2 OBJETIVO
O objetivo deste trabalho é utilizar a técnica computacionalmente intensiva
chamada bootstrap, para determinar o erro padrão bootstrap e a partir deste erro
padrão construir intervalos de confiança bootstrap para os valores da função de
confiabilidade estimados pelo método de Kaplan-Meier. Verificando se este erro
padrão bootstrap é menor que o do estimador, e que os intervalos de confiança
bootstrap sejam mais curtos em torno da estimativa da função que os intervalos do
estimador clássico. Com isso construir intervalos de confiança mais próximos da
realidade.
Como complementação do trabalho e para a realização da aplicação e
análise, desenvolveu-se um programa computacional experimental, programado na
linguagem Fortran 2003, para os cálculos do método bootstrap e do estimador de
Kaplan-Meier, para verificar a sua eficiência, além de um gerador aleatório de
tempos de falha, utilizado para simular amostras de falha.
1.3 JUSTIFICATIVA
O trabalho se justifica por utilizar uma metodologia robusta na estimação dos
valores da função de confiabilidade, primeiramente aplicada a produtos e sistemas,
mas podendo ser ampliada para outras áreas da ciência, tais como na Medicina,
Economia, confiabilidade estrutural, entre outras. Logo quando se pretende lançar
um produto, um prédio, uma ponte, etc., é necessário saber quanto tempo, na
média, ele pode durar, quantos quilos pode suportar, quantas vezes em média pode
ser acionado, etc. Assim, como os estimadores não-paramétricos da função de
confiabilidade são todos assintóticos, necessita-se de novas técnicas aliadas a estes
estimadores para se obter respostas confiáveis.
Portanto, este trabalho apresenta uma aplicação do método
computacionalmente intensivo bootstrap, associado ao estimador de Kaplan-Meier, e
assim com essa aplicação, conseguir valores das estimativas mais próximas da
16
realidade, uma vez que o método bootstrap foi desenvolvido para avaliar a
variabilidade de estatísticas com base em dados de amostras iniciais conhecidas.
Por ser uma técnica computacionalmente intensiva, fica totalmente inviável efetuar
os cálculos manualmente. Portanto, precisa-se de técnicas próprias para isso, e a
principal e fundamental é o computador além de softwares específicos para cálculos
matemáticos. Portanto, utilizou-se dos meios de computação avançados e softwares
matemáticos, que podem ser adquiridos. Como os programas desenvolvidos são de
fácil entendimento, qualquer pessoa que tenha domínio sobre o estudo da
confiabilidade poderá utilizá-los com facilidade.
1.4 ESTRUTURA DA DISSERTAÇÃO
O trabalho está composto por esta introdução, como capítulo 1, revisão de
literatura no capítulo 2, abrangendo algumas definições de confiabilidade de
produtos e sistemas, suas equações principais, temas importantes que devem ser
considerados, como definições de falha, censura, entre outras, o estimador de
Kaplan-Meier e o método computacionalmente intensivo de reamostragens
bootstrap. O capítulo 3 apresenta os materiais e os métodos utilizados no trabalho,
com um aprofundamento no erro padrão e intervalos de confiança bootstrap. No
quarto capitulo apresenta-se os resultados e análises feitas entre o método do
bootstrap aplicado ao estimador de Kaplan-Meier e o próprio estimador, tais como os
resultados dos intervalos de confiança e do erro padrão. Finalmente, tem-se a
conclusão e as referências.
17
2. REVISÃO DE LITERATURA
2.1 CONFIABILIDADE DE PRODUTOS E SISTEMAS
Nos últimos anos do século passado, houve uma ênfase na Gestão de
Qualidade Total, mostrando que a qualidade é tarefa de todos. Houve tempos em
que nas empresas a qualidade era apenas tarefa do departamento do Controle de
Qualidade. Nos dias de hoje, sob o guarda-chuva da Gestão da Qualidade Total, são
incluídas as atitudes da alta liderança, do planejamento estratégico, da gestão de
recursos humanos, da gestão dos processos, dos próprios resultados obtidos do
negócio e da satisfação do cliente.
Referindo-se ao produto em si, que vai determinar a satisfação do cliente e
consequentemente a sua retenção, está o desempenho das características técnicas
ao longo do período estimado de vida do produto. Neste momento, é importante
conceituar confiabilidade como sendo a probabilidade de que um produto
desempenhe suas funções previstas por um período de tempo sob condições
específicas de operação pré-determinados. É difícil encontrar uma pessoa que
nunca teve um produto que deixou de funcionar ocasionando inúmeros problemas
ao próprio usuário. As definições clássicas de confiabilidade e falhas serão
abordadas a seguir nas próximas seções deste capítulo.
Devido à globalização, cada vez mais os produtos vêm sendo
comercializados entres os países. As exportações e importações de produtos de
diferentes países, com diferentes condições climáticas e de estilos de usos, como
por exemplo, os automóveis que foram desenvolvidos em países de origem e
passaram a ser vendidos em outros países sob outras condições de qualidade de
combustíveis e de estrada, por essas diferenças podendo trazer problemas aos
usuários. Essa evolução torna fundamental garantir os quatro aspectos básicos da
confiabilidade: valor da probabilidade, o tempo de uso, o desempenho e as
condições de operação, para poder se tornar, ou se manter, competitivo no mercado
mundial.
Com a complicação técnica dos produtos que vem sendo lançados
atualmente, torna-se cada vez mais importante conhecer o MTBF (Mean Time
Between Failures – tempo médio entre falhas) de cada produto, que permite avaliar
18
o volume de serviços de assistência técnica, seu dimensionamento, seus requisitos
de mão-de-obra ou até um programa de manutenção preventiva se necessário.
Assim, é importante mencionar que o desenvolvimento e a introdução de
novos produtos que obedeçam as especificações durante um tempo pré-
determinado, inserem-se no modelo sistêmico da Qualidade Total.
2.1.1 Aplicação da confiabilidade no desenvolvimento de produtos
Num ambiente de alta competição, o que é hoje muito comum nos
mercados, é importante que as empresas sejam capazes de determinar e controlar a
confiabilidade dos seus produtos. Sabendo-se o nível de confiabilidade dos
produtos, pode-se saber de antemão se as expectativas dos clientes quanto a este
produto serão atingidas, bem como o nível de qualidade do mesmo. Nesta definição,
produtos são componentes, subsistemas ou sistemas que constituem um produto ou
serviço.
A principal aplicação de confiabilidade em Engenharia é na prevenção de
falhas. O conceito de falha será apresentado a seguir, mas pode-se adiantar que,
falha pode ser definida como término da disponibilidade de um produto, para realizar
sua função requerida (Hoyland e Rausand, 1994). Falhas podem ser classificadas
conforme seus modos de ocorrência. Um modo de falha pode ser descrito como o
efeito causador da falha em um produto. Como os produtos são desenvolvidos para
realizar uma ou mais funções, um modo de falha é, portanto, definido como a não
realização de uma destas funções. A maioria dos produtos apresenta diferentes
modos de falha.
Saindo da teoria e entrando na prática, para analisar a confiabilidade de um
sistema, o analista deve conduzir um modelo estocástico que o descreva ou
escolher um modelo já existente que se adapte a ele. O modelo adotado deve
descrever as funções essenciais do sistema, não sendo necessária a exatidão nesta
descrição. Neyman (1954, apud Hoyland e Rausand, 1994), um dos pioneiros da
matemática estatística, propôs que toda tentativa de uso da matemática para o
estudo de algum fenômeno real deve iniciar com a construção de um modelo
matemático. Este modelo matemático proposto será apropriado se não ignorar
detalhes relevantes na compreensão do fenômeno estudado. A solução do problema
matemático pode estar correta e não condizer com a realidade, simplesmente
19
porque a suposição original do modelo matemático diverge das condições práticas
do problema considerado. Para ter certeza que o modelo matemático adotado é
adequado, deve-se predizer um número mínimo de resultados a partir deste modelo
e compará-los com observações realizadas.
Segundo Box et al. (1978) nenhum modelo matemático de fenômenos físicos
é totalmente correto. Em algumas situações particulares, alguns modelos são mais
úteis do que outros. Considerando que a modelagem matemática permite um estudo
mais aprofundado do fenômeno em estudo, a obtenção de modelos matemáticos é a
chave em estudos de Confiabilidade.
Na maioria dos estudos de sistemas técnicos (mecânicos, químicos,
elétricos, entre outros) é necessário trabalhar com modelos que representam os
sistemas analisados. Estes modelos podem ser gráficos ou matemáticos. Os
modelos matemáticos utilizados devem ser capazes de apresentar dados e
possibilitar o uso de métodos matemáticos e estatísticos para estimar parâmetros de
confiabilidade, segurança e risco. Os modelos matemáticos devem apresentar as
seguintes características:
(i) Ser suficientemente simples, para serem tratáveis através dos métodos
matemáticos e estatísticos disponíveis;
(ii) Ser suficientemente realistas, para deduzir os resultados da relevância
pratica (Hoyland e Rausand, 1994).
A análise de confiabilidade pode ser considerada uma tarefa multidisciplinar,
pois envolve diferentes áreas de conhecimentos na execução. Os conhecimentos e
recursos mínimos para a realização de um estudo de confiabilidade são os
seguintes:
(i) Conhecimento dos aspectos técnicos do sistema, ou produtos
analisados e dos mecanismos físicos que podem conduzir à falhas deste sistema;
(ii) Conhecimento dos conceitos matemático-estatísticos e métodos
estatísticos necessários na análise;
(iii) Disponibilidade de dados reais para a estimativa de parâmetros e teste
dos modelos desenvolvidos;
(iv) Disponibilidade de programas computacionais apropriados para a
análise de sistemas complexos.
20
A quantidade de recursos necessários na análise de Confiabilidade depende
da complexidade do sistema enfocado e profundidade da análise que se deseja
realizar (Hoyland e Rausand, 1994).
A análise de confiabilidade pode ser administrada como um sub-processo do
processo de desenvolvimento de produtos, uma vez que se pode determinar
atividades relativas à confiabilidade em diversas etapas do desenvolvimento de
produtos. Desde uma etapa preliminar, quando são estipuladas as metas de
confiabilidade, até uma etapa de início de produção, quando os dados de
confiabilidade de máquinas-piloto são avaliados e comparados com as metas
anteriormente traçadas.
Os manuais de referência do sistema da Qualidade QS9000 fazem
referência a análise de confiabilidade como parte integrante do processo de
desenvolvimento de produtos. A Figura 1 ilustra como DVP&R (Design Verification
Plan & Report – Relatório e Plano de Verificação do Projeto), está contido no
processo de desenvolvimento de produtos, conforme previsto no manual APQP
(advance product quality planning – planejamento avançado da qualidade do
produto) das normas QS9000, e sua correlação com a engenharia de confiabilidade.
Já na fase do planejamento do projeto, é importante abordar o tema
confiabilidade, estabelecendo-se as metas de qualidade e confiabilidade pretendidas
para o novo produto. Nessa fase são estabelecidos os padrões referenciais
(benchmarks), no qual o novo produto deverá espelhar-se em termos de qualidade e
confiabilidade. Não somente dados referenciais ao produto são considerados, mas
também padrões relativos a processos de fabricação e montagem. Dados de grande
valia nesta avaliação são os estudos de confiabilidade em produtos similares e/ou
concorrentes, bem como o uso dos dados de garantia que demonstrem a
confiabilidade de produtos correntes ou que serão substituídos. São analisados
dados que podem ser reportados, como tempo médio entre falhas (MTBF – mean
time between failures), o número de falhas por máquina em um determinado período
(pode ser o período de garantia), ou uma informação de grande valia para análises
gerenciais, o valor gasto em garantia como um percentual de receitas financeiras.
Para se estipular as metas de confiabilidade e qualidade também devem ser
adotadas técnicas que traduzam a expectativa dos clientes, tal como o QFD (Quality
Function Deployment - desdobramento da função qualidade), por exemplo. Os
dados de confiabilidade também podem ser expressos em um percentual de falhas
21
admitido com um determinado nível de uso do equipamento, bem como o número de
defeitos por milhão de peças produzidas.
A segunda fase da abordagem da confiabilidade ocorre durante o
desenvolvimento de produtos. Agora, as metas de confiabilidade estabelecidas na
fase de planejamento passam a nortear o desenvolvimento do projeto e dos
processos de fabricação. Os materiais e tolerâncias dimensionais são selecionados
conforme as características mecânicas e químicas necessárias para atender os
requisitos especificados na etapa anterior.
A confiabilidade do produto deve ser verificada em campo. Mas muito antes
da construção de protótipos para testes de campo ou para testes de laboratório,
diversas práticas podem ser adotadas, as quais propiciam a verificação antecipada
se determinadas peças e/ou subconjuntos atendem as especificações de
engenharia. Neste momento são estabelecidos os requisitos funcionais, de
durabilidade e de aparência dos componentes e conjuntos. Estas verificações
antecipadas são muito importantes para reduzir o custo do projeto e o ciclo de
desenvolvimento. São feitas análises virtuais de desempenho de peças, como, por
exemplo, análises de elementos finitos, realidade virtual e simulações de solicitações
dinâmicas.
Uma vez realizadas as análises virtuais selecionadas para o projeto em
questão, pode-se iniciar a fase de testes de bancada em componentes e, testes de
campo, com protótipos. Desta fase de testes em diante se inicia o monitoramento
dos dados de confiabilidade através do registro dos dados de falhas, para se plotar
as curvas de confiabilidade e monitorar a situação real contra os objetivos
estipulados na fase de planejamento.
A confiabilidade do produto é monitorada ao longo das outras fases do
desenvolvimento, pelo registro e análise de falhas, permitindo uma comparação da
evolução da confiabilidade do produto da fase de protótipos para a fase de lote piloto
e início de produção.
Este monitoramento permite reportar para os responsáveis se as metas de
confiabilidade serão atingidas e se as melhorias feitas ao longo do desenvolvimento
estão sendo eficazes em elevar o tempo entre falhas do produto.
22
FIGURA 1 – Cronograma de planejamento da qualidade do produto FONTE: Richter (2004).
2.1.2 Evolução da confiabilidade de um produto
O monitoramento da evolução da confiabilidade deve ser feito a partir do
momento em que haja protótipos prontos para irem a campo. O mais importante de
tudo é haver rigorosidade e um bom sistema para registrar as falhas que ocorrem
durante os testes de campo.
A confiabilidade deve crescer ao longo do tempo até atingir um percentual
próximo ao da confiabilidade estabelecida para o início da produção. Revisões de
projetos, que devem ser feitas a partir dos dados de falha, incorporam créditos ao
projeto que permite o aumento do tempo entre falhas. Mesmo após o início da
produção são incorporadas melhorias aos produtos, fazendo com que sua
confiabilidade melhore até atingir um grau de maturidade.
Definição do programa
Aprovação do programa
Protótipo Piloto Lançamento
Planejamento: Benchmark, QFD, MTBF, falhas em garantia, curva
de crescimento da confiabilidade
Projeto e desenvolvimento do produto: Realidade Virtual, análise de elementos finitos, testes
acelerados, simulações de vibrações, ruído, dinâmica de fluidos, solidificação, modelação de plásticos, fatores
humanos, cinemática e dinâmica de sistemas, molas e parafusos e análise e revisões do projeto.
Projeto e desenvolvimento do processo virtual: Manufacturing – DFMEA (Design Failure Modes and Effects Analysis - Análise dos Efeitos e Modos de Falha do Projeto)
Validação do produto e do processo Testes de bancada e campo, análises de confiabilidade e
monitoramento do IMTBF (Instantaneous Mean Time Between Failures - tempo médio instantâneo entre falhas)
Produção Análises de
confiabilidade e monitoramento do
IMTBF.
Análise da retroalimentação e ação corretiva
23
Existem diversas formas de se representar a evolução da confiabilidade. Uma delas mostra a evolução do IMTBF (Instantaneous Mean Time Between
Failures - tempo médio instantâneo entre falhas) ao longo do tempo. A Figura 2 apresenta um exemplo da evolução da confiabilidade no desenvolvimento de produtos.
FIGURA 2 – Evolução da confiabilidade no desenvolvimento de produtos. FONTE: Richter (2004).
O IMTBF consiste em reduzir o intervalo de análise a um valor arbitrário,
para avaliar a evolução do mesmo ao longo do programa, à medida que as
melhorias no projeto forem sendo incorporadas ao novo produto. A Figura 2
apresenta o progresso percentual do IMTBF em relação ao objetivo estipulado ao
programa, na fase de planejamento.
Para atingir a evolução planejada do IMTBF, um plano consistente de testes
e um tratamento adequado as falhas encontradas devem ser implementados. A
evolução da confiabilidade pode ser considerada como um processo de teste do
produto, resolução dos problemas de confiabilidade e monitoramento do seu
crescimento.
Antes de serem construídos os protótipos, os engenheiros devem estimar a
confiabilidade inerente e a confiabilidade inicial. A confiabilidade inicial deve ser alta
o suficiente para atingir os objetivos finais, ao tempo certo estabelecido, para o
programa. Melhorar a confiabilidade inicial é mais fácil que aumentar a taxa de
evolução da confiabilidade.
24
A taxa de evolução da confiabilidade pode ser definida como a inclinação da
curva da Figura 2, plotada em escala logarítmica. A confiabilidade inerente é o valor
a qual o produto irá atingir em sua fase de maturidade.
A estimação da confiabilidade inicial e inerente é feita baseada na
experiência das pessoas com o auxílio de técnicas e ferramentas, tais como, o
desenvolvimento de FMEAS (Failure Modes and Effects Analysis – análise dos
efeitos e modos de falha), dados de produtos similares, dados de garantia e análise
de causa raiz. Caso as confiabilidades inicial e inerente não estejam em níveis
aceitáveis, uma revisão do projeto deve ser feita para permitir que estas grandezas
correspondam às expectativas. Algumas empresas trabalham com uma
confiabilidade inicial de pelo menos 50% do objetivo de produção, para assim iniciar
a construção dos protótipos.
Com os objetivos claramente estabelecidos outros pontos importantes de
decisão devem ser avaliados. Momentos antes de iniciar-se a fabricação do lote
piloto deve-se avaliar se uma nova revisão de projeto é necessária, caso os níveis
de confiabilidade estabelecidos para aquele ponto não sejam atingidos. A mesma
avaliação pode ser feita antes de iniciar a produção e mostrar ao gerenciamento se
o produto ainda necessita de melhoria para atingir os níveis de confiabilidade
projetados e servir como instrumento de decisão para postergar o início de
produção. Esta sempre é uma decisão difícil de ser tomada, mas pode ser,
estrategicamente, uma decisão importante para evitar custos indesejados de
garantia e a insatisfação de clientes.
2.1.3 Definição de Confiabilidade
Conceito de Confiabilidade: Confiabilidade é um atributo inerente ao projeto
do produto e representa a capacidade potencial que deveria ser atingida em
condições habituais, desde que fabricado exatamente conforme projetado e operado
e mantido exatamente nas condições prescritas (Bergamo, 1997).
Definição de Confiabilidade: Confiabilidade é a probabilidade de que um
componente ou sistema cumpra sua função com sucesso, ou seja, tenha um bom
25
desempenho durante um período de tempo previsto, sob as condições de operação
especificadas no seu projeto (Bergamo, 1997).
2.1.3.1 Falha
A definição de falha é um conceito fundamental para qualquer estudo em
análise de confiabilidade. De maneira geral, uma falha consiste na interrupção ou
alteração da capacidade de um item em desempenhar uma função requerida ou
esperada, sendo que item corresponde a qualquer parte, componente, dispositivo,
subsistema, unidade funcional, equipamento ou sistema que possa ser considerado
individualmente (Guzzon, 2009).
O termo falha (failure) é frequentemente confundido com os termos erro e
defeito (fault), principalmente devido às traduções de seus respectivos termos do
inglês para a língua portuguesa. Isso gera a existência de diferentes definições para
eles, muitas vezes conflitantes. O erro corresponde à discrepância entre o valor
observado e o valor alvo (correto), não sendo considerado como uma falha por
encontrar-se dentro de limites aceitáveis de desvio do desempenho desejado. A
falha corresponde, por sua vez, ao evento que ocorre quando a função requerida é
perdida (excedendo os limites aceitáveis). O estado de um item caracterizado pela
incapacidade de desempenhar sua função requerida é denominado estado de falha
(Avizinenis et al., 2004).
Um erro pode ser referido como uma falha incipiente e é causado por um
defeito. Um defeito pode ser tanto externo quanto interno. A ativação de um defeito
interno latente ou a presença de um defeito externo pode gerar um erro. Um erro é
sucessivamente transformado em outros erros (propagação), podendo gerar uma
falha subsequente, dependendo da estrutura do sistema ou do comportamento
deste. A falha de um item, por sua vez, pode ser a causa de um defeito em outro
item ao qual esse se relaciona (Guzzon, 2009).
A Figura 3 apresenta a classificação das falhas sob vários aspectos, tais
como origem, extensão, velocidade, manifestação, criticidade ou idade. Dessa
maneira, as falhas podem ser, quanto à extensão, parciais ou completas,
dependendo se conduzem à incapacidade do item de desempenhar alguma função
requerida ou se ocorre perda total da função requerida deste.
26
FIGURA 3 – Classificação das falhas. FONTE: Adaptado de Siqueira (2005).
Ainda, o complemento da confiabilidade é a probabilidade de falha (de
componente ou sistema).
Tradicionalmente, as fases da vida de um componente ou sistema são
descritas pela Curva da Banheira, que será apresentada e definida na secção 2.1.4.
2.1.3.2 Taxa de Falhas
A Taxa de falhas é definida como a frequência com que as falhas ocorrem
num certo intervalo de tempo medida pelo número de falhas por cada hora, ou outra
unidade de tempo escolhida, de operação ou número de operações do sistema (ou
componente) (Chaves Neto, 2010).
Geralmente a taxa de falhas é representada por e o inverso da taxa de
falhas é conhecido como Tempo Médio Entre Falhas (TMEF), tradicionalmente é
conhecida em inglês como Mean Time Between Failures (MTBF). A expressão do
TMEF ou MTBF é:
1 TMEFMTBF (2.1)
Tipos de falhas frequentes
• falha aleatória: é qualquer falha cuja causa ou mecanismo de falha
faça com que seu instante de ocorrência se torne imprevisível, a não ser no sentido
probabilístico;
27
• falha por deterioração: é a falha que resulta de mecanismos de
deterioração inerentes ao item, os quais determinam uma taxa de falha crescente ao
longo do tempo;
• falha catastrófica: é a falha repentina, a qual não pode ser prevista
por monitoração, que resulta na incapacidade.
As falhas dos produtos podem ser caracterizadas em relação ao tempo
como de três categorias:
• Falhas no início da vida (mortalidade infantil);
• Falhas durante a vida útil (normal) que possui taxa de falha constante
• Falhas no final da vida (deterioração – velhice).
Estes tipos de falhas são plotados em uma curva chamada curva da
banheira.
2.1.3.3 Curva da banheira
A análise do comportamento da taxa de falha de um equipamento, ou
produto, ao longo do tempo pode ser representada por uma curva que possui a
forma de uma banheira, a curva da banheira (bathtube curve), conforme
apresentado na Figura 4. A curva representa as fases da vida características de um
sistema: mortalidade infantil, maturidade e mortalidade senil. As fases estão
associadas ao fator de forma , que é um dos parâmetros de uma eventual
distribuição de Weibull que descreva a confiabilidade do produto (Sellitto, 2005).
FIGURA 4 – Curva da Banheira e ciclo de vida de equipamentos. Fonte: Sellitto (2005).
28
No primeiro período, período de mortalidade infantil, a taxa de falhas )(th
geralmente é alta, porém decrescente. As falhas preliminarmente são causadas por
defeitos congênitos ou fraquezas, erros de projeto, peças defeituosas, processos de
fabricação inadequados, mão-de-obra desqualificada, estocagem inadequada,
instalação imprópria, partida deficiente entre outras. A taxa de falhas diminui com o
tempo, conforme os reparos de defeitos eliminam componentes frágeis ou à medida
que são detectados e reparados os erros de projeto ou de instalação. Sellitto (2005)
ressalta que, neste período, a melhor estratégia de manutenção é a corretiva, ou
seja, cabe à manutenção não apenas reparar o equipamento, mas corrigi-lo, para
que a falha não venha a se repetir.
A fase de maturidade ou período de vida útil encontra-se entre t1 e t2. O valor
médio da taxa de falha é constante. Nesta fase, as falhas ocorrem por causas
aleatórias, externas ao sistema, tais como acidentes, mau uso ou operação
inadequada, e são de difícil controle. As falhas aleatórias podem assumir diversas
naturezas, tais como: sobrecargas aleatórias, problemas externos de alimentação
elétrica, vibração, impactos mecânicos, bruscas variações de temperatura, erros
humanos de operação entre outros. Falhas aleatórias podem ser reduzidas
projetando equipamentos mais robustos do que exige o meio em que opera ou
padronizando a operação. Segundo Sellitto (2005), neste período, a melhor
estratégia de manutenção é a preditiva, ou seja, monitoramento para detectar o
início da fase de desgaste.
Após t2, há um crescimento da taxa de falhas, a mortalidade senil, ou fase
da velhice, que representa o início do período final de vida do produto. Esta fase é
caracterizada pelo desgaste do componente, corrosão, fadiga, trincas, deterioração
mecânica, elétrica ou química, manutenção insuficiente entre outros. Para produzir
produtos com vida útil mais prolongada, deve-se atentar para o projeto, utilizando
materiais e componentes mais duráveis, um plano de inspeção e manutenção que
detecte que iniciou a mortalidade senil e a previna, por substituição preventiva de
itens, e supressão dos agentes nocivos presentes no meio. Ainda, segundo Sellitto
(2005), neste período, a melhor estratégia de manutenção é a preventiva, ou seja, já
que o equipamento irá falhar, cabe à manutenção aproveitar a melhor oportunidade
para substituir ou reformar o item.
O término da vida útil, sob o ponto de vista da confiabilidade, que ocorre
quando o item ingressa no período de mortalidade senil, não deve ser confundido
29
com sua obsolescência do ponto de vista mercadológico ou produtivo. Nesta, o item
é substituído por haver desaparecido o valor atribuído à função que desempenha.
Na fase da mortalidade senil, a substituição ocorre por queda na confiabilidade do
item em produzir o valor que dele se espera. Siqueira (2005) distingue vida segura
de vida econômica. Naquela, o item opera até que a probabilidade de falha
ultrapasse um patamar de segurança. No período de mortalidade senil, o item opera
enquanto a função que desempenha continua sendo necessária.
Siqueira (2005) comenta que sistemas industriais evoluem na curva da
banheira segundo várias características. Lafraia (2001) ressalta que pode não existir
alguma das fases, passando-se, por exemplo, da mortalidade infantil para a senil,
diretamente. Este é o caso da pesquisa com embreagens, relatada em Sellitto,
Borchardt e Araújo (2002). Sistemas eletrônicos geralmente apresentam mortalidade
infantil e depois apenas falhas aleatórias, estacionando na parte baixa da curva. Tal
região é dita sem memória de falha (failure memoryless), pois a incidência de uma
falha no tempo t não tem correlação com o tempo até a próxima falha. Em softwares,
as falhas de programação geralmente têm apenas mortalidade infantil, pois uma vez
corrigidas, é impossível a reincidência, pois não se originam de processos
dissipativos de energia.
2.1.3.4 Tempo Médio Entre Falhas (MTBF)
Predições de confiabilidade podem ser utilizadas para estimar as taxas de
falhas de um produto ou o MTBF de um determinado sistema, ou produto. O MTBF é
normalmente expresso por horas. Por exemplo, se o MTBF de um sistema é de 1000
horas, isso significa que o sistema, ou produto, na média, irá apresentar uma falha
em 1000 horas de operação.
Segundo Pasetto (2002), o MTBF deve ser usado quando a função de
distribuição de falhas é especificada, porque o nível de confiabilidade indicado pelo
MTBF depende do tipo da distribuição de falhas. Isso significa que dois produtos
com o mesmo MTBF podem ter níveis de confiabilidade diferentes se a distribuição
de falhas dos mesmos também for. Existem padrões aceitos na indústria para a
modelagem das taxas de falhas de componentes que podem ajudar a estimar a taxa
de falha de um sistema ou seu MTBF. O objetivo é garantir que o MTBF projetado
esteja sempre dentro dos limites aceitáveis pelo mercado.
30
Além do MTBF outro método também pode ser utilizado para quantificar a
confiabilidade de um sistema ou produto, o MTTF (Mean Time To Failure - tempo
médio até a falha) pode ser utilizado. A diferença esta no tipo de sistema, para
sistemas que podem ser reparados utiliza-se o MTBF, já para sistemas que não
podem ser reparados utiliza-se o MTTF.
2.1.4 Censura
Nos estudos de análise confiabilidade são comuns situações em que o
experimento termina antes que todos os equipamentos, ou produtos, venham a
falhar.
Uma característica marcante destes estudos é a presença de observações
incompletas ou parciais dos tempos de falha dos produtos observados. Dessa forma
existe a necessidade de introduzir uma variável dicotômica na análise que indique se
o valor do tempo de sobrevida para um determinado produto foi ou não observado
até a sua falha. Essa variável é conhecida na literatura como variável indicadora de
censura, e é definida como sendo igual a um, se o tempo de sobrevida é observado,
e igual a zero, caso o tempo de sobrevida seja censurado antes da falha acontecer.
É importante ressaltar que, mesmo censurados, todos os resultados
provenientes do estudo de sobrevivência devem ser usados na análise estatística,
pois a omissão das censuras no cálculo das estatísticas de interesse poderá
acarretar em conclusões viciadas.
A censura pode ser de três tipos:
• Censura por tempo ou do tipo I: o teste termina após um período pré-
estabelecido de tempo;
• Censura por falha ou do tipo II: o teste termina após ter ocorrido
falha em um número pré-determinado de itens sob teste.
• Censura do tipo aleatório: o item é retirado do teste antes de ocorrer
a falha; é o caso do item falhar por uma causa diferente da que foi definida.
31
A Figura 5 ilustra exemplos dos tipos de censura.
FIGURA 5 – Tipos de censura FONTE: Adaptado de Colossimo (2006).
2.1.5 Função de confiabilidade
Definição: A função de confiabilidade é definida como a probabilidade de um
produto funcionar sem falhar até um dado tempo t (Chaves Neto, 2010).
Esta é a principal função probabilística usada para descrever dados de
durabilidade e, expressando o tempo até falhar como a variável aleatória T, sua
expressão é dada por:
)()( tTPtR (2.2)
2.1.5.1 Definição matemática da confiabilidade
Segundo Bergamo (1997), duas funções são muito utilizadas para descrever
uma variável aleatória continua x. São elas: a função de distribuição acumulada (fda)
e a função densidade de probabilidade (fdp).
32
A fda indica a probabilidade de que X tenha um valor menor ou igual a x, ou
seja:
( ) ( )F x P X x (2.3)
Já a fdp indica a probabilidade de que X esteja compreendido entre x e
x x à medida que x se torne pequeno, logo:
( ) ( )f x P x X x x (2.4)
2.1.5.2 Funções básicas de confiabilidade
As quatro funções básicas em estudos de confiabilidade, adaptadas de
Fritsch (1996) e Ribeiro (2003) são:
Função densidade de probabilidade de falha )(xf ;
Função Acumulada de falha )(tF : Probabilidade de falha até o tempo
t ;
Função de confiabilidade )(tR : Probabilidade de sucesso além do
tempo t ;
Taxa de risco – )(th : Taxa de falha dos sobreviventes no tempo t .
Onde as funções se relacionam conforme as equações a seguir:
t
dxxftF0
)()( (2.5)
)(1)( tFtR (2.6)
dt
tdR
dt
tdFtf
)()()(
(2.7)
)(
)()(
tR
tfth (2.8)
33
Assim supondo que n0 componentes idênticos sejam testados e que ao final
do tempo de teste t, nf(t) componentes falharam e ns(t) componentes sobreviveram,
as funções básicas da confiabilidade podem ser estimadas, para estes valores
hipotéticos como:
0
)()(ˆ
n
tntF
f (2.9)
0
)()(ˆ
n
tntR s (2.10)
tn
tntf
f
0
)()(ˆ (2.11)
ttn
tnth
s
f
)(
)()(ˆ (2.12)
A Figura 6 apresenta as representações hipotéticas para as quatro funções
básicas da confiabilidade apresentadas anteriormente.
FIGURA 6 – Quatro funções básicas da confiabilidade Fonte: Dillenburg (2005)
34
A Figura 7 apresenta o gráfico de duas funções de confiabilidade,
tetR 1.01 )(
e tetR 025.02 )( . Uma para o tempo de falha modelado pela
distribuição exponencial com parâmetro 1/10 (curva 1) e outra com 1/ 40
(curva 2).
FIGURA 7 – Funções de confiabilidade )(1 tR e )(2 tR
FONTE: Chaves Neto (2010).
2.1.6 Função de Taxa de Falha
A probabilidade de um produto falhar no intervalo de tempo ),[ 21 tt pode ser
calculada pela sua função de confiabilidade dada por:
2
1
)()()(),[ 1221
t
t
tRtRdttfttP (2.13)
E, de uma forma geral, redefinindo o intervalo como ),[ ttt tem-se a taxa
de falha dada por:
)(
)()()()(
ttR
ttRtRtth
(2.14)
35
E, ainda, quanto 0t , )()( tth representará a taxa de falha
instantânea:
)(1
)(
)(
)()()(
tF
tf
tR
tftth
(2.15)
Na Tabela 1, são apresentadas as funções de risco, de densidade de
probabilidade e de confiabilidade dos principais modelos utilizados em estudos de
confiabilidade em Engenharia. A Tabela 1 foi baseada em Elsayed (1996) e Leemis
(1995).
TABELA 1 – EQUAÇÕES DAS FUNÇÕES )(tf , )(tR E )(th PARA DIFERENTES
MODELOS DE PROBABILIDADE
Modelos )(th )(tf )(tR Parâmetros
Constante te te
Linear crescente
t
2
2t
te
2
2t
e
Weibull 1
t
t
et
1
t
e
,
Exponencial tbe )1( teb
tebe
)1(
teb
e
b,
Normal
)(tR
t
2ln
2
1
2
1
t
et
1 ,
Lognormal
)(
ln
tRt
t
2ln
2
1
2
1
t
et
t
de
0
2
ln
2
11
,
Gamma
)(
)(
tR
tf
t
et
)(
1
t
de
1
)(.
1
,
FONTE: Adaptado de Elsayed (1996) e Leemis (1995).
As funções básicas da confiabilidade possuem uma peculiaridade, uma pode
ser derivada da, ou das, outras funções.
Pode-se perceber que a função de confiabilidade representa o complemento
da função acumulada de falha, de maneira que, enquanto a primeira mostra a
36
quantidade de itens sobreviventes com o tempo, a segunda mostra a quantidade de
itens que falharam nesse mesmo período de tempo. Mas não são apenas essas
duas funções que se relacionam entre si.
Guzzon (2009) comenta que existem relações entre as funções acumulada
de falha, densidade de falha, confiabilidade e de risco, que estão listadas na Tabela
2.
TABELA 2 – RELAÇÕES ENTRE AS FUNÇÕES )(tF , )(tf , )(tR E )(th
)(tF )(tf )(tR )(th
)(tF _
t
duuf0
)(
duuh )(exp1
)(tf
dt
tdF )(
_
dt
tdR )(
t
duuhth0
)(exp)(
)(tR )(1 tF
tduuf )(
_
t
duuh0
)(exp
)(th )(1
)(tF
dt
tdF
tduuftf )()(
dt
tRd )(ln
_
FONTE: Adaptado de Leemis (1995).
2.2 TESTES ACELERADOS
As indústrias, hoje em dia, para se manter nos mercados que são altamente
competitivos devem planejar e desenvolver produtos novos que atendam às
expectativas dos consumidores. Assim, devem criar ou aplicar técnicas mais
avançadas, em um tempo cada vez menor e, também, manter os esforços de
melhoria da produtividade e da confiabilidade.
A escassez de dados é uma característica comumente encontrada quando
se avalia a confiabilidade de um equipamento, ou produto. Os métodos tradicionais
de avaliação da confiabilidade envolvem a análise de dados de falha de um
equipamento em suas condições de uso. Tais métodos, baseados em sua grande
maioria em estimadores de máxima verossimilhança, exigem grandes amostras de
dados de falha, as quais são muitas vezes difíceis, se não impossíveis, de serem
obtidas.
A dificuldade em obter dados consideráveis de falha sob as condições
normais (nominais) de uso é principalmente encontrada em equipamentos altamente
confiáveis, os quais executam suas funções de forma bem sucedida por longos
períodos de tempo, tais como anos. Entretanto, mesmo para tais equipamentos uma
37
avaliação da confiabilidade precisa ser realizada principalmente se exigem grandes
investimentos em seu projeto de desenvolvimento.
Os produtos em desenvolvimento possuem uma dificuldade intrínseca na
obtenção de dados de falha. Porém, uma empresa, ou indústria, para se tornar ou se
manter competitiva deve superar essa limitação e avaliar o impacto (efeito) que
modificações no projeto do produto implicam na confiabilidade do mesmo.
Assim, há necessidade de se obter informações sobre o desempenho dos
produtos. Essas informações sobre o desempenho dos produtos podem ser obtidas
em duas fontes: dados de campo (assistência técnica e teste de mercado, antes do
lançamento) e dados experimentais (laboratório). No caso do teste de campo, certo
número de produtos é repassado a uma amostra de consumidores e o desempenho
desses produtos é acompanhado durante certo intervalo de tempo. Mas, nesse caso
do teste de mercado, ocorre de existir produtos projetados para funcionar anos sem
falhar. Então, é muito demorado acompanhar o desempenho junto à amostra de
consumidores. Então, o que se faz é obter dados experimentais em laboratório em
testes acelerados.
2.2.1 Tipos de Testes Acelerados
Os testes acelerados podem ser classificados em dois tipos dependendo da
característica dos dados coletados no teste.
1º. Tipo: Testes de Vida Acelerados;
2º. Tipo: Testes de Degradação Acelerados.
No primeiro caso (Testes de Vida Acelerados) estão os testes em que a
resposta é o tempo até a ocorrência da falha. Pretende-se usar os dados para
estimar o MTTF, a função de Confiabilidade )(tR e a função de Taxa de Falhas ( )t .
Os resultados dos testes são projetados para o tempo real, por meio de uma
equação de regressão.
Já no caso dos Testes de Degradação Acelerados a resposta de interesse é
alguma medida do desempenho do produto. Neste caso a resposta pode ser a
oxidação do produto, resistência à tração, etc. Essa medida do desempenho é
obtida ao longo do tempo.
Em ambos os testes há necessidade de se definir o fator estressante. Este
fator é utilizado no teste em um nível superior ao nível considerado normal.
38
Pode ser:
• Temperatura;
Exemplo 1
Em memórias de computador tipo RAM (Random Access Memory) o
desempenho do produto é medido pelo tempo de acesso e a falha seria um tempo
superior a um limite definido. Então, nesse caso, o fator estressante poderia ser a
temperatura.
Exemplo 2
Suponha um produto alimentício, por exemplo, leite, que deve ser mantido
refrigerado. O fator estressante é novamente a temperatura. No teste as unidades
do produto são mantidas em temperatura superior à indicada e conta-se o número
de microorganismos que surgem no produto. Nesse caso, a resposta de interesse é
o número de microorganismos presente no alimento ao longo de um período
determinado. E, é claro, a falha seria um número de microorganismos superior a um
valor especificado. Essa é a forma de se definir o tempo de validade do produto.
• Tensão.
Exemplo 3
No caso da memória RAM a voltagem nominal geralmente é de 5 V. Então,
um modo de estressar o produto e, conseqüentemente, degradá-lo é elevar o nível
de tensão.
O teste pode ser acelerado de dois modos:
1º. Aumentando a taxa de uso.
Nesse caso o fator de estresse é o uso. Então, deve-se elevar a taxa de uso
do produto. Isto pode ser feito de duas maneiras:
1ª. Com velocidade mais alta
Ex. 1 – um motor funcionando com velocidade mais alta do que funcionaria
normalmente.
2ª. Redução do tempo de parada
Ex. 2 – no mecanismo do vidro da porta do veículo deixa-se o produto
funcionando por um número muito maior do que seria em condições normais.
Ex. 3 – Cafeteira elétrica, normalmente ela faz café umas quatro vezes por
dia; então, o que se faz é construir um dispositivo para fazê-la funcionar um número
muito grande de vezes por dia.
39
2º. Aceleração por altos níveis de estresse.
Nesse caso, o produto é submetido a vários níveis de estresse para encurtar
o seu tempo de vida ou degradar o seu desempenho.
2.3 ANÁLISE DOS EFEITOS E MODOS DE FALHA (FMEA)
A Análise dos Efeitos e Modos de Falha (FMEA: Failure Modes and Effects
Analysis – análise dos efeitos e modos de falha) é uma técnica de engenharia
estruturada, indutiva, lógica e progressiva, utilizada com o intuito de definir,
identificar, antecipar e eliminar falhas conhecidas e/ou potenciais do sistema,
produto, projeto, processo e serviço antes que estes cheguem ao consumidor.
Análises semelhantes à FMEA são utilizadas há muitos anos. Formalmente, a
FMEA, foi desenvolvida pela NASA (National Aeronautics and Space Administration
- Administração Nacional do Espaço e da Aeronáutica), em 1963. Porém, somente
após 1977 passou a ser mais comumente utilizada. Isto ocorreu quando a Ford
Motors Company começou a empregar essa técnica na indústria automobilística.
Mas apenas no ano 2000, a Sociedade dos Engenheiros Automotivos (SAE –
Society Automotive Enginners) publicou os procedimentos especializados de FMEA
para a indústria automotiva (Gilchrist, 1993; Hecht, 2003).
A FMEA é essencialmente utilizada para estudar as falhas que ocorrem em
materiais e equipamentos, podendo ser também aplicada a uma ampla escala de
tecnologias (como, por exemplo, em softwares). Foi inicialmente concebida para ser
aplicada durante as fases de desenvolvimento de um produto ou de um serviço
(quando está sendo definido e projetado) e quando a produção está sendo
planejada. Depois, passou a ser usada, também, no projeto de sistemas e nas
demais fases do ciclo de vida do produto e/ou processo. Quando utilizada na fase do
projeto, tem o objetivo de identificar, antecipadamente, todos os modos de falha
catastróficos ou críticos para que sejam eliminados ou minimizados no estagio inicial
do desenvolvimento do sistema, evitando-se assim custos com mudanças,
adaptações ou retrabalhos em estágios posteriores. Outros objetivos da FMEA são:
aumentar as atividades com foco no cliente, usar o conhecimento técnico de uma
equipe multifuncional, dar suporte para a melhoria contínua, aperfeiçoar as lições
40
aprendidas (através de documentação) e utilizar as melhores práticas da engenharia
simultânea (Gilchrist, 1993; Lafraia, 2001).
Para uma aplicação mais vantajosa, ou mais eficaz, as atividades da FMEA
devem ser planejadas desde o princípio do processo de desenvolvimento dos
produtos e dos processos, e sua elaboração deve ser iniciada o mais cedo possível,
mesmo que nem todos os fatos ou informações sejam ainda conhecidos. Assim, o
melhor momento para iniciar uma FMEA é tão logo alguma informação esteja
disponível. Após seu início, a FMEA deve ser constantemente atualizada conforme a
disponibilidade das informações, o que caracteriza seu dinamismo. A FMEA apenas
pode ser considerada completa ou terminada quando o sistema, projeto, produto,
processo ou serviço é considerado completo e/ou descontínuo. Pode ser, no
entanto, reaberta para revisão, avaliação e/ou melhoria a qualquer momento
(Stamatis, 1996).
Em seu livro Rozenfeld et al. (2006) dividem a macrofase de
desenvolvimento de produtos em cinco subfases, iniciando pelo projeto
informacional e seguindo para o projeto conceitual, projeto detalhado, preparação da
produção do produto até o lançamento do produto. Esses autores consideram que o
melhor momento para a aplicação da FMEA ocorre depois da atividade de
detalhamento do sistema, subsistemas ou componentes, na fase do projeto
detalhado. Quando utilizada antes disso, na fase de projeto conceitual, pode
deparar-se com o problema de falta de documentação detalhada e, assim, algumas
falhas potenciais podem passar despercebidas pela análise.
Apesar desse inconveniente, Andrade (Zardo, Forcellini, 2005) propõem que
a FMEA pode perfeitamente ser utilizada já na etapa conceitual do produto,
tornando-se assim um instrumento de auxílio à seleção de concepções e não
somente um mero instrumento de otimização. Para esses autores, a utilização da
FMEA nessa etapa possui a vantagem de possibilitar a detecção de problemas mais
cedo e, assim, resolve-los com menor custo possível, e talvez, com mais rapidez.
Para se aplicar uma FMEA eficientemente, segundo Stamatis (1995) é
necessário seguir oito passos sistemáticos: definir a finalidade ou as expectativas da
avaliação e selecionar a equipe, fazer um diagrama de blocos funcionais (FMEA de
sistema e de projeto) ou um fluxograma de processo (FMEA de processo e de
serviço), dar prioridades, coletar dados, analisar, apresentar resultados, confirmar e
avaliar os resultados e realizar tudo novamente.
41
Assim, a FMEA é capaz de identificar muitas exigências especificadas e não
especificadas do consumidor que se relacionam com o projeto do produto, seu uso,
como as falhas podem ocorrer, a severidade de tais falhas, assim como a
probabilidade de sua ocorrência. A Figura 8 apresenta o procedimento geral para se
realizar a FMEA, que normalmente é feita em duas fases. A primeira fase consiste
em coletar as informações funcionais dos componentes e processo alvo da analise.
Técnicas básicas como sessões de brainstorming e diagramas de causa-efeito,
podem ser utilizados para determinar a relação entre modos potenciais de falha,
seus efeitos e as causas relacionadas a esses modos de falha para cada função
analisada. Com tais informações estima-se a severidade dos efeitos das falhas, a
probabilidade de ocorrência da causa das falhas e de detecção dessas antes de sua
ocorrência, tendo em vista as atividades planejadas de validação, verificação e
prevenção. E assim, pode calcular-se o valor do RPN (risk priority number)
(Stamatis, 1996; Teng; Ho, 1996).
A segunda fase começa quando o valor do RPN ultrapassa o valor desejado
e, por isso, ações corretivas ou alterações do projeto são requeridas. As ações
corretivas visam à diminuição da probabilidade da não detecção do modo de falha,
enquanto as alterações no projeto buscam reduzir a severidade das falhas e a
probabilidade de sua ocorrência, sendo esta alternativa utilizada para modos de
falha que possuem um alto risco associado a sua ocorrência. Após, realiza-se nova
análise dos modos e efeitos de falha, a fim de verificar se o RPN sofreu a redução
desejada. Ao final do processo, um relatório deve ser gerado e as modificações
requeridas devem estar completas, de modo a reduzir ao mínimo o número de
modos potenciais de falhas. Todas essas informações coletadas são melhores
analisadas quando dispostas em forma de tabela (formulário), conforme a Figura 9
(Teng; Ho, 1996).
42
FIGURA 8 – Procedimento geral de FMEA FONTE: Adaptado de Teng e Ho (1996).
FIGURA 9 – Formulário FMEA FONTE: Adaptado de Stamatis (1995).
O ideal é que a informação contida no relatório da FMEA sirva como base
para o controle estatístico do processo, uma vez que gera planos de controle. Em
um plano de controle, a detecção de cada uma das falhas de interesse e seu método
Coletar informações sobre
funções do componente e sistema
Determinar modos
de falhas potenciais
Checar os efeitos
de cada falha
Determinar as causas
de cada falha
Listar controles
atuais do processo
Determinar o ranking
de detecção
Calcular RPN
Determinar
ranking de
ocorrência
Determinar o
ranking de
severidade
Correção
necessária?
Recomendar
ações corretivas
Modificações
Relatório FMEA
Item
Fu
nção
Efeitos
potenciais
de falha
Modos potenciais de falha
Severidade
(S)
Causas
potenciais
de falhas
Ação
recomendada
Indivíduo ou área
responsável pela
execução
Ação
tomada
Ocorrência
(O)
Métodos
de
detecção
Detecção
(D)
D
RPN
O S
Resultados da ação
PRIMEIRA FASE
RPN
SEGUNDA FASE
43
de detecção devem ser listados, bem como deve ser realizado o controle do
processo, a fim de minimizar a ocorrência de tais falhas. O plano de controle gera
também informações sobre a frequência de amostragens e métodos de medição
(Teng e Ho, 1996).
2.4 TÉCNICAS NÃO-PARAMÉTRICAS
2.4.1 Estimação na ausência e presença de censura
A estimação da função taxa de falha é difícil em termos não-paramétricos.
Essa dificuldade é a mesma de se estimar a função de densidade. Alguns textos
apresentam uma estimativa para esta função como sendo a variação da função de
taxa de falha acumulada. Entretanto, esta estimativa não é boa o suficiente,
principalmente para amostras pequenas. Para estimar a taxa de falha na ausência
de censura utiliza-se o histograma da distribuição aproximada do tempo de falha,
assim divide-se o número de itens que falharam em um determinado intervalo pelo
número de itens em operação até o tempo que corresponde ao início do intervalo. A
estimação da função de confiabilidade na ausência de censura também é feita
empiricamente a partir do histograma da distribuição aproximada do tempo de falha.
Neste caso divide-se o número de itens que ainda não falharam até determinado
intervalo pelo número de itens total inicial. O mesmo procedimento pode ser
realizado com relação à mantenabilidade considerando-se o histograma da
distribuição aproximada do tempo de reparo (Carvalho, 2008).
A Figura 10 mostra distribuição aproximada dos tempos de falha para os
dados não-censurados. O histograma foi obtido a partir de uma amostra de dados de
falha simulados pelo gerador implementado, com um total de 10 categorias de
tempos de falha, não censurada e um total de 25 itens, onde os tempos são dados
em anos.
44
FIGURA 10 – Histograma da Distribuição de frequências dos tempos de falha por ano FONTE: O autor (2011).
Uma estimativa para a taxa de falha no período compreendido entre 5 e 6
anos, é dada por:
5
65)6,5(ˆ
tatéoperaçãoemscomponentedenúmero
anoseentrefalhasdenúmerosh (2.16)
0,2777818
5
)725(
5)6,5(ˆ
h
Assim, a taxa de falha é de 27,8% durante o período de 1 ano,
compreendido entre 5 e 6 anos, ou seja, um componente que não falhou após 5
anos de uso tem uma probabilidade de 0,27778, ou seja 27,8%, de vir a falhar no
intervalo do 5º ao 6 º ano.
Já para a Função de Confiabilidade no tempo 5t anos, é estimada por:
0,7225
185)5(ˆ
testesobscomponentedenúmero
ttempooatéoperaçãoemscomponentedenúmeroR
Isso significa que 72% desses componentes duram mais que 5 anos. A
estimação da Função de Confiabilidade na presença de censura pode ser feita
através da Tabela de vida (Método Atuarial) ou o Estimador de Kaplan-Meier (Limite-
45
Produto). O estimador de Kaplan-Meier é uma adaptação da função de
confiabilidade empírica, e será definido na secção 2.4.2.
2.4.2 Estimador de Kaplan-Meier
O estimador de Kaplan-Meier, ou estimador limite-produto, é um estimador
não-paramétrico para a função de confiabilidade. O estimador utiliza os conceitos de
independência de eventos e de probabilidade condicional para desdobrar a condição
sobreviver até o tempo t em uma sequência de elementos independentes que
caracterizam a sobrevivência em cada intervalo de tempo anterior a t e cuja
probabilidade é condicional aos que estão em risco em cada período.
A expressão estimador limite-produto refere-se ao fato de que a
probabilidade de sobrevida até a data especificada é estimada considerando-se que
a sobrevivência até cada tempo é independente da sobrevivência até outros tempos,
e, em consequência, a probabilidade de se chegar até o tempo t é o produto da
probabilidade de se chegar até cada um dos tempos anteriores.
Por se tratar de um estimador não-paramétrico assintótico, a veracidade das
suas estimativas está garantida apenas para amostras de falhas e tempos de falhas
extensas. Sendo assim as estimativas calculadas pelo estimador de Kaplan-Meier
ficam mais próximas dos valores reais da confiabilidade conforme o crescimento da
amostra utilizada, caso a amostra seja grande, as estimativas tendem para os
valores reais da confiabilidade.
Sua vantagem em relação às funções paramétricas de confiabilidade é que o
estimador quando aplicado a amostras com algum tipo de censura tem um
desempenho satisfatório, sendo que para funções paramétricas este cálculo é de
difícil aplicação.
Pereira (2003) compara o estimador de Kaplan-Meier e o de Nelson-Aalen,
que também é um estimador não-paramétrico assintótico da função de
confiabilidade, mostrou que o estimador de Kaplan-Meier é mais preciso que o
estimador de Nelson-Aalen (Carvalho, 2005), com uma aproximação de 3 casas
decimais, quando se compara os valores da função de confiabilidade paramétrica
utilizada.
O estimador pode ser utilizado em varias áreas da ciência moderna, na
pesquisa médica, pode ser utilizado para medir a fração de pacientes que vivem em
46
um determinado período de tempo após o tratamento de sua doença. Um
economista pode medir o comprimento de tempo que as pessoas permanecem
desempregadas após uma perda do seu emprego. Um engenheiro pode medir o
tempo até a falha de peças de máquinas. Um ecologista pode usá-lo para estimar
quanto tempo frutos carnosos permanecem nas plantas antes de serem removidos
por frutívoros.
Quando não há censura pode ser definido por:
testeemitensdenº
tmomentooatéoperaçãoemitensdentR
º)(ˆ (2.17)
Esse estimador é obtido da seguinte forma: suponha que existam n itens sob
teste e nk falhas distintas nos tempos kttt ...21 . Pode ocorrer mais de uma
falha ao mesmo tempo, o que é chamado de empate.
O estimador da função de confiabilidade, para amostras censuradas ou não:
n
nn
n
dn
n
dn
n
dntR
2
22
1
11)(ˆ (2.18)
onde
id é o número de falhas no tempo it ;
in é o número de itens sob risco (em teste) no tempo it ;
nt é o maior tempo de falha menor que t.
Sua variância é calculada a partir da fórmula de Greenwood.
,)(
...)()(
)(ˆ)](ˆ[ˆ
222
2
111
12
nnn
n
dnn
d
dnn
d
dnn
dtRtRV (2.19)
onde
id é o número de falhas no tempo it ;
in é o número de itens sob risco (em teste) no tempo it ;
nt é o maior tempo de falha menor que t.
47
E, o estimador do erro padrão dessa estatística, )](ˆ[ˆ tRV é:
)](ˆ[ˆ)](ˆ[ˆ tRVtRpe (2.20)
Seja, agora, o cálculo do Intervalo de Confiança para ( )R t em um tempo
fixado t . A solução é usar um pivô aproximado baseado no Teorema Central do
Limite. A expressão do pivô é:
).1,0(~)](ˆ[ˆ
)(ˆ)(
)](ˆ[ˆ
)(ˆ)(N
tRpe
tRtR
tRV
tRtR
(2.21)
Portanto, o intervalo de confiança de nível )1( é
.1)](ˆ[ˆ)(ˆ)()](ˆ[ˆ)(ˆ
21
21
tRpeztRtRtRpeztRP (2.22)
Quando se tem o valor real de )(tR próximo de um ou de zero (valores
extremos) pode acontecer do limite superior do intervalo ultrapassar o limite 1 ou do
limite inferior ser negativo. Então, deve-se construir um novo intervalo baseado na
transformação descrita a seguir.
Seja a estatística )(ˆ tU função de )(ˆ tR
)])(ˆln[ln()(ˆ tRtU (2.23)
Cuja variância é estimada por:
2
222111 ]}/)ln[(...]/)ln[(]/){ln[(
)²(ˆ/)](ˆ[ˆ)](ˆ[ˆ
nnn ndnndnndn
tRtRVtUV
(2.24)
48
e o erro padrão é dado por
)](ˆ[ˆ)](ˆ[ˆ tUVtUpe (2.25)
Logo o intervalo de nível )1( para )(tR é
.1)(ˆ)()]()(ˆ )](ˆ[ˆ.exp)](ˆ[ˆ.exp
tUpeztUpez tRtRtRtRP (2.26)
O exemplo a seguir apresenta uma amostra de tempos de falha de um teste
simulado, hipotético, feito com ventoinhas, além dos tempos de falha também
apresenta os valores da confiabilidade, do desvio padrão e intervalos de confiança
calculados pelo estimador de Kaplan-Meier. Neste exemplo a amostra sofreu
censura e os intervalos de confiança foram calculados para um limite de 95% de
segurança.
Exemplo: Uma válvula de acionamento da ventoinha é avaliada com relação ao
tempo de vida. O fabricante submete várias válvulas a testes onde seu funcionamento é
acelerado para obter informações sobre a confiabilidade do produto. Um tipo comum de
teste é aquele em que a válvula é colocada em um tanque de água que é aquecido e
resfriado, acelerando o funcionamento da válvula. Estima-se que 30000 ciclos (um ciclo
corresponde ao ato de abrir e fechar a válvula) equivalem a 10 anos de uso em condições
normais. Considere a situação onde um lote de 30 mecanismos novos foi colocado em teste.
O teste consiste em deixá-los em funcionamento por um período de até 50000 ciclos e
registrar, para cada mecanismo, o número de ciclos que ele completou até falhar. Após o
teste, 18 mecanismos haviam falhado antes de completar 50000 ciclos e os outros 12
continuavam funcionando. O número de ciclos até a falha para estes 18 mecanismos foram:
5626; 11223; 12128; 13566; 14922; 16513; 22138; 26791; 27144; 27847; 28613; 31225;
36229; 38590; 39580; 40278; 41325; 44540.
49
FIGURA 11 – Valores das estimativas da confiabilidade e limites de confiança FONTE: o autor (2011)
Estes resultados foram calculados a partir do programa Action®. Para os
três primeiros intervalos de confiança, o limite superior apresenta valores iguais a um
ou 100%, isso acontece por que o programa não faz o ajuste para limites de
intervalos mal condicionados, ele apenas trunca em 0 ou 1, dependendo do limite
que foi ultrapassado. No caso dos três primeiros limites superiores do intervalo de
confiança, cujos valores ultrapassaram o limite de 100%, não se encaixando nos
padrões reais de confiabilidade, ele os trunca em um. Assim o software não utiliza o
ajuste da equação (2.26).
FIGURA 12 – Confiabilidade Estimada FONTE: Chaves Neto (2010).
Tempo Número de
falhas Quantidade
em risco Confiabilidade Desvio padrão
Limite inferior
Limite superior
5626 1 30 0.96666666 0.03277306 0.90243263 1 11223 1 29 0.93333333 0.04554200 0.84407264 1 12128 1 28 0.9 0.05477225 0.79264835 1 13566 1 27 0.86666666 0.06206328 0.74502485 0.98830847 14922 1 26 0.83333333 0.06804138 0.69997467 0.96669199 16513 1 25 0.8 0.07302967 0.65686446 0.94313553 22138 1 24 0.76666666 0.07722022 0.61531780 0.91801552 26791 1 23 0.73333333 0.08073734 0.57509104 0.89157561 27144 1 22 0.7 0.08366600 0.53601764 0.86398235 27847 1 21 0.66666666 0.08606629 0.49797982 0.83535350 28613 1 20 0.63333333 0.08798148 0.46089280 0.80577386 31225 1 19 0.6 0.08944271 0.42469549 0.77530450 36229 1 18 0.56666666 0.09047201 0.38934477 0.74398855 38590 1 17 0.53333333 0.09108400 0.35481196 0.71185470 39580 1 16 0.5 0.09128709 0.32108058 0.67891941 40278 1 15 0.46666666 0.09108400 0.28814529 0.64518804 41325 1 14 0.43333333 0.09047201 0.25601144 0.61065522 44540 1 13 0.4 0.08944271 0.22469549 0.57530460
50
2.4.2.1 Kaplan-Meier com estratificação
Uma variante do estimador de Kaplan-Meier é o estimador com
estratificação, que leva em consideração peculiaridades dos objetos, ou indivíduos,
que estão sofrendo o estudo da confiabilidade, ou análise de sobrevivência.
Separando uma amostra em duas ou mais sub-amostras, onde cada produto
de cada sub-amostra possua as mesmas peculiaridades que os outros, obtendo
assim uma amostra mais homogênea possível.
A estratificação consiste em dividir o conjunto total de observações em
grupos distintos, de acordo com as covariáveis de interesse, e estimar as funções de
confiabilidade separadamente para cada grupo (ou estrato). Essa variante é usada
geralmente em estudos médicos, mas também pode ser utilizada quando se trabalha
com confiabilidade de produtos. Um dos motivos pelo qual se utiliza tanto em
estudos médicos, é que para análises de mortes de certas doenças, o sexo do
individuo pode importar, transformando assim a amostra, deixando ela menos
homogênea.
2.4.3 Testes para comparação de curvas de confiabilidade
A representação gráfica da estimativa de Kaplan-Meier com estratificação,
para a função de confiabilidade, sobrevivência, permite ter uma idéia do
comportamento das curvas de confiabilidade, nos respectivos grupos. No entanto,
para avaliar se existe uma diferença significativa entre as várias curvas deve-se
recorrer aos testes de hipóteses.
Existem vários testes não paramétricos adequados a esta comparação,
sendo o teste log-rank e o teste de Peto (Carvalho, 2005), para dois grupos, os mais
utilizados em análise de sobrevivência.
2.4.3.1 Teste log-rank
O teste de hipótese log-rank compara a distribuição da ocorrência dos
eventos observados em cada estrato (sub-amostra) com a distribuição que seria
esperada se a incidência fosse igual em todos os estratos. Caso a distribuição for
51
equivalente à distribuição esperada, então a curva de sobrevivência dos produtos
pertencentes ao estrato é equivalente à curva de sobrevivência dos produtos em
geral (a covariável não tem efeito na confiabilidade).
Para utilizar o teste, calcula-se a estatística em duas etapas: primeiro,
estima-se o número de eventos esperados para cada estrato k, segundo a hipótese
nula de incidência igual em todos os estratos. Esse número esperado será chamado
de )(tEk . Em seguida, calcula-se a estatística do teste. Esta estatística segue uma
distribuição 2 , com 1k graus de liberdade, quando a hipótese nula é verdadeira.
Assim, para calcular a distribuição esperada de eventos, o total de eventos
precisamente no tempo t , )(tN , é redistribuído pelos k estratos,
proporcionalmente ao número de itens presentes em cada estrato. Logo, tem-se:
)(
)()()(
tr
trtNtE k
k (2.27)
em que )(tN é o número total de eventos observados, )(trk é o número de itens em
risco no estrato k , )(tr é o número total de itens em risco no estudo, no tempo t .
Quando se possui apenas dois estratos, sub-amostras, a estatística log-rank
é calculada utilizando apenas os dados de um dos estratos. O resultado do teste
para um estrato se estende ao outro por simetria. Isto é, se o número esperado de
casos é maior do que o esperado para um estrato, isto implica que o número de
casos é menor do que o esperado para o outro estrato. Sendo 1E , e.g., o total de
eventos esperados no estrato 1 e 1O o total de eventos observados no estrato 1, a
estatística log-rank é calculada a partir da diferença entre o total de eventos
observados e o número total de eventos esperados:
11
2
11
EOVar
EOrankLog
(2.28)
que segue uma distribuição 2 com um grau de liberdade.
52
A variância, que entra no cálculo como um fator de padronização, tem a
fórmula (para 2k ):
.
t trtr
tNtrtNtrtrEOVar
]1)([)(
)]()()[()()(2
2111 (2.29)
Existem vários outros testes que ponderam as observações de acordo com a
importância que se deseja dar ao inicio ou ao fim do tempo de sobrevida. A
estatística Peto que será apresentado na secção 2.4.3.3, atribui maior ponderação
aos eventos ocorridos nos períodos iniciais da observação.
2.4.3.2 Teste de Gehan
O teste de Gehan Bastos (Joana e Cristina Rocha, 2007), ou teste de
Wilcoxon generalizado, baseia-se numa estatística semelhante à utilizada no teste
log-rank e que tem a seguinte formula:
)( 11 EOnGehan (2.30)
onde n é o número de itens em teste no tempo t .
Assim a diferença 11 EO é ponderada por n , atribuindo menos ponderação
as diferenças 11 EO correspondentes aos instantes onde o número total de
indivíduos em risco é pequeno, isto é, aos maiores tempos de sobrevivência.
A variância da estatística é dada por:
t trtr
tNtrtNtrtrnEOVar
]1)([)(
)]()()[().().(.2
2111 (2.31)
Como no teste log-rank, o teste de Gehan segue aproximadamente a
distribuição 2 com um grau de liberdade.
Bastos (Joana e Cristina Rocha, 2007) constatou que o teste de Gehan é
menos sensível do que o teste log-rank. Em seu trabalho Bastos conclui que o teste
53
log-rank é mais potente na detecção de afastamentos da hipótese de igualdade das
distribuições que sejam do tipo risco proporcionais. Quando funções se cruzam, o
teste log-rank pode não conseguir detectar diferenças significativas entre as curvas
do estimador de Kaplan-Meier, sendo melhor aplicar o teste de Gehan.
2.4.3.3 Teste Peto
O teste Peto (Carvalho, 2005) é uma modificação do teste log-rank que dá
maior peso ao perfil de sobrevivência de tempos menores, ou seja, às diferenças (ou
semelhanças), no inicio da curva. A justificativa para isso é que o inicio da curva
concentra a maior parte dos dados, e por isso é mais informativa. Esse maior peso
no inicio da curva é obtido pela inclusão de um fator de ponderação igual ao valor
estimado da confiabilidade )(tR no estimador log-rank. A forma da estatística de
Peto é:
11
2
11
EOVar
EOPeto
(2.32)
sendo que
it
iii tEtOtSEO ))()()(( 1111 (2.33)
Da mesma forma, a variância da estatística de Peto é igual à variância do
log-rank, onde a cada tempo é ponderado pelo quadrado da função de confiabilidade
- 2)( itR . Assim como a estatística log-rank, a estatística Peto segue
aproximadamente a distribuição 2 com 1k graus de liberdade.
54
2.5 TÉCNICAS COMPUTACIONALMTE INTENSIVAS
A computação intensiva veio proporcionar a estatística novas formas de
abordagem não-paramétrica para alguns problemas. Isto é feito com reamostragem
da amostra original e tem conquistado apoio como uma alternativa aos métodos
clássicos de inferência paramétrica.
A idéia da reamostragem surgiu em meados de 1935 (Silva, 2005),
entretanto a aplicação de tal técnica só foi possível com o advento de computadores
velozes e de computação não dispendiosa, uma vez que procedimentos de
reamostragem utilizam intensivamente o computador.
A reamostragem descarta a distribuição amostral assumida de uma
estatística e calcula uma distribuição empírica – da real distribuição da estatística,
com as informações da amostra original, ao longo de centenas ou milhares de
amostras. Com a reamostragem, não se tem que confiar na distribuição assumida
nem se tem que ser cuidadoso quanto à violação de suposições inerentes. Pode-se
calcular a real distribuição de estatísticas da amostra e pode-se obter o 95º ou o 99º
percentil da distribuição empírica construída.
Mas é necessário se conhecer a origem destas inúmeras amostras. É
necessário reunir amostras separadas, mas isso aumenta o custo de coleta de
dados. Ao longo dos anos, estatísticos desenvolveram diversos procedimentos para
criar estas múltiplas amostras necessárias para a reamostragem a partir de uma
amostra original inicial.
Assim, com esse procedimento pode-se gerar um grande número de outras
amostras que podem ser empregadas para gerar a distribuição amostral empírica de
uma estatística de interesse.
E com o aperfeiçoamento dos computadores, essas técnicas são hoje
completamente viáveis, sendo possível a aplicação rápida que vem ajudar a
dinâmica dos estudos científicos.
Essas técnicas baseadas nos novos e potentes computadores são
chamadas de técnicas computacionalmente intensivas, e duas delas, o método
Jackknife e o método bootstrap, são apresentados a seguir.
55
2.5.1 Método Jackknife
O antecessor ao método bootstrap foi o método Jackknife, que também é um
método computacionalmente intensivo não-paramétrico. O método foi criado
algumas dezenas de anos antes do método bootstrap, mas não recebeu tanta
atenção dos pesquisadores quanto o método bootstrap. Segundo Chaves Neto
(1991), a primeira abordagem feita do método Jackknife foi apresentada em 1949
por Maurice Quenouille (Quenouille, 1949), e que tem a proposta de reduzir o vício
de um estimador de correlação serial com base na divisão da amostra original em
duas semi-amostras. Posteriormente, em 1956, Quenouille completou o trabalho
com a generalização do método (Chaves, 1991). Tal como o bootstrap é um método
de reamostragem, pois se baseia na construção de sub-amostras geradas de uma
amostra original inicial.
Apesar de o método Jackknife ter sido ultrapassado, em termos de
utilização, pelo bootstrap como um eficiente estimador de medidas de variabilidade e
intervalos de confiança, ele continua como uma medida viável de observações
influentes (uma observação que exerce uma influência desproporcional sobre um ou
mais aspectos das estimativas e essa influência pode ser baseada em valores
extremos das variáveis) e uma opção para os pacotes estatísticos.
2.5.2 Obtenção da amostra Jackknife
Seja uma amostra original de tamanho n , ]'...,,,[ 21 nxxxx , o método
Jackknife consiste em gerar n novas amostras de tamanho 1n , sendo a i-ésima
nova amostra ( 1,..., )i n composta pelos valores da amostra original, com exceção
da i-ésima observação (Martinez, Sandanielo e Louzada Neto, 2006).
Logo, sendo ]'...,,,[ 21 nxxxx a uma amostra de v.a’s i.i.d., são geradas
amostras nxxxxx ,,,,' 432)1( , nxxxxx ,,,,' 431)2( , nxxxxx ,,,,' 421)3( , ...,
nnn xxxxxx ,,,,,' 2321)1( e ( ) 1 2 3 1' ( , , ..., ).n nx x x x x Em cada uma das novas
amostras geradas, estima-se o parâmetro de interesse , por ( )ˆ ( ), 1,2,...,i is x i n ,
que são as reamostras “Jackknife” da estatística que é o estimador do parâmetro.
Da amostra original x que já disponibilizou a estimativa original do parâmetro por
56
ˆ ( )s x , tem-se as n estimativas Jackknife do parâmetro, (.)
ˆˆ i
n
, chamada de
estimador Jackknife do parâmetro .
2.5.3 Método bootstrap
Como mencionado anteriormente o método bootstrap é considerado o
sucessor do método Jackknife, e recebeu mais atenção por parte dos estatísticos, se
tornando assim uma técnica poderosa, associada à solução de problemas de
estimação, nos quais os métodos clássicos sejam assintóticos ou não existam.
Dois tipos de métodos estatísticos são usualmente utilizados nos trabalhos
científicos. São eles: o paramétrico, quando se conhece o modelo de probabilidade
que pode ser identificado com os dados e o não-paramétrico, quando não se tem um
modelo probabilístico associado aos dados. Nesta dissertação o objetivo é aplicar o
método bootstrap a um estimador assintótico. O erro padrão da estimativa da
confiabilidade pelo método Kaplan-Meier.
O termo bootstrap paramétrico é utilizado quando se tem alguma suposição
da distribuição, por exemplo, a suposição de que a população segue uma
distribuição Weibull, ou ainda tem-se o conhecimento da distribuição amostral de
algum estimador e deseja-se obter a distribuição amostral de outro estimador que
depende do primeiro. Este método recebe uma breve abordagem a seguir.
Já o termo bootstrap não-paramétrico é utilizado quando não se tem
nenhuma suposição da distribuição do conjunto de dados, ou seja, a distribuição
amostral da qual os dados vieram é desconhecida.
Embora a técnica bootstrap seja teoricamente simples, deve-se ter
disponível um software para fazer a reamostragem. Os softwares, tais como: SPSS,
SAS e MINITAB, não têm um procedimento disponível para fazer a reamostragem,
entretanto pode-se programar procedimentos de reamostragem, ou utilizar
linguagens de programação de computadores para implementar o método, que é o
caso deste trabalho.
57
2.5.3.1 Método bootstrap não-paramétrico
2.5.3.1.1 Definição e propriedades
O bootstrap é uma técnica estatística computacionalmente intensiva não-
paramétrica que permite a avaliação da variabilidade de estatísticas com base nos
dados de uma amostra existente inicial. É indicado para problemas onde os
procedimentos estatísticos padrões não existam ou sejam de difícil aplicação. É
vantajoso se usado em problemas com amostra finita ou com amostra grande,
desde que forneça resultado semelhante ao método assintótico usual em grande
amostra e superior em amostra pequena (Chaves Neto, 1991).
O bootstrap surgiu quando Efron em 1979 (apud Chaves Neto, 1991)
estudava o problema da estimação da distribuição amostral de uma estatística
( , )nT x F com base nos dados da amostra de tamanho n , ]...,,,[ 21 nxxxx , de uma
distribuição de probabilidade desconhecida , ~ . . .iF X i i d F .
O procedimento bootstrap é feito a partir de uma amostra inicial
]...,,,[ 21 nxxxx criando-se B novas amostras, ou reamostras, com tamanho igual
ao da amostra inicial, com reposição dos valores. Então, calcula-se a estatística de
interesse para cada reamostra bootstrap. Estas amostras bootstrap são conhecidas
como pseudo-dados. Assim o conjunto de valores bootstrap da estatística
corresponde a uma estimativa da verdadeira distribuição amostral da estatística em
questão. Essa operação pode ser representada pelo seguinte esquema:
- seja o parâmetro e seu estimador a estatística ( , )nT x F , onde 1 2[ , ,..., ]nx x x x é a
amostra aleatória disponível da variável aleatória com função distribuição
desconhecida , ~ . . .iF X i i d F é:
Então:
1º) o estimador não-paramétrico de máxima verossimilhança )(ˆ xFn de F é:
)(ˆ xFn
n
i
i nxXI
1
/)( (2.34)
58
com )( xXI i sendo função indicadora. Assim esta distribuição empírica é
construída colocando-se massa probabilística n/1 em cada ponto amostral;
2º) de ˆnF toma-se B (muito grande) amostras bootstrap de mesmo tamanho n ,
* * * *
1 11 12 1[ , ,..., ]nx x x x *
1ˆ~i nX iid F
* * * *
2 21 22 2[ , ,..., ]nx x x x *
2ˆ~i nX iid F
. . . . . . . . . . . . . . . . . . . . . .
* * * *
1 2[ , ,..., ]B B B Bnx x x x * ˆ~Bi nX iid F
3º) calcula-se as B estatísticas bootstrap )(**ln xT com 1,2,...,l B , correspondentes
às B amostras bootstrap e forma-se o conjunto:
**{ ( ); 1,2,..., }lnT x l B (2.35)
que é uma simulação da verdadeira distribuição amostral da estatística ( , )nT x F .
Como o conjunto **{ ( ); 1,2,..., }lnT x l B pode-se obter a medida da
variabilidade de ( , )nT x F , como o seu erro-padrão bootstrap. A estimativa do vício da
estatística ( , )nT x F é dada por:
*[ , ( , )] ( , )n n nb T x F T x F T (2.36)
onde *
nT corresponde à estimativa bootstrap do parâmetro e que é dada por:
*
* 1[ ( )]
B
lnln
T xT
B
(2.37)
Na prática constrói-se a distribuição bootstrap, da estatística FxTn , , pelo
método de Monte-Carlo com um número de replicações, B , suficientemente grande.
59
Um indicador do tamanho adequado de B , independente do custo computacional, é
a qualidade da convergência da estimativa bootstrap do parâmetro para a estimativa
natural do parâmetro *( ( , ))n nBT T x F
. O fluxograma da Figura 13 apresenta o
algoritmo de construção da distribuição bootstrap.
FIGURA 13 – Algoritmo da distribuição bootstrap da estatística FxTn ,
FONTE: Chaves Neto (1991).
O procedimento descrito se aplica ao método bootstrap não-paramétrico. Ao
se optar pela utilização do método bootstrap paramétrico, procede-se da mesma
forma, com única diferença de que cada amostra bootstrap é obtida da distribuição
estimador não-paramétrico
)(ˆ tFn =
n
i
i nttI1
/)](
associado a amostra t
associado a amostra
amostra bootstrap de
]ˆ,...,ˆ,ˆ,ˆ[ˆ **
3
*
2
*
1
*'
nttttt
amostra original dos tempos
de falha ntttt ,,, 21
repete-se o processo
B vezes
distribuição bootstrap de
)(*
tTn que simula a
distribuição amostral de )(tTn
},...,3,2,1;)({*
BltT ln
cálculo da estatística bootstrap
)( *tTn
inicio
fim
60
paramétrica que originou os dados, amostras, que se possui, ao invés de
reamostrar-se as observações disponíveis.
A convergência do algoritmo, ou seja, do 3º passo com B tendendo para o
infinito esta assegurada pela Lei dos Grandes Números, pois **
1( )nT x , **
2( )nT x ,...,
**( )BnT x nada mais são do que uma amostra de v.a’s i.i.d. com a distribuição
condicional de ˆ( , ) |nT X F X x .
Portanto quando B tende para o infinito, a média amostral *
nT se aproxima
de ˆ[ ( , ) | ]nE T X F X x . Efron sugeriu que a distribuição condicional bootstrap de
ˆ( , ) |nT X F X x pode ser usada como a distribuição de xXFXTn |),( . Como se vê,
no procedimento bootstrap os pontos da amostra original ]'...,,,[ 21 nxxxx são
considerados como população com função de distribuição F e média x . A
estatística bootstrap * * ˆ( , )n nT T x F é considerada como um estimador de ( , )nT x F , e
ainda, a distribuição de * ˆ( , )nT x F pode ser usada para aproximar a distribuição
amostral desconhecida de ( , )nT x F . Logo, a distribuição de *( )n nT T n pode ser
usada para aproximar a distribuição amostral de ( )nT n . Da mesma forma que
no caso Jackknife, a normalidade assintótica de *( )n nT T n e a convergência em
probabilidade da variância bootstrap,
** *1( )² [ ( ) ]²
1in ns T x T
B
para ( )nV T foram investigadas e provadas por Bickel e Freedman em 1981.
Seja agora a amostra bootstrap **
xX obtida pelo esquema da Figura 14.
O número de vezes em que o ponto amostral ix é selecionado no procedimento é
denotado por:
*** # xXN i
61
Consequentemente, nNn
i i 1
* e o vetor **
2
*
1
*,...,, nNNNN , segundo
Chaves Neto (1991), tem distribuição multinominal. Ainda, vê-se que nnbN i 1,~* e,
em correspondência a estes números existe uma distribuição de freqüências
relativas nNf ii
* , sendo que if assume valores no conjunto nnnn ,,2,1,0 .
Segundo Chaves Neto (1991) a v.a. if possui a média igual a n1 e a variância igual
a 31 nn .
Por exemplo, seja o pivô iii snn /ˆ com distribuição t para os valores in
da estimativa de uma estatística qualquer, o intervalo de nível 1 para esse
parâmetro é:
iiii stnstn ).2/1(ˆ;).2/1(ˆ .
A estatística is é o estimador clássico, utilizado pelo estimador não-
paramétrico, do erro padrão de in . O número de graus de liberdade, , da
distribuição t é dado pela diferença entre o tamanho da amostra e o número de
parâmetros estimados. Pode-se conseguir um intervalo de confiança bootstrap para
o parâmetro simplesmente substituindo-se is pela estimativa bootstrap *
is dada por:
2
1
1
2*** ˆˆ1
n
l
iili nnB
s
onde *ˆiln é a estimativa bootstrap do parâmetro in na replicação l . Tem-se portanto:
** ).2/1(ˆ;).2/1(ˆiiii stnstn
que é o intervalo bootstrap simétrico de nível 1 para o parâmetro in .
Os intervalos de confiança, que são abordados com mais ênfase no capítulo
3, podem ser construídos com base em estatísticas bootstrap. O mais simples dos
intervalos bootstrap é o bootstrap-t, onde apenas se faz a substituição da estimativa
62
usual do erro padrão, pela estimativa bootstrap. Este e outros métodos de obtenção
de intervalos de confiança são abordados no capítulo 3, sendo separados em 4
classes ou métodos.
O bootstrap pode apresentar problemas se acontecer algum dos seguintes
casos, ou uma combinação deles:
O método boostrap é sensível ao comportamento das caudas da
distribuição F da população (valores muito discrepantes);
Para que o método seja consistente é necessário que a estatística (.)s
tenha certo grau de suavidade;
Às vezes a consistência do estimador bootstrap depende do método
usado para se obter os dados.
2.5.3.2 Método bootstrap paramétrico
Existem diferentes métodos para gerar amostras bootstrap. Um desses
métodos é o paramétrico. Esse método simula amostras de tamanho n a partir de
uma distribuição )ˆ|( tF , conhecida. Por exemplo, )ˆ|( tF pode ser a função
densidade da distribuição Normal com )ˆ,ˆ(ˆ 2 , em que e 2 são os
estimadores de máxima verossimilhança de e 2 , respectivamente. O bootstrap
paramétrico assume que (.)F é conhecida com um ou mais parâmetros
desconhecidos. Por exemplo, (.)F poderia ser conhecida, com distribuição Log-
Normal, sendo os parâmetros e 2 desconhecidos. Freqüentemente, os
parâmetros da (.)F são obtidos via método de máxima verossimilhança (Barros,
2005).
63
3. MATERIAL E MÉTODO
Conforme mencionado na introdução, o trabalho visa apresentar mais uma
aplicação do método computacionalmente intensivo bootstrap e assim encontrar
intervalos de confiança mais próximos da realidade para os valores da função de
confiabilidade, estimada pelo método de Kaplan-Meier. Além de apresentar o
método, também implementou-se o modelo computacional, fazendo sua validação. A
eficiência do modelo foi avaliada através de um comparativo dos intervalos de
confiança bootstrap com o do estimador assintótico. Os softwares utilizados para a
construção das análises foram: o Action-1.1 para comparar os valores das
estimativas dos valores da função de confiabilidade, MATLAB R2009a para a
plotagem dos gráficos dos intervalos de confiança e o compilador Microsoft Visual
Studio 2008, para o desenvolvimento dos programas da dissertação, em linguagem
Fortran 2003.
O material utilizado, amostras de tempos de falha, foi obtido de amostras
sintéticas, ou seja, amostras que foram geradas de um gerador de números
aleatórios de falhas, também implementado em linguagem Fortran 2003.
A linguagem Fortran 2003 foi escolhida por ser uma linguagem voltada para
programas matemáticos de engenharia. Inicialmente os métodos foram
implementados em linguagem C, mas como o método do bootstrap gera muitas
amostras, a execução dos programas em C ficavam muito demorados, e, às vezes
não foram possíveis os cálculos, quando o número de amostras era muito grande,
impondo algumas limitações e atrapalhando o desenvolvimento do trabalho.
Para as análises e implementações foi utilizado um notebook com
processador Intel® CoreTM i5 CPU M460 2.53GHz. Os tempos computacionais
diferem muito pouco de amostra para amostra, mas na média conseguiu uma marca
de 5 segundos para cada análise, calculada a partir do termino da entrada dos
dados até o retorno dos valores. Estes tempos variaram durante a elaboração e
refinamento do programa que calcula as aplicações. Para a primeira aplicação, onde
o programa ainda estava muito carregado com cálculos desnecessários, o tempo
computacional chegou à uma hora, e assim conforme os ajustes o tempo passou a
diminuir muito, chegando aos valores mencionados, proporcionando uma análise
eficaz e rápida para as amostras. É importante ressaltar que o tamanho da amostra
influencia o tempo computacional, mas ficaram evidenciados aumentos significativos
64
no tempo, acima de 30 segundos, para amostras com mais de 50 categorias de
tempos de falha. Caracterizando que para amostras até esta marca os tempos
computacionais ficaram praticamente iguais.
3.1 SEQUÊNCIA DA APLICAÇÃO DO MÉTODO BOOTSTRAP
A aplicação do método bootstrap segue a seguinte sequência:
Efetua-se o cálculo da estatística desejada para a amostra original
],,,[ 21'
nxxxx obtendo-se )(xTn ;
Após isso, inicia-se o método bootstrap construindo B novas amostras
bootstrap Bjx j ...,,2,1*
a partir da amostra inicial, com reposição. Assim, amostra-
se a amostra original tomando-se amostras com reposição de mesmo tamanho n . E,
tem-se B amostras bootstrap em cada categoria de tempo, ki ...,,2,1 ;
Terminada a construção das B reamostras, B geralmente grande, na
casa das 10000, calcula-se os valores da estatística para cada amostra bootstrap
Bjx j ...,,2,1*
, obtendo-se BjxT jji ...,,2,1)(** . E, isto é feito para cada um dos k
conjuntos de categorias de tempo de falha.
Calcula-se a média bootstrap de cada categoria de tempo, ki ...,,2,1 ;
Calcula-se o erro padrão bootstrap de cada categoria de tempo,
ki ...,,2,1 ;
Por fim, constrói-se os intervalos de confiança.
Seja o exemplo de uma aplicação:
Seja a amostra inicial ]'3,1,1,2,1[x de número de falhas para as categorias
5,,1t , para uma amostra com 30n produtos.
Assim construindo as B amostras bootstrap tem-se:
]'3,1,1,2,2[*
1 x , ]'3,1,2,1,1[*
2 x , ..., ]'2,1,2,1,3[*Bx , ]'1,1,2,3,1[
*Bx ;
]'73.0,083,87.0,90.0,97.0[)(ˆ xR ;
65
TABELA 3 – AMOSTRAS BOOTSTRAP OBTIDAS DA ORIGINAL
Categoria Nº de falhas para cada categoria
*
1x *
2x ... *
1Bx *
Bx
1t 2 1 ... 3 1
2t 2 1 ... 1 3
3t 1 2 ... 2 2
4t 1 1 ... 1 1
5t 3 3 ... 2 1
FONTE: O autor (2011).
TABELA 4 – ESTIMATIVAS BOOTSTRAP DA CONFIABILIDADE
Categoria Confiabilidade estimada para cada amostra bootstrap
*1 )(ˆ tR *
2 )(ˆ tR ... *1 )(ˆ tRB *)(ˆ tRB
1t 0.9333333 0.9666667 ... 0.9000000 0.9666667
2t 0.8666667 0.9333333 ... 0.8666667 0.8666667
3t 0.8333333 0.8666667 ... 0.8000000 0.8000000
4t 0.8000000 0.8333333 ... 0.7666667 0.7666667
5t 0.7000000 0.7333333 ... 0.7000000 0.7333333
FONTE: O autor (2011).
onde Bjx j ...,,2,1,*
são as amostras bootstrap das falhas para cada categoria de
tempo de falha, )(ˆ xR as estimativas da confiabilidade para a amostra original e
BjtR j ...,,2,1,)(ˆ * , a confiabilidade estimada para as amostras bootstrap.
Terminado esta etapa, é calculado a média
B
j
iji R
BR
1
** ˆ1 e o erro padrão
bootstrap, *ˆpe :
TABELA 5 - ESTATÍSTICAS BOOTSTRAP PARA CADA CATEGORIA DE TEMPOS DE FALHA
Categoria Média de cada categoria *iR Erro padrão bootstrap *ˆpe
1t 0.9665526 0.0299653
2t 0.9007625 0.0599207
3t 0.8674803 0.0552260
4t 0.8340740 0.0466594
5t 0.7331951 0.0600623
FONTE: O autor (2011).
66
TABELA 6 – INTERVALOS DE CONFIANÇA DE KAPLAN-MEIER E BOOTSTRAP
Categorias IC. Kaplan-Meier IC. bootstrap-t IC. bootstrap percentílico
1t 0.7860770 0.9952365 0.9646863 0.9685377 0.9333333 1.0000000
2t 0.7211880 0.9666077 0.8884074 0.9104497 0.8666667 1.0000000
3t 0.6827647 0.9477520 0.8526042 0.8794839 0.8333333 0.9666667
4t 0.6449564 0.9270071 0.8189096 0.8467180 0.8000000 0.9333333
5t 0.5369106 0.8566934 0.7054614 0.7590329 0.6666667 0.8333333
FONTE: O autor (2011).
Assim tem-se a aplicação do método a uma amostra de tempos de falha de
30n itens, com 5k categorias de tempos de falha, 8 falhas e 22 censuras.
3.2 ERRO PADRÃO BOOTSTRAP
Para calcular alguns tipos de intervalo de confiança bootstrap é necessário
calcular primeiramente o erro padrão bootstrap, já que é utilizado no lugar do erro
padrão da amostra original para o intervalo clássico do estimador de Kaplan-Meier,
na expressão do intervalo de confiança do estimador.
O erro padrão bootstrap é calculado para cada categoria de tempo de falha,
utilizando todas as B amostras bootstrap.
Sua expressão apenas depende dos valores da confiabilidade para cada
categoria de tempos de falha e a média de cada categoria:
Erro padrão bootstrap: ,ˆ1ˆ1
1ˆ
2***
ij
iji R
BR
Bpe
onde B é o número de amostras bootstrap e *ˆ i
jR é o valor da confiabilidade
estimada para cada ponto do vetor de categorias de tempos de falha, com ki ...,,1
e Bj ...,,1 .
67
3.3 INTERVALOS DE CONFIANÇA BOOTSTRAP
O método bootstrap, juntamente com o seu erro padrão, pode ser uma
técnica robusta na hora de construir um intervalo de confiança para as estimativas
da função de confiabilidade. Além do intervalo de confiança bootstrap convencional
existem vários outros métodos de cálculo do intervalo de confiança, que eliminam
alguns problemas que geralmente aparecem quando se trabalha com amostras
“estranhas”, ou seja, amostras que não tenham distribuições parecidas com a
distribuição normal.
A seguir apresentam-se os diferentes métodos de obtenção do intervalo de
confiança bootstrap, sendo eles o intervalo bootstrap-t, percentis bootstrap, ou
intervalo bootstrap percentílico, BCPB e o aBC , com estes dois últimos uma
adaptação do intervalo percentilico para casos especiais.
3.3.1 Intervalo bootstrap-t
O intervalo de confiança bootstrap-t é calculado da mesma maneira que o
intervalo de confiança do estimador de Kaplan-Meier, apenas substituindo o erro
padrão clássico do estimador de Kaplan-Meier pelo erro padrão bootstrap:
1)](ˆ[ˆ)(ˆ)()](ˆ[ˆ)(ˆ *
21
*
21
tRpeztRtRtRpeztRP
com n o tamanho da amostra original e *ˆpe é o erro padrão bootstrap da estatística.
Embora seja flexível e praticamente automático, o cálculo do intervalo de
confiança possui um problema que pode afetar a sua eficácia. O método funciona
bem quando a distribuição bootstrap da estatística é aproximadamente Gaussiana e
a estatística pouco viciada. Sendo respeitadas estas condições o intervalo de
confiança bootstrap-t pode ser calculado na estimação de vários parâmetros.
68
3.3.2 Intervalo de confiança baseado nos percentis bootstrap
Existem dois modos distintos de se calcular o intervalo percentílico bootstrap
para uma confiança de %100).1( :
a primeira forma é calcular o percentil %100).2
1( e o percentil
( 2)100% das estatísticas amostrais bootstrap e usá-los como os limites do
intervalo.
];[ *%10021
*%1002
* PPIC
a segunda é obter o intervalo de confiança percentílico utilizando a
técnica em estudo através dos percentis das diferenças dos valores das estatísticas
nas reamostras bootstrap com a sua média, isto em cada categoria de tempo de
falha.
Para um intervalo de confiança de um valor da função de confiabilidade
)(tR , calcula-se o valor das estatísticas para cada uma das B amostras bootstrap
*ˆ ijR e as médias das estimativas iR , Ki ...,,2,1 e Bj ...,,2,1 . Então encontra-
se para cada amostra bootstrap, Bj ...,,2,1 , a diferença entre o valor de cada
estimativa bootstrap *ˆ i
jR e a média de todas as estimativas bootstrap na categoria i :
iijj RR ˆˆ **
Após este cálculo, essas diferenças são ordenadas de forma crescente
assim obtendo-se B diferenças, podendo encontrar o percentil desejado para as
diferenças.
Para um intervalo de confiança de 95%, por exemplo, encontram-se os
percentis de 97,5% e 2,5% das diferenças e calcula-se o intervalo de confiança
bootstrap percentílico da seguinte forma:
%95])(ˆ)()(ˆ[ *%5.2
*%5,97 tRtRtRP
69
Efron (1986) afirmou que se a distribuição bootstrap não for
aproximadamente Gaussiana, mas existir uma transformação monotônica possível
que a torne Normal, pode-se calcular o intervalo de confiança bootstrap percentílico
para os dados transformados, e, posteriormente, desfazer a transformação para os
limites do intervalo encontrado. Para isso a transformação deve ser monotônica,
logo o intervalo de confiança bootstrap pelo método percentílico assim calculado terá
valores iguais ao intervalo de confiança bootstrap pelo método percentílico para os
dados não transformados. Caso o vício e a assimetria estejam presentes de forma
muito forte é mais recomendável a utilização dos métodos de correção como o
método BCPB e o método aBC .
3.3.3 Intervalo de Confiança Bootstrap BCPB
No método BCPB, os extremos são os percentis da distribuição bootstrap
ajustados para corrigir o vicio e a assimetria da distribuição.
Para encontrar um intervalo de confiança BCPB de 95%, por exemplo, é
preciso ajustar os percentis de um cálculo de intervalo de confiança percentílico
tradicional, que seriam, para um nível de 95%, os percentis 97,5% e 2,5%, para
valores que corrigiriam o vício e a assimetria. Se a estatística for viciada para cima, o
BCPB move os extremos para a esquerda e se for viciada para baixo move os
extremos para a direita.
Para realizar o calculo do intervalo BCPB, primeiramente deve-se ordenar as
B estimativas BjR j ...,,2,1ˆ * em forma crescente e calcular a probabilidade 0p de
uma estimativa ser inferior à estimativa da amostra mestre )ˆ(R :
]ˆˆ[ *
0 RRPp j
A partir do valor encontrado 0p é obtido o parâmetro de correção do vicio 0z
que representa a inversa da normal no ponto 0p , tal que:
)( 0
1
0 pz
70
O segundo passo é selecionar um nível %100).1( de confiança para a
estimativa do parâmetro a determinar 2z . Então é possível obter os percentis IP e
SP :
)2( 20 zzPI
)2( 20 zzPS
O Intervalo de Confiança, BCPB, é calculado da seguinte maneira:
)]ˆ();ˆ([ ***jPjPBCPB RPRPIC
SI .
3.3.4 Intervalos de confiança percentis aBC
O método de Correção de Vício Acelerado permite encontrar o intervalo de
confiança quando assimetria estiver presente de maneira forte. Esse método é
semelhante ao método BCPB, a diferença é o fato de o aBC possuir uma constante
de aceleração a que ajusta o intervalo de confiança em relação à assimetria.
Segundo Efron (1986), nesta situação este método é mais indicado que o método
BCPB.
O intervalo de Confiança aBC é obtido de forma análoga ao método BCPB,
realizando os mesmo passos do cálculo do intervalo de confiança com os limites IP
e SP , porém utilizando um ajuste por meio da constante de aceleração a . A
obtenção da constante a envolve cálculos não triviais, o que leva o Intervalo de
Confiança aBC ser mais utilizado quando há algum software estatístico disponível.
O cálculo do intervalo de confiança aBC é feito utilizando as seguintes
fórmulas para os valores de IP e SP :
71
,)(1
)(
20
200
zza
zzzPI
)(1
)(
20
20
0
zza
zzzPS
e substituindo na expressão:
)]ˆ();ˆ([ ***jPjPBC RPRPIC
SIa .
Segundo Andrews e Buchinsky (2002), é possível determinar a constante a
de maneira simples se as variáveis aleatórias, da amostra original, observadas forem
independentes e identicamente distribuídas. Assim o cálculo da constante será:
2/3
1
**
1
**
))²ˆˆ((6
)³ˆˆ(
k
i
iji
k
i
iji
RR
RR
a
com *ˆ i
jR sendo o valor das estimativas do parâmetro estudado para cada amostra
Bj ...,,2,1 que consiste na amostra mestre sem a categoria i , com ki 1 e *
ˆ iR o
valor da média das estimativas bootstrap, *R .
72
3.4 GERADOR ALEATÓRIO DE AMOSTRAS DE FALHAS
Pensando em uma forma fácil e rápida de se obter amostras de falhas das
categorias de tempos de falhas, foi desenvolvido um gerador aleatório com
distribuição uniforme, programado na linguagem Fortran 2003.
O gerador pode gerar amostras com, ou sem, censura, podendo ser
caracterizada como censura por tempo de uso, número de acionamentos, com
valores inteiros, número máximo de falhas pré-estabelecido, entre outros.
Para a construção das amostras, é apenas necessário que se entre com a
informação de que a amostra possua censura ou não, o tamanho da amostra, e caso
possua censura o número de elementos máximos para a amostra. Retornando
então, no caso sem censura, um vetor com o tamanho desejado e o número total de
elementos, e no caso censurado o vetor do tamanho informado e o número
informado de elementos, e o número de produtos que falharam na simulação.
O programa utiliza o gerador de números aleatórios das funções da
linguagem Fortran 2003, que segue uma distribuição uniforme. É importante
ressaltar que o gerador não retorna os tempos de falha, e sim a quantidade de
elementos, produtos, que falharam na primeira categoria de tempo de falha, na
segunda e assim até a n -ésima categoria de tempos de falha.
Com o auxílio do gerador foram criadas várias amostras sintéticas de
categorias de tempos de falha, e assim aplicado cada amostra ao programa
principal, o qual calcula as reamostragens e os intervalos de confiança bootstrap.
Neste trabalho estão apresentadas seis aplicações às amostras sintéticas, variando
entre amostras com censura e sem censura, com vários tamanhos de categorias de
tempos de falha, 10 até 22 categorias, sendo 2 amostras sem censura e 4 amostras
com censura.
As amostras apresentam os números das falhas para cada categoria de
tempo. Seja o exemplo onde se considera 5k categorias de tempos de falha e
tem-se os números de falhas para cada categoria 5...,,2,1i . Então,
].3,1,1,2,1[x
73
Assim para a categoria 1t um produto falhou, para a categoria 2t dois
produtos falharam e assim até a última categoria k que corresponde a 5t em que
três produtos falharam. A amostra é do tipo censurada, pois considerou-se 30n
itens e nem todos os itens falharam )30831121( . Ocorreram vinte e duas
)22( censuras.
3.5 OBTENÇÃO DO INTERVALO DE CONFIANÇA BOOTSTRAP
A partir dos métodos descritos nas seções anteriores, pode-se obter vários
intervalos de confiança bootstrap, os abordados neste trabalho foram o intervalo de
confiança do estimador de Kaplan-Meier, intervalo de confiança bootstrap-t e o
intervalo bootstrap baseado nos percentis, percentílico, já que apenas foi trabalhado
com amostras que tem distribuição parecidas com a normal. Para o intervalo
bootstrap-t utilizou-se o erro padrão bootstrap já definido no começo deste capítulo.
Foram consideradas apenas amostras com censura dos tipos I e II, censura
por tempo de uso, número de acionamentos e número máximo de falhas pré-
estabelecido, que são os tipos mais comuns de censura para produtos e sistemas,
encontrados na literatura. Além do que esse tipo de censura torna o trabalho mais
simples e a análise mais eficaz, já que as censuras podem ser aceitas como falhas,
ou podem ser aceitas como ausência de falha.
O valor de B para o número de replicações foi crescendo gradativamente
durante as análises, para valores de B acima de 1000, os resultados começaram a
ficar melhores, ou seja, os valores do erro padrão bootstrap ficam menores que do
erro padrão calculados pelo estimador de Kaplan-Meier, e os intervalos de confiança
bootstrap ficaram com amplitudes menores que os intervalos de estimador clássico
que os resultados obtidos pelo estimador padrão, e começaram a estabilizar para
valores de B próximos de 10000.
Para todos os métodos de obtenção dos intervalos de confiança bootstrap
listados neste capítulo é utilizado o mesmo cálculo do erro padrão bootstrap descrito
no mesmo capitulo.
Como geralmente na aplicação do bootstrap obtém-se um único erro padrão
para cada amostra, e para o estimador de Kaplan-Meier temos valores para cada
categoria de tempo de falha, foi necessário uma adaptação do cálculo do erro
74
padrão bootstrap, gerando um valor de erro para cada categoria de tempo de falha
da estimação da confiabilidade.
Assim obteve-se um valor do erro padrão para a categoria 1t , um valor do
erro para a categoria 2t , e assim sucessivamente até a categoria n , gerando um
vetor de erros padrão bootstrap:
]ˆ...,,ˆ,ˆ[ˆ **
2
*
1
*
npepepepe
Assim tem-se uma matriz 2nIC dos valores do intervalo de confiança, onde a
primeira posição de cada linha refere-se ao limite inferior do intervalo e a segundo
posição o limite superior do intervalo.
É evidente que haverá desigualdades entre os intervalos de confiança
calculados com métodos distintos, uma vez que cada um, mesmo que usando o
mesmo valor do erro padrão bootstrap, utilizam equações diferentes, que podem
mudar os limites dos intervalos, deixando mais, ou menos, ajustados em torno do
valor da confiabilidade estimada.
Com isso pode-se optar pelo intervalo que se encaixe melhor nos interesses
do estudo, já que o programa principal retornará os valores do intervalo bootstrap-t e
o percentílico, além do intervalo do estimador de Kaplan-Meier e seus reajustes se
necessário, para a comparação e análise.
3.6 COMPARAÇÃO DOS INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER E O BOOTSTRAP
Após a elaboração dos intervalos de confiança, é necessário fazer a
comparação entre os intervalos obtidos pelo método bootstrap com os intervalos de
confiança do estimador de Kaplan-Meier, para poder ter uma possível confirmação
do que era esperado.
A relação de melhor ou pior intervalo será feito em questão da amplitude,
logo o intervalo que ficar mais extenso é considerado pior, ou menos ajustado em
torno da estimativa, que o outro de amplitude menor.
No método do intervalo bootstrap-t basta analisar apenas o valor do erro
padrão bootstrap, já que o intervalo é, assim como o intervalo do estimador clássico,
75
geralmente simétrico em relação à estimativa, logo, se o erro padrão bootstrap for
menor que o erro padrão calculado pela fórmula de Greenwood o intervalo de
confiança será mais ajustado que do estimador, e assim será considerado melhor,
mais ajustado em torno das estimativas, que o intervalo calculado pelo estimador
clássico.
Mas quando se trata do intervalo percentílico é necessário uma análise
intervalo por intervalo, uma vez que ele pode não ser simétrico em relação à
estimativa. Assim essa análise exige um pouco mais de trabalho, pois se o tamanho
da amostra de tempos de falha for extensa utiliza-se um tempo maior que a análise
do intervalo bootstrap-t.
Como mencionado anteriormente, foram simuladas 6 amostras aleatórias de
tempos de falha, sendo 4 com censura e 2 sem censura, outras amostras foram
utilizadas mas não é possível apresentar todas as aplicações pelo espaço, podendo
tornar a trabalho muito carregado. Os resultados dos intervalos de confiança foram
confrontados a fim de constatar o sucesso da aplicação do método bootstrap.
76
4. RESULTADOS E DISCUSSÃO
4.1 APLICAÇÃO DO MÉTODO BOOTSTRAP AOS INTERVALOS DE CONFIANÇA
Os resultados da aplicação da metodologia descrita no capítulo 3 são
apresentados nesta seção. As amostras foram geradas pelo gerador aleatório
implementado. Sendo apresentadas seis aplicações em amostras.
Para cada amostra são apresentados: o seu histograma de distribuição
aproximada das falhas, três tabelas e os gráficos com os valores da confiabilidade
estimada e os intervalos de confiança do estimador de Kaplan-Meier e dois
intervalos do método bootstrap, o intervalo bootstrap-t e o intervalo percentílico. A
primeira tabela apresenta os valores dos tempos de falhas, número de itens que
falharam para cada tempo e a confiabilidade estimada de cada tempo. A segunda
mostra três tipos de intervalos de confiança, o do estimador de Kaplan-Meier,
bootstrap-t e o bootstrap percentílico, para facilitar as análises dos intervalos e por
fim a terceira apresenta a amplitude, comprimento, de cada intervalo de confiança,
os intervalos de confiança foram todos calculados para um limite de segurança de
95%.
4.1.1 Amostra gerada com 10 categorias de tempo de falha com 33 itens, censurada
A primeira amostra, censurada, contém 10 categorias de tempos de falha,
com um total de 33 componentes em teste, com 18 falhas, sendo 15 censurados.
FIGURA 14 – Histograma da amostra com 10 categorias de tempos de falha FONTE: O autor (2011).
77
TABELA 7 – CATEGORIAS DE TEMPOS DE FALHA, NÚMERO DE FALHAS E CONFIABILIDADE ESTIMADA PELO ESTIMADOR DE KAPLAN-MEIER PARA 10 CATEGORIAS
Categoria Nº de
falhas 10,...,2,1)(ˆ itRi Média
*
iR das
categorias
Erro padrão
bootstrap *ˆpe
1t 1 0.9696970 0.9698923 0.0284697
2t 1 0.9393940 0.9395501 0.0384284
3t 2 0.8787879 0.8793879 0.0632171
4t 3 0.7878789 0.7887975 0.0962398
5t 2 0.7272728 0.7281400 0.0997467
6t 2 0.6666667 0.6675317 0.0999279
7t 1 0.6363637 0.6373060 0.0939728
8t 2 0.5757576 0.5765691 0.0881435
9t 2 0.5151516 0.5154868 0.0769828
10t 2 0.4545455 0.4544869 0.0581672
FONTE: O autor (2011).
TABELA 8 – INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP PERCENTILICO PARA 10 CATEGORIAS
Categoria IC Kaplan-Meier IC bootstrap-t IC bootstrap percentílico
1t 0.8037434 0.9956753 0.9679861 0.9713178 0.9393939 1.0000000
2t 0.7787644 0.9844893 0.9348108 0.9436648 0.9393939 1.0000000
3t 0.7085648 0.9526940 0.8639367 0.8921208 0.8484849 1.0000000
4t 0.6059378 0.8927420 0.7498338 0.8208406 0.7575758 0.9696970
5t 0.5413215 0.8476930 0.6789450 0.7695858 0.6969697 0.9090909
6t 0.4794410 0.7996069 0.6106756 0.7165235 0.6363636 0.8484849
7t 0.4494479 0.7745697 0.5807734 0.6866351 0.6060606 0.8181818
8t 0.3912513 0.7226830 0.5188301 0.6284640 0.5454545 0.7575758
9t 0.3353672 0.6685141 0.4624017 0.5653012 0.4848485 0.6666667
10t 0.2818899 0.6121349 0.4132626 0.4948494 0.4242424 0.5757576
FONTE: O autor (2011).
TABELA 9 – AMPLITUDE DOS INTERVALOS DE CONFIANÇA PARA 10 CATEGORIAS
Categoria Amplitude K-Meier Amplitude bootstrap-t Amplitude b. percentílico
1t 0.1919 0.0033 (1,72%) 0.0606 (31,6%)
2t 0.2057 0.0089 (4,32%) 0.0606 (29,5%)
3t 0.2441 0.0282 (11,6%) 0.1515 (62,1%)
4t 0.2868 0.0710 (24,8%) 0.2121 (73,9%)
5t 0.3064 0.0906 (29,6%) 0.2121 (69,2%)
6t 0.3202 0.1058 (33,1%) 0.2121 (66,2%)
7t 0.3251 0.1059 (32,6%) 0.2121 (65,2%)
8t 0.3314 0.1096 (33,1%) 0.2121 (64,0%)
9t 0.3331 0.1029 (30,9%) 0.1818 (54,6%)
10t 0.3302 0.0816 (24,7%) 0.1515 (45,9%)
Obs.: As porcentagens são referentes ao intervalo do estimador de Kaplan-Meier FONTE: O autor(2011).
78
FIGURA 15 – Intervalos da amostra com 10 categorias K-M e bootstrap-t FONTE: O autor (2011).
FIGURA 16 – Intervalos da amostra com 10 categorias K-M e b. percentílico FONTE: O autor (2011).
A Figura 14 apresenta o histograma das frequências dos números de falha
para cada categoria de tempo de falha, já a Tabela 7 apresenta a confiabilidade
estimada para a amostra original, a média bootstrap para cada categoria de tempo e
o erro padrão bootstrap, também para cada categoria de tempo.
A Tabela 8 mostra os resultados da aplicação para uma amostra sintética
censurada, ficando evidente que tanto o intervalo bootstrap-t quanto o percentilico
são intervalos mais curtos, ou seja, têm amplitudes menores em cada uma das
categorias de tempo, Tabela 9, do que o intervalo clássico para o estimador de
Kaplan-Meier. Para essa amostra o intervalo bootstrap-t foi o intervalo melhor,
79
devido ao erro bootstrap ser muito menor que o erro calculado por Kaplan-Meier. O
intervalo percentílico apresentou valores um pouco mais amplos do que o bootstrap-
t, mas mesmo assim mais curtos que o do estimador padrão.
Observando a Figura 15, a Figura 16 e a Tabela 9, fica clara a diferença dos
intervalos de confiança. O intervalo do estimador de Kaplan-Meier tem uma
amplitude muito maior que o intervalo bootstrap-t, e também maior que a amplitude
do intervalo percentilico. Para valores das estimativas da confiabilidade próximos de
1 o intervalo bootstrap-t não é simétrico, mas na seqüência ele tende a ser simétrico.
Já para o intervalo percentilico, seu limite inferior sempre se mantém perto dos
valores estimados da confiabilidade e tendo seu limite superior sempre acima do
limite superior do intervalo do estimador.
4.1.2 Amostra gerada com 11 categorias de tempo de falha com 39 itens, não censurada
As figuras, tabelas e gráficos a seguir foram criados a partir de uma amostra
aleatória sintética não censurada. A amostra possui 39 produtos e 11 categorias de
tempos de falha, onde todos os itens falham na simulação de teste.
FIGURA 17 – Histograma da amostra com 11 categorias de tempos de falha FONTE: O autor (2011).
80
TABELA 10 – CATEGORIAS DE TEMPOS DE FALHA, NÚMERO DE FALHAS E CONFIABILIDADE ESTIMADA PELO ESTIMADOR DE KAPLAN-MEIER PARA 11 CATEGORIAS
Categoria Nº de falhas 11,...,1)(ˆ itRi Média *
iR das categorias Erro padrão
bootstrap *ˆpe
1t 1 0.9743590 0.9745176 0.0243354
2t 1 0.9487180 0.9486393 0.0327115
3t 2 0.8974359 0.8975456 0.0543295
4t 4 0.7948718 0.7957529 0.1021979
5t 6 0.6410257 0.6406971 0.1626228
6t 5 0.5128205 0.5137720 0.1797573
7t 2 0.4615385 0.4625213 0.1730633
8t 6 0.3076923 0.3137035 0.1806893
9t 5 0.1794872 0.1979244 0.1620376
10t 5 0.0051282 0.0999354 0.1227658
11t 2 0.0000000 0.0638045 0.0936555
FONTE: O autor (2011).
TABELA 11 – INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP PERCENTILICO PARA 11 CATEGORIAS
Categoria IC Kaplan-Meier IC bootstrap-t IC b. percentílico 1t 0.8315876 0.9963480 0.9731233 0.9755386 0.9743590 1.0000000
2t 0.8101534 0.9869226 0.9454167 0.9518247 0.9230769 1.0000000
3t 0.7494106 0.9602185 0.8865899 0.9072995 0.8717949 1.0000000
4t 0.6314322 0.8916929 0.7554141 0.8286961 0.7692308 0.9743590
5t 0.4704332 0.7693366 0.5424722 0.7237458 0.5897436 0.9230769
6t 0.3479007 0.6554656 0.3867797 0.6253031 0.4615385 0.8461539
7t 0.3015959 0.6072957 0.3377575 0.5765047 0.3846154 0.7692308
8t 0.1725058 0.4536018 0.1864582 0.4372966 0.2307693 0.6666667
9t 0.0078973 0.3128085 0.0094445 0.2864258 0.1025641 0.5384616
10t 0.0009851 0.1517384 0.0022857 0.0096795 0.0000000 0.4102564
11t 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.3076923
FONTE: O autor (2011).
TABELA 12 – AMPLITUDE DOS INTERVALOS DE CONFIANÇA PARA 11 CATEGORIAS
Categoria Amplitude K-Meier Amplitude bootstrap-t Amplitude b. percentílico 1t 0.1648 0.0024 (1,45%) 0.0256 (15,5%)
2t 0.1768 0.0064 (3,6%) 0.0769 (43,5%)
3t 0.2108 0.0207 (9,8%) 0.1282 (60,8%)
4t 0.2603 0.0733 (28,2%) 0.2051 (78,8%)
5t 0.2989 0.1813 (60,7%) 0.3333 (111,5%)
6t 0.3076 0.2385 (77,5%) 0.3846 (125,0%)
7t 0.3057 0.2387 (78,1%) 0.3846 (125,8%)
8t 0.2811 0.2508 (89,2%) 0.4359 (155,1%)
9t 0.3049 0.2770 (90,8%) 0.4359 (142,9%)
10t 0.1508 0.0074 (4,9%) 0.4103 (272,1%)
11t 0.0000 0.0000 ( - ) 0.3077 ( - )
Obs.: As porcentagens são referentes ao intervalo do estimador de Kaplan-Meier FONTE: O autor(2011).
81
FIGURA 18 – Intervalos da amostra com 11 categorias K-M e bootstrap-t FONTE: O autor (2011).
FIGURA 19 - Intervalos da amostra com 11 categorias K-M e b. percentílico FONTE: O autor (2011).
A Figura 17 apresenta o histograma das frequências dos números de falha
para cada categoria de tempo de falha, a Tabela 10 apresenta a confiabilidade
estimada para a amostra original, a média bootstrap para cada categoria de tempo e
o erro padrão bootstrap, também para cada categoria de tempo.
A Tabela 11 demonstra novamente o êxito da aplicação do método
bootstrap, mas desta vez o intervalo percentilico não se saiu tão bem quando na
amostra anterior, novamente o intervalo bootstrap-t obteve valores bons,
conseguindo intervalos mais ajustadas em torno das estimativas da confiabilidade.
No último intervalo de confiança da Tabela 11 os valores do estimador de Kaplan-
Meier e o bootstrap-t ficam com extremos iguais a zero, isso acontece devido a
82
fórmula, uma vez que os dois utilizam os valores da confiabilidade estimada para o
cálculo do intervalo e como ela é nula então os intervalos não tem amplitude alguma.
Novamente na Figura 18 é fácil verificar que o intervalo bootstrap-t possui
uma amplitude menor que do estimador clássico, mas nesta aplicação ocorre o
inverso, neste caso o intervalo do estimador se mantém simétrico praticamente em
quase todos os valores das observações e o intervalo bootstrap-t se demonstra
menos regular, já que recebeu o ajuste uma vez que alguns dos seus limites
superiores ultrapassaram a marca de 1 ponto, ou 100%. Para o intervalo
percentilico, até a quarta observação possui uma amplitude visivelmente, e
numericamente, menor que o intervalo do estimador de Kaplan-Meier, mas da quinta
até a décima primeira observação a amplitude ficou maior para o intervalo
percentilico do que para o Kaplan-Meier. Essa diferença pode ser justificada pelo
tipo da amostra, por não ser censurada talvez force o intervalo percentílico ter uma
amplitude maior, já que isso aconteceu com as outras amostras não censuradas
utilizadas nas simulações.
Para amostras um pouco maiores os resultados ainda são melhores, já que
é característico do estimador assintótico, lógico que amostras não tão extensas, pois
caso a amostra seja muito grande não existe a necessidade de aplicar o método
bootstrap já que as estimativas tendem ao valor real conforme o tamanho da
amostra cresça.
Nos dois casos mostrados anteriormente ficou evidente a eficácia da
aplicação do método bootstrap, para a amostra não censurada o intervalo
percentilico não se comportou tão bem, pois teve uma amplitude maior que a
amplitude do intervalo clássico do estimador, na maioria das observações, mas se
demonstrou eficaz para a amostra censurada. Entretanto para os dois tipos de
amostra, o intervalo bootstrap-t se demostrou melhor que os outros dois sempre
tendo uma amplitude menor que o intervalo do estimador de Kaplan-Meier,
mostrando que a aplicação foi eficiente.
4.1.3 Amostra gerada com 22 categorias de tempo de falha com 70 itens, censurada
A seguir é apresentada a aplicação a uma amostra censurada com 22
categorias de tempo de falha, com um total de 70 itens e 57 falhas, sendo 13
censuradas.
83
FIGURA 20 – Histograma da amostra com 22 categorias de tempos de falha FONTE: O autor (2011).
TABELA 13 – CATEGORIAS DE TEMPOS DE FALHA, NÚMERO DE FALHAS E CONFIABILIDADE ESTIMADA PELO ESTIMADOR DE KAPLAN-MEIER PARA 22 CATEGORIAS
Categoria Nº de falhas 22,...,1)(ˆ itRi Média *iR das categorias
Erro padrão
bootstrap *ˆpe
1t 1 0.9857143 0.9857251 0.0138738
2t 1 0.9714286 0.9714772 0.0192419
3t 3 0.9285715 0.9280913 0.0447747
4t 5 0.8571429 0.8557433 0.0795369
5t 4 0.8000000 0.7978839 0.0939782
6t 4 0.7428572 0.7406402 0.1043036
7t 2 0.7142857 0.7126486 0.1050430
8t 4 0.6571429 0.6556810 0.1121111
9t 3 0.6142858 0.6134459 0.1134754
10t 4 0.5571429 0.5554927 0.1180758
11t 2 0.5285715 0.5269166 0.1162325
12t 4 0.4714286 0.4703937 0.1189218
13t 1 0.4571429 0.4559103 0.1168832
14t 4 0.4000001 0.3994991 0.1189335
15t 3 0.3571429 0.3569044 0.1166458
16t 3 0.3142858 0.3142420 0.1131285
17t 2 0.2857144 0.2857353 0.1084538
18t 1 0.2714286 0.2714806 0.1048753
19t 4 0.2142858 0.2142218 0.1003685
20t 1 0.2000001 0.2001101 0.0962219
21t 1 0.1857143 0.1859751 0.0919061
22t 1 0.1714286 0.1717197 0.0869427
FONTE: O autor(2011).
84
TABELA 14 – INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP PERCENTILICO PARA 22 CATEGORIAS
Categoria IC Kaplan-Meier IC bootstrap-t IC b. percentílico 1t 0.9028924 0.9979753 0.9853234 0.9860948 0.9857143 1.0000000
2t 0.8905523 0.9927770 0.9703469 0.9724714 0.9714286 1.0000000
3t 0.8368711 0.9696316 0.9222809 0.9343712 0.9142857 1.0000000
4t 0.7507553 0.9204527 0.8351399 0.8764293 0.8285714 0.9857143
5t 0.6857895 0.8763301 0.7646975 0.8306020 0.7714285 0.9571428
6t 0.6233769 0.8294762 0.6944205 0.7848270 0.7000000 0.9285714
7t 0.5929647 0.8052304 0.6614020 0.7604356 0.6714286 0.9000000
8t 0.5335257 0.7553414 0.5927202 0.7138882 0.6142857 0.8571429
9t 0.4900548 0.7168223 0.5440723 0.6769747 0.5571429 0.8285714
10t 0.4334640 0.6641195 0.4784279 0.6287096 0.5000000 0.7714286
11t 0.4057348 0.6372185 0.4490128 0.6018878 0.4714286 0.7428572
12t 0.3513920 0.5823445 0.3869818 0.5512108 0.4142857 0.7000000
13t 0.3380398 0.5684033 0.3737061 0.5366044 0.4000000 0.6857143
14t 0.2855879 0.5117327 0.3144799 0.4839550 0.3285714 0.6285715
15t 0.2472965 0.4682463 0.2741447 0.4407877 0.2857143 0.5857143
16t 0.2099736 0.4238591 0.2357992 0.3956323 0.2428572 0.5285715
17t 0.1856768 0.3937276 0.2123580 0.3631774 0.1857143 0.5000000
18t 0.1737182 0.3784877 0.2015634 0.3458481 0.1857143 0.4714287
19t 0.1273047 0.3162342 0.1533018 0.2821405 0.1285715 0.4142857
20t 0.1161011 0.3003092 0.1432048 0.2637350 0.1142857 0.3857144
21t 0.1050808 0.2842194 0.1332079 0.2451159 0.1142857 0.3714286
22t 0.0094259 0.2679519 0.1235335 0.2259886 0.1000000 0.3428572
FONTE: O autor (2011).
TABELA 15 – AMPLITUDE DOS INTERVALOS DE CONFIANÇA PARA 22 CATEGORIAS
Categoria Amplitude Kaplan-Meier Amplitude bootstrap-t Amplitude b. percentílico
1t 0.0951 0.0008 (0,84%) 0.0143 (15,1%)
2t 0.1022 0.0021 (2,1%) 0.0286 (27,9%)
3t 0.1328 0.0121 (9,1%) 0.0857 (64,5%)
4t 0.1697 0.0413 (24,3%) 0.1571 (92,6%)
5t 0.1905 0.0659 (34,6%) 0.1857 (97,5%)
6t 0.2061 0.0904 (43,9%) 0.2286 (110,9%)
7t 0.2123 0.0990 (46,6%) 0.2286 (107,7%)
8t 0.2218 0.1212 (54,6%) 0.2429 (109,5%)
9t 0.2268 0.1329 (58,6%) 0.2714 (119,7%)
10t 0.2307 0.1503 (65,2%) 0.2714 (117,6%)
11t 0.2315 0.1529 (66,1%) 0.2714 (117,2%)
12t 0.2310 0.1642 (71,1%) 0.2857 (123,7%)
13t 0.2304 0.1629 (70,7%) 0.2857 (124,0%)
14t 0.2261 0.1695 (75,0%) 0.3000 (132,7%)
15t 0.2209 0.1666 (75,4%) 0.3000 (135,8%)
16t 0.2139 0.1598 (74,7%) 0.2857 (133,6%)
17t 0.2081 0.1508 (72,5%) 0.3143 (151,1%)
18t 0.2048 0.1443 (70,5%) 0.2857 (139,5%)
19t 0.1889 0.1288 (68,2%) 0.2857 (151,3%)
20t 0.1842 0.1205 (65,6%) 0.2714 (147,3%)
21t 0.1791 0.1119 (62,5%) 0.2571 (143,6%)
22t 0.2585 0.1025 (39,7%) 0.2429 (94,0%)
Obs.: As porcentagens são referentes ao intervalo do estimador de Kaplan-Meier
85
FIGURA 21 – Intervalos da amostra com 22 categorias K-M e bootstrap-t FONTE: O autor (2011).
FIGURA 22 – Intervalos da amostra com 22 categorias K-M e b. percentílico FONTE: O autor (2011).
A Figura 20 apresenta o histograma das frequências dos números de falha
para cada categoria de tempo de falha, a Tabela 10 apresenta a confiabilidade
estimada para a amostra original, a média bootstrap para cada categoria de tempo e
o erro padrão bootstrap, também para cada categoria de tempo.
Por se tratar de uma amostra maior que as outras, os resultados das
estimativas tendem a serem melhores, ou seja, mais perto dos valores reais da
função de confiabilidade. Seus intervalos de confiança ficaram todos bem justos,
mas novamente o intervalo bootstrap-t obteve valores mais ajustados em torno das
estimativas da confiabilidade que o intervalo do estimado de Kaplan-Meier. Dessa
86
vez os intervalos do estimador e o bootstrap-t se mantiveram praticamente
simétricos em relação aos valores da confiabilidade estimada, lógico que novamente
com o intervalo bootstrap-t apresentando amplitude menor. Novamente para o
intervalo percentílico, o limite inferior ficou bem próximo ao valor da confiabilidade
estimada e isso aconteceu com a maioria das amostras, tanto para amostras
censuradas quanto para não censuradas. Talvez por utilizar um percentil elevado
para o limite superior, isso force o valor geralmente para cima.
4.1.4 Amostra gerada com 13 categorias de tempo de falha com 46 itens, censurada
A quarta aplicação foi feita a uma amostra com 13 categorias de tempo de
falha, contendo um total de 46 itens com censura, onde 26 produtos falharam e os
outros 20 foram censurados. Fica evidente observando o histograma de frequências
de falhas, que a média de falhas por categoria de tempo de falha ficou próximo à
duas falhas por categoria, ficando evidente, também, que a amostra não teve uma
oscilação significativa em relação ao número de falhas para cada categoria de
tempo de falha.
FIGURA 23 – Histograma da amostra com 13 categorias de tempos de falha FONTE: O autor (2011).
87
TABELA 16 – CATEGORIAS DE TEMPOS DE FALHA, NÚMERO DE FALHAS E CONFIABILIDADE ESTIMADA PELO ESTIMADOR DE KAPLAN-MEIER PARA 13 CATEGORIAS
Categoria Nº de falhas 13,...,1)(ˆ itRi Média *iR das categorias E. p. bootstrap *ˆpe
1t 2 0.9565217 0.9566387 0.0416920
2t 1 0.9347826 0.9348247 0.0451813
3t 2 0.8913043 0.8912892 0.0577920
4t 3 0.8260869 0.8272600 0.0780496
5t 3 0.7608696 0.7613980 0.0914376
6t 2 0.7173913 0.7181004 0.0918350
7t 1 0.6956522 0.6963377 0.0890221
8t 2 0.6521739 0.6528198 0.0874045
9t 2 0.6086957 0.6092139 0.0843825
10t 2 0.5652174 0.5662268 0.0792279
11t 1 0.5434783 0.5443282 0.0722450
12t 2 0.5000001 0.5008187 0.0629458
13t 1 0.4782609 0.4788754 0.0518871
FONTE: O autor (2011).
TABELA 17 – INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP PERCENTILICO PARA 13 CATEGORIAS
Categoria IC Kaplan-Meier IC bootstrap-t IC b. percentílico
1t 0.8371413 0.9889458 0.9529082 0.9598639 0.9565217 1.0000000
2t 0.8112690 0.9784886 0.9289634 0.9401407 0.9130435 1.0000000
3t 0.7583610 0.9532566 0.8790879 0.9023559 0.8695652 1.0000000
4t 0.6821922 0.9089689 0.8004058 0.8487811 0.8043478 0.9565217
5t 0.6099356 0.8597876 0.7211301 0.7957642 0.7173914 0.9347826
6t 0.5635856 0.8250001 0.6719072 0.7577344 0.6739131 0.8913043
7t 0.5408964 0.8070968 0.6491532 0.7372701 0.6521740 0.8695652
8t 0.4964178 0.7703686 0.6021088 0.6975743 0.6086957 0.8260869
9t 0.4530708 0.7325023 0.5567035 0.6565466 0.5652174 0.7826087
10t 0.4107989 0.6935738 0.5135580 0.6135564 0.5217392 0.7173914
11t 0.3900554 0.6737267 0.4953352 0.5890425 0.5217391 0.6956521
12t 0.3493441 0.6332846 0.4565019 0.5418882 0.4782609 0.6304348
13t 0.3293763 0.6126924 0.4419499 0.5136186 0.4565218 0.5869565
FONTE: O autor (2011).
FIGURA 24 – Intervalos da amostra com 13 categorias K-M e bootstrap-t
88
TABELA 18 – AMPLITUDE DOS INTERVALOS DE CONFIANÇA PARA 13 CATEGORIAS
Categoria Amplitude Kaplan-Meier Amplitude bootstrap-t Amplitude b. percentílico
1t 0.1518 0.0070 (4,6%) 0.0435 (28,7%)
2t 0.1672 0.0112 (6,7%) 0.0870 (52,1%)
3t 0.1949 0.0233 (12,0%) 0.1304 (67,0%)
4t 0.2268 0.0484 (21,3%) 0.1522 (67,1%)
5t 0.2499 0.0746 (29,9%) 0.2174 (87,0%)
6t 0.2614 0.0858 (32,8%) 0.2174 (83,2%)
7t 0.2662 0.0881 (33,1%) 0.2174 (81,7%)
8t 0.2740 0.0955 (34,9%) 0.2174 (79,3%)
9t 0.2794 0.0998 (35,7%) 0.2174 (77,8%)
10t 0.2828 0.1000 (35,4%) 0.1957 (69,2%)
11t 0.2837 0.0937 (33,0%) 0.1739 (61,3%)
12t 0.2839 0.0854 (30,1%) 0.1522 (53,6%)
13t 0.2833 0.0717 (25,3%) 0.1304 (46,0%)
Obs.: As porcentagens são referentes ao intervalo do estimador de Kaplan-Meier FONTE: O autor (2011).
FIGURA 25 – Intervalos da amostra com 13 categorias K-M e b. percentílico FONTE: O autor (2011).
Novamente é fácil de verificar que os intervalos do método bootstrap tiveram
uma amplitude menor que o intervalo do estimador. Como nas outras aplicações, o
intervalo bootstrap-t foi o que teve a menor amplitude, seguido do intervalo
percentilico. Tanto o intervalo do estimador de Kaplan-Meier quanto o bootstrap-t se
mantiveram praticamente simétricos em relação à confiabilidade estimada.
Uma característica presente em praticamente todas as aplicações é que o
intervalo percentílico, para as primeiras categorias de tempos, apresenta valores
com os limites superiores geralmente igual a 1, ou 100%. Talvez pelo valor das
estimativas ficarem perto ou igual a um. Assim, com os valores altos o limite superior
sofre influência.
89
4.1.5 Amostra gerada com 10 categorias de tempo de falha com 34 itens, não
censurada
A quinta aplicação foi feita em uma amostra não censurada com 10
observações e 34 itens, onde todos falharam. O histograma a seguir mostra que
esta amostra possui uma distribuição um pouco diferente das demais, ela tem
valores altos para as falhas, com uma média de 3,4 falhas por tempo de falha
simulado.
FIGURA 26 – Histograma da amostra com 10 categorias de tempos de falha FONTE: O autor (2011).
TABELA 19 – CATEGORIAS DE TEMPOS DE FALHA, NÚMERO DE FALHAS E CONFIABILIDADE ESTIMADA PELO ESTIMADOR DE KAPLAN-MEIER PARA 10 CATEGORIAS
Categoria Nº de falhas 10,...,2,1)(ˆ itRi Média *iR das
categorias
Erro padrão
bootstrap *ˆpe
1t 1 0.9705882 0.9708138 0.0276313
2t 1 0.9411765 0.9413462 0.0372984
3t 2 0.8823529 0.8828970 0.0613571
4t 4 0.7647059 0.7656875 0.1163638
5t 5 0.6176471 0.6185663 0.1608984
6t 5 0.4705882 0.4719999 0.1842956
7t 2 0.4117647 0.4135532 0.1752947
8t 5 0.2647059 0.2716411 0.1722857
9t 4 0.1470588 0.1643622 0.1441376
10t 5 0.0000000 0.0600097 0.0906538
FONTE: O autor (2011).
90
TABELA 20 – INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP PERCENTILICO PARA 10 CATEGORIAS
Categoria IC Kaplan-Meier IC bootstrap-t IC b. percentílico
1t 0.8090042 0.9958041 0.9689771 0.9721169 0.9411765 1.0000000
2t 0.7846940 0.9849558 0.9368589 0.9452075 0.9411765 1.0000000 3t 0.7162649 0.9541398 0.8683523 0.8949559 0.8529412 1.0000000
4t 0.5841796 0.8746970 0.7139181 0.8077071 0.7058824 0.9705882 5t 0.4342162 0.7570637 0.5166025 0.7036226 0.5588236 0.9117647
6t 0.2983037 0.6251885 0.3390114 0.5914087 0.4117647 0.8235294 7t 0.2477204 0.5688185 0.2861948 0.5329645 0.3529412 0.7352941
8t 0.1318715 0.4181158 0.1552003 0.3874235 0.1764706 0.6176471 9t 0.0537068 0.2846178 0.0786529 0.2357113 0.0588235 0.4705883
10t 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.3235294
FONTE: O autor (2011).
TABELA 21 – AMPLITUDE DOS INTERVALOS DE CONFIANÇA PARA 10 CATEGORIAS
Categoria Amplitude K-Meier Amplitude bootstrap-t Amplitude b. percentílico 1t 0.1868 0.0031 (1,7%) 0.0588 (31,5%)
2t 0.2003 0.0083 (4,1%) 0.0588 (29,4%)
3t 0.2379 0.0266 (11,2%) 0.1471 (61,8%)
4t 0.2905 0.0938 (32,3%) 0.2647 (91,1%)
5t 0.3228 0.1870 (57,9%) 0.3529 (109,3%)
6t 0.3269 0.2524 (72,2%) 0.4118 (126,0%)
7t 0.3211 0.2468 (76,9%) 0.3824 (119,1%)
8t 0.2862 0.2322 (81,1%) 0.4412 (154,2%)
9t 0.2309 0.1571 (68,0%) 0.4118 (178,3%)
10t 0.0000 0.0000 ( - ) 0.3235 ( - )
Obs.: As porcentagens são referentes ao intervalo do estimador de Kaplan-Meier FONTE: O autor(2011).
FIGURA 27 – Intervalos da amostra com 10 categorias K-M e bootstrap-t FONTE: O autor (2011).
91
FIGURA 28 – Intervalos da amostra com 10 categorias K-M e b. percentílico FONTE: O autor (2011).
Assim como para a primeira amostra não censurada o intervalo percentílico
obteve a maior amplitude em comparação com os outros dois intervalos, até a
quarta observação o intervalo percentílico obteve uma amplitude menor que o
intervalo do estimador de Kaplan-Meier, mas a partir da quinta começou a aumentar
a amplitude. Os intervalos bootstrap-t e do estimador ficaram praticamente
simétricos em relação às estimativas da confiabilidade, convergindo para zero na
ultima observação, assim como aconteceu na segunda amostra apresentada, que
também não era censurada. Para esse tipo de amostra, não censurada, em todas
testadas, os intervalos booststap-t e o do Kaplan-Meier se comportaram dessa
maneira, na última observação os limites, tanto inferior quanto superior, ficaram
iguais a zero, e apenas o percentílico, no limite superior, não ficou igual a zero.
4.1.6 Amostra gerada com 12 categorias de tempo de falha com 56 itens, censurada
Para a sexta aplicação foi utilizado uma amostra aleatória simulada com 12
categorias de tempos de falha e um total de 56 itens, censurada contou-se 23 falhas,
censurando os 33 demais. No histograma da amostra verifica-se que as falhas
ficaram bem distribuídas pelas categorias, com uma média de 1,92 falhas por
categoria de tempo de falha simulado.
92
FIGURA 29 – Histograma da amostra com 12 categorias de tempos de falha FONTE: O autor (2011).
TABELA 22 – CATEGORIAS DE TEMPOS DE FALHA, NÚMERO DE FALHAS E CONFIABILIDADE ESTIMADA PELO ESTIMADOR DE KAPLAN-MEIER PARA 10 CATEGORIAS
Categoria Nº de falhas 10,...,1,)(ˆ itRi Média *iR das categorias E. p. bootstrap *ˆpe
1t 1 0.9821429 0.9822172 0.0170836
2t 1 0.9642857 0.9642502 0.0229110
3t 2 0.9285715 0.9283521 0.0385678
4t 3 0.8750001 0.8756507 0.0586410
5t 4 0.8035715 0.8039783 0.0811436
6t 2 0.7678572 0.7682160 0.0811183
7t 1 0.7500001 0.7504490 0.0787430
8t 2 0.7142858 0.7151350 0.0768601
9t 2 0.6785715 0.6791063 0.0732294
10t 1 0.6607144 0.6612328 0.0687466
11t 1 0.6428573 0.6432199 0.0630217
12t 3 0.5892859 0.5894934 0.0594925
FONTE: O autor (2011).
TABELA 23 – INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP PERCENTILICO PARA 12 CATEGORIAS
Categoria IC Kaplan-Meier IC bootstrap-t IC b. percentílico
1t 0.8799214 0.9974653 0.9815404 0.9827258 0.9642857 1.0000000 2t 0.8646516 0.9909467 0.9626764 0.9658269 0.9642857 1.0000000 3t 0.8207787 0.9725758 0.9231836 0.9335951 0.8928571 1.0000000 4t 0.7555916 0.9383587 0.8608838 0.8877786 0.8571429 0.9821429 5t 0.6734388 0.8860640 0.7738414 0.8298309 0.7678572 0.9464286
6t 0.6340398 0.8580120 0.7336873 0.7982591 0.7321429 0.9107143 7t 0.6146968 0.8436050 0.7148438 0.7815011 0.7142858 0.8928571
8t 0.5766604 0.8141139 0.6762601 0.7486998 0.6785715 0.8571429 9t 0.5394250 0.7838017 0.6391517 0.7146808 0.6428572 0.8214285 10t 0.5210883 0.7683617 0.6223748 0.6961499 0.6250001 0.7857143
11t 0.5029310 0.7527424 0.6065775 0.6767236 0.6249999 0.7678571 12t 0.4494910 0.7048625 0.5519769 0.6246040 0.5714285 0.6964286
FONTE: O autor (2011).
93
TABELA 24 – AMPLITUDE DOS INTERVALOS DE CONFIANÇA PARA 12 CATEGORIAS
Categoria Amplitude K-Meier Amplitude bootstrap-t Amplitude b. percentílico
1t 0.1175 0.0012 (1,0%) 0.0357 (30,3%)
2t 0.1263 0.0032 (2,5%) 0.0357 (28,3%)
3t 0.1518 0.0104 (6,9%) 0.1071 (70,6%)
4t 0.1828 0.0269 (14,7%) 0.1250 (68,4%)
5t 0.2126 0.0560 (26,3%) 0.1786 (84,0%)
6t 0.2240 0.0646 (28,8%) 0.1786 (79,3%)
7t 0.2289 0.0667 (29,1%) 0.1786 (78,0%)
8t 0.2375 0.0724 (30,5%) 0.1786 (75,2%)
9t 0.2444 0.0755 (30,9%) 0.1786 (73,1%)
10t 0.2473 0.0738 (29,8%) 0.1607 (65,0%)
11t 0.2498 0.0701 (28,1%) 0.1429 (57,2%)
12t 0.2554 0.0726 (28,4%) 0.1250 (49,0%)
Obs.: As porcentagens são referentes ao intervalo do estimador de Kaplan-Meier FONTE: O autor (2011).
FIGURA 30 – Intervalos da amostra com 12 categorias K-M e bootstrap-t FONTE: O autor (2011).
FIGURA 31 – Intervalos da amostra com 12 categorias K-M e b. percentílico FONTE: O autor (2011).
94
Para esta aplicação, Figura 30 e Figura 31, tanto o gráfico das estimativas
da confiabilidade quanto os intervalos de confiança ficaram bem suaves.
Novamente, como nas outras amostras apresentadas, o intervalo bootstrap-t teve
uma amplitude menor que a amplitude dos outros dois intervalos. Outra
característica presente em todas as aplicações das amostras foi que o intervalo
bootstrap-t sempre se inicia bem próximo das estimativas e vai aumentando a
amplitude. Isso se deve ao erro padrão bootstrap que começa muito pequeno e vai
crescendo nos demais pontos de observação.
Assim temos a análise de 6 amostras aleatórias, simuladas pelo programa
secundário implementado, sendo 2 amostras não censuradas e 4 censuradas. Ficou
evidente em todas as amostras que o intervalo bootstrap-t possui uma amplitude
menor que dos outros dois intervalos.
Para o intervalo bootstrap percentílico, o tipo de amostra influência os
resultados. Para amostras censuradas obteve amplitudes menores que do estimador
de Kaplan-Meier, porem para amostras não censuradas os seus intervalos ficaram
com as maiores amplitudes da análise. Sendo assim caso o interesse seja um
intervalo mais justo, para as amostras não censuradas, deve-se utilizar o intervalo
bootstrap-t ou o intervalo do estimador. E para as amostras censuradas, pode-se
utilizar o intervalo bootstrap-t ou o percentilico.
95
5. CONCLUSÃO
O objetivo principal do trabalho, a construção de intervalos de confiança para
os valores da função de confiabilidade estimada pelo método de Kaplan-Meier, pela
técnica computacionalmente intensiva bootstrap foi alcançado. Assim foram
construídos intervalos de confiança utilizando o método bootstrap, além do próprio
intervalo de confiança do estimador de Kaplan-Meier. Os intervalos aplicados foram
os intervalos bootstrap-t e o bootstrap percentílico, em comparação com o intervalo
clássico.
O método se apresentou eficiente para amostras de diversos tamanhos, uma
limitação ainda existente é que o método apenas funciona bem para amostras com
censura do tipo I e II, devendo ser feitas algumas adaptações caso se trabalhe com
outros tipos de censura.
Assim, sendo que dos resultados pode-se observar que:
o intervalo bootstrap-t apresentou intervalos de confiança mais justos
que os demais métodos, em todas as categorias de tempo de falha, sendo mais
eficiente que o intervalo bootstrap percentílico e que o intervalo clássico de Kaplan-
Meier.
o intervalo bootstrap percentílico superou o intervalo clássico de
Kaplan-Meier quando existe censura e superou nas categorias de tempo iniciais
quando não existe censura;
os resultados do programa desenvolvido mostraram-se eficientes.
Foram utilizados os cálculos dos intervalos de confiança para um nível de
95% de segurança, tanto para o intervalo do estimador dos valores da confiabilidade
quanto para os intervalos do método bootstrap. Na aplicação do método bootstrap
foram utilizadas 10000 replicações, pode-se utilizar um número maior de
reamostragens, mas durante os testes, para valores de B perto e acima das 10000
replicações, os valores dos intervalos começaram a ficar iguais, apenas aumentando
o tempo computacional demandado. O problema para determinar quantas
replicações B são necessárias para a obtenção de boas estimativas dos limites
inferiores e superiores de intervalos de confiança do método bootstrap e discutido
em Efron e Tibshirani (1986).
96
Sugestões para trabalhos futuros:
Expandir o método criado para outras áreas de estudo, tais como
medicina, economia, entre outras áreas da ciência moderna citados;
Utilizar amostras “estranhas”, ou seja, que tenham distribuição muito
diferente da distribuição normal;
Utilizar amostras reais para as análises e efetuar análises e aplicações
dos outros métodos de intervalos de confiança bootstrap.
97
REFERÊNCIAS
ANDRADE, L. F. S.; ZARDO, C. R.; FORCELLINI, F. A. O uso do FMEA como uma
métrica para a confiabilidade no projeto conceitual. In: VCBGDP, Curitiba,
Paraná, ago. 2005. 8p.
ANDREWS, D. W. K.; BUCHINSKY, M. On the number of bootstrap repetitions
for BCa confidence intervals. Econometric Theory, v. 18, n. 4, p. 962-984, Aug.
2002.
AVIZIENIS, A.; LAPRIE, J. C.; RANDELL, B.; LANDWEHER, C. Basic concepts
and taxonomy of dependable and security computing. IEEE Transactions on
Dependable and Secure Computing. v. 1, n. 1, p. 11-33, jan./mar. 2004.
BAILAR III, J. C., MOSTTELER, F. Medical Uses of Statistics. 2nd edition, NEJM
Book, Boston. 1992.
BARROS, E. A. Coelho. Aplicações de simulação Monte Carlo e Bootstrap
(Monografia, 2005). Universidade Estadual de Maringá, UEM.
BASTOS, J., ROCHA, C. Notas metodológicas: Análise de Sobrevivência. Serviço de Higiene e Epidemiologia, Faculdade de Medicina da Universidade do Porto; DEIO e CEAUL, Faculdade de Ciências da Universidade de Lisboa, Portugal, 2007. BERGAMO, V. F.. Confiabilidade Básica e Prática. 1ª edição. Editora Edgard Blücher LTDA, São Paulo, SP. 1997.
BICKEL, P., FREEDMAN, D. Some asymptotic theory for the bootstrap. Ann. Statistic. n. 9, pp 1196-1197. 1981. BOX, G.E.P.; HUNTER, W. G.; HUNTER, J. S. Statistic for experimenters; An introduction to design, data analysis, and model building. New York: John Wiley, 1978. 653p. CARVALHO, A. Lopes. Análise de Disponibilidade Utilizando Abordagem Nebulosa (Tese de Doutorado, 2008). Universidade Federal de Minas Gerais, UFMG CARVALHO, M. Sá; ANDREOZZI, V. Lima; CODEÇO, C. Torres; BARBOSA, M. T. Serrano; SHIMAKURA, F. Emiko. Análise de Sobrevida: Teoria e Aplicação em Saúde. 20ª ed. Editora Fiocruz, Rio de Janeiro, RJ. 2005. CARRASCO, C. Giugioli. Uma introdução a análise de sobrevivência e confiabilidade. IV Seminário de Iniciação Cientifica, Unidade Universitária de Ciências Exatas e Tecnologias, UEG.
98
CHAVES NETO, A., “Bootstrap” em Séries Temporais. (Tese de Doutorado, 1991). Pontifícia Universidade Católica do Rio de Janeiro. PUC-RJ. CHAVES NETO, A. Confiabilidade e Métodos Estatísticos Aplicados a Sistemas de Engenharia. Notas de aula. Departamento de Estatística, Universidade Federal do Paraná, Curitiba, 2010. COLOSSIMO, E. A.; GIOLO, S. R. Análise de Sobrevivência Aplicada. 1ª edição. Editora Edgard Blücher LTDA, São Paulo, SP. 2006. DILLENBURG, M. R. Estimativas de confiabilidade de produtos a partir das contagens mensais de vendas e falhas ao longo do período de garantia (Dissertação de Mestrado, 2005). Universidade Federal do Rio Grande do Sul, UFRGS. EFRON, B. “Bootstrap” Methods: another look at the jackknife. The Annals of Statistics 1.:1-20, 1979. EFRON, B. The Jacknife, the “Bootstrap”, and Other Resampling Plans. Number 38 in CBMS-NSF Regional Conference Series in Applied Mathematics. 1982. Philadelphia: SIAM. EFRON, B.; TIBSHIRANI, R. J. An introduction to the “bootstrap”, volume 57 of Monographs on Statistics and Applied Probability. Chapman and Hall, New York, 1993. ELSAYED, E. A. Reliability engineering. Reading, MA: Addison Wesley Longman, 1996. 737p. FERNANDES, C. Geordane. Metodologia para melhorar a confiabilidade de subsistemas através da análise de falhas e testes acelerados (Dissertação de Mestrado, 2010). Universidade Federal do Rio Grande do Sul, UFRGS. FREITAS, M. A. e COLOSSIMO, E. A. Confiabilidade: análise de tempo de falha e
testes acelerados. Fundação Cristiano Ottoni, Belo Horizonte, Minas Gerais. 1997.
FRITSH, C. Modelos de confiabilidade para testes de sobrevida. Dissertação de
Mestrado, Programa de Pós-Graduação em Engenharia de Produção, UFRGS.
Porto Alegra, 1996.
GILCHRIST, W. Modelling failure modes and effects analysis. International Journal
of Quality & Reliability Management. Bradford, v. 10, n. 5, p. 16-23, 1993.
GUIMARÃES, U. V. Modelagem para análise da confiabilidade de produtos em
garantia (Dissertação de Mestrdo, 2002). Universidade Federal do Rio Grande do
Sul, UFRGS.
99
GUZZON, S. O. Proposta de análise quantitativa de confiabilidade a partir de
dados quantitativos provenientes da FMEA (Dissertação de Mestrado, 2009).
Universidade Federal do Rio Grande do Sul, UFRGS.
HECHT, H. Systems reliability and failure prevention. Norwood: Artech House,
2003. 230p.
HOYLAND, A.; RAUSAND, M. System reliability theory: models and statistical
methods. New York: Wiley-Interscience, 1994.
LAFRAIA, J. Manual de confiabilidade, mantenabilidade e disponibilidade. Rio
de Janeiro: Qualitymark, 374 p,2001.
LEEMIS, L. M. Reability. Probabilistic models and statistical methodos.
Englewood Cliffs: Pretentice-Hall, 1995. 319 p.
MACHADO, R. L.; MELO, G. C. Utilização do FMEA na melhoria de processos de
fabricação da industria farmacêutica. XXVII ENEGEP, Foz do Iguaçu, out. 2007.
10p.
MARTINEZ-ESPINOSA, M.; SANDANIELO, V. L. M.; LOUZADA-NETO, F.; O metodo de “bootstrap” para o estudo de dados de fadiga dos materiais. Ver. Mat. Estat., Sao Paulo, v.24, n.2, p.37-50, 2006. PALADY, Paul “FMEA – Análise de Modos e Efeitos de Falha” Edt. IMAM, 3ª Edição, 2004. PASETTO, S. Castro. Previsão de falhas no período de garantia a partir da percepção do cliente: um estudo de caso junto a uma empresa de alta tecnologia (Dissertação de Mestrado, 2002). Universidade Federal do Rio Grande do Sul, UFRGS. PEREIRA, P. J.; PEREIRA, M. A. T. Comparação dos estimadores de Kaplan-Meier e de Nenson-Aalen para um estudo entomológico, com introdução de
censura tipo I. 48ª Reunião da RBRAS e 10º SEAGRO, Universidade Federal de
Lavras, Departamento e Ciências Exatas, 7 a 11 de Junho de 2003, Lavras, Minas Gerais. PIAZZA, G. Introdução a Engenharia da Confiabilidade. Edt. EDUCS, 1ªEdição, 2000. QUENOUILLE, M. H. Aproximate tests of correlation in time-series. Journal os Statistical Computation and Simulation, 8:75-80, 1949.
RIBEIRO, J. L. D. Confiabilidade de componentes e sistemas. UFRGS/PPGEP,
Porto Alegre, 2003. Paginação irregular.
100
RICHTER, P. R.; LOPES, L. F. D. A confiabilidade relacionada ao
desenvolvimento de produtos e à gestão de qualidade total, XXIV ENEGEP,
Florianópolis, SC, 2004.
RIZZO, A. L. T.; CYMROT, R. Estudo e aplicações da técnica bootstrap. II
Jornada de Iniciação Científica, Universidade Presbiteriana Mackenzie.
ROZENFELD, H.; AMARAL, D. C.; ALLIPRANDINI, D. H.; FORCELLINI, F. A.;
TOLEDO, J. C.; SCALICE, R. K.; SILVA, S. L. Gestão de desenvolvimento de
produtos: uma referência para a melhoria do processo. São Paulo: Saraiva,
2006. 542 p.
SAGRILO, L.V. S. - Análise de Confiabilidade Estrutural Utilizando os Métodos Analíticos FORM e SORM (Tese de Doutorado, 1994). Programa de Engenharia Civil, COPPE/UFRJ. SANTOS, T. G. Modelo de confiabilidade associando dados de garantia e pós-garantia a três comportamentos de falhas (Tese de Doutorado, 2008). Universidade Federal do Rio Grande do Sul, UFRGS. SELLITTO, M. Formulação estratégica da manutenção industrial com base na confiabilidade dos equipamentos. Produção, v.15, n.1, p.44-59, 2005. SELLITTO, M.; BORCHADT, M.; ARAÚJO, D. Manutenção centrada em
confiabilidade: uma abordagem quantitativa. Anais do XXII ENEGEP. Curitiba:
ABEPRO. 2002.
SILVA, A. H. C. Aplicação da metodologia FMEA (failure mode and effect
analysis) para realização de análise de falhas em um sistema de pontes de
embarque de um aeroporto. XXVII ENEGEP, Foz do Iguaçu, outubro, 2007. 10p.
SILVA, W. V. Junior. Probabilidade de cobertura dos intervalos de confiança
assintóticos, p-Bootstrap e t-Bootstrap, para alguns parâmetros da
distribuição Weibull (Monografia, 2005). Universidade Estadual de Maringá, UEM.
SIQUEIRA, A. H. C. Manutenção centrada na confiabilidade: manual de
implementação. Rio de Janeiro: Qualitymark, 2005, 374 p.
STAMATIS, D. H. Failure mode and effects analysis: an integrate approach for
product design and process control. International Journal of Quality & Reliability
Management. Bradford, v. 13, n. 5, p. 8-26, 1996.
STIGLER, S. M. Citation Patterns in the Jounals of Statistics and Probability.
Statistical Science, 94-108, 1994.
101
TENG, S. H.; HO, S. Y. Failure mode and effects analysis: an integrate approach for
product design and process control. International Journal of Quality & Reliability
Management. Bradford, v. 13, n. 5, p. 8-26, 1996.
WUTTKE, R. André. Cálculo da disponibilidade e da posição na curva da banheira de uma válvula de processo petroquímico. ABEPRO, Universidade Federal de Santa Catarina, UFSC, 2008.
102
APÊNDICES
APÊNDICE A – PROGRAMA GERADOR DE AMOSTRAS ALEATÓRIAS DE
FALHAS IMPLEMENTADO EM LINGUAGEM FORTRAN
program gerador
implicit none
integer :: i,j,m,n
real :: x,o
character :: a
real, dimension(:), allocatable :: vec_erros, vec_erros2
n=0
externo: do
write(*,*) "VETOR COM OU SEM CENSURA, 'S' PARA SIM E 'N' PARA NAO: "
read(*,*) a
if(a=="n" .or. a=="N")then
write(*,*) "NUMERO DE POSICOES DO VETOR DE AMOSTRAS: "
read(*,*) m
allocate(vec_erros(m))
do i=1,m
call random_number(x)
x=ceiling(x*m)
x=int(x)
vec_erros(i)=x
vec_erros(i)=ceiling(vec_erros(i)/2)
n=n+vec_erros(i)
end do
write(*,*) "VETOR DE FALHAS EM CASA TEMPO: "
do i=1,m
write(*,*) vec_erros(i)
end do
write(*,*) "NUMERO TOTAL DE ITENS: "
write(*,*) n
exit externo
else if(a=="s" .or. a=="S")then
write(*,*) "NUMERO DE POSICOES DO VETOR DE AMOSTRAS: "
read(*,*) m
write(*,*) "NUMERO TOTAL DE ITENS DA AMOSTRA: "
read(*,*) j
allocate(vec_erros(m),vec_erros2(m))
do i=1,m
call random_number(x)
x=ceiling(x*m)
x=int(x)
if(x<j)then
vec_erros(i)=x
n=n+vec_erros(i)
vec_erros(i)=ceiling(vec_erros(i)/3)
if(n>j/2)then
103
vec_erros(i)=ceiling(vec_erros(i)/2)
end if
end if
end do
n=0
do i=1,m
n=n+vec_erros(i)
end do
write(*,*) "VETOR DE FALHAS EM CASA TEMPO: "
do i=1,m
write(*,*) vec_erros(i)
end do
write(*,*) "NUMERO DE ELEMENTOS TOTAL: "
write(*,*) n
exit externo
else
write(*,*) "!!!!!!!!!!!!!!!!!!!!!!!!!!!"
write(*,*) "!!! MENSAGEM INVALIDA !!!"
write(*,*) "!!!!!!!!!!!!!!!!!!!!!!!!!!!"
end if
end do externo
pause
end program gerador
104
APÊNDICE B – PROGRAMA QUE CALCULA OS INTERVALOS DE CONFIANÇA
DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP
PERCENTÍLICO IMPLEMENTADO EM LINGUAGEM FORTRAN
program boot_KB2
implicit none
integer :: i, j, n, m,k, num, num1,num2,num3,num4,num5,kk
real:: a,b,c,x,d,ep,f1,g,aa,bb,cc1,cc2,u3,ale,sum,rtb1,alpha1,alpha2
real, dimension(:),allocatable ::
vec_tempo,vec_falha,nsuj,somaposi,confb,vec_suj
real, dimension(:),allocatable ::
erroboot,mediart,confb1,erro_boots,cont,conf_kb
real, dimension(:),allocatable ::
inter_boot1,inter_boot2,percent1,percent2,var_u
real, dimension(:),allocatable ::
inter_boot11,inter_boot22,v,inter_kmi,inter_kmf
real, dimension(:),allocatable :: dvar,lg,vu,a1,inter_bi,inter_bf
real, dimension(:,:),allocatable ::
boots,acum,rtb,nsujb,acum1,somaposi1,soma_rtb
real, dimension(:,:),allocatable :: rtb_transp
write(*,*) " NUMERO INICIAL DE COMPONENTES EM TESTE: "
read(*,*) num
num1=num
num2=num
num3=num
num4=num
num5=num
write(*,*) " ENTRE COM O TAMANHO DA AMOSTRA ORIGINAL: "
read(*,*) n
write(*,*)
allocate(vec_tempo(n),vec_falha(n),nsuj(n),somaposi(n),confb(n),vec_suj(n))
allocate(erroboot(n),mediart(n),confb1(n),erro_boots(n),cont(n),conf_kb(n))
allocate(inter_boot1(n),inter_boot2(n),percent1(n),percent2(n),var_u(n))
allocate(inter_boot11(n),inter_boot22(n),lg(n),vu(n),v(n),a1(n),dvar(n))
allocate(inter_kmi(n),inter_kmf(n),inter_bi(n),inter_bf(n))
write(*,*) " ENTRE COM O NUMERO DE REAMOSTRAGENS: "
read(*,*) m
write(*,*)
allocate(boots(m,n),acum(m,n),rtb(m,n),nsujb(m,n),acum1(m,n),somaposi1(m,n)
,soma_rtb(m,n))
allocate(rtb_transp(n,m))
write(*,*) " ENTRE COM O VETOR DAS CATEGORIAS DE TEMPO DE FALHA: "
do i=1,n
read(*,*) vec_tempo(i)
end do
write(*,*)
write(*,*) " ENTRE COM O VETOR DE FALHAS PARA CADA CATEGORIA: "
do i=1,n
read(*,*) vec_falha(i)
end do
write(*,*)
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
!!! ESTIMADOR DE KAPLAN-MEIER!!!
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
105
do i=1,n
nsuj(i)=num
num=num-vec_falha(i)
end do
write(*,*) " CATEGORIAS || FALHAS"
do i=1,n
write(*,*) vec_tempo(i) , vec_falha(i)
end do
write(*,*)
do i=1,n
num4=num4-vec_falha(i)
vec_suj(i)=num4
end do
write(*,*) " CONFIABILIDADE PARA CADA CATEGORIA DA AMOSTRA ORIGINAL: "
conf_kb(1)=((num5-vec_falha(1))/num5) ! calculo da
confiabilidade com estimador
do i=2,n
conf_kb(i)=conf_kb(i-1)*((vec_suj(i-1)-vec_falha(i))/vec_suj(i-1))
end do
do i=1,n
write(*,*) vec_tempo(i) , conf_kb(i)
end do
v(1)=(vec_falha(1)/(num5*(num5-vec_falha(1))))
var_u(1)=(conf_kb(1)**2)*v(1)
do i=2,n
v(i)=v(i-1)+(vec_falha(i)/(vec_suj(i-1)*(vec_suj(i-1)-vec_falha(i))))
var_u(i)=(conf_kb(i)**2)*v(i)
end do
dvar=sqrt(var_u)
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
!!! METODO BOOTSTRAP !!!
!!! OBTENÇAO DAS AMOSTRAS BOOTSTRAP!!!
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
do i=1,m ! AMOSTRA BOOTSTRAP
do j=1,n
call random_number(x)
x=ceiling(x*n)
x=int(x)
boots(i,j)=vec_tempo(x)
acum(i,j)=vec_falha(x)
end do
end do
acum1=0.0
do k=1,500 ! ORDENA A MATRIZ
do i=1,m
do j=1,n-1
if(boots(i,j)>boots(i,j+1))then
a=boots(i,j)
boots(i,j)=boots(i,j+1)
boots(i,j+1)=a
b=acum(i,j)
acum(i,j)=acum(i,j+1)
acum(i,j+1)=b
end if
end do
end do
end do
somaposi1=0.0
do i=1,m
106
do j=1,n
do k=1,n
if (boots(i,k)==vec_tempo(j)) then
somaposi1(i,j)=somaposi1(i,j)+1
end if
end do
end do
end do
do i=1,m
do j=1,n
acum1(i,j)=somaposi1(i,j)*vec_falha(j)
end do
end do
do i=1,m
do j=1,n
num1=num1-acum1(i,j)
nsujb(i,j)=num1
if(nsujb(i,j)<0.0) then
nsujb(i,j)=0
end if
end do
num1=num2
end do
cont=0.0
do i=1,m
do j=1,n
if(somaposi1(i,j)/=0.0)then
cont(j)=cont(j)+1
end if
end do
end do
do i=1,m
rtb(i,1)=nsujb(i,1)/num3
end do
do i=1,m
do j=2,n
if(nsujb(i,j)/=0.0)then
rtb(i,j)=rtb(i,j-1)*(nsujb(i,j)/nsujb(i,j-1))
else
rtb(i,j)=0.0
end if
end do
end do
soma_rtb=0.0
confb=0.0
ale=0.0
do i=1,n
do j=1,m
soma_rtb(j,i)=soma_rtb(j,i)+somaposi1(j,i)*rtb(j,i)
confb(i)=confb(i)+rtb(j,i)
end do
end do
mediart=confb/m
write(*,*)
write(*,*) " MEDIA DE CADA CATEGORIA: "
do i=1,n
write(*,*) vec_tempo(i) , mediart(i)
end do
write(*,*)
107
ale=0.0
confb1=0.0
do i=1,n
do j=1,m
confb1(i)=confb1(i)+((rtb(j,i)-mediart(i))**2)
end do
end do
erro_boots=sqrt((1/(m-1.0))*(confb1)) ! ERRO BOOTSTRAP PARA CADA PONTO
write(*,*) " ERRO BOOTSTRAP PARA CADA CATEGORIA DE TEMPOS DE FALHA: "
do i=1,n
write(*,*) vec_tempo(i) , erro_boots(i)
end do
inter_boot1=conf_kb-(1.96*erro_boots) ! CALCULO DO INTERVALO BOOTSTRA-
T
inter_boot2=conf_kb+(1.96*erro_boots)
inter_boot11=conf_kb-(1.96*dvar) ! CALCULO DO
INTERVALO K-M
inter_boot22=conf_kb+(1.96*dvar)
vu=0.0
vu=(var_u/(conf_kb**2))/(log(conf_kb)**2)
a1=sqrt(vu)
fora1:do i=1,n
if((inter_boot11(i) < 0.0).or.(inter_boot11(i)>
1.0).or.(inter_boot22(i)<0.0).or.(inter_boot22(i)>1.0))then
do j=1,n
inter_kmi(j)= conf_kb(j)**(exp(+1.96*a1(j)))
inter_kmf(j)= conf_kb(j)**(exp(-1.96*a1(j)))
end do
exit fora1
end if
end do fora1
fora2:do i=1,n
if((inter_boot1(i) < 0.0).or.(inter_boot1(i)>
1.0).or.(inter_boot2(i)<0.0).or.(inter_boot2(i)>1.0))then
do j=1,n
inter_bi(j)=conf_kb(j)**(exp(+1.96*erro_boots(j)))
inter_bf(j)=conf_kb(j)**(exp(-1.96*erro_boots(j)))
end do
exit fora2
end if
end do fora2
rtb_transp=TRANSPOSE (rtb) ! TRANPOE A MATRIZ
DAS CONFIABILIDADES
open(1,file='saida.txt')
do k=1,1000 ! ORDENA A MATRIZ
TRANSPOSTA
do i=1,n
do j=1,m-1
if(rtb_transp(i,j)>rtb_transp(i,j+1))then
a=rtb_transp(i,j)
rtb_transp(i,j)=rtb_transp(i,j+1)
rtb_transp(i,j+1)=a
end if
end do
end do
end do
do i=1,m
write(1,*) rtb_transp(:,i)
end do
108
close(1)
alpha1=nint(0.025*m)
alpha2=nint(0.975*m)
do i=1,n
percent1(i)=rtb_transp(i,alpha1)
percent2(i)=rtb_transp(i,alpha2)
end do
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
!!!INTERVALOS DE CONFIANCA!!!
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
write(*,*)
write(*,*) " INTERVALO DE CONFIANCA DO ESTIMADOR DE KAPLAN-MEIER: "
do i=1,n
write(*,*) inter_boot11(i) , conf_kb(i) , inter_boot22(i)
end do
write(*,*)
write(*,*) " INTERVALO DE CONFIANCA DO ESTIMADOR DE KAPLAN-MEIER AJUSTADO:
"
do i=1,n
write(*,*) inter_kmi(i) , conf_kb(i) , inter_kmf(i)
end do
write(*,*)
write(*,*) " INTERVALO BOOTSTRAP-t DO ESTIMADOR DE KAPLAN-MEIER: "
do i=1,n
write(*,*) inter_boot1(i) , conf_kb(i) , inter_boot2(i)
end do
write(*,*)
write(*,*) " INTERVALO BOOTSTRAP-t DO ESTIMADOR DE KAPLAN-MEIER AJUSTADO"
do i=1,n
write(*,*) inter_bi(i) , conf_kb(i) , inter_bf(i)
end do
write(*,*)
write(*,*) " INTERVALO BOOTSTRAP PERCENTILICO DO ESTIMADOR DE KAPLAN-MEIER:
"
do i=1,n
write(*,*) percent1(i) , conf_kb(i) , percent2(i)
end do
pause
end program boot_KB2=