UNIVERSIDADE FEDERAL DO PARANÁ ANDRÉ LUIZ EMIDIO DE …

UNIVERSIDADE FEDERAL DO PARANÁ

ANDRÉ LUIZ EMIDIO DE ABREU

INTERVALO DE CONFIANÇA BOOTSTRAP PARA VALORES DA FUNÇÃO DE

CONFIABILIDADE ESTIMADOS PELO MÉTODO DE KAPLAN-MEIER

CURITIBA

2011

ANDRÉ LUIZ EMIDIO DE ABREU

INTERVALO DE CONFIANÇA BOOTSTRAP PARA VALORES DA FUNÇÃO DE

CONFIABILIDADE ESTIMADOS PELO MÉTODO DE KAPLAN-MEIER

Dissertação apresentada como requisito parcial a obtenção do grau de Mestre em Ciências pelo Programa de Pós-Graduação em Métodos Numéricos em Engenharia, do Departamento de Construção Civil e do Departamento de Matemática da UFPR, na Área de Concentração em Programação Matemática e na Linha de Pesquisa em Métodos Estatísticos Aplicados a Engenharia. Orientador: Prof. Dr. Anselmo Chaves Neto

CURITIBA

2011

TERMO DE APROVAÇÃO

André Luiz Emidio de Abreu

“Intervalo de Confiança “Bootstrap” para Valores da Função de Confiabilidade Estimados pelo Método de

Kaplan-Meier”Dissertação aprovada como requisito parcial para obtenção do grau de Mestre no

Curso de Pós-Graduação em Métodos Numéricos em Engenharia - Área de Concentração

em Programação Matemática, Setores de Tecnologia e de Ciências Exatas da Universidade

Federal do Paraná, pela seguinte banca examinadora:

Programa de Pós-Graduação em Métodos Numéricos em Engenharia - PPGMNE da UFPR

Prof. Leandro dos Santos Coelho, D.Eng. PPGEPS / PUC-PR e PPGEE/UFPR

Prof. Lednardg^amo^Emmendorfer, D.Sc.PPGMC/ FURG /

Prof. Alexandre Rasi Aoki, c EnPPGEE / UFPR e Inst. De TEc. Para o Desenv. - LACTEC

Curitiba, 04 de abril de 2011.

AGRADECIMENTOS

Agradeço em primeiro lugar a Deus pela força que me deu durante o

percurso de mais uma etapa vencida com sucesso na minha vida.

Ao professor Dr. Anselmo Chaves Neto, pela orientação e disposição para

com este trabalho.

Aos meus familiares, principalmente minha avó Venina Emidio pelo apoio

irrestrito na minha trajetória, propiciando as condições para a conclusão deste curso.

Aos professores do Programa de Pós-Graduação em Métodos Numéricos

em Engenharia (PPGMNE) da Universidade Federal do Paraná pelo esforço e

dedicação no decorrer das disciplinas.

Aos colegas do mestrado pela ajuda prestada no decorrer do curso.

A CAPES pelo apoio financeiro.

Agradeço a todos que direta ou indiretamente contribuíram para a conclusão

deste trabalho.

RESUMO

A análise de confiabilidade é uma área importante, tanto para a indústria que lança novos produtos quanto para os consumidores que sempre exigem produtos cada vez melhores e que tenham uma grande durabilidade. Com isso varias técnicas foram, e ainda são, desenvolvidas para esta finalidade. Uma delas é o estimador de Kaplan-Meier, estimador da função de confiabilidade, o estimador de Kaplan-Meier é um estimador não-paramétrico assintótico, pois a assintoticidade exige que as amostras sejam grandes para que as estimativas dos valores da confiabilidade fiquem próximas aos valores reais. Uma maneira de tentar corrigir isso é a utilização de técnicas computacionalmente intensivas, tais como o método bootstrap, que é uma técnica de reamostragem proposto por Efron em 1979, que foi utilizado para avaliar a variabilidade de uma estatística qualquer. O trabalho apresenta a aplicação do método bootstrap ao estimador não-paramétrico Kaplan-Meier, e assim obter intervalos de confiança bootstrap para os valores das estimativas da confiabilidade. Foi desenvolvido um programa computacional em linguagem Fortran do método bootstrap aliado ao estimador de Kaplan-Meier, foram testadas diversas amostras de tempo de falha e comparados os resultados com os do estimador. Ao final concluiu-se que a aplicação do método resultou em resultados satisfatórios. PALAVRAS-CHAVE: Análise de confiabilidade. Bootstrap. Kaplan-Meier.

ABSTRACT

The reliability analysis is a important field for the industrial as it launches new products and for consumers who demand products always better and that have a great durability. So many techniques have been and still are developed to apply this study. One is the Kaplan-Meier estimator, estimator of the reliability function. The Kaplan-Meier estimator is a estimator nonparametric asymptotic, to be asymptotic requires that the samples are large for the estimates of the reability remain close to actual values. One way of trying to fix this is to use computationally intensive techniques, such as the bootstrap method, which is a resampling technique proposed by Efron in 1979, which was used to assess the variability of a statistic any. The paper presents the application of the bootstrap method to the nonparametric Kaplan-Meier estimator, and thereby obtain confidence intervals bootstrap for values the estimates of reliability. A computer program was developed in Fortran of bootstrap method applied to Kaplan-Meier estimator, were tested several samples of failure time and compared the results with the results of estimator. In the end it was concluded that the method achieved satisfactory results. KEYWORDS: Reability Analysis. Bootstrap. Kaplan-Meier.

LISTA DE FIGURAS

FIGURA 1 – CRONOGRAMA DE PLANEJAMENTO DA QUALIDADE DO PRODUTO ................................................................................................................ 22

FIGURA 2 – EVOLUÇÃO DA CONFIABILIDADE NO DESENVOLVIMENTO DE PRODUTOS .............................................................................................................. 23

FIGURA 3 – CLASSIFICAÇÃO DAS FALHAS .......................................................... 26

FIGURA 4 – CURVA DA BANHEIRA E CICLO DE VIDA DE EQUIPAMENTOS ...... 27

FIGURA 5 – TIPOS DE CENSURA ........................................................................... 31

FIGURA 6 – QUATRO FUNÇÕES BÁSICAS DA CONFIABILIDADE ....................... 33

FIGURA 7 – FUNÇÕES DE CONFIABILIDADE )(1 tR E )(2 tR ................................. 34

FIGURA 8 – PROCEDIMENTO GERAL DE FMEA ................................................... 42

FIGURA 9 – FORMULÁRIO FMEA ........................................................................... 42

FIGURA 10 – HISTOGRAMA DA DISTRIBUIÇÃO DE FREQUÊNCIAS DOS TEMPOS DE FALHA POR ANO ............................................................................... 44

FIGURA 11 – VALORES DAS ESTIMATIVAS DA CONFIABILIDADE E LIMITES DE CONFIANÇA ............................................................................................................. 49

FIGURA 12 – CONFIABILIDADE ESTIMADA ........................................................... 49

FIGURA 13 – ALGORITMO DA DISTRIBUICAO BOOTSTRAP DA ESTATISTICA Tn(x,F) ....................................................................................................................... 59

FIGURA 14 – HISTOGRAMA DA AMOSTRA COM 10 CATEGORIAS DE TEMPOS DE FALHA ................................................................................................................. 76

FIGURA 15 – INTERVALOS DA AMOSTRA COM 10 CATEGORIAS K-M E BOOTSTRAP-T ......................................................................................................... 78

FIGURA 16 – INTERVALOS DA AMOSTRA COM 10 CATEGORIAS K-M E B. PERCENTIS .............................................................................................................. 78







LISTA DE TABELAS

TABELA 1 – EQUAÇÕES DAS FUNÇÕES )(tf , )(tR E )(th PARA DIFERENTES

MODELOS DE PROBABILIDADE ............................................................................. 35

TABELA 2 – RELAÇÕES ENTRE AS FUÇÕES )(tF , )(tf , )(tR E )(th .................. 36

TABELA 3 – AMOSTRAS BOOTSTRAP OBTIDAS DA ORIGINAL .......................... 65

TABELA 4 – ESTIMATIVAS BOOTSTRAP DA CONFIABILIDADE .......................... 65

TABELA 5 – ESTATÍSTICAS BOOTSTRAP PARA CADA CATEGORIA DE TENPOS DE FALHA ................................................................................................................. 65

TABELA 6 – INTERVALOS DE CONFIANÇA DE KAPLAN-MEIER E BOOTSTRAP ............................................................................................................ 66

TABELA 7 – CATEGORIAS DE TEMPOS DE FALHA, NÚMERO DE FALHAS E CONFIABILIDADE ESTIMADA PELO ESTIMADOR DE KAPLAN-MEIER PARA 10 CATEGORIAS ........................................................................................................... 77

TABELA 8 – INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP PERCENTILICO PARA 10 CATEGORIAS ........... 77

TABELA 9 – AMPLITUDE DOS INTERVALOS DE CONFIANÇA 10 CATEGORIAS ...................................................................................................... 77


TABELA 11 – INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP PERCENTILICO PARA 11 CATEGORIAS ........................................................................................... 80








SUMÁRIO

1 INTRODUÇÃO ....................................................................................................... 12

1.1 PROBLEMA ........................................................................................................ 14

1.2 OBJETIVO ........................................................................................................... 15

1.3 JUSTIFICATIVA .................................................................................................. 15

1.4 ESSTRUTURA DA DISSERTAÇÃO ................................................................... 16

2 REVISÃO DE LITERATURA ................................................................................. 17

2.1 CONFIABILIDADE DE PRODUTOS E SISTEMAS ............................................. 17

2.1.1 Aplicação da confiabilidade no desenvolvimento de produtos ......................... 18

2.1.2 Evolução da confiabilidade de um produto ....................................................... 22

2.1.3 Definição de confiabilidade ............................................................................... 24

2.1.3.1 Falha ............................................................................................................. 25

2.1.3.2 Taxa de falha ................................................................................................. 26

2.1.3.3 Curva da banheira ......................................................................................... 27

2.1.3.4 Tempo médio entre falhas (MTBF) ................................................................ 29

2.1.4 Censura ............................................................................................................ 30

2.1.5 Função de confiabilidade .................................................................................. 31

2.1.5.1 Definição matemática da confiabilidade ........................................................ 31

2.1.5.2 Funções básicas de confiabilidade ................................................................ 32

2.1.6 Função de taxa de falha ................................................................................... 34

2.2 TESTES ACELERADOS ..................................................................................... 36

2.2.1 Tipos de testes acelerados ............................................................................... 37

2.3 ANÁLISE DOS EFEITOS E MODOS DE FALHA (FMEA)................................... 39

2.4 TÉCNICAS NÃO-PARAMÉTRICAS .................................................................... 43

2.4.1 Estimação na ausência e presença de censura ............................................... 43

2.4.2 Estimador de Kaplan-Meier .............................................................................. 45

2.4.2.1 Kaplan-Meier com estratificação ................................................................... 50

2.4.3 Testes para comparação de curvas de confiabilidade ..................................... 50

2.4.3.1 Teste de log-rank .......................................................................................... 50

2.4.3.2 Teste de Gehan ............................................................................................. 52

2.4.3.3 Teste de Peto ................................................................................................ 53

2.5 TÉCNICAS COMPUTACIONALMENTE INTENSIVAS ....................................... 54

2.5.1 Método Jackknife ............................................................................................. 55

2.5.2 Obtenção da amostra Jackknife ....................................................................... 55

2.5.3 Método bootstrap ............................................................................................. 56

2.5.3.1 Método bootstrap não-paramétrico ............................................................... 57

2.5.3.1.1 Definição e propriedades ............................................................................ 57

2.5.3.2 Método bootstrap paramétrico ....................................................................... 62

3 MATERIAL E MÉTODO ......................................................................................... 63

3.1 SEQUÊNCIA DA APLICAÇÃO DO MÉTODO BOOTSTRAP .............................. 64

3.2 ERRO PADRÃO BOOTSTRAP ........................................................................... 66

3.3 INTERVALOS DE CONFIANÇA BOOTSTRAP ................................................... 67

3.3.1 Intervalo bootstrap-t ......................................................................................... 67

3.3.2 Intervalo de confiança baseado nos percentis bootstrap ................................. 68

3.3.3 Intervalo de confiança bootstrap BCPB ............................................................ 69

3.3.4 Intervalos de confiança percentis aBC ............................................................. 70

3.4 GERADOR ALEATÓRIO DE AMOSTRAS DE FALHAS ..................................... 72

3.5 OBTENÇÃO DO INTERVALO DE CONFIANÇA BOOTSTRAP .......................... 73

3.6 COMPARAÇÃO DOS INTERVALOS DE CONFIANÇA DE KAPLAN-MEIER E O BOOTSTRAP ............................................................................................................ 74

4 RESULTADOS ....................................................................................................... 76

4.1 APLICAÇÃO DO MÉTODO BOOTSTRAP DOS INTERVALOS DE CONFIANÇA ............................................................................................................. 76

4.1.1 Amostra gerada com 10 observações com 33 itens, censurada ...................... 76

4.1.2 Amostra gerada com 11 observações com 39 itens, não censurada ............... 79



4.1.5 Amostra gerada com 10 observações com 34 itens, não censurada ............... 89


5 CONCLUSÃO ........................................................................................................ 95

REFERÊNCIAS ......................................................................................................... 97

APÊNDICES ........................................................................................................... 102

APÊNDICE A .......................................................................................................... 102

APENDICE B .......................................................................................................... 104

12

1. INTRODUÇÃO

Durante a 2a Guerra Mundial, pesquisas científicas foram desenvolvidas e

aplicadas ou, ainda, outras já desenvolvidas foram aplicadas. Um exemplo que pode

ser citado é o radar (desenvolvido pelo inglês Watson Watt em 1938-1940), outro

seria o método de otimização simplex (desenvolvido pelo americano George Bernard

Dantzig, com resultados publicados em 1947) e, é o caso também do

desenvolvimento da confiabilidade. Nessa época, os sistemas eletrônicos tiveram

uma vasta aplicabilidade e, então, evoluíram e se tornaram complexos surgindo

vários problemas operacionais. A solução desses problemas exigia abordagens

metódicas e bem formuladas. Assim, as forças armadas americanas criaram comitês

de avaliação de problemas de confiabilidade.

No ano de 1952, o Departamento de Defesa americano coordenou os

esforços do exército americano, força aérea e marinha e criou o Advisory Group on

Reability of Electronic Equipment (AGREE). Este grupo influenciou decisivamente

toda a abordagem científica sobre confiabilidade e publicou muitos artigos relatando

trabalhos realizados, principalmente sobre equipamentos eletrônicos militares.

O emprego das técnicas de qualidade no Japão (1947-1950) e nos países

desenvolvidos fez com que a confiabilidade fosse utilizada cada vez mais, não só na

indústria bélica, mas também (e principalmente) na indústria de bens e serviços.

Dessa forma, passou a ser importante nas fases industriais ou de serviços

seguintes: operação, manutenção, assistência técnica e satisfação do cliente

(Chaves Neto, 2010).

Seguindo essa tendência, a análise de confiabilidade foi uma das áreas da

Estatística que mais cresceu nas últimas duas décadas do século passado. Isso se

deve ao desenvolvimento e ao aperfeiçoamento de técnicas estatísticas em conjunto

com computadores cada vez mais velozes. Essa é a área da Estatística, segundo

Bailar III e Mosteller (1992), que mais se destacou no período de 1979 até 1989,

tanto na área da Engenharia, quanto na área da Medicina onde é conhecida como

análise de sobrevivência. Os dois artigos mais citados em toda literatura estatística

no período de 1987 a 1989 foram, segundo Stigler (1994), o do estimador de

Kaplan-Meier para a função de confiabilidade (1958) (sobrevivência) e o modelo de

Cox (1972).

13

Na análise de confiabilidade, a variável resposta é, geralmente, o tempo até

a ocorrência de algum evento de importância relacionada com falha. Esta variável é

denominada como tempo de falha e é considerada até o tempo em que, por

exemplo, o produto falhe, uma estrutura vá a colapso, ou um paciente morra, no

caso da Medicina.

Uma das características dos dados de tempo de falha é a presença de

censura, que é a observação parcial da resposta. A censura aparece geralmente

quando um item, neste caso item pode ser considerado um componente de um

sistema, uma peça de um produto ou até mesmo o produto, ou sistema, como um

todo, acaba ultrapassando o ponto, ou tempo, limite do teste de vida. Geralmente,

este ponto se refere ao tempo de uso, número de vezes que o produto é utilizado até

atingir um número pré-estabelecido de falhas ou quando a falha ocorre de uma

forma que não era esperada, por exemplo, em um teste de vida em que um monitor

está sendo testado para avaliar o tempo em que o tubo de imagem suporta, em altas

temperaturas, até que seu sistema eletrônico acabe falhando. Neste caso ocorreria

censura do item por que a falha ocorreu no sistema eletrônico, e não no tubo. Na

Medicina, seja o caso de um paciente que está sendo tratado de câncer de pulmão,

mas acaba morrendo atropelado, ou de outra forma que não esteja ligada ao câncer.

O paciente é retirado do estudo por censura.

Nos casos em que não ocorrem censuras, as técnicas estatísticas clássicas,

como análise de regressão e outras de planejamento de experimentos, podem ser

utilizadas na análise dos dados. Infelizmente isso não acontece com frequência, logo

não se pode utilizar tais técnicas, uma vez que elas necessitam de todos as

categorias de tempos de falha. Logo se faz necessário o uso de métodos de análise

de confiabilidade, sobrevivência, que possibilitam incorporar na análise estatística a

informação contida nos dados censurados. Para esses problemas foram

desenvolvidas diversas técnicas estatísticas, um exemplo são os estimadores não-

paramétricos, que tentam aproximar os valores da função de confiabilidade. Um

muito conhecido e usado é o estimador não-paramétrico de Kaplan-Meier, outro

também conhecido é o estimador não-paramétrico de Nelson-Aalen (Colossimo,

2006). O primeiro, Kaplan-Meier, é o estimador utilizado neste trabalho, por ter sido

comparado com o de Nelson-Aalen e obtido valores mais próximos da função de

confiabilidade real.

14

As aplicações do estimador de Kaplan-Meier são diversas, tanto na

Medicina, quanto na Engenharia e na Economia, além de outras áreas da ciência

moderna. Alguns exemplos de aplicações em outras áreas podem ser observados,

por exemplo, na área criminalista, onde estudam o tempo entre a liberação de

presos e a ocorrência de novos crimes; estudiosos do trabalho se concentram em

mudanças de emprego, desempregos, promoções e aposentadorias; demógrafos,

com nascimentos, mortes, casamentos, divórcios e migrações. Mas, neste trabalho,

a abordagem será estritamente na análise de confiabilidade de produtos e sistemas.

Portanto, a maioria das definições, exemplos, ilustrações ou até mesmo citações são

voltados à confiabilidade de produtos e sistemas.

1.1 PROBLEMA

Como mencionado anteriormente, o estudo da confiabilidade vem crescendo

muito (Bailar III e Mosteller, 1992), demonstrando o interesse dos fabricantes em

fornecer produtos cada vez mais confiáveis e seguros. Para isso, várias técnicas

foram e ainda estão sendo desenvolvidas, e a análise de confiabilidade é uma área

da estatística que tem recebido uma atenção acentuada de pesquisadores.

Com esse crescimento, várias técnicas estatísticas foram desenvolvidas, tais

como os estimadores não-paramétricos da função de confiabilidade. Um método de

estimação da função de confiabilidade que vem sendo utilizado por vários

estatísticos e engenheiros, é o estimador não-paramétrico de Kaplan-Meier,

proposto em 1958, também denominado estimador Limite-produto é uma adaptação

da função de confiabilidade empírica. Embora seja um estimador muito confiável, ele

é assintótico, logo necessita de uma amostra grande de dados de falha, mas para

produtos que ainda serão lançados, o fabricante não possui tantos dados dos

tempos de falha, ou possui dados coletados do tempo de garantia que geralmente

não são muitos, impondo ao fabricante que faça vários testes de vida acelerados.

Mas isso pode levar a uma tabela de valores tendenciosos, sendo pouco confiável.

Logo, o principal problema é encontrar estimativas razoáveis, perto dos

valores das estimativas reais, mesmo com amostras de falha de tamanho pequeno.

Isso mostra que é de extrema importância a utilização de técnicas junto aos

estimadores não-paramétricos para se obter estimativas cada vez melhores e mais

15

confiáveis, além, também, do ganho de tempo que isso pode proporcionar com o

auxílio de computadores.

1.2 OBJETIVO

O objetivo deste trabalho é utilizar a técnica computacionalmente intensiva

chamada bootstrap, para determinar o erro padrão bootstrap e a partir deste erro

padrão construir intervalos de confiança bootstrap para os valores da função de

confiabilidade estimados pelo método de Kaplan-Meier. Verificando se este erro

padrão bootstrap é menor que o do estimador, e que os intervalos de confiança

bootstrap sejam mais curtos em torno da estimativa da função que os intervalos do

estimador clássico. Com isso construir intervalos de confiança mais próximos da

realidade.

Como complementação do trabalho e para a realização da aplicação e

análise, desenvolveu-se um programa computacional experimental, programado na

linguagem Fortran 2003, para os cálculos do método bootstrap e do estimador de

Kaplan-Meier, para verificar a sua eficiência, além de um gerador aleatório de

tempos de falha, utilizado para simular amostras de falha.

1.3 JUSTIFICATIVA

O trabalho se justifica por utilizar uma metodologia robusta na estimação dos

valores da função de confiabilidade, primeiramente aplicada a produtos e sistemas,

mas podendo ser ampliada para outras áreas da ciência, tais como na Medicina,

Economia, confiabilidade estrutural, entre outras. Logo quando se pretende lançar

um produto, um prédio, uma ponte, etc., é necessário saber quanto tempo, na

média, ele pode durar, quantos quilos pode suportar, quantas vezes em média pode

ser acionado, etc. Assim, como os estimadores não-paramétricos da função de

confiabilidade são todos assintóticos, necessita-se de novas técnicas aliadas a estes

estimadores para se obter respostas confiáveis.

Portanto, este trabalho apresenta uma aplicação do método

computacionalmente intensivo bootstrap, associado ao estimador de Kaplan-Meier, e

assim com essa aplicação, conseguir valores das estimativas mais próximas da

16

realidade, uma vez que o método bootstrap foi desenvolvido para avaliar a

variabilidade de estatísticas com base em dados de amostras iniciais conhecidas.

Por ser uma técnica computacionalmente intensiva, fica totalmente inviável efetuar

os cálculos manualmente. Portanto, precisa-se de técnicas próprias para isso, e a

principal e fundamental é o computador além de softwares específicos para cálculos

matemáticos. Portanto, utilizou-se dos meios de computação avançados e softwares

matemáticos, que podem ser adquiridos. Como os programas desenvolvidos são de

fácil entendimento, qualquer pessoa que tenha domínio sobre o estudo da

confiabilidade poderá utilizá-los com facilidade.

1.4 ESTRUTURA DA DISSERTAÇÃO

O trabalho está composto por esta introdução, como capítulo 1, revisão de

literatura no capítulo 2, abrangendo algumas definições de confiabilidade de

produtos e sistemas, suas equações principais, temas importantes que devem ser

considerados, como definições de falha, censura, entre outras, o estimador de

Kaplan-Meier e o método computacionalmente intensivo de reamostragens

bootstrap. O capítulo 3 apresenta os materiais e os métodos utilizados no trabalho,

com um aprofundamento no erro padrão e intervalos de confiança bootstrap. No

quarto capitulo apresenta-se os resultados e análises feitas entre o método do

bootstrap aplicado ao estimador de Kaplan-Meier e o próprio estimador, tais como os

resultados dos intervalos de confiança e do erro padrão. Finalmente, tem-se a

conclusão e as referências.

17

2. REVISÃO DE LITERATURA

2.1 CONFIABILIDADE DE PRODUTOS E SISTEMAS

Nos últimos anos do século passado, houve uma ênfase na Gestão de

Qualidade Total, mostrando que a qualidade é tarefa de todos. Houve tempos em

que nas empresas a qualidade era apenas tarefa do departamento do Controle de

Qualidade. Nos dias de hoje, sob o guarda-chuva da Gestão da Qualidade Total, são

incluídas as atitudes da alta liderança, do planejamento estratégico, da gestão de

recursos humanos, da gestão dos processos, dos próprios resultados obtidos do

negócio e da satisfação do cliente.

Referindo-se ao produto em si, que vai determinar a satisfação do cliente e

consequentemente a sua retenção, está o desempenho das características técnicas

ao longo do período estimado de vida do produto. Neste momento, é importante

conceituar confiabilidade como sendo a probabilidade de que um produto

desempenhe suas funções previstas por um período de tempo sob condições

específicas de operação pré-determinados. É difícil encontrar uma pessoa que

nunca teve um produto que deixou de funcionar ocasionando inúmeros problemas

ao próprio usuário. As definições clássicas de confiabilidade e falhas serão

abordadas a seguir nas próximas seções deste capítulo.

Devido à globalização, cada vez mais os produtos vêm sendo

comercializados entres os países. As exportações e importações de produtos de

diferentes países, com diferentes condições climáticas e de estilos de usos, como

por exemplo, os automóveis que foram desenvolvidos em países de origem e

passaram a ser vendidos em outros países sob outras condições de qualidade de

combustíveis e de estrada, por essas diferenças podendo trazer problemas aos

usuários. Essa evolução torna fundamental garantir os quatro aspectos básicos da

confiabilidade: valor da probabilidade, o tempo de uso, o desempenho e as

condições de operação, para poder se tornar, ou se manter, competitivo no mercado

mundial.

Com a complicação técnica dos produtos que vem sendo lançados

atualmente, torna-se cada vez mais importante conhecer o MTBF (Mean Time

Between Failures – tempo médio entre falhas) de cada produto, que permite avaliar

18

o volume de serviços de assistência técnica, seu dimensionamento, seus requisitos

de mão-de-obra ou até um programa de manutenção preventiva se necessário.

Assim, é importante mencionar que o desenvolvimento e a introdução de

novos produtos que obedeçam as especificações durante um tempo pré-

determinado, inserem-se no modelo sistêmico da Qualidade Total.

2.1.1 Aplicação da confiabilidade no desenvolvimento de produtos

Num ambiente de alta competição, o que é hoje muito comum nos

mercados, é importante que as empresas sejam capazes de determinar e controlar a

confiabilidade dos seus produtos. Sabendo-se o nível de confiabilidade dos

produtos, pode-se saber de antemão se as expectativas dos clientes quanto a este

produto serão atingidas, bem como o nível de qualidade do mesmo. Nesta definição,

produtos são componentes, subsistemas ou sistemas que constituem um produto ou

serviço.

A principal aplicação de confiabilidade em Engenharia é na prevenção de

falhas. O conceito de falha será apresentado a seguir, mas pode-se adiantar que,

falha pode ser definida como término da disponibilidade de um produto, para realizar

sua função requerida (Hoyland e Rausand, 1994). Falhas podem ser classificadas

conforme seus modos de ocorrência. Um modo de falha pode ser descrito como o

efeito causador da falha em um produto. Como os produtos são desenvolvidos para

realizar uma ou mais funções, um modo de falha é, portanto, definido como a não

realização de uma destas funções. A maioria dos produtos apresenta diferentes

modos de falha.

Saindo da teoria e entrando na prática, para analisar a confiabilidade de um

sistema, o analista deve conduzir um modelo estocástico que o descreva ou

escolher um modelo já existente que se adapte a ele. O modelo adotado deve

descrever as funções essenciais do sistema, não sendo necessária a exatidão nesta

descrição. Neyman (1954, apud Hoyland e Rausand, 1994), um dos pioneiros da

matemática estatística, propôs que toda tentativa de uso da matemática para o

estudo de algum fenômeno real deve iniciar com a construção de um modelo

matemático. Este modelo matemático proposto será apropriado se não ignorar

detalhes relevantes na compreensão do fenômeno estudado. A solução do problema

matemático pode estar correta e não condizer com a realidade, simplesmente

19

porque a suposição original do modelo matemático diverge das condições práticas

do problema considerado. Para ter certeza que o modelo matemático adotado é

adequado, deve-se predizer um número mínimo de resultados a partir deste modelo

e compará-los com observações realizadas.

Segundo Box et al. (1978) nenhum modelo matemático de fenômenos físicos

é totalmente correto. Em algumas situações particulares, alguns modelos são mais

úteis do que outros. Considerando que a modelagem matemática permite um estudo

mais aprofundado do fenômeno em estudo, a obtenção de modelos matemáticos é a

chave em estudos de Confiabilidade.

Na maioria dos estudos de sistemas técnicos (mecânicos, químicos,

elétricos, entre outros) é necessário trabalhar com modelos que representam os

sistemas analisados. Estes modelos podem ser gráficos ou matemáticos. Os

modelos matemáticos utilizados devem ser capazes de apresentar dados e

possibilitar o uso de métodos matemáticos e estatísticos para estimar parâmetros de

confiabilidade, segurança e risco. Os modelos matemáticos devem apresentar as

seguintes características:

(i) Ser suficientemente simples, para serem tratáveis através dos métodos

matemáticos e estatísticos disponíveis;

(ii) Ser suficientemente realistas, para deduzir os resultados da relevância

pratica (Hoyland e Rausand, 1994).

A análise de confiabilidade pode ser considerada uma tarefa multidisciplinar,

pois envolve diferentes áreas de conhecimentos na execução. Os conhecimentos e

recursos mínimos para a realização de um estudo de confiabilidade são os

seguintes:

(i) Conhecimento dos aspectos técnicos do sistema, ou produtos

analisados e dos mecanismos físicos que podem conduzir à falhas deste sistema;

(ii) Conhecimento dos conceitos matemático-estatísticos e métodos

estatísticos necessários na análise;

(iii) Disponibilidade de dados reais para a estimativa de parâmetros e teste

dos modelos desenvolvidos;

(iv) Disponibilidade de programas computacionais apropriados para a

análise de sistemas complexos.

20

A quantidade de recursos necessários na análise de Confiabilidade depende

da complexidade do sistema enfocado e profundidade da análise que se deseja

realizar (Hoyland e Rausand, 1994).

A análise de confiabilidade pode ser administrada como um sub-processo do

processo de desenvolvimento de produtos, uma vez que se pode determinar

atividades relativas à confiabilidade em diversas etapas do desenvolvimento de

produtos. Desde uma etapa preliminar, quando são estipuladas as metas de

confiabilidade, até uma etapa de início de produção, quando os dados de

confiabilidade de máquinas-piloto são avaliados e comparados com as metas

anteriormente traçadas.

Os manuais de referência do sistema da Qualidade QS9000 fazem

referência a análise de confiabilidade como parte integrante do processo de

desenvolvimento de produtos. A Figura 1 ilustra como DVP&R (Design Verification

Plan & Report – Relatório e Plano de Verificação do Projeto), está contido no

processo de desenvolvimento de produtos, conforme previsto no manual APQP

(advance product quality planning – planejamento avançado da qualidade do

produto) das normas QS9000, e sua correlação com a engenharia de confiabilidade.

Já na fase do planejamento do projeto, é importante abordar o tema

confiabilidade, estabelecendo-se as metas de qualidade e confiabilidade pretendidas

para o novo produto. Nessa fase são estabelecidos os padrões referenciais

(benchmarks), no qual o novo produto deverá espelhar-se em termos de qualidade e

confiabilidade. Não somente dados referenciais ao produto são considerados, mas

também padrões relativos a processos de fabricação e montagem. Dados de grande

valia nesta avaliação são os estudos de confiabilidade em produtos similares e/ou

concorrentes, bem como o uso dos dados de garantia que demonstrem a

confiabilidade de produtos correntes ou que serão substituídos. São analisados

dados que podem ser reportados, como tempo médio entre falhas (MTBF – mean

time between failures), o número de falhas por máquina em um determinado período

(pode ser o período de garantia), ou uma informação de grande valia para análises

gerenciais, o valor gasto em garantia como um percentual de receitas financeiras.

Para se estipular as metas de confiabilidade e qualidade também devem ser

adotadas técnicas que traduzam a expectativa dos clientes, tal como o QFD (Quality

Function Deployment - desdobramento da função qualidade), por exemplo. Os

dados de confiabilidade também podem ser expressos em um percentual de falhas

21

admitido com um determinado nível de uso do equipamento, bem como o número de

defeitos por milhão de peças produzidas.

A segunda fase da abordagem da confiabilidade ocorre durante o

desenvolvimento de produtos. Agora, as metas de confiabilidade estabelecidas na

fase de planejamento passam a nortear o desenvolvimento do projeto e dos

processos de fabricação. Os materiais e tolerâncias dimensionais são selecionados

conforme as características mecânicas e químicas necessárias para atender os

requisitos especificados na etapa anterior.

A confiabilidade do produto deve ser verificada em campo. Mas muito antes

da construção de protótipos para testes de campo ou para testes de laboratório,

diversas práticas podem ser adotadas, as quais propiciam a verificação antecipada

se determinadas peças e/ou subconjuntos atendem as especificações de

engenharia. Neste momento são estabelecidos os requisitos funcionais, de

durabilidade e de aparência dos componentes e conjuntos. Estas verificações

antecipadas são muito importantes para reduzir o custo do projeto e o ciclo de

desenvolvimento. São feitas análises virtuais de desempenho de peças, como, por

exemplo, análises de elementos finitos, realidade virtual e simulações de solicitações

dinâmicas.

Uma vez realizadas as análises virtuais selecionadas para o projeto em

questão, pode-se iniciar a fase de testes de bancada em componentes e, testes de

campo, com protótipos. Desta fase de testes em diante se inicia o monitoramento

dos dados de confiabilidade através do registro dos dados de falhas, para se plotar

as curvas de confiabilidade e monitorar a situação real contra os objetivos

estipulados na fase de planejamento.

A confiabilidade do produto é monitorada ao longo das outras fases do

desenvolvimento, pelo registro e análise de falhas, permitindo uma comparação da

evolução da confiabilidade do produto da fase de protótipos para a fase de lote piloto

e início de produção.

Este monitoramento permite reportar para os responsáveis se as metas de

confiabilidade serão atingidas e se as melhorias feitas ao longo do desenvolvimento

estão sendo eficazes em elevar o tempo entre falhas do produto.

22

FIGURA 1 – Cronograma de planejamento da qualidade do produto FONTE: Richter (2004).

2.1.2 Evolução da confiabilidade de um produto

O monitoramento da evolução da confiabilidade deve ser feito a partir do

momento em que haja protótipos prontos para irem a campo. O mais importante de

tudo é haver rigorosidade e um bom sistema para registrar as falhas que ocorrem

durante os testes de campo.

A confiabilidade deve crescer ao longo do tempo até atingir um percentual

próximo ao da confiabilidade estabelecida para o início da produção. Revisões de

projetos, que devem ser feitas a partir dos dados de falha, incorporam créditos ao

projeto que permite o aumento do tempo entre falhas. Mesmo após o início da

produção são incorporadas melhorias aos produtos, fazendo com que sua

confiabilidade melhore até atingir um grau de maturidade.

Definição do programa

Aprovação do programa

Protótipo Piloto Lançamento

Planejamento: Benchmark, QFD, MTBF, falhas em garantia, curva

de crescimento da confiabilidade

Projeto e desenvolvimento do produto: Realidade Virtual, análise de elementos finitos, testes

acelerados, simulações de vibrações, ruído, dinâmica de fluidos, solidificação, modelação de plásticos, fatores

humanos, cinemática e dinâmica de sistemas, molas e parafusos e análise e revisões do projeto.

Projeto e desenvolvimento do processo virtual: Manufacturing – DFMEA (Design Failure Modes and Effects Analysis - Análise dos Efeitos e Modos de Falha do Projeto)

Validação do produto e do processo Testes de bancada e campo, análises de confiabilidade e

monitoramento do IMTBF (Instantaneous Mean Time Between Failures - tempo médio instantâneo entre falhas)

Produção Análises de

confiabilidade e monitoramento do

IMTBF.

Análise da retroalimentação e ação corretiva

23

Existem diversas formas de se representar a evolução da confiabilidade. Uma delas mostra a evolução do IMTBF (Instantaneous Mean Time Between

Failures - tempo médio instantâneo entre falhas) ao longo do tempo. A Figura 2 apresenta um exemplo da evolução da confiabilidade no desenvolvimento de produtos.

FIGURA 2 – Evolução da confiabilidade no desenvolvimento de produtos. FONTE: Richter (2004).

O IMTBF consiste em reduzir o intervalo de análise a um valor arbitrário,

para avaliar a evolução do mesmo ao longo do programa, à medida que as

melhorias no projeto forem sendo incorporadas ao novo produto. A Figura 2

apresenta o progresso percentual do IMTBF em relação ao objetivo estipulado ao

programa, na fase de planejamento.

Para atingir a evolução planejada do IMTBF, um plano consistente de testes

e um tratamento adequado as falhas encontradas devem ser implementados. A

evolução da confiabilidade pode ser considerada como um processo de teste do

produto, resolução dos problemas de confiabilidade e monitoramento do seu

crescimento.

Antes de serem construídos os protótipos, os engenheiros devem estimar a

confiabilidade inerente e a confiabilidade inicial. A confiabilidade inicial deve ser alta

o suficiente para atingir os objetivos finais, ao tempo certo estabelecido, para o

programa. Melhorar a confiabilidade inicial é mais fácil que aumentar a taxa de

evolução da confiabilidade.

24

A taxa de evolução da confiabilidade pode ser definida como a inclinação da

curva da Figura 2, plotada em escala logarítmica. A confiabilidade inerente é o valor

a qual o produto irá atingir em sua fase de maturidade.

A estimação da confiabilidade inicial e inerente é feita baseada na

experiência das pessoas com o auxílio de técnicas e ferramentas, tais como, o

desenvolvimento de FMEAS (Failure Modes and Effects Analysis – análise dos

efeitos e modos de falha), dados de produtos similares, dados de garantia e análise

de causa raiz. Caso as confiabilidades inicial e inerente não estejam em níveis

aceitáveis, uma revisão do projeto deve ser feita para permitir que estas grandezas

correspondam às expectativas. Algumas empresas trabalham com uma

confiabilidade inicial de pelo menos 50% do objetivo de produção, para assim iniciar

a construção dos protótipos.

Com os objetivos claramente estabelecidos outros pontos importantes de

decisão devem ser avaliados. Momentos antes de iniciar-se a fabricação do lote

piloto deve-se avaliar se uma nova revisão de projeto é necessária, caso os níveis

de confiabilidade estabelecidos para aquele ponto não sejam atingidos. A mesma

avaliação pode ser feita antes de iniciar a produção e mostrar ao gerenciamento se

o produto ainda necessita de melhoria para atingir os níveis de confiabilidade

projetados e servir como instrumento de decisão para postergar o início de

produção. Esta sempre é uma decisão difícil de ser tomada, mas pode ser,

estrategicamente, uma decisão importante para evitar custos indesejados de

garantia e a insatisfação de clientes.

2.1.3 Definição de Confiabilidade

Conceito de Confiabilidade: Confiabilidade é um atributo inerente ao projeto

do produto e representa a capacidade potencial que deveria ser atingida em

condições habituais, desde que fabricado exatamente conforme projetado e operado

e mantido exatamente nas condições prescritas (Bergamo, 1997).

Definição de Confiabilidade: Confiabilidade é a probabilidade de que um

componente ou sistema cumpra sua função com sucesso, ou seja, tenha um bom

25

desempenho durante um período de tempo previsto, sob as condições de operação

especificadas no seu projeto (Bergamo, 1997).

2.1.3.1 Falha

A definição de falha é um conceito fundamental para qualquer estudo em

análise de confiabilidade. De maneira geral, uma falha consiste na interrupção ou

alteração da capacidade de um item em desempenhar uma função requerida ou

esperada, sendo que item corresponde a qualquer parte, componente, dispositivo,

subsistema, unidade funcional, equipamento ou sistema que possa ser considerado

individualmente (Guzzon, 2009).

O termo falha (failure) é frequentemente confundido com os termos erro e

defeito (fault), principalmente devido às traduções de seus respectivos termos do

inglês para a língua portuguesa. Isso gera a existência de diferentes definições para

eles, muitas vezes conflitantes. O erro corresponde à discrepância entre o valor

observado e o valor alvo (correto), não sendo considerado como uma falha por

encontrar-se dentro de limites aceitáveis de desvio do desempenho desejado. A

falha corresponde, por sua vez, ao evento que ocorre quando a função requerida é

perdida (excedendo os limites aceitáveis). O estado de um item caracterizado pela

incapacidade de desempenhar sua função requerida é denominado estado de falha

(Avizinenis et al., 2004).

Um erro pode ser referido como uma falha incipiente e é causado por um

defeito. Um defeito pode ser tanto externo quanto interno. A ativação de um defeito

interno latente ou a presença de um defeito externo pode gerar um erro. Um erro é

sucessivamente transformado em outros erros (propagação), podendo gerar uma

falha subsequente, dependendo da estrutura do sistema ou do comportamento

deste. A falha de um item, por sua vez, pode ser a causa de um defeito em outro

item ao qual esse se relaciona (Guzzon, 2009).

A Figura 3 apresenta a classificação das falhas sob vários aspectos, tais

como origem, extensão, velocidade, manifestação, criticidade ou idade. Dessa

maneira, as falhas podem ser, quanto à extensão, parciais ou completas,

dependendo se conduzem à incapacidade do item de desempenhar alguma função

requerida ou se ocorre perda total da função requerida deste.

26

FIGURA 3 – Classificação das falhas. FONTE: Adaptado de Siqueira (2005).

Ainda, o complemento da confiabilidade é a probabilidade de falha (de

componente ou sistema).

Tradicionalmente, as fases da vida de um componente ou sistema são

descritas pela Curva da Banheira, que será apresentada e definida na secção 2.1.4.

2.1.3.2 Taxa de Falhas

A Taxa de falhas é definida como a frequência com que as falhas ocorrem

num certo intervalo de tempo medida pelo número de falhas por cada hora, ou outra

unidade de tempo escolhida, de operação ou número de operações do sistema (ou

componente) (Chaves Neto, 2010).

Geralmente a taxa de falhas é representada por e o inverso da taxa de

falhas é conhecido como Tempo Médio Entre Falhas (TMEF), tradicionalmente é

conhecida em inglês como Mean Time Between Failures (MTBF). A expressão do

TMEF ou MTBF é:

1 TMEFMTBF (2.1)

Tipos de falhas frequentes

• falha aleatória: é qualquer falha cuja causa ou mecanismo de falha

faça com que seu instante de ocorrência se torne imprevisível, a não ser no sentido

probabilístico;

27

• falha por deterioração: é a falha que resulta de mecanismos de

deterioração inerentes ao item, os quais determinam uma taxa de falha crescente ao

longo do tempo;

• falha catastrófica: é a falha repentina, a qual não pode ser prevista

por monitoração, que resulta na incapacidade.

As falhas dos produtos podem ser caracterizadas em relação ao tempo

como de três categorias:

• Falhas no início da vida (mortalidade infantil);

• Falhas durante a vida útil (normal) que possui taxa de falha constante

• Falhas no final da vida (deterioração – velhice).

Estes tipos de falhas são plotados em uma curva chamada curva da

banheira.

2.1.3.3 Curva da banheira

A análise do comportamento da taxa de falha de um equipamento, ou

produto, ao longo do tempo pode ser representada por uma curva que possui a

forma de uma banheira, a curva da banheira (bathtube curve), conforme

apresentado na Figura 4. A curva representa as fases da vida características de um

sistema: mortalidade infantil, maturidade e mortalidade senil. As fases estão

associadas ao fator de forma , que é um dos parâmetros de uma eventual

distribuição de Weibull que descreva a confiabilidade do produto (Sellitto, 2005).

FIGURA 4 – Curva da Banheira e ciclo de vida de equipamentos. Fonte: Sellitto (2005).

28

No primeiro período, período de mortalidade infantil, a taxa de falhas )(th

geralmente é alta, porém decrescente. As falhas preliminarmente são causadas por

defeitos congênitos ou fraquezas, erros de projeto, peças defeituosas, processos de

fabricação inadequados, mão-de-obra desqualificada, estocagem inadequada,

instalação imprópria, partida deficiente entre outras. A taxa de falhas diminui com o

tempo, conforme os reparos de defeitos eliminam componentes frágeis ou à medida

que são detectados e reparados os erros de projeto ou de instalação. Sellitto (2005)

ressalta que, neste período, a melhor estratégia de manutenção é a corretiva, ou

seja, cabe à manutenção não apenas reparar o equipamento, mas corrigi-lo, para

que a falha não venha a se repetir.

A fase de maturidade ou período de vida útil encontra-se entre t1 e t2. O valor

médio da taxa de falha é constante. Nesta fase, as falhas ocorrem por causas

aleatórias, externas ao sistema, tais como acidentes, mau uso ou operação

inadequada, e são de difícil controle. As falhas aleatórias podem assumir diversas

naturezas, tais como: sobrecargas aleatórias, problemas externos de alimentação

elétrica, vibração, impactos mecânicos, bruscas variações de temperatura, erros

humanos de operação entre outros. Falhas aleatórias podem ser reduzidas

projetando equipamentos mais robustos do que exige o meio em que opera ou

padronizando a operação. Segundo Sellitto (2005), neste período, a melhor

estratégia de manutenção é a preditiva, ou seja, monitoramento para detectar o

início da fase de desgaste.

Após t2, há um crescimento da taxa de falhas, a mortalidade senil, ou fase

da velhice, que representa o início do período final de vida do produto. Esta fase é

caracterizada pelo desgaste do componente, corrosão, fadiga, trincas, deterioração

mecânica, elétrica ou química, manutenção insuficiente entre outros. Para produzir

produtos com vida útil mais prolongada, deve-se atentar para o projeto, utilizando

materiais e componentes mais duráveis, um plano de inspeção e manutenção que

detecte que iniciou a mortalidade senil e a previna, por substituição preventiva de

itens, e supressão dos agentes nocivos presentes no meio. Ainda, segundo Sellitto

(2005), neste período, a melhor estratégia de manutenção é a preventiva, ou seja, já

que o equipamento irá falhar, cabe à manutenção aproveitar a melhor oportunidade

para substituir ou reformar o item.

O término da vida útil, sob o ponto de vista da confiabilidade, que ocorre

quando o item ingressa no período de mortalidade senil, não deve ser confundido

29

com sua obsolescência do ponto de vista mercadológico ou produtivo. Nesta, o item

é substituído por haver desaparecido o valor atribuído à função que desempenha.

Na fase da mortalidade senil, a substituição ocorre por queda na confiabilidade do

item em produzir o valor que dele se espera. Siqueira (2005) distingue vida segura

de vida econômica. Naquela, o item opera até que a probabilidade de falha

ultrapasse um patamar de segurança. No período de mortalidade senil, o item opera

enquanto a função que desempenha continua sendo necessária.

Siqueira (2005) comenta que sistemas industriais evoluem na curva da

banheira segundo várias características. Lafraia (2001) ressalta que pode não existir

alguma das fases, passando-se, por exemplo, da mortalidade infantil para a senil,

diretamente. Este é o caso da pesquisa com embreagens, relatada em Sellitto,

Borchardt e Araújo (2002). Sistemas eletrônicos geralmente apresentam mortalidade

infantil e depois apenas falhas aleatórias, estacionando na parte baixa da curva. Tal

região é dita sem memória de falha (failure memoryless), pois a incidência de uma

falha no tempo t não tem correlação com o tempo até a próxima falha. Em softwares,

as falhas de programação geralmente têm apenas mortalidade infantil, pois uma vez

corrigidas, é impossível a reincidência, pois não se originam de processos

dissipativos de energia.

2.1.3.4 Tempo Médio Entre Falhas (MTBF)

Predições de confiabilidade podem ser utilizadas para estimar as taxas de

falhas de um produto ou o MTBF de um determinado sistema, ou produto. O MTBF é

normalmente expresso por horas. Por exemplo, se o MTBF de um sistema é de 1000

horas, isso significa que o sistema, ou produto, na média, irá apresentar uma falha

em 1000 horas de operação.

Segundo Pasetto (2002), o MTBF deve ser usado quando a função de

distribuição de falhas é especificada, porque o nível de confiabilidade indicado pelo

MTBF depende do tipo da distribuição de falhas. Isso significa que dois produtos

com o mesmo MTBF podem ter níveis de confiabilidade diferentes se a distribuição

de falhas dos mesmos também for. Existem padrões aceitos na indústria para a

modelagem das taxas de falhas de componentes que podem ajudar a estimar a taxa

de falha de um sistema ou seu MTBF. O objetivo é garantir que o MTBF projetado

esteja sempre dentro dos limites aceitáveis pelo mercado.

30

Além do MTBF outro método também pode ser utilizado para quantificar a

confiabilidade de um sistema ou produto, o MTTF (Mean Time To Failure - tempo

médio até a falha) pode ser utilizado. A diferença esta no tipo de sistema, para

sistemas que podem ser reparados utiliza-se o MTBF, já para sistemas que não

podem ser reparados utiliza-se o MTTF.

2.1.4 Censura

Nos estudos de análise confiabilidade são comuns situações em que o

experimento termina antes que todos os equipamentos, ou produtos, venham a

falhar.

Uma característica marcante destes estudos é a presença de observações

incompletas ou parciais dos tempos de falha dos produtos observados. Dessa forma

existe a necessidade de introduzir uma variável dicotômica na análise que indique se

o valor do tempo de sobrevida para um determinado produto foi ou não observado

até a sua falha. Essa variável é conhecida na literatura como variável indicadora de

censura, e é definida como sendo igual a um, se o tempo de sobrevida é observado,

e igual a zero, caso o tempo de sobrevida seja censurado antes da falha acontecer.

É importante ressaltar que, mesmo censurados, todos os resultados

provenientes do estudo de sobrevivência devem ser usados na análise estatística,

pois a omissão das censuras no cálculo das estatísticas de interesse poderá

acarretar em conclusões viciadas.

A censura pode ser de três tipos:

• Censura por tempo ou do tipo I: o teste termina após um período pré-

estabelecido de tempo;

• Censura por falha ou do tipo II: o teste termina após ter ocorrido

falha em um número pré-determinado de itens sob teste.

• Censura do tipo aleatório: o item é retirado do teste antes de ocorrer

a falha; é o caso do item falhar por uma causa diferente da que foi definida.

31

A Figura 5 ilustra exemplos dos tipos de censura.

FIGURA 5 – Tipos de censura FONTE: Adaptado de Colossimo (2006).

2.1.5 Função de confiabilidade

Definição: A função de confiabilidade é definida como a probabilidade de um

produto funcionar sem falhar até um dado tempo t (Chaves Neto, 2010).

Esta é a principal função probabilística usada para descrever dados de

durabilidade e, expressando o tempo até falhar como a variável aleatória T, sua

expressão é dada por:

)()( tTPtR (2.2)

2.1.5.1 Definição matemática da confiabilidade

Segundo Bergamo (1997), duas funções são muito utilizadas para descrever

uma variável aleatória continua x. São elas: a função de distribuição acumulada (fda)

e a função densidade de probabilidade (fdp).

32

A fda indica a probabilidade de que X tenha um valor menor ou igual a x, ou

seja:

( ) ( )F x P X x (2.3)

Já a fdp indica a probabilidade de que X esteja compreendido entre x e

x x à medida que x se torne pequeno, logo:

( ) ( )f x P x X x x (2.4)

2.1.5.2 Funções básicas de confiabilidade

As quatro funções básicas em estudos de confiabilidade, adaptadas de

Fritsch (1996) e Ribeiro (2003) são:

Função densidade de probabilidade de falha )(xf ;

Função Acumulada de falha )(tF : Probabilidade de falha até o tempo

t ;

Função de confiabilidade )(tR : Probabilidade de sucesso além do

tempo t ;

Taxa de risco – )(th : Taxa de falha dos sobreviventes no tempo t .

Onde as funções se relacionam conforme as equações a seguir:

t

dxxftF0

)()( (2.5)

)(1)( tFtR (2.6)

dt

tdR

dt

tdFtf

)()()(

(2.7)

)(

)()(

tR

tfth (2.8)

33

Assim supondo que n0 componentes idênticos sejam testados e que ao final

do tempo de teste t, nf(t) componentes falharam e ns(t) componentes sobreviveram,

as funções básicas da confiabilidade podem ser estimadas, para estes valores

hipotéticos como:

0

)()(ˆ

n

tntF

f (2.9)

0

)()(ˆ

n

tntR s (2.10)

tn

tntf

f

0

)()(ˆ (2.11)

ttn

tnth

s

f

)(

)()(ˆ (2.12)

A Figura 6 apresenta as representações hipotéticas para as quatro funções

básicas da confiabilidade apresentadas anteriormente.

FIGURA 6 – Quatro funções básicas da confiabilidade Fonte: Dillenburg (2005)

34

A Figura 7 apresenta o gráfico de duas funções de confiabilidade,

tetR 1.01 )(

e tetR 025.02 )( . Uma para o tempo de falha modelado pela

distribuição exponencial com parâmetro 1/10 (curva 1) e outra com 1/ 40

(curva 2).

FIGURA 7 – Funções de confiabilidade )(1 tR e )(2 tR

FONTE: Chaves Neto (2010).

2.1.6 Função de Taxa de Falha

A probabilidade de um produto falhar no intervalo de tempo ),[ 21 tt pode ser

calculada pela sua função de confiabilidade dada por:

2

1

)()()(),[ 1221

t

t

tRtRdttfttP (2.13)

E, de uma forma geral, redefinindo o intervalo como ),[ ttt tem-se a taxa

de falha dada por:

)(

)()()()(

ttR

ttRtRtth

(2.14)

35

E, ainda, quanto 0t , )()( tth representará a taxa de falha

instantânea:

)(1

)(

)(

)()()(

tF

tf

tR

tftth

(2.15)

Na Tabela 1, são apresentadas as funções de risco, de densidade de

probabilidade e de confiabilidade dos principais modelos utilizados em estudos de

confiabilidade em Engenharia. A Tabela 1 foi baseada em Elsayed (1996) e Leemis

(1995).

TABELA 1 – EQUAÇÕES DAS FUNÇÕES )(tf , )(tR E )(th PARA DIFERENTES

MODELOS DE PROBABILIDADE

Modelos )(th )(tf )(tR Parâmetros

Constante te te

Linear crescente

t

2

2t

te

2

2t

e

Weibull 1

t

t

et

1

t

e

,

Exponencial tbe )1( teb

tebe

)1(

teb

e

b,

Normal

)(tR

t

2ln

2

1

2

1

t

et

1 ,

Lognormal

)(

ln

tRt

t

2ln

2

1

2

1

t

et

t

de

0

2

ln

2

11

,

Gamma

)(

)(

tR

tf

t

et

)(

1

t

de

1

)(.

1

,

FONTE: Adaptado de Elsayed (1996) e Leemis (1995).

As funções básicas da confiabilidade possuem uma peculiaridade, uma pode

ser derivada da, ou das, outras funções.

Pode-se perceber que a função de confiabilidade representa o complemento

da função acumulada de falha, de maneira que, enquanto a primeira mostra a

36

quantidade de itens sobreviventes com o tempo, a segunda mostra a quantidade de

itens que falharam nesse mesmo período de tempo. Mas não são apenas essas

duas funções que se relacionam entre si.

Guzzon (2009) comenta que existem relações entre as funções acumulada

de falha, densidade de falha, confiabilidade e de risco, que estão listadas na Tabela

2.

TABELA 2 – RELAÇÕES ENTRE AS FUNÇÕES )(tF , )(tf , )(tR E )(th

)(tF )(tf )(tR )(th

)(tF _

t

duuf0

)(

duuh )(exp1

)(tf

dt

tdF )(

_

dt

tdR )(

t

duuhth0

)(exp)(

)(tR )(1 tF

tduuf )(

_

t

duuh0

)(exp

)(th )(1

)(tF

dt

tdF

tduuftf )()(

dt

tRd )(ln

_

FONTE: Adaptado de Leemis (1995).

2.2 TESTES ACELERADOS

As indústrias, hoje em dia, para se manter nos mercados que são altamente

competitivos devem planejar e desenvolver produtos novos que atendam às

expectativas dos consumidores. Assim, devem criar ou aplicar técnicas mais

avançadas, em um tempo cada vez menor e, também, manter os esforços de

melhoria da produtividade e da confiabilidade.

A escassez de dados é uma característica comumente encontrada quando

se avalia a confiabilidade de um equipamento, ou produto. Os métodos tradicionais

de avaliação da confiabilidade envolvem a análise de dados de falha de um

equipamento em suas condições de uso. Tais métodos, baseados em sua grande

maioria em estimadores de máxima verossimilhança, exigem grandes amostras de

dados de falha, as quais são muitas vezes difíceis, se não impossíveis, de serem

obtidas.

A dificuldade em obter dados consideráveis de falha sob as condições

normais (nominais) de uso é principalmente encontrada em equipamentos altamente

confiáveis, os quais executam suas funções de forma bem sucedida por longos

períodos de tempo, tais como anos. Entretanto, mesmo para tais equipamentos uma

37

avaliação da confiabilidade precisa ser realizada principalmente se exigem grandes

investimentos em seu projeto de desenvolvimento.

Os produtos em desenvolvimento possuem uma dificuldade intrínseca na

obtenção de dados de falha. Porém, uma empresa, ou indústria, para se tornar ou se

manter competitiva deve superar essa limitação e avaliar o impacto (efeito) que

modificações no projeto do produto implicam na confiabilidade do mesmo.

Assim, há necessidade de se obter informações sobre o desempenho dos

produtos. Essas informações sobre o desempenho dos produtos podem ser obtidas

em duas fontes: dados de campo (assistência técnica e teste de mercado, antes do

lançamento) e dados experimentais (laboratório). No caso do teste de campo, certo

número de produtos é repassado a uma amostra de consumidores e o desempenho

desses produtos é acompanhado durante certo intervalo de tempo. Mas, nesse caso

do teste de mercado, ocorre de existir produtos projetados para funcionar anos sem

falhar. Então, é muito demorado acompanhar o desempenho junto à amostra de

consumidores. Então, o que se faz é obter dados experimentais em laboratório em

testes acelerados.

2.2.1 Tipos de Testes Acelerados

Os testes acelerados podem ser classificados em dois tipos dependendo da

característica dos dados coletados no teste.

1º. Tipo: Testes de Vida Acelerados;

2º. Tipo: Testes de Degradação Acelerados.

No primeiro caso (Testes de Vida Acelerados) estão os testes em que a

resposta é o tempo até a ocorrência da falha. Pretende-se usar os dados para

estimar o MTTF, a função de Confiabilidade )(tR e a função de Taxa de Falhas ( )t .

Os resultados dos testes são projetados para o tempo real, por meio de uma

equação de regressão.

Já no caso dos Testes de Degradação Acelerados a resposta de interesse é

alguma medida do desempenho do produto. Neste caso a resposta pode ser a

oxidação do produto, resistência à tração, etc. Essa medida do desempenho é

obtida ao longo do tempo.

Em ambos os testes há necessidade de se definir o fator estressante. Este

fator é utilizado no teste em um nível superior ao nível considerado normal.

38

Pode ser:

• Temperatura;

Exemplo 1

Em memórias de computador tipo RAM (Random Access Memory) o

desempenho do produto é medido pelo tempo de acesso e a falha seria um tempo

superior a um limite definido. Então, nesse caso, o fator estressante poderia ser a

temperatura.

Exemplo 2

Suponha um produto alimentício, por exemplo, leite, que deve ser mantido

refrigerado. O fator estressante é novamente a temperatura. No teste as unidades

do produto são mantidas em temperatura superior à indicada e conta-se o número

de microorganismos que surgem no produto. Nesse caso, a resposta de interesse é

o número de microorganismos presente no alimento ao longo de um período

determinado. E, é claro, a falha seria um número de microorganismos superior a um

valor especificado. Essa é a forma de se definir o tempo de validade do produto.

• Tensão.

Exemplo 3

No caso da memória RAM a voltagem nominal geralmente é de 5 V. Então,

um modo de estressar o produto e, conseqüentemente, degradá-lo é elevar o nível

de tensão.

O teste pode ser acelerado de dois modos:

1º. Aumentando a taxa de uso.

Nesse caso o fator de estresse é o uso. Então, deve-se elevar a taxa de uso

do produto. Isto pode ser feito de duas maneiras:

1ª. Com velocidade mais alta

Ex. 1 – um motor funcionando com velocidade mais alta do que funcionaria

normalmente.

2ª. Redução do tempo de parada

Ex. 2 – no mecanismo do vidro da porta do veículo deixa-se o produto

funcionando por um número muito maior do que seria em condições normais.

Ex. 3 – Cafeteira elétrica, normalmente ela faz café umas quatro vezes por

dia; então, o que se faz é construir um dispositivo para fazê-la funcionar um número

muito grande de vezes por dia.

39

2º. Aceleração por altos níveis de estresse.

Nesse caso, o produto é submetido a vários níveis de estresse para encurtar

o seu tempo de vida ou degradar o seu desempenho.

2.3 ANÁLISE DOS EFEITOS E MODOS DE FALHA (FMEA)

A Análise dos Efeitos e Modos de Falha (FMEA: Failure Modes and Effects

Analysis – análise dos efeitos e modos de falha) é uma técnica de engenharia

estruturada, indutiva, lógica e progressiva, utilizada com o intuito de definir,

identificar, antecipar e eliminar falhas conhecidas e/ou potenciais do sistema,

produto, projeto, processo e serviço antes que estes cheguem ao consumidor.

Análises semelhantes à FMEA são utilizadas há muitos anos. Formalmente, a

FMEA, foi desenvolvida pela NASA (National Aeronautics and Space Administration

- Administração Nacional do Espaço e da Aeronáutica), em 1963. Porém, somente

após 1977 passou a ser mais comumente utilizada. Isto ocorreu quando a Ford

Motors Company começou a empregar essa técnica na indústria automobilística.

Mas apenas no ano 2000, a Sociedade dos Engenheiros Automotivos (SAE –

Society Automotive Enginners) publicou os procedimentos especializados de FMEA

para a indústria automotiva (Gilchrist, 1993; Hecht, 2003).

A FMEA é essencialmente utilizada para estudar as falhas que ocorrem em

materiais e equipamentos, podendo ser também aplicada a uma ampla escala de

tecnologias (como, por exemplo, em softwares). Foi inicialmente concebida para ser

aplicada durante as fases de desenvolvimento de um produto ou de um serviço

(quando está sendo definido e projetado) e quando a produção está sendo

planejada. Depois, passou a ser usada, também, no projeto de sistemas e nas

demais fases do ciclo de vida do produto e/ou processo. Quando utilizada na fase do

projeto, tem o objetivo de identificar, antecipadamente, todos os modos de falha

catastróficos ou críticos para que sejam eliminados ou minimizados no estagio inicial

do desenvolvimento do sistema, evitando-se assim custos com mudanças,

adaptações ou retrabalhos em estágios posteriores. Outros objetivos da FMEA são:

aumentar as atividades com foco no cliente, usar o conhecimento técnico de uma

equipe multifuncional, dar suporte para a melhoria contínua, aperfeiçoar as lições

40

aprendidas (através de documentação) e utilizar as melhores práticas da engenharia

simultânea (Gilchrist, 1993; Lafraia, 2001).

Para uma aplicação mais vantajosa, ou mais eficaz, as atividades da FMEA

devem ser planejadas desde o princípio do processo de desenvolvimento dos

produtos e dos processos, e sua elaboração deve ser iniciada o mais cedo possível,

mesmo que nem todos os fatos ou informações sejam ainda conhecidos. Assim, o

melhor momento para iniciar uma FMEA é tão logo alguma informação esteja

disponível. Após seu início, a FMEA deve ser constantemente atualizada conforme a

disponibilidade das informações, o que caracteriza seu dinamismo. A FMEA apenas

pode ser considerada completa ou terminada quando o sistema, projeto, produto,

processo ou serviço é considerado completo e/ou descontínuo. Pode ser, no

entanto, reaberta para revisão, avaliação e/ou melhoria a qualquer momento

(Stamatis, 1996).

Em seu livro Rozenfeld et al. (2006) dividem a macrofase de

desenvolvimento de produtos em cinco subfases, iniciando pelo projeto

informacional e seguindo para o projeto conceitual, projeto detalhado, preparação da

produção do produto até o lançamento do produto. Esses autores consideram que o

melhor momento para a aplicação da FMEA ocorre depois da atividade de

detalhamento do sistema, subsistemas ou componentes, na fase do projeto

detalhado. Quando utilizada antes disso, na fase de projeto conceitual, pode

deparar-se com o problema de falta de documentação detalhada e, assim, algumas

falhas potenciais podem passar despercebidas pela análise.

Apesar desse inconveniente, Andrade (Zardo, Forcellini, 2005) propõem que

a FMEA pode perfeitamente ser utilizada já na etapa conceitual do produto,

tornando-se assim um instrumento de auxílio à seleção de concepções e não

somente um mero instrumento de otimização. Para esses autores, a utilização da

FMEA nessa etapa possui a vantagem de possibilitar a detecção de problemas mais

cedo e, assim, resolve-los com menor custo possível, e talvez, com mais rapidez.

Para se aplicar uma FMEA eficientemente, segundo Stamatis (1995) é

necessário seguir oito passos sistemáticos: definir a finalidade ou as expectativas da

avaliação e selecionar a equipe, fazer um diagrama de blocos funcionais (FMEA de

sistema e de projeto) ou um fluxograma de processo (FMEA de processo e de

serviço), dar prioridades, coletar dados, analisar, apresentar resultados, confirmar e

avaliar os resultados e realizar tudo novamente.

41

Assim, a FMEA é capaz de identificar muitas exigências especificadas e não

especificadas do consumidor que se relacionam com o projeto do produto, seu uso,

como as falhas podem ocorrer, a severidade de tais falhas, assim como a

probabilidade de sua ocorrência. A Figura 8 apresenta o procedimento geral para se

realizar a FMEA, que normalmente é feita em duas fases. A primeira fase consiste

em coletar as informações funcionais dos componentes e processo alvo da analise.

Técnicas básicas como sessões de brainstorming e diagramas de causa-efeito,

podem ser utilizados para determinar a relação entre modos potenciais de falha,

seus efeitos e as causas relacionadas a esses modos de falha para cada função

analisada. Com tais informações estima-se a severidade dos efeitos das falhas, a

probabilidade de ocorrência da causa das falhas e de detecção dessas antes de sua

ocorrência, tendo em vista as atividades planejadas de validação, verificação e

prevenção. E assim, pode calcular-se o valor do RPN (risk priority number)

(Stamatis, 1996; Teng; Ho, 1996).

A segunda fase começa quando o valor do RPN ultrapassa o valor desejado

e, por isso, ações corretivas ou alterações do projeto são requeridas. As ações

corretivas visam à diminuição da probabilidade da não detecção do modo de falha,

enquanto as alterações no projeto buscam reduzir a severidade das falhas e a

probabilidade de sua ocorrência, sendo esta alternativa utilizada para modos de

falha que possuem um alto risco associado a sua ocorrência. Após, realiza-se nova

análise dos modos e efeitos de falha, a fim de verificar se o RPN sofreu a redução

desejada. Ao final do processo, um relatório deve ser gerado e as modificações

requeridas devem estar completas, de modo a reduzir ao mínimo o número de

modos potenciais de falhas. Todas essas informações coletadas são melhores

analisadas quando dispostas em forma de tabela (formulário), conforme a Figura 9

(Teng; Ho, 1996).

42

FIGURA 8 – Procedimento geral de FMEA FONTE: Adaptado de Teng e Ho (1996).

FIGURA 9 – Formulário FMEA FONTE: Adaptado de Stamatis (1995).

O ideal é que a informação contida no relatório da FMEA sirva como base

para o controle estatístico do processo, uma vez que gera planos de controle. Em

um plano de controle, a detecção de cada uma das falhas de interesse e seu método

Coletar informações sobre

funções do componente e sistema

Determinar modos

de falhas potenciais

Checar os efeitos

de cada falha

Determinar as causas

de cada falha

Listar controles

atuais do processo

Determinar o ranking

de detecção

Calcular RPN

Determinar

ranking de

ocorrência

Determinar o

ranking de

severidade

Correção

necessária?

Recomendar

ações corretivas

Modificações

Relatório FMEA

Item

Fu

nção

Efeitos

potenciais

de falha

Modos potenciais de falha

Severidade

(S)

Causas

potenciais

de falhas

Ação

recomendada

Indivíduo ou área

responsável pela

execução

Ação

tomada

Ocorrência

(O)

Métodos

de

detecção

Detecção

(D)

D

RPN

O S

Resultados da ação

PRIMEIRA FASE

RPN

SEGUNDA FASE

43

de detecção devem ser listados, bem como deve ser realizado o controle do

processo, a fim de minimizar a ocorrência de tais falhas. O plano de controle gera

também informações sobre a frequência de amostragens e métodos de medição

(Teng e Ho, 1996).

2.4 TÉCNICAS NÃO-PARAMÉTRICAS

2.4.1 Estimação na ausência e presença de censura

A estimação da função taxa de falha é difícil em termos não-paramétricos.

Essa dificuldade é a mesma de se estimar a função de densidade. Alguns textos

apresentam uma estimativa para esta função como sendo a variação da função de

taxa de falha acumulada. Entretanto, esta estimativa não é boa o suficiente,

principalmente para amostras pequenas. Para estimar a taxa de falha na ausência

de censura utiliza-se o histograma da distribuição aproximada do tempo de falha,

assim divide-se o número de itens que falharam em um determinado intervalo pelo

número de itens em operação até o tempo que corresponde ao início do intervalo. A

estimação da função de confiabilidade na ausência de censura também é feita

empiricamente a partir do histograma da distribuição aproximada do tempo de falha.

Neste caso divide-se o número de itens que ainda não falharam até determinado

intervalo pelo número de itens total inicial. O mesmo procedimento pode ser

realizado com relação à mantenabilidade considerando-se o histograma da

distribuição aproximada do tempo de reparo (Carvalho, 2008).

A Figura 10 mostra distribuição aproximada dos tempos de falha para os

dados não-censurados. O histograma foi obtido a partir de uma amostra de dados de

falha simulados pelo gerador implementado, com um total de 10 categorias de

tempos de falha, não censurada e um total de 25 itens, onde os tempos são dados

em anos.

44

FIGURA 10 – Histograma da Distribuição de frequências dos tempos de falha por ano FONTE: O autor (2011).

Uma estimativa para a taxa de falha no período compreendido entre 5 e 6

anos, é dada por:

5

65)6,5(ˆ

tatéoperaçãoemscomponentedenúmero

anoseentrefalhasdenúmerosh (2.16)

0,2777818

5

)725(

5)6,5(ˆ

h

Assim, a taxa de falha é de 27,8% durante o período de 1 ano,

compreendido entre 5 e 6 anos, ou seja, um componente que não falhou após 5

anos de uso tem uma probabilidade de 0,27778, ou seja 27,8%, de vir a falhar no

intervalo do 5º ao 6 º ano.

Já para a Função de Confiabilidade no tempo 5t anos, é estimada por:

0,7225

185)5(ˆ

testesobscomponentedenúmero

ttempooatéoperaçãoemscomponentedenúmeroR

Isso significa que 72% desses componentes duram mais que 5 anos. A

estimação da Função de Confiabilidade na presença de censura pode ser feita

através da Tabela de vida (Método Atuarial) ou o Estimador de Kaplan-Meier (Limite-

45

Produto). O estimador de Kaplan-Meier é uma adaptação da função de

confiabilidade empírica, e será definido na secção 2.4.2.

2.4.2 Estimador de Kaplan-Meier

O estimador de Kaplan-Meier, ou estimador limite-produto, é um estimador

não-paramétrico para a função de confiabilidade. O estimador utiliza os conceitos de

independência de eventos e de probabilidade condicional para desdobrar a condição

sobreviver até o tempo t em uma sequência de elementos independentes que

caracterizam a sobrevivência em cada intervalo de tempo anterior a t e cuja

probabilidade é condicional aos que estão em risco em cada período.

A expressão estimador limite-produto refere-se ao fato de que a

probabilidade de sobrevida até a data especificada é estimada considerando-se que

a sobrevivência até cada tempo é independente da sobrevivência até outros tempos,

e, em consequência, a probabilidade de se chegar até o tempo t é o produto da

probabilidade de se chegar até cada um dos tempos anteriores.

Por se tratar de um estimador não-paramétrico assintótico, a veracidade das

suas estimativas está garantida apenas para amostras de falhas e tempos de falhas

extensas. Sendo assim as estimativas calculadas pelo estimador de Kaplan-Meier

ficam mais próximas dos valores reais da confiabilidade conforme o crescimento da

amostra utilizada, caso a amostra seja grande, as estimativas tendem para os

valores reais da confiabilidade.

Sua vantagem em relação às funções paramétricas de confiabilidade é que o

estimador quando aplicado a amostras com algum tipo de censura tem um

desempenho satisfatório, sendo que para funções paramétricas este cálculo é de

difícil aplicação.

Pereira (2003) compara o estimador de Kaplan-Meier e o de Nelson-Aalen,

que também é um estimador não-paramétrico assintótico da função de

confiabilidade, mostrou que o estimador de Kaplan-Meier é mais preciso que o

estimador de Nelson-Aalen (Carvalho, 2005), com uma aproximação de 3 casas

decimais, quando se compara os valores da função de confiabilidade paramétrica

utilizada.

O estimador pode ser utilizado em varias áreas da ciência moderna, na

pesquisa médica, pode ser utilizado para medir a fração de pacientes que vivem em

46

um determinado período de tempo após o tratamento de sua doença. Um

economista pode medir o comprimento de tempo que as pessoas permanecem

desempregadas após uma perda do seu emprego. Um engenheiro pode medir o

tempo até a falha de peças de máquinas. Um ecologista pode usá-lo para estimar

quanto tempo frutos carnosos permanecem nas plantas antes de serem removidos

por frutívoros.

Quando não há censura pode ser definido por:

testeemitensdenº

tmomentooatéoperaçãoemitensdentR

º)(ˆ (2.17)

Esse estimador é obtido da seguinte forma: suponha que existam n itens sob

teste e nk falhas distintas nos tempos kttt ...21 . Pode ocorrer mais de uma

falha ao mesmo tempo, o que é chamado de empate.

O estimador da função de confiabilidade, para amostras censuradas ou não:

n

nn

n

dn

n

dn

n

dntR

2

22

1

11)(ˆ (2.18)

onde

id é o número de falhas no tempo it ;

in é o número de itens sob risco (em teste) no tempo it ;

nt é o maior tempo de falha menor que t.

Sua variância é calculada a partir da fórmula de Greenwood.

,)(

...)()(

)(ˆ)](ˆ[ˆ

222

2

111

12

nnn

n

dnn

d

dnn

d

dnn

dtRtRV (2.19)

onde

id é o número de falhas no tempo it ;

in é o número de itens sob risco (em teste) no tempo it ;

nt é o maior tempo de falha menor que t.

47

E, o estimador do erro padrão dessa estatística, )](ˆ[ˆ tRV é:

)](ˆ[ˆ)](ˆ[ˆ tRVtRpe (2.20)

Seja, agora, o cálculo do Intervalo de Confiança para ( )R t em um tempo

fixado t . A solução é usar um pivô aproximado baseado no Teorema Central do

Limite. A expressão do pivô é:

).1,0(~)](ˆ[ˆ

)(ˆ)(

)](ˆ[ˆ

)(ˆ)(N

tRpe

tRtR

tRV

tRtR

(2.21)

Portanto, o intervalo de confiança de nível )1( é

.1)](ˆ[ˆ)(ˆ)()](ˆ[ˆ)(ˆ

21

21

tRpeztRtRtRpeztRP (2.22)

Quando se tem o valor real de )(tR próximo de um ou de zero (valores

extremos) pode acontecer do limite superior do intervalo ultrapassar o limite 1 ou do

limite inferior ser negativo. Então, deve-se construir um novo intervalo baseado na

transformação descrita a seguir.

Seja a estatística )(ˆ tU função de )(ˆ tR

)])(ˆln[ln()(ˆ tRtU (2.23)

Cuja variância é estimada por:

2

222111 ]}/)ln[(...]/)ln[(]/){ln[(

)²(ˆ/)](ˆ[ˆ)](ˆ[ˆ

nnn ndnndnndn

tRtRVtUV

(2.24)

48

e o erro padrão é dado por

)](ˆ[ˆ)](ˆ[ˆ tUVtUpe (2.25)

Logo o intervalo de nível )1( para )(tR é

.1)(ˆ)()]()(ˆ )](ˆ[ˆ.exp)](ˆ[ˆ.exp

tUpeztUpez tRtRtRtRP (2.26)

O exemplo a seguir apresenta uma amostra de tempos de falha de um teste

simulado, hipotético, feito com ventoinhas, além dos tempos de falha também

apresenta os valores da confiabilidade, do desvio padrão e intervalos de confiança

calculados pelo estimador de Kaplan-Meier. Neste exemplo a amostra sofreu

censura e os intervalos de confiança foram calculados para um limite de 95% de

segurança.

Exemplo: Uma válvula de acionamento da ventoinha é avaliada com relação ao

tempo de vida. O fabricante submete várias válvulas a testes onde seu funcionamento é

acelerado para obter informações sobre a confiabilidade do produto. Um tipo comum de

teste é aquele em que a válvula é colocada em um tanque de água que é aquecido e

resfriado, acelerando o funcionamento da válvula. Estima-se que 30000 ciclos (um ciclo

corresponde ao ato de abrir e fechar a válvula) equivalem a 10 anos de uso em condições

normais. Considere a situação onde um lote de 30 mecanismos novos foi colocado em teste.

O teste consiste em deixá-los em funcionamento por um período de até 50000 ciclos e

registrar, para cada mecanismo, o número de ciclos que ele completou até falhar. Após o

teste, 18 mecanismos haviam falhado antes de completar 50000 ciclos e os outros 12

continuavam funcionando. O número de ciclos até a falha para estes 18 mecanismos foram:

5626; 11223; 12128; 13566; 14922; 16513; 22138; 26791; 27144; 27847; 28613; 31225;

36229; 38590; 39580; 40278; 41325; 44540.

49

FIGURA 11 – Valores das estimativas da confiabilidade e limites de confiança FONTE: o autor (2011)

Estes resultados foram calculados a partir do programa Action®. Para os

três primeiros intervalos de confiança, o limite superior apresenta valores iguais a um

ou 100%, isso acontece por que o programa não faz o ajuste para limites de

intervalos mal condicionados, ele apenas trunca em 0 ou 1, dependendo do limite

que foi ultrapassado. No caso dos três primeiros limites superiores do intervalo de

confiança, cujos valores ultrapassaram o limite de 100%, não se encaixando nos

padrões reais de confiabilidade, ele os trunca em um. Assim o software não utiliza o

ajuste da equação (2.26).

FIGURA 12 – Confiabilidade Estimada FONTE: Chaves Neto (2010).

Tempo Número de

falhas Quantidade

em risco Confiabilidade Desvio padrão

Limite inferior

Limite superior

5626 1 30 0.96666666 0.03277306 0.90243263 1 11223 1 29 0.93333333 0.04554200 0.84407264 1 12128 1 28 0.9 0.05477225 0.79264835 1 13566 1 27 0.86666666 0.06206328 0.74502485 0.98830847 14922 1 26 0.83333333 0.06804138 0.69997467 0.96669199 16513 1 25 0.8 0.07302967 0.65686446 0.94313553 22138 1 24 0.76666666 0.07722022 0.61531780 0.91801552 26791 1 23 0.73333333 0.08073734 0.57509104 0.89157561 27144 1 22 0.7 0.08366600 0.53601764 0.86398235 27847 1 21 0.66666666 0.08606629 0.49797982 0.83535350 28613 1 20 0.63333333 0.08798148 0.46089280 0.80577386 31225 1 19 0.6 0.08944271 0.42469549 0.77530450 36229 1 18 0.56666666 0.09047201 0.38934477 0.74398855 38590 1 17 0.53333333 0.09108400 0.35481196 0.71185470 39580 1 16 0.5 0.09128709 0.32108058 0.67891941 40278 1 15 0.46666666 0.09108400 0.28814529 0.64518804 41325 1 14 0.43333333 0.09047201 0.25601144 0.61065522 44540 1 13 0.4 0.08944271 0.22469549 0.57530460

50

2.4.2.1 Kaplan-Meier com estratificação

Uma variante do estimador de Kaplan-Meier é o estimador com

estratificação, que leva em consideração peculiaridades dos objetos, ou indivíduos,

que estão sofrendo o estudo da confiabilidade, ou análise de sobrevivência.

Separando uma amostra em duas ou mais sub-amostras, onde cada produto

de cada sub-amostra possua as mesmas peculiaridades que os outros, obtendo

assim uma amostra mais homogênea possível.

A estratificação consiste em dividir o conjunto total de observações em

grupos distintos, de acordo com as covariáveis de interesse, e estimar as funções de

confiabilidade separadamente para cada grupo (ou estrato). Essa variante é usada

geralmente em estudos médicos, mas também pode ser utilizada quando se trabalha

com confiabilidade de produtos. Um dos motivos pelo qual se utiliza tanto em

estudos médicos, é que para análises de mortes de certas doenças, o sexo do

individuo pode importar, transformando assim a amostra, deixando ela menos

homogênea.

2.4.3 Testes para comparação de curvas de confiabilidade

A representação gráfica da estimativa de Kaplan-Meier com estratificação,

para a função de confiabilidade, sobrevivência, permite ter uma idéia do

comportamento das curvas de confiabilidade, nos respectivos grupos. No entanto,

para avaliar se existe uma diferença significativa entre as várias curvas deve-se

recorrer aos testes de hipóteses.

Existem vários testes não paramétricos adequados a esta comparação,

sendo o teste log-rank e o teste de Peto (Carvalho, 2005), para dois grupos, os mais

utilizados em análise de sobrevivência.

2.4.3.1 Teste log-rank

O teste de hipótese log-rank compara a distribuição da ocorrência dos

eventos observados em cada estrato (sub-amostra) com a distribuição que seria

esperada se a incidência fosse igual em todos os estratos. Caso a distribuição for

51

equivalente à distribuição esperada, então a curva de sobrevivência dos produtos

pertencentes ao estrato é equivalente à curva de sobrevivência dos produtos em

geral (a covariável não tem efeito na confiabilidade).

Para utilizar o teste, calcula-se a estatística em duas etapas: primeiro,

estima-se o número de eventos esperados para cada estrato k, segundo a hipótese

nula de incidência igual em todos os estratos. Esse número esperado será chamado

de )(tEk . Em seguida, calcula-se a estatística do teste. Esta estatística segue uma

distribuição 2 , com 1k graus de liberdade, quando a hipótese nula é verdadeira.

Assim, para calcular a distribuição esperada de eventos, o total de eventos

precisamente no tempo t , )(tN , é redistribuído pelos k estratos,

proporcionalmente ao número de itens presentes em cada estrato. Logo, tem-se:

)(

)()()(

tr

trtNtE k

k (2.27)

em que )(tN é o número total de eventos observados, )(trk é o número de itens em

risco no estrato k , )(tr é o número total de itens em risco no estudo, no tempo t .

Quando se possui apenas dois estratos, sub-amostras, a estatística log-rank

é calculada utilizando apenas os dados de um dos estratos. O resultado do teste

para um estrato se estende ao outro por simetria. Isto é, se o número esperado de

casos é maior do que o esperado para um estrato, isto implica que o número de

casos é menor do que o esperado para o outro estrato. Sendo 1E , e.g., o total de

eventos esperados no estrato 1 e 1O o total de eventos observados no estrato 1, a

estatística log-rank é calculada a partir da diferença entre o total de eventos

observados e o número total de eventos esperados:

11

2

11

EOVar

EOrankLog

(2.28)

que segue uma distribuição 2 com um grau de liberdade.

52

A variância, que entra no cálculo como um fator de padronização, tem a

fórmula (para 2k ):

.

t trtr

tNtrtNtrtrEOVar

]1)([)(

)]()()[()()(2

2111 (2.29)

Existem vários outros testes que ponderam as observações de acordo com a

importância que se deseja dar ao inicio ou ao fim do tempo de sobrevida. A

estatística Peto que será apresentado na secção 2.4.3.3, atribui maior ponderação

aos eventos ocorridos nos períodos iniciais da observação.

2.4.3.2 Teste de Gehan

O teste de Gehan Bastos (Joana e Cristina Rocha, 2007), ou teste de

Wilcoxon generalizado, baseia-se numa estatística semelhante à utilizada no teste

log-rank e que tem a seguinte formula:

)( 11 EOnGehan (2.30)

onde n é o número de itens em teste no tempo t .

Assim a diferença 11 EO é ponderada por n , atribuindo menos ponderação

as diferenças 11 EO correspondentes aos instantes onde o número total de

indivíduos em risco é pequeno, isto é, aos maiores tempos de sobrevivência.

A variância da estatística é dada por:

t trtr

tNtrtNtrtrnEOVar

]1)([)(

)]()()[().().(.2

2111 (2.31)

Como no teste log-rank, o teste de Gehan segue aproximadamente a

distribuição 2 com um grau de liberdade.

Bastos (Joana e Cristina Rocha, 2007) constatou que o teste de Gehan é

menos sensível do que o teste log-rank. Em seu trabalho Bastos conclui que o teste

53

log-rank é mais potente na detecção de afastamentos da hipótese de igualdade das

distribuições que sejam do tipo risco proporcionais. Quando funções se cruzam, o

teste log-rank pode não conseguir detectar diferenças significativas entre as curvas

do estimador de Kaplan-Meier, sendo melhor aplicar o teste de Gehan.

2.4.3.3 Teste Peto

O teste Peto (Carvalho, 2005) é uma modificação do teste log-rank que dá

maior peso ao perfil de sobrevivência de tempos menores, ou seja, às diferenças (ou

semelhanças), no inicio da curva. A justificativa para isso é que o inicio da curva

concentra a maior parte dos dados, e por isso é mais informativa. Esse maior peso

no inicio da curva é obtido pela inclusão de um fator de ponderação igual ao valor

estimado da confiabilidade )(tR no estimador log-rank. A forma da estatística de

Peto é:

11

2

11

EOVar

EOPeto

(2.32)

sendo que

it

iii tEtOtSEO ))()()(( 1111 (2.33)

Da mesma forma, a variância da estatística de Peto é igual à variância do

log-rank, onde a cada tempo é ponderado pelo quadrado da função de confiabilidade

- 2)( itR . Assim como a estatística log-rank, a estatística Peto segue

aproximadamente a distribuição 2 com 1k graus de liberdade.

54

2.5 TÉCNICAS COMPUTACIONALMTE INTENSIVAS

A computação intensiva veio proporcionar a estatística novas formas de

abordagem não-paramétrica para alguns problemas. Isto é feito com reamostragem

da amostra original e tem conquistado apoio como uma alternativa aos métodos

clássicos de inferência paramétrica.

A idéia da reamostragem surgiu em meados de 1935 (Silva, 2005),

entretanto a aplicação de tal técnica só foi possível com o advento de computadores

velozes e de computação não dispendiosa, uma vez que procedimentos de

reamostragem utilizam intensivamente o computador.

A reamostragem descarta a distribuição amostral assumida de uma

estatística e calcula uma distribuição empírica – da real distribuição da estatística,

com as informações da amostra original, ao longo de centenas ou milhares de

amostras. Com a reamostragem, não se tem que confiar na distribuição assumida

nem se tem que ser cuidadoso quanto à violação de suposições inerentes. Pode-se

calcular a real distribuição de estatísticas da amostra e pode-se obter o 95º ou o 99º

percentil da distribuição empírica construída.

Mas é necessário se conhecer a origem destas inúmeras amostras. É

necessário reunir amostras separadas, mas isso aumenta o custo de coleta de

dados. Ao longo dos anos, estatísticos desenvolveram diversos procedimentos para

criar estas múltiplas amostras necessárias para a reamostragem a partir de uma

amostra original inicial.

Assim, com esse procedimento pode-se gerar um grande número de outras

amostras que podem ser empregadas para gerar a distribuição amostral empírica de

uma estatística de interesse.

E com o aperfeiçoamento dos computadores, essas técnicas são hoje

completamente viáveis, sendo possível a aplicação rápida que vem ajudar a

dinâmica dos estudos científicos.

Essas técnicas baseadas nos novos e potentes computadores são

chamadas de técnicas computacionalmente intensivas, e duas delas, o método

Jackknife e o método bootstrap, são apresentados a seguir.

55

2.5.1 Método Jackknife

O antecessor ao método bootstrap foi o método Jackknife, que também é um

método computacionalmente intensivo não-paramétrico. O método foi criado

algumas dezenas de anos antes do método bootstrap, mas não recebeu tanta

atenção dos pesquisadores quanto o método bootstrap. Segundo Chaves Neto

(1991), a primeira abordagem feita do método Jackknife foi apresentada em 1949

por Maurice Quenouille (Quenouille, 1949), e que tem a proposta de reduzir o vício

de um estimador de correlação serial com base na divisão da amostra original em

duas semi-amostras. Posteriormente, em 1956, Quenouille completou o trabalho

com a generalização do método (Chaves, 1991). Tal como o bootstrap é um método

de reamostragem, pois se baseia na construção de sub-amostras geradas de uma

amostra original inicial.

Apesar de o método Jackknife ter sido ultrapassado, em termos de

utilização, pelo bootstrap como um eficiente estimador de medidas de variabilidade e

intervalos de confiança, ele continua como uma medida viável de observações

influentes (uma observação que exerce uma influência desproporcional sobre um ou

mais aspectos das estimativas e essa influência pode ser baseada em valores

extremos das variáveis) e uma opção para os pacotes estatísticos.

2.5.2 Obtenção da amostra Jackknife

Seja uma amostra original de tamanho n , ]'...,,,[ 21 nxxxx , o método

Jackknife consiste em gerar n novas amostras de tamanho 1n , sendo a i-ésima

nova amostra ( 1,..., )i n composta pelos valores da amostra original, com exceção

da i-ésima observação (Martinez, Sandanielo e Louzada Neto, 2006).

Logo, sendo ]'...,,,[ 21 nxxxx a uma amostra de v.a’s i.i.d., são geradas

amostras nxxxxx ,,,,' 432)1( , nxxxxx ,,,,' 431)2( , nxxxxx ,,,,' 421)3( , ...,

nnn xxxxxx ,,,,,' 2321)1( e ( ) 1 2 3 1' ( , , ..., ).n nx x x x x Em cada uma das novas

amostras geradas, estima-se o parâmetro de interesse , por ( )ˆ ( ), 1,2,...,i is x i n ,

que são as reamostras “Jackknife” da estatística que é o estimador do parâmetro.

Da amostra original x que já disponibilizou a estimativa original do parâmetro por

56

ˆ ( )s x , tem-se as n estimativas Jackknife do parâmetro, (.)

ˆˆ i

n

, chamada de

estimador Jackknife do parâmetro .

2.5.3 Método bootstrap

Como mencionado anteriormente o método bootstrap é considerado o

sucessor do método Jackknife, e recebeu mais atenção por parte dos estatísticos, se

tornando assim uma técnica poderosa, associada à solução de problemas de

estimação, nos quais os métodos clássicos sejam assintóticos ou não existam.

Dois tipos de métodos estatísticos são usualmente utilizados nos trabalhos

científicos. São eles: o paramétrico, quando se conhece o modelo de probabilidade

que pode ser identificado com os dados e o não-paramétrico, quando não se tem um

modelo probabilístico associado aos dados. Nesta dissertação o objetivo é aplicar o

método bootstrap a um estimador assintótico. O erro padrão da estimativa da

confiabilidade pelo método Kaplan-Meier.

O termo bootstrap paramétrico é utilizado quando se tem alguma suposição

da distribuição, por exemplo, a suposição de que a população segue uma

distribuição Weibull, ou ainda tem-se o conhecimento da distribuição amostral de

algum estimador e deseja-se obter a distribuição amostral de outro estimador que

depende do primeiro. Este método recebe uma breve abordagem a seguir.

Já o termo bootstrap não-paramétrico é utilizado quando não se tem

nenhuma suposição da distribuição do conjunto de dados, ou seja, a distribuição

amostral da qual os dados vieram é desconhecida.

Embora a técnica bootstrap seja teoricamente simples, deve-se ter

disponível um software para fazer a reamostragem. Os softwares, tais como: SPSS,

SAS e MINITAB, não têm um procedimento disponível para fazer a reamostragem,

entretanto pode-se programar procedimentos de reamostragem, ou utilizar

linguagens de programação de computadores para implementar o método, que é o

caso deste trabalho.

57

2.5.3.1 Método bootstrap não-paramétrico

2.5.3.1.1 Definição e propriedades

O bootstrap é uma técnica estatística computacionalmente intensiva não-

paramétrica que permite a avaliação da variabilidade de estatísticas com base nos

dados de uma amostra existente inicial. É indicado para problemas onde os

procedimentos estatísticos padrões não existam ou sejam de difícil aplicação. É

vantajoso se usado em problemas com amostra finita ou com amostra grande,

desde que forneça resultado semelhante ao método assintótico usual em grande

amostra e superior em amostra pequena (Chaves Neto, 1991).

O bootstrap surgiu quando Efron em 1979 (apud Chaves Neto, 1991)

estudava o problema da estimação da distribuição amostral de uma estatística

( , )nT x F com base nos dados da amostra de tamanho n , ]...,,,[ 21 nxxxx , de uma

distribuição de probabilidade desconhecida , ~ . . .iF X i i d F .

O procedimento bootstrap é feito a partir de uma amostra inicial

]...,,,[ 21 nxxxx criando-se B novas amostras, ou reamostras, com tamanho igual

ao da amostra inicial, com reposição dos valores. Então, calcula-se a estatística de

interesse para cada reamostra bootstrap. Estas amostras bootstrap são conhecidas

como pseudo-dados. Assim o conjunto de valores bootstrap da estatística

corresponde a uma estimativa da verdadeira distribuição amostral da estatística em

questão. Essa operação pode ser representada pelo seguinte esquema:

- seja o parâmetro e seu estimador a estatística ( , )nT x F , onde 1 2[ , ,..., ]nx x x x é a

amostra aleatória disponível da variável aleatória com função distribuição

desconhecida , ~ . . .iF X i i d F é:

Então:

1º) o estimador não-paramétrico de máxima verossimilhança )(ˆ xFn de F é:

)(ˆ xFn

n

i

i nxXI

1

/)( (2.34)

58

com )( xXI i sendo função indicadora. Assim esta distribuição empírica é

construída colocando-se massa probabilística n/1 em cada ponto amostral;

2º) de ˆnF toma-se B (muito grande) amostras bootstrap de mesmo tamanho n ,

* * * *

1 11 12 1[ , ,..., ]nx x x x *

1ˆ~i nX iid F

* * * *

2 21 22 2[ , ,..., ]nx x x x *

2ˆ~i nX iid F

. . . . . . . . . . . . . . . . . . . . . .

* * * *

1 2[ , ,..., ]B B B Bnx x x x * ˆ~Bi nX iid F

3º) calcula-se as B estatísticas bootstrap )(**ln xT com 1,2,...,l B , correspondentes

às B amostras bootstrap e forma-se o conjunto:

**{ ( ); 1,2,..., }lnT x l B (2.35)

que é uma simulação da verdadeira distribuição amostral da estatística ( , )nT x F .

Como o conjunto **{ ( ); 1,2,..., }lnT x l B pode-se obter a medida da

variabilidade de ( , )nT x F , como o seu erro-padrão bootstrap. A estimativa do vício da

estatística ( , )nT x F é dada por:

*[ , ( , )] ( , )n n nb T x F T x F T (2.36)

onde *

nT corresponde à estimativa bootstrap do parâmetro e que é dada por:

*

* 1[ ( )]

B

lnln

T xT

B

(2.37)

Na prática constrói-se a distribuição bootstrap, da estatística FxTn , , pelo

método de Monte-Carlo com um número de replicações, B , suficientemente grande.

59

Um indicador do tamanho adequado de B , independente do custo computacional, é

a qualidade da convergência da estimativa bootstrap do parâmetro para a estimativa

natural do parâmetro *( ( , ))n nBT T x F

. O fluxograma da Figura 13 apresenta o

algoritmo de construção da distribuição bootstrap.

FIGURA 13 – Algoritmo da distribuição bootstrap da estatística FxTn ,

FONTE: Chaves Neto (1991).

O procedimento descrito se aplica ao método bootstrap não-paramétrico. Ao

se optar pela utilização do método bootstrap paramétrico, procede-se da mesma

forma, com única diferença de que cada amostra bootstrap é obtida da distribuição

estimador não-paramétrico

)(ˆ tFn =

n

i

i nttI1

/)](

associado a amostra t

associado a amostra

amostra bootstrap de

]ˆ,...,ˆ,ˆ,ˆ[ˆ **

3

*

2

*

1

*'

nttttt

amostra original dos tempos

de falha ntttt ,,, 21

repete-se o processo

B vezes

distribuição bootstrap de

)(*

tTn que simula a

distribuição amostral de )(tTn

},...,3,2,1;)({*

BltT ln

cálculo da estatística bootstrap

)( *tTn

inicio

fim

60

paramétrica que originou os dados, amostras, que se possui, ao invés de

reamostrar-se as observações disponíveis.

A convergência do algoritmo, ou seja, do 3º passo com B tendendo para o

infinito esta assegurada pela Lei dos Grandes Números, pois **

1( )nT x , **

2( )nT x ,...,

**( )BnT x nada mais são do que uma amostra de v.a’s i.i.d. com a distribuição

condicional de ˆ( , ) |nT X F X x .

Portanto quando B tende para o infinito, a média amostral *

nT se aproxima

de ˆ[ ( , ) | ]nE T X F X x . Efron sugeriu que a distribuição condicional bootstrap de

ˆ( , ) |nT X F X x pode ser usada como a distribuição de xXFXTn |),( . Como se vê,

no procedimento bootstrap os pontos da amostra original ]'...,,,[ 21 nxxxx são

considerados como população com função de distribuição F e média x . A

estatística bootstrap * * ˆ( , )n nT T x F é considerada como um estimador de ( , )nT x F , e

ainda, a distribuição de * ˆ( , )nT x F pode ser usada para aproximar a distribuição

amostral desconhecida de ( , )nT x F . Logo, a distribuição de *( )n nT T n pode ser

usada para aproximar a distribuição amostral de ( )nT n . Da mesma forma que

no caso Jackknife, a normalidade assintótica de *( )n nT T n e a convergência em

probabilidade da variância bootstrap,

** *1( )² [ ( ) ]²

1in ns T x T

B

para ( )nV T foram investigadas e provadas por Bickel e Freedman em 1981.

Seja agora a amostra bootstrap **

xX obtida pelo esquema da Figura 14.

O número de vezes em que o ponto amostral ix é selecionado no procedimento é

denotado por:

*** # xXN i

61

Consequentemente, nNn

i i 1

* e o vetor **

2

*

1

*,...,, nNNNN , segundo

Chaves Neto (1991), tem distribuição multinominal. Ainda, vê-se que nnbN i 1,~* e,

em correspondência a estes números existe uma distribuição de freqüências

relativas nNf ii

* , sendo que if assume valores no conjunto nnnn ,,2,1,0 .

Segundo Chaves Neto (1991) a v.a. if possui a média igual a n1 e a variância igual

a 31 nn .

Por exemplo, seja o pivô iii snn /ˆ com distribuição t para os valores in

da estimativa de uma estatística qualquer, o intervalo de nível 1 para esse

parâmetro é:

iiii stnstn ).2/1(ˆ;).2/1(ˆ .

A estatística is é o estimador clássico, utilizado pelo estimador não-

paramétrico, do erro padrão de in . O número de graus de liberdade, , da

distribuição t é dado pela diferença entre o tamanho da amostra e o número de

parâmetros estimados. Pode-se conseguir um intervalo de confiança bootstrap para

o parâmetro simplesmente substituindo-se is pela estimativa bootstrap *

is dada por:

2

1

1

2*** ˆˆ1

n

l

iili nnB

s

onde *ˆiln é a estimativa bootstrap do parâmetro in na replicação l . Tem-se portanto:

** ).2/1(ˆ;).2/1(ˆiiii stnstn

que é o intervalo bootstrap simétrico de nível 1 para o parâmetro in .

Os intervalos de confiança, que são abordados com mais ênfase no capítulo

3, podem ser construídos com base em estatísticas bootstrap. O mais simples dos

intervalos bootstrap é o bootstrap-t, onde apenas se faz a substituição da estimativa

62

usual do erro padrão, pela estimativa bootstrap. Este e outros métodos de obtenção

de intervalos de confiança são abordados no capítulo 3, sendo separados em 4

classes ou métodos.

O bootstrap pode apresentar problemas se acontecer algum dos seguintes

casos, ou uma combinação deles:

O método boostrap é sensível ao comportamento das caudas da

distribuição F da população (valores muito discrepantes);

Para que o método seja consistente é necessário que a estatística (.)s

tenha certo grau de suavidade;

Às vezes a consistência do estimador bootstrap depende do método

usado para se obter os dados.

2.5.3.2 Método bootstrap paramétrico

Existem diferentes métodos para gerar amostras bootstrap. Um desses

métodos é o paramétrico. Esse método simula amostras de tamanho n a partir de

uma distribuição )ˆ|( tF , conhecida. Por exemplo, )ˆ|( tF pode ser a função

densidade da distribuição Normal com )ˆ,ˆ(ˆ 2 , em que e 2 são os

estimadores de máxima verossimilhança de e 2 , respectivamente. O bootstrap

paramétrico assume que (.)F é conhecida com um ou mais parâmetros

desconhecidos. Por exemplo, (.)F poderia ser conhecida, com distribuição Log-

Normal, sendo os parâmetros e 2 desconhecidos. Freqüentemente, os

parâmetros da (.)F são obtidos via método de máxima verossimilhança (Barros,

2005).

63

3. MATERIAL E MÉTODO

Conforme mencionado na introdução, o trabalho visa apresentar mais uma

aplicação do método computacionalmente intensivo bootstrap e assim encontrar

intervalos de confiança mais próximos da realidade para os valores da função de

confiabilidade, estimada pelo método de Kaplan-Meier. Além de apresentar o

método, também implementou-se o modelo computacional, fazendo sua validação. A

eficiência do modelo foi avaliada através de um comparativo dos intervalos de

confiança bootstrap com o do estimador assintótico. Os softwares utilizados para a

construção das análises foram: o Action-1.1 para comparar os valores das

estimativas dos valores da função de confiabilidade, MATLAB R2009a para a

plotagem dos gráficos dos intervalos de confiança e o compilador Microsoft Visual

Studio 2008, para o desenvolvimento dos programas da dissertação, em linguagem

Fortran 2003.

O material utilizado, amostras de tempos de falha, foi obtido de amostras

sintéticas, ou seja, amostras que foram geradas de um gerador de números

aleatórios de falhas, também implementado em linguagem Fortran 2003.

A linguagem Fortran 2003 foi escolhida por ser uma linguagem voltada para

programas matemáticos de engenharia. Inicialmente os métodos foram

implementados em linguagem C, mas como o método do bootstrap gera muitas

amostras, a execução dos programas em C ficavam muito demorados, e, às vezes

não foram possíveis os cálculos, quando o número de amostras era muito grande,

impondo algumas limitações e atrapalhando o desenvolvimento do trabalho.

Para as análises e implementações foi utilizado um notebook com

processador Intel® CoreTM i5 CPU M460 2.53GHz. Os tempos computacionais

diferem muito pouco de amostra para amostra, mas na média conseguiu uma marca

de 5 segundos para cada análise, calculada a partir do termino da entrada dos

dados até o retorno dos valores. Estes tempos variaram durante a elaboração e

refinamento do programa que calcula as aplicações. Para a primeira aplicação, onde

o programa ainda estava muito carregado com cálculos desnecessários, o tempo

computacional chegou à uma hora, e assim conforme os ajustes o tempo passou a

diminuir muito, chegando aos valores mencionados, proporcionando uma análise

eficaz e rápida para as amostras. É importante ressaltar que o tamanho da amostra

influencia o tempo computacional, mas ficaram evidenciados aumentos significativos

64

no tempo, acima de 30 segundos, para amostras com mais de 50 categorias de

tempos de falha. Caracterizando que para amostras até esta marca os tempos

computacionais ficaram praticamente iguais.

3.1 SEQUÊNCIA DA APLICAÇÃO DO MÉTODO BOOTSTRAP

A aplicação do método bootstrap segue a seguinte sequência:

Efetua-se o cálculo da estatística desejada para a amostra original

],,,[ 21'

nxxxx obtendo-se )(xTn ;

Após isso, inicia-se o método bootstrap construindo B novas amostras

bootstrap Bjx j ...,,2,1*

a partir da amostra inicial, com reposição. Assim, amostra-

se a amostra original tomando-se amostras com reposição de mesmo tamanho n . E,

tem-se B amostras bootstrap em cada categoria de tempo, ki ...,,2,1 ;

Terminada a construção das B reamostras, B geralmente grande, na

casa das 10000, calcula-se os valores da estatística para cada amostra bootstrap

Bjx j ...,,2,1*

, obtendo-se BjxT jji ...,,2,1)(** . E, isto é feito para cada um dos k

conjuntos de categorias de tempo de falha.

Calcula-se a média bootstrap de cada categoria de tempo, ki ...,,2,1 ;

Calcula-se o erro padrão bootstrap de cada categoria de tempo,

ki ...,,2,1 ;

Por fim, constrói-se os intervalos de confiança.

Seja o exemplo de uma aplicação:

Seja a amostra inicial ]'3,1,1,2,1[x de número de falhas para as categorias

5,,1t , para uma amostra com 30n produtos.

Assim construindo as B amostras bootstrap tem-se:

]'3,1,1,2,2[*

1 x , ]'3,1,2,1,1[*

2 x , ..., ]'2,1,2,1,3[*Bx , ]'1,1,2,3,1[

*Bx ;

]'73.0,083,87.0,90.0,97.0[)(ˆ xR ;

65

TABELA 3 – AMOSTRAS BOOTSTRAP OBTIDAS DA ORIGINAL

Categoria Nº de falhas para cada categoria

*

1x *

2x ... *

1Bx *

Bx

1t 2 1 ... 3 1

2t 2 1 ... 1 3

3t 1 2 ... 2 2

4t 1 1 ... 1 1

5t 3 3 ... 2 1

FONTE: O autor (2011).

TABELA 4 – ESTIMATIVAS BOOTSTRAP DA CONFIABILIDADE

Categoria Confiabilidade estimada para cada amostra bootstrap

*1 )(ˆ tR *

2 )(ˆ tR ... *1 )(ˆ tRB *)(ˆ tRB

1t 0.9333333 0.9666667 ... 0.9000000 0.9666667

2t 0.8666667 0.9333333 ... 0.8666667 0.8666667

3t 0.8333333 0.8666667 ... 0.8000000 0.8000000

4t 0.8000000 0.8333333 ... 0.7666667 0.7666667

5t 0.7000000 0.7333333 ... 0.7000000 0.7333333


onde Bjx j ...,,2,1,*

são as amostras bootstrap das falhas para cada categoria de

tempo de falha, )(ˆ xR as estimativas da confiabilidade para a amostra original e

BjtR j ...,,2,1,)(ˆ * , a confiabilidade estimada para as amostras bootstrap.

Terminado esta etapa, é calculado a média

B

j

iji R

BR

1

** ˆ1 e o erro padrão

bootstrap, *ˆpe :

TABELA 5 - ESTATÍSTICAS BOOTSTRAP PARA CADA CATEGORIA DE TEMPOS DE FALHA

Categoria Média de cada categoria *iR Erro padrão bootstrap *ˆpe

1t 0.9665526 0.0299653

2t 0.9007625 0.0599207

3t 0.8674803 0.0552260

4t 0.8340740 0.0466594

5t 0.7331951 0.0600623


66

TABELA 6 – INTERVALOS DE CONFIANÇA DE KAPLAN-MEIER E BOOTSTRAP

Categorias IC. Kaplan-Meier IC. bootstrap-t IC. bootstrap percentílico

1t 0.7860770 0.9952365 0.9646863 0.9685377 0.9333333 1.0000000

2t 0.7211880 0.9666077 0.8884074 0.9104497 0.8666667 1.0000000

3t 0.6827647 0.9477520 0.8526042 0.8794839 0.8333333 0.9666667

4t 0.6449564 0.9270071 0.8189096 0.8467180 0.8000000 0.9333333

5t 0.5369106 0.8566934 0.7054614 0.7590329 0.6666667 0.8333333


Assim tem-se a aplicação do método a uma amostra de tempos de falha de

30n itens, com 5k categorias de tempos de falha, 8 falhas e 22 censuras.

3.2 ERRO PADRÃO BOOTSTRAP

Para calcular alguns tipos de intervalo de confiança bootstrap é necessário

calcular primeiramente o erro padrão bootstrap, já que é utilizado no lugar do erro

padrão da amostra original para o intervalo clássico do estimador de Kaplan-Meier,

na expressão do intervalo de confiança do estimador.

O erro padrão bootstrap é calculado para cada categoria de tempo de falha,

utilizando todas as B amostras bootstrap.

Sua expressão apenas depende dos valores da confiabilidade para cada

categoria de tempos de falha e a média de cada categoria:

Erro padrão bootstrap: ,ˆ1ˆ1

1ˆ

2***

ij

iji R

BR

Bpe

onde B é o número de amostras bootstrap e *ˆ i

jR é o valor da confiabilidade

estimada para cada ponto do vetor de categorias de tempos de falha, com ki ...,,1

e Bj ...,,1 .

67

3.3 INTERVALOS DE CONFIANÇA BOOTSTRAP

O método bootstrap, juntamente com o seu erro padrão, pode ser uma

técnica robusta na hora de construir um intervalo de confiança para as estimativas

da função de confiabilidade. Além do intervalo de confiança bootstrap convencional

existem vários outros métodos de cálculo do intervalo de confiança, que eliminam

alguns problemas que geralmente aparecem quando se trabalha com amostras

“estranhas”, ou seja, amostras que não tenham distribuições parecidas com a

distribuição normal.

A seguir apresentam-se os diferentes métodos de obtenção do intervalo de

confiança bootstrap, sendo eles o intervalo bootstrap-t, percentis bootstrap, ou

intervalo bootstrap percentílico, BCPB e o aBC , com estes dois últimos uma

adaptação do intervalo percentilico para casos especiais.

3.3.1 Intervalo bootstrap-t

O intervalo de confiança bootstrap-t é calculado da mesma maneira que o

intervalo de confiança do estimador de Kaplan-Meier, apenas substituindo o erro

padrão clássico do estimador de Kaplan-Meier pelo erro padrão bootstrap:

1)](ˆ[ˆ)(ˆ)()](ˆ[ˆ)(ˆ *

21

*

21

tRpeztRtRtRpeztRP

com n o tamanho da amostra original e *ˆpe é o erro padrão bootstrap da estatística.

Embora seja flexível e praticamente automático, o cálculo do intervalo de

confiança possui um problema que pode afetar a sua eficácia. O método funciona

bem quando a distribuição bootstrap da estatística é aproximadamente Gaussiana e

a estatística pouco viciada. Sendo respeitadas estas condições o intervalo de

confiança bootstrap-t pode ser calculado na estimação de vários parâmetros.

68

3.3.2 Intervalo de confiança baseado nos percentis bootstrap

Existem dois modos distintos de se calcular o intervalo percentílico bootstrap

para uma confiança de %100).1( :

a primeira forma é calcular o percentil %100).2

1( e o percentil

( 2)100% das estatísticas amostrais bootstrap e usá-los como os limites do

intervalo.

];[ *%10021

*%1002

* PPIC

a segunda é obter o intervalo de confiança percentílico utilizando a

técnica em estudo através dos percentis das diferenças dos valores das estatísticas

nas reamostras bootstrap com a sua média, isto em cada categoria de tempo de

falha.

Para um intervalo de confiança de um valor da função de confiabilidade

)(tR , calcula-se o valor das estatísticas para cada uma das B amostras bootstrap

*ˆ ijR e as médias das estimativas iR , Ki ...,,2,1 e Bj ...,,2,1 . Então encontra-

se para cada amostra bootstrap, Bj ...,,2,1 , a diferença entre o valor de cada

estimativa bootstrap *ˆ i

jR e a média de todas as estimativas bootstrap na categoria i :

iijj RR ˆˆ **

Após este cálculo, essas diferenças são ordenadas de forma crescente

assim obtendo-se B diferenças, podendo encontrar o percentil desejado para as

diferenças.

Para um intervalo de confiança de 95%, por exemplo, encontram-se os

percentis de 97,5% e 2,5% das diferenças e calcula-se o intervalo de confiança

bootstrap percentílico da seguinte forma:

%95])(ˆ)()(ˆ[ *%5.2

*%5,97 tRtRtRP

69

Efron (1986) afirmou que se a distribuição bootstrap não for

aproximadamente Gaussiana, mas existir uma transformação monotônica possível

que a torne Normal, pode-se calcular o intervalo de confiança bootstrap percentílico

para os dados transformados, e, posteriormente, desfazer a transformação para os

limites do intervalo encontrado. Para isso a transformação deve ser monotônica,

logo o intervalo de confiança bootstrap pelo método percentílico assim calculado terá

valores iguais ao intervalo de confiança bootstrap pelo método percentílico para os

dados não transformados. Caso o vício e a assimetria estejam presentes de forma

muito forte é mais recomendável a utilização dos métodos de correção como o

método BCPB e o método aBC .

3.3.3 Intervalo de Confiança Bootstrap BCPB

No método BCPB, os extremos são os percentis da distribuição bootstrap

ajustados para corrigir o vicio e a assimetria da distribuição.

Para encontrar um intervalo de confiança BCPB de 95%, por exemplo, é

preciso ajustar os percentis de um cálculo de intervalo de confiança percentílico

tradicional, que seriam, para um nível de 95%, os percentis 97,5% e 2,5%, para

valores que corrigiriam o vício e a assimetria. Se a estatística for viciada para cima, o

BCPB move os extremos para a esquerda e se for viciada para baixo move os

extremos para a direita.

Para realizar o calculo do intervalo BCPB, primeiramente deve-se ordenar as

B estimativas BjR j ...,,2,1ˆ * em forma crescente e calcular a probabilidade 0p de

uma estimativa ser inferior à estimativa da amostra mestre )ˆ(R :

]ˆˆ[ *

0 RRPp j

A partir do valor encontrado 0p é obtido o parâmetro de correção do vicio 0z

que representa a inversa da normal no ponto 0p , tal que:

)( 0

1

0 pz

70

O segundo passo é selecionar um nível %100).1( de confiança para a

estimativa do parâmetro a determinar 2z . Então é possível obter os percentis IP e

SP :

)2( 20 zzPI

)2( 20 zzPS

O Intervalo de Confiança, BCPB, é calculado da seguinte maneira:

)]ˆ();ˆ([ ***jPjPBCPB RPRPIC

SI .

3.3.4 Intervalos de confiança percentis aBC

O método de Correção de Vício Acelerado permite encontrar o intervalo de

confiança quando assimetria estiver presente de maneira forte. Esse método é

semelhante ao método BCPB, a diferença é o fato de o aBC possuir uma constante

de aceleração a que ajusta o intervalo de confiança em relação à assimetria.

Segundo Efron (1986), nesta situação este método é mais indicado que o método

BCPB.

O intervalo de Confiança aBC é obtido de forma análoga ao método BCPB,

realizando os mesmo passos do cálculo do intervalo de confiança com os limites IP

e SP , porém utilizando um ajuste por meio da constante de aceleração a . A

obtenção da constante a envolve cálculos não triviais, o que leva o Intervalo de

Confiança aBC ser mais utilizado quando há algum software estatístico disponível.

O cálculo do intervalo de confiança aBC é feito utilizando as seguintes

fórmulas para os valores de IP e SP :

71

,)(1

)(

20

200

zza

zzzPI

)(1

)(

20

20

0

zza

zzzPS

e substituindo na expressão:

)]ˆ();ˆ([ ***jPjPBC RPRPIC

SIa .

Segundo Andrews e Buchinsky (2002), é possível determinar a constante a

de maneira simples se as variáveis aleatórias, da amostra original, observadas forem

independentes e identicamente distribuídas. Assim o cálculo da constante será:

2/3

1

**

1

**

))²ˆˆ((6

)³ˆˆ(

k

i

iji

k

i

iji

RR

RR

a

com *ˆ i

jR sendo o valor das estimativas do parâmetro estudado para cada amostra

Bj ...,,2,1 que consiste na amostra mestre sem a categoria i , com ki 1 e *

ˆ iR o

valor da média das estimativas bootstrap, *R .

72

3.4 GERADOR ALEATÓRIO DE AMOSTRAS DE FALHAS

Pensando em uma forma fácil e rápida de se obter amostras de falhas das

categorias de tempos de falhas, foi desenvolvido um gerador aleatório com

distribuição uniforme, programado na linguagem Fortran 2003.

O gerador pode gerar amostras com, ou sem, censura, podendo ser

caracterizada como censura por tempo de uso, número de acionamentos, com

valores inteiros, número máximo de falhas pré-estabelecido, entre outros.

Para a construção das amostras, é apenas necessário que se entre com a

informação de que a amostra possua censura ou não, o tamanho da amostra, e caso

possua censura o número de elementos máximos para a amostra. Retornando

então, no caso sem censura, um vetor com o tamanho desejado e o número total de

elementos, e no caso censurado o vetor do tamanho informado e o número

informado de elementos, e o número de produtos que falharam na simulação.

O programa utiliza o gerador de números aleatórios das funções da

linguagem Fortran 2003, que segue uma distribuição uniforme. É importante

ressaltar que o gerador não retorna os tempos de falha, e sim a quantidade de

elementos, produtos, que falharam na primeira categoria de tempo de falha, na

segunda e assim até a n -ésima categoria de tempos de falha.

Com o auxílio do gerador foram criadas várias amostras sintéticas de

categorias de tempos de falha, e assim aplicado cada amostra ao programa

principal, o qual calcula as reamostragens e os intervalos de confiança bootstrap.

Neste trabalho estão apresentadas seis aplicações às amostras sintéticas, variando

entre amostras com censura e sem censura, com vários tamanhos de categorias de

tempos de falha, 10 até 22 categorias, sendo 2 amostras sem censura e 4 amostras

com censura.

As amostras apresentam os números das falhas para cada categoria de

tempo. Seja o exemplo onde se considera 5k categorias de tempos de falha e

tem-se os números de falhas para cada categoria 5...,,2,1i . Então,

].3,1,1,2,1[x

73

Assim para a categoria 1t um produto falhou, para a categoria 2t dois

produtos falharam e assim até a última categoria k que corresponde a 5t em que

três produtos falharam. A amostra é do tipo censurada, pois considerou-se 30n

itens e nem todos os itens falharam )30831121( . Ocorreram vinte e duas

)22( censuras.

3.5 OBTENÇÃO DO INTERVALO DE CONFIANÇA BOOTSTRAP

A partir dos métodos descritos nas seções anteriores, pode-se obter vários

intervalos de confiança bootstrap, os abordados neste trabalho foram o intervalo de

confiança do estimador de Kaplan-Meier, intervalo de confiança bootstrap-t e o

intervalo bootstrap baseado nos percentis, percentílico, já que apenas foi trabalhado

com amostras que tem distribuição parecidas com a normal. Para o intervalo

bootstrap-t utilizou-se o erro padrão bootstrap já definido no começo deste capítulo.

Foram consideradas apenas amostras com censura dos tipos I e II, censura

por tempo de uso, número de acionamentos e número máximo de falhas pré-

estabelecido, que são os tipos mais comuns de censura para produtos e sistemas,

encontrados na literatura. Além do que esse tipo de censura torna o trabalho mais

simples e a análise mais eficaz, já que as censuras podem ser aceitas como falhas,

ou podem ser aceitas como ausência de falha.

O valor de B para o número de replicações foi crescendo gradativamente

durante as análises, para valores de B acima de 1000, os resultados começaram a

ficar melhores, ou seja, os valores do erro padrão bootstrap ficam menores que do

erro padrão calculados pelo estimador de Kaplan-Meier, e os intervalos de confiança

bootstrap ficaram com amplitudes menores que os intervalos de estimador clássico

que os resultados obtidos pelo estimador padrão, e começaram a estabilizar para

valores de B próximos de 10000.

Para todos os métodos de obtenção dos intervalos de confiança bootstrap

listados neste capítulo é utilizado o mesmo cálculo do erro padrão bootstrap descrito

no mesmo capitulo.

Como geralmente na aplicação do bootstrap obtém-se um único erro padrão

para cada amostra, e para o estimador de Kaplan-Meier temos valores para cada

categoria de tempo de falha, foi necessário uma adaptação do cálculo do erro

74

padrão bootstrap, gerando um valor de erro para cada categoria de tempo de falha

da estimação da confiabilidade.

Assim obteve-se um valor do erro padrão para a categoria 1t , um valor do

erro para a categoria 2t , e assim sucessivamente até a categoria n , gerando um

vetor de erros padrão bootstrap:

]ˆ...,,ˆ,ˆ[ˆ **

2

*

1

*

npepepepe

Assim tem-se uma matriz 2nIC dos valores do intervalo de confiança, onde a

primeira posição de cada linha refere-se ao limite inferior do intervalo e a segundo

posição o limite superior do intervalo.

É evidente que haverá desigualdades entre os intervalos de confiança

calculados com métodos distintos, uma vez que cada um, mesmo que usando o

mesmo valor do erro padrão bootstrap, utilizam equações diferentes, que podem

mudar os limites dos intervalos, deixando mais, ou menos, ajustados em torno do

valor da confiabilidade estimada.

Com isso pode-se optar pelo intervalo que se encaixe melhor nos interesses

do estudo, já que o programa principal retornará os valores do intervalo bootstrap-t e

o percentílico, além do intervalo do estimador de Kaplan-Meier e seus reajustes se

necessário, para a comparação e análise.

3.6 COMPARAÇÃO DOS INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER E O BOOTSTRAP

Após a elaboração dos intervalos de confiança, é necessário fazer a

comparação entre os intervalos obtidos pelo método bootstrap com os intervalos de

confiança do estimador de Kaplan-Meier, para poder ter uma possível confirmação

do que era esperado.

A relação de melhor ou pior intervalo será feito em questão da amplitude,

logo o intervalo que ficar mais extenso é considerado pior, ou menos ajustado em

torno da estimativa, que o outro de amplitude menor.

No método do intervalo bootstrap-t basta analisar apenas o valor do erro

padrão bootstrap, já que o intervalo é, assim como o intervalo do estimador clássico,

75

geralmente simétrico em relação à estimativa, logo, se o erro padrão bootstrap for

menor que o erro padrão calculado pela fórmula de Greenwood o intervalo de

confiança será mais ajustado que do estimador, e assim será considerado melhor,

mais ajustado em torno das estimativas, que o intervalo calculado pelo estimador

clássico.

Mas quando se trata do intervalo percentílico é necessário uma análise

intervalo por intervalo, uma vez que ele pode não ser simétrico em relação à

estimativa. Assim essa análise exige um pouco mais de trabalho, pois se o tamanho

da amostra de tempos de falha for extensa utiliza-se um tempo maior que a análise

do intervalo bootstrap-t.

Como mencionado anteriormente, foram simuladas 6 amostras aleatórias de

tempos de falha, sendo 4 com censura e 2 sem censura, outras amostras foram

utilizadas mas não é possível apresentar todas as aplicações pelo espaço, podendo

tornar a trabalho muito carregado. Os resultados dos intervalos de confiança foram

confrontados a fim de constatar o sucesso da aplicação do método bootstrap.

76

4. RESULTADOS E DISCUSSÃO

4.1 APLICAÇÃO DO MÉTODO BOOTSTRAP AOS INTERVALOS DE CONFIANÇA

Os resultados da aplicação da metodologia descrita no capítulo 3 são

apresentados nesta seção. As amostras foram geradas pelo gerador aleatório

implementado. Sendo apresentadas seis aplicações em amostras.

Para cada amostra são apresentados: o seu histograma de distribuição

aproximada das falhas, três tabelas e os gráficos com os valores da confiabilidade

estimada e os intervalos de confiança do estimador de Kaplan-Meier e dois

intervalos do método bootstrap, o intervalo bootstrap-t e o intervalo percentílico. A

primeira tabela apresenta os valores dos tempos de falhas, número de itens que

falharam para cada tempo e a confiabilidade estimada de cada tempo. A segunda

mostra três tipos de intervalos de confiança, o do estimador de Kaplan-Meier,

bootstrap-t e o bootstrap percentílico, para facilitar as análises dos intervalos e por

fim a terceira apresenta a amplitude, comprimento, de cada intervalo de confiança,

os intervalos de confiança foram todos calculados para um limite de segurança de

95%.

4.1.1 Amostra gerada com 10 categorias de tempo de falha com 33 itens, censurada

A primeira amostra, censurada, contém 10 categorias de tempos de falha,

com um total de 33 componentes em teste, com 18 falhas, sendo 15 censurados.

FIGURA 14 – Histograma da amostra com 10 categorias de tempos de falha FONTE: O autor (2011).

77

TABELA 7 – CATEGORIAS DE TEMPOS DE FALHA, NÚMERO DE FALHAS E CONFIABILIDADE ESTIMADA PELO ESTIMADOR DE KAPLAN-MEIER PARA 10 CATEGORIAS

Categoria Nº de

falhas 10,...,2,1)(ˆ itRi Média

*

iR das

categorias

Erro padrão

bootstrap *ˆpe

1t 1 0.9696970 0.9698923 0.0284697

2t 1 0.9393940 0.9395501 0.0384284

3t 2 0.8787879 0.8793879 0.0632171

4t 3 0.7878789 0.7887975 0.0962398

5t 2 0.7272728 0.7281400 0.0997467

6t 2 0.6666667 0.6675317 0.0999279

7t 1 0.6363637 0.6373060 0.0939728

8t 2 0.5757576 0.5765691 0.0881435

9t 2 0.5151516 0.5154868 0.0769828

10t 2 0.4545455 0.4544869 0.0581672


TABELA 8 – INTERVALOS DE CONFIANÇA DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP PERCENTILICO PARA 10 CATEGORIAS

Categoria IC Kaplan-Meier IC bootstrap-t IC bootstrap percentílico

1t 0.8037434 0.9956753 0.9679861 0.9713178 0.9393939 1.0000000

2t 0.7787644 0.9844893 0.9348108 0.9436648 0.9393939 1.0000000

3t 0.7085648 0.9526940 0.8639367 0.8921208 0.8484849 1.0000000

4t 0.6059378 0.8927420 0.7498338 0.8208406 0.7575758 0.9696970

5t 0.5413215 0.8476930 0.6789450 0.7695858 0.6969697 0.9090909

6t 0.4794410 0.7996069 0.6106756 0.7165235 0.6363636 0.8484849

7t 0.4494479 0.7745697 0.5807734 0.6866351 0.6060606 0.8181818

8t 0.3912513 0.7226830 0.5188301 0.6284640 0.5454545 0.7575758

9t 0.3353672 0.6685141 0.4624017 0.5653012 0.4848485 0.6666667

10t 0.2818899 0.6121349 0.4132626 0.4948494 0.4242424 0.5757576


TABELA 9 – AMPLITUDE DOS INTERVALOS DE CONFIANÇA PARA 10 CATEGORIAS

Categoria Amplitude K-Meier Amplitude bootstrap-t Amplitude b. percentílico

1t 0.1919 0.0033 (1,72%) 0.0606 (31,6%)

2t 0.2057 0.0089 (4,32%) 0.0606 (29,5%)

3t 0.2441 0.0282 (11,6%) 0.1515 (62,1%)

4t 0.2868 0.0710 (24,8%) 0.2121 (73,9%)

5t 0.3064 0.0906 (29,6%) 0.2121 (69,2%)

6t 0.3202 0.1058 (33,1%) 0.2121 (66,2%)

7t 0.3251 0.1059 (32,6%) 0.2121 (65,2%)

8t 0.3314 0.1096 (33,1%) 0.2121 (64,0%)

9t 0.3331 0.1029 (30,9%) 0.1818 (54,6%)

10t 0.3302 0.0816 (24,7%) 0.1515 (45,9%)

Obs.: As porcentagens são referentes ao intervalo do estimador de Kaplan-Meier FONTE: O autor(2011).

78

FIGURA 15 – Intervalos da amostra com 10 categorias K-M e bootstrap-t FONTE: O autor (2011).

FIGURA 16 – Intervalos da amostra com 10 categorias K-M e b. percentílico FONTE: O autor (2011).

A Figura 14 apresenta o histograma das frequências dos números de falha

para cada categoria de tempo de falha, já a Tabela 7 apresenta a confiabilidade

estimada para a amostra original, a média bootstrap para cada categoria de tempo e

o erro padrão bootstrap, também para cada categoria de tempo.

A Tabela 8 mostra os resultados da aplicação para uma amostra sintética

censurada, ficando evidente que tanto o intervalo bootstrap-t quanto o percentilico

são intervalos mais curtos, ou seja, têm amplitudes menores em cada uma das

categorias de tempo, Tabela 9, do que o intervalo clássico para o estimador de

Kaplan-Meier. Para essa amostra o intervalo bootstrap-t foi o intervalo melhor,

79

devido ao erro bootstrap ser muito menor que o erro calculado por Kaplan-Meier. O

intervalo percentílico apresentou valores um pouco mais amplos do que o bootstrap-

t, mas mesmo assim mais curtos que o do estimador padrão.

Observando a Figura 15, a Figura 16 e a Tabela 9, fica clara a diferença dos

intervalos de confiança. O intervalo do estimador de Kaplan-Meier tem uma

amplitude muito maior que o intervalo bootstrap-t, e também maior que a amplitude

do intervalo percentilico. Para valores das estimativas da confiabilidade próximos de

1 o intervalo bootstrap-t não é simétrico, mas na seqüência ele tende a ser simétrico.

Já para o intervalo percentilico, seu limite inferior sempre se mantém perto dos

valores estimados da confiabilidade e tendo seu limite superior sempre acima do

limite superior do intervalo do estimador.

4.1.2 Amostra gerada com 11 categorias de tempo de falha com 39 itens, não censurada

As figuras, tabelas e gráficos a seguir foram criados a partir de uma amostra

aleatória sintética não censurada. A amostra possui 39 produtos e 11 categorias de

tempos de falha, onde todos os itens falham na simulação de teste.


80


Categoria Nº de falhas 11,...,1)(ˆ itRi Média *

iR das categorias Erro padrão

bootstrap *ˆpe

1t 1 0.9743590 0.9745176 0.0243354

2t 1 0.9487180 0.9486393 0.0327115

3t 2 0.8974359 0.8975456 0.0543295

4t 4 0.7948718 0.7957529 0.1021979

5t 6 0.6410257 0.6406971 0.1626228

6t 5 0.5128205 0.5137720 0.1797573

7t 2 0.4615385 0.4625213 0.1730633

8t 6 0.3076923 0.3137035 0.1806893

9t 5 0.1794872 0.1979244 0.1620376

10t 5 0.0051282 0.0999354 0.1227658

11t 2 0.0000000 0.0638045 0.0936555



Categoria IC Kaplan-Meier IC bootstrap-t IC b. percentílico 1t 0.8315876 0.9963480 0.9731233 0.9755386 0.9743590 1.0000000

2t 0.8101534 0.9869226 0.9454167 0.9518247 0.9230769 1.0000000

3t 0.7494106 0.9602185 0.8865899 0.9072995 0.8717949 1.0000000

4t 0.6314322 0.8916929 0.7554141 0.8286961 0.7692308 0.9743590

5t 0.4704332 0.7693366 0.5424722 0.7237458 0.5897436 0.9230769

6t 0.3479007 0.6554656 0.3867797 0.6253031 0.4615385 0.8461539

7t 0.3015959 0.6072957 0.3377575 0.5765047 0.3846154 0.7692308

8t 0.1725058 0.4536018 0.1864582 0.4372966 0.2307693 0.6666667

9t 0.0078973 0.3128085 0.0094445 0.2864258 0.1025641 0.5384616

10t 0.0009851 0.1517384 0.0022857 0.0096795 0.0000000 0.4102564

11t 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.3076923



Categoria Amplitude K-Meier Amplitude bootstrap-t Amplitude b. percentílico 1t 0.1648 0.0024 (1,45%) 0.0256 (15,5%)

2t 0.1768 0.0064 (3,6%) 0.0769 (43,5%)

3t 0.2108 0.0207 (9,8%) 0.1282 (60,8%)

4t 0.2603 0.0733 (28,2%) 0.2051 (78,8%)

5t 0.2989 0.1813 (60,7%) 0.3333 (111,5%)

6t 0.3076 0.2385 (77,5%) 0.3846 (125,0%)

7t 0.3057 0.2387 (78,1%) 0.3846 (125,8%)

8t 0.2811 0.2508 (89,2%) 0.4359 (155,1%)

9t 0.3049 0.2770 (90,8%) 0.4359 (142,9%)

10t 0.1508 0.0074 (4,9%) 0.4103 (272,1%)

11t 0.0000 0.0000 ( - ) 0.3077 ( - )


81


FIGURA 19 - Intervalos da amostra com 11 categorias K-M e b. percentílico FONTE: O autor (2011).


para cada categoria de tempo de falha, a Tabela 10 apresenta a confiabilidade



A Tabela 11 demonstra novamente o êxito da aplicação do método

bootstrap, mas desta vez o intervalo percentilico não se saiu tão bem quando na

amostra anterior, novamente o intervalo bootstrap-t obteve valores bons,

conseguindo intervalos mais ajustadas em torno das estimativas da confiabilidade.

No último intervalo de confiança da Tabela 11 os valores do estimador de Kaplan-

Meier e o bootstrap-t ficam com extremos iguais a zero, isso acontece devido a

82

fórmula, uma vez que os dois utilizam os valores da confiabilidade estimada para o

cálculo do intervalo e como ela é nula então os intervalos não tem amplitude alguma.

Novamente na Figura 18 é fácil verificar que o intervalo bootstrap-t possui

uma amplitude menor que do estimador clássico, mas nesta aplicação ocorre o

inverso, neste caso o intervalo do estimador se mantém simétrico praticamente em

quase todos os valores das observações e o intervalo bootstrap-t se demonstra

menos regular, já que recebeu o ajuste uma vez que alguns dos seus limites

superiores ultrapassaram a marca de 1 ponto, ou 100%. Para o intervalo

percentilico, até a quarta observação possui uma amplitude visivelmente, e

numericamente, menor que o intervalo do estimador de Kaplan-Meier, mas da quinta

até a décima primeira observação a amplitude ficou maior para o intervalo

percentilico do que para o Kaplan-Meier. Essa diferença pode ser justificada pelo

tipo da amostra, por não ser censurada talvez force o intervalo percentílico ter uma

amplitude maior, já que isso aconteceu com as outras amostras não censuradas

utilizadas nas simulações.

Para amostras um pouco maiores os resultados ainda são melhores, já que

é característico do estimador assintótico, lógico que amostras não tão extensas, pois

caso a amostra seja muito grande não existe a necessidade de aplicar o método

bootstrap já que as estimativas tendem ao valor real conforme o tamanho da

amostra cresça.

Nos dois casos mostrados anteriormente ficou evidente a eficácia da

aplicação do método bootstrap, para a amostra não censurada o intervalo

percentilico não se comportou tão bem, pois teve uma amplitude maior que a

amplitude do intervalo clássico do estimador, na maioria das observações, mas se

demonstrou eficaz para a amostra censurada. Entretanto para os dois tipos de

amostra, o intervalo bootstrap-t se demostrou melhor que os outros dois sempre

tendo uma amplitude menor que o intervalo do estimador de Kaplan-Meier,

mostrando que a aplicação foi eficiente.


A seguir é apresentada a aplicação a uma amostra censurada com 22

categorias de tempo de falha, com um total de 70 itens e 57 falhas, sendo 13

censuradas.

83



Categoria Nº de falhas 22,...,1)(ˆ itRi Média *iR das categorias

Erro padrão

bootstrap *ˆpe

1t 1 0.9857143 0.9857251 0.0138738

2t 1 0.9714286 0.9714772 0.0192419

3t 3 0.9285715 0.9280913 0.0447747

4t 5 0.8571429 0.8557433 0.0795369

5t 4 0.8000000 0.7978839 0.0939782

6t 4 0.7428572 0.7406402 0.1043036

7t 2 0.7142857 0.7126486 0.1050430

8t 4 0.6571429 0.6556810 0.1121111

9t 3 0.6142858 0.6134459 0.1134754

10t 4 0.5571429 0.5554927 0.1180758

11t 2 0.5285715 0.5269166 0.1162325

12t 4 0.4714286 0.4703937 0.1189218

13t 1 0.4571429 0.4559103 0.1168832

14t 4 0.4000001 0.3994991 0.1189335

15t 3 0.3571429 0.3569044 0.1166458

16t 3 0.3142858 0.3142420 0.1131285

17t 2 0.2857144 0.2857353 0.1084538

18t 1 0.2714286 0.2714806 0.1048753

19t 4 0.2142858 0.2142218 0.1003685

20t 1 0.2000001 0.2001101 0.0962219

21t 1 0.1857143 0.1859751 0.0919061

22t 1 0.1714286 0.1717197 0.0869427

FONTE: O autor(2011).

84


Categoria IC Kaplan-Meier IC bootstrap-t IC b. percentílico 1t 0.9028924 0.9979753 0.9853234 0.9860948 0.9857143 1.0000000

2t 0.8905523 0.9927770 0.9703469 0.9724714 0.9714286 1.0000000

3t 0.8368711 0.9696316 0.9222809 0.9343712 0.9142857 1.0000000

4t 0.7507553 0.9204527 0.8351399 0.8764293 0.8285714 0.9857143

5t 0.6857895 0.8763301 0.7646975 0.8306020 0.7714285 0.9571428

6t 0.6233769 0.8294762 0.6944205 0.7848270 0.7000000 0.9285714

7t 0.5929647 0.8052304 0.6614020 0.7604356 0.6714286 0.9000000

8t 0.5335257 0.7553414 0.5927202 0.7138882 0.6142857 0.8571429

9t 0.4900548 0.7168223 0.5440723 0.6769747 0.5571429 0.8285714

10t 0.4334640 0.6641195 0.4784279 0.6287096 0.5000000 0.7714286

11t 0.4057348 0.6372185 0.4490128 0.6018878 0.4714286 0.7428572

12t 0.3513920 0.5823445 0.3869818 0.5512108 0.4142857 0.7000000

13t 0.3380398 0.5684033 0.3737061 0.5366044 0.4000000 0.6857143

14t 0.2855879 0.5117327 0.3144799 0.4839550 0.3285714 0.6285715

15t 0.2472965 0.4682463 0.2741447 0.4407877 0.2857143 0.5857143

16t 0.2099736 0.4238591 0.2357992 0.3956323 0.2428572 0.5285715

17t 0.1856768 0.3937276 0.2123580 0.3631774 0.1857143 0.5000000

18t 0.1737182 0.3784877 0.2015634 0.3458481 0.1857143 0.4714287

19t 0.1273047 0.3162342 0.1533018 0.2821405 0.1285715 0.4142857

20t 0.1161011 0.3003092 0.1432048 0.2637350 0.1142857 0.3857144

21t 0.1050808 0.2842194 0.1332079 0.2451159 0.1142857 0.3714286

22t 0.0094259 0.2679519 0.1235335 0.2259886 0.1000000 0.3428572



Categoria Amplitude Kaplan-Meier Amplitude bootstrap-t Amplitude b. percentílico

1t 0.0951 0.0008 (0,84%) 0.0143 (15,1%)

2t 0.1022 0.0021 (2,1%) 0.0286 (27,9%)

3t 0.1328 0.0121 (9,1%) 0.0857 (64,5%)

4t 0.1697 0.0413 (24,3%) 0.1571 (92,6%)

5t 0.1905 0.0659 (34,6%) 0.1857 (97,5%)

6t 0.2061 0.0904 (43,9%) 0.2286 (110,9%)

7t 0.2123 0.0990 (46,6%) 0.2286 (107,7%)

8t 0.2218 0.1212 (54,6%) 0.2429 (109,5%)

9t 0.2268 0.1329 (58,6%) 0.2714 (119,7%)

10t 0.2307 0.1503 (65,2%) 0.2714 (117,6%)

11t 0.2315 0.1529 (66,1%) 0.2714 (117,2%)

12t 0.2310 0.1642 (71,1%) 0.2857 (123,7%)

13t 0.2304 0.1629 (70,7%) 0.2857 (124,0%)

14t 0.2261 0.1695 (75,0%) 0.3000 (132,7%)

15t 0.2209 0.1666 (75,4%) 0.3000 (135,8%)

16t 0.2139 0.1598 (74,7%) 0.2857 (133,6%)

17t 0.2081 0.1508 (72,5%) 0.3143 (151,1%)

18t 0.2048 0.1443 (70,5%) 0.2857 (139,5%)

19t 0.1889 0.1288 (68,2%) 0.2857 (151,3%)

20t 0.1842 0.1205 (65,6%) 0.2714 (147,3%)

21t 0.1791 0.1119 (62,5%) 0.2571 (143,6%)

22t 0.2585 0.1025 (39,7%) 0.2429 (94,0%)

Obs.: As porcentagens são referentes ao intervalo do estimador de Kaplan-Meier

85




para cada categoria de tempo de falha, a Tabela 10 apresenta a confiabilidade



Por se tratar de uma amostra maior que as outras, os resultados das

estimativas tendem a serem melhores, ou seja, mais perto dos valores reais da

função de confiabilidade. Seus intervalos de confiança ficaram todos bem justos,

mas novamente o intervalo bootstrap-t obteve valores mais ajustados em torno das

estimativas da confiabilidade que o intervalo do estimado de Kaplan-Meier. Dessa

86

vez os intervalos do estimador e o bootstrap-t se mantiveram praticamente

simétricos em relação aos valores da confiabilidade estimada, lógico que novamente

com o intervalo bootstrap-t apresentando amplitude menor. Novamente para o

intervalo percentílico, o limite inferior ficou bem próximo ao valor da confiabilidade

estimada e isso aconteceu com a maioria das amostras, tanto para amostras

censuradas quanto para não censuradas. Talvez por utilizar um percentil elevado

para o limite superior, isso force o valor geralmente para cima.


A quarta aplicação foi feita a uma amostra com 13 categorias de tempo de

falha, contendo um total de 46 itens com censura, onde 26 produtos falharam e os

outros 20 foram censurados. Fica evidente observando o histograma de frequências

de falhas, que a média de falhas por categoria de tempo de falha ficou próximo à

duas falhas por categoria, ficando evidente, também, que a amostra não teve uma

oscilação significativa em relação ao número de falhas para cada categoria de

tempo de falha.


87


Categoria Nº de falhas 13,...,1)(ˆ itRi Média *iR das categorias E. p. bootstrap *ˆpe

1t 2 0.9565217 0.9566387 0.0416920

2t 1 0.9347826 0.9348247 0.0451813

3t 2 0.8913043 0.8912892 0.0577920

4t 3 0.8260869 0.8272600 0.0780496

5t 3 0.7608696 0.7613980 0.0914376

6t 2 0.7173913 0.7181004 0.0918350

7t 1 0.6956522 0.6963377 0.0890221

8t 2 0.6521739 0.6528198 0.0874045

9t 2 0.6086957 0.6092139 0.0843825

10t 2 0.5652174 0.5662268 0.0792279

11t 1 0.5434783 0.5443282 0.0722450

12t 2 0.5000001 0.5008187 0.0629458

13t 1 0.4782609 0.4788754 0.0518871



Categoria IC Kaplan-Meier IC bootstrap-t IC b. percentílico

1t 0.8371413 0.9889458 0.9529082 0.9598639 0.9565217 1.0000000

2t 0.8112690 0.9784886 0.9289634 0.9401407 0.9130435 1.0000000

3t 0.7583610 0.9532566 0.8790879 0.9023559 0.8695652 1.0000000

4t 0.6821922 0.9089689 0.8004058 0.8487811 0.8043478 0.9565217

5t 0.6099356 0.8597876 0.7211301 0.7957642 0.7173914 0.9347826

6t 0.5635856 0.8250001 0.6719072 0.7577344 0.6739131 0.8913043

7t 0.5408964 0.8070968 0.6491532 0.7372701 0.6521740 0.8695652

8t 0.4964178 0.7703686 0.6021088 0.6975743 0.6086957 0.8260869

9t 0.4530708 0.7325023 0.5567035 0.6565466 0.5652174 0.7826087

10t 0.4107989 0.6935738 0.5135580 0.6135564 0.5217392 0.7173914

11t 0.3900554 0.6737267 0.4953352 0.5890425 0.5217391 0.6956521

12t 0.3493441 0.6332846 0.4565019 0.5418882 0.4782609 0.6304348

13t 0.3293763 0.6126924 0.4419499 0.5136186 0.4565218 0.5869565


FIGURA 24 – Intervalos da amostra com 13 categorias K-M e bootstrap-t

88


Categoria Amplitude Kaplan-Meier Amplitude bootstrap-t Amplitude b. percentílico

1t 0.1518 0.0070 (4,6%) 0.0435 (28,7%)

2t 0.1672 0.0112 (6,7%) 0.0870 (52,1%)

3t 0.1949 0.0233 (12,0%) 0.1304 (67,0%)

4t 0.2268 0.0484 (21,3%) 0.1522 (67,1%)

5t 0.2499 0.0746 (29,9%) 0.2174 (87,0%)

6t 0.2614 0.0858 (32,8%) 0.2174 (83,2%)

7t 0.2662 0.0881 (33,1%) 0.2174 (81,7%)

8t 0.2740 0.0955 (34,9%) 0.2174 (79,3%)

9t 0.2794 0.0998 (35,7%) 0.2174 (77,8%)

10t 0.2828 0.1000 (35,4%) 0.1957 (69,2%)

11t 0.2837 0.0937 (33,0%) 0.1739 (61,3%)

12t 0.2839 0.0854 (30,1%) 0.1522 (53,6%)

13t 0.2833 0.0717 (25,3%) 0.1304 (46,0%)

Obs.: As porcentagens são referentes ao intervalo do estimador de Kaplan-Meier FONTE: O autor (2011).


Novamente é fácil de verificar que os intervalos do método bootstrap tiveram

uma amplitude menor que o intervalo do estimador. Como nas outras aplicações, o

intervalo bootstrap-t foi o que teve a menor amplitude, seguido do intervalo

percentilico. Tanto o intervalo do estimador de Kaplan-Meier quanto o bootstrap-t se

mantiveram praticamente simétricos em relação à confiabilidade estimada.

Uma característica presente em praticamente todas as aplicações é que o

intervalo percentílico, para as primeiras categorias de tempos, apresenta valores

com os limites superiores geralmente igual a 1, ou 100%. Talvez pelo valor das

estimativas ficarem perto ou igual a um. Assim, com os valores altos o limite superior

sofre influência.

89

4.1.5 Amostra gerada com 10 categorias de tempo de falha com 34 itens, não

censurada

A quinta aplicação foi feita em uma amostra não censurada com 10

observações e 34 itens, onde todos falharam. O histograma a seguir mostra que

esta amostra possui uma distribuição um pouco diferente das demais, ela tem

valores altos para as falhas, com uma média de 3,4 falhas por tempo de falha

simulado.



Categoria Nº de falhas 10,...,2,1)(ˆ itRi Média *iR das

categorias

Erro padrão

bootstrap *ˆpe

1t 1 0.9705882 0.9708138 0.0276313

2t 1 0.9411765 0.9413462 0.0372984

3t 2 0.8823529 0.8828970 0.0613571

4t 4 0.7647059 0.7656875 0.1163638

5t 5 0.6176471 0.6185663 0.1608984

6t 5 0.4705882 0.4719999 0.1842956

7t 2 0.4117647 0.4135532 0.1752947

8t 5 0.2647059 0.2716411 0.1722857

9t 4 0.1470588 0.1643622 0.1441376

10t 5 0.0000000 0.0600097 0.0906538


90



1t 0.8090042 0.9958041 0.9689771 0.9721169 0.9411765 1.0000000

2t 0.7846940 0.9849558 0.9368589 0.9452075 0.9411765 1.0000000 3t 0.7162649 0.9541398 0.8683523 0.8949559 0.8529412 1.0000000

4t 0.5841796 0.8746970 0.7139181 0.8077071 0.7058824 0.9705882 5t 0.4342162 0.7570637 0.5166025 0.7036226 0.5588236 0.9117647

6t 0.2983037 0.6251885 0.3390114 0.5914087 0.4117647 0.8235294 7t 0.2477204 0.5688185 0.2861948 0.5329645 0.3529412 0.7352941

8t 0.1318715 0.4181158 0.1552003 0.3874235 0.1764706 0.6176471 9t 0.0537068 0.2846178 0.0786529 0.2357113 0.0588235 0.4705883

10t 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.3235294



Categoria Amplitude K-Meier Amplitude bootstrap-t Amplitude b. percentílico 1t 0.1868 0.0031 (1,7%) 0.0588 (31,5%)

2t 0.2003 0.0083 (4,1%) 0.0588 (29,4%)

3t 0.2379 0.0266 (11,2%) 0.1471 (61,8%)

4t 0.2905 0.0938 (32,3%) 0.2647 (91,1%)

5t 0.3228 0.1870 (57,9%) 0.3529 (109,3%)

6t 0.3269 0.2524 (72,2%) 0.4118 (126,0%)

7t 0.3211 0.2468 (76,9%) 0.3824 (119,1%)

8t 0.2862 0.2322 (81,1%) 0.4412 (154,2%)

9t 0.2309 0.1571 (68,0%) 0.4118 (178,3%)

10t 0.0000 0.0000 ( - ) 0.3235 ( - )



91


Assim como para a primeira amostra não censurada o intervalo percentílico

obteve a maior amplitude em comparação com os outros dois intervalos, até a

quarta observação o intervalo percentílico obteve uma amplitude menor que o

intervalo do estimador de Kaplan-Meier, mas a partir da quinta começou a aumentar

a amplitude. Os intervalos bootstrap-t e do estimador ficaram praticamente

simétricos em relação às estimativas da confiabilidade, convergindo para zero na

ultima observação, assim como aconteceu na segunda amostra apresentada, que

também não era censurada. Para esse tipo de amostra, não censurada, em todas

testadas, os intervalos booststap-t e o do Kaplan-Meier se comportaram dessa

maneira, na última observação os limites, tanto inferior quanto superior, ficaram

iguais a zero, e apenas o percentílico, no limite superior, não ficou igual a zero.


Para a sexta aplicação foi utilizado uma amostra aleatória simulada com 12

categorias de tempos de falha e um total de 56 itens, censurada contou-se 23 falhas,

censurando os 33 demais. No histograma da amostra verifica-se que as falhas

ficaram bem distribuídas pelas categorias, com uma média de 1,92 falhas por

categoria de tempo de falha simulado.

92



Categoria Nº de falhas 10,...,1,)(ˆ itRi Média *iR das categorias E. p. bootstrap *ˆpe

1t 1 0.9821429 0.9822172 0.0170836

2t 1 0.9642857 0.9642502 0.0229110

3t 2 0.9285715 0.9283521 0.0385678

4t 3 0.8750001 0.8756507 0.0586410

5t 4 0.8035715 0.8039783 0.0811436

6t 2 0.7678572 0.7682160 0.0811183

7t 1 0.7500001 0.7504490 0.0787430

8t 2 0.7142858 0.7151350 0.0768601

9t 2 0.6785715 0.6791063 0.0732294

10t 1 0.6607144 0.6612328 0.0687466

11t 1 0.6428573 0.6432199 0.0630217

12t 3 0.5892859 0.5894934 0.0594925




1t 0.8799214 0.9974653 0.9815404 0.9827258 0.9642857 1.0000000 2t 0.8646516 0.9909467 0.9626764 0.9658269 0.9642857 1.0000000 3t 0.8207787 0.9725758 0.9231836 0.9335951 0.8928571 1.0000000 4t 0.7555916 0.9383587 0.8608838 0.8877786 0.8571429 0.9821429 5t 0.6734388 0.8860640 0.7738414 0.8298309 0.7678572 0.9464286

6t 0.6340398 0.8580120 0.7336873 0.7982591 0.7321429 0.9107143 7t 0.6146968 0.8436050 0.7148438 0.7815011 0.7142858 0.8928571

8t 0.5766604 0.8141139 0.6762601 0.7486998 0.6785715 0.8571429 9t 0.5394250 0.7838017 0.6391517 0.7146808 0.6428572 0.8214285 10t 0.5210883 0.7683617 0.6223748 0.6961499 0.6250001 0.7857143

11t 0.5029310 0.7527424 0.6065775 0.6767236 0.6249999 0.7678571 12t 0.4494910 0.7048625 0.5519769 0.6246040 0.5714285 0.6964286


93


Categoria Amplitude K-Meier Amplitude bootstrap-t Amplitude b. percentílico

1t 0.1175 0.0012 (1,0%) 0.0357 (30,3%)

2t 0.1263 0.0032 (2,5%) 0.0357 (28,3%)

3t 0.1518 0.0104 (6,9%) 0.1071 (70,6%)

4t 0.1828 0.0269 (14,7%) 0.1250 (68,4%)

5t 0.2126 0.0560 (26,3%) 0.1786 (84,0%)

6t 0.2240 0.0646 (28,8%) 0.1786 (79,3%)

7t 0.2289 0.0667 (29,1%) 0.1786 (78,0%)

8t 0.2375 0.0724 (30,5%) 0.1786 (75,2%)

9t 0.2444 0.0755 (30,9%) 0.1786 (73,1%)

10t 0.2473 0.0738 (29,8%) 0.1607 (65,0%)

11t 0.2498 0.0701 (28,1%) 0.1429 (57,2%)

12t 0.2554 0.0726 (28,4%) 0.1250 (49,0%)

Obs.: As porcentagens são referentes ao intervalo do estimador de Kaplan-Meier FONTE: O autor (2011).



94

Para esta aplicação, Figura 30 e Figura 31, tanto o gráfico das estimativas

da confiabilidade quanto os intervalos de confiança ficaram bem suaves.

Novamente, como nas outras amostras apresentadas, o intervalo bootstrap-t teve

uma amplitude menor que a amplitude dos outros dois intervalos. Outra

característica presente em todas as aplicações das amostras foi que o intervalo

bootstrap-t sempre se inicia bem próximo das estimativas e vai aumentando a

amplitude. Isso se deve ao erro padrão bootstrap que começa muito pequeno e vai

crescendo nos demais pontos de observação.

Assim temos a análise de 6 amostras aleatórias, simuladas pelo programa

secundário implementado, sendo 2 amostras não censuradas e 4 censuradas. Ficou

evidente em todas as amostras que o intervalo bootstrap-t possui uma amplitude

menor que dos outros dois intervalos.

Para o intervalo bootstrap percentílico, o tipo de amostra influência os

resultados. Para amostras censuradas obteve amplitudes menores que do estimador

de Kaplan-Meier, porem para amostras não censuradas os seus intervalos ficaram

com as maiores amplitudes da análise. Sendo assim caso o interesse seja um

intervalo mais justo, para as amostras não censuradas, deve-se utilizar o intervalo

bootstrap-t ou o intervalo do estimador. E para as amostras censuradas, pode-se

utilizar o intervalo bootstrap-t ou o percentilico.

95

5. CONCLUSÃO

O objetivo principal do trabalho, a construção de intervalos de confiança para

os valores da função de confiabilidade estimada pelo método de Kaplan-Meier, pela

técnica computacionalmente intensiva bootstrap foi alcançado. Assim foram

construídos intervalos de confiança utilizando o método bootstrap, além do próprio

intervalo de confiança do estimador de Kaplan-Meier. Os intervalos aplicados foram

os intervalos bootstrap-t e o bootstrap percentílico, em comparação com o intervalo

clássico.

O método se apresentou eficiente para amostras de diversos tamanhos, uma

limitação ainda existente é que o método apenas funciona bem para amostras com

censura do tipo I e II, devendo ser feitas algumas adaptações caso se trabalhe com

outros tipos de censura.

Assim, sendo que dos resultados pode-se observar que:

o intervalo bootstrap-t apresentou intervalos de confiança mais justos

que os demais métodos, em todas as categorias de tempo de falha, sendo mais

eficiente que o intervalo bootstrap percentílico e que o intervalo clássico de Kaplan-

Meier.

o intervalo bootstrap percentílico superou o intervalo clássico de

Kaplan-Meier quando existe censura e superou nas categorias de tempo iniciais

quando não existe censura;

os resultados do programa desenvolvido mostraram-se eficientes.

Foram utilizados os cálculos dos intervalos de confiança para um nível de

95% de segurança, tanto para o intervalo do estimador dos valores da confiabilidade

quanto para os intervalos do método bootstrap. Na aplicação do método bootstrap

foram utilizadas 10000 replicações, pode-se utilizar um número maior de

reamostragens, mas durante os testes, para valores de B perto e acima das 10000

replicações, os valores dos intervalos começaram a ficar iguais, apenas aumentando

o tempo computacional demandado. O problema para determinar quantas

replicações B são necessárias para a obtenção de boas estimativas dos limites

inferiores e superiores de intervalos de confiança do método bootstrap e discutido

em Efron e Tibshirani (1986).

96

Sugestões para trabalhos futuros:

Expandir o método criado para outras áreas de estudo, tais como

medicina, economia, entre outras áreas da ciência moderna citados;

Utilizar amostras “estranhas”, ou seja, que tenham distribuição muito

diferente da distribuição normal;

Utilizar amostras reais para as análises e efetuar análises e aplicações

dos outros métodos de intervalos de confiança bootstrap.

97

REFERÊNCIAS

ANDRADE, L. F. S.; ZARDO, C. R.; FORCELLINI, F. A. O uso do FMEA como uma

métrica para a confiabilidade no projeto conceitual. In: VCBGDP, Curitiba,

Paraná, ago. 2005. 8p.

ANDREWS, D. W. K.; BUCHINSKY, M. On the number of bootstrap repetitions

for BCa confidence intervals. Econometric Theory, v. 18, n. 4, p. 962-984, Aug.

2002.

AVIZIENIS, A.; LAPRIE, J. C.; RANDELL, B.; LANDWEHER, C. Basic concepts

and taxonomy of dependable and security computing. IEEE Transactions on

Dependable and Secure Computing. v. 1, n. 1, p. 11-33, jan./mar. 2004.

BAILAR III, J. C., MOSTTELER, F. Medical Uses of Statistics. 2nd edition, NEJM

Book, Boston. 1992.

BARROS, E. A. Coelho. Aplicações de simulação Monte Carlo e Bootstrap

(Monografia, 2005). Universidade Estadual de Maringá, UEM.

BASTOS, J., ROCHA, C. Notas metodológicas: Análise de Sobrevivência. Serviço de Higiene e Epidemiologia, Faculdade de Medicina da Universidade do Porto; DEIO e CEAUL, Faculdade de Ciências da Universidade de Lisboa, Portugal, 2007. BERGAMO, V. F.. Confiabilidade Básica e Prática. 1ª edição. Editora Edgard Blücher LTDA, São Paulo, SP. 1997.

BICKEL, P., FREEDMAN, D. Some asymptotic theory for the bootstrap. Ann. Statistic. n. 9, pp 1196-1197. 1981. BOX, G.E.P.; HUNTER, W. G.; HUNTER, J. S. Statistic for experimenters; An introduction to design, data analysis, and model building. New York: John Wiley, 1978. 653p. CARVALHO, A. Lopes. Análise de Disponibilidade Utilizando Abordagem Nebulosa (Tese de Doutorado, 2008). Universidade Federal de Minas Gerais, UFMG CARVALHO, M. Sá; ANDREOZZI, V. Lima; CODEÇO, C. Torres; BARBOSA, M. T. Serrano; SHIMAKURA, F. Emiko. Análise de Sobrevida: Teoria e Aplicação em Saúde. 20ª ed. Editora Fiocruz, Rio de Janeiro, RJ. 2005. CARRASCO, C. Giugioli. Uma introdução a análise de sobrevivência e confiabilidade. IV Seminário de Iniciação Cientifica, Unidade Universitária de Ciências Exatas e Tecnologias, UEG.

98

CHAVES NETO, A., “Bootstrap” em Séries Temporais. (Tese de Doutorado, 1991). Pontifícia Universidade Católica do Rio de Janeiro. PUC-RJ. CHAVES NETO, A. Confiabilidade e Métodos Estatísticos Aplicados a Sistemas de Engenharia. Notas de aula. Departamento de Estatística, Universidade Federal do Paraná, Curitiba, 2010. COLOSSIMO, E. A.; GIOLO, S. R. Análise de Sobrevivência Aplicada. 1ª edição. Editora Edgard Blücher LTDA, São Paulo, SP. 2006. DILLENBURG, M. R. Estimativas de confiabilidade de produtos a partir das contagens mensais de vendas e falhas ao longo do período de garantia (Dissertação de Mestrado, 2005). Universidade Federal do Rio Grande do Sul, UFRGS. EFRON, B. “Bootstrap” Methods: another look at the jackknife. The Annals of Statistics 1.:1-20, 1979. EFRON, B. The Jacknife, the “Bootstrap”, and Other Resampling Plans. Number 38 in CBMS-NSF Regional Conference Series in Applied Mathematics. 1982. Philadelphia: SIAM. EFRON, B.; TIBSHIRANI, R. J. An introduction to the “bootstrap”, volume 57 of Monographs on Statistics and Applied Probability. Chapman and Hall, New York, 1993. ELSAYED, E. A. Reliability engineering. Reading, MA: Addison Wesley Longman, 1996. 737p. FERNANDES, C. Geordane. Metodologia para melhorar a confiabilidade de subsistemas através da análise de falhas e testes acelerados (Dissertação de Mestrado, 2010). Universidade Federal do Rio Grande do Sul, UFRGS. FREITAS, M. A. e COLOSSIMO, E. A. Confiabilidade: análise de tempo de falha e

testes acelerados. Fundação Cristiano Ottoni, Belo Horizonte, Minas Gerais. 1997.

FRITSH, C. Modelos de confiabilidade para testes de sobrevida. Dissertação de

Mestrado, Programa de Pós-Graduação em Engenharia de Produção, UFRGS.

Porto Alegra, 1996.

GILCHRIST, W. Modelling failure modes and effects analysis. International Journal

of Quality & Reliability Management. Bradford, v. 10, n. 5, p. 16-23, 1993.

GUIMARÃES, U. V. Modelagem para análise da confiabilidade de produtos em

garantia (Dissertação de Mestrdo, 2002). Universidade Federal do Rio Grande do

Sul, UFRGS.

99

GUZZON, S. O. Proposta de análise quantitativa de confiabilidade a partir de

dados quantitativos provenientes da FMEA (Dissertação de Mestrado, 2009).

Universidade Federal do Rio Grande do Sul, UFRGS.

HECHT, H. Systems reliability and failure prevention. Norwood: Artech House,

2003. 230p.

HOYLAND, A.; RAUSAND, M. System reliability theory: models and statistical

methods. New York: Wiley-Interscience, 1994.

LAFRAIA, J. Manual de confiabilidade, mantenabilidade e disponibilidade. Rio

de Janeiro: Qualitymark, 374 p,2001.

LEEMIS, L. M. Reability. Probabilistic models and statistical methodos.

Englewood Cliffs: Pretentice-Hall, 1995. 319 p.

MACHADO, R. L.; MELO, G. C. Utilização do FMEA na melhoria de processos de

fabricação da industria farmacêutica. XXVII ENEGEP, Foz do Iguaçu, out. 2007.

10p.

MARTINEZ-ESPINOSA, M.; SANDANIELO, V. L. M.; LOUZADA-NETO, F.; O metodo de “bootstrap” para o estudo de dados de fadiga dos materiais. Ver. Mat. Estat., Sao Paulo, v.24, n.2, p.37-50, 2006. PALADY, Paul “FMEA – Análise de Modos e Efeitos de Falha” Edt. IMAM, 3ª Edição, 2004. PASETTO, S. Castro. Previsão de falhas no período de garantia a partir da percepção do cliente: um estudo de caso junto a uma empresa de alta tecnologia (Dissertação de Mestrado, 2002). Universidade Federal do Rio Grande do Sul, UFRGS. PEREIRA, P. J.; PEREIRA, M. A. T. Comparação dos estimadores de Kaplan-Meier e de Nenson-Aalen para um estudo entomológico, com introdução de

censura tipo I. 48ª Reunião da RBRAS e 10º SEAGRO, Universidade Federal de

Lavras, Departamento e Ciências Exatas, 7 a 11 de Junho de 2003, Lavras, Minas Gerais. PIAZZA, G. Introdução a Engenharia da Confiabilidade. Edt. EDUCS, 1ªEdição, 2000. QUENOUILLE, M. H. Aproximate tests of correlation in time-series. Journal os Statistical Computation and Simulation, 8:75-80, 1949.

RIBEIRO, J. L. D. Confiabilidade de componentes e sistemas. UFRGS/PPGEP,

Porto Alegre, 2003. Paginação irregular.

100

RICHTER, P. R.; LOPES, L. F. D. A confiabilidade relacionada ao

desenvolvimento de produtos e à gestão de qualidade total, XXIV ENEGEP,

Florianópolis, SC, 2004.

RIZZO, A. L. T.; CYMROT, R. Estudo e aplicações da técnica bootstrap. II

Jornada de Iniciação Científica, Universidade Presbiteriana Mackenzie.

ROZENFELD, H.; AMARAL, D. C.; ALLIPRANDINI, D. H.; FORCELLINI, F. A.;

TOLEDO, J. C.; SCALICE, R. K.; SILVA, S. L. Gestão de desenvolvimento de

produtos: uma referência para a melhoria do processo. São Paulo: Saraiva,

2006. 542 p.

SAGRILO, L.V. S. - Análise de Confiabilidade Estrutural Utilizando os Métodos Analíticos FORM e SORM (Tese de Doutorado, 1994). Programa de Engenharia Civil, COPPE/UFRJ. SANTOS, T. G. Modelo de confiabilidade associando dados de garantia e pós-garantia a três comportamentos de falhas (Tese de Doutorado, 2008). Universidade Federal do Rio Grande do Sul, UFRGS. SELLITTO, M. Formulação estratégica da manutenção industrial com base na confiabilidade dos equipamentos. Produção, v.15, n.1, p.44-59, 2005. SELLITTO, M.; BORCHADT, M.; ARAÚJO, D. Manutenção centrada em

confiabilidade: uma abordagem quantitativa. Anais do XXII ENEGEP. Curitiba:

ABEPRO. 2002.

SILVA, A. H. C. Aplicação da metodologia FMEA (failure mode and effect

analysis) para realização de análise de falhas em um sistema de pontes de

embarque de um aeroporto. XXVII ENEGEP, Foz do Iguaçu, outubro, 2007. 10p.

SILVA, W. V. Junior. Probabilidade de cobertura dos intervalos de confiança

assintóticos, p-Bootstrap e t-Bootstrap, para alguns parâmetros da

distribuição Weibull (Monografia, 2005). Universidade Estadual de Maringá, UEM.

SIQUEIRA, A. H. C. Manutenção centrada na confiabilidade: manual de

implementação. Rio de Janeiro: Qualitymark, 2005, 374 p.

STAMATIS, D. H. Failure mode and effects analysis: an integrate approach for

product design and process control. International Journal of Quality & Reliability

Management. Bradford, v. 13, n. 5, p. 8-26, 1996.

STIGLER, S. M. Citation Patterns in the Jounals of Statistics and Probability.

Statistical Science, 94-108, 1994.

101

TENG, S. H.; HO, S. Y. Failure mode and effects analysis: an integrate approach for

product design and process control. International Journal of Quality & Reliability

Management. Bradford, v. 13, n. 5, p. 8-26, 1996.

WUTTKE, R. André. Cálculo da disponibilidade e da posição na curva da banheira de uma válvula de processo petroquímico. ABEPRO, Universidade Federal de Santa Catarina, UFSC, 2008.

102

APÊNDICES

APÊNDICE A – PROGRAMA GERADOR DE AMOSTRAS ALEATÓRIAS DE

FALHAS IMPLEMENTADO EM LINGUAGEM FORTRAN

program gerador

implicit none

integer :: i,j,m,n

real :: x,o

character :: a

real, dimension(:), allocatable :: vec_erros, vec_erros2

n=0

externo: do

write(*,*) "VETOR COM OU SEM CENSURA, 'S' PARA SIM E 'N' PARA NAO: "

read(*,*) a

if(a=="n" .or. a=="N")then

write(*,*) "NUMERO DE POSICOES DO VETOR DE AMOSTRAS: "

read(*,*) m

allocate(vec_erros(m))

do i=1,m

call random_number(x)

x=ceiling(x*m)

x=int(x)

vec_erros(i)=x

vec_erros(i)=ceiling(vec_erros(i)/2)

n=n+vec_erros(i)

end do

write(*,*) "VETOR DE FALHAS EM CASA TEMPO: "

do i=1,m

write(*,*) vec_erros(i)

end do

write(*,*) "NUMERO TOTAL DE ITENS: "

write(*,*) n

exit externo

else if(a=="s" .or. a=="S")then

write(*,*) "NUMERO DE POSICOES DO VETOR DE AMOSTRAS: "

read(*,*) m

write(*,*) "NUMERO TOTAL DE ITENS DA AMOSTRA: "

read(*,*) j

allocate(vec_erros(m),vec_erros2(m))

do i=1,m


x=ceiling(x*m)

x=int(x)

if(x<j)then

vec_erros(i)=x

n=n+vec_erros(i)


if(n>j/2)then

103


end if

end if

end do

n=0

do i=1,m

n=n+vec_erros(i)

end do

write(*,*) "VETOR DE FALHAS EM CASA TEMPO: "

do i=1,m

write(*,*) vec_erros(i)

end do

write(*,*) "NUMERO DE ELEMENTOS TOTAL: "

write(*,*) n

exit externo

else

write(*,*) "!!!!!!!!!!!!!!!!!!!!!!!!!!!"

write(*,*) "!!! MENSAGEM INVALIDA !!!"

write(*,*) "!!!!!!!!!!!!!!!!!!!!!!!!!!!"

end if

end do externo

pause

end program gerador

104

APÊNDICE B – PROGRAMA QUE CALCULA OS INTERVALOS DE CONFIANÇA

DO ESTIMADOR DE KAPLAN-MEIER, BOOTSTRAP-T E BOOTSTRAP

PERCENTÍLICO IMPLEMENTADO EM LINGUAGEM FORTRAN

program boot_KB2

implicit none

integer :: i, j, n, m,k, num, num1,num2,num3,num4,num5,kk

real:: a,b,c,x,d,ep,f1,g,aa,bb,cc1,cc2,u3,ale,sum,rtb1,alpha1,alpha2

real, dimension(:),allocatable ::

vec_tempo,vec_falha,nsuj,somaposi,confb,vec_suj


erroboot,mediart,confb1,erro_boots,cont,conf_kb


inter_boot1,inter_boot2,percent1,percent2,var_u


inter_boot11,inter_boot22,v,inter_kmi,inter_kmf

real, dimension(:),allocatable :: dvar,lg,vu,a1,inter_bi,inter_bf

real, dimension(:,:),allocatable ::

boots,acum,rtb,nsujb,acum1,somaposi1,soma_rtb

real, dimension(:,:),allocatable :: rtb_transp

write(*,*) " NUMERO INICIAL DE COMPONENTES EM TESTE: "

read(*,*) num

num1=num

num2=num

num3=num

num4=num

num5=num

write(*,*) " ENTRE COM O TAMANHO DA AMOSTRA ORIGINAL: "

read(*,*) n

write(*,*)

allocate(vec_tempo(n),vec_falha(n),nsuj(n),somaposi(n),confb(n),vec_suj(n))

allocate(erroboot(n),mediart(n),confb1(n),erro_boots(n),cont(n),conf_kb(n))

allocate(inter_boot1(n),inter_boot2(n),percent1(n),percent2(n),var_u(n))

allocate(inter_boot11(n),inter_boot22(n),lg(n),vu(n),v(n),a1(n),dvar(n))

allocate(inter_kmi(n),inter_kmf(n),inter_bi(n),inter_bf(n))

write(*,*) " ENTRE COM O NUMERO DE REAMOSTRAGENS: "

read(*,*) m

write(*,*)

allocate(boots(m,n),acum(m,n),rtb(m,n),nsujb(m,n),acum1(m,n),somaposi1(m,n)

,soma_rtb(m,n))

allocate(rtb_transp(n,m))

write(*,*) " ENTRE COM O VETOR DAS CATEGORIAS DE TEMPO DE FALHA: "

do i=1,n

read(*,*) vec_tempo(i)

end do

write(*,*)

write(*,*) " ENTRE COM O VETOR DE FALHAS PARA CADA CATEGORIA: "

do i=1,n

read(*,*) vec_falha(i)

end do

write(*,*)

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

!!! ESTIMADOR DE KAPLAN-MEIER!!!

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

105

do i=1,n

nsuj(i)=num

num=num-vec_falha(i)

end do

write(*,*) " CATEGORIAS || FALHAS"

do i=1,n

write(*,*) vec_tempo(i) , vec_falha(i)

end do

write(*,*)

do i=1,n

num4=num4-vec_falha(i)

vec_suj(i)=num4

end do

write(*,*) " CONFIABILIDADE PARA CADA CATEGORIA DA AMOSTRA ORIGINAL: "

conf_kb(1)=((num5-vec_falha(1))/num5) ! calculo da

confiabilidade com estimador

do i=2,n

conf_kb(i)=conf_kb(i-1)*((vec_suj(i-1)-vec_falha(i))/vec_suj(i-1))

end do

do i=1,n

write(*,*) vec_tempo(i) , conf_kb(i)

end do

v(1)=(vec_falha(1)/(num5*(num5-vec_falha(1))))

var_u(1)=(conf_kb(1)**2)*v(1)

do i=2,n

v(i)=v(i-1)+(vec_falha(i)/(vec_suj(i-1)*(vec_suj(i-1)-vec_falha(i))))

var_u(i)=(conf_kb(i)**2)*v(i)

end do

dvar=sqrt(var_u)

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

!!! METODO BOOTSTRAP !!!

!!! OBTENÇAO DAS AMOSTRAS BOOTSTRAP!!!

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

do i=1,m ! AMOSTRA BOOTSTRAP

do j=1,n


x=ceiling(x*n)

x=int(x)

boots(i,j)=vec_tempo(x)

acum(i,j)=vec_falha(x)

end do

end do

acum1=0.0

do k=1,500 ! ORDENA A MATRIZ

do i=1,m

do j=1,n-1

if(boots(i,j)>boots(i,j+1))then

a=boots(i,j)

boots(i,j)=boots(i,j+1)

boots(i,j+1)=a

b=acum(i,j)

acum(i,j)=acum(i,j+1)

acum(i,j+1)=b

end if

end do

end do

end do

somaposi1=0.0

do i=1,m

106

do j=1,n

do k=1,n

if (boots(i,k)==vec_tempo(j)) then

somaposi1(i,j)=somaposi1(i,j)+1

end if

end do

end do

end do

do i=1,m

do j=1,n

acum1(i,j)=somaposi1(i,j)*vec_falha(j)

end do

end do

do i=1,m

do j=1,n

num1=num1-acum1(i,j)

nsujb(i,j)=num1

if(nsujb(i,j)<0.0) then

nsujb(i,j)=0

end if

end do

num1=num2

end do

cont=0.0

do i=1,m

do j=1,n

if(somaposi1(i,j)/=0.0)then

cont(j)=cont(j)+1

end if

end do

end do

do i=1,m

rtb(i,1)=nsujb(i,1)/num3

end do

do i=1,m

do j=2,n

if(nsujb(i,j)/=0.0)then

rtb(i,j)=rtb(i,j-1)*(nsujb(i,j)/nsujb(i,j-1))

else

rtb(i,j)=0.0

end if

end do

end do

soma_rtb=0.0

confb=0.0

ale=0.0

do i=1,n

do j=1,m

soma_rtb(j,i)=soma_rtb(j,i)+somaposi1(j,i)*rtb(j,i)

confb(i)=confb(i)+rtb(j,i)

end do

end do

mediart=confb/m

write(*,*)

write(*,*) " MEDIA DE CADA CATEGORIA: "

do i=1,n

write(*,*) vec_tempo(i) , mediart(i)

end do

write(*,*)

107

ale=0.0

confb1=0.0

do i=1,n

do j=1,m

confb1(i)=confb1(i)+((rtb(j,i)-mediart(i))**2)

end do

end do

erro_boots=sqrt((1/(m-1.0))*(confb1)) ! ERRO BOOTSTRAP PARA CADA PONTO

write(*,*) " ERRO BOOTSTRAP PARA CADA CATEGORIA DE TEMPOS DE FALHA: "

do i=1,n

write(*,*) vec_tempo(i) , erro_boots(i)

end do

inter_boot1=conf_kb-(1.96*erro_boots) ! CALCULO DO INTERVALO BOOTSTRA-

T

inter_boot2=conf_kb+(1.96*erro_boots)

inter_boot11=conf_kb-(1.96*dvar) ! CALCULO DO

INTERVALO K-M

inter_boot22=conf_kb+(1.96*dvar)

vu=0.0

vu=(var_u/(conf_kb**2))/(log(conf_kb)**2)

a1=sqrt(vu)

fora1:do i=1,n

if((inter_boot11(i) < 0.0).or.(inter_boot11(i)>

1.0).or.(inter_boot22(i)<0.0).or.(inter_boot22(i)>1.0))then

do j=1,n

inter_kmi(j)= conf_kb(j)**(exp(+1.96*a1(j)))

inter_kmf(j)= conf_kb(j)**(exp(-1.96*a1(j)))

end do

exit fora1

end if

end do fora1

fora2:do i=1,n

if((inter_boot1(i) < 0.0).or.(inter_boot1(i)>

1.0).or.(inter_boot2(i)<0.0).or.(inter_boot2(i)>1.0))then

do j=1,n

inter_bi(j)=conf_kb(j)**(exp(+1.96*erro_boots(j)))

inter_bf(j)=conf_kb(j)**(exp(-1.96*erro_boots(j)))

end do

exit fora2

end if

end do fora2

rtb_transp=TRANSPOSE (rtb) ! TRANPOE A MATRIZ

DAS CONFIABILIDADES

open(1,file='saida.txt')

do k=1,1000 ! ORDENA A MATRIZ

TRANSPOSTA

do i=1,n

do j=1,m-1

if(rtb_transp(i,j)>rtb_transp(i,j+1))then

a=rtb_transp(i,j)

rtb_transp(i,j)=rtb_transp(i,j+1)

rtb_transp(i,j+1)=a

end if

end do

end do

end do

do i=1,m

write(1,*) rtb_transp(:,i)

end do

108

close(1)

alpha1=nint(0.025*m)

alpha2=nint(0.975*m)

do i=1,n

percent1(i)=rtb_transp(i,alpha1)

percent2(i)=rtb_transp(i,alpha2)

end do

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

!!!INTERVALOS DE CONFIANCA!!!

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

write(*,*)

write(*,*) " INTERVALO DE CONFIANCA DO ESTIMADOR DE KAPLAN-MEIER: "

do i=1,n

write(*,*) inter_boot11(i) , conf_kb(i) , inter_boot22(i)

end do

write(*,*)

write(*,*) " INTERVALO DE CONFIANCA DO ESTIMADOR DE KAPLAN-MEIER AJUSTADO:

"

do i=1,n

write(*,*) inter_kmi(i) , conf_kb(i) , inter_kmf(i)

end do

write(*,*)

write(*,*) " INTERVALO BOOTSTRAP-t DO ESTIMADOR DE KAPLAN-MEIER: "

do i=1,n

write(*,*) inter_boot1(i) , conf_kb(i) , inter_boot2(i)

end do

write(*,*)

write(*,*) " INTERVALO BOOTSTRAP-t DO ESTIMADOR DE KAPLAN-MEIER AJUSTADO"

do i=1,n

write(*,*) inter_bi(i) , conf_kb(i) , inter_bf(i)

end do

write(*,*)

write(*,*) " INTERVALO BOOTSTRAP PERCENTILICO DO ESTIMADOR DE KAPLAN-MEIER:

"

do i=1,n

write(*,*) percent1(i) , conf_kb(i) , percent2(i)

end do

pause

end program boot_KB2=

UNIVERSIDADE FEDERAL DO PARANÁ ANDRÉ LUIZ EMIDIO DE …

Documents

Transcript of UNIVERSIDADE FEDERAL DO PARANÁ ANDRÉ LUIZ EMIDIO DE …