1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de...

25
1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade (CEQ): variáveis mensuráveis

Transcript of 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de...

Page 1: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

1

Controle Estatístico de Qualidade Robert Wayne Samohyl

Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade (CEQ): variáveis mensuráveis

Page 2: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

2

3.1 Introdução• O conceito de distribuição de freqüências e

probabilidades de variáveis (ou mensuráveis ou atributos), e principalmente o formato da distribuição, é central para a utilização de estatística.

• A tendência central dos dados, a sua dispersão e assimetria são características que definem as distribuições, e facilitam a análise e a inspiração das propostas para melhorias.

• O propósito do capítulo 3 é formalizar e generalizar as definições dessas características distribucionais para as variáveis mensuráveis e utilizá-las nas ferramentas de controle estatístico de qualidade.

Page 3: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

3

3.2 Distribuição normal

• Como já foi discutido no capítulo 2 sobre as medidas descritivas e os gráficos básicos, os dados que vem da distribuição normal produz um agrupamento de valores observados próximos à média, e frequências menores quando nos afastamos da média.

• Esse formato é facilmente visto no histograma.

Page 4: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

4

3.2.1 Distribuições não-normais transformáveis em normal

• Em alguns casos, ainda raros, dado o tipo de variável sob investigação, o pesquisador não deve esperar a distribuição normal.

• O variável tempo (duração de tempo entre eventos), por exemplo, quase nunca é distribuída normalmente. Veja o histograma na próxima transparência.

Page 5: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

5

Figura 3.1 – A distribuição de tempos de parada de máquina esperando manutenção.

0

100

200

300

400

500

1 39 76 114

152

190

227

265

303

Minutos de parada da máquina

Freq

üênc

ia

Page 6: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

6

Transformação logarítmica

• Para resolver o problema de não normalidade, o pesquisador pode experimentar uma transformação do dado original para um dado distribuído normalmente.

• Para dados de tempo, a experiência diz que uma transformação logarítmica é a melhor sugestão inicial,

• W = ln(X).

• Assim, transformando todos os dados da variável X pelo logaritmo natural e montando o histograma dos dados transformados (ln(X)), veja na figura 3.2, fica convincente que o resultado é a distribuição normal.

Page 7: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

7

Figura 3.2 – A distribuição de tempos de parada de máquina após a aplicação da

transformação exponencial ln(X)

Minutos transformados

Freq

üênc

ia

Page 8: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

8

3.2.2 Características matemáticas da distribuição normal: a relação entre o desvio padrão da variável e a

probabilidade

Desde que uma boa parte do mundo real tende a se representar como a distribuição normal, as figuras a seguir ajudam a compreender melhor a realidade e também a conveniência prática da distribuição normal. Assim, qualquer processo de medição mesmo em estado laboratorial, e mesmo com as melhores medidores, se representa com variabilidade e erro~ruido.

2

2

( - )-

21( )

2

i x

x

x

i i

x

Y f x ems

s p= =

Page 9: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

9

Figura 3.3a - A distribuição normal em termos de um único desvio padrão.

Distribuição normal em desvio padrão

-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6

68,27%

15,865 %

Page 10: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

10

Figura 3.3b - A distribuição normal em termos de dois desvios padrão.

Distribuição normal em desvio padrão

-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6

95,45%

2,275%

Page 11: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

11

Figura 3.3c - A distribuição normal em termos de três desvios padrão.

Distribuição normal em desvio padrão

-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6

99,73%

0,135%

Page 12: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

12

Figura 3.3d - A distribuição normal em termos de seis desvios padrão.

-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7

Distribuição normal em desvios padrão

0,000000001

0,999999998

Page 13: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

13

Tabela 3.1 – Valores de Zi e a área acumulada, a probabilidade de Zi ser menor.

Area Area Area Area Area Areaacumulada acumulada acumulada acumulada acumulada acumulada

Zi a esquerda Zi a esquerda Zi a esquerda Zi a esquerda Zi a esquerda Zi a esquerda-6 0,000000001 -3,9 0,000048096 -1,9 0,02871656 0 0,5 2 0,97725 4 0,999968329

-5,9 0,000000002 -3,8 0,000072348 -1,8 0,035930319 0,1 0,539827837 2,1 0,982136 4,1 0,999979342-5,8 0,000000003 -3,7 0,000107800 -1,7 0,044565463 0,2 0,579259709 2,2 0,986097 4,2 0,999986654-5,7 0,000000006 -3,6 0,000159109 -1,6 0,054799292 0,3 0,617911422 2,3 0,989276 4,3 0,99999146-5,6 0,000000011 -3,5 0,000232629 -1,5 0,066807201 0,4 0,655421742 2,4 0,991802 4,4 0,999994587-5,5 0,000000019 -3,4 0,000336929 -1,4 0,080756659 0,5 0,691462461 2,5 0,99379 4,5 0,999996602-5,4 0,000000033 -3,3 0,000483424 -1,3 0,096800485 0,6 0,725746882 2,6 0,995339 4,6 0,999997888-5,3 0,000000058 -3,2 0,000687138 -1,2 0,11506967 0,7 0,758036348 2,7 0,996533 4,7 0,999998699-5,2 0,000000100 -3,1 0,000967603 -1,1 0,135666061 0,8 0,788144601 2,8 0,997445 4,8 0,999999207-5,1 0,000000170 -3,0 0,001349898 -1 0,158655254 0,9 0,815939875 2,9 0,998134 4,9 0,999999521

-5 0,000000287 -2,9 0,001865813 -0,9 0,184060125 1 0,841344746 3 0,99865 5 0,999999713-4,9 0,000000479 -2,8 0,002555130 -0,8 0,211855399 1,1 0,864333939 3,1 0,999032 5,1 0,999999830-4,8 0,000000793 -2,7 0,003466974 -0,7 0,241963652 1,2 0,88493033 3,2 0,999313 5,2 0,999999900-4,7 0,000001301 -2,6 0,004661188 -0,6 0,274253118 1,3 0,903199515 3,3 0,999517 5,3 0,999999942-4,6 0,000002112 -2,5 0,006209665 -0,5 0,308537539 1,4 0,919243341 3,4 0,999663 5,4 0,999999967-4,5 0,000003398 -2,4 0,008197536 -0,4 0,344578258 1,5 0,933192799 3,5 0,999767 5,5 0,999999981-4,4 0,000005413 -2,3 0,010724110 -0,3 0,382088578 1,6 0,945200708 3,6 0,999841 5,6 0,999999989-4,3 0,000008540 -2,2 0,013903448 -0,2 0,420740291 1,7 0,955434537 3,7 0,999892 5,7 0,999999994-4,2 0,000013346 -2,1 0,017864421 -0,1 0,460172163 1,8 0,964069681 3,8 0,999928 5,8 0,999999997-4,1 0,000020658 -2,0 0,022750132 1,9 0,97128344 3,9 0,999952 5,9 0,999999998

-4 0,000031671 6 0,999999999

Page 14: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

14

3.2.3 Distribuição normal padronizada (Z)

• Quando a distribuição normal é padronizada com a média igual a zero e desvio padrão unitário, como nas figuras 3.3, as percentagens de área embaixo da curva podem ser avaliadas e tabeladas para qualquer número ou fração de desvios padrão como foi feito na tabela 3.1.

• Nesse sentido, qualquer número Xi em medidas originais como centímetros, litros, reais ou dólares pode ser transformado em variável padronizada

Zi

Page 15: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

15

Zi exemplo

99,94

143=

=

padrãodesvio

XXZ ii

Voltando para tabela 2.2, a média das demoras para resolver os problemas dos clientes é 182,89 minutos e, para ilustrar a transformação para Zi, vamos escolher o oitavo número da lista, 325,89 minutos. O desvio a partir da média é

325,89 – 182,89 = 143 minutos

Então, para converter a medida original minutos em número de desvios padrão de distância da média, é só dividir pelo valor do desvio padrão (94,99). Assim, podemos escrever

= 1,5

Page 16: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

16

Análise• Como foi exemplificado nas figuras 3.3, a área embaixo da curva a

direita de Zi (1,50) é a probabilidade P(Zi) de encontrar valores maiores que Xi (325). A probabilidade foi encontrada na tabela 3.1 e é quase 7% (1 – 0,933).

• Muito provavelmente o gerente tentando investigar esse valor individual para alguma causa especial não vai encontrar nada. Se forem consideradas as duas caudas, a probabilidade é 14% de encontrar valores pelo menos 1,50 desvios padrão da média em circunstâncias perfeitamente normais com a média do processo estável e a variabilidade embora grande, mas também estável. É resultado de causas comuns.

• O problema nesse processo é com a dispersão dos dados em geral. Talvez seja necessário treinar o pessoal e organizar melhor todo o processo de atendimento ao cliente.

Page 17: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

17

• Uma grande universidade no sul do Brasil tem 18.000 alunos, uma população grande. Imediatamente depois de cada semestre, o reitor gostaria apresentar um prêmio aos melhores alunos com médias finais mais altas, mas o problema é como reconhecer rapidamente esses alunos sem pesquisar todos os 18.000. É reconhecido que a administração da universidade é lenta e leva mais ou menos um mês para processar as médias finais da população de todas as disciplinas e alunos.

3.2.4 Exemplo na universidade: prêmio para os melhores alunos

Page 18: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

18

continuação

P(Z) = 1% → Zi = 2,33

Já sabemos que o valor estimado da amostra para a média das avaliações é 7,0 e que o valor estimado do desvio padrão é 1,0. Colocando tudo junto, temos então:

2,33 = padrão desvio

média)- (X i

1,0

7,0)- (Xi

Page 19: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

19

3.2.4 Exemplo na universidade: prêmio para os melhores alunos

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

4 5 6 7 8 9 10

Xi conceitos finais

0 1 2 2,33Zi desvios padrão da média

.

- 1

9,33

Área na cauda a direita de 9,33 é 1,0%, os alunos premiáveis.

9,33 = 7,0 + 2,33*1,09,33 = média + 2,33*desvio padrão

Page 20: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

20

Figura 3.5 – Distribuição normal e distribuição t, comparação de caudas. Tamanho amostral

pequeno, desvio padrão desconhecido.

0 0,5 1 1,5 2 2,5 3 3,5 4 4,5

Distância em desvios padrão

distribuição t

distribuição normal

Page 21: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

21

3.4 Algumas considerações sobre as distribuições F e χ2 (Chi quadrado). Como as

distribuições são construídas na base da normal.

k2 2

ii 1

Z=

=22

22 1 2

1

1

glF(gl ,gl )

gl

=

Page 22: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

22

3.5 Exercício6. Um engenheiro rejeita todo produto que está fora

dos limites de especificação. Nesse momento, a linha está produzindo uma taxa de 10% de rejeito simetricamente acima e abaixo dos limites de especificação, 5% de cada lado. No entanto, ele é descontente com a alta taxa de rejeição e quer uma taxa ao máximo de 2%, 1% de cada lado. Ele vê duas alternativas: ou diminuir o desvio padrão do processo ou aumentar os limites de especificação. Qual é a alternativa mais econômica no curto prazo?

Outra questão importante é se o engenheiro optar para diminuir o desvio padrão do processo, qual é a relação entre o desvio padrão novo que é menor e o desvio padrão velho que é obviamente maior, dadas as taxas de rejeição? Elaborar sua resposta usando a distribuição normal padronizada.

Page 23: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

23

Resposta: Em primeiro lugar, a alteração dos limites de especificação é sempre mais fácil que a alteração do desvio padrão do processo, embora a base conceitual do limite de especificação tenha mais a ver com a engenharia da peça e não considerações comerciais.

Page 24: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

24

continuação• Utilizando a distribuição normal padronizada, queremos

comparar a diferença entre o desvio padrão do processo antes das melhorias e depois das melhorias, em outras palavras, quanto foi diminuído o tamanho do desvio padrão. Vamos comparar as caudas da distribuição normal padronizada antes e depois das melhorias. Antes, a cauda é igual a 5% e depois é igual a 1%. Os limites de especificação ficam constantes. Antes das melhorias, a distância é 1,64 desvios padrão velhos e depois das melhorias é 2,33 desvios padrão novos. Em outra forma, dado que os limites são constantes, 1,64 desvios padrão velhos = 2,33 desvios padrão novos. A relação entre desvios padrão novos e velhos é 1,64/2,33 = 0,7. Portanto, o desvio padrão vai ter que diminuir em aproximadamente 30% para diminuir a taxa de rejeição de 10% para 2%.

Page 25: 1 Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 3 As distribuições de probabilidade mais importantes em controle estatístico de qualidade.

25

3.6 Referências

Box, George E. P.; Cox, D. R. (1964). "An analysis of transformations". Journal of the Royal Statistical Society, Series B 26: 211–246.

http://www.jstor.org/stable/2984418.