Introduçãorosf/public_html/Notas%20de%20Aula%20de... · Web viewEstatística I (Notas de aulas)...

115
Professor Inácio Andruski Guimarães , MSc. Estatística I (Notas de aulas)

Transcript of Introduçãorosf/public_html/Notas%20de%20Aula%20de... · Web viewEstatística I (Notas de aulas)...

Professor Inácio Andruski Guimarães , MSc.

Estatística I(Notas de aulas)

I.C.S.P. – Instituto de Ciências Sociais do ParanáF.E.S.P. – Fundação de Estudos Sociais do Paraná

Introdução

Para o matemático e filósofo francês René Descartes, na pesquisa e elucidação de verdades são necessários, e suficientes, quatro princípios1:

1 – Princípio da EvidênciaJamais aceitar como exata coisa alguma que não se conheça à evidência como tal, incluindo em

juízos apenas aquilo que se mostre tão claro que não subsista razão alguma de dúvida.2 – Princípio da Análise

Dividir cada dificuldade a ser examinada em tantas partes quanto possível e necessárias à sua resolução.3 – Princípio da Síntese

Pôr em ordem os pensamentos, começando pelos mais simples e de mais fácil resolução, até atingir, gradativamente, o conhecimento de assuntos mais complexos, sem deixar de supor uma ordem.4 – Princípio da Enumeração

Fazer, para cada caso, enumerações tão exatas e revisões tão gerais que se possa ter certeza de não omitir nada.

Os quatro princípios acima acabaram por se tornar a base de qualquer método de investigação científica aplicado a qualquer ciência experimental que necessite de um mecanismo de análise referente a um processo de generalização a partir de um conjunto de observações individuais.

A palavra Estatística tem origem latina ( “status” ). Também denominada “métodos estatísticos”, foi usada inicialmente para tratar de dados relativos a negócios de Estado, daí o seu nome. De acordo com o matemático e estatístico inglês Ronald A. Fisher, a Estatística é uma ramo da Matemática Aplicada dedicado à análise de dados de observação, constituindo-se, portanto, em um conjunto de métodos destinados à coleta, organização, apresentação, descrição e análise de dados de natureza quantitativa. Atualmente é de fundamental importância em praticamente qualquer ciência, notadamente as ciências aplicadas, tais como psicologia, biologia e sociologia, por exemplo.

A Estatística é dividida em duas partes: descritiva e inferencial. A primeira é aplicada nas etapas que vão da coleta até a descrição dos dados. A segunda parte é aplicada sobretudo na tomada de decisões sob condições de incerteza. Como toda tomada de decisão está relacionada a uma relativa margem de incerteza, já que normalmente é feita com base em apenas uma parte das possíveis observações, a estatística inferencial utiliza em larga escala conceitos da Teoria das Probabilidades, tais como nível de confiança, margem de erro e outros.

Na administração de empresas a Estatística tem se tornado cada dia mais útil como ferramenta. Um dos efeitos da globalização é a necessidade de maior agilidade por parte dos tomadores de decisão, exigindo, além da rapidez, confiabilidade dos resultados apresentados. Além disso, o uso da Estatística acaba por dotar o trabalho efetuado de uma sólida base científica, aumentando a sua consistência.

1 Descartes, René – Discurso Sobre o Método – Livraria Exposição do Livro – São Paulo.

0 – Conceitos e Definições

0.01 – Conceitos e Definições ..............................................................................................0.01.01 – Estatística .............................................................................................................0.01.02 – Séries Estatísticas .................................................................................................0.01.03 – Apresentação Tabular ..........................................................................................0.01.04 – Apresentação Gráfica ...........................................................................................0.01.05 – Exercícios .............................................................................................................0.02 – Notação por Índices ...................................................................................................0.02.01 – Somatório .............................................................................................................0.02.02 – Produtório .............................................................................................................0.03 – Distribuições de Freqüências ....................................................................................0.03.01 – Dados Brutos ........................................................................................................0.03.02 – Rol ........................................................................................................................0.03.03 – Amplitude Total ...................................................................................................0.03.04 – Número de Classes ...............................................................................................0.03.05 – Limites de Classe .................................................................................................0.03.06 – Amplitude de Classe ............................................................................................0.03.07 – Intervalo de Classe ...............................................................................................0.03.08 – Freqüência ............................................................................................................0.03.09 – Freqüência Acumulada .........................................................................................0.03.10 – Freqüência Relativa ..............................................................................................0.03.11 – Ponto Médio .........................................................................................................0.03.12 – Histograma ...........................................................................................................0.03.13 – Polígono de Freqüências .....................................................................................0.03.14 – Curva de Freqüências ..........................................................................................0.03.15 – Regras para Construção de uma Distribuição de Freqüências .............................0.03.16 – Exercícios .............................................................................................................

1 – Medidas de Tendência Central, ou de Posição

1.01 – Média Aritmética .......................................................................................................1.02 – Mediana ......................................................................................................................1.03 – Moda ..........................................................................................................................1.04 – Relação Entre Média, Mediana e Moda .....................................................................1.05 – Separatrizes ................................................................................................................1.05.1 – Percentil .................................................................................................................1.06 – Exercícios ..................................................................................................................

2– Medidas de Dispersão, ou Variabilidade

2.01 – Variância ...................................................................................................................2.02 – Desvio Padrão ...........................................................................................................2.03 – Coeficiente de Variação ............................................................................................2.04 – Escore Reduzido ........................................................................................................2.05 – Exercícios ..................................................................................................................

3 – Medidas de Assimetria e de Curtose

3.01 – Definições e Conceitos ..............................................................................................3.02 – Coeficientes de Pearson para Assimetria ..................................................................3.03 – Coeficiente Percentílico de Curtose ..........................................................................3.04 – Exercícios de Revisão ...............................................................................................

4 – Teoria da Probabilidade

4.01 – Conceitos ...................................................................................................................4.02 – Experimento Aleatório e Evento .............................................................................. 4.03 – Teorema de Bayes......................................................................................................4.04 – Variável Aleatória .....................................................................................................4.05 – Distribuição de Probabilidade ...................................................................................4.06 – Exercícios ..................................................................................................................

5 – Distribuições de Probabilidade Discreta

5.01 – Distribuição Binomial ...............................................................................................5.05 – Distribuição de Poisson .............................................................................................5.06 – Exercícios ..................................................................................................................

6 – Distribuições de Probabilidade Contínua

6.01 – Distribuição Normal ..................................................................................................6.01.02 – Aproximação da Distribuição Binomial pela Distribuição Normal....................6.02 – Distribuição Exponencial ........................................................................................6.03 – Exercícios ..................................................................................................................

7 – Estimação de Parâmetros

7.01 – Conceitos ................................................................................................................7.02 – Distribuição Amostral ............................................................................................7.03 – Estimação por Ponto ..............................................................................................7.04 – Estimação por Intervalos de Confiança ...................................................................7.05 – Intervalos de Confiança para a Média .....................................................................7.06 – Intervalos de Confiança para a Proporção ...............................................................7.07 – Distribuição t, de Student ........................................................................................

8 – Controle Estatístico de Processo (CEP)

8.01 – Conceitos8.02 – Gráficos de Controle por Variável8.03 – Gráficos de Controle por Atributo8.04 – Índices

0.01 - Conceitos e Definições

0.01.01 – Estatística

O termo Estatística, ou Estatística Aplicada, refere-se ao conjunto de técnicas destinadas à coleta, organização, apresentação e análise de dados de natureza quantitativa. Sua aplicação mais freqüente é no auxílio à tomada de decisões sob condições de incerteza.

No estudo da Estatística, é comum dividi-la em

Estatística Descritiva

Inclui as técnicas utilizadas na coleta, organização e descrição de dados quantitativos, ou numéricos.

Estatística Indutiva

Inclui as técnicas utilizadas na tomada de decisões sobre uma população, utilizando algumas vezes dados amostrais. Esta tomada de decisões está sujeita a condições de incerteza, o que acaba por exigir o emprego de conceitos da Teoria das Probabilidades.

Tanto para o estudo como para a aplicação da Estatística, são úteis alguns conceitos.

0.01.01.01 – Atributo

Característica quantitativa, ou qualitativa, empregada na classificação de uma elemento. São exemplos de atributos: Cor, idade, escolaridade, estado civil, tamanho, etc.

0.01.01.02 – População

Conjunto de elementos com pelo menos um atributo em comum. Também pode ser denominada Universo.Exemplo 0.1: Pessoas casadas do sexo feminino.

0.01.01.02.01 – População Finita

Quando possui um número limitado de elementos.

Exemplo 0.2: Veículo movidos a álcool vendidos em determinado ano.

0.01.01.02.02 – População Infinita

Quando possui um número ilimitado de elementos, ou observações.

Exemplo 0.3: Seja, por exemplo, o diâmetro de um eixo fabricado por certa empresa. Em princípio, não limite para o número de medições efetuadas com o objetivo de determinar o valor para este diâmetro. Desta forma, a população formada pelo número de medições pode ser considerada infinita.

0.01.01.03 – Amostra

É qualquer subconjunto de uma população.

0.01.01.03.01 – Amostra Com ou Sem Reposição

Na coleta de uma amostra deve-se determinar de antemão se os elementos observados serão, ou não, recolocados na população. Uma amostragem sem reposição exige que cada elemento seja observado

uma única vez. Se esta condição não for estabelecida, tem-se uma amostra com reposição. É importante ressaltar que a determinação referida acima caracteriza uma amostra como finita ou infinita.

0.01.02 – Séries Estatísticas

São conjuntos de dados envolvendo três fatores: Fenômeno, Local e Tempo, dos quais um é variável e ou outros dois são fixos. São classificadas como:

0.01.02.01 – Séries Temporais

Têm como elemento variável o tempo. O local e o fenômeno são os elementos fixos. As séries temporais também são chamadas Cronológicas, Históricas ou Marchas.

Exemplo 0.4:

Tabela 0.03 – Faturamento da Empresa ABC no primeiro semestre do ano XXXX.Mês Faturamento (R$ . 1000,00)

Janeiro 25,3Fevereiro 28,7

Março 32,5Abril 35,9Maio 31,4Junho 15,2Total 169,0

Dados fictícios

0.01.02.02 – Séries Geográficas

O elemento variável é o local, ou região, e os elementos fixos são o tempo e o fenômeno.

Exemplo 0.5:

Tabela 0.04 – Faturamento da Empresa ABC no primeiro semestre do ano XXXX, por região.

Região Faturamento (R$ . 1000,00)Sul 48,1

Sudeste 42,4Centro Oeste 29,9

Nordeste 27,5Norte 21,1Total 169,0

Dados fictícios

0.01.02.03 – Séries Específicas

O tempo e o local são fixos. O elemento variável é o fenômeno.

Exemplo 0.6:

Tabela 0.05 – Faturamento da Empresa ABC no primeiro semestre do ano XXXX, por produto.

Produto Faturamento (R$ . 1000,00)Queijo 48,8Salame 39,7

Presunto 32,5Mortadela 31,8

Patê 16,2Total 169,0

Dados fictícios

0.01.03 – Apresentação Tabular

A mesma atenção dispensada às fases de coleta e organização dos dados deve ser observada na apresentação dos mesmos. Um conjunto de dados pode ser apresentado através de duas formas, que não se excluem mutuamente: através de tabelas,ou quadros, e gráficos. A primeira forma deve ser usada sempre que se desejar maior precisão na apresentação. A segunda, em que pese a maior facilidade de visualização, não proporciona a mesma precisão observada para a forma anterior.

0.01.03.01 – Estrutura

Uma tabela, ou um quadro, deve não somente apresentar dados mas, também, identificá-los quanto à origem, o quê representam e qual o período de tempo abrangido. É formada por três partes:

a) Cabeçalho: que deve identificar os dados da forma mais completa possível.b) Corpo: onde são dispostos os valores e identificadas as categorias e variáveis utilizadas.c) Rodapé: que deve indicar a fonte dos dados.

Outro ponto merecedor de destaque é a correta denominação da ferramenta utilizada. Uma tabela não deve ser fechada nas laterais. Quando as laterais são fechadas a denominação correta é quadro, conforme pode-se observar na figura abaixo.

Tabela Quadro

Figura 0.01 – Formatos de Tabela e Quadro

0.01.03.02 – Tabela, ou Quadro, Simples

Consiste basicamente de duas colunas, como nos exemplos 0.52, 0.53 e 0.54.

0.01.03.03 – Tabela, ou Quadro, de Dupla Entrada

É utilizada sempre que se deseja representar duas séries estatísticas simultaneamente.

Exemplo 0.7:

Quadro 0.02 – Faturamento (R$ .1000,00) da Empresa ABC no primeiro semestre do ano XXXX por região e por produto.

Região Produto TotalQueijo Salame Presunto Mortadela Patê

Sul 12,4 8,2 14,2 9,8 3,5 48,1Sudeste 10,6 6,4 10,1 12,5 2,8 42,4

Centro Oeste 9,5 7,4 4,3 4,8 3,9 29,9Nordeste 10,1 10,5 2,1 2,2 2,6 27,5

XXXXXYYYYY************************

XXXXXYYYYY************************

Norte 6,2 7,2 1,8 2,5 3,4 21,1Total 48,8 39,7 32,5 31,8 16,2 169,0

Dados fictícios

0.01.03.04 – Tabela, ou Quadro, de Múltipla Entrada

É usada para representar mais de duas séries simultaneamente.

Exemplo 0.8:

Quadro 0.03 – Faturamento (R$ . 1000,00) da Empresa ABC nos dois primeiros trimestres do ano XXXX, por região e por produto.

Região Produto TotalQueijo Salame Presunto Mortadela Patê

1o. tr 2o. tr 1o. tr 2o. tr 1o. tr 2o. tr 1o. tr 2o. tr 1o. tr 2o. trSul 8,2 4,4 5,0 3,2 6,5 7,7 4,3 5,6 1,3 2,5 48,1

Sudeste 4,1 6,5 3,8 2,6 4,7 5,4 4,2 8,3 1,3 1,5 42,4Centro Oeste 4,2 5,3 3,5 3,9 1,9 2,4 2,2 2,6 1,5 2,4 29,9

Nordeste 6,0 4,1 5,0 5,5 1,6 0,5 1,0 1,2 1,5 1,1 27,5Norte 2,0 4,2 3,7 3,5 1,1 0,7 1,2 1,3 1,5 1,9 21,1Total 24,5 24,3 21,0 18,7 15,8 16,7 12,9 18,9 7,1 9,1 169,0

Dados fictícios

0.01.04 - Apresentação GráficaPode ser utilizada isoladamente ou em conjunto com a apresentação tabular. A principal

vantagem da apresentação gráfica é a facilidade de compreensão por parte dos leitores. Não se deve esquecer, contudo, que esta facilidade acaba por comprometer a precisão das informações. Uma forma “ideal” de apresentação pode combinar as duas ferramentas. Os principais tipos de gráficos, ou os mais utilizados, são:

0.01.04.01 – Gráfico LinearÉ o gráfico mais usado na representação de séries temporais.

Exemplo 0.9:Tabela 0.03 – Faturamento da Empresa ABC no primeiro semestre do ano XXXX.

Mês Faturamento (R$ . 1000,00)Janeiro 25,3

Fevereiro 28,7Março 32,5Abril 35,9Maio 31,4Junho 15,2Total 169,0

Dados fictícios

Gráfico 0.01 – Faturamento da Empresa ABC no 1o. semestre do ano XXXX.

0.01.04.02 – Gráfico de Colunas

Neste tipo de gráfico, cada coluna representa uma categoria, sendo o valor observado indicado pela altura da coluna.

Exemplo 0.10:Tabela 0.04 – Faturamento da Empresa ABC no primeiro semestre do ano XXXX, por região.

Região Faturamento (R$ . 1000,00)Sul 48,1

Sudeste 42,4Centro Oeste 29,9

Nordeste 27,5Norte 21,1Total 169,0

Dados fictícios

Gráfico 0.02 – Faturamento da Empresa ABC por região.

0.01.04.03 – Gráfico de Setores.

É uma circunferência na qual cada setor corresponde a uma categoria. Também é chamado, incorretamente, de “gráfico pizza”.

Exemplo 0.11:Tabela 0.05 – Faturamento da Empresa ABC no primeiro semestre do ano XXXX, por produto.

Produto Faturamento (R$ . 1000,00)Queijo 48,8Salame 39,7

Presunto 32,5Mortadela 31,8

Patê 16,2Total 169,0

Dados fictícios

Gráfico 0.03 – Faturamento da Empresa ABC por produto.

0.01.04.03.01 – Construção do Gráfico Setorial.

Basta utilizar, para cada categoria, uma regra de três simples. O total deve corresponder a 360o , determinando-se a seguir a quantos graus corresponde cada categoria.No exemplo anterior,

169,0 360o

48,8 x

x 104o

0.01.04.04 – Gráfico de Colunas Sobrepostas

Pode ser utilizado para representar os dados de uma tabela, ou quadro, de dupla entrada. Cada coluna corresponde a uma categoria, sendo cada categoria composta por subcategorias.

Exemplo 0.12Quadro 0.02 – Faturamento (R$ .1000,00) da Empresa ABC no primeiro semestre do ano XXXX por região e por produto.

Região Produto TotalQueijo Salame Presunto Mortadela Patê

Sul 12,4 8,2 14,2 9,8 3,5 48,1Sudeste 10,6 6,4 10,1 12,5 2,8 42,4

Centro Oeste 9,5 7,4 4,3 4,8 3,9 29,9Nordeste 10,1 10,5 2,1 2,2 2,6 27,5

Norte 6,2 7,2 1,8 2,5 3,4 21,1Total 48,8 39,7 32,5 31,8 16,2 169,0

Dados fictícios

Gráfico 0.03 – Faturamento da Empresa ABC por região e por produto.

0.01.04.05 – Gráfico de Barras

É equivalente ao gráfico de colunas. A diferença está na substituição das colunas (verticais) por barras horizontais.

Exemplo 0.13:Tabela 0.04 – Faturamento da Empresa ABC no primeiro semestre do ano XXXX, por região.

Região Faturamento (R$ . 1000,00)Sul 48,1

Sudeste 42,4Centro Oeste 29,9

Nordeste 27,5Norte 21,1Total 169,0

Dados fictícios

Gráfico 0.04 - Faturamento da Empresa ABC por região.

0.05 – Exercícios

1) Uma empresa (fictícia) atua nos ramos de transporte, armazenagem e distribuição em três estados diferentes. O quadro abaixo mostra o desempenho desta empresa durante quatro meses.

Quadro 0.03 – Faturamento (R$ . 1000,00) mensal, por ramo de atividade e por Estado.Ramo Total

Transporte Armazenagem LogísticaPR SC RS PR SC RS PR SC RS

Janeiro 56,4 45,8 35,7 25,9 26,7 36,8 25,9 15,7 42,5Fevereiro 45,6 25,8 36,9 42,8 32,0 41,7 54,2 19,7 23,4

Março 32,0 14,7 41,1 54,8 36,7 45,1 62,2 24,3 14,5Abril 25,8 10,5 45,2 59,8 39,7 50,2 72,1 26,7 10,9Total

Construir para os dados do quadro acima:a) Uma série temporal.b) Uma série geográfica.c) Uma série específica.

Representar os dados:d) da série temporal por um gráfico linear;e) da série geográfica por um gráfico setorial;f) da série específica por um gráfico de colunas.

2) Construir uma tabela, ou quadro, para classificar os funcionários de uma empresa com relação a sexo, estado civil (solteiro, casado, viúvo e outros) e escolaridade (primeiro grau, segundo grau ou superior).

0.02 – Notação por Índices

A notação por índices é utilizada para representar os valores de um conjunto ordenado de dados. Consiste simplesmente em acrescentar uma letra, normalmente i ou j, à direita da letra usada para designar a variável, embora esta letra possa ser posicionada de modo diferente. Usualmente a forma empregada é

( “ X índice i” )

Seja, por exemplo, o conjunto { 2 , 4 , 5 , 6 , 8 , 9 , 11 , 15 }. Então X1 = 2 , X4 = 6 , X6 = 9.

0.02.01 – Somatório

É o símbolo utilizado para representar a soma dos elementos de um conjunto. É representado por

Lê-se: “Somatório de X índice i, com i variando de 1 a n”.

0.02.01.01 – Propriedades:

P1:

P2:

P3:

P4: , k IR .

P5:

Exemplo 0.14: Sejam os conjuntos X = { 1 , 2 , 4 , 5 , 6 } e Y = { - 3 , - 1 , 0 , 2 , 3 }. Calcular:

a)

b)

c)

d)

e)

f)

g)

0.02.02 – Produtório

É o símbolo utilizado para representar o produto dos elementos de um conjunto. É representado por

Lê-se: “Produtório de X índice i, com i variando de 1 a n”.

Exemplo 0.15: Sejam os conjuntos X e Y do exemplo anterior. Calcular

a)

b)

c)

0.03 – Distribuições de Freqüências

São séries estatísticas nas quais tempo, local e fenômeno são fixos. Neste caso o fenômeno é representado através de intervalos de valores, chamados classes ou categorias.

Exemplo 0.16 :Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.

Salários (R$) Funcionários200 – 400 20400 – 600 36600 – 800 60800 – 1000 401000 – 1200 281200 – 1400 16

Total 200Dados fictíciosNo exemplo acima há seis categorias, ou classes, salariais. O número de funcionários pertencentes a cada classe é a freqüência, ou freqüência simples, da mesma.

0.03.01 – Dados Brutos

São dados numéricos não organizados, seja numa distribuição de freqüências ou seguindo qualquer outro critério, como ordem crescente, por exemplo.

0.03.02 – Rol

É um conjunto de dados numéricos organizados em ordem crescente.

0.03.03 – Amplitude Total ( R )

É a diferença entre o maior e o menor valores de um conjunto de dados numéricos, isto éR = Xmáx – Xmín (0.11)

0.03.04 – Número de Classes ( n )

Ao se elaborar uma distribuição de freqüências deve-se definir inicialmente o número de classes da mesma. Este número pode ser definido arbitrariamente ou pela expressão abaixo, conhecida como Fórmula de Sturges.

(0.12)

onde N é o número de elementos do conjunto, também chamado freqüência total.Na prática não são elaboradas distribuições de freqüências com menos de cinco classes nem para

menos de 50 elementos.

0.03.05 – Limites de Classe

São os valores que delimitam os elementos que serão considerados como pertencentes à classe em questão. Normalmente são representados por

Lsi = limite superior da i-ésima classeLii = limite inferior da i-ésima classe

0.03.06 – Amplitude de Classe ( hi )

É a diferença entre os limites da i-ésima classe, ou seja

(0.13)

0.03.07 – Intervalo de Classe

É estabelecido com a finalidade de determinar quais elementos serão considerados como pertencentes à classe. Os quatro intervalos possíveis são representados por

“inclusive – exclusive”

“inclusive – inclusive”

“exclusive – exclusive”

“exclusive – inclusive”

0.03.08 – Freqüência ( fi )

A freqüência da i-ésima classe nada mais é que o número de elementos pertencentes à mesma. Também é chamada freqüência simples da classe. Na prática, quando a freqüência de uma classe é muito pequena em relação as demais, isto é, desprezível, costuma-se representá-la por “ – “ (traço). Isto não significa que a freqüência é zero.

No exemplo 0.16: f1 = , f2 = , f3 = , etc.

0.03.09 – Freqüência Acumulada

A freqüência acumulada da i-ésima classe pode ser:

0.03.09.01 – Crescente ( faci )É a soma da freqüência da i-ésima classe com as freqüências das classes anteriores. Então

(0.14)

0.03.09.02 – Decrescente ( fadi )É a soma da freqüência da i-ésima classe com as freqüências das classes posteriores. Então

(0.15)

No exemplo 0.16: e

0.03.10 – Freqüência Relativa ( fri )

A freqüência relativa da i-ésima classe é dada pela divisão da freqüência desta classe pela soma das freqüências. Isto é

(0.16)

0.03.10.01 – Freqüência Relativa Percentual ( fri % )

A freqüência relativa percentual da i-ésima classe é dada pela multiplicação da freqüência relativa desta classe por 100 (cem). Então

(0.17)0.03.11 – Ponto Médio ( Xi )

O ponto médio da i-ésima classe é

(0.18)

No exemplo 0.16, X1 = 300 , X2 = 500 e X5 = 1100.

0.03.12 – Histograma

É um gráfico de colunas justapostas, onde a largura de cada coluna representa a amplitude e a altura corresponde à freqüência da respectiva classe.

Exemplo 0.17: O histograma correspondente aos dados da tabela 0.05.

Gráfico 0.05 – Histograma representativo dos dados da tabela 0.05.

O quadro à direita pode ser eliminado. Neste caso os valores são escritos abaixo do eixo das abscissas. Também não são necessárias as linhas horizontais de escala.

0.03.13 – Polígono de Freqüências

É uma linha poligonal unindo os pontos ( Xi , fi ). Pode ser traçada sobre o histograma, como se pode ver a seguir.

Gráfico 0.06 – Polígono de freqüências representativo dos dados da tabela 0.05.

0.03.14 – Curva de Freqüências

É uma curva que passa pelos pontos ( Xi , fi).

0.03.15 – Regras para Construção de uma Distribuição de Freqüências

Algumas regras gerais para a construção de uma distribuição de freqüências são apresentadas por Spiegel 2 . De acordo o referido autor, as etapas são:

1) Determinar a amplitude total do rol.2) Dividir a amplitude total em um número conveniente de intervalos de classes que tenham a

mesma amplitude. Caso isto não seja possível, usar intervalos com amplitudes diferentes ou abertos. Estes intervalos também devem ser escolhidos de modo que os pontos médios coincidam com valores efetivamente observados, de modo a diminuir o erro de agrupamento em análises posteriores.

3) Determinar o número de observações que caem dentro de cada intervalo.

0.03.16 – Exercícios

1) Uma amostra de 144 pacotes de um certo produto teve seus pesos, em gramas, observados, e os valores são mostrados a seguir. Elaborar uma distribuição de freqüências.

114 118 95 85 101 104 95 102 104 105 130 86112 90 96 103 96 89 96 94 96 97 126 8480 117 103 104 102 103 95 98 97 93 124 92115 104 81 108 104 103 106 94 102 101 120 109112 104 107 85 81 109 86 99 88 98 122 110110 92 107 101 107 84 106 100 97 92 98 95119 103 92 111 103 92 106 92 104 104 96 102110 94 109 87 107 89 95 103 87 99 99 91115 102 105 110 105 83 105 100 98 92 101 99110 94 93 82 107 89 106 98 88 105 103 106116 101 109 117 101 102 109 102 98 99 115 87113 114 112 110 108 109 95 106 116 94 107 95

a) Amplitude total: R =

b) Número de classes: n =

2 Spiegel, Murray R. – Estatística - 3ª. Edição – São Paulo – Makron Books – 1993.

c) Amplitude de classe: h =

d) Intervalo:

e) Distribuição:

f) Histograma:

g) Polígono de freqüências:

h) Curva de freqüências:

1 – Medidas de Tendência Central, ou de Posição

1.01 – Média Aritmética

Seja um conjunto de dados { x1 , x2 , x3 , ... , xn }. Então a média aritmética é

(1.01)

É importante ressaltar que a notação usada, , corresponde à média aritmética de dados amostrais. A média aritmética de uma população é representada pela letra grega , calculada da mesma forma.

Exemplo 1.01: Calcular a média aritmética do conjunto { 3 , 4 , 6 , 8 , 8 , 9 , 10 , 10 , 11 }.

OBS: Neste material, salvo menção em contrário, todo exercício considerará os dados como sendo amostrais.

1.01.01 – Propriedades:

P1: Se uma constante k for somada a cada um dos elementos do conjunto, a média aritmética do mesmo será acrescida de k.

Exemplo 1.02: Sejam os conjuntos { 1 , 3 , 4 , 6 , 9 } e { 201 , 203 , 204 , 206 , 209 }. Calcular e comparar as médias aritméticas para ambos.

P2: Se todos os elementos de um conjunto forem multiplicados por uma constante k, a média aritmética dos mesmos também será multiplicada pelo mesmo valor.

Exemplo 1.03: Sejam os conjunto { 2 , 3 , 6 , 6 , 8 } e { 6 , 9 , 18 , 18 , 24 }. Calcular e comparar as médias aritméticas para ambos.

P3: A soma dos desvios dos valores de um conjunto em relação à sua média é nula.

Exemplo 1.04: Verificar a soma dos desvios em relação à média aritmética dos valores do conjunto { 2 , 4 , 6 , 7 , 9 }.

1.01.02 – Média Aritmética para Dados Agrupados.

Sejam N valores agrupados em n classes, com pontos médios Xi e freqüências fi . Então a média aritmética é

(1.02)

Exemplo 1.05: Calcular a média aritmética para os dados da distribuição de freqüências do exemplo 0.64.Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.

Salários Funcionários Xi Xi fi

200 – 350 20350 – 500 36500 – 650 60650 – 800 40800 – 950 28950 – 1100 16

TotalDados fictícios

Exemplo 1.06: Calcular a média aritmética para a distribuição de freqüências obtida no exercício 0.04.15.1.

1.02 – Mediana ( ou Me )

A mediana, ou valor mediano, de um conjunto de dados é o número que divide este conjunto em duas partes iguais. É importante ressaltar que este valor não pertence necessariamente ao conjunto.

1.02.01 – Dados Simples.Há dois casos a considerar:

1) Quantidade ímpar de valores: neste caso a mediana é o valor que ocupa a posição central, quando os valores estão em ordem crescente.

Exemplo 1.14: Calcular a mediana do conjunto { 3 , 4 , 6 , 8 , 8 , 9 , 10 , 10 , 11 }.

Como os valores já estão ordenados, basta verificar que elemento ocupa a posição central. Neste caso = 8.

2) Quantidade par de valores: aqui a mediana é a média dos dois elementos centrais, quando os valores estão em ordem crescente.

Exemplo 1.15: Calcular a mediana do conjunto { 2 , 3 , 5 , 6 , 7 , 9 , 10 , 13 , 14 , 15 }.

1.02.02 – Dados Agrupados

Para dados agrupados em uma distribuição de freqüências pode-se aplicar a fórmula dada a seguir:

(1.09)

onde:Li = limite inferior da classe que contém a mediana.fc = freqüência acumulada crescente da classe anterior à classe que contém a mediana.fme = freqüência simples da classe que contém a mediana.h = amplitude da classe que contém a mediana.

A classe que contém a mediana é aquela cuja freqüência acumulada crescente é imediatamente superior,

ou igual, a .

Exemplo 1.16: Calcular a mediana para a distribuição de freqüências do exemplo 0.64.Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.

Salários Funcionários Xi Xi fi

200 – 350 20350 – 500 36500 – 650 60650 – 800 40800 – 950 28950 – 1100 16

TotalDados fictícios

1o. passo: Determinar a classe que contém a mediana:

Então a mediana pertence à .......... classe.

2o. passo: Aplicar a fórmula 1.09:

Li =

fc =

fme =

h =

3o. passo: Interpretação: ..............................................................................................................................................................................................................................................................

Exemplo 1.17: Calcular a mediana para a distribuição de freqüências do exemplo 1.06.

1.03 – Moda ( Mo)

A moda, ou valor modal, de um conjunto de dados é o valor com maior freqüência. Este valor pode não existir ou, caso exista, pode não ser único.

1.03.01 – Dados Simples

Basta verificar qual elemento possui a maior freqüência.

Exemplo 1.18: Para o conjunto { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 8 , 9 , 10 } a moda é 4.

Exemplo 1.19: Para o conjunto { 1 , 2 , 2 , 2 , 2 , 3 , 3, 5 , 5 , 5 , 5 , 6 , 7 , 8 , 8 } os valores modais são 2 e 5.

Exemplo 1.20: O conjunto { 2 , 3 , 4 , 5 , 7 , 8 , 9 , 10 , 11 , 13 , 15 } não possui moda.

1.03.02 – Dados Agrupados

Para valores agrupados em uma distribuição de freqüências pode-se aplicar a fórmula obtida a seguir.

Suponha-se que a figura (1.01), a seguir, represente parte do histograma de uma distribuição de freqüências cujo valor modal deseja-se calcular. O retângulo mais alto representa a classe modal, isto é, a de maior freqüência.

A B

1 E I F 2

D

C

Li I’ Li + h

(Figura 1.01)

O valor modal, Mo, coincide com I’ , abscissa do ponto I , que é a intersecção dos segmentos e BC. Os triângulos AIC e BID são semelhantes. Então

Como I’ = Mo

Simplificando-se, a expressão fica

(1.10)

onde:Li = limite inferior da classe modal (com maior freqüência simples).1 = diferença entre as freqüências simples da classe modal e da classe anterior.2 = diferença entre as freqüências simples da classe modal e da classe posterior.h = amplitude da classe modal.

Exemplo 1.21: Calcular a moda para a distribuição de freqüências do exemplo 0.64.Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.

Salários Funcionários Xi Xi fi

200 – 350 20350 – 500 36500 – 650 60650 – 800 40800 – 950 28950 – 1100 16

TotalDados fictícios

Exemplo 1.22: Calcular a moda para a distribuição de freqüências do exemplo 1.06.

1.04 – Relação Entre Média, Mediana e Moda

A assimetria de uma distribuição de freqüências é o grau de desvio dos valores em relação a um valor central. A determinação do tipo de assimetria tem grande utilidade em algumas aplicações da Estatística, como no Controle Estatístico de Processo (CEP), por exemplo.

1.04.01 – Tipos de Assimetria

Com relação ao tipo de assimetria, uma distribuição de freqüências pode ser:

1.04.01.01 – Assimétrica Positiva:

(Figura 1.02 – Distribuição Assimétrica Positiva)

1.04.01.02 – Simétrica, ou Normal:

(Figura 1.03 – Distribuição Simétrica, ou Normal)

1.04.01.03 – Assimétrica Negativa:

(Figura 1.04 – Distribuição Assimétrica Negativa)

1.05 – Separatrizes (Medidas de Posição)

Já foi visto que a mediana divide um conjunto de dados ordenados em duas partes iguais. De forma análoga, há medidas estatísticas que dividem um conjunto em quatro, dez ou cem partes. Estas medidas são chamadas separatrizes. A medida que divide o conjunto em 100 partes iguais é o percentil, definido a seguir.

1.05.01 – Percentil ( Pn )

Também chamado centil , divide um conjunto em cem partes iguais.

1.05.01.01 – Dados Simples

Para um conjunto de dados simples os percentis podem ser determinados de forma análoga a utilizada para a determinação da mediana.

1.05.01.02 – Dados Agrupados

Para dados agrupados em uma distribuição de freqüências pode-se utilizar a fórmula dada a seguir

(1.13)

onde: n = 1 , 2 , 3 , ... , 99 é o percentil que se deseja calcular.N = soma das freqüências.fc = freqüência acumulada crescente da classe anterior à classe que contém o n-ésimo percentil.fP = freqüência simples da classe que contém o n-ésimo percentil.h = amplitude da classe que contém o n-ésimo percentil.

A classe que contém o n-ésimo percentil é aquela cuja freqüência acumulada crescente é imediatamente

superior, ou igual, a .

Exemplo 1.28: Calcular o 20o. e o 75o. percentis para a distribuição de freqüências do exemplo 0.64.Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.

Salários Funcionários Xi Xi fi

200 – 350 20350 – 500 36500 – 650 60650 – 800 40800 – 950 28950 – 1100 16

TotalDados fictícios

Exemplo 1.29: Calcular o 35o. e o 80o. percentis para a distribuição de freqüências do exemplo 1.06.

1.05.02 – Quartil e Decil

O quartil é a medida que divide um conjunto em quatro partes iguais. Pode ser calculado pelas seguintes relações:

Q1 = P25

Q2 = P50

Q3 = P75

O decil divide o conjunto em dez partes iguais. Assim, usando raciocínio análogo ao utilizado para o cálculo do quartil, tem-se

D1 = P10

D2 = P20

D3 = P30

1.06 – Exercícios

Tabela 1.01 – Diâmetros (mm) observados em um amostra de tubos.Classe Diâmetros (mm) Tubos

1 93 |- 95 162 95 |- 97 243 97 |- 99 364 99 |- 101 485 101 |- 103 366 103 |- 105 247 105 |- 107 16

TotalDados fictícios

1) Para os dados da tabela 1.01:1) Calcular o diâmetro médio.2) Calcular o diâmetro mediano.3) Calcular o diâmetro modal.4) Calcular e interpretar o 10o. percentil.5) Calcular e interpretar o 90o. percentil.6) Determinar o tipo de assimetria da distribuição.7) Construir o histograma.8) Calcular a freqüência acumulada decrescente.

Tabela 1.02 – Distribuição por idades dos moradores de uma certa localidade.Idade Moradores0 -| 5 1005 -| 10 150

10 -| 15 20015 -| 20 25020 -| 25 20025 -| 30 15030 -| 35 10035 -| 40 7540 -| 45 5045 -| 50 3550 -| 55 2055 -| 60 1060 -| 65 5

Dados fictícios.

2) Para o dados da tabela 1.02:1) Calcular a idade média.2) Calcular a idade mediana.3) Calcular a idade modal.4) Com base nos três valores acima, classificar a população como “Jovem”, “Normal” ou “Velha”.

Relacionar a classificação com o tipo de assimetria.5) Construir o histograma.6) Calcular o 10o. percentil.7) Calcular o 90o. percentil.8) Construir um histograma para as freqüências acumuladas decrescentes.

3) Tabela 1.03Ponto médio Freqüência Acumulada Crescente

2 64 166 308 5010 7812 10014 11216 12018 126

1) Calcular a média.2) Calcular a mediana.3) Calcular a moda.4) Calcular o 1o. quartil.5) Calcular o 3o. quartil.6) Construir um histograma para as freqüências acumuladas crescentes.

2 – Medidas de Dispersão, ou Variabilidade

Tão importante quanto o cálculo de uma medida de posição, geralmente a média aritmética, é a determinação da variação dos valores em torno desta medida. Esta variação é denominada dispersão, e suas principais medidas são dadas a seguir.

2.01 – Variância ( 2 ou s2 )

A variância de um conjunto de dados é a média dos quadrados dos desvios dos valores em relação à sua média. Isto é, dado um conjunto { x1 , x2 , x3 , ... , xn }, a variância é dada por

2.01.01 – Dados Populacionais:

(2.01)

2.01.02 – Dados Amostrais:

(2.02)

OBS: Neste material, salvo menção em contrário, os dados serão sempre considerados como amostrais.

As fórmulas dadas acima podem ser substituídas, respectivamente, por

(2.03)

(2.04)

conhecidas como fórmulas reduzidas, e que (apesar da aparência) tornam os cálculos consideravelmente mais rápidos.

Exemplo 2.01: Calcular a variância do conjunto { 3 , 4 , 6 , 8 , 8 , 9 , 10 , 10 , 11 }.

2.01.03 – Variância para Dados Agrupados

Sejam N valores agrupados em n classes, com pontos médios Xi e freqüências fi . Então a variância é

2.01.03.01 – Dados Populacionais

(2.04)

2.01.03.02 – Dados Amostrais

(2.05)

onde .

Da mesma forma que as fórmulas (2.01) e (2.02), as fórmulas acima também podem ser substituídas por fórmulas reduzidas. Neste caso (2.04) e (2.05) ficam, respectivamente,

(2.06)

(2.07)

Exemplo 2.02: Calcular a variância para os dados da distribuição de freqüências do exemplo 1.28.Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.

Salários Funcionários Xi Xi fi

200 – 350 20350 – 500 36500 – 650 60650 – 800 40800 – 950 28950 – 1100 16

TotalDados fictícios

Exemplo 2.03: Calcular a variância para a distribuição de freqüências do exemplo 1.29.

2.02 – Desvio Padrão ( ou s )

É a mais conhecida, e utilizada, medida de dispersão. O desvio padrão de um conjunto de dados nada mais é que a raiz quadrada da variância do mesmo.

Exemplo 2.05: Calcular o desvio padrão do conjunto { 3 , 4 , 6 , 8 , 8 , 9 , 10 , 10 , 11 }.

Exemplo 2.06: Calcular o desvio padrão para a distribuição de freqüências do exemplo 2.04.

OBS: A exemplo dos exercícios envolvendo a variância, todos os exercícios envolvendo o cálculo do desvio padrão devem considerar os dados como amostrais, salvo menção em contrário.

2.02.01 – Propriedades

P1: Se uma constante k é somada a todos os valores de um conjunto, o desvio padrão não se altera.

P2: Se todos os valores de um conjunto são multiplicados por uma constante k, o desvio padrão também fica multiplicado por k.

2.03 – Coeficiente de Variação

O coeficiente de variação é definido como a razão entre o desvio padrão e a média aritmética. Então

(2.10)

Exemplo 2.07: Calcular o coeficiente de variação para o conjunto {3 , 4 , 6 , 8 , 9 , 10 , 10 , 11}.

Exemplo 2.08: Idem para a distribuição de freqüências do exemplo 2.04.

2.04 – Escore Reduzido ( z )

Seja um conjunto { x1 , x2 , x3 , ... , xn }. O escore reduzido do i-ésimo elemento é dado por

(2.11)

Quando os dados estão agrupados em um distribuição de freqüências, calcula-se o escore reduzido dos pontos médios.

Exemplo 2.09: Calcular o escore reduzido para o conjunto { 3 , 4 , 6 , 8 , 8 , 9 , 10 , 10 , 11 }.

Exemplo 2.10: Calcular o escore reduzido de cada ponto médio da distribuição de freqüências do exemplo 2.04.

2.05 – Exercícios

Tabela 1.01 – Diâmetros (mm) observados em um amostra de 100 tubos.Classe Diâmetros (mm) Tubos

1 93 |- 95 162 95 |- 97 243 97 |- 99 364 99 |- 101 485 101 |- 103 366 103 |- 105 247 105 |- 107 16

Total 200Dados fictícios

1) Para os dados da tabela 1.01:1) Calcular a variância.2) Calcular o desvio padrão.3) Calcular o coeficiente de variação.

Tabela 1.02 – Distribuição por idades dos moradores de uma certa localidade.Idade Moradores0 -| 5 1005 -| 10 15010 -| 15 20015 -| 20 25020 -| 25 20025 -| 30 15030 -| 35 10035 -| 40 75

40 -| 45 5045 -| 50 3550 -| 55 2055 -| 60 1060 -| 65 5

Dados fictícios.

2) Para o dados da tabela 1.02.1) Calcular o desvio padrão.2) Calcular os escores reduzidos correspondentes aos pontos médios.

Tabela 1.03Ponto médio Freqüência Acumulada Crescente

2 64 166 308 5010 7812 10014 11216 12018 126

3) Calcular o desvio padrão.

4) Calcular o desvio padrão para os conjuntos:

a) {2 , 4 , 5 , 6 , 8 }b) {102 , 104 , 105 , 106 , 108 }.

5) Calcular o coeficiente de variação para cada conjunto do exercício anterior.

3 – Medidas de Assimetria e Curtose

3.01 – Definições e Conceitos

O conceito de assimetria foi apresentado em 1.07 , p. 56. Ali também foi apresentada uma forma de determinar o tipo de assimetria de um conjunto de dados. Em algumas aplicações, contudo, a simples determinação do tipo de assimetria não é suficiente, fazendo-se necessário o cálculo do coeficiente de assimetria.

A curtose de um conjunto de dados é o achatamento de uma curva de freqüências em relação a uma curva simétrica, ou normal. Com relação à curtose, uma curva de freqüências pode ser classificada como:

3.01.01 – Mesocúrtica:

Figura 3.01 – Distribuição Mesocúrtica3.01.02 – Leptocúrtica

Figura 3.02 – Distribuição Leptocúrtica3.01.03 – Platicúrtica

Figura 3.03 – Distribuição Platicúrtica.

3.02 – Coeficientes de Pearson para Assimetria

O primeiro e o segundo coeficientes de Pearson para a assimetria são dados, respectivamente, por

(3.01)

(3.02)

3.02.01 – Comentário

Na prática há situações nas quais as relações entre média, mediana e moda apresentadas em 1.07, não se verificam. Isto é, a mediana ( ) não assume um valor intermediário entre a média ( ) e a moda ( Mo ). Neste caso pode-se aplicar uma “regra não escrita”, que consiste em desconsiderar o valor da

moda na determinação do tipo de assimetria. Para o cálculo do coeficiente de assimetria deve-se adotar, portanto, o segundo coeficiente de Pearson (3.02). Por outro lado, independentemente da ocorrência ou não deste fato, é consenso que o cálculo deste coeficiente deve ser feito sempre com base em uma única fórmula, das duas dadas acima.

Exemplo 3.01: Calcular o coeficiente de assimetria para o conjunto { 3, 4 , 6 , 8 , 8 , 9 , 10 , 10 , 11 }.

Exemplo 3.02: Calcular os dois coeficientes de Pearson para a distribuição de freqüências do exemplo 2.04.Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.

Salários Funcionários Xi Xi fi

200 – 350 20350 – 500 36500 – 650 60650 – 800 40800 – 950 28950 – 1100 16

TotalDados fictícios

3.03 – Coeficiente Percentílico de Curtose

Uma medida de curtose muito usada na prática é o coeficiente percentílico de curtose, dado por

(3.03)

A determinação do tipo de curtose é feita com base nas relações a seguir:

k < 0,263 Leptocúrtica

k = 0,263 Mesocúrtica

k > 0,263 Platicúrtica

Exemplo 3.03: Calcular o coeficiente de curtose para a distribuição de freqüências do exemplo 3.02.

Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.Salários Funcionários Xi Xi fi

200 – 350 20350 – 500 36500 – 650 60650 – 800 40800 – 950 28950 – 1100 16

TotalDados fictícios

3.03.01 – Comentário

Na prática, o coeficiente de curtose é calculado apenas para distribuições normais, ou simétricas.

3.04 – Exercícios de Revisão.

Seja a distribuição de freqüências a seguir.

Tabela 3.01: Pesos (em gramas) observados em uma amostra de pacotes de um certo produto.

Peso (g) Pacotes90 – 92 1292 – 94 1894 – 96 2496 – 98 3698 – 100 48100 – 102 40102 – 104 34104 – 106 22106 - 108 14

Dados fictícios

1) Calcular a freqüência acumulada crescente para cada classe.2) Calcular a freqüência acumulada decrescente para cada classe.3) Calcular o peso médio.4) Calcular o peso mediano.5) Calcular o peso modal.6) Construir o histograma.7) Determinar o tipo de assimetria da distribuição.8) Calcular o desvio padrão.9) Calcular o primeiro coeficiente de Pearson.10) Calcular o coeficiente percentílico de curtose.

Repetir o exercício anterior para a distribuição a seguir:Tabela 1.03

Ponto médio Freqüência Acumulada Crescente2 64 166 308 5010 7812 10014 11216 12018 126

4 – Teoria Elementar da Probabilidade

4.01 – Conceitos

A teoria da probabilidade é aplicada à Estatística Indutiva, ou Inferencial, que tem se mostrado uma importante ferramenta de apoio à tomada de decisões sob condições de incerteza. Embora não haja uma definição precisa do que é probabilidade, o assunto pode ser estudado sob três enfoques, dados a seguir.

4.01.01 – Enfoque Clássico

Seja um experimento com n possíveis resultados. Supondo-se que m destes resultados, m n, sejam favoráveis à ocorrência de um evento, então a probabilidade de ocorrência do evento é

(4.01)

Interpretação: “A probabilidade de ocorrência de um evento é a razão entre o número de casos favoráveis e o número de casos possíveis”.

4.01.02 – Enfoque Relativo

Sob este enfoque a probabilidade de ocorrência de um evento é determinada com base na proporção de ocorrências deste evento em um certo número de observações, ou experimentos.

4.01.03 – Enfoque Subjetivo

É adotado quando há apenas uma oportunidade para a ocorrência do evento. Neste caso o que se observa é um certo “grau de crença”3 , ou expectativa. Também é conhecido como enfoque personalístico.

Um princípio muito importante no estudo da teoria da probabilidade é o Princípio Fundamental da Contagem (PFC). De acordo com este princípio, se dois eventos sucessivos podem ocorrer de m e n modos, respectivamente, então o número de modos pelos quais m e n podem ocorrer é dado por (m.n).

4.02 – Experimento Aleatório ( )

É todo experimento, ou observação, cujo resultado não seja previsível, estando sujeito unicamente ao acaso. São exemplos de experimento aleatório: número de falhas apresentadas por um equipamento, número de nascimentos em uma certa semana, número de clientes atendidos em um dia qualquer em um estabelecimento comercial e o número de ganhadores de uma loteria, entre outros.4.02.01 – Espaço Amostral ( S )

É o conjunto de todos os possíveis resultados de um experimento aleatório. Como é um conjunto, está sujeito a todas as propriedades vistas no capítulo 0 , p. 6. Cabe acrescentar, ainda, que um espaço amostral pode ser:4.02.01.01 – Discreto: quando é um conjunto enumerável.

4.02.01.02 – Contínuo: quando não é conjunto enumerável.

4.02.02 – Evento ( E )

É um subconjunto de um espaço amostral, cujos elementos são os resultados favoráveis, mencionados em 4.01.01. Dois, ou mais, eventos atendem a todas as propriedades e operações sobre conjuntos já mencionadas, tais como união, intersecção, etc.

4.02.02.01 – Evento União

Sejam dois eventos, A e B. O evento união, ou A B , ocorre sempre que se observar a ocorrência de um resultado favorável a A ou a B.

4.02.02.02 – Evento Intersecção

Sejam dois eventos, A e B. O evento intersecção ocorre sempre que se observar a ocorrência de um resultado favorável a A e a B.

4.02.02.03 – Evento Complementar

Seja um evento A. O evento complementar ocorre sempre que se observar a ocorrência de um resultado desfavorável a A.

4.02.02.04 – Eventos Mutuamente Exclusivos

3 Kazmier, Leonard J. – Estatística Aplicada à Economia e Administração – Ed. Mc Graw Hill do Brasil – São Paulo – 1982.

Dois eventos, A e B, são mutuamente exclusivos quando não há possibilidade de ocorrência de um resultado favorável a ambos, como no evento união. Isto significa dizer que

A B =

4.02.03 – Probabilidade de um Evento ( p ou P(E) )

É dada por

(4.02)

4.02.04 – Propriedades

Sejam A e B dois eventos quaisquer de um espaço amostral S. São válidas as seguintes propriedades:

1) 0 P(A) 12) P( A B) = P( A + B) = P(A) + P(B) – P(A B)3) P(S) = 14) Sejam A1 , A2 , ... , An todos os eventos de um espaço amostral S. Então

4.02.05 – Exemplos

Escrever e classificar o espaço amostral associado a cada experimento aleatório dado a seguir.

1) Uma moeda é lançada duas vezes. 2) Um dado é lançado após o lançamento de uma moeda.3) Foguetes são lançados até que um lançamento seja bem sucedido. O número máximo de

lançamentos é 5 (cinco).4) Número de defeitos apresentados por um veículo durante o período de garantia.5) Número de cancelamentos de passagens para vôo em um avião com 20 lugares.

Calcular a probabilidade de cada um dos eventos dados a seguir.

1) Uma moeda é lançada duas vezes. Qual a probabilidade de se obter duas “caras” ?2) Uma caixa contém cinco bolas brancas e cinco bolas pretas. São retiradas duas bolas. Qual a

probabilidade de que:

a) As duas sejam pretas ?b) As duas sejam da mesma cor ?

3) Resolver o exemplo anterior considerando as retiradas com reposição.4) Um dado é lançado duas vezes. Qual a probabilidade de que a soma dos resultados seja a) 8 ?

b) 5 ? c) 7 ?5) Uma caixa contém dez rolamentos, dos quais dois estão estragados. São retirados quatro

rolamentos. Qual a probabilidade de que os dois rolamentos defeituosos estejam entre estes quatro ?

4.02.06 – Eventos Independentes

Dois eventos, A e B, são chamados independentes quando a ocorrência de um não altera a probabilidade de ocorrência do outro. Neste caso, para determinar a ocorrência do evento A e do evento B, aplica-se a Regra do Produto, dada por

(4.03)

Exemplo 4.02.06: Um dado é lançado duas vezes. Qual a probabilidade de se obter os resultados 3 e 5 ?

4.02.07 – Probabilidade Condicional

Sejam A e B dois eventos consecutivos. Há casos nos quais a ocorrência, ou não, do evento A altera a probabilidade de ocorrência do evento B. Nestes casos diz-se que a ocorrência de B está condicionada à ocorrência de A. Assim, a probabilidade de ocorrência de B, após a ocorrência de A, é dada por

(4.04)

Na equação acima, P(B | A) deve ser lido como “probabilidade de B ocorrer, dado que A ocorreu”.

Exemplo 4.02.07: Uma caixa contém duas bolas brancas e três bolas pretas. São retiradas duas bolas aleatoriamente e sem reposição. Qual a probabilidade de que a primeira seja branca e a segunda seja preta ?

Exemplo 4.02.08: No exemplo anterior, qual a probabilidade de que as duas bolas sejam da mesma cor ?

4.02.08 – Teorema da Probabilidade Total

Sejam A1 , A2 , ... , Ai , ... , An partições de um espaço amostral S , isto é, . Seja B um evento qualquer de S. Então a probabilidade de ocorrência de

B é dada por

(4.05)

Exemplo 4.02.09: Uma indústria adquire um componente de três fornecedores, A, B e C. O fornecedor A é responsável por 40% das unidades, enquanto os fornecedores B e C são responsáveis por 30% cada um. A proporção de não conformidade (p.n.c.) do fornecedor A é igual a 3%, do fornecedor B é 5% e do fornecedor C é 4%. Uma unidade do componente em questão é selecionada aleatoriamente. Qual a probabilidade de ser não conforme ?

4.03 – Teorema de Bayes

Também conhecido como fórmula de probabilidades “a posteriori”, é aplicado na seguinte situação. Sejam A1 , A2 , ... , Ai , ... , An partições de um espaço amostral S , isto é,

. Seja B um evento qualquer de S. Então

(4.06)

Exemplo 4.03.01: Seja o exemplo anterior. Uma unidade é selecionada aleatoriamente e verifica-se que é não conforme. Qual a probabilidade de ter sido produzida por B ?

4.04 – Variável Aleatória (V.A.)

De um modo simplificado, pode-se dizer que uma variável é chamada aleatória quando seus valores são determinados por processos aleatórios.

Exemplo 4.04.01: Seja o experimento aleatório “lançamento de um dado”. Seja X a variável que representa os possíveis resultados para este experimento. Isto significa que X {1 , 2 , 3 , 4 , 5 , 6}.

4.04.01 – Tipos de Variável Aleatória.

Uma variável aleatória pode ser:

4.04.01.01 – Discreta: Quando o espaço amostral é um conjunto enumerável (página 8).

4.04.01.02 – Contínua: Quando o espaço amostral é um conjunto não enumerável.

4.05. – Função de Probabilidade

Seja X uma v. a. discreta. Uma função p( X ) é uma função de probabilidade se, para cada valor de X:

a) 0 p( X )

b)

c) p( k ) = P( X = k )

4.05.01 – Função Densidade de Probabilidade

Seja X uma v. a. contínua. Uma função f( X ) é uma função densidade de probabilidade (fdp) se, para cada valor de X:

a) 0 f (X)

b)

c) P( a X b) =

4.05.02 – Expectância ( E( X ) ou )

É a média, ou valor esperado, de uma variável aleatória. É definida como

, v. a. discreta (4.07)

, v. a. contínua (4.08)

Exemplo 4.05.01 – A tabela abaixo mostra o número falhas observadas em uma linha de produção durante um período de 50 dias. Calcular a expectância da v.a. discreta X.

Tabela 5.01 – Numero de falhas observado durante 50 dias em uma linha de produção.

Número de falhas (X) Dias0 51 72 113 134 85 46 2

Total 50Solução:

Número de falhas (X) Dias P( X ) XP( X )0 51 72 113 134 85 46 2

Total 50

Exemplo 4.05.02: Um certo modelo de automóvel custa R$ 30000,00. As estatísticas mostram que 8% dos veículos deste modelo são roubados no período de um ano. Qual o valor “justo” para o seguro contra roubo ?

4.05.03 – Variância ( V( X ) ou 2 )

Seja uma v. a. X. A sua medida de dispersão, ou variabilidade, em torno da média é dada por

, v. a. discreta (4.09)

, v. a. contínua (4.10)

Exemplo 4.05.03: Calcular a variância para a v. a. discreta do exemplo 4.05.01.

Número de falhas (X) Dias

0 51 72 113 134 85 46 2

Total 50

Exemplo 4.05.04: A variância também pode ser calculada pela fórmula . Calcular a variância da v. a. do exemplo anterior através da fórmula dada.

4.06 – ExercíciosPara cada um dos exercícios abaixo, escrever o espaço amostral, o evento estudado e calcular a

probabilidade do mesmo, quando solicitado.

1) Seja o seguinte jogo. De uma urna, contendo cinco bolas pretas e cinco bolas brancas, são retiradas, com reposição, três bolas sucessivamente. A cada bola retirada é colocada outra da mesma cor. Qual a probabilidade de que:

a) As três primeiras bolas sejam pretas ?b) As três primeiras bolas sejam da mesma cor ?c) No mínimo uma das três bolas retiradas seja preta ?

2) Um dado é lançado duas vezes. Qual a probabilidade de que a soma dos resultados seja:

a) dois ?b) cinco ?c) no mínimo nove ?d) menos que nove ?

3) O fornecimento de um componente é feito por três empresas, C1 , C2 e C3. As proporções de não conformidade (pnc’s) destas empresas são, respectivamente, 3% , 8% e 9%. O fornecedor C1

produz o dobro do fornecedor C2, cuja participação é igual à de C3. Qual a probabilidade de que uma unidade, selecionada aleatoriamente, seja:

a) produzida por C1 e não conforme ?b) não conforme e produzida por C1 ?c) conforme e produzida por C2 ou C3 ?

4) Um atirador tem o direito de disparar quatro tiros, até acertar o alvo. Se a probabilidade de acertar o alvo é igual a p, calcular a probabilidade de que o atirador acerte na segunda tentativa.

5) Uma oferta de emprego é respondida por 100 pessoas. Destas 100 pessoas, 50 possuem certificado técnico e 30 possuem apenas experiência. Há, ainda, 20 pessoas que preenchem ambos os requisitos. Qual a probabilidade de que um candidato selecionado aleatoriamente:

a) possua certificado ?b) possua experiência ?c) possua certificado e experiência ?d) possua certificado ou experiência ?e) possua certificado ou experiência, mas não ambos ?

6) A pnc (proporção de não conformidade) de um produto é igual a 5%. Em um lote de cinco unidades, qual a probabilidade de que:

a) duas estejam fora de conformidade ?b) mais de duas estejam fora de conformidade ?c) no mínimo duas estejam fora de conformidade ?d) ao menos uma esteja fora de conformidade ?

7) A tabela a seguir mostra o número de caminhões que chegam para descarregar em um terminal ao longo de 30 dias.

Número de caminhões (X) Dias1 12 33 74 95 56 47 1

Total 30

a) Calcular a probabilidade de que o terminal receba, em um dia qualquer, no mínimo cinco caminhões.

b) Qual o número esperado de caminhões em um dia qualquer ?c) Qual a variância ?

8) Supondo que a chegada de cada caminhão represente uma receita de R$ 300,00, qual a receita esperada para um período de 30 dias ?

9) Um dado é lançado após o lançamento de uma moeda. Qual a probabilidade de:a) obter uma “cara” e um número par ?b) obter uma “cara” ou um número par ?c) obter um número par, se o resultado anterior foi uma “cara” ?

10) Um dado é lançado cinco vezes. Qual a probabilidade de obter três “quatro” ?11) Uma urna contém quatro bolas brancas e seis bolas pretas. São retiradas quatro bolas. Seja X a v.

a. que representa o número de bolas brancas retiradas. Construir uma tabela para a função de probabilidade de X.

12) Um dado é lançado duas vezes. Qual a probabilidade de obter:a) Um “dois” e um “três” ?b) Um “três” no segundo lançamento após a ocorrência de um “dois” no primeiro

lançamento ?

13) Com relação a um certo modelo de automóvel verificou-se que a taxa de roubos, no ano anterior, foi de 5%. A taxa de envolvimento em acidentes foi de 7%. Se o veículo custa R$ 25000,00 , quanto deve ser cobrado por um seguro contra roubo e acidentes, de modo que o valor seja “justo”?

14) Em um lote de 20 motores há dois defeituosos. Para fazer a inspeção de qualidade são testadas três unidades de cada lote. Se mais de uma unidade defeituosa for encontrada, o lote é rejeitado. Qual a probabilidade de que o lote seja aceito ?

5 – Distribuições de Probabilidade Discreta

5.01 – Distribuição Binomial

Seja um experimento aleatório com as seguintes propriedades:1) A cada observação há somente dois resultados possíveis, denominados sucesso e fracasso. 2) As observações constituem eventos independentes, isto é, o resultado de uma observação não

influencia o resultado da observação subseqüente.

3) A probabilidade de sucesso, representada por p, não se altera.

Um experimento aleatório com as referidas propriedades é denominado Experimento de Bernoulli4.

Seja um experimento de Bernoulli realizado n vezes, com probabilidade p de “sucesso”, e seja X a v.a. discreta que representa o número de “sucessos”. Então a probabilidade de k “sucessos” é dada por

(5.01)

Exemplo 5.01: A pnc de um produto é igual a 4%. Em uma caixa com dez unidades deste produto, qual a probabilidade de que:

a) três estejam fora de conformidade ?b) no máximo duas estejam fora de conformidade ?c) mais de duas estejam fora de conformidade ?

Exemplo 5.02: Suponha que o fabricante do produto acima deva pagar uma multa de R$ 5,00 por caixa com mais de uma unidade não conforme. Qual o montante das multas para 20 caixas ?

Exemplo 5.03: Suponha agora que as caixas, cada uma com dez unidades, do produto acima sejam acondicionadas em pacotes com cinco caixas. Qual a probabilidade de que um pacote contenha duas caixas com mais de uma unidade fora de conformidade ?

5.01.01 – Propriedades da Distribuição Binomial

A média e a variância da distribuição binomial são dadas respectivamente por

(5.02)

(5.03)

5.02 – Distribuição de Poisson5

Sejam X, uma v. a. discreta que assume seu valores em um intervalo contínuo 6, e , um experimento aleatório com as seguintes propriedades:

1) O número de “sucessos” em um intervalo independe do número de “sucessos” em qualquer outro intervalo disjunto.

2) A probabilidade de ocorrência de um “sucesso” em um dado intervalo é proporcional ao comprimento do mesmo e independente do número de “sucessos” fora deste mesmo intervalo.

3) A probabilidade de ocorrência de mais de um sucesso em um intervalo muito pequeno é desprezível.

Um experimento aleatório com as propriedades acima é denominado Experimento de Poisson.

Seja X a v. a. que representa o número de ocorrências (“sucessos”) de um evento em um Experimento de Poisson. A distribuição de probabilidade de X é dada por

(5.04)

4 Jacques Bernoulli (1654 – 1705). Matemático suíço.5 Siméon Poisson (1781 – 1840) . Matemático francês.6 Número de falhas por hora; número de defeitos por metro quadrado; quantidade de passageiros por dia; etc.

onde é o número médio de ocorrências no intervalo considerado.

Exemplo 5.09: Um caixa eletrônico atende em média dez clientes em oito horas. Qual a probabilidade de atender cinco clientes em quatro horas ?

Exemplo 5.10: No exemplo anterior, qual a probabilidade de serem atendidos no mínimo dois clientes em 2 horas ?

5.05.01 – Propriedades da Distribuição de Poisson

A média e a variância da distribuição de Poisson são dadas respectivamente por

(5.05) (5.06)

5.03 – Distribuição Geométrica

Seja um experimento de Bernoulli repetido até a ocorrência do primeiro sucesso, com probabilidade p. Seja X a variável aleatória que representa o número de realizações necessárias. Então

(5.07)

Exemplo 5.06: A taxa de rejeição no processo de fabricação de um certo produto é de 40%. Qual a probabilidade de se ter que produzir 5 unidades para obter uma aceitável ?

Exemplo 5.07: No exemplo acima, qual a probabilidade de se ter que produzir mais de 3 unidades até a obtenção de uma aceitável ?

5.03.01 – Propriedades da Distribuição Geométrica

A média e a variância da distribuição geométrica são dadas respectivamente por

(5.08)

(5.09)

5.04 – Distribuição de Pascal

Seja um experimento de Bernoulli, com probabilidade p de sucesso, repetido de forma independente até que se consigam n sucessos. Seja X a variável aleatória que representa o número de realizações necessárias. Então

(5.10)

Exemplo 5.08: Em um processo de fabricação há um índice de aceitação de 70%. Qual a probabilidade de se ter que produzir 10 unidades para obter 6 conformes ?

Exemplo 5.09: No exemplo acima, qual a probabilidade de se ter que produzir no máximo 10 unidades para obter 7 conformes ?

5.04.01 – Propriedades da distribuição de Pascal

A média e a variância da distribuição de Pascal são dadas respectivamente por

(5.11)

(5.12)

5.05 – Distribuição Hipergeométrica

Seja um conjunto com N elementos, dos quais w apresentam determinada propriedade. Seja uma amostra com n elementos, extraída do conjunto acima (n N). Seja X a variável aleatória que representa o número de elementos da amostra com a mencionada propriedade. Então

(5.13)

Exemplo 5.10: Um lote de 10 unidades de um componente contém 3 defeituosos. Qual a probabilidade de que uma amostra de 6 unidades, extraída deste lote, contenha 2 defeituosas ?

Exemplo 5.11: No exemplo anterior, qual a probabilidade de que a amostra contenha no mínimo uma unidade defeituosa ?

5.05.01 – Propriedades da Distribuição Hipergeométrica

A média e a variância da distribuição hipergeométrica são dadas respectivamente por

(5.14)

(5.15)

5.06 – Distribuição Multinomial

Seja um experimento com n resultados mutuamente exclusivos, com probabilidades p1 , ... , pn .Sejam X1 , ... , Xn as ocorrências de cada um dos n resultados, respectivamente. Então

(5.16)

OBS: .

Exemplo 5.12: Das unidades produzidas por um certo processo de fabricação, 80% são conformes, 15% reaproveitáveis e 5% rejeitadas. Em um lote de 10 unidades, qual a probabilidade de se encontrar 7 conformes, 2 reaproveitáveis e 1 rejeitada ?

5.06.01 – Propriedades da Distribuição Multinomial

A média e a variância para cada um dos n resultados são dadas respectivamente por

(5.17)

(5.18)

5.06 – Exercícios

1) Um produto, cuja p.n.c. é igual a 7%, é comercializado em caixas com 20 unidades. Os clientes rejeitam qualquer caixa que contenha mais de uma unidade não conforme. Qual a probabilidade de que uma caixa seja rejeitada ?

2) Supondo que, no exercício anterior, o fabricante tenha um custo de R$ 2,00 por caixa devolvida, qual o custo total esperado para uma encomenda de 1000 caixas ?

3) Um equipamento costuma apresentar uma falha a cada dez horas de trabalho. Qual a probabilidade de apresentar:

a) Uma falha em duas horas ?b) Mais de uma falha em duas horas ?c) Duas falhas em cinco horas ?

4) Em um lote de 15 unidades de um certo produto há três defeituosas. Qual a probabilidade de que uma amostra de três unidades apresente todas com defeito ?

5) A p.n.c. de um produto é igual a 5%. Qual a probabilidade de que um lote com dez unidades contenha três não conformes ?

6) A taxa de cancelamento de passagens verificada por empresa é igual a 15%. Para evitar que um avião, com capacidade para 30 passageiros, decole com assentos vazios, a empresa aceita até 33 reservas. Qual a probabilidade de que haja excesso de lotação (“overbooking”) ?

7) Uma empresa utiliza o Controle Estatístico de Processo (CEP) na fabricação de um certo componente mecânico. Para tanto, são tomadas amostras periódicas a fim de verificar possíveis variações nos valores controlados. No processo de fabricação do componente em questão, a probabilidade de que uma variação não seja detectada em uma amostragem é de 15%. Qual a probabilidade de que o problema seja detectado apenas na décima amostragem ?

8) Um posto de gasolina atende em média seis carros por hora. Qual a probabilidade de atender cinco carros em trinta minutos ?

9) Um aeroporto registra em média seis aterrissagens num período de doze horas. Qual a probabilidade de registrar duas aterrissagens em uma hora ?

10) Um empresa fabrica placas de madeira compensada que são comercializadas em lotes de 20 unidades. Cada placa apresenta em média uma imperfeição. Um cliente desta empresa admite que uma placa possua no máximo duas imperfeições. Qual a probabilidade de:

a) uma placa ser recusada pelo cliente ?b) um lote ter no máximo cinco placas rejeitadas ?

11) Uma administradora de planos de saúde verificou que, para determinada faixa etária, a taxa mensal média de utilização de consultas médicas pelos clientes é de 25%. A mensalidade é calculada de modo a permitir até dez consultas por mês. Se o número de consultas ultrapassar este limite a administradora terá prejuízos. Supondo que cada cliente possa solicitar uma consulta mensal, qual a probabilidade de que a administradora tenha prejuízo em um grupo de vinte pacientes ?

12) Um produto, que apresenta p.n.c. igual a 5%, é embalado em pacotes com 25 unidades. Estes pacotes são acondicionados em caixas com 30 pacotes. Um pacote é rejeitado se apresentar mais de uma unidade fora de conformidade. Qual a probabilidade de uma caixa apresentar:

a) nenhumb) umc) doisd) mais de dois

pacote(s) rejeitado(s) ?13) Supondo que o fabricante do produto mencionado no exercício anterior deva indenizar os

clientes em R$ 2,50 por pacote rejeitado, qual o montante esperado com indenizações em uma encomenda de 200 pacotes ?

14) Entre os candidatos a um certo cargo, 15% possuem as qualificações exigidas pela empresa contratante. Em um grupo de 15 candidatos qual a probabilidade de que cinco possuam os requisitos necessários à contratação ?

15) Uma fábrica de autopeças adquire chapas de aço em bobinas de 20m. Cada bobina apresenta em média duas imperfeições. Para seu uso a indústria corta as bobinas em segmentos de 2 m de comprimento. Um segmento só é aprovado na inspeção de qualidade se não apresentar nenhuma imperfeição. Qual a probabilidade de um segmento ser rejeitado ?

16) Por um cruzamento passam em média 5 carros por minuto. Qual a probabilidade de não passar nenhum carro durante 30 segundos ?

17) No exercício acima, qual a probabilidade de passarem dez carros em dois minutos ?

18) Em uma indústria a p.n.c. de um produto é igual a 5%. Em um lote de vinte unidades, qual a probabilidade de:

a) nenhuma ser defeituosa ?b) duas serem defeituosas ?c) no mínimo três serem defeituosas ?

19) Uma distribuidora de gás utiliza para entregas uma caminhonete com capacidade para vinte botijões. Normalmente 10% dos clientes da rota não fazem nenhuma compra. Se há 25 clientes na rota, qual a probabilidade de que a caminhonete deva fazer entregas extraordinárias ?

20) A taxa de respostas a um formulário enviado pelo correio é igual a 10%. Para um lote de 25 formulários, qual a probabilidade de se obter:

a) nenhuma resposta ?b) duas respostas ?c) cinco respostas ?d) mais de duas respostas ?

21) No exercício acima, qual o número esperado de respostas ?22) Ainda com relação ao exercício 28, se cada formulário custa R$ 3,00, qual o custo esperado com

formulários não respondidos ?23) Um aluno acredita saber metade da matéria avaliada em um exame. Se o exame é formado por

dez questões, cada uma valendo um ponto, e a nota mínima para aprovação é cinco, qual a probabilidade que o aluno tem de ser aprovado ?

24) Uma seguradora apurou que 5% dos clientes com um certo perfil envolvem-se em acidentes. Em um grupo de 30 clientes com o referido perfil, qual a probabilidade de que:

a) nenhum se envolva em acidente ?b) um se envolva em acidente ?c) cinco se envolvam em acidente ?

25) Uma linha de produção apresenta em média cinco falhas a cada 100 horas de trabalho. Qual a probabilidade de apresentar duas falhas em 20 horas de trabalho ?

26) Uma linha de montagem trabalhando continuamente costuma apresentar quatro falhas em cada turno de 24 horas. Cada falha acarreta um interrupção média de 15 minutos. Ao receber uma encomenda que demanda 36 horas de trabalho, a administração determina um prazo de 38 horas. Qual a probabilidade de que este prazo seja insuficiente ?

27) Uma empresa adquire um certo componente de três fornecedores. O fornecedor X é responsável por 40% das entregas, enquanto os fornecedores Y e Z respondem cada um por 30%. Em um lote de dez unidades do referido componente, qual a probabilidade de que quatro tenham sido entregues por X, três tenham sido entregues por Y e três tenham sido entregues por Z ?

28) Em um fábrica de automóveis verificou-se que cada veículo pronto apresenta em média quatro defeitos. Qual a probabilidade de um veículo apresentar no máximo três defeitos ?

29) No exercício anterior, qual a probabilidade de um veículo apresentar no mínimo três defeitos ?30) Ainda com relação ao exercício 28, qual a probabilidade de que, em dez veículos, quatro

apresentem no máximo dois defeitos cada um ?31) No processo de fundição de uma certa peça, 35% das unidades produzidas são rejeitadas. A

empresa recebe uma encomenda de seis unidades da referida peça. Qual a probabilidade de se ter que produzir dez unidades para atender a encomenda ?

32) Uma remessa de 20 motores contém dois defeituosos. Qual a probabilidade de que uma amostra de cinco unidades contenha:

a) Nenhum motor defeituoso ?b) Um motor defeituoso ?

6 – Distribuições de Probabilidade Contínua

6.01 – Distribuição NormalDiz-se que uma v. a. contínua X tem distribuição normal com média e variância 2, o que se

representa por X ~ N( , 2), quando a sua função densidade de probabilidade é dada por

(6.01)7

Figura 6.1 – Gráfico da Distribuição Normal

A curva normal, também chamada Gaussiana, tem área total igual a um, e é simétrica em relação ao eixo vertical. A probabilidade de que o valor de X esteja entre a e b, P(a X b), correspondente à área (Fig. 6.2) abaixo da curva limitada pelas retas X = a e X = b, é dada por

(6.02)

a bFigura 6.2

É possível demonstrar que os intervalos( - , + )

( - 2 , + 2 )( - 3 , + 3 )

compreendem, respectivamente, 68,27% , 95,45% e 99,73% da área total da curva, conforme mostrado na figura 6.3.

7 exp( X ) = eX.

68,27%

99,45%

99,73%

Figura 6.3

6.01.01 – Distribuição Normal Padronizada

Seja z a variável reduzida definida como

(6.03)

então z tem distribuição normal com média igual a 0 e variância igual a 1. A f.d.p. de z é dada por

(6.04)

O gráfico para f(z) tem a forma da figura 6.4. A probabilidade de que X assuma um valor entre a e b corresponde à área limitada pela curva e pelas retas z = z1 e z = z2 , conforme a figura 6.5.

0Figura 6.4 – Gráfico da Distribuição Normal Padronizada

z1 z2

Figura 6.5As áreas limitadas pela curva normal e pelas retas z = z1 e z = z2 podem ser calculadas com o

auxílio da tabela dada no apêndice I.

Exemplo 6.1 – Seja X uma v. a. contínua, normalmente distribuída, com média igual a 20 e variância igual a 4. Calcular a probabilidade de:

a) P(18 X 21)

b) P(19 X)

c) P(X 18)

d) P(X 23)

e) P(25 X)

f) P(21 X 24)

g) P(17 X 19)

Exemplo 6.2 – Uma máquina empacotadora embala um produto em pacotes cujo peso médio é igual a 500 g, e cujo desvio padrão é igual a 20 g. Qual a probabilidade de um pacote apresentar peso igual a:

a) No mínimo 510 g ?b) No máximo 520 g ?c) No mínimo 495 g e no máximo 520 g ?d) No máximo 495 g ?e) No mínimo 490 g e no máximo 495 g ?f) No mínimo 500 g e no máximo 515 g ?

Exemplo 6.3 – Sejam os pacotes embalados pela máquina do exemplo anterior. Um cliente rejeita todos os pacotes com menos de 495 g. Quantos pacotes de uma encomenda de 10000 serão rejeitados ?

Exemplo 6.4 – Para quanto deve ser ajustado o peso médio dos pacotes dos exemplos anteriores para que a percentagem de rejeição seja reduzida à metade ? O desvio padrão também deve ser alterado ? Por quê ?

Exemplo 6.5 – Uma indústria produz tubos de concreto com diâmetro médio igual a 900 mm e desvio padrão igual a 15 mm. Os tubos são vendidos de acordo o diâmetro, de acordo com a tabela abaixo. Qual o faturamento esperado para uma produção mensal de 5000 unidades ?

Diâmetro (mm) Preço Unitário (R$)Abaixo de 895 8,50De 895 a 910 12,30Acima de 910 6,50

Exemplo 6.6 – Um comprador dos tubos do exemplo anterior está rejeitando 8% das unidades adquiridas, sob a alegação de que o diâmetro excede o seu limite superior de especificação. Quanto vale esta especificação ?

6.01.02 – Aproximação da Distribuição Binomial pela Distribuição Normal

Seja um experimento de Bernoulli, conforme descrito em 5.01. Quando o número de observações é muito grande, o cálculo da probabilidade de ocorrência de um evento pode ser impraticável. Neste caso pode-se efetuar a aproximação da distribuição binomial pela distribuição normal.

Seja X o número de ocorrências (“sucessos”) em n observações. A probabilidade de X pode ser calculada conforme os passos mostrados a seguir:

1) Efetuar a “correção de continuidade” para X. Isto significa: a) adicionar 0,5 a X quando se desejar um número de ocorrências igual, ou inferior, a X.b) subtrair 0,5 de X quando se desejar um número de ocorrências igual, ou superior, a X.

2) Calcular a média e a variância, dadas respectivamente por

(6.05) (6.06)

3) Calcular o escore reduzido, z (fórmula 6.03).4) Calcular a probabilidade com o auxílio da tabela do apêndice I.

6.02 – Distribuição Exponencial

Seja um experimento de Poisson, com parâmetro , conforme definido em 5.05. Seja T o comprimento do intervalo entre duas ocorrências de um determinado evento, como o tempo decorrido entre duas falhas, p. ex., ou o comprimento do intervalo até a primeira ocorrência. A v. a. T é contínua e tem função densidade de probabilidade dada por

(6.05)

A fórmula acima dá o comprimento do intervalo até a próxima, ou primeira, ocorrência.

Exemplo 6.7 – Um aeroporto recebe em média dez aviões a cada oito horas. Após a aterrissagem de uma aeronave, qual a probabilidade de que a próxima chegue em no máximo:

a) uma hora ?

b) 30 minutos ?

Para calcular a probabilidade de que um evento ocorra após um instante t pode-se utilizar a fórmula

(6.07)

Exemplo 6.8 – Um terminal portuário recebe em média dois navios por semana (cinco dias úteis). Após a chegada de um navio, qual a probabilidade de que se passem dois dias até a chegada do próximo ?

6.02.01 – Propriedades da Distribuição Exponencial

A média e a variância da distribuição exponencial são dadas, respectivamente, por

(6.08)

(6.08)

6.03 – Exercícios

1) Um determinado componente tem duração de vida média igual a 2500 horas, com desvio padrão de 150 horas. Calcular a probabilidade de uma unidade selecionada aleatoriamente durar:

a) no máximo 2550 horasb) no mínimo 2450 horas.c) no mínimo 2400 e no máximo 2700 horas.d) no mínimo 2700 horas

2) Supondo que o fabricante do componente acima deva pagar uma indenização de R$ 35,00 para cada unidade com duração de vida inferior a 2400 horas, qual o montante com indenizações para um lote de 1000 unidades ?

3) Se o componente dos exercícios anteriores é embalado em caixas com dez unidades, qual a probabilidade de que uma caixa contenha no máximo três unidades com duração de vida inferior a 2700 horas ?

4) O cliente de uma indústria de parafusos rejeita 10% das unidades entregues, alegando que os diâmetros estão abaixo do limite inferior de especificação. Outros 4% são rejeitados sob a alegação de que os diâmetros estão acima do limite superior de especificação. Se o diâmetro médio dos parafusos é igual a 12 mm, e o desvio padrão igual a 0,5 mm, quais são os limites de especificação do cliente ?

5) Os limites de especificação para o diâmetro de um tipo de eixo são 105 0,6 mm. Se o diâmetro médio é igual a 105 mm, e o desvio padrão igual a 1 mm, qual a proporção de não conformidade ?

6) Um equipamento é dotado de quatro unidades de um componente. A duração de vida média deste componente é igual a 1000 horas, com desvio padrão de 120 horas. Qual a probabilidade de pelo menos duas unidades funcionarem no mínimo 1200 horas cada um ?

7) Um terminal de descarga recebe em média seis caminhões num período de doze horas. A operação requer 20 minutos. Qual a probabilidade de não haver formação de fila ?

8) A p.n.c. de um componente é igual a 10%. Em uma remessa de 500 unidades, qual a probabilidade de que no mínimo 450 sejam consideradas “conformes”?

9) Em uma oficina, o tempo para a realização de um conserto em um equipamento é normalmente distribuído, com média igual a 40 minutos e variância igual a 25. A gerência informa que o equipamento estará disponível em uma hora. Se o serviço é iniciado 15 minutos após a entrada do equipamento, qual a probabilidade de que o prazo não seja suficiente ?

10) As bobinas de aço produzidas por uma siderúrgica têm comprimento de 50 m, e apresentam em média 3 imperfeições cada uma. Ao se desenrolar uma bobina, qual a probabilidade de que a primeira imperfeição apareça após os primeiros 10 m ?

7 – Estimação de Parâmetros

7.01 – Conceitos

O termo parâmetro origina-se da língua grega, para (ao lado) + metron (medida). Um parâmetro é representado geralmente por uma letra grega. Em Estatística é usado para designar uma grandeza mensurável, que caracteriza uma população. Como exemplo de parâmetros pode-se citar a média ( ) e a variância ( 2 ) . Na prática é comum que os parâmetros de uma população sejam desconhecidos. Nestes casos os valores dos parâmetros são determinados através de um processo conhecido como estimação. Um estimador, do latim aestimare (avaliar), é um valor característico de uma amostra, de tamanho n, extraída de uma população, de tamanho N, sobre a qual deseja-se tirar alguma conclusão. Os estimadores são representados por letras latinas e, algumas vezes, são designados por estatísticas. Exemplos de estimadores são a média amostral ( ) e a variância amostral (s2), que foram estudados nos capítulos 1 e 2, respectivamente.

A principal finalidade da estimação de parâmetros é o estudo de uma população com base em valores obtidos a partir de uma amostra extraída da mesma.

População Amostra

Medida Parâmetro EstimadorMédia

Variância 2 s2

Desvio padrão sProporção p

Quadro 7.01 – Parâmetros e estimadores

Um estimador é considerado eficiente quando apresenta as seguintes propriedades:

1) É não viciado, ou “não tendencioso”. Seja S o estimador de um parâmetro . Neste caso a média de S deve ser igual ao parâmetro . Isto é

E( S ) = 2) Deve possuir mínima variância.

3) Deve ser consistente. Isto significa que, a medida que o tamanho da amostra ( n ) aumenta, a diferença entre o estimador e o parâmetro diminui.

4) Deve ser suficiente, isto é, deve ser função de uma estatística que resuma o máximo possível de informações a respeito do parâmetro.

Um estimador que reúna as duas primeiras características é referido como sendo “uniformemente não-viciado de variância mínima” (UNVM). A média e a variância amostrais são exemplos de estimadores UNVM.

7.02 – Distribuição Amostral

Seja uma população, de tamanho N, da qual são extraídas todas as possíveis amostras, todas de tamanho n. Seja o parâmetro que se deseja estimar. Se, para cada uma das possíveis amostras, for

2 s2

calculado o estimador S, ou , obtém-se um conjunto de valores denominado distribuição amostral do estimador em questão.

7.03 – Distribuição Amostral da Média (DAM)

É a distribuição de probabilidade para os possíveis valores das médias das amostras de tamanho n.

Exemplo 7.01 – Seja a população constituída dos números { 2 , 3 , 5 , 7 }.a) Extrair todas as possíveis amostras de tamanho n = 2 , com reposição.b) Calcular a média de cada amostra.c) Calcular a média populacional.d) Calcular a média da distribuição amostral da média (DAM)e) Calcular o desvio padrão populacional.f) Calcular o desvio padrão da distribuição amostral da média (DAM).g) Comparar as médias encontradas em ( c ) e ( d ).h) Comparar os desvios padrões encontrados em ( e ) e ( f ).

a) Neste caso N = 4 (tamanho da população), e n = 2 (tamanho das amostras). Os valores encontrados são mostrados no quadro 7.02, a seguir.

Número da amostra ( i ) Amostra ( a ) Média ( b )

1 2 , 2 2,02 2 , 3 2,53 2 , 5 3,54 2 , 7 4,55 3 , 2 2,56 3 , 3 3,07 3 , 5 4,08 3 , 7 5,09 5 , 2 3,510 5 , 3 4,011 5 , 5 5,012 5 , 7 6,013 7 , 2 4,514 7 , 3 5,015 7 , 5 6,016 7 , 7 7,0

Quadro 7.02 – Médias amostrais

c) A média populacional é dada por =

d) A média da DAM é dada por =

e) O desvio padrão populacional é dado por =

f) O desvio padrão da DAM é dado por =

g) Comparação das médias:

h) Comparação dos desvios padrões:

Conclusão:

7.04 – Estimação por Ponto:

Também denominada Estimação Pontual, consiste em apresentar como estimador para um dado parâmetro um valor numérico único. Isto significa, por exemplo, estimar a média populacional como igual a . Este procedimento, embora não seja incorreto, apresenta, contudo, um sério inconveniente: o estimador pode não ser um valor suficientemente próximo do valor do parâmetro. Este fato pode comprometer seriamente a qualidade do estimador.

7.05 – Estimação por Intervalos de Confiança:

Também denominada Estimação Intervalar, consiste em determinar um intervalo numérico. A este intervalo está associada uma probabilidade () de que o mesmo contenha o valor efetivo do parâmetro estimado. A referida probabilidade é denominada “Nível de Confiança”. O valor (1 - ) também é conhecido como “Margem de Erro”.

7.05.01 – Níveis de Confiança e Valores Críticos:

Para uma distribuição normal há uma probabilidade de 68,27% de que o valor do parâmetro pertença ao intervalo ( - ; + ). Para os intervalos dados por ( - 2 ; + 2 ) e ( - 3 ; + 3 ) as probabilidades são, respectivamente, 95,45% e 99,73%. Estas probabilidades são os níveis de confiança para os respectivos intervalos. Os valores 1 , 2 e 3 são denominados “valores críticos”.

Os principais níveis de confiança, e os respectivos valores críticos, adotados na prática são apresentados no quadro 7.03, adiante.

Nível de Confiança () 0,99 0,95 0,90 0,80Valor Crítico (zc) 2,58 1,96 1,65 1,28Quadro 7.03 – Níveis de Confiança e Valores Críticos

7.06 – Intervalos de Confiança para a Média

A primeira providência a ser tomada na construção de um intervalo de confiança para estimar a média é verificar se o desvio padrão populacional ( ) é conhecido. Se a resposta for positiva, os valores críticos são tomados com base na Distribuição Normal, sendo os valores do quadro 7.03 os mais utilizados na prática. Os limites do intervalo são

(7.01)

para amostragem com reposição, e

(7.02)

para amostragem sem reposição, onde N é o tamanho da população.Quando o desvio padrão populacional é desconhecido, o que se nota com mais freqüência na

prática, não é aconselhável o uso da Distribuição Normal. Para estes casos a distribuição mais apropriada é a Distribuição t, de Student, que será estudada adiante.

Exemplo 7.02: Uma amostra de 50 rolamentos produzidos por uma indústria apresentou diâmetro médio igual a 92,0 mm. O desvio padrão verificado para o processo é igual a 0,6 mm. Determinar um intervalo de 95% de confiança para a o diâmetro médio dos rolamentos produzidos pela indústria.

n = = = zc =

Exemplo 7.03: Em uma cidade há 3500 famílias. Sabe-se que o desvio padrão da renda familiar é igual a 3,5 SM. Uma amostra de 150 famílias apresentou renda familiar média igual a 9,7 SM. Determinar um intervalo de 90% de confiança para a renda familiar média desta cidade.

N = n = = = zc =

7.06.01 – Comentários

Nos dois exemplos acima o desvio padrão populacional ( ) é conhecido. Como deve ser do conhecimento do estudante, para a determinação deste valor deve-se conhecer a média. Neste caso, como explicar que se conheça o valor do desvio padrão sem que o valor da média seja conhecido ? Considere-se, por exemplo, uma máquina empacotadora. Os pacotes embalados pela referida máquina apresentam um peso médio ( ) e um desvio padrão ( ). Se a regulagem da máquina for alterada, o peso de cada pacote será alterado. Esta nova regulagem acarretará uma alteração no peso médio, mas não no desvio padrão, conforme é possível verificar pelas propriedades da média e do desvio padrão. Nestas condições o intervalo de confiança terá como finalidade estimar o novo peso médio, já que o desvio padrão permanecerá o mesmo.

7.07 – Intervalos de Confiança para a Proporção

Seja p a proporção de “sucessos” em uma população. Um caso que pode ser tomado como exemplo é a proporção de não conformidade (p.n.c.), que representa a percentagem de unidades defeituosas. Neste caso a distribuição envolvida é a Binomial. Entretanto, como as populações, e também as amostras, costumam ter um tamanho considerável, é utilizada a aproximação da distribuição Binomial pela distribuição Normal, conforme visto em 6.01.02. Seja uma amostra de tamanho n, para a qual é calculada a proporção amostral ( ). Desta forma, o intervalo de confiança para a proporção populacional ( p ) é dado por

(7.03)

quando a amostragem é feita com reposição, e

(7.04)

quando a amostragem é feita sem reposição, onde N é o tamanho da população.

Nas fórmulas acima considera-se que a variância populacional é desconhecida.

Exemplo 7.04: Uma amostra de 50 unidades de um certo componente apresentou 4 não conformes. Determinar um intervalo de 95% de confiança para a p.n.c. deste componente.

n = = zc =Exemplo 7.05: Uma empresa emprega 300 funcionários. Uma pesquisa junto a 40 funcionários mostrou que 15 estão propensos a aceitar um novo plano de cargos e salários. Determinar um intervalo de 99% de confiança para a proporção de aceitação do novo plano entre os funcionários.

N = n = = zc =

7.08 – Distribuição t, de Student8

Conforme já foi mencionado, a Distribuição Normal só pode ser aplicada quando a variância populacional é conhecida. Se esta condição não é verificada, o uso da referida distribuição não é recomendado, sob pena de comprometer a confiabilidade dos resultados. A estatística t é definida como

8 Pseudônimo do matemático inglês William Gosset, que não podia publicar seus trabalhos usando o próprio nome.

(7.05)

Diz-se que a variável aleatória t acima tem “Distribuição t, de Student” com (n – 1) graus de liberdade. A função densidade de probabilidade desta variável é dada por

(7.06)

onde (n) = (n – 1) ! e ( ½ ) = . Quando n a distribuição t aproxima-se da Distribuição Normal.

Os valores de t para diferentes graus de liberdade são dados por uma tabela apropriada, a exemplo dos valores para a Distribuição Normal.

7.08.01 – Intervalo de Confiança para a Média, Usando a Distribuição t, de Student

Quando a variância populacional é desconhecida o intervalo de confiança para a média é dado por

(7.07)

onde tc é calculado para (n – 1) graus de liberdade.

Exemplo 7.06: Uma amostra de 20 tubos de concreto apresentou média igual a 275 mm e desvio padrão igual a 2 mm. Determinar um intervalo de 95% de confiança para o diâmetro médio.n = = s = tc =

7.09 – Intervalo de Confiança para a Diferença de duas Médias

Sejam duas amostras, uma de tamanho n1, extraída de uma população com média 1, e outra de tamanho n2 , extraída de uma população com média 2, sendo ambas as médias desconhecidas e as variâncias populacionais, 1

2 e 22.

Sejam duas amostras nas condições acima. Então o intervalo de confiança para a diferença das médias populacionais é dado por

(7.08)

onde Sp é a “variância ponderada”, calculada por

(7.09)

onde tc é calculado para (n1 + n2 – 2) graus de liberdade.

Exemplo 7.07: Uma amostra de 50 lâmpadas de uma certa marca apresentou duração de vida média igual a 1750 horas, com desvio padrão igual a 245 horas. Outra amostra, de 60 lâmpadas de uma outra marca, apresentou duração de vida média igual a 1698 horas, com desvio padrão igual a 197 horas. Determinar um intervalo de 95% de confiança para a diferença entre as durações de vida médias das lâmpadas das duas marcas.

7.10 – Intervalo de Confiança para a Diferença de Duas Proporções

Sejam duas amostras, uma de tamanho n1, extraída de uma população com proporção p1 de “sucessos”, e outra de tamanho n2, extraída de uma população com proporção p2 de “sucessos”. Então o intervalo de confiança para a diferença (p1 – p2) é dado por

(7.10)

onde

(7.11)

Exemplo 7.08: Uma amostra, de 50 mancais produzidos por uma máquina apresentou 3 fora de conformidade. Outra amostra, de 70 mancais produzidos por uma segunda máquina, apresentou 5 fora de conformidade. Construir um intervalo de 95% para estimar a diferença entre as p.n.c.’s .

7.10.01 – Comentários:

Ao se construir um intervalo de confiança para a proporção, pode-se obter para o limite inferior um valor negativo. Neste caso pode-se interpreta-lo como 0 (zero). Para a diferença de duas proporções não há necessidade de considerar o valor negativo como 0 (zero).

7.11 – Tamanho Mínimo da Amostra

Para a estimação da média o tamanho mínimo da amostra deve ser calculado por

(7.12)

onde:zc = valor crítico correspondente ao nível de confiança desejado. = desvio padrão populacional, ou seu estimador ( s ). = erro bilateral admitido.

Exemplo 7.09: Uma injetora produz garrafas com diâmetro médio igual a 145 mm e desvio padrão igual a 0,6 mm. Após uma modificação no equipamento, deseja-se estimar o novo diâmetro médio. O nível de confiança desejado é de 95% e o erro admitido é de 0,2 mm, para mais ou para menos (tolerância bilateral). Qual deve ser o tamanho mínimo da amostra?

= zc = =

Para a estimação da proporção populacional p o tamanho mínimo da amostra é dado por

(7.13)

Exemplo 7.10: Deseja-se estimar a p.n.c. de um componente produzido por uma certa máquina. O nível de confiança necessário é igual a 95%, e a tolerância (bilateral) admitida é de 0,02, ou 1%. Qual deve ser o tamanho da amostra ?

7.12 – Exercícios

1) Uma amostra de 60 pneus apresentou duração média igual a 45000 km, com desvio padrão igual a 4550 km. Determinar um intervalo de 95% de confiança para estimar a duração média.

2) Uma pesquisa sobre renda familiar em uma certa localidade apresentou os valores mostrados na distribuição de freqüências abaixo. Determinar um intervalo de 90% de confiança para a renda familiar média.

Renda (SM) Famílias1 – 5 125 – 9 209 – 13 3813 – 17 1817 – 21 821 – 25 4

3) Uma amostra de 30 unidades de um certo produto apresentou 2 fora de conformidade. Determinar um intervalo de 95% de confiança para a p.n.c. do mesmo.

4) Sabe-se que o salário de uma determinada categoria tem desvio padrão igual a R$ 220,00. Uma pesquisa junto a 150 trabalhadores apresentou salário médio igual a R$ 458,00. Construir um intervalo de 90% de confiança para o salário médio da categoria.

5) Uma viga, fabricada com determinada liga metálica, apresenta tensão de ruptura média igual a 45 kgf/mm2, com desvio padrão igual a 7 kgf/mm2. Uma amostra de 40 unidades, tomada após uma modificação no processo de fabricação, mostrou tensão de ruptura média igual a 46,8 kgf/mm 2. Determinar um intervalo de 99% de confiança para a tensão de ruptura média da viga após a modificação.

6) Uma amostra de 45 garrafas de cerveja apresentou conteúdo médio igual a 355 ml, e desvio padrão igual a 2 ml. Uma outra amostra, de 60 garrafas de cerveja de outra marca, apresentou conteúdo médio igual a 356 ml, e desvio padrão de 3,5 ml. Determinar um intervalo de confiança de 95% para a diferença das duas médias.

7) Uma pesquisa junto a 150 eleitores de uma região mostrou que 87 estão propensos a votar em um determinado candidato a prefeito. Construir um intervalo de 95% de confiança para a proporção de votos a favor do referido candidato.

8) Deseja-se estimar a renda média, em salários mínimos, das famílias de um certo bairro. Estima-se a variância populacional em 2,5. Deseja-se 95% de confiança e admite-se uma diferença de 1 SM. Qual deve ser o tamanho da amostra a ser coletada ?

9) Qual a diferença entre parâmetro e estimador ?

10) Quais a características de um estimador eficiente ?

11) Em uma região estão instaladas 250 madeireiras. Um estudo efetuado junto a 50 destas empresas apontou faturamento médio mensal de R$ 87000,00 , com desvio padrão igual a R$ 6700,00. Determinar um intervalo de 90% de confiança para o faturamento médio mensal das empresas instaladas nesta região.

12) Uma pesquisa junto a 200 eleitores de certa localidade mostrou que 85 pretendem votar no candidato da situação, enquanto os demais preferem o candidato da oposição. Construir um intervalo de 95% de confiança para a diferença das proporções de votos para ambos os candidatos. OBS: Considerar n1 = n2 = 200.

13) Partindo dos resultados do exercício anterior, interpretar o termo “empate técnico”, ouvido com freqüência em períodos de eleição. Representar individualmente os intervalos encontrados.

14) Uma amostra de 100 moldes produzidos por um operário apresentou 4 não conformes. Uma segunda amostra, de 70 moldes produzidos por outro operário apresentou 3 não conformes. Construir um intervalo de 95% de confiança para a diferença das p.n.c.’s dos dois operários.

15) Um lote de bois foi submetido a uma dieta à base de milho e sais minerais. O ganho de peso observado é mostrado no quadro a seguir. Determinar um intervalo de 95% de confiança para o peso médio do rebanho. OBS: @ = arroba (15 kg)

Peso ( @ ) Animais18 – 20 820 – 22 1022 – 24 2024 – 26 2626 – 28 1828 – 30 1430 – 32 4

8 – Controle Estatístico de Processo (CEP)

8.01 – Conceitos

8.01.01 – Qualidade

O conceito de “qualidade” é extremamente subjetivo, variando de indivíduo para indivíduo. Todavia, não há como negar que o termo está diretamente relacionado à satisfação do cliente, ou usuário, de um produto, ou serviço. Uma das definições mais utilizadas na prática é dada a seguir:

“ Qualidade é a capacidade que um produto apresenta de superar as expectativas do cliente “

Em qualquer aplicação das técnicas estatísticas de controle da qualidade é imprescindível que se defina, em primeiro lugar, quais são os parâmetros de qualidade. Uma vez que se tenha isto em mente, os trabalhos subseqüentes deverão ter tal parâmetro como foco.

8.01.02 – Processo

O conceito mais frequëntemente adotado na prática é conhecido por 6 M’s , e envolve os seguintes elementos:

1) Material2) Mão de obra3) Máquina4) Meio ambiente5) Método6) Meio de medição

8.01.03 – Controle

É um conjunto de técnicas adotadas com objetivo de garantir que determinados padrões, previamente estabelecidos, sejam alcançados.

8.01.04 – Tolerância

É a maior diferença admitida entre um padrão estabelecido e um padrão alcançado. A tolerância pode ser:

8.01.04.01 – Bilateral: Quando admite tanto uma diferença positiva como negativa. O diâmetro de um eixo, por exemplo, pode ser especificado como 105 mm 0,3 mm. Neste caso admite-se que o diâmetro varie de 104,7 mm até 105,3 mm.

8.01.04.02 – Unilateral: Quando admite a diferença em apenas um sentido. No eemplo citado acima, a especificação poderia ser 105 mm + 0,3 mm. Neste caso qualquer unidade com diâmetro inferior a 105 mm seria rejeitada.

8.01.05 – Característico

É o termo usado para designar qualquer elemento que esteja sendo estudado na busca da qualidade. Assim, p. ex., o diâmetro de um eixo e o conteúdo de uma lata de refrigerante podem ser considerados característicos de qualidade.

8.01.06 – Variação

No controle estatístico de processo (CEP) as variações são classificadas como:

8.01.06.01 – Aleatórias: São as variações inerentes ao processo de fabricação. Este tipo de variação não pode ser eliminado. Neste caso o que se pretende é a manutenção de tais variações dentro de certos limites. Diz-se que um processo está “sob controle” quando as variações aleatórias estão dentro dos limites acima referidos.

8.01.06.02 – Causais: São as variações estranhas ao processo. A eliminação de tais variações é o principal objetivo do CEP.

8.01.07 – Técnicas

As principais técnicas usadas no CEP para estudo de problemas são:

8.01.07.01 – Princípio de Pareto9

Ao estudar a distribuição de renda em sua época, Pareto concluiu que a maior parte das riquezas era controlada pela minoria da população, cabendo à maioria a menor parcela das riquezas. Este princípio foi incorporado ao estudo da qualidade por J. M. Juran, que o sintetizou como “poucos vitais e muitos triviais”, referindo-se à ocorrência de defeitos. O princípio consiste em elaborar uma distribuição de freqüências para os problemas verificados, por exemplo, em um produto. Os problemas verificados são distribuídos de acordo com a freqüência, sempre em ordem decrescente.

Exemplo 8.01:Quadro 8.1 – Defeitos observados no produto X.

Defeito Freqüência Freqüência relativa (%)Risco na pintura 25 29,76

Porta desregulada 18 21,43Dobradiça solta 15 17,86

Mancal com folga 10 11,90Embalagem violada 6 7,15

Outros 10 11,90

O histograma correspondente é mostrado na figura 8.1, a seguir.

9 Vilfredo Pareto (1848 – 1923), economista italiano .

Figura 8.1

Com os dados da distribuição de freqüências é elaborado o “Diagrama de Pareto”, a partir das freqüências acumuladas crescentes, conforme é mostrado na figura 8.2.

Figura 8.2

8.01.07.02 – Diagrama Causa-Efeito

Também conhecido como “Gráfico Espinha de Peixe”, é usado sobretudo no exame das possíveis causas para uma problema. Tem a forma mostrada na figura 8.3, a seguir.

Máquina Mão de obra Matéria prima

Efeito

Meio de medição Meio ambiente Método

Figura 8.3 – Diagrama de Causa – Efeito

Exemplo 8.02: Construir um diagrama causa – efeito para estudar o problema “risco na pintura”, do exemplo anterior.

Máquina Mão de obra Matéria prima

Baixa Sem treino Baixa conformidade

PotênciaObsoleta Frágil

Efeito

Desregulado Difícil Escuro Difícil interpretação compreensão

Meio de medição Meio ambiente Método

Figura 8.4 – Diagrama de Causa – Efeito

8.01.07.03 – Gráfico de Controle

Também chamado “carta de controle”, é formado por três linhas paralelas ao eixo das abscissas. A intermediária é chamada “linha média” (LM). As outras duas são chamadas “limites de controle”. A região compreendida entre os limites de controle é chamada “zona de controle”. As regiões abaixo do limite inferior de controle (LIC) e acima do limite superior de controle (LSC) são denominadas “zonas de ação”. Quando usados de forma adequada os gráficos de controle proporcionam benefícios como:

1) Auxiliar os operadores a atingir e manter o controle de um processo.2) Proporcionar um linguagem comum para acompanhar a performance do processo.3) Ajudar a tornar o processo mais consistente e previsível.

A forma geral de um gráfico de controle é mostrada na figura 8.5, a seguir.

Medidas

LSC

Zona de controle LM

Zona de controle LIC

AmostrasFigura 8.5 – Gráfico de Controle

Diz-se que um processo está “sob controle” quando nenhum ponto correspondente a uma medida está fora da zona de controle.

8.02 – Gráfico de Controle por Variável

Este tipo de gráfico é amplamente utilizado quando se pretende avaliar grandezas mensuráveis, como diâmetro, peso e comprimento, por exemplo. Os gráficos de variáveis podem ser considerados como a mais típica das aplicações do CEP, e um dos seus principais atributos é a precisão das informações fornecidas, uma vez que uma resposta do tipos “o diâmetro do rolamento é 23,5 mm” pode ser muito mais útil que uma resposta como “o rolamento está fora das especificações”. Os principais gráficos de controle por variável são apresentados a seguir.

8.02.01 – Gráfico da Média e da Amplitude ( )

É utilizado para representar os valores resultantes de medições, que devem ser efetuadas periodicamente (p. ex. de hora em hora, a cada vinte minutos, etc). As etapas para elaboração são dadas a seguir.

1) Determinar a quantidade ( k ) de amostras.2) Determinar o tamanho ( n ) das amostras.3) Para cada amostra calcular a média aritmética:

(8.01)

4) Para cada amostra calcular a amplitude: (8.02)

5) Calcular a média das médias: (8.03)

6) Calcular a média das amplitudes: (8.04)

7) Calcular os limites de controle para o gráfico da média:

Limite Superior de Controle: (8.05)Linha Média: (8.06)Limite Inferior de Controle: (8.07)

8) Calcular os limites de controle para o gráfico da amplitude:

Limite Superior de Controle: (8.08)Linha Média: (8.09)Limite Inferior de Controle: (8.10)

As constantes A2 , D3 e D4 são dadas no quadro 8.2, a seguir:

n 2 3 4 5 6 7 8 9 10D4 3,27 2,57 2,28 2,11 2,00 1,92 1,86 1,82 1,78D3 - - - - - 0,08 0,14 0,18 0,22D2 1,13 1,69 2,06 2,33 2,53 2,70 2,85 2,97 3,08A2 1,88 1,02 0,73 0,58 0,48 0,42 0,37 0,34 0,31

Quadro 8.2 – Constantes Multiplicativas para o Gráfico

Para amostras com menos de sete unidades considera-se que não há limite inferior para o gráfico da amplitude.

Exemplo 8.03: A seguir são mostrados os valores observados para um determinado característico de qualidade. Por comodidade foram anotados apenas os valores decimais, isto é, se o valor observado foi 100,92 mm, anotou-se apenas “92”. Esta é uma prática bastante comum, e não compromete os resultados finais. No total foram observadas 25 amostras, cada uma com cinco elementos. O objetivo é construir o gráfico .

Amostra X1 X2 X3 X4 X5 R

1 92 91 93 94 95 93 42 91 92 91 93 923 96 91 92 92 924 93 93 92 92 925 92 93 92 93 916 94 93 93 94 917 94 92 93 92 928 92 95 91 95 929 95 94 91 94 9310 95 94 94 92 9111 93 92 94 91 9112 94 92 95 92 9413 93 91 94 93 9314 92 93 93 92 9415 93 94 92 92 9316 92 94 93 91 9317 92 93 91 92 9318 91 92 92 93 9519 90 90 90 92 9220 92 91 91 91 9221 93 92 92 93 9122 94 93 94 94 9323 95 93 93 92 9424 93 91 94 92 9225 91 92 94 93 93

Quantidade de amostras: k = Tamanho das amostras: n =

Média das médias: Amplitude média:

A2 = D3 = D4 =

Limites de controle para o gráfico da média:

Limites de controle para o gráfico da amplitude:

8.02.01.01 – Interpretação do Gráfico

1) Pontos além dos limites de controle: A ocorrência de um ponto além dos limites de controle é uma evidência de que o processo esteve fora de controle naquele ponto. Considerando que pontos nesta situação devem ocorrer raramente, presume-se que houve uma variação causal. Neste caso deve-se isolar a amostra correspondente a fim de investigar as possíveis causas.

Um ponto acima do limite superior de controle indica uma, ou mais, das causas a seguir: O limite superior de controle foi calculado, ou traçado, incorretamente. O ponto foi plotado incorretamente. A dispersão sofreu um acréscimo naquele ponto. Isto pode eventualmente indicar uma tendência. O meio de medição pode ter sido alterado. O meio de medição sofreu alterações na sua precisão.

Um ponto abaixo do limite inferior de controle indica uma, ou mais, das causas a seguir: O limite inferior de controle foi calculado, ou traçado, incorretamente. O ponto foi plotado incorretamente. A dispersão sofreu um decréscimo naquele ponto. Isto pode eventualmente indicar uma

tendência de melhoria no processo. O meio de medição pode ter sido alterado. O meio de medição sofreu alterações na sua precisão.

2) Padrões ou tendências entre os limites de controle: A ocorrência de padrões incomuns, com as amplitudes sob controle, pode indicar uma alteração na dispersão do processo, ocorrida no período de observação dos dados correspondentes.

3) Muitos pontos de um mesmo lado da linha média: Esta ocorrência pode indicar uma grande dispersão, resultante de uma variação causal. Esta variação pode ter sido provocada por um problema na máquina, p. ex.

4) Uma seqüência crescente de três pontos acima da linha média, ou uma seqüência decrescente de três pontos abaixo da mesma. Neste caso o processo deve ser interrompido, pois há uma tendência de que o mesmo fique fora de controle.

8.02.01.02 – Estimação do Desvio Padrão do Processo

A variabilidade dentro de cada amostra é representada pela amplitude da mesma. Desta forma a estimação do desvio padrão pode se basear na amplitude média . Desta forma

(8.11)

onde o valor de D2 é dado no quadro 8.2.

Exemplo 8.04: Estimar o desvio padrão para o processo do exemplo 8.03.

8.02.01.03 – Capabilidade do Processo ( Cpk )

A capabilidade de um processo envolve a distância entre a média do mesmo e as especificações para o característico avaliado. As especificações mencionadas também são denominadas “limites de

engenharia” ou “limites de especificação”. A referida distância é expressa em termos de escores reduzidos. Há duas situações a considerar, ambas relativas à tolerância.

Tolerância Bilateral

Deve-se calcular os escores reduzidos relativos aos limites de engenharia, tomando como parâmetros a média ( ) e o desvio padrão do mesmo. Então

(8.12)

(8.13)

Onde LIE = Limite Inferior de Especificação LSE = Limite Superior de Especificação

Deve-se considerar em seguida o menor valor entre os dois calculados acima, isto é

(8.14) Tolerância Unilateral

Neste caso há apenas um escore reduzido a ser calculado. Utiliza-se a fórmula apropriada entre as duas acima, (8.12) e (8.13). Desta forma

ou

O índice Cpk , em ambas as situações, é dado por (8.15)

Os escores reduzidos calculados em (8.12) e (8.13) fornecem a proporção de não conformidade do processo. Esta proporção é calculada com base nos valores da distribuição normal padronizada, estando representada na figura 8.6, a seguir.

ZLIE ZLSE

Abaixo do LIE Acima do LSE

Figura 8.6

8.02.01.03.01 – Interpretação da Capabilidade

Um processo pode ser classificado de acordo com o valor obtido para o índice C pk, conforme o quadro a seguir:

Valor de Cpk ClassificaçãoCpk < 1,00 Processo inadequado. Controle e inspeção de 100%

1,00 < Cpk < 1,33 Adequado. Controle e inspeção por amostragem necessários1,33 < Cpk Controle e inspeção desnecessários

Quadro 8.6 – Classificação de Processo com Base no Índice Cpk

Exemplo 8.05: Calcular o índice de capabilidade para o processo do exemplo 8.03, considerando tolerância bilateral, sendo os limites inferior e superior de especificação iguais a 91,90 mm e 93,20 mm , respectivamente.

Exercício 8.01: No próximo quadro são mostrados os conteúdos observados em 20 amostras de latas de óleo de soja. Por comodidade não foram anotados os valores correspondentes à centena, isto é, se o valor observado foi “989,92 ml”, anotou-se apenas “89,92”.

a) Calcular os limites para o gráfico da média (“x barra”).b) Idem para o gráfico da amplitude.c) Traçar o gráfico, usando a carta dada nas próximas páginas.d) Supondo que a tolerância do processo é de 1,5 ml, calcular o índice de capabilidade

Amostra X1 X2 X3 X4 X5 R

1 90,92 89,91 89,98 90,94 90,952 90,99 89,99 89,91 90,93 90,923 91,06 90,91 91,52 91,92 90,974 90,93 90,95 91,02 90,52 90,005 90,05 89,93 89,92 90,15 90,216 89,04 89,93 90,03 90,94 91,917 88,94 90,92 90,35 90,02 90,008 90,92 90,90 90,10 89,95 88,989 90,95 91,40 90,90 90,44 90,0010 94,95 91,94 92,95 91,92 91,9111 90,00 90,42 90,24 90,91 90,4512 90,04 90,02 90,05 90,12 90,1513 91,03 90,91 90,94 89,98 90,9314 98,92 90,03 90,15 90,25 90,1415 98,93 98,94 98,92 90,02 90,0316 90,02 90,04 90,03 90,01 90,1517 91,12 90,43 90,01 90,12 89,9318 90,41 91,02 90,99 90,93 89,9519 90,90 90,90 90,80 90,92 91,0220 91,05 91,41 91,91 90,91 89,92

8.02.02 – Gráfico da Média e do Desvio Padrão ( )

No gráfico a amplitude é usada para avaliar a variabilidade do processo. A principal vantagem desta prática reside na facilidade para obter o valor em questão. Esta vantagem é ainda maior quando as amostras não são grandes, geralmente com menos de 10 elementos cada uma. Contudo, a medida de dispersão mais precisa é o desvio padrão, embora o seu cálculo seja mais complexo. De qualquer forma é aconselhável utilizar o desvio padrão como medida de dispersão, principalmente quando se verifica pelo menos uma das condições a seguir:

Amostras com tamanho igual ou superior a 10 (dez). Dados tratados computacionalmente. O funcionário responsável pelas observações dispõe de pelo menos uma calculadora científica.

As etapas para construção do gráfico são listadas a seguir.1) Determinar a quantidade ( k ) de amostras.2) Determinar o tamanho ( n ) das amostras.

3) Para cada amostra calcular a média aritmética:

(8.01)

4) Para cada amostra calcular o desvio padrão: (8.16)

5) Calcular a média das médias: (8.03)

6) Calcular a média dos desvios padrões: (8.17)

7) Calcular os limites de controle para o gráfico da média:Limite Superior de Controle: (8.18)Linha Média: (8.06)Limite Inferior de Controle: (8.19)

8) Calcular os limites de controle para o gráfico do desvio padrão:

Limite Superior de Controle: (8.20)Linha Média: (8.21)Limite Inferior de Controle: (8.22)

As constantes A3 , B3 e B4 são dadas no quadro 8.3, a seguir:

8.02.02.01 – Estimação do Desvio Padrão do Processo

Aqui o desvio padrão é estimado por (8.23)

onde o valor de C4 é dado no quadro 8.3.

n 2 3 4 5 6 7 8 9 10B4 3,27 2,57 2,27 2,09 1,97 1,88 1,82 1,76 1,72B3 - - - - 0,03 0,12 0,19 0,24 0,28C4 0,798 0,886 0,921 0,940 0,952 0,959 0,965 0,969 0,973A3 2,66 1,95 1,63 1,43 1,29 1,18 1,10 1,03 0,98

Quadro 8.3 – Constantes Multiplicativas para o Gráfico

8.02.02.02 – Capabilidade do Processo ( Cpk )

É estimada como apresentado em 8.02.01.03, apenas utilizando-se como estimador da variabilidade o valor calculado em (8.23).Exercício 8.02: Construir o gráfico para o processo do exercício 8.01.

Amostra X1 X2 X3 X4 X5 s

1 92 91 93 94 95 932 91 92 91 93 923 96 91 92 92 924 93 93 92 92 925 92 93 92 93 916 94 93 93 94 917 94 92 93 92 928 92 95 91 95 929 95 94 91 94 9310 95 94 94 92 9111 93 92 94 91 9112 94 92 95 92 9413 93 91 94 93 9314 92 93 93 92 9415 93 94 92 92 9316 92 94 93 91 9317 92 93 91 92 9318 91 92 92 93 9519 90 90 90 92 9220 92 91 91 91 9221 93 92 92 93 9122 94 93 94 94 9323 95 93 93 92 9424 93 91 94 92 9225 91 92 94 93 93

Quantidade de amostras: k = Tamanho das amostras: n =Média das médias: Desvio padrão médio:A2 = D3 = D4 =Limites de controle para o gráfico da média: Limites de controle para o gráfico da amplitude:

8.02.03 – Gráfico da Mediana e da Amplitude ( )

O gráfico da mediana é uma alternativa ao gráfico da média, muito embora a mediana possa não ser um estimador tão eficiente quanto a média. Apesar deste fato, o gráfico da mediana apresenta conclusões semelhantes ao gráfico da média, não esquecendo o fato de que o cálculo da mediana é mais fácil que o da média. As etapas para construção do gráfico da mediana são dadas a seguir:

1) Determinar a quantidade ( k ) de amostras.2) Determinar o tamanho ( n ) das amostras.3) Para cada amostra calcular a mediana. Os valores devem ser anotados, preferencialmente, em

ordem crescente. Neste caso, se a amostra tem tamanho ímpar, a mediana é o valor central. Se tem tamanho par, a mediana é a média dos dois valores centrais, conforme já estudado em 1.02.

Normalmente os dados não são observados em ordem crescente. Para evitar o trabalho adicional de ordená-los, basta que sejam representados (plotados) diretamente no gráfico. Desta forma o valor mediano é facilmente identificável.

4) Para cada amostra calcular a amplitude: (8.02)

5) Calcular a média das medianas: (8.24)

6) Calcular a média das amplitudes: (8.04)

7) Calcular os limites de controle para o gráfico da mediana:

Limite Superior de Controle: (8.25)Linha Média: (8.26)Limite Inferior de Controle: (8.27)

8) Calcular os limites de controle para o gráfico da amplitude:

Limite Superior de Controle: (8.28)Linha Média: (8.29)Limite Inferior de Controle: (8.30)

As constantes Ã2 , D3 e D4 são dadas no quadro 8.4, a seguir:

n 2 3 4 5 6 7 8 9 10D4 3,27 2,57 2,28 2,11 2,00 1,92 1,86 1,82 1,78D3 - - - - - 0,08 0,14 0,18 0,22D2 1,13 1,69 2,06 2,33 2,53 2,70 2,85 2,97 3,08Ã2 1,88 1,19 0,80 0,69 0,55 0,51 0,43 0,41 0,36

Quadro 8.4 – Constantes Multiplicativas para o Gráfico

Para amostras com menos de sete unidades considera-se que não há limite inferior para o gráfico da amplitude.

8.02.03.01 – Estimação do Desvio Padrão do Processo

Aqui o desvio padrão é estimado por (8.11)

onde o valor de C4 é dado no quadro 8.3.

8.02.03.02 – Capabilidade do Processo ( Cpk )

É estimada como apresentado em 8.02.01.03, apenas utilizando-se como estimador da variabilidade o valor calculado em (8.11).

Exercício 8.04: Construir o gráfico para o processo do exercício 8.01.

Amostra X1 X2 X3 X4 X5 s

1 92 91 93 94 95 932 91 92 91 93 923 96 91 92 92 924 93 93 92 92 925 92 93 92 93 916 94 93 93 94 917 94 92 93 92 928 92 95 91 95 929 95 94 91 94 9310 95 94 94 92 9111 93 92 94 91 9112 94 92 95 92 9413 93 91 94 93 9314 92 93 93 92 9415 93 94 92 92 9316 92 94 93 91 9317 92 93 91 92 9318 91 92 92 93 9519 90 90 90 92 9220 92 91 91 91 9221 93 92 92 93 9122 94 93 94 94 9323 95 93 93 92 9424 93 91 94 92 9225 91 92 94 93 93

Quantidade de amostras: k = Tamanho das amostras: n =Média das medianas: Amplitude média:A2 = D3 = D4 =Limites de controle para o gráfico da mediana: Limites de controle para o gráfico da amplitude:

Exercício 8.05: Fazer a análise de capabilidade para o processo do exercício anterior.

8.02.04 – Gráfico da Amplitude Móvel ( X – MR )

Alguns processos podem ter seu controle baseado em observações individuais. Isto ocorre, p. ex., no controle do pH de produtos químicos armazenados em tanques; neste caso não há necessidade de se coletar mais de uma observação por tanque. O mesmo se aplica a ensaios destrutivos, já que o alto custo representado por certos tipos de ensaios pode inviabilizar os trabalhos. Uma outra situação na qual se recomenda o uso deste tipo de gráfico é na produção de pequenas quantidades, quando não há observações suficientes para se formar uma amostra.

O gráfico X – MR pode ser utilizado nas situações acima, desde que sejam observados os seguintes fatos:

Observações individuais não têm a mesma eficiência que observações amostrais. Deve-se ter cuidado com as conclusões, principalmente se a distribuição de freqüências do

processo não for normal (simétrica). Como as observações são individuais, a média do processo e o seu desvio padrão podem

apresentar grande variabilidade.

As etapas para construção do gráfico são dadas a seguir.1) Determinar a quantidade k de observações2) A partir da segunda observação, determinar a diferença (amplitude) entre cada observação e a

observação anterior. Não levar em consideração o sinal.

, j = 2 , 3 , ... , k

3) Calcular a amplitude média (8.31)

4) Calcular a média do processo

5) Calcular os limites de controle para as observações individuais:

Limite Superior de Controle (8.32)Linha Média (8.33)Limite Inferior de Controle (8.34)

6) Calcular os limites de controle para o gráfico da amplitude

Limite Superior de Controle: (8.28)Linha Média: (8.29)Limite Inferior de Controle: (8.30)

As constantes E2 , D3 e D4 são dadas no quadro 8.5, a seguir:

n 2 3 4 5 6 7 8 9 10D4 3,27 2,57 2,28 2,11 2,00 1,92 1,86 1,82 1,78D3 - - - - - 0,08 0,14 0,18 0,22D2 1,13 1,69 2,06 2,33 2,53 2,70 2,85 2,97 3,08E2 2,66 1,77 1,46 1,29 1,18 1,11 1,05 1,01 0,98

Quadro 8.5 – Constantes Multiplicativas para o Gráfico X – MR

8.02.04.01 – Capabilidade ( Cpk )

A estimação da capabilidade segue os mesmos procedimentos adotados no gráfico .

Exercício 8.06: O quadro a seguir mostra as observações efetuadas para um processo industrial qualquer. Os dados referem-se à concentração, em p.p.m., de uma certa substância. Construir o gráfico X – MR.

Obs. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20Xi 10 15 13 10 15 16 18 14 10 12 8 10 9 12 13 10 11 9 8 10

Rj - 5 2 3 5 1 2 4

8.03 – Gráficos de Controle por Atributo

Embora sejam extremamente confiáveis como ferramentas de apoio à decisão, os gráficos de controle por variável apresentam alguns inconvenientes de ordem prática, alguns dos quais listados a seguir:

Cada gráfico, ou carta, pode ser usado para apenas uma variável. Supondo que um produto tenha cinco característicos a serem controlados. Neste caso serão necessários cinco gráficos.

Em algumas etapas da produção o interesse resume-se à simples verificação de conformidade em relação a algum parâmetro. Uma situação típica deste caso é a inspeção efetuada com o objetivo de verificar se o diâmetro de um eixo está dentro dos limites de tolerância. Aqui não há interesse em determinar o diâmetro, o que dispensa a coleta de amostra e os cálculos das medidas já estudadas.

Alguns componentes são inspecionados apenas com o objetivo de verificar a presença de algum defeito. Nas indústrias automobilísticas as partes da carroceria de um veículo são inspecionadas com a finalidade de verificar se apresentam riscos. A simples ocorrência de um risco na pintura é suficiente para que a peça seja rejeitada, não importando a dimensão ou a quantidade de riscos.

O controle por atributo trabalha apenas com os conceitos “passa – não passa”, “presente – ausente” e “conforme – não conforme”, entre outros referidos acima. É de grande utilidade nos trabalhos de inspeção final, e também em setores industriais, como na indústria eletrônica, p. ex.

A estrutura de um gráfico de controle por atributo é igual à do gráfico de controle por variável, isto é, possui dois limites de controle, que definem a zona de controle, e uma linha média, definida com base na proporção de ocorrências do atributo.

Antes de se adotar o controle por atributo deve-se tomar alguns cuidados, entre os quais destacam-se:

Inspecionar cada unidade, de cada uma das amostras selecionadas. Criar um ambiente favorável, do ponto de vista do gerenciamento. Algumas empresas delegam a

elaboração de gráficos de controle por variável aos próprios operários responsáveis pela fabricação dos componentes avaliados. Para o controle por atributo esta prática é um tanto temerária, pois normalmente o item inspecionado é proveniente de um processo ao qual são aplicadas técnicas de CEP. Neste caso o controle por atributo pode ser usado mais como ferramenta de apoio à decisão, já que na inspeção de vários atributos pode-se detectar falhas não identificadas anteriormente.

Levar em consideração as necessidades do cliente/usuário ao definir os critérios de decisão.

Os gráficos de controle por atributo mais usados são dados a seguir.

8.03.01 – Gráfico da Proporção de Unidades Não Conformes ( p )

O gráfico p mostra a proporção de não conformidade, ou de itens não conformes, em um grupo de amostras inspecionadas. Este gráfico pode apresentar tanto as variações para um atributo como para vários deles. As etapas para elaboração são dadas a seguir.

1) O tamanho ( n ) das k amostras não precisa ser igual. Pode-se coletar amostras de tamanhos diferentes. Este tipo de gráfico normalmente requer amostras grandes, geralmente de tamanho não inferior a 50. Este detalhe pode se tornar uma desvantagem, pois em alguns setores industriais, ou mesmo de serviços, a observação de uma amostra deste tamanho pode demandar

um período de tempo muito grande, o que acabaria por impedir a detecção de padrões que podem evidenciar uma variação causal.

2) Para cada uma das k amostras, calcular a fração defeituosa, ou proporção de não conformidade, que se obtém dividindo o número de itens defeituosos ( dj ) da amostra pelo tamanho ( nj ) da mesma.

(8.31)

3) Calcular a fração defeituosa média, ou proporção média de não conformidade.

(8.32)

4) Se as amostras têm tamanhos diferentes, calcular o tamanho médio das amostras:

(8.33)

5) Calcular o desvio padrão do processo:

(8.34)

6) Calcular os limites de controle:

Limite Superior de Controle: (8.35)

Linha Média: (8.36)

Limite Inferior de Controle: (8.37)

Exercício 8.07: O quadro a seguir mostra o resultado das observações sobre 20 amostras formadas por um determinado produto.

Amostra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20Tamanho 50 40 50 60 50 50 30 40 40 30 60 20 40 50 50 40 20 30 50 50

Defeituosos 3 2 2 3 3 2 1 1 2 0 3 3 1 0 2 3 2 1 4 0 pj

Construir o gráfico de controle da fração defeituosa (use o gráfico em branco da próxima página). Utilize duas casas decimais.

Linha Média: Desvio padrão:

Limite Superior de Controle: Limite Inferior de Controle:

8.03.02 – Gráfico do Número de Unidades Não Conformes ( np )

Também conhecido como Gráfico do Número de Defeituosos, pode ser usado como alternativa ao gráfico da fração defeituosa (8.03.01), apresentando as mesmas vantagens já mencionadas. Neste caso as amostras devem ter todas o mesmo tamanho, ao contrário do gráfico anterior, que permite a observação de amostras de diferentes tamanhos. As etapas para construção do gráfico np são dadas a seguir.

1) Selecionar k amostras, de tamanho n.

2) Calcular o número médio de unidades não conformes do processo:

(8.38)

3) Calcular o desvio padrão do processo: (8.39)

4) Calcular os limites de controle:

Limite Superior de Controle: (8.40)Linha Média: (8.41)Limite Inferior de Controle: (8.42)

Exercício 8.08: Construir o gráfico do número de unidades não conformes para os dados a seguir. Os valores apresentados referem-se à observação de 20 amostras, de tamanho 50, de um certo produto.

Amostra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20n 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50

Defeituosos 2 3 1 0 3 4 0 0 2 2 3 5 4 2 3 3 0 1 3 4p

8.03.03 – Gráfico do Número de Não Conformidades ( c )

Este gráfico é utilizado para avaliar o número de não conformidades, ou defeitos, em uma amostra. A utilização deste gráfico requer tamanho constante para as amostras observadas. Algumas aplicações são, p. ex., controle de bolhas em garrafas e riscos em peças estampadas.A principal diferença com relação ao gráfico p, é que este último se utiliza da contagem de unidades defeituosas, não se preocupando com a quantidade de defeitos. Uma idéia desta diferença é dada pela figura 8.7, a seguir. Considerando cada quadro como uma unidade, e cada ponto em destaque como um defeito, nota-se que há na amostra da esquerda quatro unidades defeituosas, e um total de sete defeitos. Na amostra da direita há duas unidades defeituosas, e o mesmo número de defeitos da primeira.

Figura 8.7

As etapas para construção do gráfico c são dadas a seguir.1) Selecionar k amostras com o mesmo tamanho, e determinar o número de defeitos, c , para cada

amostra.2) Calcular o número médio de não conformidades, ou defeitos.

(8.43)

3) Calcular os limites de controle.

Limite Superior de Controle: (8.44)Linha Média: (8.45)Limite Inferior de Controle: (8.46)

Exercício 8.09: Os dados a seguir referem-se à observação de 20 amostras, cada uma com 10 camisas. A cada amostra observada anotou-se o número de defeitos verificados (c). Construir um gráfico c para os dados.

Amostra ( j ) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20cj 3 2 5 4 2 0 3 4 5 1 1 2 0 3 4 3 2 2 0 3

8.03.04 – Gráfico do Número de Não Conformidades por Unidade ( u )

Este gráfico mede o número de não conformidades, ou defeitos, por unidade. Pode ser uma alternativa ao gráfico c, quando as amostras não têm o mesmo tamanho. Também pode ser usado quando a amostra é constituída de apenas uma unidade, mas que possui muitos componentes que devem ser inspecionados, como um motor, p. ex.,.

As etapas para construção do gráfico u são dadas a seguir.1) Selecionar k amostras, que podem ter tamanhos diferentes, e registrar o número de defeitos ( c )

encontrados em cada uma.2) Para cada uma das k amostras, determinar o número de defeitos por unidade.

(8.47)

onde cj é o número de defeitos encontrados na j – ésima amostra.

3) Calcular o número médio de defeitos por unidade:

(8.48)

4) Calcular o tamanho médio das amostras:

(8.49)

5) Calcular os limites de controle.

Limite Superior de Controle: (8.50)

Linha Média: (8.51)

Limite Inferior de Controle: (8.52)

Exercício 8.10: Os dados a seguir referem-se à observação de 15 amostras de um certo produto. A cada amostra observada anotou-se o número de defeitos verificados. Construir um gráfico u para os dados.

Amostra ( j ) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15nj 30 25 50 20 20 10 25 30 40 40 50 20 30 30 20cj 3 2 5 4 2 0 3 4 5 1 1 2 0 3 4uj

8.05 – Interpretação do Índice Cpk

Um processo pode ser classificado de acordo com o valor obtido para o índice C pk, conforme o quadro a seguir:

Valor de Cpk ClassificaçãoCpk < 1,00 Processo inadequado. Controle e inspeção de 100%

1,00 < Cpk < 1,33 Adequado. Controle e inspeção por amostragem necessários1,33 < Cpk Controle e inspeção desnecessários

Quadro 8.6 – Classificação de Processo com Base no Índice Cpk

8.06 – Capacidade de Processo

Embora a principal meta do CEP seja alcançar e manter um processo sob controle, esta condição nem sempre é a mais satisfatória. Um processo, mesmo sob controle, pode não ser capaz de atender às especificações do cliente. Para classificar um processo com relação à esta capacidade basta comparar os limites de controle do mesmo com os limites de especificação, ou de engenharia, do cliente. A comparação pode ser feita diretamente sobre o gráfico, ou carta, do processo, conforme mostrado nas figuras a seguir. Nas figuras, os limites de controle são representados por linhas cheias e os limites de especificação por linhas tracejadas .

Figura 8.8 – Processo Capaz Sob Controle

Figura 8.9 – Processo Capaz Fora de Controle

Figura 8.10 – Processo Incapaz Sob Controle

Figura 8.11 - Processo Incapaz Fora de Controle

n 2 3 4 5 6 7 8 9 10D4 3,27 2,57 2,28 2,11 2,00 1,92 1,86 1,82 1,78D3 - - - - - 0,08 0,14 0,18 0,22D2 1,13 1,69 2,06 2,33 2,53 2,70 2,85 2,97 3,08A2 1,88 1,02 0,73 0,58 0,48 0,42 0,37 0,34 0,31

Quadro 8.2 – Constantes Multiplicativas para o Gráfico

n 2 3 4 5 6 7 8 9 10B4 3,27 2,57 2,27 2,09 1,97 1,88 1,82 1,76 1,72B3 - - - - 0,03 0,12 0,19 0,24 0,28C4 0,798 0,886 0,921 0,940 0,952 0,959 0,965 0,969 0,973A3 2,66 1,95 1,63 1,43 1,29 1,18 1,10 1,03 0,98

Quadro 8.3 – Constantes Multiplicativas para o Gráfico

n 2 3 4 5 6 7 8 9 10D4 3,27 2,57 2,28 2,11 2,00 1,92 1,86 1,82 1,78D3 - - - - - 0,08 0,14 0,18 0,22D2 1,13 1,69 2,06 2,33 2,53 2,70 2,85 2,97 3,08Ã2 1,88 1,19 0,80 0,69 0,55 0,51 0,43 0,41 0,36

Quadro 8.4 – Constantes Multiplicativas para o Gráfico

n 2 3 4 5 6 7 8 9 10D4 3,27 2,57 2,28 2,11 2,00 1,92 1,86 1,82 1,78D3 - - - - - 0,08 0,14 0,18 0,22D2 1,13 1,69 2,06 2,33 2,53 2,70 2,85 2,97 3,08E2 2,66 1,77 1,46 1,29 1,18 1,11 1,05 1,01 0,98

Quadro 8.5 – Constantes Multiplicativas para o Gráfico X – MR

8.07 – Exercícios

1) Da produção de uma máquina foram extraídas 20 amostras, cada uma com 50 unidades de um componente. As unidades foram inspecionadas para a verificação da ocorrência de um certo defeito. Calcular os limites de controle e construir o gráfico de controle .

Amostra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20Defeituosos 2 3 0 2 0 5 1 0 0 3 2 0 5 4 1 2 3 0 2 3

2) Um gráfico tem os seguintes valores: = 135 , = 2,5. Foram inspecionadas 25 amostras, com cinco unidades cada uma. As especificações do cliente são: LSE = 136,5 e LIE = 133. Calcular o índice de capabilidade, Cpk.

3) Uma indústria química produz um certo tipo de solvente. Uma inspeção em 15 tonéis do produto apresentou os valores dados no quadro abaixo, referentes à concentração de sal, em p.p.m. Construir o gráfico de controle mais apropriado.

Tonel 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

p.p.m. 15 20 16 18 22 14 17 13 22 15 19 25 20 18 14

4) Em uma confecção foram inspecionadas 15 amostras, cada uma com 20 calças. Registrou-se o número de defeitos em cada amostra. Calcular os limites de controle e construir o gráfico.

Amostra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Defeitos 6 4 8 4 5 4 2 8 4 3 4 4 2 6 4

5) Os gráficos de controle por variável devem ser construídos para processos normalizados, isto é, quando a curva de freqüências é normal. O quadro a seguir mostra o resultado da inspeção em 20 amostras, cada uma com cinco unidades, de tubos de PVC. O característico avaliado é o diâmetro.

a) Construir uma distribuição de freqüências para os valores observados. (Use amplitude de classe igual a 0,2 mm para as oito classes).

b) Calcular a média, a mediana e a moda.c) Verificar se o processo está normalizado.d) Calcular os limites de controle para um gráfico .e) Calcular o índice de capabilidade, supondo que as especificações do cliente são: LIE =

24,0 mm e LSE = 25,5 mm.f) Classificar o processo quanto à sua capacidade.

Amostra X1 X2 X3 X4 X5 Média Amplitude1 24,0 24,1 24,0 24,2 24,32 24,8 24,8 24,9 24,9 24,83 24,5 24,4 24,4 24,5 24,44 25,3 25,4 25,5 25,5 24,35 24,6 24,7 24,7 24,7 24,66 25,3 25,5 25,4 25,5 24,37 24,8 24,8 24,9 24,8 24,48 24,8 24,8 24,8 24,9 24,39 25,0 24,5 24,5 24,5 24,410 24,8 24,8 24,1 24,0 24,211 25,0 25,0 25,1 25,1 24,512 25,2 25,3 25,2 25,2 24,513 24,7 24,2 24,6 24,0 24,314 25,2 25,3 25,3 25,3 24,415 25,0 25,0 25,1 25,0 24,516 24,6 24,7 24,7 24,2 24,317 24,6 24,7 24,6 24,6 24,718 24,8 24,9 24,8 24,9 24,919 24,6 24,7 24,6 24,6 24,620 25,0 25,0 25,1 25,1 25,0