e Statistic A

180
SACHIKO ARAKI LIRA ESTATÍSTICA

Transcript of e Statistic A

SACHIKO ARAKI LIRA

ESTATÍSTICA

SUMÁRIO ii

SUMÁRIO

ESTATÍSTICA DESCRITIVA ........................................................................................................ 1

1.1 Variável Aleatória ................................................................................................................ 2 1.2 Tipos de Escalas e Variáveis............................................................................................... 4 1.3 Tabelas ............................................................................................................................... 5 1.3.1 Normas para apresentação de tabelas ............................................................................. 5 1.3.2 Tabelas de distribuição de frequências............................................................................. 6 1.3.2.1 Variável Discreta ........................................................................................................... 6 1.3.2.2 Variável Contínua .......................................................................................................... 8 1.4 Gráficos ............................................................................................................................... 9 1.4.1 Representação Gráfica ..................................................................................................... 9 1.4.2 Histograma de Frequências.............................................................................................. 9 1.4.3 Diagrama de Ramo e Folhas (Stem and Leaf Plot) ........................................................ 10 1.4.4 Gráfico de Boxplot ou da Caixa ...................................................................................... 11 1.4.5 Gráfico de Linhas ........................................................................................................... 12 1.5 Medidas de Localização, Variabilidade e Forma da Distribuição ....................................... 12 1.5.1 Tendência Central .......................................................................................................... 13 1.5.1.1 Esperança matemática ou média aritmética ................................................................ 13 1.5.1.2 Mediana ...................................................................................................................... 15 1.5.1.3 Moda ........................................................................................................................... 18 1.5.2 Medidas de Posição (ou Separatrizes) ........................................................................... 20 1.5.2.1 Quartil.......................................................................................................................... 20 1.5.3 Medidas de Dispersão .................................................................................................... 22 1.5.3.1 Amplitude Total ........................................................................................................... 22 1.5.3.2 Amplitude Interquartil ................................................................................................... 23 1.5.3.3 Desvio Médio ............................................................................................................... 23 1.5.3.4 Variância e Desvio Padrão .......................................................................................... 24 1.5.3.5 Coeficiente de Variação............................................................................................... 27 1.5.4 Forma da Distribuição .................................................................................................... 27 1.5.4.1 Coeficiente do momento de assimetria ........................................................................ 27 1.5.4.2 Coeficiente do momento de curtose ............................................................................ 28 Lista de Exercícios no. 1 – Estatística Descritiva ..................................................................... 31

ELEMENTOS DE PROBABILIDADES ....................................................................................... 34 2.1 Experimento Aleatório (E) ................................................................................................ 34 2.2 Espaço Amostral (S) ......................................................................................................... 34 2.3 Evento ............................................................................................................................... 34 2.3.1 Evento Complementar .................................................................................................... 35 2.3.2 Eventos Independentes .................................................................................................. 35 2.3.3 Eventos Mutuamente Exclusivos .................................................................................... 36 2.4 Definição Clássica de Probabilidade ................................................................................. 37 2.5 Definição Axiomática de Probabilidade ............................................................................. 37 2.6 Probabilidade Condicional ................................................................................................. 37 2.7 Teorema da Probabilidade Total ....................................................................................... 38 2.8 Teorema de Bayes ............................................................................................................ 39 Lista de Exercícios no. 2 - Probabilidades ............................................................................... 40

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES .............. 43 3.1 Definições ......................................................................................................................... 43 3.2 Distribuições de Probabilidades Discretas ......................................................................... 46 3.2.1 Distribuição binomial ...................................................................................................... 46 3.2.2 Distribuição de Poisson .................................................................................................. 48 3.2.3 Distribuição Hipergeométrica .......................................................................................... 50

SACHIKO ARAKI LIRA iii

Lista de Exercícios no. 3 – Distribuições de Probabilidades Discretas .................................... 52 VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES .............. 54

4.1 Definições ......................................................................................................................... 54 4.2 Distribuições de Probabilidades Continuas ........................................................................ 56 4.2.1 Distribuição Exponencial ................................................................................................ 56 4.2.2 Distribuição normal ou Gaussiana .................................................................................. 57 4.3.2.1 Distribuição normal padronizada ou reduzida .............................................................. 59

4.3.3 Distribuição 2 ( qui-quadrado)...................................................................................... 61

4.3.4 Distribuição “ t ” de Student ............................................................................................ 62

4.3.5 Distribuição F de Snedecor ............................................................................................ 63 Lista de Exercícios no. 4 – Distribuições de Probabilidades Contínuas ................................... 64

NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS.............................................. 66 5.1 Introdução ......................................................................................................................... 66 5.2 Amostragem Probabilística ................................................................................................ 66 5.2.1 Amostragem Aleatória Simples (AAS) ............................................................................ 66 5.2.2 Amostragem Sistemática ................................................................................................ 67 5.2.3 Amostragem Estratificada............................................................................................... 68 5.3 Distribuições Amostrais ..................................................................................................... 68 5.3.1 Distribuição Amostral de Médias .................................................................................... 68 5.3.2 Distribuição Amostral de Proporções .............................................................................. 72 5.3.3 Distribuição Amostral da Variância ................................................................................. 72

ESTIMAÇÃO DE PARÂMETROS .............................................................................................. 74 6.1 Introdução ......................................................................................................................... 74 6.2 Estimador e Estimativa ...................................................................................................... 74 6.3 Qualidades de um Estimador ............................................................................................ 74 6.4 Estimação por Pontos ....................................................................................................... 75 6.4.1 Estimador da Média Populacional .................................................................................. 75 6.4.2 Estimador da Variância Populacional ............................................................................. 75 6.4.3 Estimador do Desvio Padrão Populacional ..................................................................... 76 6.4.4 Estimador da Proporção Populacional ............................................................................ 76 6.5 Estimação por Intervalo ..................................................................................................... 76 6.5.1 Intervalo de Confiança para Média populacional ............................................................ 76 6.5.2 Intervalo de Confiança para Diferença entre Duas Médias Populacionais 1 e 2 ......... 80

6.5.3 Intervalo de Confiança para a Variância Populacional .................................................... 84 6.5.4 Intervalo de Confiança para o Desvio Padrão Populacional ........................................... 85 6.5.5 Intervalo de Confiança para Proporção Populacional ..................................................... 86 6.6 Dimensionamento da Amostra .......................................................................................... 87 6.6.1 Estimação da Média Populacional .................................................................................. 87 6.6.2 Estimação da Proporção Populacional ........................................................................... 88 Lista de Exercícios no. 5 - Intervalos de Confiança ................................................................ 89

TESTES DE HIPÓTESES .......................................................................................................... 92 7.1 Etapas para Testes de Hipóteses ...................................................................................... 92 7.1.1 Nível de Significância ..................................................................................................... 92 7.1.2 Erro Estatístico ............................................................................................................... 93 7.2 Testes Estatísticos Paramétricos ...................................................................................... 93 7.2.1 Teste para a Média Populacional ................................................................................... 93

7.2.1.1 Quando a variância populacional 2 é Conhecida ...................................................... 93

7.2.1.2 Quando a variância populacional 2 é desconhecida ................................................. 95

7.2.2 Teste para a Proporção Populacional ............................................................................. 96 7.2.3 Teste para a Variância Populacional .............................................................................. 98 7.2.4 Teste para a Diferença entre Duas Médias Populacionais............................................ 100

7.2.4.1 Quando as variâncias populacionais 21 e 2

2 são Conhecidas ................................ 100

7.2.4.2 Quando as variâncias populacionais 21 e 2

2 são Desconhecidas .......................... 102

7.2.5 Duas Amostras Emparelhadas ..................................................................................... 106 7.2.6 Teste para Igualdade de Duas Variâncias .................................................................... 107

SUMÁRIO iv

Lista de Exercícios no. 6 – Testes de Hipóteses ................................................................... 110 TESTES DE ADERÊNCIA ....................................................................................................... 113

8.1 Teste Qui-quadrado de Aderência ................................................................................... 113 8.2 Teste de Lilliefors ............................................................................................................ 117 Lista de Exercícios no. 7 – Testes de Aderência ................................................................... 119

ANÁLISE DA VARIÂNCIA ........................................................................................................ 121 9.1 Fundamentos da ANOVA ................................................................................................ 121 9.2 Análise da Variância a um Critério de Classificação ........................................................ 123 9.3 Comparações Múltiplas entre Médias .............................................................................. 128 9.3.1 Teste de Scheffé .......................................................................................................... 128 Lista de Exercícios no. 8 – Análise da Variância ................................................................... 131

ANÁLISE DE CORRELAÇÃO E REGRESSÃ0 SIMPLES ........................................................ 133 10.1 Introdução ..................................................................................................................... 133 10.2 Diagrama de Dispersão ................................................................................................. 133 10.3 Análise de Correlação ................................................................................................... 134 10.3.1 Coeficiente de Correlação Linear de Pearson ............................................................ 134 10.3.1.1 Teste de Hipóteses para Coeficiente de Correlação ................................................ 136 10.4 Análise de Regressão Linear Simples ........................................................................... 137 10.4.1 Estimação dos Parâmetros ......................................................................................... 138 10.4.2 Testes de Hipóteses na Regressão Linear ................................................................ 141 10.4.2.1Teste t ..................................................................................................................... 141

10.4.2.2 Análise da Variância ................................................................................................ 141 10.4.3 Coeficiente de Determinação ou Explicação............................................................... 144 10.5 Ajuste de Curva Geométrica (ou Função Potência) ....................................................... 147 10.5.1 Estimativa dos Coeficientes ........................................................................................ 148 10.5.2 Testes de Hipóteses ................................................................................................... 149 10.5.2.1 Análise da Variância ................................................................................................ 149 10.5.3 Coeficiente de Determinação ou Explicação............................................................... 150 10.6 Ajuste de Função Exponencial ...................................................................................... 152 10.6.1 Estimativa dos Coeficientes ........................................................................................ 153 10.6.2 Testes de Hipóteses ................................................................................................... 154 10.6.2.1 Análise da Variância ................................................................................................ 154 10.6.3. Coeficiente de Determinação ou Explicação .............................................................. 154 Lista de Exercícios no. 9 – Análise de Correlação e Regressão ............................................ 158

ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA ..................................................................... 160 11.1 Regressão Linear com 2 Variáveis Independentes ........................................................ 160 11.1.1 Estimativas dos Coeficientes de Regressão ............................................................... 161 1.1.2 Teste para Verificar a Existência de Regressão ........................................................... 161 11.1.3 Cálculo do Coeficiente de Determinação ou Explicação ............................................. 161 Lista de Exercícios no. 10 – Análise de regressão Linear Múltipla ........................................ 166

BIBLIOGRAFIA ........................................................................................................................ 168 TABELA A1.1 – ÁREAS SOB A CURVA NORMAL ............................................................... 169 TABELA A1.2 – ÁREAS SOB A CURVA NORMAL ............................................................... 170

TABELA A2 - DISTRIBUIÇÃO „ t ‟ DE STUDENT .................................................................. 171

TABELA A3 - DISTRIBUIÇÃO DE 2 .................................................................................. 172

TABELA A4 - DISTRIBUIÇÃO „F‟ DE SNEDECOR (Nível de Significância 1%) .................... 173 TABELA A5 - DISTRIBUIÇÃO „F‟ DE SNEDECOR (Nível de Significância de 5%) ............... 174 TABELA A6 - DISTRIBUIÇÃO „F‟ DE SNEDECOR (Nível de Significância de 10%) ............. 175

TABELA A7 - VALORES CRÍTICOS )cd( PARA TESTE DE LILLIERFORS ....................... 176

SACHIKO ARAKI LIRA 1

ESTATÍSTICA DESCRITIVA

INTRODUÇÃO

Estatística é a ciência que trata da coleta, organização, descrição, análise e interpretação dos

dados experimentais. O diagrama abaixo mostra o contexto em que se situa o estudo completo

da Estatística, aqui subdividido em Estatística Descritiva e Estatística Indutiva (ou Inferência

Estatística).

FIGURA 1 - ESQUEMA GERAL DA ESTATÍSTICA

FONTE: COSTA NETO (1994), p. 04.

A Estatística Descritiva é a parte que trata da organização e descrição de dados, através dos

cálculos de médias, variâncias, estudo de gráficos, tabelas etc.

A Teoria das Probabilidades permite-nos modelar os fenômenos aleatórios, ou seja, aqueles em

que está presente a incerteza. É uma ferramenta fundamental para a inferência estatística.

A Estatística Indutiva compreende um conjunto de técnicas baseadas em probabilidades, que a

partir de dados amostrais, permite-nos tirar conclusões sobre a população de interesse.

A Amostragem é o ponto de partida para um estudo estatístico. O estudo de qualquer

fenômeno, seja ele natural, social, econômico ou biológico, exige a coleta e a análise de dados

estatísticos. A coleta de dados é, pois, a fase inicial de qualquer pesquisa.

A População é o conjunto de todas as observações potenciais sobre determinado fenômeno. O

conjunto de dados efetivamente observados, ou extraídos, constitui uma amostra da população.

É a partir do dado amostral, que se desenvolvem os estudos, com o objetivo de se fazer

inferências sobre a população.

Estatística

Descritiva Amostragem Cálculo das

Probabilidade

s

Estatística

Indutiva

ESTATÍSTICA DESCRITIVA 2

1 ESTATÍSTICA DESCRITIVA

O objetivo da estatística descritiva é organizar os dados e apresentá-los de forma a possibilitar a

visualização das informações subjacentes (que não são observáveis). As técnicas estatísticas e

gráficas, disponíveis para a análise exploratória de dados, podem ser aplicadas a qualquer

conjunto de dados, sejam para dados populacionais ou amostrais.

O parâmetro é uma medida numérica que descreve de forma reduzida alguma característica de

uma população ou universo. É habitualmente representado por letras gregas. Por exemplo: μ

(média), σ (desvio padrão), ρ (coeficiente de correlação). O parâmetro normalmente é

desconhecido e, deseja-se estimar através de dados amostrais.

Estatística ou medida amostral é uma medida numérica que descreve alguma característica de

uma amostra. É habitualmente representada por letras latinas. Por exemplo: X (média), S

(desvio padrão), r (coeficiente de correlação).

Em resumo, a análise exploratória de dados permite organizar os dados através de tabelas,

gráficos e medidas de localização e dispersão, procurando mostrar um padrão ou

comportamento de um conjunto de dados.

1.1 VARIÁVEL ALEATÓRIA

Variável aleatória é aquela cujo valor numérico não é conhecido antes da sua observação. Esta

tem uma distribuição de probabilidades associada, o que permite calcular a probabilidade de

ocorrência de certos valores.

Geralmente, utilizam-se letras maiúsculas (X, Y, Z...) para designar as variáveis aleatórias, e

minúsculas (x, y, z...) para indicar particulares valores dessas variáveis. O comportamento de

uma variável aleatória é descrito por sua distribuição de probabilidade.

Exemplo: Suponha que em um lote de 10 parafusos, 2 são defeituosos. A variável aleatória

X=número de parafusos defeituosos, na escolha de 3 parafusos com reposição, pode assumir os

seguintes valores:

DDDsse,3

PDDsouDPDsouDDPsse,2

PPDsouPDPsouDPPsse,1

PPPsse,0

)s(X

sendo P=perfeito e D=defeituoso.

DISTRIBUIÇÃO DE PROBABILIDADES DA

VARIÁVEL ALEATÓRIA X

xX )xX(P

0 512,0)108( 3

1 384,0)102()108(3 2

2 096,0)102()108(3 2

3 008,0)10/2( 3

SACHIKO ARAKI LIRA 3

A função de distribuição ou função de distribuição acumulada da v. a X é definida por

Rx,)xX(P)x(F XX , ou seja, é definida como sendo a probabilidade de X assumir um valor

menor ou igual a x. Para o exemplo tem-se:

FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA DA VARIÁVEL

ALEATÓRIA X

xX )xX(P )x(FX

0 512,0)108( 3 0,512

1 384,0)102()108(3 2 0,896

2 096,0)102()108(3 2 0,992

3 008,0)10/2( 3 1,000

1.1.1 ARREDONDAMENTO DE NÚMEROS

1. Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica inalterado o último

número que permanecer.

Exemplo: seja o número 48,231, ao arredondar para 2 casas decimais ficará 48,23.

2. Quando o primeiro algarismo a ser abandonado for 6, 7, 8 ou 9, aumenta-se de uma unidade

o último algarismo a permanecer.

Exemplo: o número 23,077, ao arredondar para 2 casas decimais ficará 23,08.

3. Quando o primeiro algarismo a ser abandonado for 5, haverá duas formas:

a) como regra geral, aumenta-se de uma unidade o último algarismo a permanecer.

Exemplo: 12,5253 ficará 12,53.

b) se ao 5 só seguirem zeros, o último algarismo a ser conservado só será aumentado se for

ímpar.

Exemplo: 24,7750 passa a ser 24,78

24,7650 passa a ser 24,76.

Exemplos: arredondar os números dados para 2 casa decimais.

17,44452 ficará 17,44;

179,5673 ficará 179,57;

87,4931 ficará 87,49;

4,5652 ficará 4,57;

4,5650 ficará 4,56;

4,575 ficará 4,58.

ESTATÍSTICA DESCRITIVA 4

4. Quando houver parcelas e total, e ocorrer diferença no arredondamento, deve-se fazer

correção na parcela (ou parcelas) onde o erro relativo for menor.

Exemplo:

2,4 para 2 13,4 14 16,1 16 ----- ---- 31,9 32

1.2 TIPOS DE ESCALAS E VARIÁVEIS

Uma variável pode se apresentar das seguintes formas, quanto aos valores assumidos:

1.o Escala nominal: é aquela que permite o agrupamento da unidade de observação (unidade da

pesquisa) de acordo com uma classificação qualitativa em categorias definidas, ou seja, consiste

simplesmente em nomear ou rotular, não sendo possível estabelecer graduação ou ordenamento.

Ao se trabalhar com essa escala, cada unidade de observação deve ser classificada em uma e

somente uma categoria, isto é, deve ser mutuamente excludente.

Por exemplo, seja X, a variável, estado de uma peça de automóvel. Neste caso, a variável X

assume as categorias “perfeita” e “defeituosa”, sendo denominada dicotômica. Quando assume

mais de duas categorias é denominada politômica. Não tem significado aritmético ou de

quantificação, não se faz cálculos, apenas a contagem.

2.o Escala ordinal: permite o agrupamento da unidade de observação de acordo com uma ordem

de classificação. A escala ordinal fornece informações sobre a ordenação das categorias, mas

não indica a grandeza das diferenças entre os valores.

Exemplo: Seja X a variável que indica a qualidade de um determinado produto. Tem-se então: A

(indicando melhor qualidade), B (qualidade intermediária) e C (pior qualidade).

3.º Escala intervalar: é uma escala ordinal em que a distância entre as categorias é sempre a

mesma. As escalas para medir temperaturas como a Fahrenheit e a Centígrada são exemplos de

escalas de intervalo. Não se pode afirmar que 40 graus é duas vezes mais quente que uma

temperatura de 20 graus, embora se possa dizer que a diferença entre 20 graus e 40 graus é a

mesma que entre 75 graus e 95 graus.

4.º Escala de razão: quando uma escala tem todas as características de uma escala intervalar e

o zero absoluto representa o ponto de origem, é chamada escala de razão. Sempre que possível,

é preferível utilizar a medida de escala de razão, pois a partir desta pode-se transformar em

escala intervalar, ordinal ou nominal, não ocorrendo o inverso.

De acordo com o nível de mensuração, a variável pode ser classificada em qualitativa ou

quantitativa. Variável qualitativa é aquela cujo nível de mensuração é nominal ou ordinal,

enquanto a quantitativa é aquela em que o nível de mensuração é intervalar ou de razão.

SACHIKO ARAKI LIRA 5

A variável quantitativa pode ser ainda discreta ou contínua, sendo a primeira resultante de

contagem, assumindo somente valores inteiros, e a última de medições, assumindo qualquer

valor no campo dos números reais. Apresentam-se, a seguir, os conceitos de variáveis

quantitativas discretas e contínuas.

Variável aleatória discreta: uma variável aleatória X é discreta se o conjunto de valores

possíveis de X for finito ou infinito numerável.

Variável aleatória contínua: a variável aleatória X é chamada de contínua quando o seu

contradomínio é um conjunto infinito.

Variável

Qualitativa

Quantitativa

Nominal

Ordinal

Discreta

Contínua

FIGURA 2 - TIPOS DE VARIÁVEIS

Exemplo de aplicação: Seja uma população de peças produzidas em um determinado

processo. É possível ter as seguintes situações:

VARIÁVEL TIPO

Estado: Conforme ou Não-conforme Qualitativa Nominal

Qualidade: 1ª., 2ª. ou 3ª. categoria Qualitativa Ordinal

Número de peças conformes Quantitativa Discreta

Comprimento das peças Quantitativa Contínua

1.3 TABELAS

1.3.1 NORMAS PARA APRESENTAÇÃO DE TABELAS

Uma tabela deve apresentar os dados de forma resumida, oferecendo uma visão geral do

comportamento do fenômeno analisado.

Uma tabela é constituída dos seguintes elementos:

1 - Título: é a indicação que precede a tabela e contém a identificação de três fatores do

fenômeno.

a) A data a qual se refere;

ESTATÍSTICA DESCRITIVA 6

b) o local onde ocorreu o evento;

c) o fenômeno que é descrito.

2 - Cabeçalho: é a parte superior da tabela que especifica o conteúdo das colunas.

3 - Corpo da tabela: é o espaço que contém as informações sobre o fenômeno observado.

4 - Fonte: é a indicação da entidade responsável pelo levantamento dos dados.

1.3.2 TABELAS DE DISTRIBUIÇÃO DE FREQUÊNCIAS

Serão apresentados alguns conceitos importantes para a construção de tabelas de frequências.

Dados brutos: É o conjunto de dados numéricos obtidos e que ainda não foram

organizados.

Rol: É o arranjo dos dados brutos em ordem crescente (ou decrescente).

Amplitude (At): É a diferença entre o maior e o menor dos valores observados.

Frequência absoluta ( if ): É o número de vezes que um elemento aparece no conjunto de

dados:

k

1ii nf onde n é o número total de observações e k é o número de valores diferentes

observados.

Frequência Relativa ( rf ):

n

ff ir e 1f

k

1ir

Frequência Absoluta Acumulada ( acf ): É a soma da frequência absoluta do valor i assumida

pela variável com todas as frequências absolutas anteriores.

1.3.2.1 VARIÁVEL DISCRETA

Quando uma variável quantitativa discreta assume poucos valores, pode-se considerar que cada

valor seja uma classe e que existe uma ordem natural nessas classes.

Exemplo: Os dados que seguem apresentam os resultados da inspeção diária de todas as

unidades de computadores produzidos durante os últimos 10 dias. O número de unidades não-

conformes são: 4 - 7 - 5 - 8 - 6 - 6 - 4 - 5 - 8 - 7

SACHIKO ARAKI LIRA 7

TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS DO NÚMERO

DE UNIDADES NÃO CONFORMES DE COMPUTADORES

PRODUZIDOS DURANTE 10 DIAS

NÚMERO DE DEFEITOS FREQUÊNCIA

4 2

5 2

6 2

7 2

8 2

FONTE: MONTEGOMERY, D. C.

NOTA: A produção diária é de 100 computadores.

Número de Classes (k)

Quando se tratar de uma variável quantitativa discreta que pode assumir um grande número de

valores distintos, a construção da tabela de frequências e de gráficos considerando cada valor

como uma categoria fica inviável. A solução é agrupar os valores em classes ao elaborar a

tabela.

Segundo Bussab e Morettin, a escolha dos intervalos dependerá do conhecimento que o

pesquisador tem sobre os dados. Assim, a definição do número de intervalos ou classes é

arbitrária. Mas, vale lembrar que, quando se utiliza um pequeno número de intervalos pode-se

perder informações, e ao contrário, com um grande número de intervalos pode-se prejudicar o

resumo dos dados.

Existem duas soluções para a definição do número de intervalos bastante utillizadas, que são:

1) Se o número de elementos (n) for menor que 25 então o número de classes (k) é igual a 5; se

n for maior que 25, então o número de classes é aproximadamente a raiz quadrada positiva de

n. Ou seja:

Para n 25, k = 5

Para n > 25, k = n

2) Fórmula de Sturges para número de classes: )n(log3,31k .

Amplitude total ou “range” (At): É a diferença entre o maior e o menor valor observados no

conjunto de dados.

minmáxt XXA

Amplitude dos intervalos ou das classes (h): É a divisão da amplitude total (At) pelo número

de intervalos (k).

Ou seja: h k

At

ESTATÍSTICA DESCRITIVA 8

1.3.2.2 VARIÁVEL CONTÍNUA

Quando a variável quantitativa em estudo é contínua, que assume muitos valores distintos, o

agrupamento dos dados em classes será sempre necessário, na construção das tabelas de

frequências.

Exemplo 1: A tabela abaixo apresenta as medidas de uma dimensão de uma peça produzida por

um processo de usinagem. Construir a tabela de distribuição de frequências em classes.

102,8 - 136,4 - 110,1 - 115,9 - 118,5 - 149,3 - 125,3 - 144,8 - 129,7 - 132,7

135,0 – 108,2 - 138,1 - 138,6 - 139,6 - 144,4 - 125,9 - 145,2 - 145,7 – 120,4

ROL:

102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7

135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3

50,468,1023,149XXA minmáxt

5k

103,95

50,46

k

Ah t

TABELA DE DISTRIBUIÇÃO DE FREQUENCIAS DAS

MEDIDAS DE UMA DIMENSÃO DE UMA PEÇA PRODUZIDA

POR UM PROCESSO DE USINAGEM

INTERVALO DE

CLASSES if rf fac

102,8 |--- 112,8 3 0,15 3

112,8 |--- 122,8 3 0,15 6

122,8 |--- 132,8 4 0,20 10

132,8 |--- 142,8 5 0,25 15

142,8 |--- 152,8 5 0,25 20

TOTAL 20 1,00

FONTE: Elaborada pelo autor.

Exemplo 2: O tempo necessário para se realizar certa operação industrial foi cronometrado (em

segundos), sendo feita 30 determinações:

45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 - 34 - 45

41 - 57 - 38 - 46 - 46 - 58 - 57 - 36 - 58 - 35 - 31 - 59 - 44 - 57 - 35

SACHIKO ARAKI LIRA 9

ROL:

31 - 34 - 35 - 35 - 36 - 37 - 38 - 39 - 39 - 40 - 41 -41 - 43 - 44 - 45

45 - 45 - 45 - 46 - 46 - 48 - 49 - 51 - 53 - 57- 57 - 57 - 58 - 58 – 59

28,03159XXA minmáxt

65,87)30log(3,31k (fórmula de Sturges)

54,76

28

k

Ah t

TABELA DE DISTRIBUIÇÃO DE FREQUENCIAS DO TEMPO

NECESSÁRIO PARA SE REALIZAR CERTA OPERAÇÃO

INDUSTRIAL

INTERVALO DE

CLASSES if rf fac

31 |---- 36 4 0,13 4

36 |---- 41 6 0,20 10

41 |---- 46 8 0,27 18

46 |---- 51 4 0,13 22

51 |---- 56 2 0,07 24

56 |---- 61 6 0,20 30

TOTAL 30 1,00

FONTE: Elaborada pelo autor.

1.4 GRÁFICOS

1.4.1 REPRESENTAÇÃO GRÁFICA

O objetivo do gráfico é passar para o leitor uma visão clara do comportamento do fenômeno em

estudo, uma vez que os gráficos transmitem informação mais imediata do que uma tabela.

A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais:

a) Simplicidade: O gráfico deve ser destituído de detalhes de importância secundária.

b) Clareza: o gráfico deve possibilitar uma correta interpretação dos valores representativos do

fenômeno em estudo.

c) Veracidade: o gráfico deve ser a verdadeira expressão do fenômeno em estudo.

1.4.2 HISTOGRAMA DE FREQUÊNCIAS

Este é um gráfico usado para apresentar dados organizados em intervalos de classes, utilizado

principalmente para representar a distribuição de variáveis contínuas.

ESTATÍSTICA DESCRITIVA 10

1.4.3 DIAGRAMA DE RAMO E FOLHAS (STEM AND LEAF PLOT)

Este diagrama é muito útil para uma primeira análise dos dados.

Passos para construir um diagrama de ramo e folha:

1. ordenar os valores para encontrar o valor mínimo e máximo dos dados;

2. dividir cada número ix em duas partes: um ramo, consistindo em um ou mais dígitos iniciais, e

uma folha, consistindo nos dígitos restantes ;

3. listar os valores do ramo em uma coluna vertical;

4. a partir dai colocam-se os valores na folha . O valor zero, significa que há informação e que é

um número inteiro. Já, quando naquele valor inteiro não existe observações, não colocar nada,

deixar em branco;

5. escrever as unidades para o ramo e folhas no gráfico.

Considerando os dados do exemplo 1: Os dados referem-se às medidas de uma dimensão de

uma peça produzida por um processo de usinagem.

102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7

135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3

RAMO FOLHA FREQ.

10 2 8 2

11 0 5 8 3

12 0 5 5 9 4

13 2 5 6 8 8 9 6

14 4 4 5 5 9 5

HISTOGRAMA DE FREQUÊNCIAS

0

1

2

3

4

5

6

7

8

9

10

Classes

Freq.

76 105 134 163 221192 250

SACHIKO ARAKI LIRA 11

Considerando os dados do exemplo 2, tem-se: O tempo necessário para se realizar certa

operação industrial foi cronometrado (em segundos):

31 - 34 - 35 - 35 - 36 - 37 - 38 - 39 - 39 - 40 - 41 -41 - 43 - 44 - 45

45 - 45 - 45 - 46 - 46 - 48 - 49 - 51 - 53 - 57- 57 - 57 - 58 - 58 – 59

RAMO FOLHA FREQ.

3 1 4 5 5 6 7 8 9 9 9

4 0 1 1 3 4 5 5 5 5 6 6 8 9 13

5 1 3 7 7 7 8 8 9 8

1.4.4 GRÁFICO DE BOXPLOT OU DA CAIXA

* Valores extremos: valores maiores que 3 compri-mentos da caixa, a partir do Quartil 3

O Outliers: valores maiores que 1,5 comprimentos da caixa, a partir do Quartil 3

O

Outliers: valores menores que 1,5 comprimentos da caixa, a partir do Quartil 1

* Valores extremos: valores menores que 3 compri-mentos da caixa, a partir do Quartil 1

Comprimento da caixa = amplitude interquartílica = Q3 - Q1

A linha central do retângulo (“caixa”) representa a mediana da distribuição. As bordas superior e

inferior do retângulo representam os quartis 1 e 3, respectivamente. Logo, a altura deste

retângulo é chamada de amplitude interquartílica (IQ). Os traços horizontais ao final das linhas

verticais são traçados sobre o último ponto (de um lado ou de outro) que não é considerado um

outlier.

Não há um consenso sobre a definição de um outlier. Porém, no caso do boxplot em geral, a

maior parte das definições considera que pontos acima do valor do 3º quartil somado a 1,5 vezes

Quartil 2 = mediana

Quartil 1

Quartil 3

Menor valor que não é outlier

Maior valor que não é outlier

ESTATÍSTICA DESCRITIVA 12

a IQ ou os pontos abaixo do valor do 1º quartil diminuído de 1,5 vezes a IQ, são considerados

outliers.

1.4.5 GRÁFICO DE LINHAS

O gráfico de linhas é indicado para representar séries temporais ou sequência temporal, que é

um conjunto de dados em que as observações são registradas na ordem em que elas ocorrem.

Este tipo de gráfico é importante para a análise do controle de processo de produção e de

séries temporais.

A seguir, o gráfico de controle de média das medidas dos diâmetros internos (mm) de anéis de

pistão de motores de automóveis, de 25 amostras, cujos tamanhos de amostras variam entre 3

e 5.

1.5 MEDIDAS DE LOCALIZAÇÃO, VARIABILIDADE E FORMA DA

DISTRIBUIÇÃO

Estimador ou estatística é uma função dos valores da amostra, ou seja, é uma variável aleatória,

pois depende dos elementos selecionados para compor a amostra.

Ao analisarmos a distribuição de frequências de uma variável quantitativa, proveniente de uma

amostra, deve-se, verificar basicamente três características:

Localização;

Variabilidade ou Dispersão;

Forma.

SACHIKO ARAKI LIRA 13

1.5.1 TENDÊNCIA CENTRAL

As medidas de tendência central fazem parte, juntamente com as de posição, das chamadas

medidas de localização, e indicam onde se concentra a maioria dos dados.

1.5.1.1 ESPERANÇA MATEMÁTICA OU MÉDIA ARITMÉTICA

A esperança matemática ou média aritmética de uma variável aleatória X é o centro de

gravidade do conjunto de dados, e é definida como a soma de todos os valores da variável

dividida pelo número de observações.

a) Para dados simples

A esperança matemática ou média aritmética populacional é dada pela expressão:

N

1iix

N

1)X(E

A média aritmética amostral é obtida através da seguinte expressão:

n

1iix

n

1X

b) Para dados agrupados em classes

N

fx

)X(E

k

1ii i

(população)

onde: k é o número de classes;

ix é o ponto médio das classes.

n

fx

X

k

1ii i

(amostra)

onde: k é o número de classes;

ix é o ponto médio das classes.

Propriedades da Esperança Matemática

1. K)X(E)KX(E , sendo k=constante e X v.a.

2. )X(Ek)K.X(E

3. Sejam X e Y variáveis aleatórias. Então:

)Y(E)X(E)YX(E

4. Sejam X e Y variáveis aleatórias independentes. Então:

)Y(E.)X(E)Y.X(E

ESTATÍSTICA DESCRITIVA 14

5. 0)XX(E v.a. centrada

A média e os valores extremos: a média apresenta um grave problema, ela é fortemente

influenciada pelos valores extremos. Por esta razão, deve-se fazer uma análise cuidadosa dos

dados.

Exemplos de aplicação:

1) Suponha que um engenheiro esteja projetando um conector de náilon para ser usado em uma

aplicação automotiva. O engenheiro estabelece como especificação do projeto uma espessura

de 3/32 polegadas, mas está inseguro acerca do efeito dessa decisão na força da remoção do

conector.

Oito unidades do protótipo são produzidas e suas forças de remoção são medidas (em libras-pé):

12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1. A média da força de remoção será:

n

1iix

n

1X

0,138

1041,136,125,136,133,124,139,126,12

8

1X libras-força

2) Considere a seguinte distribuição:

TABELA DE DISTRIBUIÇÃO DE FREQUENCIAS DO TEMPO NECESSÁRIO PARA SE REALIZAR CERTA OPERAÇÃO INDUSTRIAL

INTERVALO DE

CLASSES if rf fac

31 |---- 36 4 0,13 4

36 |---- 41 6 0,20 10

41 |---- 46 8 0,27 18

46 |---- 51 4 0,13 22

51 |---- 56 2 0,07 24

56 |---- 61 6 0,20 30

TOTAL 30 1,00

FONTE: Elaborada pelo autor.

Calcular o tempo médio necessário para realizar a operação industrial.

Solução:

INTERVALO DE

CLASSES if ix iifx

31 |---- 36 4 33,5 134,0

36 |---- 41 6 38,5 231,0

41 |---- 46 8 43,5 348,0

46 |---- 51 4 48,5 194,0

51 |---- 56 2 53,5 107,0

56 |---- 61 6 58,5 351,0

TOTAL 30 1365,0

SACHIKO ARAKI LIRA 15

45,5030

1365

n

fx

X

k

1ii i

3) Seja a distribuição de frequências a seguir. Calcular a média das medidas da dimensão das

peças.

TABELA DE DISTRIBUIÇÃO DE FREQUENCIAS DAS MEDIDAS DE UMA DIMENSÃO DE UMA PEÇA PRODUZIDA POR UM PROCESSO DE USINAGEM

INTERVALO DE

CLASSES if rf fac

102,8 |--- 112,8 3 0,15 3

112,8 |--- 122,8 3 0,15 6

122,8 |--- 132,8 4 0,20 10

132,8 |--- 142,8 5 0,25 15

142,8 |--- 152,8 5 0,25 20

TOTAL 20 1,00

FONTE: Elaborada pelo autor.

INTERVALO DE

CLASSES if ix iifx

102,8 |--- 112,8 3 107,8 323,4

112,8 |--- 122,8 3 117,8 353,4

122,8 |--- 132,8 4 127,8 511,2

132,8 |--- 142,8 5 137,8 689,0

142,8 |--- 152,8 5 147,8 739,0

TOTAL 20 2616,0

130,820

2616

n

fx

X

k

1ii i

1.5.1.2 MEDIANA

A mediana é o valor que ocupa a posição central do conjunto de observações de uma variável,

dividindo o conjunto em duas partes iguais, sendo que 50% dos dados tomam valores menores

ou iguais ao valor da mediana e os 50% restantes, acima do seu valor.

ESTATÍSTICA DESCRITIVA 16

a) Para dados simples

Etapas para a obtenção da mediana:

1. ordenar os dados em ordem crescente (pode ser também na ordem decrescente, mas não é

comum e pode atrapalhar na hora de calcular as medidas de posição)

2. o lugar ou posição que a mediana ocupa é:

14

)1n(2PosM e

3. o valor da mediana é o valor da variável que ocupa o lugar ePosM .

A mediana é independente dos valores extremos, porque ela só leva em consideração os

valores de posição central.

Exemplo de aplicação:

1) Considerando-se as forças de remoção, medidas em uma amostra de oito unidades do protótipo

(em libras-força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1.

Rol: 12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6

5,414

)18(2PosMe

A mediana é a média aritmética dos valores que ocupam a posição 4 e 5. Logo,

13,02

1,139,12Me

2) Os dados que seguem são os resultados da inspeção diária de todas as unidades de

computadores produzidos durante os últimos 10 dias. O número de unidades não-conformes são:

4 - 7 - 5 - 8 - 6 - 6 - 4 - 5 - 8 - 7

Calcular a mediana.

Rol: 4 - 4 - 5 - 5 - 6 - 6 - 7 - 7 - 8 - 8

5,514

)110(2PosMe

62

66Me

b) Dados agrupados em classes

hf

fac)2n(LM

iie

SACHIKO ARAKI LIRA 17

onde:

iL é o limite inferior da classe que contém a mediana;

n é o número de elementos do conjunto de dados;

fac' é a freqüência acumulada da classe anterior a que contém a mediana;

if é a freqüência simples da classe que contém a mediana;

h é o intervalo ou amplitude da classe que contém a mediana.

1) Seja a distribuição de frequências a seguir. Calcular a mediana das medidas da dimensão

das peças.

INTERVALO DE

CLASSES if

102,8 |--- 112,8 3

112,8 |--- 122,8 3

122,8 |--- 132,8 4

132,8 |--- 142,8 5

142,8 |--- 152,8 5

TOTAL 20

Solução:

1) O passo inicial é calcular 102

20

2

n ;

2) Calcular as frequências acumuladas ( acf ).

INTERVALO DE

CLASSES if acf

102,8 |--- 112,8 3 3

112,8 |--- 122,8 3 6

122,8 |--- 132,8 4 10

132,8 |--- 142,8 5 15

142,8 |--- 152,8 5 20

TOTAL 20

hf

fac)2n(LM

iie

132,8104

6)220(8,122Me

ESTATÍSTICA DESCRITIVA 18

2) Considerando a distribuição a seguir, calcular a mediana.

INTERVALO DE

CLASSES if

31 |---- 36 4

36 |---- 41 6

41 |---- 46 8

46 |---- 51 4

51 |---- 56 2

56 |---- 61 6

TOTAL 30

Solução:

INTERVALO DE

CLASSES if acf

31 |---- 36 4 4

36 |---- 41 6 10

41 |---- 46 8 18

46 |---- 51 4 22

51 |---- 56 2 14

56 |---- 61 6 30

TOTAL 30

152

30

2

n

hf

fac)2n(LM

i

ie

44,12558

10)15(41Me

1.5.1.3 MODA

a) Para dados simples

A moda, representada por oM , é o valor que apresenta maior frequência. Ela pode não existir

(distribuição amodal), ter somente um valor (unimodal) ou pode ter dois ou mais (bimodal ou

multimodal), principalmente quando a variável assume muitos valores.

Exemplo:

1) Considerando-se as forças de remoção, medidas em uma amostra de oito unidades do protótipo

(em libras-força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1.

Para o exemplo tem-se que a moda é igual a 12,6 libras-força.

SACHIKO ARAKI LIRA 19

b) Dados agrupados em classes

X2M3M eo ( moda de Pearson)

onde:

eM é a mediana da distribuição de dados;

X é a média da distribuição de dados.

1) Dada a distribuição de freqüências a seguir, calcular a moda.

INTERVALO DE

CLASSES if

31 |---- 36 4

36 |---- 41 6

41 |---- 46 8

46 |---- 51 4

51 |---- 56 2

56 |---- 61 6

TOTAL 30

Solução:

Tem-se que a média e a mediana da distribuição são, respectivamente:

45,50X

44,125Me

Logo, a moda será: 41,37550,452125,443X2M3M eo

2) Seja a distribuição de frequências a seguir. Calcular a moda das medidas da dimensão das

peças.

INTERVALO DE

CLASSES if

102,8 |--- 112,8 3

112,8 |--- 122,8 3

122,8 |--- 132,8 4

132,8 |--- 142,8 5

142,8 |--- 152,8 5

TOTAL 20

Solução:

Tem-se que a média e a mediana da distribuição são, respectivamente:

ESTATÍSTICA DESCRITIVA 20

130,8X

132,8104

6)220(8,122Me

136,88,13028,1323X2M3M eo

1.5.2 MEDIDAS DE POSIÇÃO (OU SEPARATRIZES)

As separatrizes mais conhecidas são os quartis e os percentis. Os quartis dividem o conjunto de

dados em quatro partes iguais e os percentis, em cem partes iguais. A cada quartil

correspondem 25% do conjunto de dados e a percentil, 1%.

Da mesma forma que para a mediana, as posições das separatrizes, para dados ordenados em

ordem crescente.

1.5.2.1 QUARTIL

São três medidas )QeQ,Q( 321 que dividem o conjunto de dados em 4 partes iguais, sendo

que a cada quartil correspondem 25% dos dados.

a) Para dados simples

14

)1n(iPosQ i

, 3,2,1i

Exemplo 1: Os dados a seguir são diâmetros (em cm) de peças de automóveis:

12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0

Calcular os quartis.

3,014

)19(1PosQ1

(3º elemento) , logo 6,12Q1

5,014

)19(2PosQ2

(5º elemento) , logo 1,13Q2

7,0 14

)19(3PosQ3

(7º elemento) , logo 5,13Q3

Exemplo 2: Os dados abaixo são as medidas de uma dimensão de uma peça produzida por um

processo de usinagem.

102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7

135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3

Calcular os quartis (1,2 e 3) .

SACHIKO ARAKI LIRA 21

5,7514

)120(1PosQ1

(5,75º elemento) ,

logo 119,92575,0*)5,1184,120(5,118Q1

10,514

)120(2PosQ2

(10,5º elemento) ,

logo 133,855,0*)7,1320,135(7,132Q2

15,25 14

)120(3PosQ3

(15,25º elemento) ,

logo 140,8025,0*)6,1394,144(6,139Q3

b) Para dados agrupados em classes

4

niPosQ i , 3,2,1i

hf

fac)PosQ(LQ

i

iii

onde:

n é o número de elementos do conjunto de dados;

iL é o limite inferior da classe que contém o quartil;

fac' é a freqüência acumulada da classe anterior a que contém o quartil;

if é a freqüência simples da classe que contém o quartil;

h é o intervalo ou amplitude da classe que contém a mediana.

Exemplos:

1) Seja a distribuição de frequências a seguir. Calcular os quartis 1,2 e 3, das medidas da

dimensão das peças.

INTERVALO DE

CLASSES if acf

102,8 |--- 112,8 3 3

112,8 |--- 122,8 3 6

122,8 |--- 132,8 4 10

132,8 |--- 142,8 5 15

142,8 |--- 152,8 5 20

TOTAL 20

Solução:

a) 54

201PosQ1

ESTATÍSTICA DESCRITIVA 22

119,47103

358,1121Q

104

202PosQ2

132,80104

6108,1222Q

154

203PosQ3

142,80105

10158,132Q3

2) Dada a distribuição de freqüências a seguir, calcular os quartis 1,2 e 3.

INTERVALO DE

CLASSES if

31 |---- 36 4

36 |---- 41 6

41 |---- 46 8

46 |---- 51 4

51 |---- 56 2

56 |---- 61 6

TOTAL 30

1.5.3 MEDIDAS DE DISPERSÃO

Para descrever adequadamente a distribuição de freqüências de uma variável quantitativa, além

da informação do valor representativo da variável (tendência central), é necessário dizer também

o quanto estes valores variam, ou seja, o quanto eles são dispersos. Somente a informação

sobre a tendência central de um conjunto de dados não consegue representá-lo

adequadamente. As medidas de dispersão medem o grau de variabilidade ou dispersão dos

dados.

1.5.3.1 AMPLITUDE TOTAL

A amplitude total mede a distância entre o valor máximo e mínimo. Ela é uma estatística

rudimentar, pois embora forneça uma noção de dispersão, não diz qual é sua natureza.

minmáxt XXA

Exemplo de aplicação:

Exemplo 1: Os dados a seguir são diâmetros (em cm) de peças de automóveis:

12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0

Tem-se que:

SACHIKO ARAKI LIRA 23

7,23,120,15XXA minmáxt

1.5.3.2 AMPLITUDE INTERQUARTIL

A amplitude interquartil, ou comprimento da caixa, é a distância entre o primeiro e terceiro

quartil. É muito útil para detectar valores extremos, e é usado no diagrama de Boxplot.

13 QQQI

Exemplo: considerando o dados referentes aos diâmetros (em cm) de peças de automóveis e os

quartis correspondentes, já calculados anteriormente, calcular a amplitude interquartil.

3,014

)19(1PosQ1

(3º elemento) , logo 6,12Q1

7,0 14

)19(3PosQ3

(7º elemento) , logo 5,13Q3

9,06,125,13IQ

Para a construção do gráfico Box plot, tem-se:

IQ5,1Qeriorinfitelim 1

IQ5,1Qeriorsupitelim 3

Para o exemplo em questão:

25,119,05,16,12eriorinfitelim

85,149,05,15,13eriorsupitelim

Existe um valor outlier, que é 15,0.

1.5.3.3 DESVIO MÉDIO

a) Para dados simples

O desvio médio é a média dos valores absolutos dos desvios. É calculada através da

expressão:

n

Xx

DM

n

1ii

Exemplo de aplicação:

Os dados a seguir são diâmetros (em cm) de peças de automóveis:

12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0. Tem-se que: 22,13X

ESTATÍSTICA DESCRITIVA 24

QUADRO 3 - VALORES DA VARIÁVEL X E DESVIOS ABSOLUTOS EM RELAÇÃO À MÉDIA

ix Xx i

12,3 0,92 12,6 0,62 12,6 0,62 12,9 0,32 13,1 0,12 13,4 0,18 13,5 0,28 13,6 0,38 15,0 1,78

5,22

58,09

22,5

n

Xx

DM

n

1ii

b) Para dados agrupados em classes

n

fXx

DM

k

1iii

Dada a distribuição de freqüências a seguir, calcular o desvio médio. Sabe-se que

50,45X .

INTERVALO DE

CLASSES if ix Xx i ii fXx

31 |---- 36 4 33,5 12,0 48

36 |---- 41 6 38,5 7,0 42

41 |---- 46 8 43,5 2,0 16

46 |---- 51 4 48,5 3,0 12

51 |---- 56 2 53,5 8,0 16

56 |---- 61 6 58,5 13,0 78

TOTAL 30 212

07,70667,730

212

n

fXx

DM

k

1iii

1.5.3.4 VARIÂNCIA E DESVIO PADRÃO

A variância da variável aleatória, representada por )X(V ou 2 , é obtida elevando-se os desvios

em relação à media ao quadrado. Quando se extrai a raiz quadrada da variância, tem-se o

desvio padrão.

Propriedades da Variância

1. 0)k(V , onde k=constante

SACHIKO ARAKI LIRA 25

2. )X(Vk)kX(V 2 , onde k=constante e X v.a.

3. Sejam X e Y v.a. independentes. Então:

)Y(V)X(V)YX(V

4. Sejam X e Y v.a. não independentes (ou dependentes). Então:

)Y,X(COV2)Y(V)X(V)YX(V

)Y,X(COV2)Y(V)X(V)YX(V

onde: )Y(E)X(E)XY(E)Y,X(COV (covariância)

a) Para dados simples

A variância e o desvio padrão populacional são obtidas pelas expressões:

N

1i

22ix

N

1 (variância)

2 (desvio padrão)

A variância e o desvio padrão amostral são obtidas pelas expressões:

n

1i

22 Xx

1n

1S i (variância)

2SS (desvio padrão)

Exemplo de aplicação: Considerando o exemplo tem-se:

QUADRO 4 - VALORES DA VARIÁVEL X E DESVIOS SIMPLES E QUADRÁTICOS EM RELAÇÃO À MÉDIA

iX Xx i 2Xx i

12,3 -0,92 0,8464 12,6 -0,62 0,3844 12,6 -0,62 0,3844 12,9 -0,32 0,1024 13,1 -0,12 0,0144 13,4 0,18 0,0324 13,5 0,28 0,0784 13,6 0,38 0,1444 15,0 1,78 3,1684

5,1556

0,644519

1556,5Xx

1n

1S

n

1ii

22

0,80S

b) Para dados agrupados em classes

A variância e o desvio padrão populacional são obtidas pelas expressões:

ESTATÍSTICA DESCRITIVA 26

N

fx

f

fxk

1i

2

i

k

1i

k

1i

2

i2

i

i

i

(variância)

2 (desvio padrão)

A variância e o desvio padrão amostral são obtidas pelas expressões:

1n

fXx

1f

fXx

S

k

1i

2

i

k

1i

k

1i

2

i2

i

i

i

(variância)

2SS (desvio padrão)

Exemplo:

Seja a distribuição de frequências a seguir. Calcular variância e o desvio padrão.

INTERVALO DE

CLASSES if ix if)Xx( 2

i

102,8 |--- 112,8 3 107,8 1587,0

112,8 |--- 122,8 3 117,8 507,0

122,8 |--- 132,8 4 127,8 36,0

132,8 |--- 142,8 5 137,8 245,0

142,8 |--- 152,8 5 147,8 1445,0

TOTAL 20 3820,0

Dados: 130,8X

0526,201

120

3820

1n

fXx

S

k

1i

2

i2

i

18,14S

Exercício: Dada a distribuição de freqüências a seguir, calcular a variância e o desvio padrão.

INTERVALO DE

CLASSES if

31 |---- 36 4

36 |---- 41 6

41 |---- 46 8

46 |---- 51 4

51 |---- 56 2

56 |---- 61 6

TOTAL 30

SACHIKO ARAKI LIRA 27

1.5.3.5 COEFICIENTE DE VARIAÇÃO

É uma medida de dispersão relativa. É definido como o quociente entre o desvio padrão e a

média, multiplicado por 100, para expressar porcentagem.

Em algumas situações é desejável comparar o grau de dispersão de dois conjuntos de dados

com unidades de medidas diferentes. Neste caso, deve-se usar o coeficiente de variação (CV),

que é uma medida de dispersão relativa, e ela não é afetada pelas unidades de medida da

variável. Ou ainda, quando as médias dos dois conjuntos de dados são muito distintas, neste

caso faz-se necessário utilizar uma medida de dispersão relativa.

100CV

coeficiente de variação populacional

100X

SCV coeficiente de variação amostral

Exemplo de aplicação: Para o exemplo tem-se:

Dados: 130,8X ; 18,14S

Logo, %84,101008,130

18,14CV

1.5.4 FORMA DA DISTRIBUIÇÃO

A distribuição de freqüências de uma variável pode ter várias formas, mas existem três formas

básicas, apresentadas através de histogramas e suas respectivas ogivas, que são gráficos

específicos para distribuições de frequências.

A distribuição é simétrica, quando as observações estão igualmente distribuídas em torno de um

valor mais frequente (metade acima e metade abaixo). Já, a assimetria de uma distribuição pode

ocorrer de duas formas:

assimetria positiva;

assimetria negativa.

Em alguns casos, apenas o conhecimento da forma da distribuição de freqüências de uma

variável já nos fornece uma boa informação sobre o comportamento dessa variável.

1.5.4.1 COEFICIENTE DO MOMENTO DE ASSIMETRIA

23

i2

i3

i

k

1ii

k

1i3

f)Xx(n

1

f)Xx(n

1

a

Uma distribuição é classificada como:

ESTATÍSTICA DESCRITIVA 28

Simétrica: 0As e tem-se que média=mediana=moda

Assimétrica negativa: 0As e tem-se que média mediana moda

Assimétrica positiva: 0As e tem-se que moda mediana média

Graficamente:

FIGURA 3: CLASSIFICAÇÃO DAS DISTRIBUIÇÕES QUANTO A ASSIMETRIA

1.5.4.2 COEFICIENTE DO MOMENTO DE CURTOSE

A medida de curtose é o grau de achatamento da distribuição, é um indicador da forma desta

distribuição. O coeficiente momento de curtose é definido como sendo:

2k

1i

2

k

1i

4

4

ii

ii

f)Xx(n

1

f)Xx(n

1

a

Se 3a4 , a distribuição é platicúrtica e esta apresenta uma curva de freqüência mais

aberta, com os dados fracamente concentrados em torno de seu centro.

Se 3a4 , a distribuição é mesocúrtica e os dados estão razoavelmente concentrados em

torno de seu centro.

Se 3a4 , a distribuição é leptocúrtica e esta apresenta uma curva de freqüência bastante

fechada, com os dados fortemente concentrados em torno de seu centro.

A curtose ou achatamento é mais uma medida com a finalidade de complementar a

caracterização da dispersão em uma distribuição. Esta medida quantifica a concentração ou

dispersão dos valores de um conjunto de dados em relação às medidas de tendência central em

uma distribuição de freqüências. Uma distribuição é classificada quanto ao grau de achatamento

como:

Assimetria positiva Simétrica Assimetria negativa

SACHIKO ARAKI LIRA 29

Exemplo 1: Para a distribuição de frequências das medidas da dimensão das peças

apresentadas a seguir e as estatísticas já calculadas anteriormente, calcular os coeficientes de

assimetria e curtose.

INTERVALO DE

CLASSES if

102,8 |--- 112,8 3

112,8 |--- 122,8 3

122,8 |--- 132,8 4

132,8 |--- 142,8 5

142,8 |--- 152,8 5

TOTAL 20

Solução:

INTERVALO DE

CLASSES if ix )Xx( i ii f)Xx( i

2i f)Xx( i

3i f)Xx( i

4i f)Xx(

102,8 |--- 112,8 3 107,8 -23 -69 1.587 -3.6501 839.523

112,8 |--- 122,8 3 117,8 -13 -39 507 -6.591 85.683

122,8 |--- 132,8 4 127,8 -3 -12 36 -108 324

132,8 |--- 142,8 5 137,8 7 35 245 1.715 12.005

142,8 |--- 152,8 5 147,8 17 85 1.445 24.565 417.605

TOTAL 20 0 3.820 -16.920 1.355.140

-0,3205

820.320

1

)920.16(20

1

f)Xx(n

1

f)Xx(n

1

a23

2

3

23

i

k

1ii

k

1iii

3

A distribuição apresenta assimetria negativa.

Leptocúrtica Mesocúrtica Platicúrtica

ESTATÍSTICA DESCRITIVA 30

1,8573

820.320

1

140.355.120

1

f)Xx(n

1

f)Xx(n

1

a22

i2

i

i4

i

k

1i

k

1i4

A distribuição é platicúrtica.

Exemplo 2: Dada a distribuição de freqüências a seguir, calcular a assimetria e curtose.

INTERVALO DE

CLASSES if

31 |---- 36 4

36 |---- 41 6

41 |---- 46 8

46 |---- 51 4

51 |---- 56 2

56 |---- 61 6

TOTAL 30

Solução:

INTERVALO DE

CLASSES if ix )Xx( i ii f)Xx( i

2i f)Xx( i

3i f)Xx( i

4i f)Xx(

31 |---- 36 4 33,5 -12 -48 576 -6.912 82.944

36 |---- 41 6 38,5 -7 -42 294 -2.058 14.406

41 |---- 46 8 43,5 -2 -16 32 -64 128

46 |---- 51 4 48,5 3 12 36 108 324

51 |---- 56 2 53,5 8 16 128 1.024 8.192

56 |---- 61 6 58,5 13 78 1.014 13.182 171.366

TOTAL 20 0 2.080 5.280 277.360

0,2489

080.220

1

)280.5(20

1

f)Xx(n

1

f)Xx(n

1

a23

2

3

23

i

k

1ii

k

1iii

3

A distribuição apresenta assimetria ligeiramente positiva.

1,2822

080.220

1

360.27720

1

f)Xx(n

1

f)Xx(n

1

a22

i2

i

i4

i

k

1i

k

1i4

A distribuição é platicúrtica.

SACHIKO ARAKI LIRA 31

LISTA DE EXERCÍCIOS NO. 1 – ESTATÍSTICA DESCRITIVA

1. Conceitue:

a) População ou Universo;

b) Amostra;

c) Parâmetro;

d) Estatística ou medida amostral;

e) Variável aleatória discreta e exemplifique;

f) Variável aleatória contínua e exemplifique.

2. Uma importante característica de qualidade da água é a concentração de material sólido

suspenso. Em seguida são apresentadas 30 medidas de sólidos suspensos de um certo lago.

42,4 - 65,7 - 29,8 - 58,7 - 52,1 - 55,8 - 57,0 - 68,7 - 67,3 - 67,3 - 54,3 - 54,0 - 73,1 - 81,3 - 59,9

56,9 - 62,2 - 69,9 - 66,9 - 59,0 - 56,3 - 43,3 - 57,4 - 45,3 - 80,1 - 49,7 - 42,8 - 42,4 - 59,6 - 65,8

a) construir a distribuição de freqüências em classes;

b) calcular as freqüências relativa e acumulada;

c) construir o histograma de freqüências.

3. O tempo necessário para se realizar certa operação industrial foi cronometrado (em

segundos), sendo feita 40 determinações:

45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 – 34 - 45 - 35

41 - 57 - 38 - 46 - 46 - 58 - 57 - 36 - 58 - 35 - 31 - 59 - 44 - 57 - 45 - 44

38 - 43 - 33 - 56 - 47 - 48 - 44 - 49

a) construir a distribuição de freqüências em classes;

b) calcular as freqüências relativa e acumulada;

c) construir o histograma de freqüências.

4. Foram obtidos oito medidas do diâmetro interno de anéis de pistão forjados de um motor de

um automóvel. Os dados (em mm) são:

74,001 - 74,003 - 74,015 - 74,000 - 74,005 - 74,002 - 74,005 - 74,004

Calcule a média, a mediana, a moda, o desvio médio , o desvio padrão e o coeficiente de

variação da amostra.

5. Os tempos de esgotamento de um fluído isolante entre eletrodos a 34 kV, em minutos são:

0,19 - 0,78 - 0,96 - 1,31 - 2,78 - 3,16 - 4,15 - 4,67 - 4,85 - 6,50 - 7,35 - 8,01 - 8,27 - 12,06 - 31,75 -

32,52 - 33,91 - 36,71 - 72,89.

Calcule a média, mediana, quartil 1, quartil 3, desvio padrão e coeficiente de variação ecomente

os resultados obtidos.

6. O pH de uma solução é medido oito vezes por uma operadora que usa o mesmo instrumento.

Ela obteve os seguintes dados:

7,15 - 7,20 - 7,18 - 7,19 - 7,21 - 7,20 -7,16 - 7,18

Faça uma análise estatística dos dados e comente.

ESTATÍSTICA DESCRITIVA 32

7. Prevenir a propagação de trinca de fadiga em estruturas de aviões é um importante

elemento de segurança em aeronaves. Um estudo de engenharia para investigar a trinca de

fadiga em n=9 asas reportou os seguintes comprimentos (em mm) de trinca:

2,13 - 2,96 - 3,02 - 1,82 - 1,15 - 1,37 - 2,04 - 2,47 - 2,60

Calcule a média, os quartis (1,2 e 3), o desvio padrão e o coeficiente de variação da

amostra. Comente os resultados obtidos.

8. Uma amostra de 7 corpos de prova de concreto forneceu as seguintes resistências à ruptura

( 2cm/kg ) :

340 - 329 - 337 - 348 - 351 - 360 - 354

Calcular a média, mediana, moda, variância, desvio padrão e coeficiente de variação. Comente

os resultados obtidos.

9. O tempo necessário para se realizar certa operação industrial foi cronometrado (em

segundos), sendo feita 20 determinações:

45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 – 34 - 45 - 35 - 38 - 46 - 46 - 58

Faça uma análise estatística dos dados construindo a distribuição de freqüências em

classes(calcule também as medidas de assimetria e curtose).

10. As taxas de octanagem de combustível para motor, de várias misturas de gasolina foram

obtidas:

88,5 - 94,7 - 84,3 - 90,1 - 89,0 - 89,8 - 91,6 - 90,3 - 90,0 - 91,5 - 89,9

98,8 - 88,3 - 90,4 - 91,2 - 90,6 - 92,2 - 87,7 - 91,1 - 86,7 - 93,4 - 96,1

Faça uma análise estatística dos dados (calcule também as medidas de assimetria e curtose).

11. A propagação de trincas por fadiga em diversas peças de aeronaves tem sido objeto de

muitos estudos. Os dados a seguir consistem dos tempos de propagação (horas de vôo/104)

para atingir um determinado tamanho de trinca em furos de fixadores propostos para uso em

aeronaves militares.

0,736 - 0,863 - 0,865 - 0,913 - 0,915 - 0,937 - 0,983 - 1,007

1,011 - 1,064 - 1,109 -1,132 - 1,140 - 1,153 - 1,253 - 1,394

a) Calcule e compare os valores da média e mediana amostrais;

b) calcule o desvio médio, desvio padrão e o coeficiente de variação;

c) qual é a conclusão sobre a forma da distribuição (assimetria e curtose)?

12. O tempo necessário para se realizar certa operação industrial foi cronometrado (em

segundos), sendo feita 12 medições:

45 – 37 – 39 – 48 – 51 – 40 - 53 – 49 – 39 – 41- 45 – 43

a) calcular Q1 (quartil 1), Q2 (quartil 2) e Q3 (quartil 3);

b) construir o gráfico Boxplot.

SACHIKO ARAKI LIRA 33

13. As taxas de octanagem de combustível para motor, de várias misturas de gasolina foram

obtidas: 88,5 - 94,7 – 80,0 - 90,1 - 89,0 - 89,8 - 91,6 - 90,3 - 90,0 - 91,5 - 89,9

a) calcular Q1 (quartil 1), Q2 (quartil 2) e Q3 (quartil 3);

b) construir o gráfico Boxplot.

ELEMENTOS DE PROBABILIDADES 34

ELEMENTOS DE PROBABILIDADES

DEFINIÇÕES

2.1 EXPERIMENTO ALEATÓRIO (E)

Definição 1: É o fenômeno que, mesmo repetidos várias vezes sob condições semelhantes,

apresentam resultados imprevisíveis. O resultado final depende do acaso.

2.2 ESPAÇO AMOSTRAL (S)

Definição 2: É o conjunto formado por todos os resultados possíveis em qualquer experimento

aleatório.

Exemplos:

a) Inspecionar de uma peça de automóvel. conformenão,conformeS ;

b) Tomar uma válvula eletrônica e verificar o tempo de vida. 0x,RxS ;

c) Inspeçionar uma lâmpada. defeituosanão,defeituosaS ;

d) Medir o conteúdo de cobre no latão. %90x%50,RxS

2.3 EVENTO

Definição 3: É um subconjunto do espaço amostral S de um experimento aleatório.

Exemplo:

Seja o espaço amostral )n,n(),c,n(),n,c(),c,c(S , resultado do experimento de seleção de

duas peças, sendo c=peça conforme e n=peça não conforme.

Suponha que A seja o subconjunto de resultados para os quais, no mínimo uma peça seja

conforme. Então o evento A será: )c,n(,)n,c(),c,c(A .

S

A

SACHIKO ARAKI LIRA 35

Por serem subconjuntos, é possível realizar a operação de união (U) entre conjuntos. A União

de Eventos representa a ocorrência de um evento OU de outro. Outra operação que pode ser

feita sobre Eventos é a intersecção (∩). A intersecção de eventos representa a ocorrência de

um E de outro.

União de eventos => BA

Interseção de eventos => BA

2.3.1 EVENTO COMPLEMENTAR

O evento complementar do evento A, representado por A , é aquele que ocorre somente

se A deixar de ocorrer. E tem-se que:

SAAAA => 1)AA(P

AAAA Ø => 0)AA(P

Seja o evento A, obter número 4 na face superior no lançamento de um dado 4A . O

evento complementar A será: 6,5,3,2,1A

2.3.2 EVENTOS INDEPENDENTES

Quando a realização ou não realização de um dos eventos não afeta a probabilidade da

realização do outro e vice-versa.

Exemplos:

1) No lançamento de dois dados qual é a probabilidade de obter o nº 4 no primeiro dado e o nº

3 no segundo dado ?

61)1dadono4.no(P)1(P

61)2dadono3.no(P)2(P

3616161)2(P)1(P)2E1(P)21(P

A

B

A

B

BA

ELEMENTOS DE PROBABILIDADES 36

2) Suponha que numa produção diária de 850 peças fabricadas contenha 50 peças que não

satisfaçam as exigências dos consumidores. Duas peças são selecionadas, sendo que a

primeira peça é reposta antes da segunda ser selecionada. Qual é a probabilidade das duas

peças serem defeituosas?

%35,00035,0850

50

850

50)DeD(P

2.3.3 EVENTOS MUTUAMENTE EXCLUSIVOS

Dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a

realização do(s) outro(s). Assim, no lançamento de uma moeda, o evento "tirar cara" e o evento

"tirar coroa" são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.

Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se

realize é igual à soma das probabilidades de que cada um deles se realize:

)B(P)A(P)BOUA(P)BA(P

Exemplos:

1) No lançamento de um dado qual a probabilidade de se tirar o nº 3 ou o nº 4 ?

Os dois eventos são mutuamente exclusivos então:

316161)4.no(P)3.no(P)BOUA(P)BA(P

2) Um parafuso é selecionado aleatoriamente de um lote de 100 parafusos, sendo que 15

apresentam pequenos defeitos e 10 são não-conformes (não aceitáveis). Qual é a probabilidade

do parafuso selecionado ser:

a) Perfeito ou apresentar pequeno defeito?

b) Apresentar pequeno defeito ou não-conforme?

Solução:

15,0100

15)defeitopequeno(P

10,0100

10)conformenão(P

A B

S

SACHIKO ARAKI LIRA 37

75,0100

75)perfeito(P

a) 90,0100

15

100

75)defeitopequenoouperfeito(P

b) 25,0100

10

100

15)conformenãooudefeitopequeno(P

2.4 DEFINIÇÃO CLÁSSICA DE PROBABILIDADE

Seja A um subconjunto do espaço amostral S. Então, se todos os resultados elementares de S

são equiprováveis, a medida da probabilidade de ocorrência do evento A é dada por:

)S(n

)A(n

Semelementosdenúmero

Aemelementosdenúmero)A(P

2.5 DEFINIÇÃO AXIOMÁTICA DE PROBABILIDADE

Seja o espaço amostral S associado a um certo experimento. A cada evento SA

associa-se um número real representado por )A(P , chamado de probabilidade de A ,

satisfazendo as propriedades:

1) 1)A(P0

2) 1)S(P (ou seja, a probabilidade do evento certo é igual a 1 )

3) sejam A e B dois eventos mutuamente exclusivos. A probabilidade de ocorrência de A ou B

é igual à soma das probabilidades individuais.

)B(P)A(P)BouA(P

2.6 PROBABILIDADE CONDICIONAL

Definição 4: Sejam A e B eventos de um experimento E, com 0)B(P . Então a probabilidade

condicional do evento A dado que B tenha ocorrido é:

)B(P

)BA(P)B|A(P

, EA

Exemplo: A tabela a seguir fornece um exemplo de 400 itens classificados por falhas na

superfície e como defeituosos (funcionalmente).

DEFEITUOSO FALHAS NA SUPERFÍCIE

Sim Não TOTAL

Sim 10 18 28 Não 30 342 372 TOTAL 40 360 400

ELEMENTOS DE PROBABILIDADES 38

a) Qual é a probabilidade do item ser defeituoso, dado que apresenta falhas na superfície?

b) Qual é a probabilidade de ter falhas na superfície dado que é defeituoso?

Solução:

A Probabilidade Condicional pode assumir a forma abaixo, chamada algumas vezes de

teorema da multiplicação de probabilidades:

)B(P)B|A(P)BA(P , ou de forma equivalente, )A(P)A|B(P)BA(P

Exemplo: A probabilidade de que o primeiro estágio de uma operação,numericamente

controlada, de usinagem para pistões com alta rpm atenda às especificações é igual a 0,90.

Falhas são devido a variações no metal, alinhamento de acessórios, condições da lâmina de

corte, vibração e condições ambientais. Dado que o primeiro estágio atende às especificações, a

probabilidade de que o segundo estágio de usinagem atenda à especificações é de 0,95. Qual a

probabilidade de ambos os estágios atenderem as especificações?

855,090,095,0)A(P)A|B(P)BA(P

2.7 TEOREMA DA PROBABILIDADE TOTAL

Suponha que eventos aleatórios k21 A,,A,A sejam k conjuntos mutuamente

exclusivos e exaustivos )S...,AAA( k21 . Então:

i

ii )A|B(P).A(P)B(P

Exemplos:

1) A probabilidade de que um conector elétrico que seja mantido seco falhe durante o período de

garantia de um computador portátil é 1%. Se o conector for molhado, a probabilidade de falha

durante o período de garantia será de 5%. Se 90% dos conectores forem mantidos secos e 10%

forem mantidos molhados, qual é a probabilidade dos conectores falharem durante o período da

garantia?

Solução:

SACHIKO ARAKI LIRA 39

2) Suponha que na fabricação de semicondutores, a probabilidade seja de 0,10 de que um chip

que esteja sujeito a altos níveis de contaminação durante a fabricação cause uma falha no

produto. A probabilidade é de 0,005 de que um chip que não esteja sujeito a altos níveis de

contaminação durante a fabricação cause uma falha no produto. Em um dado instante da

produção, 20% dos chips estão sujeitos a altos níveis de contaminação. Qual a probabilidade de

um produto usando um desses chips vir a falhar?

Solução:

2.8 TEOREMA DE BAYES

Uma das relações mais importantes envolvendo probabilidades condicionais é dada pelo

teorema de Bayes, que expressa uma probabilidade condicional em termos de outras

probabilidades condicionais.

k

1jjj

iii

)A|B(P).A(P

)A|B(P).A(P)B|A(P

Exemplo: Uma determinada peça é produzida por três fábricas, A, B e C. Sabe-se que a fábrica

1 produz o dobro de peças que 2, e 2 e 3 produziram o mesmo número de peças durante um

período de produção especificado. Sabe-se também que 2% das peças produzidas por 1 e por 2

são defeituosas, enquanto 4% daquelas produzidas por 3 são defeituosas. Todas as peças são

colocadas num depósito. Uma peça é retirada ao acaso do depósito e se verifica que é

defeituosa. Qual a probabilidade de que tenha sido produzida na fábrica 1?

Definição dos eventos:

B={ a peça é defeituosa}

A1={ a peça é da fábrica 1}

A2{ a peça é da fábrica 2}

A3={ a peça é da fábrica 3}

02,0)A|B(P 1

2

1)A(P 1

ELEMENTOS DE PROBABILIDADES 40

02,0)A|B(P 2

4

1)A(P 2

04,0)A|B(P 3

4

1)A(P 3

k

1jjj

iii

)A|B(P).A(P

)A|B(P).A(P)B|A(P

)A|B(P).A(P)A|B(P).A(P)A|B(P).A(P

)A|B(P).A(P)B|A(P

332211

111

40,004,04102,04102,021

02,021)B|A(P 1

2) Cada objeto manufaturado é submetido para exame com a probabilidade 0,55 a um

controlador e com a probabilidade 0,45 a um outro. A probabilidade de passar no exame é,

segundo o controlador, respectivamente igual a 0,90 e 0,98. Achar a probabilidade de que um

objeto aceito tenha sido examinado pelo segundo controlador.

LISTA DE EXERCÍCIOS NO. 2 - PROBABILIDADES

1. De uma caixa contendo 100 peças entre as quais 10 são defeituosas se extraem quatro peças

ao acaso, sem reposição. Encontrar a probabilidade de que entre estas não ocorra:

a) nenhuma peça defeituosa;

b) nenhuma peça boa.

2. De um lote de 15 válvulas 10 são boas. Encontrar a probabilidade de que de 3 válvulas

extraídas ao acaso, sem reposição, 2 sejam boas.

3. Uma caixa contém 20 peças das quais 5 são defeituosas. Extraem-se duas ao acaso, sem

reposição. Qual a probabilidade de:

a) ambas serem boas?

b) ambas serem defeituosas?

c) uma boa e outra defeituosa?

4. Dois aparelhos de alarme independentes funcionam, no caso de avaria, com a probabilidade

0,95 e 0,90, respectivamente. Achar a probabilidade de que numa avaria funcione apenas um

dos aparelhos.

5. A probabilidade de que numa medição o erro ultrapasse o admitido é 0,4. Achar a

probabilidade de que em apenas uma medição de uma série de três o erro ultrapasse o

admitido.

SACHIKO ARAKI LIRA 41

6. A probabilidade de que uma peça do tipo exigido se ache em cada uma de quatro caixas é

igual, respectivamente, a 0,60; 0,70; 0,80 e 0,90. Calcular a probabilidade de que tal peça se

encontre:

a) no máximo em três caixas;

b) pelo menos em duas caixas.

7. Um circuito elétrico é constituído de três elementos ligados em série que deixam de funcionar

com probabilidade 10,0p1 ; 15,0p2 ; 20,0p3 , respectivamente. Achar a probabilidade de que

não haja corrente no circuito.

8. Um dispositivo de freio de automóvel consiste de três subsistemas, que devem funcionar

simultaneamente para que o freio funcione. Os subsistemas são um sistema eletrônico, um

sistema hidráulico e um ativador mecânico. Ao frear, a probabilidade de sucesso dessas

unidades é de 0,96, 0,95 e 0,95, respectivamente. Estime a confiabilidade do sistema, admitindo

que os subsistemas funcionem independentemente.

Comentário: Sistemas deste tipo podem ser representados graficamente, conforme ilustração

abaixo, onde os subsistemas A (eletrônico), B (hidráulico) e C (ativador mecânico), dispõem-se

em série. Considera-se a trajetória a-b como a trajetória do sucesso.

9. Os automóveis são equipados com circuitos redundantes de frenagem; os freios falham

somente quando todos os circuitos falham. Consideremos o caso de dois circuitos redundantes,

ou paralelos, cada um com 0,95 de confiabilidade (probabilidade de sucesso). Determine a

confiabilidade do sistema, supondo que os circuitos atuem independentemente.

10. Respectivamente 60 e 84 por cento das peças fornecidas por duas máquinas automáticas, a

produtividade da primeira sendo o dobro da segunda, são de alta qualidade. Tendo-se

constatado que uma peça escolhida ao acaso é de alta qualidade, achar a probabilidade de que

provenha da primeira máquina (teorema de Bayes).

11. Um relatório de controle de qualidade de transistores acusa os seguintes resultados por

fabricante e por qualidade:

FABRI-CANTE

QUALIDADE

Aceitável Marginal Inaceitável TOTAL

A 128 10 2 140

B 97 5 3 105

C 110 5 5 120

Escolhido um transistor ao acaso, qual a probabilidade:

a) de provir do fabricante A e ser de qualidade aceitável?

b) de ser aceitável, dado que provém do fabricante C?

c) de provir do fabricante B, dado que apresenta qualidade marginal?

0,96 0,95 0,95 a b

A B C

ELEMENTOS DE PROBABILIDADES 42

12) Suponha que na fabricação de semicondutores, as probabilidades de que um chip, sujeito a

alto, médio ou baixo nível de contaminação durante a fabricação, cause uma falha no produto

sejam respectivamente iguais a 0,10, 0,01 e 0,001. Em um experimento particular da produção,

20% dos chips estão sujeitos a altos níveis de contaminação, 30% a níveis médios de

contaminação e 50% a baixos níveis de contaminação. Qual a probabilidade de um produto

falhar ao usar um desses chips?

SACHIKO ARAKI LIRA 43

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES

DISCRETAS DE PROBABILIDADES

3.1 DEFINIÇÕES

Definição 1: Seja E um experimento e S o espaço amostral associado ao experimento. Variável

aleatória unidimensional é uma função X, que associa a cada elemento Ss , um número real

)s(X .

Exemplo: Uma caixa contém 4 válvulas, sendo duas perfeitas e duas defeituosas. Duas válvulas

são retiradas aleatoriamente da caixa e testadas (sendo representadas por D se a peça é

defeituosa e P se a peça é perfeita). O espaço amostral associado a este evento é:

S={PP,PD,DP,DD}

Seja a variável aleatória X=número de válvulas defeituosas. Os valores possíveis da

variável aleatória X, serão:

}2,1,0{RX

Definição 2: Seja X uma variável aleatória discreta. A função de probabilidade, associa um

número real )xX(P i , chamado de probabilidade de ix , a cada possível resultado ix .

Tem-se que:

1)xX(P0 i

Sx

1)xX(P i

Uma distribuição de probabilidade é uma descrição, que fornece a probabilidade para

cada valor da variável aleatória. Ela é frequentemente expressa na forma de um gráfico, de uma

tabela ou uma fórmula.

Exemplo1: No lançamento de duas moedas ao ar, tem-se que os possíveis resultados são: CC,

Ck, KC, KK (C=cara e K=coroa). Seja X, a variável aleatória número de caras. Então, X poderá

assumir os valores:

s

S

X )s(X

XR

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES 44

CCsse,2

KCsouCKsse,1

KKsse,0

)s(X

A distribuição de probabilidade da variável aleatória X é:

xX )xX(P

0 1/4

1 1/2

2 1/4

Exemplo 2: Em um processo de fabricação de semicondutores, 3 pastilhas de um lote são

testadas. Cada pastilha é classificada como “passa” ou “falha”. Suponha que a probabilidade de

uma pastilha passar no teste seja de 0,8 e que as pastilhas sejam independentes. Seja X a

variável número de pastilhas de um lote que passam no teste. A distribuição de probabilidade de

X será:

008,02,0)8,01()f,f,f(P)0x(P 33

096,00,0323)20,020,080,0(3)p,f,f(Pou)f,p,f(Pou)f,f,p(P)1x(P

0,3840,1283)20,080,080,0(3)p,p,f(Pou)p,f,p(Pou)f,p,p(P)2x(P

0,5128,0)p,p,p(P)3x(P 3

xX )xX(P

0 0,008 1 0,096 2 0,384 3 0,512

Definição 3: Seja X uma variável aleatória. A função de distribuição acumulada ou de

repartição de X é definida como

)xX(P)x(F

Se X for variável discreta, tem-se

)x(P)x(F ixxi

Esperança

O valor esperado, expectância ou a esperança matemática E(X), de uma variável

aleatória discreta X, que é a média da distribuição, é definida por:

)xX(Px)X(Eii

n

1i

SACHIKO ARAKI LIRA 45

Variância

A variância da variável aleatória discreta X, representada por )X(V ou 2 , é definida por:

n

1iii

2 )x(P)X(Ex)X(EXE)X(V 22

Exemplo 1: Seja X uma variável aleatória discreta que representa o número de peças

defeituosas em cada 5 peças inspecionadas. Sabendo-se que a probabilidade de uma peça ser

defeituosa é de 20%, obtém-se a seguinte distribuição de probabilidade:

ix 0 1 2 3 4 5

)x(p i 0,3277 0,4096 0,2048 0,0512 0,0064 0,0003

Qual o valor esperado de X ( )X(E ) e a variância ( ))X(V ?

0003,050064,040512,032048,024096,013277,00)x(px)X(Eii

1i

1)X(E

Portanto, em cada 5 peças inspecionadas, o número esperado de peça defeituosa é 1.

n

1iii

2 )x(P)X(Ex)X(EXE)X(V 22

0512,0)13(2048,0)12(4096,0)11(3277,0)10()X(V 2222

0003,0)15(0064,0)14( 22

0,7997)X(V

Exemplo 2: O tempo T, em minutos, necessário para um operário processar certa peça é uma

variável aleatória com a seguinte distribuição de probabilidade:

t 2 3 4 5 6 7

P(t) 0,1 0,1 0,3 0,2 0,2 0,1

Calcular: )X(E e )X(V

a) )x(px)X(Eii

1i

6,41,072,062,053,041,031,02)X(E

b)

n

1ii

2 )x(px)X(V i2

1,0)6,47(2,0)6,46(2,0)6,45(3,0)6,44(1,0)6,43(1,0)6,42()X(V 222222

04,2)X(V

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES 46

Definição 4: Seja E um experimento com espaço amostral S. Sejam )s(XX e )s(YY duas

funções, cada uma associando um número real a cada resultado Ss . Tem-se então que (X,Y)

é uma Variável Aleatória Bidimensional.

Seja o experimento: retirar uma barra de ferro de um lote e observar a dimensão (largura

e o comprimento); tem-se neste caso duas variáveis aleatórias X e Y.

3.2 DISTRIBUIÇÕES DE PROBABILIDADES DISCRETAS

3.2.1 DISTRIBUIÇÃO BINOMIAL

Uma variável aleatória discreta X, que conta o número de sucessos em n provas

independentes, que apresentam os resultados sucesso )p( ou fracasso )p1q( , tem

distribuição binomial. Sua função de probabilidade é dada por:

xnxqpx

n)xX(P

, n,,2,1,0x e 1p0

A função de distribuição é dada por:

nxse,1

nx0se,qpk

n

0xse,0

)xX(P)x(Fx

0k

knk

Os parâmetros da distribuição são:

Média pn)X(E

Variância qpn)X(V

Exemplo 1: Seja X uma v.a. que indica o número de peças não conformes (não segue a

especificação definida no projeto de qualidade) produzidas pela máquina “Z”. Se a probabilidade

desta maquina produzir uma peça não conforme é de 15%, ao selecionar aleatoriamente 5

peças, pede-se:

a) a probabilidade de nenhuma peça ser não conforme;

b) a probabilidade de todas as peças serem de acordo com especificação do projeto de

qualidade;

c) obter a distribuição de probabilidade e o gráfico.

Solução:

a) 5n

S

s s

X(s)

Y(s)

YXR

SACHIKO ARAKI LIRA 47

15,0p

85,0q

0x (peça conforme)

0,4437)85,0()15,0(0

5)0X(P 050

b) 0,4437)0X(P)çãoespecificaascomacordodetodas(P

c) Distribuição de Probabilidade

DISTRIBUIÇÃO DE PROBABILIDADE DE X

x )xX(P

0 0,4437

1 0,3915

2 0,1382

3 0,0244

4 0,0022

5 0,0001

Gráficamente:

A seguir, o gráfico da função de distribuição.

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES 48

Exemplo 2: Seja X uma v.a. que indica o número de parafusos defeituosos produzidos pela

máquina “A”. Se a probabilidade desta maquina produzir um parafuso defeituoso é de 5%, ao

selecionar aleatoriamente dois parafusos, qual a probabilidade de ambos serem defeituosos?

p =probabilidade de ser defeituoso=0,05

p1 = probabilidade de ser perfeito=1-0,05=0,95

%25,00025,0)95,0()05,0(2

2)2X(P 222

Ao selecionar 50 parafusos produzidos por esta máquina, espera-se uma média de 2,5

parafusos defeituosos, e uma variância de 2,4 (parafusos defeituosos)2.

3.2.2 DISTRIBUIÇÃO DE POISSON

A distribuição de Poisson pode ser aplicada a muitos casos práticos nos quais interessa

o número de vezes que um determinado evento pode ocorrer durante um intervalo de tempo ou

distância, área ou outra unidade de medida análoga.

Uma v.a. discreta X tem distribuição de Poisson se sua função de probabilidade é dada

por:

!x

)xX(Pxe

, ,2,1,0x e 0 (probabilidade de sucesso)

A função de distribuição é dada por:

x

0k

0xse,!k

0xse,0

)xX(P)x(F ke

Os parâmetros da distribuição são:

Média: )X(E

Variância: )X(V

Exemplo 1: São contados os números de partículas radioativas emitidas em cada intervalo de 5

segundos. Suponha que o número de partículas emitidas, durante cada intervalo de 5 segundos,

tenha uma distribuição de Poisson com parâmetro 2,0. Pede-se:

a) qual é a probabilidade de que menos de 3 partículas sejam emitidas?

b) supondo que 10 contagens são realizadas, construir a distribuição de probabilidade.

Solução:

a) !2

2

!1

2

!0

2)2X(P)1X(P)0X(P)3X(P

210 222 eee

0,67672707,02707,01353,0)3X(P

SACHIKO ARAKI LIRA 49

DISTRIBUIÇÃO DE PROBABILIDADE DE X X )xX(P

0 0,1353 1 0,2707 2 0,2707 3 0,1804 4 0,0902 5 0,0361 6 0,0120 7 0,0034 8 0,0009 9 0,0002 10 0,0000

Gráficamente:

A função de distribuição:

Exemplo 2: Seja X o número de acidentes mensais ocorridos numa determinada indústria. Se o

número médio de acidentes por mês é 3, qual a probabilidade de não ocorrer nenhum acidente

no próximo mês?

%5050,0!0

3)0X(P 3

3

ee 0

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES 50

3.2.3 DISTRIBUIÇÃO HIPERGEOMÉTRICA

Suponha que em um lote de N peças, k são defeituosas e (N-k) são perfeitas e

escolhem-se ao acaso, n peças desse lote )Nn( . Pode-se estar interessado na probabilidade

de selecionar x peças dos k rotulados como defeituosos e (n-x) perfeitas dos (N-k) rotulados

como perfeitas. Esse experimento é chamado hipergeométrico.

Uma v.a. discreta X tem distribuição hipergeométrica se sua f.p. é dada por:

n

N

xn

kN

x

k

)xX(P

A função de distribuição é dada por:

jx0se,

jxse,1

n

N

jn

kN

j

k

jxse,0

)xX(P)x(Fk

0j

Os parâmetros da distribuição são:

Média: pn)X(E

Variância: 1N

nNnpq)X(V

, onde

N

k1q;

N

kp .

Exemplo 1: Pequenos motores elétricos são expedidos em lotes de 30 unidades. Antes que

uma remessa seja aprovada, um inspetor seleciona ao acaso 3 destes motores para inspeção.

Se nenhum dos motores inspecionados for defeituoso, o lote é aprovado. Se um ou mais dos

motores verificados forem defeituosos, o lote todo é inspecionado. Suponha que existam, de

fato, 2 motores defeituosos no lote. Qual é a probabilidade de que a inspeção de todo o lote seja

necessária?

N=30 (número de casos total na população)

k=2 (número de casos favoráveis na população)

n=3 (tamanho da amostra) x=1,2,3 (número de casos desfavoráveis na amostra)

A probabilidade de que a inspeção seja necessária é igual a

)3X(P)2X(P)1X(P ou )0X(P1)1X(P

SACHIKO ARAKI LIRA 51

%31,191931,08069,01

3

30

3

28

0

2

1

3

30

03

230

0

2

1)0X(P1)1X(P

DISTRIBUIÇÃO DE PROBABILIDADE DE

X

x

p(x)

0 0,8069 1 0,1862 2 0,0069 3 0,0000

Gráficamente:

A função de distribuição:

Exemplo 2: Uma empresa adquiriu diversas caixas contendo cada uma 15 lâmpadas. Ela

decidiu fazer uma inspeção por amostragem sem reposição, analisando 5 lâmpadas de uma

caixa. A caixa será aceita caso encontre no máximo duas defeituosas. Qual a probabilidade de

aceitar uma caixa sabendo que a qualidade do produto é definida por 20% de defeituosos?

N=15

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES 52

n=5

2x

315*20,0k

)2X(P)1X(P)0X(P)2X(P

%80,979780,0003.3

937.2

003.3

660485.1792

5

15

25

315

2

3

5

15

15

315

1

3

5

15

05

315

0

3

)2X(P

LISTA DE EXERCÍCIOS NO. 3 – DISTRIBUIÇÕES DE PROBABILIDADES DISCRETAS

1. O número de mensagens enviadas por hora, através de uma rede de computadores, tem a

seguinte distribuição:

x = número de mensagens

10 11 12 13 14 15

p(x) 0,08 0,15 0,30 0,20 0,20 0,07

Calcular:

E(X);

V(X).

2. Seja X=o número de cilindros do motor do próximo carro a ser regulado em certa oficina. A

função de probabilidade é dada por:

x 4 6 8

p(x) 0,5 0,3 0,2

a) calcular )X(E

b) calcular )X(V

c) calcular

3. Suponha que 8

x)x(f , para 5X3 . Calcular:

a) Função distribuição acumulada;

b) E(X);

c) V(X).

4. Um proprietário acaba de instalar 20 lâmpadas em uma nova casa. Supondo que cada

lâmpada tenha 0,20 de probabilidade de funcionar por mais de três meses, pede-se:

a) qual a probabilidade de ao menos cinco delas durarem mais de três meses?

b) qual o número médio de lâmpadas que deverão ser substituídas em três meses?

5. Repete-se um experimento 5 vezes. Supondo que a probabilidade de sucesso em uma prova

seja 0,75, e admitindo a independência dos resultados das provas:

a) qual a probabilidade de todas as cinco provas resultarem em sucesso?

b) qual o número esperado de sucesso?

SACHIKO ARAKI LIRA 53

6. Um produto eletrônico contém 40 circuitos integrados. A probabilidade de que qualquer

circuito integrado seja defeituoso é de 0,01. Os circuitos integrados são independentes. O

produto opera somente se não houver circuitos integrados defeituosos. Qual é a probabilidade

de que o produto opere?

7. Um departamento de conserto de máquinas recebe uma média de 5 chamadas por hora.

Qual a probabilidade de que em uma hora selecionada aleatoriamente sejam recebidas:

a) Exatamente três chamadas?

b) Menos que três chamadas?

8. Bateladas que consistem em 50 molas helicoidais, provenientes de um processo de produção

são verificadas com respeito à conformidade em relação aos requerimentos dos consumidores.

O número médio de molas não-conformes em uma batelada é igual 5. Considere que o número

de molas não-conformes em uma batelada, denotado por X, seja uma variável aleatória

binomial. Pede-se:

a) qual é a probabilidade do número de molas não-conformes em uma batelada seja menor ou

igual a 2?

b) qual é a probabilidade do número de molas não-conformes em uma batelada seja maior ou

igual a 49?

9. Suponha que 90% de todas as pilhas do tipo D, de certo fabricante, tenham voltagens

aceitáveis. Um determinado tipo de lanterna necessita de 2 pilhas tipo D, e ela só funciona se as

duas pilhas tiverem voltagem aceitável. Entre 10 lanternas selecionadas aleatoriamente, qual é a

probabilidade de:

a) pelo menos 9 funcionarem?

b) no máximo 2 funcionarem?

10. Seja X o número de falhas na superfície de uma caldeira de um determinado tipo

selecionado aleatoriamente, com distribuição de Poisson de parâmetro 5 . Calcular:

a) )2x(P

b) )8x(P

c) )8x5(P

11. Cartões de circuito integrado são verificados em um teste funcional depois de serem

preenchidos com chips semicondutores. Um lote contém 140 cartões e 20 são selecionados sem

reposição para o teste funcional.

a) se 20 cartões forem defeituosos, qual será a probabilidade de no mínimo 1 cartão defeituoso

estar na amostra?

b) se 5 cartões forem defeituosos, qual será a probabilidade de 1 cartão defeituoso aparecer na

amostra?

12. Num lote de 20 pneus enviadas a um fornecedor sabe-se que há 5 defeituosos. Um cliente

vai a esse fornecedor comprar 4 pneus. Qual a probabilidade de levar 1 defeituoso?

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES 54

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES

CONTÍNUAS DE PROBABILIDADES

4.1 DEFINIÇÕES

Definição 1: Seja X uma variável aleatória continua. A função densidade de probabilidade

)x(f , é uma função que satisfaz as seguintes condições:

0)x(f para todo XRx

1)x(d)x(f

.

Exemplo: Seja X uma variável contínua com função densidade de probabilidade dada por:

16

x)x(f , 6x2

0)x(f , para qualquer outros valores.

A função densidade de probabilidade é:

Para 2x 8

1

16

2)2(f

Para 4x 8

2

16

4)4(f

Para 6x 8

3

16

6)6(f

A condição 1)x(d)x(f

, indica que a área total limitada pela curva que representa )x(f e

o eixo das abcissas é igual a 1.

Seja o intervalo [a,b] de XR . A probabilidade de um valor de X pertencer a esse intervalo

será dada por: b

adx)x(f)bXa(P , que representa a área sob a curva da função densidade

de probabilidade.

Para variáveis aleatórias contínuas, as probabilidades são interpretadas como áreas.

Sendo X uma variável aleatória continua, a probabilidade em um ponto é nula, então:

)bXa(P)bXa(P)bXa(P)bXa(P

Definição 2: Seja X uma variável aleatória. A função de distribuição acumulada ou de

repartição de X é definida como

)xX(P)x(F

SACHIKO ARAKI LIRA 55

Se X for variável aleatória continua, tem-se:

x

dx)x(f)xX(P)x(F

Exemplo: Seja X uma variável contínua com função densidade de probabilidade dada

por:

16

x)x(f , 6x2

0)x(f , para qualquer outros valores.

A função de distribuição acumulada é dada por:

132

3226

32

1

2

x

16

1dx

16

x0dx)x(fdx)x(f)x(F 22

6

2

26

2

6

2

2

Esperança

A esperança matemática E(X), de uma variável aleatória continua X, com função

densidade de probabilidade )x(f , é definida por:

dx)x(fx)X(E

Variância

Se X é uma variável aleatória contínua, a variância, representada por 22X)X(V é

definida por:

dx)x(f)x()X(V 22

As propriedades da variância para variável aleatória continua são as mesmas das já

apresentadas para variável aleatória discreta.

Exemplo1: Seja X uma variável contínua com função densidade de probabilidade dada por:

16

x)x(f , 6x2

0)x(f , para qualquer outros valores.

Qual é o valor esperado e a variância de X?

33,42648

1

3

x

16

1dxx

16

1dx

16

xx)X(E 33

6

2

36

2

26

2

dx)x(f)x()X(V 22

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES 56

6

2

226

2

2 dx16

x)33,4x33,42x(dx

16

x)33,4x()X(V

6

2

26

2

36

2

46

2

23

2

x

16

7489,18

3

x

16

66,8

4

x

16

1dx)

16

x7489,18x

16

66,8

16

x()X(V

2

26

16

7489,18

3

26

16

66,8

4

26

16

1)X(V

223344

2

32

16

7489,18

3

208

16

66,8

4

1280

16

1)X(V

1,22)X(V

Exemplo 2: Suponha que 25,0)x(f , para 4x0 . Determine a média e a variância.

Solução:

a)

dx)x(fx)X(E

2042

25,0

2

x25,0dxx25,0dx25,0x)X(E 22

24

0

4

0

4

0

b)

dx)x(f)x()X(V 22

4

0

4

0

40

4

0

24

0

3222 x4

2

x4

3

x25,0dx)4x4x(25,0dx25,0)2x()X(V

33,1)X(V

4.2 DISTRIBUIÇÕES DE PROBABILIDADES CONTINUAS

4.2.1 DISTRIBUIÇÃO EXPONENCIAL

Uma v.a. continua X, tem distribuição exponencial se sua função densidade de

probabilidade é dada por:

xe)x(f , 0x

A função de distribuição é dada por:

xx ee 1dx)xX(P)x(Fx0

, 0x

Portanto: xe)xX(P

SACHIKO ARAKI LIRA 57

Os parâmetros da distribuição são:

Média:

1

)X(E

Variância 2

1)X(V

Essa distribuição tem papel importante na descrição de uma grande classe de

fenômenos, particularmente nos assuntos relacionados a teoria da confiabilidade.

Exemplo 1: O tempo de vida X (em horas) das lâmpadas elétricas fabricadas por uma

empresa é uma variável aleatória, tendo sua função densidade de probabilidade dada por:

0xse0

002,0)x(f0xse,xe 002,0

a) qual a probabilidade do tempo de vida de uma lâmpada ser superior a 600 horas?

b) qual é o tempo de vida esperado?

Solução:

a) 002,0

3012,0e0002,0)600X(P 600002,0600

x002,0x002,0 ee600

b) horas500002,0

11)X(E

Exemplo 2: A vida média de um satélite é 4 anos, seguindo o modelo exponencial. Seja

X a variável definindo o tempo de vida do satélite. Calcule a )4X(P .

Solução:

41

)X(E

, portanto, 4

1

Então, %79,363679,0)4X(P 14

4

1

eee x

4.2.2 DISTRIBUIÇÃO NORMAL OU GAUSSIANA

É uma das mais importantes distribuições de probabilidades, sendo aplicada em

inúmeros fenômenos e frequentemente utilizada para o desenvolvimento teórico da inferência

estatística.

Uma v.a. continua X, tem distribuição normal ou Gaussiana se sua função densidade de

probabilidade é dada por:

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES 58

2x

2

1

e2

1)x(f

, R,R,Rx ,

A função de distribuição é dada por:

dxe2

1)x(d)x(f)xX(P)x(F

2x

2

1

x x

Os parâmetros da distribuição são:

Média: )X(E

Variância: 2)X(V

Quando se deseja especificar que a variável aleatória X, segue distribuição normal com

média e variância 2 , usa-se a notação: )(N~X 2; .

A distribuição normal é definida a partir de dois parâmetros, a média e o desvio padrão

da distribuição, por exemplo, a curva da distribuição normal )x(f para 40 , 10 e

valores da variável aleatória no intervalo (10, 70) é mostrada no gráfico abaixo.

Uma das características importantes é que a partir desses dois parâmetros será possível

calcular, por exemplo, a percentagem de valores que deverão estar acima ou abaixo de um

determinado valor da variável aleatória, ou entre esses dois valores definidos etc.

A probabilidade )bXa(P de a variável aleatória contínua X ser igual ou maior que a

e, ao mesmo tempo, menor ou igual a b , é obtida da área definida pela função )x(f entre os

limites a e b , sendo ab . O cálculo é feito integrando-se a função )x(f no intervalo )b,a( ,

que é bastante trabalhoso.

Portanto,

ba

dx2

1)bXa(P

2x

2

1

e

SACHIKO ARAKI LIRA 59

Representação Gráfica:

É um gráfico em forma de sino. O seu posicionamento em relação ao eixo das ordenadas

e seu achatamento são determinados pelos parâmetros e 2 , respectivamente.

A área compreendida entre é igual a %27,68 ; entre 2 é igual a %45,95 e

entre 3 é igual a 99,73%.

Propriedades da distribuição normal:

1. )x(f possui um ponto de máximo para X ;

2. )x(f tem dois pontos de inflexão cujas abcissas valem e ;

3. )x(f é simétrica em relação a X . E, ainda MdMo ;

4. )x(f tende a zero quando x tende para (assintótica em relação ao eixo x);

4.3.2.1 DISTRIBUIÇÃO NORMAL PADRONIZADA OU REDUZIDA

A variável normal padronizada Z é obtida através de uma transformação linear da

variável normal X, obtendo-se assim uma escala relativa de valores na qual, a média é o ponto

de referência e o desvio padrão, uma medida de afastamento da média.

Considere a transformação:

XZ , então

dXdZ .

Tem-se:

dx

2

1)x(F

x

2x

2

1

e

Utilizando a transformação será:

dz

2

1)z(F

z2

z2

1

e

, que é a função de distribuição para a variável normal reduzida.

Os parâmetros da distribuição são:

Média: 0)Z(E

Variância: 1)Z(V

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES 60

Gráfico da distribuição normal padrão:

Exemplo 1: O diâmetro de um eixo de um dispositivo ótico de armazenagem é normalmente

distribuído, com média 0,2508 polegadas e desvio padrão de 0,0005 polegadas. As

especificações do eixo são 0015,02500,0 polegada. Que proporção de eixo obedece às

especificações?

2508,0

0005,0

?)2515,0X2485,0(P

6,40005,0

2508,02485,0Z1

4,10005,0

2508,02515,0Z2

91,92%0,91920,0000-0,9192)4,1Z6,4(P)2515,0X2485,0(P

Exemplo 2: O diâmetro de um cabo elétrico é normalmente distribuído com média 0,8 mm e

variância 0,0004 mm2. Dentre uma amostra de 1.000 cabos, espera-se que quantos tenham

diâmetro menor que 0,78 mm?

8,0

0004,02 => 02,0

102,0

8,078,0Z

=> 1587,0)1Z(P

7,1581587,0000.1n

SACHIKO ARAKI LIRA 61

4.3.3 DISTRIBUIÇÃO 2 ( QUI-QUADRADO)

A função densidade da distribuição “ 2 ” com graus de liberdade é dada por:

222

2

2 e12

x

22

1)(f

, 02 ,

Os parâmetros da distribuição são:

Média )(E 2

Variância 2)(V 2

Diz-se que 2 segue uma distribuição qui-quadrado com parâmetro . O parâmetro

é chamado de graus de liberdade da distribuição.

Quando se deseja indicar que uma variável 2 segue uma distribuição qui-quadrado com

graus de liberdade, usa-se a notação:

)(~ 22 ou 22 ~ .

Esta distribuição possui numerosas aplicações em inferência estatística. Dentre as

aplicações da Distribuição Qui-quadrado cita-se a construção de intervalos de confiança para

variâncias e testes de hipóteses.

Utilização da distribuição 2

Determinar os valores de 2 tais que:

a) 975,0)0(P 23

2

Deseja-se obter o valor de 23 de maneira que, abaixo dele se encontrem a área

correspondente a 97,5%.

O valor é igual a: 3484,923

b) 900,0)(P 210

2

Neste caso, o valor de 210 é o limite inferior da área que compreende 90% da

distribuição qui-quadrado.

O valor é igual a: 8652,4210 .

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES 62

4.3.4 DISTRIBUIÇÃO “ t ” DE STUDENT

A função densidade da distribuição “t” com graus de liberdade é dada por:

2

)1(

2t1

2

2

1

)t(f

, Rt ,

Os parâmetros da distribuição são:

Média: 0)t(E

Variância: 2

)t(V

para 2 , onde o parâmetro é o graus de liberdade da

distribuição.

A distribuição t é simétrica em relação a 0t , sendo que, quando ela tende para

uma distribuição normal com média 0 e variância 1 (distribuição normal padronizada). O único

parâmetro que a define e caracteriza a sua forma é o número de graus de liberdade

(número de observações livres para variar). Quando se deseja indicar que uma variável aleatória

t segue uma distribuição t de Student com graus de liberdade, usa-se a seguinte notação

)(t~t ou t~t .

Dentre as utilizações da Distribuição t, citam-se os testes de hipóteses e intervalos de

confiança para amostras pequenas )30n( e testes de hipóteses para coeficiente de correlação

amostral.

Utilização da distribuição t de Student

Determinar os valores de t , tais que:

a) 05,0)tt(P 5

Deseja-se obter o valor de 5t tal que abaixo dele se encontrem 5% da área da

distribuição.

O valor é igual a: 0150,2t5

b) 10,0)tt(P 8

Deseja-se obter o valor de 8t tal que acima dele se encontrem 10% da área da

distribuição.

O valor é igual a: 1,3968t8

SACHIKO ARAKI LIRA 63

4.3.5 DISTRIBUIÇÃO F DE SNEDECOR

A função densidade da distribuição “F” com 21 e graus de liberdade é dada por:

2

21

12

11

2

1

21

21

F1

F

22

2

1

)F(f

2

1

2, 0F ,

Os parâmetros da distribuição são:

Média:2

)X(E2

2

, 22

Variância: )4()2(

)2(2)X(V

22

21

2122

, 42

A distribuição F de Snedecor depende de dois parâmetros, 21 e , denominados,

respectivamente, de graus de liberdade do numerador e denominador.

Quando se deseja indicar que a variável aleatória F segue uma distribuição F de

Snedecor com 21 e graus de liberdade , respectivamente no numerador e denominador,

usa-se a notação

),(F~F 21 ou 21,F~F

Dentre as aplicações da Distribuição F é possível citar a análise de variância (ANOVA) e

análise de regressão.

Utilização da distribuição F

Determinar os valores de 21 ,F , tais que:

a) 01,0)10,6(FFP

Deseja-se obter o valor de 10,6F tal que abaixo dele estejam 1% da área da distribuição.

39,5)10,6(F

b) 05,0)5,3(FFP

Deseja-se obter o valor de 5,3F tal que acima dele estejam 5% da área da distribuição.

5,4095)5,3(F

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES 64

LISTA DE EXERCÍCIOS NO. 4 – DISTRIBUIÇÕES DE PROBABILIDADES CONTÍNUAS

1. O tempo de operação de uma máquina de embalagem de frascos sem interrupção para

manutenção, tem distribuição exponencial com média igual a duas horas. Qual a probabilidade

dessa máquina conseguir operar mais de uma hora sem interrupção?

2. Suponha que um componente eletrônico tenha um tempo de vida X (em unidades de 1.000

horas) que é considerado uma variável aleatória com função densidade de probabilidade

0x,)x(f xe . Qual é a probabilidade de 9,0x ?

3. O tempo (em horas) necessário para reparar uma máquina é uma variável aleatória

exponencialmente distribuída com parâmetro 2/1 . Determine a probabilidade de que o

tempo de reparo exceda duas horas.

4. O diâmetro de uma determinada peça é uma característica da qualidade importante. Sabe-se

que esse diâmetro segue um modelo normal com média 40 mm e desvio padrão 2 mm. Se a

especificação estabelece que o diâmetro deve ser maior que 35mm, qual probabilidade que a

peça produzida satisfaça a especificação?

5. Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa

máquina. Supondo que essa variável tenha distribuição normal com média igual 2 cm e desvio

padrão igual a 0,04 cm. Qual a probabilidade de um parafuso ter o diâmetro com valor entre 2 e

2,05 cm ?

6. A tensão de ruptura (em newtons) de uma fibra sintética é representada por X e distribuída

como )12,800(N 2 . O controle de qualidade na fabricação da fibra exige uma tensão de no

mínimo 772 N. Uma amostra da fibra é randomicamente testada. Qual é a probabilidade de

obtermos )772X(P ?

7. Suponha que as freqüências indesejáveis para um determinado sinal elétrico tenham uma

variação normal com média 60 Hz e desvio padrão 15 Hz.

a) Qual a probabilidade desse sinal elétrico possuir componentes entre 40 e 70 Hz devido a

essas freqüências indesejáveis?

b) Qual a maior freqüência do sinal para que a probabilidade de contaminação por freqüências

indesejáveis seja de 10%?

8. A vida média de certo aparelho é de oito anos, com d.p. de 1,8 ano. O fabricante substitui os

aparelhos que acusam defeito dentro do prazo de garantia. Se ele deseja substituir no máximo

5% dos aparelhos que apresentem defeito, qual deve ser o prazo de garantia?

9. Um processo industrial produz peças com diâmetro médio de 2,00” e d.p. de 0,01”. As peças

com diâmetro que se afaste da média por mais de 0,03” são consideradas defeituosas. Admitida

a normalidade:

a) qual a percentagem das peças defeituosas?

b) qual a percentagem de peças perfeitas?

SACHIKO ARAKI LIRA 65

10. Uma empresa usa anualmente milhares de lâmpadas elétricas, que permanecem acesa

continuamente, dia e noite. A vida de uma lâmpada pode ser considerada uma variável aleatória

normal, com média de 50 dias e desvio padrão de 15 dias. Em 1º de janeiro a companhia

instalou 8.000 lâmpadas novas. Aproximadamente quantas deverão ser substituídas em 1º de

fevereiro?

11. O diâmetro do eixo principal de um disco rígido segue a distribuição normal com média

25,08 in. e desvio padrão 0,05 in. Se as especificações para esse eixo são 15,000,25 in.

Determine o percentual de unidadesproduzidas em conformidades com as especificações.

NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS 66

NOÇÕES DE AMOSTRAGEM E

DISTRIBUIÇÕES AMOSTRAIS

5.1 INTRODUÇÃO

Razão para se trabalhar com amostras:

menor custo;

redução do tempo e de mão-de-obra para a realização da coleta de dados;

maior confiabilidade e qualidade dos dados;

facilidade na realização dos trabalhos.

dois tipos de amostragem: a probabilística e a não-probabilística.

amostragem probabilística Todos os elementos da população têm probabilidade

conhecida, e diferente de zero, de pertencer à amostra.

amostragem probabilística melhor recomendação para garantir a representatividade da

amostra, pois o acaso será o único responsável por eventuais diferenças entre população

e amostra. É possivel utilizar as técnicas de Inferência Estatística.

5.2 AMOSTRAGEM PROBABILÍSTICA

Algumas técnicas de amostragem probabilística:

5.2.1 AMOSTRAGEM ALEATÓRIA SIMPLES (AAS)

método mais simples e mais importante para selecionar uma amostra probabilística;

listar todas as unidades elementares enumeradas de 1 a N;

sorteiam-se “n” elementos da população, sendo que todos os elementos têm a mesma proba-

bilidade de serem selecionados;

com reposição ou sem reposição.

Exemplo: Foram produzidos 500 anéis de pistão em certo processo de produção. Deseja-se

obter uma amostra de 30 anéis de pistão deste processo.

SACHIKO ARAKI LIRA 67

Utilizando processo aleatório simples com reposição:

1) enumerar os anéis de pistão de 1 a 500;

2) todos os anéis terão a mesma probabilidade de compor a amostra, igual a 0,2%;

3) gerar 30 números aleatórios ou selecionar 30 números utilizando tabelas de números

aleatórios;

4) os anéis que comporão a amostra serão aqueles correspondentes aos números aleatórios;

290 271 211 4 456 451 389 487 397 410

473 143 381 217 128 465 457 174 160 157

206 369 155 285 421 239 454 341 424 289

No excel:

ALEATÓRIO()*(b-a)+a onde a=1; b=500

5) a amostra de 30 anéis de pistão será composta pelos anéis com as numerações acima.

5.2.2 AMOSTRAGEM SISTEMÁTICA

os elementos da população estão ordenados e a retirada das unidades amostrais é feita

sistematicamente;

a cada dez itens produzidos, em uma linha de produção, retirar um para compor a

amostra da produção diária.

Considerando o exemplo dos anéis de pistão: os anéis estão enumerados de 1 a 500.

17

1

500

30

N

nf (fração amostral)

1) gera-se ou seleciona-se um número aleatório entre 1 e 17;

2) O número gerado foi 11. Para obter os demais elementos, soma-se sempre 17, até

completar o tamanho da amostra.

No excel:

ALEATÓRIO()*(b-a)+a onde a=1; b=17

11 28 45 62 79 96 113 130 147 164

181 198 215 232 249 266 283 300 317 334

351 368 385 402 419 436 453 470 487 4

3) a amostra de 30 anéis de pistão será composta pelos anéis com as numerações acima.

NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS 68

5.2.3 AMOSTRAGEM ESTRATIFICADA

A população pode ser dividida em subgrupos (estratos);

esse processo pode gerar amostras bastante precisas;

a estratificação é usada principalmente para resolver alguns problemas como a melhoria da

precisão das estimativas.

quando a variável em estudo apresenta um comportamento heterogêneo entre os

diferentes estratos, convém que o sorteio dos elementos da amostra leve em consideração

tais estratos.

Exemplo:

Dada a população de 5.000 operários de uma certa industria automobilística, selecionar

uma amostra proporcional estratificada de operários para estimar seu salário médio. Usando a

variável critério “cargo” para estratificar essa população, e considerando amostra total de 250

operários, chega-se ao seguinte quadro:

CARGO POPULAÇÃO PROPORÇÃO AMOSTRA

Chefes de seção 500 0,10 25

Operários especializados 1.500 0,30 75

Operários não especializados 3.000 0,60 150

TOTAL 5.000 1,00 250

5.3 DISTRIBUIÇÕES AMOSTRAIS

Ao retirar uma amostra aleatória de uma população, está-se considerando cada valor da

amostra como um valor de uma variável aleatória cuja distribuição de probabilidade é a mesma

da população, no instante da retirada desse elemento para a amostra.

Em conseqüência do fato de os valores da amostra serem aleatórios, decorre que

qualquer quantidade calculada em função dos elementos da amostra, também será uma variável

aleatória.

Os parâmetros são valores teóricos correspondentes à população e as estatísticas são

funções dos valores amostrais.

As estatísticas, sendo variáveis aleatórias, terão alguma distribuição de probabilidade,

com uma média, variância, etc. A distribuição de probabilidade de uma estatística chama-se,

comumente, distribuição amostral ou distribuição por amostragem.

5.3.1 DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS

O parâmetro é um valor único e desconhecido. A estatística X é um valor conhecido,

porém, pode variar de amostra para amostra. Se forem retiradas diferentes amostras aleatórias

SACHIKO ARAKI LIRA 69

de mesmo tamanho, as médias das diferentes amostras não deverão ser iguais. Apesar de a

média da população ser a mesma, a média da amostra dependerá de cada amostra.

Com as médias das amostras, é possível construir a distribuição de freqüências das

médias das amostras, denominada distribuição amostral, cuja média denomina-se média da

distribuição amostral e seu desvio padrão, erro padrão.

Embora os parâmetros, média e desvio padrão, da população não sejam conhecidos,

considera-se para o exemplo a seguir, como sendo conhecidos.

Seja uma população constituída dos elementos: 10e7,5,2 , sendo 4N . A média e a

variância populacional são: 00,6 e 50,82 .

Considere as possíveis amostras de 2 elementos ( 2n ), que podem ser retiradas desta

população.

a) Sem reposição

O número de amostras possíveis é dado por nN

Ck . Então, o número de amostras

possíveis é igual a 6.

QUADRO 1 - AMOSTRAS POSSÍVEIS RETIRADAS DE UMA POPULAÇÃO

AMOSTRAS

AMOS-

TRA 1

AMOS-

TRA 2

AMOS-

TRA 3

AMOS-

TRA 4

AMOS-

TRA 5

AMOS-

TRA 6

1X 2 2 2 5 5 7

2X 5 7 10 7 10 10

Média 3,5 4,5 6,0 6,0 7,5 8,5

Observe que a média da amostra depende de cada amostra extraída. Qualquer

inferência realizada sobre a média da população utilizando uma única amostra estará sujeita a

alguma incerteza, pois a média de cada amostra pode ser diferente.

A média das médias amostrais é obtida por:

6

36X

k

1)X(E

k

1ii

6)X(E

A média das médias amostrais ou a média da distribuição amostral coincide com a média da

população. Tem-se, então, a primeira conclusão importante: a média das médias amostrais é

a própria média da população.

A variância das médias amostrais é dada por:

6

1725,625,20025,225,6

6

1))X(EX(

k

1)X(V

k

1i

2i

83,2)X(V

NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS 70

A variância das médias amostrais é igual à variância da população multiplicada pelo

fator: 1N

nN

n

1

Tem-se então que:

X)X(E (Média da distribuição amostral de médias)

1N

nN

n)X(V

2

2

X

(Variância da distribuição amostral de médias)

a) Com reposição

O número de amostras possíveis é dado por nNk . Então, o número de amostras

possíveis é igual a 16.

AMOS-

TRAS

AMOS-

TRA 1

AMOS-

TRA 2

AMOS-

TRA 3

AMOS-

TRA 4

AMOS-

TRA 5

AMOS-

TRA 6

AMOS-

TRA 7

AMOS-

TRA 8

1X 2 2 2 2 5 5 5 5

2X 2 5 7 10 2 5 7 10

Média 2,0 3,5 4,5 6,0 3,5 5,0 6,0 7,5

AMOS-

TRAS

AMOS-

TRA 9

AMOS-

TRA 10

AMOS-

TRA 11

AMOS-

TRA 12

AMOS-

TRA 13

AMOS-

TRA 14

AMOS-

TRA 15

AMOS-

TRA 16

1X 7 7 7 7 10 10 10 10

2X 2 5 7 10 2 5 7 10

Média 4,5 6,0 7,0 8,5 6,0 7,5 8,5 10,0

A média das médias amostrais é obtida por:

16

96X

k

1)X(E

k

1ii

6)X(E

A variância das médias amostrais é dada por:

16

681625,6...25,225,616

16

1))X(EX(

k

1)X(V

k

1i

2i

25,4)X(V

A variância das médias amostrais é igual à variância da população multiplicada pelo

fator: n

1

Tem-se então que:

X)X(E (Média da distribuição amostral de médias)

SACHIKO ARAKI LIRA 71

n)X(V

2

2

X

(Variância da distribuição amostral de médias)

De forma geral, a forma da distribuição amostral depende da forma da distribuição da

população. Se a distribuição da população for normal N(, ), a distribuição da média amostral

também será normal, seja qual for o tamanho n da amostra. Se a distribuição da população não

for normal, à medida que o tamanho da amostra aumentar, a distribuição da média amostral se

aproximará da distribuição normal.

De acordo com o teorema central do limite, a distribuição das médias de amostras de

tamanho suficientemente grande poderá ser considerada como normal, seja qual for a forma da

distribuição da população.

Resumindo:

a) Amostragem com reposição:

X)X(E (Média da distribuição amostral de médias)

n)X(V

22

X

(Variância da distribuição amostral de médias)

b) Amostragem sem reposição:

X)X(E (Média da distribuição amostral de médias)

1N

nN

n)X(V

22

X

(Variância da distribuição amostral de médias)

onde o fator 1N

nN

é denominado de fator de população finita. Evidentemente, tem-se que:

11N

nNlimN

TEOREMA CENTRAL DO LIMITE

Em situações onde se tem n , é possível aplicar o Teorema Central do Limite.

Existem diversas versões do teorema central do limite. Será apresentada uma das versões.

Teorema Central do Limite (versão i.i.d. em termos da média amostral)

Sejam n21 XX,X ,, , variáveis aleatórias independentes e identicamente distribuídas

(i.i.d.), tais que )X(E i e 2i )X(V , ambas finitas. Seja X a média amostral. Então:

)1,0(N~X

n

n

XZ

2

.

A aproximação melhora com o aumento do tamanho da amostra.

NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS 72

Se, de uma população com parâmetros ),( 2 for retirada uma amostra de tamanho n

suficientemente grande, a distribuição de X será aproximadamente normal )n,(N , seja

qual for a forma da distribuição da população.

O teorema central do limite é muito importante, pois permite utilizar a distribuição normal

para realizar inferências da média amostral, seja qual for a forma da distribuição da população.

5.3.2 DISTRIBUIÇÃO AMOSTRAL DE PROPORÇÕES

Seja uma população tal que, a probabilidade de sucesso de certo evento é p e de

insucesso é p1q . Para cada amostra de tamanho n , pode-se determinar o número k de

sucesso e como conseqüência, a freqüência relativa ou proporção dada por n

kpfr .

` O conjunto de freqüências relativas calculadas para as amostras constitui a distribuição

amostral das proporções ou de freqüências relativas.

A média e o desvio padrão da distribuição amostral de proporções são apresentados a

seguir, considerando-se amostras sem e com reposição.

a) Com reposição

pp (média da distribuição amostral de proporções)

n

qpp

( desvio padrão da distribuição amostral de proporções)

b) Sem reposição

pp (média da distribuição amostral de proporções)

1N

nN

n

pqp

( desvio padrão da distribuição amostral de proporções)

Para amostras suficientemente grandes, a distribuição amostral das proporções, que

segue distribuição binomial, poderá se aproximar de uma distribuição normal de mesma média e

mesma variância. Na prática, considera-se a amostra grande para 30n e p próximo de 0,5.

5.3.3 DISTRIBUIÇÃO AMOSTRAL DA VARIÂNCIA

A estatística 2

22 S)1n(

, segue uma distribuição qui-quadrado com 1n graus de

liberdade. Sendo que 2S é a variância amostral, dada por:

n

1i

2i

2 )Xx(1n

1S

SACHIKO ARAKI LIRA 73

A partir da expressão da expressão de estatística 2 , tem-se que:

22

2

)1n(S

, com 21n

ou seja, 2S segue uma distribuição 2 , com 1n graus de liberdade.

Tem-se para a distribuição amostral da variância 2S que:

22 )S(E

1n

)S(V4

2 2

ESTIMAÇÃO DE PARÂMETROS 74

ESTIMAÇÃO DE PARÂMETROS

6.1 INTRODUÇÃO

Inferência estatística tem como objetivo fazer generalizações sobre uma população, com

base nos dados amostrais.

Inferência estatística divide-se em duas grandes áreas: estimação e teste de hipóteses.

Pontual

Estimação Inferência Por intervalo Estatística Teste de Hipóteses

Estimação o objetivo é fornecer informações sobre os parâmetros populacionais, tendo

como base uma amostra aleatória extraída da população de interesse.

Estatística qualquer quantidade calculada em função dos elementos da amostra.

Distribuição amostral ou distribuição por amostragem distribuição de probabilidade de

uma estatística.

6.2 ESTIMADOR E ESTIMATIVA

Estimador quantidade calculada em função dos elementos amostrais, que será utilizada no

processo de estimação do parâmetro de interesse.

Principais métodos de obtenção de estimadores:

Método dos momentos;

Método da máxima verossimilhança;

Método dos mínimos quadrados;

Estimativa valor numérico obtido pelo estimador numa determinada amostra.

6.3 QUALIDADES DE UM ESTIMADOR

a) Não tendenciosidade ou não viesado

SACHIKO ARAKI LIRA 75

Um estimador é não tendencioso ou não viesado quando a sua média (ou esperança

ou expectância) é o próprio valor do parâmetro populacional que está se pretendendo

estimar, ou seja: )(E ˆ

b) Consistência

Um estimador é consistente se (além de ser não viesado) sua variância tende para

zero, quando n tende para , isto é:

)(E ˆ e 0)(V ˆlimn

c) Eficiência

Dados dois estimadores 1 e 2 de um mesmo parâmetro, é mais eficiente aquele que

apresenta menor variância, ou seja:

Se )(V)(V 21ˆˆ então 1 é mais eficiente que 2 .

Ainda, se 1 e 2 forem ambos não tendenciosos, a eficiência relativa será dado pelo

quociente das respectivas variâncias, ou seja:

)(V

)(V

2

1

ˆ

ˆ

.

d) Suficiência

Um estimador é suficiente quando permite obter um resumo das informações trazidas

pela amostra, ou seja, resume os dados sem perder nenhuma informação sobre o parâmetro .

6.4 ESTIMAÇÃO POR PONTOS

Quando o parâmetro é estimado através de um único valor diz-se que a estimação é por

ponto ou pontual. Por exemplo: X é um estimador pontual da média populacional ; 2S é um

estimador pontual da variância populacional 2 ; etc.

6.4.1 ESTIMADOR DA MÉDIA POPULACIONAL

O estimador utilizado é a média aritmética amostral X , sendo um estimador não viesado,

consistente, eficiente e suficiente.

n

1iix

n

1X

6.4.2 ESTIMADOR DA VARIÂNCIA POPULACIONAL

O estimador utilizado é a variância amostral 2S . As estimativas obtidas pelas

expressões apresentadas a seguir são não tendenciosos e consistentes.

Quando a média populacional for conhecida, a estimativa é dada por:

ESTIMAÇÃO DE PARÂMETROS 76

n

)x(

S

n

1i

2i

2

E quando a média populacional for desconhecida, por:

n

1i

2i

2 )Xx(1n

1S

6.4.3 ESTIMADOR DO DESVIO PADRÃO POPULACIONAL

Tem-se que 2S é um estimador não tendencioso da variância populacional 2 . No

entanto, a raiz quadrada de 2S não é um estimador não tendencioso do desvio padrão

populacional .

A tendenciosidade de S tende a zero, à medida que aumenta o tamanho da amostra.

6.4.4 ESTIMADOR DA PROPORÇÃO POPULACIONAL

O estimador utilizado é a proporção amostral p . A expressão de p é dada por: n

kp ,

onde k é o número de casos favoráveis.

6.5 ESTIMAÇÃO POR INTERVALO

Consiste em construir um intervalo em torno da estimativa por ponto, de tal forma que ele

possua probabilidade conhecida (nível de confiança )1( ) de conter o verdadeiro valor do

parâmetro.

Seja o parâmetro , tal que 1)tt(P 21 . Então, tem-se:

21 tt chamado de intervalo de confiança (I.C.)

21 tet são denominados de limites de confiança

1 nível de confiança.

A escolha do nível de confiança depende do grau de precisão com que se deseja estimar

o parâmetro. É comum utilizar os níveis de 95% e 99%. Evidentemente, o aumento no nível de

confiança implica no aumento de sua amplitude.

6.5.1 INTERVALO DE CONFIANÇA PARA MÉDIA POPULACIONAL

1) Quando a Variância Populacional 2 é Conhecida

1)n

ZXn

ZX(P 22

SACHIKO ARAKI LIRA 77

onde:

X é a média da amostra;

é o nível de significância adotado;

2Z é o valor de Z da tabela da distribuição “t” para um determinado nível de significância e

graus de liberdade ;

é o desvio padrão da população;

n é o tamanho da amostra.

A utilização da expressão acima deve atender aos seguintes critérios:

Para amostras pequenas )30n( , a população deve ser normalmente distribuída;

Para grandes amostras )30n( , não existe a exigência de que a população seja normalmente

distribuída (justificada pelo Teorema Central do Limite), e sendo desconhecido, pode ser

substituído pelo desvio padrão amostral S .

FIGURA 1 – DISTRIBUIÇÃO NORMAL PADRÃO

Exemplos de aplicação:

1) O desvio padrão dos comprimentos de todas as peças produzidas por certa máquina é 2 mm.

Uma amostra de 50 peças produzidas por essa máquina apresenta média igual a 25 mm.

Construir o I.C. de 95% para o verdadeiro comprimento das peças produzidas por essa

máquina.

Solução:

2

50n

25X

%951 ; %5 ; 96,1Z 2

1

2Z 2Z

2 2

FIGURA 1 – DISTRIBUIÇÃO NORMAL PADRÃO

ESTIMAÇÃO DE PARÂMETROS 78

Assim, o intervalo de confiança será:

1

nZX

nZXP 22

%9550

296,125

50

296,125P

%95mm25,55mm24,45P

2) Experiência passada indicou que a resistência à quebra de um fio usado na fabricação de

material moldável é normalmente distribuída e que 2 psi. Uma amostra aleatória de nove

espécimes é testada e a resistência média à quebra é 98 psi. Encontre um intervalo bilateral de

confiança de 95% para a resistência média à quebra.

Solução:

2

9n

98X

%951 ; %5 ; 96,1Z 2

1

nZX

nZXP 22

%959

296,198

9

296,198P

%95sip99,31sip96,69P

2) Quando a Variância Populacional 2 é Desconhecida

O estudo que trata de distribuições amostrais ou distribuições de probabilidade de

estatísticas, de pequenas amostras (n<30), é chamado de Teoria das Pequenas Amostras.

A distribuição t de Student, desenvolvida por William Sealy Gosset, é uma distribuição

de probabilidade estatística. Esta distribuição é de fundamental importância para a inferência

estatística, quando o desvio padrão populacional é desconhecido e trata-se de amostras

pequenas (geralmente n<30).

O intervalo de confiança é obtida através de:

1)n

StX

n

StX(P 22

onde:

X é a média da amostra;

é o nível de significância adotado;

2t é o valor de t da tabela da distribuição “t” para um determinado nível de significância e

1n graus de liberdade;

SACHIKO ARAKI LIRA 79

S é o desvio padrão da amostra;

n é o tamanho da amostra.

A utilização do I. C. acima deve obedecer aos seguintes critérios:

Para amostras pequenas )30n( , a população de onde a amostra foi retirada deve ser

normalmente distribuída;

Para grandes amostras )30n( , ele pode substituir o I. C. dado pela fórmula em que é

conhecido, pois, no caso de grandes amostras, a distribuição t de Student se aproxima de uma

distribuição normal padronizada.

FIGURA 2 – DISTRIBUIÇÃO t DE STUDENT

Exemplos de aplicação

1) Uma amostra de 20 cabos, produzidos por uma indústria, foram avaliados e medidas as

tensões de rupturas (em kgf). A média e o desvio padrão da amostra são iguais a 762 kgf e 14,4

kgf, respectivamente. Deseja-se construir o intervalo de confiança de 95% para a tensão média

de ruptura de cabos produzidos pela indústria.

Solução:

20n

762X

4,14S

%951 ; %5 ; 191n

09,2t 2

Assim, o intervalo de confiança será dada por:

1

2t

2t

2 2

ESTIMAÇÃO DE PARÂMETROS 80

1

n

StX

n

StXP 22

1

20

4,1409,2762

20

4,1409,2762P

%95kgf768,73kgf755,27P

2) A resistência do concreto à compressão está sendo testada por um engenheiro civil. Ele

testa 12 corpos de prova e obtém dados abaixo. Construir um intervalo de 95% para a

resistência média.

Dados: 92,2259X ; 57,35S

Solução:

12n

%951

%5

111n

20,2t 2

1

n

StX

n

StXP 22

1

12

57,3520,292,2259

12

57,3520,292,2259P

%952.282,512.237,33P

6.5.2 INTERVALO DE CONFIANÇA PARA DIFERENÇA ENTRE DUAS MÉDIAS

POPULACIONAIS 1 E 2

1) Quando as Variâncias Populacionais 21 e 2

2 são Conhecidas

1nn

Z)XX()(nn

Z)XX(P2

22

1

21

22121

2

22

1

21

221

onde:

1X é a média da amostra 1;

2X é a média da amostra 2;

é o nível de significância adotado;

SACHIKO ARAKI LIRA 81

2Z é o valor de Z da tabela da distribuição “t” para um determinado nível de significância e

graus de liberdade ;

21 é a variância da população 1;

22 é a variância da população 2;

1n é o tamanho da amostra 1;

2n é o tamanho da amostra 2.

Exemplo de aplicação:

1) Os desvios padrões das durações das lâmpadas elétricas fabricadas pelas indústrias A e B

são, respectivamente, 50 horas e 80 horas. Foram ensaiadas 40 lâmpadas de cada marca e

as durações médias obtidas foram 1.200 horas e 1.100 horas, para A e B, respectivamente.

Construir o intervalo de confiança de 99% para a diferença entre os tempos médios de vida

das lâmpadas de marcas A e B, ou seja, BA .

Solução:

50A

80B

40n

1200XA

1100XB

%991

58,2Z 2

O intervalo de confiança (I.C.) de %100)1( para BA , será dado por:

B

2B

A

2A

BA

B

2B

A

2A

nnZ)XX(

nnZ)XX( 2BA2BA

40

80

40

5058,2)11001200(

40

80

40

5058,2)11001200(

22

BA

22

%99horas138,48horas61,52P BA

2) Quando as Variâncias Populacionais 21 e 2

2 são Desconhecidas e Supostamente

Iguais

1)

n

1

n

1(St)XX()

n

1

n

1(St)XX(P

21

2p21

21

2p 221221

sendo que: 2nn

S)1n(S)1n(S

21

222

2112

p

ESTIMAÇÃO DE PARÂMETROS 82

1X é a média da amostra 1;

2X é a média da amostra 2;

é o nível de significância adotado;

2t é o valor de t da tabela da distribuição “t” para um determinado nível de significância e

2nn 21 graus de liberdade;

21S é a variância da amostra 1;

22S é a variância da amostra 2;

1n é o tamanho da amostra 1;

2n é o tamanho da amostra 2.

Exemplo de aplicação:

Uma amostra de 5 tubos da fábrica A, apresentou os seguintes resultados quanto aos diâmetros

(mm): 40,45XA ; 30,1S2A

E, uma amostra de 6 tubos da fábrica B, apresentou: 17,44XB ; 37,1S2B .

Construir o I. C. de 95% para as diferenças entre os diâmetros médios BA .

Solução:

5nA

6nB

%951

2t , com 2nn 21 graus de liberdade, logo 9

26,2t 2

O intervalo de confiança (I.C.) de %100)1( para 21 , será dado por:

)n

1

n

1(St)XX()

n

1

n

1(St)XX(

BA

2pBA

BA

2pBA 2BA2

onde:

1,34265

)37,1)(16()30,1)(15(

2nn

S)1n(S)1n(S

BA

2BB

2AA2

p

)6

1

5

1(34,126,2)17,4440,45()

6

1

5

1(34,126,2)17,4440,45( BA

1,5823,11,5823,1 BA

%95mm2,81mm0,35-P BA

SACHIKO ARAKI LIRA 83

3) Quando as Variâncias Populacionais 21 e 2

2 são Desconhecidas e Supostamente

Diferentes

Para a construção do intervalo de confiança para a diferença entre duas médias

populacionais 1 e 2 , com base nos dados amostrais, desconhecendo-se os desvios padrões

populacionais 1 e 2 sendo supostamente diferentes, deve-se fazer uma modificação no teste

t, denominada correção de Aspin-Welch.

1

n

S

n

St)XX(

n

S

n

St)XX(P

2

22

1

21

21

2

22

1

21

221221

onde a variável t tem número de graus de liberdade dada por:

1n

w

1n

w

ww

2

22

1

21

2

21

, onde

1

21

1n

Sw e

2

22

2n

Sw (método de Aspin-Welch)

onde:

1X é a média da amostra 1;

2X é a média da amostra 2;

é o nível de significância adotado;

2t é o valor de t da tabela da distribuição “t” para um determinado nível de significância e

graus de liberdade;

21S é a variância da amostra 1;

22S é a variância da amostra 2;

1n é o tamanho da amostra 1;

2n é o tamanho da amostra 2.

Exemplo de aplicação:

1) Dois operários mediram o tempo (em min) de certa operação industrial, obtendo:

17,12X1 ; 60,15X2 ; 77,7S21 ; 30,16S2

2 ; 6n1 ; 5n2

Estimar através de um I.C. de 95% a diferença 21 , supondo que as variâncias sejam

diferentes.

Solução:

%951

2t é o valor de t da tabela da distribuição “t” para um determinado nível de significância e

graus de liberdade.

ESTIMAÇÃO DE PARÂMETROS 84

Onde:

1n

w

1n

w

)ww(

2

22

1

21

221

, onde

1

21

1n

Sw e

2

22

2n

Sw

1,306

77,7

n

Sw

1

21

1

3,265

30,16

n

Sw

2

22

2

7

15

26,3

16

30,1

)26,330,1(22

2

O intervalo de confiança (I.C.) de %100)1( para 21 , será dado por:

2

22

1

21

21

2

22

1

21

n

S

n

St)XX(

n

S

n

St)XX( 221221

5

3,16

6

77,736,2)6,1517,12(

5

3,16

6

77,736,2)6,1517,12( 21

5,04-3,435,04-3,43 21

%95min 1,61min 8,47-P 21

6.5.3 INTERVALO DE CONFIANÇA PARA A VARIÂNCIA POPULACIONAL

1

S)1n(S)1n(P

221

22

22

2

FIGURA 3 – DISTRIBUIÇÃO 2

1

2

2

221

22

)(f 2

SACHIKO ARAKI LIRA 85

Exemplo de aplicação:

Foram realizadas 12 determinações da densidade de certo metal ( 3cm/g ), obtendo-se o

seguinte resultado: 02,0S2

Estimar a variância populacional da densidade através de um intervalo de confiança de

95%.

Solução:

Tem-se então que 02,0S2 . Os valores de 2 tabelados serão:

3,8157221

21,920022

Logo:

221

22

22

2 S)1n(S)1n(

8157,3

02,0)112(

9200,21

02,0)112( 2

%950577,00100,0P 2

6.5.4 INTERVALO DE CONFIANÇA PARA O DESVIO PADRÃO POPULACIONAL

Considerando a raiz quadrada positiva do intervalo de confiança da variância

populacional, obtém-se o intervalo de confiança de %100)1( para , dada por:

1

S)1n(S)1n(P

221

2

22

2

Exemplo de aplicação:

Considerando os resultados obtidos nas determinações da densidade de certo metal ( 3cm/g ),

apresentado no exemplo anterior, estimar o desvio padrão através de um intervalo de confiança

de 95%.

Solução:

221

2

22

2 S)1n(S)1n(

8157,3

02,0)112(

9200,21

02,0)112(

%950,24010,1002P

ESTIMAÇÃO DE PARÂMETROS 86

6.5.5 INTERVALO DE CONFIANÇA PARA PROPORÇÃO POPULACIONAL

Para o cálculo do desvio padrão, deve-se estimar a proporção populacional p , utilizando

a estimativa pontual p , assim fazendo p1q , tem-se:

1

n

qpZpp

n

qpZpP 22

onde n

xp é a proporção amostral (onde x representa o número de casos favoráveis ao evento

estudado).

A utilização do I. C. acima deve obedecer aos seguintes critérios:

a) 5np e 5)p1(n , exigindo assim que a amostra seja grande. Os critérios exigidos estão

teoricamente, de acordo com a aproximação da distribuição binomial à distribuição normal;

b) Quando as condições do item (a) não são obedecidas, a amostra será pequena e a

construção dos intervalos de confiança exige a utilização de uma tabela especial, resultando

em I.C. tão amplos que não tem nenhum valor prático.

Exemplo de aplicação:

Em uma amostra de 200 peças produzidas por certa máquina, verificou-se que 10 eram

defeituosas. Estimar a verdadeira proporção de peças defeituosas produzidas por essa

máquina, utilizando I.C. de 90%.

Solução:

200n

05,0200

10p

95,0p1q

64,1Z 2

Substituindo os valores na expressão do I.C., tem-se:

200

95,005,064,105,0p

200

95,005,064,105,0

0753,0p0247,0

%90%53,7p%47,2P

SACHIKO ARAKI LIRA 87

6.6 DIMENSIONAMENTO DA AMOSTRA

O objetivo do dimensionamento de amostras é o de determinar o tamanho mínimo de

amostra que se deve tomar, de maneira que, ao se estimar o parâmetro, o erro seja menor do

que um valor especificado.

6.6.1 ESTIMAÇÃO DA MÉDIA POPULACIONAL

Suponha que se pretende dimensionar o tamanho da amostra para a estimação da

média populacional , através do I.C. de %100)1( . Em se tratando extração de amostras

com reposição, a precisão é dada pela semi-amplitude do I.C.:

n

Ze 2o

,

quando o desvio padrão populacional é conhecido. E assim,

2

o2

eZn

Já, quando se tratar de extração de amostras sem reposição, tem-se:

1n

nN

nZe 2o

222

20

222

Z)1N(e

NZn

Exemplo de aplicação:

Qual o tamanho mínimo da amostra para se estimar a média de uma população cujo desvio

padrão é igual a 10, com confiança de 99% e precisão igual a 4? Supor que a amostragem é

obtida:

a) com reposição;

b) sem reposição de uma população com 1000 elementos;

Solução:

a) Amostragem com reposição

Tem-se as seguintes informações:

10

4e0

%991 , logo %1 e 58,2Z 2

ESTIMAÇÃO DE PARÂMETROS 88

2

o2

eZn

4241,60254

58,2n

210

b) Amostragem sem reposição

10

4e0

000.1N

%991 , logo %1 e 58,2Z 2

222

20

222

Z)1N(e

NZn

4039,97921058,2)11000(4

10001058,2n

222

22

6.6.2 ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL

Suponha que se pretende dimensionar o tamanho da amostra para a estimação da

proporção populacional p através do I.C. de %100)1( . A precisão é dada pela semi-

amplitude do I.C.:

n

qpZe 20

,

20

22

e

qpZn

Exemplo de aplicação:

Qual o tamanho de amostra suficiente para estimar a proporção de peças defeituosas fornecidas

por certa máquina, com precisão de 0,08 e 99% de confiança, sabendo que essa proporção não

ultrapassa a 0,10?

Solução:

10,0p

03,0e0

%991 , logo %1 e 58,2Z 2

SACHIKO ARAKI LIRA 89

20

22

e

qpZn

9493,6056)08,0(

)10,01(10,058,2n

2

2

LISTA DE EXERCÍCIOS NO. 5 - INTERVALOS DE CONFIANÇA

1. A cronometragem (em segundos), de certa operação, obtida em uma amostra, forneceu os

seguintes resultados: 11n ; 18,27X ; 2,49S .

Supondo que o tempo para a execução da operação industrial seja normalmente distribuído,

construir: a) O I.C. de 95% para a média populacional; b) O I.C. de 95% para a variância populacional; c) O I.C. de 95% para o desvio padrão populacional;

2. Um fabricante produz anéis para pistões de um motor de um carro. Sabe-se que o diâmetro

do anel é distribuído normalmente com 001,0 milímetro. Uma amostra aleatória de 15

anéis tem um diâmetro médio de 74,036 milímetros. Construa o intervalo de confiança de

99% para o diâmetro dos anéis de pistão.

3. Sabe-se que a vida (em horas), de um bulbo de uma lâmpada de 75 W é distribuída

normalmente com 25 horas. Uma amostra aleatória de 20 bulbos tem uma vida média de

1.014 horas. Construa um intervalo de confiança de 95% para a vida média.

4. Um engenheiro do setor de pesquisa de um fabricante de pneu está investigando a vida

média do pneu em relação a um novo componente de borracha. Ele fabricou 16 pneus e

testou-os até o final da vida em um teste na estrada. A média e o desvio padrão da amostra

são 60.139,7 e 3.645,94 km, respectivamente. Sabendo-se que a vida média do pneu é

normalmente distribuída, encontre um intervalo de confiança de 95% para:

a) a vida média do pneu;

b) o desvio padrão do tempo de vida do pneu.

5. Uma máquina produz bastões metálicos usados em um sistema de suspensão de

automóveis. Uma amostra aleatória de 15 bastões é selecionada e mede-se o diâmetro dos

bastões. Os dados (em milímetro) resultantes são mostrados a seguir:

15n ; 23,8X ; 03,0S

Sabendo-se que o diâmetro dos bastões distribui-se normalmente: a) encontre um intervalo de confiança de 95% para o diâmetro médio dos bastões; b) encontre um intervalo de confiança de 95% para a variância dos bastões;

c) encontre um intervalo de confiança de 95% para o desvio padrão dos bastões;

6. Em uma amostra aleatória de 85 mancais de eixos de manivelas de motores de automóveis,

10 têm um acabamento de superfície que é mais rugoso do que as especificações

permitidas. Consequentemente, uma estimativa pontual da proporção de mancais na

ESTIMAÇÃO DE PARÂMETROS 90

população que excede a especificação de rugosidade é 12,085

10p . Construir o intervalo de

confiança de 95% para a proporção populacional.

7. Um fabricante de calculadoras eletrônicas retira uma amostra aleatória de 1200 calculadoras

e encontra 80 unidades defeituosas. Construa um intervalo de confiança de 95% para a

proporção de calculadoras defeituosas na população.

8. Está-se estudando a fração de circuitos integrados defeituosos produzidos em um processo.

Uma amostra de 300 circuitos é testada, revelando 13 defeituosos. Calcular o intervalo de

confiança de 90% para a fração de circuitos defeituosos produzidos pelo processo.

9. Um empresa vem tendo sérios problemas com sucata e retrabalho, de modo que um de seus

engenheiros de qualidade decide investigar um determinado processo. Uma amostra

aleatória de 150 itens é extraída num determinado dia, sendo encontrada uma porcentagem

alta e alarmante de 16% de itens desconformes (ou seja, defeituosos) . O engenheiro decide

criar um intervalo de confiança de 95% para a proporção real de unidades defeituosas

naquele momento. Qual é o intervalo obtido?

10. Dois tipos de plásticos são adequados para uso por um fabricante de componentes

eletrônicos. A resistência à quebra desse plástico é importante. É sabido que 0,121 psi.

A partir de uma amostra aleatória de 10n1 e 12n2 , obteve-se 5,162X1 e 0,155X2 psi.

A companhia não adotará o plástico 1, a menos que sua resistência média à quebra exceda

do plástico 2, por no mínimo, 10 psi. Calcule o intervalo de confiança de 95% para a

diferença de médias, supondo que ambas as populações sejam normalmente distribuídas.

11. Duas formulações diferentes de um combustível oxigenado de um motor devem ser testadas

com a finalidade de estudar sua octanagem na estrada. A variância da octanagem na

estrada no caso da formulação 1 é 5,121 e no caso da formulação 2 é 2,12

2 . Duas

amostras aleatórias de 15n1 e 20n2 são testadas, sendo que as octanagens médias

observadas são 6,89X1 e 5,92X2 . Considere normalidade das distribuições. Calcular o

intervalo de confiança de 90% para a diferença na octanagem média ( 12 ) observada na

estrada.

12. Diâmetro de bastões de aço, fabricadas em duas máquinas extrusoras diferentes, está

sendo investigado. Duas amostras aleatórias de tamanhos de 15n1 e 17n2 são

selecionadas e as médias e variâncias das amostras são 73,8X1 , 35,0S21 , 68,8X2 e

40,0S21 , respectivamente. Suponha que 2

221 e que os dados sejam retirados de uma

população normal. Construa um intervalo de confiança de 98% para a diferença no diâmetro

médio dos bastões.

13. Duas companhias fabricam um material de borracha para uso em uma aplicação automotiva.

A peça será sujeita a um desgaste abrasivo no campo de aplicação. Assim, decide-se

comprar, através de um teste, o material produzido por cada companhia. Vinte e cinco

amostras de material de cada companhia são testadas em um teste de abrasão, sendo a

quantidade de desgaste observada depois de 1000 ciclos. Para a companhia 1, a média e o

desvio padrão do desgaste na amostra são 20X1 miligramas/1000 ciclos e 2S1

miligramas/1000 ciclos, enquanto para companhia 2 são 15X2 miligramas/1000 ciclos e

SACHIKO ARAKI LIRA 91

8S2 miligramas/1000 ciclos. Construa um intervalo de confiança para 95% e 99% para a

diferença de média de desgastes, considerando que as populações são normalmente

distribuídas.

14. Um experimento realizado para estudar várias características de pinos de ferro resultou em

78 observações sobre a resistência de corte (kip) de pinos de 3/8 polegada de diâmetro e 88

observações sobre a resistência de pinos de 1/2 polegada de diâmetro. Os resultados

obtidos foram:

PINOS n X S

Pino diâmetro 3/8 38 6,140 0,9 Pino diâmetro 1/2 35 4,250 1,3

Construir um intervalo de confiança de 98% para diferença entre as resistências médias de

corte, supondo normalidade das duas populações.

15. Qual o tamanho mínimo de amostra para se estimar a média de uma população cujo desvio

padrão é igual a 12, com confiança de 95% e precisão igual a 3? Supor que a amostragem é

obtida sem reposição de uma população com 2000 elementos.

16. Qual o tamanho de amostra suficiente para estimarmos a proporção de peças defeituosas

fornecidas por certa máquina, com erro de 0,03 e 99% de confiança, sabendo que a proporção

não ultrapassa de 0,10

17. Determinar o número mínimo de elementos de uma amostra, se desejamos estimar a média

populacional com 95% de confiança e erro amostral de 1, sendo que de uma amostra piloto com

70 elementos obteve-se variância igual a 36.

18. Um fabricante de peças acredita que aproximadamente 5% de seus produtos são

defeituosos se ele deseja estimar a verdadeira porcentagem, com erro de 0,05, com 90% de

confiança. Qual deverá ser o tamanho da amostra a ser retirada?

TESTES DE HIPÓTESES 92

TESTES DE HIPÓTESES

7.1 ETAPAS PARA TESTES DE HIPÓTESES

Etapas básicas para testar a significância estatística:

1) Estabelecer a hipótese nula 0H ;

2) Estabelecer a hipótese alternativa 1H ;

3) Fixar o nível de significância ;

4) Escolher a distribuição de probabilidade adequada ao teste e a partir daí determinar a região

de rejeição da hipótese nula 0H ;

Para a definição da região de rejeição de 0H é necessário considerar a hipótese 1H , uma vez

que é ela que define o tipo do teste, se é unilateral à esquerda, unilateral à direita ou bilateral.

Conforme o tipo do teste identifica-se a área de rejeição de 0H . Genericamente, tem-se:

00 TT:H

3Figura)bilateralteste(TT

2Figura)direitaàunilateralteste(TT

1Figura)esquerdaàunilateralteste(TT

:H

0

0

0

1

Os pontos -c e c são os pontos críticos, localizados nas tabelas das distribuições das estatísticas

do teste, considerando-se o nível de significância adotado e o número de graus de liberdade em

questão.

5) Definir o tamanho da amostra, coletar os dados e calcular o valor da estatística

correspondente;

6) Rejeitar ou aceitar Ho, avaliando se o valor da estatística, obtida a partir dos dados amostrais,

situa-se na área de rejeição ou na região de aceitação.

7.1.1 NÍVEL DE SIGNIFICÂNCIA

É a probabilidade máxima com a qual se sujeitaria a correr o risco de um erro tipo I.

R.R. Figura 1 Figura 2 R.R.

R.R.

Figura 3

SACHIKO ARAKI LIRA 93

7.1.2 ERRO ESTATÍSTICO

Dois tipos de erros são possíveis:

Erro tipo I – Rejeitar a hipótese nula quando ela for verdadeira, também denominado

erro alfa ( ).

)verdadeiraH/Hrejeitar(P 00

Erro tipo II – Não rejeitar a hipótese nula quando ela for falsa, também denominado erro

beta ( ).

)falsaH/Haceitar(P 00

7.2 TESTES ESTATÍSTICOS PARAMÉTRICOS

7.2.1 TESTE PARA A MÉDIA POPULACIONAL

7.2.1.1 QUANDO A VARIÂNCIA POPULACIONAL 2 É CONHECIDA

Para amostras pequenas )30n( , a população deve ser normalmente distribuída, e o

desvio padrão populacional deve ser conhecido. Para grandes amostras )30n( , não existe

a exigência de que a população seja normalmente distribuída (justificada pelo Teorema Central

do Limite).

Para realizar o teste de hipóteses, as etapas apresentadas na seção 7.1 devem ser

seguidas. As hipóteses estatísticas são:

00 :H

)bilateralteste(

)direitaàunilateralteste(

)esquerdaàunilateralteste(

:H

0

0

0

1

Estabelecido o nível de significância , o valor de Z crítico para este nível de

significância será obtido em uma tabela da variável normal padronizada e, assim, definida a

região de rejeição de 0H . Obtidos os dados amostrais, a estatística do teste é calculada por:

n

XZ 0

onde:

X é a média amostral;

0 é o valor a ser testado;

é o desvio padrão populacional;

TESTES DE HIPÓTESES 94

n é o tamanho da amostra.

Deve-se rejeitar 0H se o valor de Z amostral se situar na região de rejeição ou aceitar

0H se situar na região de aceitação.

Exemplos de aplicação:

1) Uma peça ao ser fabricada, foi planejada de tal forma que uma de suas dimensões seja igual

a 10 cm. Conhece-se o desvio padrão do processo produtivo, que é igual a 0,8 cm e sabe-se

que a distribuição das dimensões é normal. Uma amostra de 40 peças forneceu uma dimensão

média igual a 10,09 cm. Há interesse em testar se a média populacional é maior que 10 cm, ao

nível de 5% de significância.

Solução:

Dados: 8,0 cm

40n

09,10X

As hipóteses estatísticas são: 10:H0

10:H1

A estatística do teste é calculada por: 0,71

40

8,0

1009,10

n

XZ 0

Conclusão: O valor de Z calculado é 0,71 e o tabelado 64,1Z 05,0 . Portanto, aceita-se 0H , logo,

a média populacional é igual a 10 cm.

2) Uma população normalmente distribuída tem desvio padrão conhecido, sendo igual a 5 mm.

Uma amostra de 20 elementos, obtida dessa população, tem média igual a 46 mm. Pode-se

afirmar que a média dessa população é superior a 43mm, ao nível de significância de 1%?

Solução:

a) Dados:

5 cm

20n

46X

As hipóteses estatísticas são:

43:H0

43:H1

A estatística do teste é calculada por:

SACHIKO ARAKI LIRA 95

n

XZ 0

Conclusão: O valor de Z calculado é 2,68 e o tabelado 33,2Z 01,0 . Portanto, rejeita-se 0H ,

logo, a média populacional é maior que 43 mm.

7.2.1.2 QUANDO A VARIÂNCIA POPULACIONAL 2 É DESCONHECIDA

Deve-se seguir as etapas já apresentadas anteriormente para fazer o teste.

Para amostras pequenas )30n( , a população de onde a amostra foi retirada deve ser

normalmente distribuída. Se 2 é desconhecida, a estatística do teste é calculada por:

n

S

Xt 0

sendo a distribuição t de Student com n-1 graus de liberdade.

onde:

X é a média amostral;

0 é o valor a ser testado;

S é o desvio padrão amostral;

n é o tamanho da amostra.

As áreas de rejeição e aceitação de 0H devem ser definidos de acordo com o valor

crítico de t, que deve ser obtido em uma tabela da distribuição t de Student, para nível de

significância e n-1 graus de liberdade. Deve-se rejeitar 0H se o valor de t amostral situar-se

na região de rejeição ou aceitar 0H se situar-se na região de aceitação.

Exemplos de aplicação:

1) Uma amostra de 20 peças, retirada de uma população normalmente distribuída, apresenta

diâmetro médio igual a 10,08 cm e desvio padrão igual a 0,9 cm. Pode-se afirmar que o

diâmetro médio da população é superior a 10 cm, ao nível de significância de 1%?

Solução:

Dados:

9,0S cm

20n

8,10X

As hipóteses estatísticas são:

10:H0

TESTES DE HIPÓTESES 96

10:H1

A estatística do teste é calculada por:

98,3

20

9,0

108,10

n

Xt

S0

Conclusão: O valor de t calculado é 3,98 e o tabelado 54,2t 19;01,0 . Portanto, rejeita-se 0H ,

logo, a média populacional é maior do que 10 cm.

2) Um fabricante afirma que a tensão média de ruptura dos cabos produzidos por sua

companhia não é inferior a 500 kgf. Uma amostra de 7 cabos foi ensaiada, obtendo-se os

resultados (em Kgf): 14,485X e 77,7S . Sabendo-se que a tensão de ruptura é

normalmente distribuída, testar a hipótese de que a média populacional é menor que 500 kgf,

utilizando o nível de significância de 5%.

Solução:

Cálculo das estatísticas a partir da amostra:

77,7S cm

7n

14,485X

As hipóteses estatísticas são: 500:H0

500:H1

A estatística do teste é calculada por:

n

Xt

S0

-5,06

7

50014,485t

77,7

Conclusão: O valor de t calculado é -5,06 e o tabelado 943,16;t . Portanto, rejeita-se 0H ,

logo, a média populacional é menor que 500 kgf.

7.2.2 TESTE PARA A PROPORÇÃO POPULACIONAL

Utiliza-se o teste para a proporção populacional (p) quando se deseja testar a hipótese

de que p é supostamente igual a um determinado valor.

As hipóteses estatísticas são:

SACHIKO ARAKI LIRA 97

00 pp:H

)bilateralteste(pp

)direitaàunilateralteste(pp

)esquerdaàunilateralteste(pp

:H

0

0

0

1

Os critérios a serem obedecidos é que 5np e 5)p1(n , exigindo assim que a amostra seja

grande. Para amostras suficientemente grandes (na prática, 30n ), a estatística do teste é

dada por:

n

)p1(p

ppZ

00

0

onde:

p é a proporção amostral;

0p é o valor a ser testado;

n é o tamanho da amostra.

Estabelecido o nível de significância , o valor de Z crítico para este nível de

significância será obtido em uma tabela da variável normal padronizada e assim, definida a

região de rejeição de 0H . Deve-se rejeitar 0H se o valor de Z calculado situar-se na região de

rejeição ou aceitar 0H se situar-se na região de aceitação.

Exemplos de aplicação:

1) Um fabricante afirma que no máximo 3% das peças produzidas por sua indústria são

defeituosas. Um comerciante comprou 50 peças e verificou que 4 eram defeituosas. Testar a

hipótese de que a proporção de peças defeituosas é superior a 3%, utilizando nível de

significância de 5%.

Solução:

50n

08,050/4p

%5

As hipóteses estatísticas são:

03,0p:H0

03,0p:H1

A estatística do teste é dada por:

n

)p1(p

ppZ

00

0

TESTES DE HIPÓTESES 98

07,2

50

)03,01(03,0

03,008,0Z

645,1Z 05,0 (teste unilateral)

Conclusão: O valor de Z calculado é maior que o Z tabelado, portanto, rejeita-se a hipótese 0H

de que a proporção de defeituosos é igual a 3%. Logo, a proporção de defeituosos é maior que

3%.

2) Deseja-se determinar se um certo tipo de tratamento para evitar a corrosão é eficiente. O

tratamento é considerado eficiente se mais de 95% dos tubos apresentarem resultado

satisfatório. Em uma amostra de 50 tubos, observou-se que 48 apresentaram resultados

satisfatórios. Qual a conclusão, ao nível de significância de 1%?

Solução:

50n

96,050/48p

%1

As hipóteses estatísticas são:

95,0p:H0

95,0p:H1

A estatística do teste é dada por:

n

)p1(p

ppZ

00

0

32,0

50

)95,01(95,0

95,096,0Z

33,2Z 01,0 (teste unilateral)

Conclusão: O valor de Z calculado é menor que Z tabelado, portanto, aceita-se a hipótese 0H

de que a proporção de tubos que apresentam resultado satisfatório é igual a 95%.

7.2.3 TESTE PARA A VARIÂNCIA POPULACIONAL

Para aplicar o teste para a variância é necessário que a população de onde foi extraída a

amostra seja normalmente distribuída.

As hipóteses estatísticas são:

SACHIKO ARAKI LIRA 99

20

20 :H

)bilateralteste(

)direitaàunilateralteste(

)esquerdaàunilateralteste(

:H20

2

20

2

20

2

1

A estatística do teste é calculada por:

20

22 S)1n(

As regiões de rejeição e aceitação de 0H serão definidas de acordo com o valor crítico

obtido em uma tabela de distribuição 2 , para nível de significância e n-1 graus de liberdade.

Deve-se rejeitar 0H se o valor de 2 calculado situar-se na região de rejeição ou aceitar 0H se

situar-se na região de aceitação.

Exemplos de aplicação:

1) As chapas de aço, produzidas por uma indústria, têm especificação tal que a variância de

suas espessuras (em mm) não deve ser superior a 0,0009 mm2. Uma amostra de 30 chapas,

apresentaram espessura média de 3,157 mm e variância igual a 0,00098 mm2. O que se pode

concluir a cerca da especificação da indústria ao nível de 5% de significância sendo que as

espessuras das chapas têm distribuição normal?

Solução:

30n

157,3X

00098,0S2

%5

As hipóteses estatísticas são:

0009,0:H 20

0009,0:H 21

A estatística do teste é calculada por:

20

22 S)1n(

58,310009,0

00098,0)130(2

As áreas de rejeição e aceitação de 0H encontram-se no gráfico abaixo:

TESTES DE HIPÓTESES 100

Conclusão: O valor de 2 tabelado é 42,56, logo aceita-se 0H , portanto, conclui-se que 2

não é superior a 0,0009 mm2.

2) Usuários de uma rede de transmissão de energia elétrica têm reclamado da alta variação na

tensão (desvio padrão de 12 V). A empresa encarregada da transmissão de energia elétrica na

região instalou novos transformadores. Uma amostra de 30 observações forneceu um desvio

padrão de 8V e a distribuição de freqüências dos valores da amostra sugere uma distribuição

normal. Há evidência de redução na variação da tensão? Usar %5 . ( 2 =12,89)

7.2.4 TESTE PARA A DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS

7.2.4.1 QUANDO AS VARIÂNCIAS POPULACIONAIS 21 E

22 SÃO CONHECIDAS

A aplicação do teste requer as seguintes suposições:

1. As duas populações 1X e 2X devem ser independentes;

2. Ambas as populações devem ser normais.

As hipóteses estatísticas são:

0210 d:H

)bilateralteste(d

)direitaàunilateralteste(d

)esquerdaàunilateralteste(d

:H

021

021

021

1

A estatística do teste é dada por:

2

22

1

21

021

nn

d)XX(Z

A.R.

.

42,56

A.A.

.

SACHIKO ARAKI LIRA 101

onde:

1X é a média da amostra 1;

2X é a média da amostra 2; 21 é a variância da população 1;

22 é a variância da população 2;

1n é o tamanho da amostra 1;

2n é o tamanho da amostra 2.

Estabelecido o nível de significância , o valor de z crítico para este nível de

significância será obtido em uma tabela da variável normal padronizada e assim, definida a

região de rejeição de 0H . Deve-se rejeitar 0H se o valor de z calculado situar-se na região de

rejeição ou aceitar 0H se situar-se na região de aceitação.

Exemplos de aplicação:

1) Duas amostras de tubos de aço das marcas A e B foram analisadas e obtidas as resistências

médias, respectivamente de 40 kgf/mm2 e 35 kgf/ mm2. Conhecendo-se os desvios padrão

populacionais das resistências, de 4 kgf/ mm2 e 6 kgf/ mm2 , respectivamente, e tamanhos de

amostras iguais a 30, qual a conclusão a respeito das diferenças entre as médias, ao nível de

significância de 5%?

Solução:

1) Dados:

40X1 ; 41 ; 30n1

35X2 ; 52 ; 30n2

05,0

As hipóteses estatísticas são:

0:H 210

0:H 211

A estatística do teste é dada por:

80,3

30

6

30

4

3540

nn

)XX(Z

22

2

22

1

21

21

96,1Z 025,02/ (teste bilateral)

Conclusão: O valor de Z calculado é igual a 3,80 e valor tabelado é 1,96, portanto, rejeita-se

0H . Logo, as resistências médias das marcas A e B são diferentes.

TESTES DE HIPÓTESES 102

2) Uma amostra de 100 válvulas da Indústria A tem vida média h1530XA , sendo h100A .

Uma outra amostra de 70 válvulas da Indústria B, tem vida média h1420XB , sendo

h80B . Testar a hipótese de que as válvulas da indústria A em relação a B tem duração

média superior a 100 h. Utilizar 01,0 .

Solução:

Dados:

530.1XA ; 100A ; 100nA

450.1XB ; 902 ; 70n2

01,0

As hipóteses estatísticas são:

100:H BA0

100:H BA1

A estatística do teste é dada por:

45,5

70

90

100

100

450.1530.1

nn

)XX(Z

22

B

2B

A

2A

BA

33,2Z 01,0

Conclusão: O valor de Z calculado é igual a 5,45 e valor tabelado é 2,33, portanto, rejeita-se

0H . Logo, as válvulas da indústria A em relação a B têm duração média superior a 100 h.

7.2.4.2 QUANDO AS VARIÂNCIAS POPULACIONAIS 21 E

22 SÃO DESCONHECIDAS

A aplicação do teste requer as seguintes suposições quando 21 e 2

2 são

Desconhecidas:

1. As populações 1X e 2X devem ser normalmente distribuídas;

2. Os tamanhos de amostras ( 1n e 2n ) devem ser pequenos (não exceder 40).

a) Quando as Variâncias Populacionais 21 e 2

2 são Desconhecidas e Supostamente

Iguais

As hipóteses estatísticas são:

0210 d:H

)bilateralteste(d

)direitaàunilateralteste(d

)esquerdaàunilateralteste(d

:H

021

021

021

1

SACHIKO ARAKI LIRA 103

A estatística do teste é dada por:

)n

1

n

1(S

d)XX(t

21

2p

021

, onde

2nn

S)1n(S)1n(S

21

222

2112

p

onde:

1X é a média da amostra 1;

2X é a média da amostra 2;

2

1S é a variância da amostra 1;

22S é a variância da amostra 2;

1n é o tamanho da amostra 1;

2n é o tamanho da amostra 2.

A determinação da região crítica será com base no valor de t tabelado com

2nn 21 graus de liberdade e nível de significância . Deve-se rejeitar 0H se o valor de t

calculado situar-se na região de rejeição ou aceitar 0H se situar-se na região de aceitação.

Exemplo de aplicação:

Dois tipos de soluções químicas foram ensaiados para se determinar os pH. Os resultados

obtidos foram:

516,7X1 ; 033,0S21 ; 5n1

505,7X2 ; 011,0S22 ; 6n2

Testar a hipótese de que não existe diferença entre os pH médios das duas populações,

supondo que os desvios padrões populacionais são iguais. Usar 05,0 .

Solução:

516,7X1 ; 033,0S21 ; 5n1

505,7X2 ; 011,0S22 ; 6n2

05,0

As hipóteses estatísticas são:

0:H 210

0:H 211

A estatística do teste é dada por:

)n

1

n

1(S

d)XX(t

21

2p

021

, onde

2nn

S)1n(S)1n(S

21

222

2112

p

TESTES DE HIPÓTESES 104

021,0265

011,0)16(033,0)15(S2

p

13,0

6

1

5

1021,0

0)505,7516,7(t

O número de graus de liberdade é dada por: 92652nn 21 . Portanto, o

valor de 2t com 9 graus de liberdade é 2,26.

Conclusão: O valor de t calculado é igual 0,13, menor que o valor tabelado, logo, aceita-se 0H .

Conclui-se, portanto, que os pH médios das duas populações são iguais.

b) Quando as Variâncias Populacionais 21 e 2

2 são Desconhecidas e Supostamente

Diferentes

Quando as variâncias das amostras não forem homogêneas, uma modificação do teste t,

denominada correção de Aspin-Welch deve ser aplicada.

As hipóteses a serem testadas são:

0210 d:H

)bilateralteste(d

)direitaàunilateralteste(d

)esquerdaàunilateralteste(d

:H

021

021

021

1

A estatística do teste é dada por:

2

22

1

21

021

n

S

n

S

d)XX(t

A determinação da região crítica será com base no valor de t tabelado com

1n

w

1n

w

ww

2

22

1

21

2

21

, onde

1

21

1n

Sw e

2

22

2n

Sw , graus de liberdade e nível de significância .

Tem-se que:

1X é a média da amostra 1;

2X é a média da amostra 2;

2

1S é a variância da amostra 1;

22S é a variância da amostra 2;

1n é o tamanho da amostra 1;

2n é o tamanho da amostra 2.

SACHIKO ARAKI LIRA 105

Deve-se rejeitar 0H se o valor de t calculado situar-se na região de rejeição ou aceitar

0H se situar-se na região de aceitação.

Exemplo de aplicação:.

Uma mesma distância foi medida 5 vezes por dois instrumentos (em metros):

Instrumento 1: 46,100X1 ; 473,0S21 ; 5n1

Instrumento 2: 40,100X2 ; 01,0S22 ; 5n2

Testar a hipótese de que não existe diferença entre os resultados obtidos antes e após a

calibração do instrumento. Utilizar o nível de significância de 5%.

Solução:

46,100X1 ; 473,0S21 ; 5n1

40,100X2 ; 01,0S22 ; 5n2

05,0

As hipóteses estatísticas são:

0:H 210

0:H 211

A estatística do teste é dada por:

2

22

1

21

021

n

S

n

S

d)XX(t

A determinação da região crítica será com base no valor de t tabelado com

1n

w

1n

w

ww

2

22

1

21

2

21

, onde

1

21

1n

Sw e

2

22

2n

Sw , graus de liberdade e nível de significância .

19,0

5

01,0

5

473,0

0)40,10046,100(t

22

Cálculo de (graus de liberdade):

0946,05

0473,0

n

Sw

1

21

1

002,05

01,0

n

Sw

2

22

2

TESTES DE HIPÓTESES 106

416,4

4

002,0

4

0946,0

)002,00946,0(

1n

w

1n

w

ww22

2

2

22

1

21

2

21

Conclusão: O valor de 2t com 4 graus de liberdade é 2,78, logo, aceita-se

0:H 210 . Conclui-se que as médias são iguais.

7.2.5 DUAS AMOSTRAS EMPARELHADAS

Este teste deve ser utilizado quando os dados estão relacionados dois a dois de acordo

com algum critério.

O teste t de Student para grupos dependentes é aplicado para comparação das médias

de dois grupos emparelhados, que utiliza para o seu cálculo, a média das diferenças )d( entre

cada um dos pares formados pelas duas amostras.

Se n 30 (pares), a suposição explícita de normalidade da população é desnecessária

(Teorema Central do Limite).

As hipóteses a serem testadas:

0210 d:H

)bilateralteste(d

)direitaàunilateralteste(d

)esquerdaàunilateralteste(d

:H

021

021

021

1

A estatística do teste é dada por:

nS

ddt

d

0 ,

em que: n

d

d

n

1ii

e

n

1i

22i

2d dnd

1n

1S

d é a media das diferenças;

0d é o valor que ser quer testar;

n é o tamanho da amostra.

Se o valor de t calculado situar-se na região de rejeição, rejeita-se 0H e se situar na

região de aceitação, aceita-se 0H .

Exemplo de aplicação: Uma amostra de 7 cabos de aço foi analisada antes e depois de sofrer

um tratamento para aumentar sua resistência (em kgf/mm2). Os resultados obtidos foram:

Antes: 50 54 51 50 55 53 52 Depois: 60 61 57 54 59 58 60

Testar a hipótese de que o tratamento é eficiente, no nível de significância de 5%. Tratar

os dados como emparelhados.

SACHIKO ARAKI LIRA 107

Solução:

As hipóteses a serem testadas:

0d:H0 ( o tratamento não é eficiente)

0d:H 1 ( o tratamento é eficiente)

A estatística do teste é dada por:

nS

ddt

d

0 , em que:

n

d

d

n

1ii

e

n

1i

22i

2d dnd

1n

1S

Tem-se que 44d7

1ii

, logo 29,6d , 90,4S2d e 21,2S .

Assim, a estatística „t” será :

53,7

7

21,2

029,6

nS

ddt 0

Conclusão: O valor de t com 617 graus de liberdade é 1,943, logo, rejeita-se

0d:H0 . Conclui-se que o tratamento é eficiente.

7.2.6 TESTE PARA IGUALDADE DE DUAS VARIÂNCIAS

Para aplicar o teste para a variância é necessário que a população de onde foi extraída a

amostra seja normalmente distribuída.

As hipóteses estatísticas são:

22

210 :H

)bilateralteste(

)direitaàunilateralteste(

)esquerdaàunilateralteste(

:H22

21

22

21

22

21

1

A estatística do teste é calculada por:

22

21

S

SF

onde: 21S é a variância da amostra 1;

22S é a variância da amostra 2;

1n é o tamanho da amostra 1;

2n é o tamanho da amostra 2.

O valor crítico de F é obtido a partir da tabela da distribuição F, para o nível de

significância e 1n11 graus de liberdade no numerador e 1n22 graus de liberdade

no denominador.

Rejeita-se 0H se o valor de F calculado situar-se na região de rejeição ou aceitar 0H se

situar-se na região de aceitação.

TESTES DE HIPÓTESES 108

Exemplo de aplicação:

1) Foram testadas as durabilidades (em km) dos pneus das marcas A e B, obtendo-se para 5

pneus de cada marca os seguintes resultados:

Marca A: 30.000 32.000 28.000 26.000 31.000

Marca B: 25.000 30.000 20.000 21.000 23.000

Existe diferença significativa entre as variâncias das durabilidades dos dois pneus, ao

nível de 10% de significância?

Solução:

As hipóteses estatísticas são:

22

210 :H

22

211 :H

A estatística do teste é calculada por:

22

21

S

SF

Deve-se, portanto, calcular inicialmente os desvios padrão amostrais:

000.800.5S21 5n1 41n11

000.700.15S22 5n2 41n22

37,0000.700.15

000.800.5

S

SF

22

21

A região de rejeição está representada no gráfico:

39,6FFF)4;405,0()1;22(2 ;;

16,039,6

1

F

1FF

)2;12(

)1;221(2;

;1

A.R.

A.R.

A.A.

.

6,39 0,16

SACHIKO ARAKI LIRA 109

Conclusão: O valor de F calculado está na área de aceitação de 0H , portanto, variâncias das

durabilidades dos dois pneus são iguais.

2) Foram ensaiadas válvulas das marcas A e B, e verificou-se que os tempos de vida (em horas)

foram:

Marca A: 1.500 1.450 1.480 1.520 1.510 Marca B: 1.000 1.300 1.180 1.250

Testar a hipótese de igualdade para as variâncias do tempo de vida das válvulas de marcas A e

B, ao nível de significância de 10%.

Solução:

As hipóteses estatísticas são:

2B

2A0 :H

2B

2A1 :H

A estatística do teste é calculada por:

2B

2A

S

SF

Deve-se, portanto, calcular inicialmente os desvios padrão amostrais:

770S2A 5nA 41nAA

225.17S2B 4nB 31nBB

04,0225.17

770

S

SF

2B

2A

A região de rejeição está representada no gráfico:

59,6FFF)4;305,0()1;22(2 ;;

11,012,9

1

F

1FF

)2;12(

)1;221(2;

;1

A.R.

A.R.

A.A.

.

6,39 0,16

0,11 6,59

TESTES DE HIPÓTESES 110

Conclusão: O valor de F calculado é igual a 0,04 situando-se, portanto, na área de rejeição de

0H . Logo, as variâncias do tempo de vida das válvulas de marcas A e B são diferentes.

LISTA DE EXERCÍCIOS NO. 6 – TESTES DE HIPÓTESES

1. Sabe-se que os diâmetros internos de rolamentos usados no trem de pouso de aviões têm

desvio padrão 009,0 cm e normalmente distribuídos. Uma amostra aleatória de 15 rolamentos

acusa um diâmetro interno médio de 8,2535 cm. Testar a hipótese de que o diâmetro interno

médio do rolamento é maior que 8,25 cm. Usar 05,0 .

2. Deseja-se testar a hipótese de que o diâmetro médio da haste de liga de alumínio, produzidas

em uma máquina de calibragem, é diferente de 0,5025 in. Uma amostra de 25 hastes

apresentou um diâmetro médio de 0,5046 in e desvio padrão de 0,01 in. Utilizar 05,0 e supor

distribuição normal.

3. A força média de resistência de uma fibra sintética é uma característica de qualidade de

interesse do fabricante, que deseja testar a hipótese de que a força média é maior que 50 psi,

usando 05,0 . O desvio padrão populacional da força de resistência é desconhecido. Uma

amostra de 16 exemplares de fibra é selecionada e são obtidos os seguintes resultados:

,8605X ; 1,66S . Sabe-se que a distribuição da força de resistência é normal.

4. Uma fundição produz cabos de aço usados na indústria automotiva. Deseja-se testar a

hipótese de que a fração de itens não-conformes é menor que 10%. Em uma amostra aleatória

de 250 cabos, detectou-se que 24 estavam fora das especificações. Usar 05,0 .

5. Em uma amostra aleatória de 80 mancais para virabrequins de automóveis, 15 apresentam o

acabamento de superfície mais áspero do que as especificações permitem. Testar a hipótese de

que a fração de não-conformes é diferente de 0,19, utilizando nível de significância de 2%.

6. Uma amostra aleatória de 500 pinos de hastes de conexão contém 65 unidades não-

conformes. Testar a hipótese de que a verdadeira fração de defeituosos nesse processo é maior

que 0,08. Usar 01,0 .

7. Dois catalisadores estão sendo testados para determinar como afetam o rendimento médio de

um processo químico. Especificamente, o catalisador 1 está sendo usado atualmente, mas o

catalisador 2 é aceitável. Como o catalisador 2 é mais barato, ele poderia ser adotado, desde

que não alterasse o rendimento do processo. Um teste é realizado em uma fábrica piloto e os

resultados são apresentados abaixo. Existe alguma diferença entre os rendimentos médios?

Usar 05,0 e supor que as populações são normais e as variâncias iguais..

Dados: 92,26X1 ; 1,39S1 ; 8n1 ; 92,68X2 ; 28,1S2 ; 8n2

8. Considerar o exercício anterior supondo que as variâncias populacionais não são iguais.

9. Uma pesquisa apresenta os resultados de uma análise do peso do cálcio no cimento padrão e

no cimento misturado com chumbo. Níveis reduzidos de cálcio são uma indicação de que o

mecanismo de hidratação no cimento está bloqueado, o que permitirá a água atacar vários

locais da estrutura de cimento. Dez amostras do cimento padrão acusaram um peso percentual

SACHIKO ARAKI LIRA 111

médio de cálcio de 0,90X1 , com desvio padrão 0,5S1 e 15 amostras do cimento misturado

com chumbo apresentaram um peso médio de cálcio de 0,87X2 , com desvio padrão de

0,4S2 . Testar a hipótese de que 21 é maior zero, utilizando 01,0 e supondo que

ambas as populações são normalmente distribuídos e têm o mesmo desvio padrão.

10. Dois técnicos de controle de qualidade mediram o acabamento da superfície de uma parte de

metal, cujos dados estão apresentados abaixo. Suponha que as medidas sejam normalmente

distribuídas. Testar a hipótese de que as medidas médias do acabamento da superfície obtidas

pelos dois técnicos são iguais. Usar 01,0 e supor variâncias iguais.

Dados: 1,39X1 ; 0,11S1 ; 7n1 ; 1,18X2 ; 12,0S2 ; 8n2

11. Uma nova unidade de purificação é instalada em um processo químico. Antes de sua instalação,

uma amostra aleatória forneceu os seguintes dados sobre a porcentagem de impureza:

85,9X1

73,81S21

10n1

Após a instalação, uma amostra aleatória resultou em:

08,8X2

46,78S22

8n2

É possível concluir que o novo aparelho de purificação reduziu a porcentagem média de

impureza? Usar 05,0 e supor que as populações são normais e variâncias populacionais

diferentes.

12. Dois tipos diferentes de máquina são usados para medir a força de resistência de uma fibra

sintética. Deseja-se saber se as duas máquinas fornecem os mesmos valores médios da

força de resistência. Oito espécimes de fibra são aleatoriamente selecionados e uma

medida da força é feita sobre cada espécime usando cada uma das máquinas.

Testar a hipótese de que não há diferença entre as duas máquinas quanto à força média de

resistência, 05,0 .

Observação: Os dados nesse experimento foram emparelhados para evitar que diferenças entre

os espécimes de fibra (que podem ser substanciais) afetem o teste sobre a diferença das

máquinas.

ESPÉCIMES MÁQUINA 1 MÁQUINA 2

1 74 78

2 76 79

3 74 75

4 69 66

5 58 63

6 71 70

7 66 66

8 65 67

TESTES DE HIPÓTESES 112

13. Um operário realizou uma mesma operação com dois equipamentos diferentes, e os tempos

gastos (em segundos foram):

Equipamento A: 10 11 10 12 15

Equipamento B: 8 10 15 12

Existe diferença significativa entre as variâncias para os tempos gastos pelos dois

equipamentos, ao nível de 10%? Supor as populações normalmente distribuídas.

14. Foram testadas válvulas de marca A e verificou-se que os tempos de vida (em horas) foram:

1500 1450 1480 1520 1510. Sabendo-se que os tempos de vida das válvulas são

normalmente distribuídos, testar a hipótese de que a variância do tempo de vida é menor do que

700, ao nível de 5% de significância.

SACHIKO ARAKI LIRA 113

TESTES DE ADERÊNCIA

INTRODUÇÃO

O objetivo do teste de aderência é verificar se os dados de uma amostra comportam-se

de acordo com uma distribuição teórica, tais como normal, binomial, Poisson, etc.

8.1 TESTE QUI-QUADRADO DE ADERÊNCIA

Os testes de aderência servem para testar hipóteses mais gerais sobre a distribuição dos

dados. A idéia básica é que, dada uma amostra aleatória de tamanho n, observada de uma

variável aleatória X , deseja-se testar:

00 f:H odistibuiçãtemX

01 f:H odistibuiçãtemnãoX

A estatística de teste, chamada de 2 (qui-quadrado), é uma medida de distância entre

as frequências observadas e as frequências esperadas de cada categoria, e é dada pela

expressão:

2k

1i i

ii2

E

EO

, sendo iE obtida através de:

ii pnE

onde:

iO é o número de observações ou freqüência absoluta observada da classe iA ;

n é o número total de observações;

ip é a probabilidade de obter uma observação na classe iA ;

Sendo verdadeira a hipótese nula, a estatística acima tem distribuição assintótica de Qui-

quadrado com 1pk graus de liberdade ( 21pk; ), onde k representa o número de classes e

p o número de parâmetros da distribuição da população, estimados a partir da amostra.

Para utilizar este teste tem-se as seguintes regras:

A dimensão da amostra deve ser não-inferior a 30 ( 30n ) ;

A frequência esperada em cada classe deve ser 5n .

Se esta última condição não prevalecer, o teste pode ainda ser utilizado, embora com

moderada confiança, se não mais de 20% dos valores de iE forem inferiores a 5 e nenhum for

inferior a 1. Quando tal não se verificar, procuram-se agregar classes adjacentes, de forma a

obter novas classes que satisfaçam esta condição.

TESTES DE ADERÊNCIA 114

Se 2c

2calc

, aceita-se 0H ( Há aderência à distribuição especificada)

Se 2c

2calc

, rejeita-se 0H ( Não há aderência à distribuição especificada).

Gráficamente:

Exemplos de aplicação:

1) Supõe-se que o número de defeitos nas placas de circuito impresso segue a distribuição de

Poisson. Uma amostra de 60 placas impressas foi coletada e observou-se o número de defeitos,

apresentados a seguir.

NÚMERO DE DEFEITOS

FREQUÊNCIA

OBSERVADA

0 32

1 15

2 9

3 4

A forma da distribuição de defeitos é Poisson? Usar 05,0 .

Solução:

As hipóteses a serem testadas:

oH : a forma da distribuição de defeitos é Poisson

1H : a forma da distribuição de defeitos não é Poisson

É possível obter as probabilidades para cada valor de X.

No. DE

DEFEITOS ( ix ) NO. DE

MÁQUINAS )xX(p i

0 32 0,53

1 15 0,25

2 9 0,15

3 4 0,07

TOTAL 60 1,00

Tem-se que o número médio de defeitos é dada por:

n

1iii )x(px)X(E

2c

A.A

A.R

SACHIKO ARAKI LIRA 115

75,007,0315,0225,0153,00)X(E

A função de probabilidade da distribuição de Poisson é dada por:

!x

)xX(Pxe

, onde é a média.

Tem-se então que:

472,0!0

)75,0()0X(P

075,0e

354,0!1

)75,0()1X(P

175,0e

133,0!2

)75,0()2X(P

275,0e

041,0)133,0354,0472,0(1)2X(P1)3X(P

As freqüências esperadas são obtidas pela multiplicação do tamanho da amostra 60n

pelas probabilidades )xX(Pp ii , ou seja, ii pnE . As freqüências observadas e as

esperadas estão apresentadas na tabela abaixo.

NÚMERO DE DEFEITOS

FREQUÊNCIA

OBSERVADA

FREQUÊNCIA ESPERADA

0 32 28472,060

1 15 21354,060

2 9 8133,060

3 4 3041,060

A estatística do teste é:

74,23

)34(

8

)89(

21

)2115(

28

)2832(

E

EO 2222n

1i i

2

ii2

O número de graus de liberdade é k-p-1, onde k representa o número de classes e p o

número de parâmetros da distribuição da população estimados a partir da amostra. Assim tem-

se: 1113.l.g

O valor de 2 tabelado com 1 grau de liberdade e 5% de significância é 3,84.

Conclusão:

Como 74,22calc é menor que 84,3.l.g

21;05,0 , aceita-se a hipótese de que a forma

da distribuição de defeitos é Poisson.

2) Foram inspecionados 100 lotes de 3 peças cada um, sendo que o número X de peças

defeituosas por lote segue distribuição abaixo. Testar a hipótese de que a distribuição é

binomial, utilizando 01,0 .

No. de defeituosos 0 1 2 3 Total

No. de lotes 65 30 4 1 100

TESTES DE ADERÊNCIA 116

Solução:

O número médio (média ou valor esperado) de válvulas defeituosas observadas é

calculada por:

6

1iii px)X(E , logo

39,0100

13

100

42

100

301

100

650)X(E

A distribuição binomial é dada por:

xnxxn qpC)xX(P , onde p é a probabilidade de uma válvula ser defeituosa.

Tem-se que a média da distribuição binomial é np)X(E (parâmetro da distribuição

binomial), assim, p3)X(E .

Igualando as duas médias, )X(E , tem-se: 39,0p3 , portanto, 13,0p e

consequentemente, 87,0q . Então, a distribuição binomial ajustada é:

x3xx3 )87,0()13,0(C)xX(P

As probabilidades são calculadas através de:

6585,0)87,0()13,0(C)0X(P 03003

2952,0)87,0()13,0(C)1X(P 13113

0441,0)87,0()13,0(C)2X(P 23223

0022,0)87,0()13,0(C)3X(P 33333

Foram agrupadas as duas últimas classes, pois a freqüência esperada da última classe é

menor do que 1.

As probabilidades, as frequências teóricas e observadas são:

No. DE DEFEITUOSAS

( x )

)xX(P FREQ. TEÓRICA

( iE ) FREQ. OBS. ( IO )

0 0,6585 100x0,6585=66 65

1 0,2952 100x0,2952=29 30

2 0,0463 100x0,0463=5 5

05,05

)55(

29

)2930(

66

)6665(

E

EO 222n

1i i

2

ii2

O número de graus de liberdade é k-p-1, onde k representa o número de classes e p o

número de parâmetros da distribuição da população estimados a partir da amostra. Assim tem-

se: 1113.l.g

O valor de 2 tabelado com 1 grau de liberdade e 1% de significância é 6,64.

Conclusão:

Como 05,02calc é menor que 64,62

.l.g1;01,0 , aceita-se a hipótese de que a forma da

distribuição de válvulas defeituosas é Binomial.

SACHIKO ARAKI LIRA 117

8.2 TESTE DE LILLIEFORS

O teste de Lilliefors é utilizado para verificar a aderência dos dados a uma distribuição

normal, sem a especificação de seus parâmetros, ou seja, a média e o desvio padrão são

calculados a partir da amostra.

As hipóteses são:

0H : a amostra provém de uma população que segue uma distribuição normal

1H : a amostra não provém de uma população que segue uma distribuição normal

Calcula-se a estatística de teste, D, em termos da amostra em análise:

)x(Sx(F,)x(Sx(Fmaxd 1iiiii

Exemplos:

1) Um fabricante de autopeças está para fechar um grande contrato com a montadora. O ponto-

chave é a garantia da qualidade de seus produtos, especialmente do diâmetro (em mm) dos

eixos produzidos, que ele supõe seguir uma distribuição normal. Para realizar o teste, a

montadora selecionou uma amostra aleatória de 15 eixos, para testar as especificações a 5% de

significância. Ao valores são apresentados a seguir.

93,45 94,46 94,93 96,17 96,74 97,07 97,68 97,93

99,10 99,30 100,73 103,29 103,60 103,83 105,20

Solução:

0H : a amostra provém de uma população que segue uma distribuição normal

1H : a amostra não provém de uma população que segue uma distribuição normal

1. Construção da distribuição acumulada da amostra, )x(S :

OBS. ix FREQ.

RELATIVA )x(S i

1 93,45 0,0667 0,067

2 94,46 0,0667 0,133

3 94,93 0,0667 0,200

4 96,17 0,0667 0,267

5 96,74 0,0667 0,333

6 97,07 0,0667 0,400

7 97,68 0,0667 0,467

8 97,93 0,0667 0,533

9 99,10 0,0667 0,600

10 99,30 0,0667 0,667

11 100,73 0,0667 0,733

12 103,29 0,0667 0,800

13 103,60 0,0667 0,867

14 103,83 0,0667 0,933

15 105,20 0,0667 1,000

Média 98,90

Desvio Padrão 3,70

TESTES DE ADERÊNCIA 118

2. Construção da função de distribuição acumulada )x(F , para cada valor de ix . Cada valor de

diâmetro ix pode ser transformado em escore padronizado iZ . Por exemplo:

45,93x1 -1,473,70

98,9045,93Z1

A probabilidade acumulada até cada escore Z é obtida da tabela de áreas sob a curva

normal. Para 1Z , tem-se:

0708,0)ZX(P)X(F 1

3. Cálculo das diferenças absolutas entre as distribuições acumuladas esperadas e observadas,

)x(Sx(F ii e )x(Sx(F 1ii .

OBS. ix FREQ.

RELATIVA )x(S i

iZ )x(F i )x(Sx(F 1ii )x(Sx(F ii

0

1 93,45 0,0667 0,067 -1,47 0,071 0,071 0,004

2 94,46 0,0667 0,133 -1,20 0,115 0,049 0,018

3 94,93 0,0667 0,200 -1,07 0,142 0,009 0,058

4 96,17 0,0667 0,267 -0,74 0,231 0,031 0,036

5 96,74 0,0667 0,333 -0,58 0,280 0,013 0,053

6 97,07 0,0667 0,400 -0,49 0,311 0,023 0,089

7 97,68 0,0667 0,467 -0,33 0,371 0,029 0,096

8 97,93 0,0667 0,533 -0,26 0,397 0,070 0,137

9 99,10 0,0667 0,600 0,05 0,522 0,012 0,078

10 99,30 0,0667 0,667 0,11 0,543 0,057 0,124

11 100,73 0,0667 0,733 0,49 0,690 0,023 0,044

12 103,29 0,0667 0,800 1,19 0,882 0,149 0,082

13 103,60 0,0667 0,867 1,27 0,898 0,098 0,031

14 103,83 0,0667 0,933 1,33 0,909 0,042 0,025

15 105,20 0,0667 1,000 1,70 0,956 0,022 0,044

4. A maior diferença absoluta é igual a 0,149, logo, 149,0d .

5. A distância máxima admissível para 15n e %5 é 220,0dc . Como cdd , aceita-se

0H , logo, amostra provém de uma população que segue uma distribuição normal.

2) No controle estatístico de processos, uma suposição fundamental para a utilização de

gráficos de controle de média de Shewhart é de que a distribuição das médias possa ser

considerada normal. Um engenheiro quer saber se é possível aplicar gráficos de controle de

médias a um processo produtivo. Para tanto, que avaliar a aderência das médias de 25

amostras à distribuição normal. Os valores são:

0,19 0,57 0,66 1,41 0,28 0,05 0,63 0,75 0,85

0,99 1,68 3,01 0,31 5,48 0,66 0,76 5,94 0,85

0,03 9,49 2,18 1,23 4,89 0,71 3,52

Com base nos dados apresentados, e utilizando nível de signficância de 1%, é possível

usar gráfico de controle de média de Shewhart para monitorar o processo?

SACHIKO ARAKI LIRA 119

Solução:

0H : a amostra provém de uma população que segue uma distribuição normal

1H : a amostra não provém de uma população que segue uma distribuição normal

OBS. ix FREQ.

RELATIVA )x(S i

iZ )x(F i )x(Sx(F 1ii )x(Sx(F ii

1 0,03 0,04 0,040 -0,80 0,212 0,212 0,172

2 0,05 0,04 0,080 -0,79 0,214 0,174 0,134

3 0,19 0,04 0,120 -0,73 0,232 0,152 0,112

4 0,28 0,04 0,160 -0,69 0,244 0,124 0,084

5 0,31 0,04 0,200 -0,68 0,248 0,088 0,048

6 0,57 0,04 0,240 -0,56 0,285 0,085 0,045

7 0,63 0,04 0,280 -0,54 0,294 0,054 0,014

8 0,66 0,04 0,320 -0,53 0,299 0,019 0,021

9 0,66 0,04 0,360 -0,53 0,299 0,021 0,061

10 0,71 0,04 0,400 -0,50 0,306 0,054 0,094

11 0,75 0,04 0,440 -0,49 0,312 0,088 0,128

12 0,76 0,04 0,480 -0,48 0,314 0,126 0,166

13 0,85 0,04 0,520 -0,44 0,328 0,152 0,192

14 0,85 0,04 0,560 -0,44 0,328 0,192 0,232

15 0,99 0,04 0,600 -0,38 0,350 0,210 0,250

16 1,23 0,04 0,640 -0,28 0,389 0,211 0,251

17 1,41 0,04 0,680 -0,20 0,419 0,221 0,261

18 1,68 0,04 0,720 -0,09 0,465 0,215 0,255

19 2,18 0,04 0,760 0,13 0,551 0,169 0,209

20 3,01 0,04 0,800 0,49 0,686 0,074 0,114

21 3,52 0,04 0,840 0,71 0,760 0,040 0,080

22 4,89 0,04 0,880 1,30 0,903 0,063 0,023

23 5,48 0,04 0,920 1,55 0,940 0,060 0,020

24 5,94 0,04 0,960 1,75 0,960 0,040 0,000

25 9,49 0,04 1,000 3,28 0,999 0,039 0,001

média 1,88

DP 2,32

A distância máxima admissível para 15n e %5 é 0,173dc . Como cdd ,

rejeita-se 0H , logo, amostra não provém de uma população que segue uma distribuição normal.

Assim, não é possível utilizar o gráfico de controle de média.

LISTA DE EXERCÍCIOS NO. 7 – TESTES DE ADERÊNCIA

1. As taxas de octanagem de combustível para motor, de várias misturas de gasolina foram

obtidas. A média e o desvio padrão amostral são 90,59 e 3,18, respectivamente. A distribuição

de freqüências encontra-se a seguir:

TESTES DE ADERÊNCIA 120

TAXAS DE OCTANAGEM

fi

83,5 |--- 85,9 3

85,9 |--- 88,4 9

88,4 |--- 90,9 21

90,9 |--- 93,4 15

93,4 |--- 95,9 5

95,9 |--- 98,4 1

98,4 |--- 100,9 2

TOTAL 56

Verificar se amostra da taxa de octanagem provém de uma distribuição normal, utilizando

05,0 .

2. O tempo necessário para se realizar certa operação industrial foi cronometrado (em

segundos), sendo feita 50 determinações. A média e o desvio padrão amostral são 46,32 e

7,44. A distribuição de freqüências encontra-se a seguir:

TEMPO (segundos)

fi

32 |--- 36 5

36 |--- 40 7

40 |--- 44 5

44 |--- 48 14

48 |--- 52 8

52 |--- 56 3

56 |--- 60 8

TOTAL 50

Verificar se a amostra do tempo necessário para realizar a operação provém de uma distribuição

normal, utilizando 01,0 .

SACHIKO ARAKI LIRA 121

ANÁLISE DA VARIÂNCIA

INTRODUÇÃO

O objetivo da análise da variância, conhecida como ANOVA, é comparar k médias

populacionais, sendo 2k , com base nas amostras provenientes de k populações distintas.

Enquanto no teste para igualdade de duas médias se utiliza as estatísticas Z ou t, conforme os

desvios padrões populacionais sejam conhecidos ou não, na análise da variância, a estatística

utilizada é a estatística F.

A análise da variância é um teste para igualdade de médias que utiliza variâncias para a

tomada de decisões.

9.1 FUNDAMENTOS DA ANOVA

Supondo que se deseja testar a hipótese de igualdade de k )2k( médias

populacionais, isto é:

k21 ...:H0 ,

contra a hipótese alternativa de que, pelo menos uma dessas médias seja diferente das demais,

ou seja:

:H1 pelo menos uma média i .

Na aplicação deste método, supõe-se que as populações são normalmente distribuídas e as

variâncias populacionais iguais (homocedasticidade), ou seja:

22k

22

21 ...

Sejam as k amostras extraídas das populações, cujas médias serão testadas. A partir

dessas amostras, é possível estimar a variância 2 de três maneiras, conforme apresentados a

seguir.

POPULAÇÃO 1

1

2

POPULAÇÃO 2

2

2

POPULAÇÃO k

K

2

AMOSTRA 1

1n AMOSTRA 2

2n AMOSTRA k

kn

ANÁLISE DA VARIÂNCIA 122

1) Variância Total )S( 2t

Consiste em estimar a variância 2 considerando todas as k amostras reunidas em uma

única amostra, o que é possível em função da suposição de que as variâncias populacionais são

todas iguais a 2 .

Essa variância é estimada através de:

1N

)Xx(

S

k

1j

n

1i

2ji

2t

Onde:

n é o tamanho de cada amostra;

k é o número de amostras;

jix é o i-ésimo elemento da j-ésima amostra;

nkN é o número de elementos em todas as amostras;

N

x

X

k

1i

n

1jji

é a média do conjunto de todas as amostras;

O numerador é denominado de Soma de Quadrados Total (SQT), então tem-se:

k

1j

n

1i

2ji )Xx(SQT

2) Variância entre Amostras )S( 2e

Sendo verdadeira a hipótese 0H , é possível estimar a variância 2 , através de:

1k

)XX(

S

k

1j

n

1i

2j

2e

Onde:

n

x

X

n

1iji

j

é a média da j-ésima amostra (j=1,2,...,k)

n é o tamanho de cada amostra.

Esta variância )S( 2e é também chamada de Quadrado Médio Entre Amostras (QME).

SACHIKO ARAKI LIRA 123

O numerador é denominado de Soma de Quadrados entre Amostras (SQE), então

tem-se:

k

1j

n

1i

2j )XX(SQE

3) Variância Residual (ou Variância dentro)

Consiste em estimar as variâncias dentro de cada amostra e em seguida estimar um

único valor para 2 , por meio da combinação dessas k variâncias. Esta variância )S( 2r é

chamada também de Quadrado Médio Residual (QMR).

Para uma amostra qualquer j, a estimativa da variância é dada por:

1n

)Xx(

S

n

1i

2jji

2j

Combinando as k variâncias, obtém-se a estimativa de 2 , dada por:

kN

)Xx(

S

k

1j

n

1i

2jji

2r

O numerador é denominado de Soma de Quadrados Residual (SQR), logo:

k

1j

n

1i

2jji )Xx(SQR

Onde:

jX é a média da j-ésima amostra (j=1,2,...,k)

A Soma de Quadrados Residual pode também ser obtida através de:

SQESQTSQR

9.2 ANÁLISE DA VARIÂNCIA A UM CRITÉRIO DE CLASSIFICAÇÃO

Neste modelo, os elementos observados são classificados segundo um critério, ou seja,

existe apenas uma característica de interesse a ser testada.

As etapas para a realização da ANOVA:

a) Formulação das hipóteses:

k21 ...:H0

:H1 pelo menos uma média i ;

b) Fixar o nível de significância ;

c) Determinar a região de rejeição (R.R.);

ANÁLISE DA VARIÂNCIA 124

O teste será sempre unilateral. O valor crítico de F será obtido para nível de significância

e )1k( e )kN( graus de liberdade, no numerador e denominador, respectivamente.

d) Cálculo da estatística F

A estatística F é calculada através de:

2r

2e

S

SF

e) Quadro da Análise da Variância

QUADRO DA ANÁLISE DE VARIÂNCIA - ANOVA

FONTE DE VARIAÇÃO

SOMA DE QUADRADOS

G.L QUADRADOS

MÉDIOS F

Entre amostras SQE 1k 1k

SQEQMES2

e

QMR

QME

S

SF

er

2e Residual SQR kN

kN

SQRQMRS2

r

Total SQT 1N

f) Conclusão

Se )kN,1k(FF , rejeita-se hipótese 0H , caso contrário, aceita-se 0H .

Exemplos da aplicação:

1) Verificou-se os índices de produção, segundo os postos de trabalho, durante certo período.

Analisar se há diferença nos índice de produção, devido aos postos de trabalho. Usar 05,0 .

POSTOS DE TRABALHO

INDICES DE PRODUÇÃO (%)

A 90,8 100,0 81,1

B 85,5 83,0 73,7

C 65,9 77,1 68,5

R.R. 1

R.A.

SACHIKO ARAKI LIRA 125

Solução:

a) As hipóteses a serem testadas:

CBA:H0

:H1 pelo menos uma média i

b) Cálculo da Soma de Quadrados Total (SQT)

Tem-se que a soma de quadrados total é dada por:

k

1j

n

1i

2ji )Xx(SQT

Logo, faz-se necessário calcular inicialmente a média do conjunto de todas as amostras

)X( .

POSTOS DE TRABALHO

INDICES DE PRODUÇÃO (%) ( jix )

SOMAS

)x(n

1ii

MÉDIAS

)X( j

A 90,8 100 81,1 271,90 90,63

B 85,5 83 73,7 242,20 80,73

C 65,9 77,1 68,5 211,50 70,50

TOTAL 725,60 80,62

A média do conjunto de todas as amostras será:

62,809

6,725

N

x

X

k

1i

n

1jji

Então, tem-se:

22222 )62,805,68()62,801,77()62,801,81()62,800,100()62,808,90(SQT

932,78SQT

c) Soma de Quadrados entre Amostras (SQE)

k

1j

2j

k

1j

n

1i

2j )XX(n)XX(SQE

22 )62,805,70(3)62,8073,80(3)62,8063,90(3SQE 2

607,88SQE

d) Cálculo da Soma de Quadrados Residual (SQR)

SQESQTSQR

324,90607,88-932,78SQR

k

1i

n

1jjix

ANÁLISE DA VARIÂNCIA 126

e) Quadro da ANOVA

QUADRO DA ANÁLISE DE VARIÂNCIA - ANOVA

FONTE DE VARIAÇÃO

SOMA DE QUADRADOS

G.L QUADRADOS MÉDIOS

F

Entre amostras 88,607SQE 2 94,3032

88,607QME

5,61F Dentro da amostra (residual)

90,324SQR 6 15,546

90,324QMR

Total

78,932SQT 8

O valor de F tabelado é: 14,5F 6;2;05,0

f) Conclusão: Como 6;2;05,0FF , rejeita-se a hipótese oH de que os índices médios de

produção são iguais.

2) Em uma indústria, quatro operários executam uma mesma operação. Com o objetivo de

identificar se existe diferença entre os tempos gastos para executar a operação mencionada,

foram realizadas as seguintes observações desses tempos (em segundos):

Operário 1: 8,1 8,3 8,0 8,1 8,5 Operário 2: 8,4 8,4 8,5 8,3 Operário 3: 8,8 8,7 8,9 Operário 4: 8,3 8,4 8,2 8,2 8,3 8,4

Verificar se a diferença é significativa ao nível de 1% de significância.

Solução:

a) As hipóteses a serem testadas:

4321:H0

:H1 pelo menos uma média i

b) Cálculo da Soma de Quadrados Total (SQT)

Tem-se que a soma de quadrados total é dada por:

k

1j

n

1i

2ji )Xx(SQT

Logo, faz-se necessário calcular inicialmente a média do conjunto de todas as amostras.

OPERA-DORES

TEMPOS ( jix )

SOMAS

)x(n

1ii

MÉDIAS

)X( j

1 8,1 8,3 8,0 8,1 8,5 41,0 8,2

2 8,4 8,4 8,5 8,3 33,6 8,4

3 8,8 8,7 8,9 26,4 8,8

4 8,3 8,4 8,2 8,2 8,3 8,4 49,8 8,3

150,8 8,4

k

1i

n

1jjix

SACHIKO ARAKI LIRA 127

A média do conjunto de todas as amostras será:

4,818

8,150

N

x

X

k

1i

n

1jji

Então, tem-se:

2222 )4,84,8()4,80,8()4,83,8()4,81,8(SQT

0,98 SQT

c) Soma de Quadrados entre Amostras (SQE)

k

1j

n

1i

2j )XX(SQE

OBS: Neste caso, cada 2j )XX( é multiplicado pelo seu respectivo tamanho de amostra.

2222 )4,83,8(8)4,88,8(3)4,84,8(4)4,82,8(5SQE

0,74 SQE

d) Cálculo da Soma de Quadrados Residual (SQR)

k

1j

n

1i

2jji )Xx(SQR

2222 )3,84,8()3,83,8()2,83,8()2,81,8(SQR

0,24 SQR

e) Quadro da ANOVA

QUADRO DA ANÁLISE DE VARIÂNCIA - ANOVA

FONTE DE VARIAÇÃO

SOMA DE QUADRADOS G.L

QUADRADOS MÉDIOS F

Entre amostras (Tratamentos)

74,0SQE 3 3

74,0QME

39,14F Dentro da amostra (residual)

24,0SQR 14 14

24,0QMR

Total

98,0SQT 17

O valor de F tabelado é 56,5F 14;3;01,0 .

Conclusão: Como 14;3;01,0FF , rejeita-se a hipótese 0H de que as quatro médias são iguais.

ANÁLISE DA VARIÂNCIA 128

9.3 COMPARAÇÕES MÚLTIPLAS ENTRE MÉDIAS

A análise da variância serve para verificar se existe diferença significativa entre as

médias; porém, se houver diferenças, não é possível saber, através dela, quais as médias

diferem entre si. A identificação de diferenças entre médias, tomando-as duas a duas, deve ser

feita usando testes de comparações múltiplas entre médias.

9.3.1 TESTE DE SCHEFFÉ

A estatística de teste é a distribuição F de Snedecor com )kN,1k( graus de liberdade,

corrigida por um fator que leva em conta o fato de se comparar k médias, duas a duas.

O Teste de Scheffé é um teste mais geral, permite usar amostras com dimensões

diferentes e é robusto a violações dos pressupostos de normalidade e de igualdade de

variâncias.

Se mi XX , rejeita-se a hipótese nula de que mi0 :H , sendo que a

estatística é dada por:

,kN,1kF

n

1

n

1)1k(QMR

mi

.

Exercícios de aplicação:

1) Para o exemplo dos índices de produção segundo diferentes postos de trabalho, verificar

quais médias são diferentes, utilizando 05,0 .

Solução:

Os índices médios, segundo diferentes postos de trabalho são:

POSTOS DE TRABALHO

MÉDIAS

)X( j

A 90,63

B 80,73

C 70,50

Utilizando o teste de Scheffé:

,kN,1kF

n

1

n

1)1k(QMR

mi

onde:

3k ( postos de trabalho)

639kN

05,0

3n (tamanho da amostra para cada grupo)

SACHIKO ARAKI LIRA 129

15,546

90,324QMR ( do exemplo de aplicação no. 1)

14,5F 05,0;6,2

Considerando os postos de trabalha A e B, tem-se:

26,1914,53

1

3

1215,5405,0

Da mesma forma para A e C e B e C, pois os tamanhos de amostras são iguais a 3.

Portanto, tem-se:

POSTOS DE TRABALHO

DIFERENÇA DE MÉDIAS DIFERENÇA SIGNIFICATIVA

A e B 90,973,8063,90 19,26 Não

A e C 20,1370,5063,90 19,26 Sim

B e C 10,2370,5073,80 19,26 Não

Conclui-se portanto que as médias dos postos de trabalho A e C são diferentes, para

nível de 5% de significância.

2) Para o exemplo de quatro operários que executam uma mesma operação em uma indústria,

aplicar o método de Scheffé, utilizando 01,0 .

Solução:

Os tempos médios gastos para executar determinada operação, segundo operadores:

OPERA-DORES in

MÉDIAS

)X( j

1 5 8,2

2 4 8,4

3 3 8,8

4 6 8,3

Utilizando o teste de Scheffé:

,kN,1kF

n

1

n

1)1k(QMRXX

mi

mi

4k ( operadores)

18N

14418kN

01,0

0171,014

0,24QMR ( do exemplo de aplicação no. 2)

ANÁLISE DA VARIÂNCIA 130

56,5F 01,0;14;3

Considerando os operários 1 e 2, tem-se:

5n1

4n2

Substituindo os valores na expressão do teste de Scheffé:

0,36 56,54

1

5

130171,0

As médias dos operários 1 e 2 são: 2,8X1 e 4,8X2 , portanto a diferença é

2,0XX 21 . Tem-se que 0,36 2,0XX 21 , logo não há diferença entre as duas

médias.

Considerando os operários 1 e 3, tem-se:

5n1

3n2

0,39 56,53

1

5

130171,0

Considerando os operários 1 e 4, tem-se:

5n1

6n2

32,056,56

1

5

130171,0

Considerando os operários 2 e 3, tem-se:

4n1

3n2

41,056,53

1

4

130171,0

Considerando os operários 2 e 4, tem-se:

4n1

6n2

34,056,56

1

4

130171,0

Considerando os operários 3 e 4, tem-se:

3n1

SACHIKO ARAKI LIRA 131

6n2

38,056,56

1

3

130171,0

Assim, tem-se:

OPERADORES mi XX

CONCLUSÃO

1 e 2 0,20 0,36 Não diferem

1 e 3 0,60 0,39 diferem

1 e 4 0,10 0,32 Não diferem

2 e 3 0,60 0,41 diferem

2 e 4 0,10 0,34 Não diferem

3 e 4 0,50 0,38 diferem

A média do operador número 3 difere dos demais, ao nível de 1% de significância.

LISTA DE EXERCÍCIOS NO. 8 – ANÁLISE DA VARIÂNCIA

1. Uma empresa deseja adquirir certa máquina e verificou que existem no mercado três marcas

diferentes: A, B, e C que satisfazem. Decidiu-se que será comprada a máquina que apresentar

melhor rendimento. Foi realizado um ensaio com as três máquinas em períodos iguais durante 5

dias e as produções resultantes foram:

A 120 123 121 125 122

B 119 121 118 120 123

C 125 127 128 127 128

Pergunta-se: com relação ao rendimento, existe diferença significativa entre as máquinas ao

nível de 1% de significância? Aplicar o teste de Scheffé e concluir qual a máquina a ser

adquirida.

2. Foram testados três tipos de lâmpadas elétricas e os tempos de vida (em horas) obtidos

foram:

lâmpada A: 1.245 1.354 1.367 1.289

lâmpada B: 1.235 1.300 1.230 1.189

lâmpada C: 1.345 1.450 1.320

Existe diferença significativa entre os tempos médios de vida dessas três marcas de lâmpadas,

ao nível de significância de 1%? Se necessário, aplicar o teste de Scheffé.

3. Três máquinas produzem parafusos. Encontram-se a seguir, os diâmetros correspondentes a

uma amostra de 4 parafusos produzidos em cada máquina.

ANÁLISE DA VARIÂNCIA 132

MÁQUINAS

A B C

8 9 7

7 7 9

9 7 7

7 8 7

Testar se os diâmetros médios são iguais a um nível de significância de 5%.

4) Pesquisadores investigaram três métodos diferentes de preparar o composto supercondutor

86SPbMo . Eles afirmam que a presença de oxigênio durante o processo de preparação afeta a

temperatura de transição, cT , da supercondução do material. Os métodos de preparação 1 e 2

usam técnicas que são planejadas para eliminar a presença de oxigênio, enquanto o método 3

permite a presença de oxigênio. Cinco observações de cT (em K) foram feitas para cada

material, sendo os resultados apresentados a seguir.

MÉTODO DE PREPARAÇÃO

TEMPERATURA DE TRANSIÇÃO cT (K)

1 14,8 14,8 14,7 14,8 14,9

2 14,6 15,0 14,9 14,8 14,7

3 14,2 14,4 14,4 12,2 11,7

Há qualquer evidência que confirme a afirmação de que a presença de oxigênio durante a

preparação afete a temperatura média de transição? Usar 05,0 .

5) A resistência de contato de um relé foi estudada para três materiais diferentes (todos eram

ligas, tendo prata como base). Os dados encontram-se a seguir.

LIGA RESISTÊNCIA DE CONTATO 1 95 87 99 98

2 104 102 102 105

3 119 130 132 136

O tipo de liga afeta a resistência média de contato? Usar 01,0 .

SACHIKO ARAKI LIRA 133

ANÁLISE DE CORRELAÇÃO E REGRESSÃ0

SIMPLES

10.1 INTRODUÇÃO

A análise de correlação mede o grau de associação entre variáveis, e pode ser:

Correlação simples: mede a “força” ou “grau” de relacionamento entre duas variáveis;

Correlação múltipla: mede a “força” ou “grau” de relacionamento entre uma variável e um

conjunto de outras variáveis.

A análise de regressão estuda o relacionamento entre uma variável chamada

dependente e outras variáveis chamadas variáveis independentes. Este relacionamento é

representado por um modelo matemático, isto é, por uma equação que associa a variável

dependente com as variáveis independentes.

Modelo de regressão linear simples: define uma relação linear entre a variável dependente e

uma variável independente;

Modelo de regressão linear múltipla: define uma relação linear entre a variável dependente

e duas ou mais variáveis independentes.

10.2 DIAGRAMA DE DISPERSÃO

O diagrama de dispersão é uma representação gráfica da relação entre duas ou mais

variáveis. No diagrama de dispersão entre duas variáveis, X e Y, cada ponto no gráfico é um par

( ii y,x ).

A visualização do diagrama de dispersão possibilita ter uma boa idéia de como as duas

variáveis se correlacionam.

DIAGRAMA DE DISPERSÃO

0

20

40

60

80

100

120

2 7 12 17 22

X

Y

GRÁFICO 1 - DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁ-

VEIS X E Y

ANÁLISE DE CORRELAÇÃO E REGRESSÃO 134

10.3 ANÁLISE DE CORRELAÇÃO

10.3.1 COEFICIENTE DE CORRELAÇÃO LINEAR DE PEARSON

Diferentes formas de correlação podem existir entre as variáveis. O caso mais simples e

mais conhecido é a correlação linear simples, envolvendo duas variáveis, X e Y.

Este coeficiente mostra o grau de relacionamento entre as variáveis, fornecendo um número,

indicando como as variáveis variam conjuntamente. Não há a necessidade de definir as relações

de causa e efeito, ou seja, qual é a variável dependente e a independente.

Quando para maiores valores de X, existe uma tendência de obter maiores valores de Y,

diz-se que existe correlação linear positiva, conforme o gráfico 1, apresentado anteriormente.

Entretanto, pode ocorrer o inverso, ou seja, para maiores valores de X, existir uma tendência de

obter menores valores de Y, diz-se neste caso, que existe correlação linear negativa,

conforme o gráfico 2. Obviamente, existem muitos casos em que as variáveis não são

correlacionadas, isto é, a correlação linear é nula, como apresentado no gráfico 3.

O coeficiente de correlação amostral é obtido através da expressão:

n

1i

2Y

n

1i

2X

n

1i

YX

YX

YX

r

ii

ii

A interpretação do coeficiente quando 1r é de que existe correlação linear perfeita

entre as variáveis X e Y. A correlação é linear perfeita positiva quando 1r e linear perfeita

negativa quando 1r . Quando se tem 0r , não existe correlação linear entre as variáveis X e

Y. O coeficiente de correlação pode ser avaliado qualitativamente de acordo com os critérios

abaixo:

DIAGRAMA DE DISPERSÃO

0

20

40

60

80

100

120

2 7 12 17 22

X

Y

DIAGRAMA DE DISPERSÃO

0

10

20

30

40

50

60

70

2 7 12 17

X

Y

GRÁFICO 2 – DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁ- VEIS X E Y

GRÁFICO 3 – DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁ- VEIS X E Y

SACHIKO ARAKI LIRA 135

se 30,0r0 existe fraca correlação linear;

se 60,0r30,0 existe moderada correlação linear;

se 90,0r60,0 existe forte correlação linear;

se 00,1r90,0 existe correlação linear muito forte.

Exemplo de aplicação:

Seja o processo de recobrimento de uma determinada peça com metal. O recobrimento é

feito com metal fundido.

X= quantidade utilizada de metal fundido (em gramas);

Y = porcentagem de recobrimento obtida (%).

QUANTIDADE DE METAL FUNDIDO UTILIZADA E PORCENTAGEM DE RECOBRIMENTO OBTIDA

OBSERVAÇÃO ix iy

1 6,0 10

2 4,0 10

3 6,0 20

4 8,0 20

5 7,5 30

6 8,5 40

7 9,5 45

8 11,0 50

9 12,0 60

10 12,0 65

O diagrama de dispersão é apresentado abaixo:

A visualização do diagrama de dispersão possibilita ter uma boa idéia de como as duas

variáveis se relacionam, ou seja, qual a tendência de variação conjunta que apresentam. O

gráfico sugere a existência de uma relação linear entre as duas variáveis. Assim, calcular-se-á o

coeficiente de correlação linear de Pearson.

DIAGRAMA DE DISPERSÃO

0

10

20

30

40

50

60

70

80

2 4 6 8 10 12 14

Quantidade de metal

Porcentagem de

recobrimento (%)

GRÁFICO 4 – DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁVEIS QUANTI- DADE DE METAL FUNDIDO E PORCENTAGEM DE RECOBRI-

MENTO

ANÁLISE DE CORRELAÇÃO E REGRESSÃO 136

OBS. ix iy )Xx( i )Yy( i )Yy)(Xx( ii 2i )Xx( 2

i )Yy(

1 6 10 -2,45 -25 61,25 6,00 625

2 4 10 -4,45 -25 111,25 19,80 625

3 6 20 -2,45 -15 36,75 6,00 225

4 8 20 -0,45 -15 6,75 0,20 225

5 7,5 30 -0,95 -5 4,75 0,90 25

6 8,5 40 0,05 5 0,25 0,00 25

7 9,5 45 1,05 10 10,50 1,10 100

8 11 50 2,55 15 38,25 6,50 225

9 12 60 3,55 25 88,75 12,60 625

10 12 65 3,55 30 106,50 12,60 900

84,5 350 465,00 65,73 3.600

MÉDIA 8,45 35

Tem-se que:

n

1i

2iY

n

1i

2iX

n

1iiYiX

YX

YX

r Y,Xˆ

Substituindo os valores na expressão acima tem-se:

0,95603.60065,73

465r Y,Xˆ

Sendo o 9560,0r , conclui-se que existe correlação linear muito forte.

10.3.1.1 TESTE DE HIPÓTESES PARA COEFICIENTE DE CORRELAÇÃO

O coeficiente de correlação linear r , é uma estimativa da correlação populacional ρ ,

obtida com base em uma amostra de tamanho n. O tamanho da amostra exerce papel

fundamental na estimativa, desta forma, torna-se necessário testar a hipótese de que realmente

existe correlação linear entre as variáveis estudadas. Assim, as hipóteses a serem testadas são:

0:H0

( a correlação populacional é igual a zero)

0:H1 ( a correlação populacional é diferente de zero)

A estatística para testar a hipótese 0:H0 contra 0H :1 , tem distribuição t com n - 2

graus de liberdade, ou seja:

2r1

2nrt

~ 2nt .

SACHIKO ARAKI LIRA 137

Exemplo de aplicação:

Seja o exemplo do processo de recobrimento de uma determinada peça com metal. Tem-se que

o coeficiente de correlação estimado é 0,9560r . Testar a hipótese de que a correlação

populacional é diferente de zero, utilizando nível de significância de 5%.

As hipóteses são:

0:H0

( a correlação populacional é igual a zero)

0:H1 ( a correlação populacional é diferente de zero)

A estatística t é:

9,22

9560,01

2109560,0

r1

2nrt

22

O valor de “t” tabelado para nível de significância e 5% e 8 graus de liberdade é 2,31,

portanto, rejeita-se a hipótese 0:H0

.

10.4 ANÁLISE DE REGRESSÃO LINEAR SIMPLES

Análise de regressão linear simples é uma técnica de modelagem utilizada para analisar

a relação entre uma variável dependente (Y) e uma variável independente X .

O objetivo dessa técnica é identificar uma função que descreve, o mais próximo possível,

a relação entre essas variáveis e assim poder predizer o valor que a variável dependente (Y) irá

assumir para um determinado valor da variável independente X.

O modelo de regressão poderá ser expresso como:

XY

Um valor de Y é formado pelo componente funcional ou regressão )X( , que

representa a influência da variável independente X sobre o valor de Y e o componente aleatório )( , que representa a influência de outros fatores, bem como os erros de medidas da variável

Y.

Apresenta-se a seguir, um gráfico, onde estão representados os pontos observados e a

reta ajustada.

20

22

24

26

28

30

32

34

20 22 24 26 28 30

ANÁLISE DE CORRELAÇÃO E REGRESSÃO 138

Verifica-se no gráfico que nem todos os pontos tocam a reta, e essa diferença é o erro

(), mas supõe-se que em média esses erros tendem a se anular, ou seja:

0)(E i

Ao estabelecer o modelo de regressão linear simples, deve-se pressupor que:

1) os erros )i( têm distribuição normal;

2) os erros )i( são independentes;

2) i é uma variável aleatória com média igual a zero, isto é, 0)(E i ;

3) A variância de i é igual a 2 para todos os valores de X.

10.4.1 ESTIMAÇÃO DOS PARÂMETROS

Uma vez escolhido o modelo de regressão, deve-se estimar os seus parâmetros, neste

caso, os coeficientes da equação da reta, e . Isso pode ser feito a partir da aplicação do

Método dos Mínimos Quadrados. Neste método, a soma dos erros quadráticos (isto é, a soma

dos quadrados da distância vertical entre as observações e a reta ajustada) é mínima.

Os parâmetros e são estimados através dos dados amostrais e a reta estimada

será da forma:

bXaY

Seja ie a distância da reta ajustada aos pontos amostrais, o método dos mínimos

quadrados minimiza a soma de 2ie , ou seja:

2i

n

1ii

n

1i

2ii

n

1i

2i )bxay()yy(e

Derivando a expressão acima em relação a “ a ” e igualando a zero, tem-se:

0xb2na2y2)bxay(n

1ii

n

1ii

2i

n

1iia

Derivando a expressão acima em relação a “b ” e igualando a zero, tem-se:

0xb2xa2yx2)bxay(n

1i

2i

n

1ii

n

1iii

2i

n

1ii

b

Obtém-se assim o sistema de duas equações:

n

1ii

n

1ii xbnay

n

1i

2i

n

1ii

n

1iii xbxayx

A solução analítica do sistema de equações fornece os valores de "a" e "b" , como

apresentados a seguir.

XbYa

SACHIKO ARAKI LIRA 139

n

1i

2i

n

1iii

)Xx(

y)Xx(

b

Exemplos de aplicação:

1) Seja o processo de recobrimento de uma determinada peça com metal. O recobrimento é

feito com metal fundido.

X= quantidade utilizada de metal fundido (em gramas); Y = porcentagem de recobrimento obtida (%).

QUANTIDADE DE METAL FUNDIDO UTILIZADA E PORCENTAGEM DE RECOBRIMENTO OBTIDA

OBSERVAÇÃO ix iy

1 6,0 10

2 4,0 10

3 6,0 20

4 8,0 20

5 7,5 30

6 8,5 40

7 9,5 45

8 11,0 50

9 12,0 60

10 12,0 65

Ajustar um modelo de regressão linear simples aos dados:

Solução:

Tem-se então que:

OBS. ix iy )Xx( i 2i )Xx( ii y)Xx(

1 6 10 -2,45 6,00 -24,50

2 4 10 -4,45 19,80 -44,50

3 6 20 -2,45 6,00 -49,00

4 8 20 -0,45 0,20 -9,00

5 7,5 30 -0,95 0,90 -28,50

6 8,5 40 0,05 0,00 2,00

7 9,5 45 1,05 1,10 47,25

8 11 50 2,55 6,50 127,50

9 12 60 3,55 12,60 213,00

10 12 65 3,55 12,60 230,75

Total 84,5 350 65,725 465,00

Média 8,45 35

45,8X

35Y

ANÁLISE DE CORRELAÇÃO E REGRESSÃO 140

725,65)Xx(n

1i

2i

00,465y)Xx(n

1iii

Logo, 7,0749725,65

00,465

)Xx(

y)Xx(

bn

1i

2i

n

1iii

-24,783245,80749,7XbYa 35

A equação de regressão linear será:

X0749,77832,24Y

Tem-se então que:

OBS. ix iy iy

1 6 10 17,7

2 4 10 3,5

3 6 20 17,7

4 8 20 31,8

5 7,5 30 28,3

6 8,5 40 35,4

7 9,5 45 42,4

8 11 50 53,0

9 12 60 60,1

10 12 65 60,1

O gráfico a seguir, apresenta o diagrama de dispersão e a função linear ajustada.

DIAGRAMA DE DISPERSÃO E FUNÇÃO LINEAR

AJUSTADA

0

10

20

30

40

50

60

70

0 5 10 15

Quantidade de metal fundido

Recobrimento

(%)

SACHIKO ARAKI LIRA 141

10.4.2 TESTES DE HIPÓTESES NA REGRESSÃO

Uma etapa importante da verificação da adequação de um modelo de regressão linear é

a realização de um teste estatístico de hipóteses em relação aos parâmetros do modelo.

10.4.2.1TESTE t

Lembrando que o modelo é XY , deve-se testar as hipóteses:

0:H0

0:H1

A estatística do teste é dada por:

XX

2

S

S

b:t

, que segue distribuição t com n-2 graus de liberdade.

Tem-se que:

2n

bSSS XYYY2

, que é a estimativa de 2

Onde:

n

1i

2iXX )Xx(S

n

1i

2iYY )Yy(S

n

yx

yxS

n

1i

n

iiin

1iiiXY

A conclusão do teste será:

Se 22 ttt , aceita-se 0H e conclui-se que não existe regressão e se 2tt ,

rejeita-se 0H e conclui-se que existe regressão.

10.4.2.2 ANÁLISE DA VARIÂNCIA

A análise da variância, conhecida como ANOVA, é um teste que permite verificar a

existência da regressão, ou seja, se existe relação entre a variável dependente e independente,

através do comportamento das variações totais, explicadas e residuais. Este teste é resumido no

quadro da ANOVA..

ANÁLISE DE CORRELAÇÃO E REGRESSÃO 142

A estatística utilizada para o teste é a variável aleatória com distribuição F de Snedecor,

com m graus de liberdade no numerador e n graus de liberdade no denominador. As hipóteses

são:

regressãoexisteNão:H0

regressãoExiste:H1

As variações ou somas dos quadrados são obtidos através de :

n

1i

2i )Yy(totaisquadradosdeSomaSQT

XYSblicadosexpquadradosdeSomaSQE

onde: )Yy()Xx(S ii

n

1iXY

XYYY SbSresiduaisquadradosdeSomaSQR

onde:

n

1i

2YY )Yy(S i

Tem-se que: SQRSQESQT .

Para a ANOVA, faz-se necessária elaborar a tabela abaixo:

FONTE DE VARIAÇÃO

SOMA DOS QUADRADOS

G.L. QUADRADO MÉDIO F

Explicada XYSbSQE 1 XYSbQME

QMR

QMEF

Residual XYYY SbSSQR 2n 2n

SbSQMR XYYY

Total YYSSQT 1n

Se )tabelado(FF 2n,1;calculado , rejeita-se 0H e conclui-se que existe a regressão de Y

sobre X .

GRÁFICO 5 – DESVIOS TOTAIS, EXPLICADOS E RESIDUAIS

Y

X

iy

)yy( ii

)Yy( i

)yY( i

bXaY

SACHIKO ARAKI LIRA 143

Exemplo de aplicação:

1) Testar o modelo ajustado no exemplo 1, através do teste t e da análise da variância. Usar

%5 .

Solução:

Para obter as somas dos quadrados faz-se necessário os seguintes cálculos:

OBS. ix iy ii yx )Xx( i )Yy( i 2i )Xx( 2

i )Yy( )Yy()Xx( ii

1 6 10 60,0 -2,45 -25 6,0 625 61,25

2 4 10 40,0 -4,45 -25 19,8 625 111,25

3 6 20 120,0 -2,45 -15 6,0 225 36,75

4 8 20 160,0 -0,45 -15 0,2 225 6,75

5 7,5 30 225,0 -0,95 -5 0,9 25 4,75

6 8,5 40 340,0 0,05 5 0,0 25 0,25

7 9,5 45 427,5 1,05 10 1,1 100 10,5

8 11 50 550,0 2,55 15 6,5 225 38,25

9 12 60 720,0 3,55 25 12,6 625 88,75

10 12 65 780,0 3,55 30 12,6 900 106,5

Total 84,5 350 3.422,5 65,70 3.600 465,00

a) Teste “t”

0:H0

0:H1

Tem-se que:

38,76568

465075,7600.3

2n

bSSS XYYY2

Calculando inicialmente:

70,65)Xx(Sn

1i

2iXX

600.3)Yy(Sn

1i

2iYY

46510

3505,845,422.3

n

yx

yxS

n

1i

n

iiin

1iiiXY

A estatística do teste é dada por:

9,21

70,65

7656,38

0075,7

S

S

bt

XX

2

, que segue distribuição t com n-2 graus de liberdade.

ANÁLISE DE CORRELAÇÃO E REGRESSÃO 144

Tem-se que 31,28;2/05,0t , logo, rejeita-se 0H e conclui-se que existes regressão.

b) ANOVA

600.3)Yy(SSQTn

1i

2iYY

XYSbSQE ,

sendo que 465)Yy()Xx(S i

n

1iiXY

7,0749b (já calculado)

Assim, tem-se que: 3289,82854650749,7SXYbSQE

XYYY SSSQR b

310,17158285,3289600.3SSSQR XYYY b

QUADRO DA ANÁLISE DA VARIÂNCIA

FONTE DE VARIAÇÃO

SOMA DOS QUADRADOS

G.L. QUADRADO MÉDIO F

Explicada 8285,289.3SQE 1 8285,289.3QME

84,85F

Residual 1715,310SQR 82n 38,7714

8

1715,310QMR

Total 000,600.3SQT 91n

Tem-se que 32,5F 8,1;05,0 , logo, conclui-se que existe regressão.

10.4.3 COEFICIENTE DE DETERMINAÇÃO OU EXPLICAÇÃO

Um outro indicador utilizado constantemente é o coeficiente de determinação, 2R , que

indica quantos por cento a variação explicada pela regressão representa da variação total. Este

varia entre 0 e 1. Quanto mais próximo de 1, maior é a explicação pelo modelo das variação

total. A expressão de 2R é dada por:

SQT

SQER2

Para o exemplo 1, tem-se que:

0,9138000,600.3

829,289.3

SQT

SQER2

O modelo ajustado explica 91,38% das variações ocorridas na variável dependente Y.

2) Foi realizada uma experiência relacionando os alongamentos de uma mola (cm) com as cargas aplicadas (kg). Os resultados obtidos foram:

SACHIKO ARAKI LIRA 145

Carga (kg) 3 4 5 6 7 8 9 10

Alongamento (cm) 4,0 4,8 5,6 6,7 7,9 9,0 9,8 11,0

Ajustar um modelo de regressão linear simples aos dados, testar a hipótese da existência

de regressão e calcular o coeficiente de determinação.

Solução:

a) Ajuste do modelo de regressão linear simples

Tem-se que a variável dependente Y é o alongamento da mola e a independente X, a

carga, Assim, para obter os coeficientes a e b, serão necessários os seguintes cálculos:

X-> carga

Y-> alongamento

OBS. ix iy )Xx( i 2i )Xx( ii y)Xx(

1 3 4 -3,5 12,25 -14,00

2 4 4,8 -2,5 6,25 -12,00

3 5 5,6 -1,5 2,25 -8,40

4 6 6,7 -0,5 0,25 -3,35

5 7 7,9 0,5 0,25 3,95

6 8 9 1,5 2,25 13,50

7 9 9,8 2,5 6,25 24,50

8 10 11 3,5 12,25 38,50

Total 52 58,8 0 42,00 42,70

Média 6,5 7,35

Tem-se então que:

5,6X

35,7Y

52)Xx(n

1i

2i

70,42y)Xx(n

1iii

Logo, 1,0166742

70,42

)Xx(

y)Xx(

bn

1i

2i

n

1iii

0,74165,61,0166735,7XbYa

A equação de regressão linear será:

X0167,17415,0Y

Tem-se que:

ANÁLISE DE CORRELAÇÃO E REGRESSÃO 146

OBS. ix iy iy

1 3 4 3,8

2 4 4,8 4,8

3 5 5,6 5,8

4 6 6,7 6,8

5 7 7,9 7,9

6 8 9 8,9

7 9 9,8 9,9

8 10 11 10,9

O gráfico a seguir, apresenta o diagrama de dispersão e a função linear ajustada.

b) Teste da existência de regressão

Para obter as somas dos quadrados faz-se necessário os seguintes cálculos:

OBS. ix iy )Xx( i )Yy( i 2i )Xx( 2

i )Yy( )Yy()Xx( ii

1 3 4 -3,5 -3,35 12,25 11,2225 11,725

2 4 4,8 -2,5 -2,55 6,25 6,5025 6,375

3 5 5,6 -1,5 -1,75 2,25 3,0625 2,625

4 6 6,7 -0,5 -0,65 0,25 0,4225 0,325

5 7 7,9 0,5 0,55 0,25 0,3025 0,275

6 8 9 1,5 1,65 2,25 2,7225 2,475

7 9 9,8 2,5 2,45 6,25 6,0025 6,125

8 10 11 3,5 3,65 12,25 13,3225 12,775

Total 52 58,8 42,00 43,56 42,70

Média 6,5 7,35

56,43)Yy(SSQTn

1i

2iYY

DIAGRAMA DE DISPERSÃO E FUNÇÃO LINEAR

AJUSTADA

0

2

4

6

8

10

12

0 2 4 6 8 10 12

Carga

Alongamento

SACHIKO ARAKI LIRA 147

XYSbSQE ,

sendo que 70,42)Yy()Xx(S ii

n

1iXY

01667,1b (já calculado)

Assim, tem-se que: 43,411770,4201667,1SXYbSQE

XYYY SSSQR b

0,148343,411756000,43SSSQR XYYY b

QUADRO DA ANÁLISE DA VARIÂNCIA

FONTE DE VARIAÇÃO

SOMA DOS QUADRADOS

G.L. QUADRADO MÉDIO F

Explicada 4117,43SQE 1 43,4117QME

1757,56F Residual 0,1483SQR 62n

0,0247QMR

Total 5600,43SQT 71n

Tem-se que 99,5F 6,1;05,0 , logo, conclui-se que existe a regressão de Y sobre X .

c) Coeficiente de determinação

SQT

SQER2

Para o exemplo 2, tem-se que:

0,99665600,43

4117,43

SQT

SQER2

O modelo ajustado explica 99,66% das variações ocorridas na variável dependente Y.

10.5 AJUSTE DE CURVA GEOMÉTRICA (OU FUNÇÃO POTÊNCIA)

Apresenta-se, a seguir, como se ajusta uma função potência, a um conjunto de pontos

)y,x( ii . A função potência é dada pela expressão a seguir:

XY

Graficamente, tem-se:

ANÁLISE DE CORRELAÇÃO E REGRESSÃO 148

10.5.1 ESTIMATIVA DOS COEFICIENTES

O modelo estimado será dado por:

ˆ

XY ˆ

Para ajustar uma curva geométrica ˆ

XY ˆ , a um conjunto de pontos )y,x( ii , pode-se

fazer através da seguinte transformação, considerando 0Y e 0X :

XlnlnYln ˆˆ , que poderá ser escrita da seguinte forma:

TAZ

onde:

YlnZ

ˆlnA

XlnT

Os parâmetros A e são estimados através dos dados amostrais e a reta estimada

será da forma:

TAZ

Os valores de A e serão obtidos a partir das equações apresentadas a seguir.

TZA

n

1i

2i

n

1iii

)Tt(

z)Tt(ˆ

Para obter a estimativa do modelo na sua forma original, faz-se a transformação inversa

dos coeficientes A e B . Tem-se então que:

ˆlnA , logo, Aeˆ

FUNÇÃO POTÊNCIA

40

45

50

55

60

65

70

75

80

85

140 240 340 440 540

X

Y

10

SACHIKO ARAKI LIRA 149

E a função potência estimada será:

ˆ

XY ˆ

10.5.2 TESTES DE HIPÓTESES NA REGRESSÃO

10.5.2.1 ANÁLISE DA VARIÂNCIA

A estatística utilizada para o teste é a variável aleatória com distribuição F de Snedecor,

com m graus de liberdade no numerador e n graus de liberdade no denominador. As hipóteses

são:

regressãoexisteNão:H0

regressãoExiste:H1

As variações ou somas dos quadrados são obtidos através de :

n

1i

2i )Zz(SQT

TZSSQE

onde: )Zz()Tt(S ii

n

1iTZ

TZZZ SSSQR

onde:

n

1i

2ZZ )Zz(S i

Tem-se que: SQRSQESQT .

Para a ANOVA, faz-se necessária elaborar a tabela abaixo:

FONTE DE VARIAÇÃO

SOMA DOS QUADRADOS

G.L. QUADRADO MÉDIO F

Explicada TZSSQE 1 TZSQME

QMR

QMEF Residual TZZZ SSSQR 2n

2n

SSQMR TZ

ˆZZ

Total ZZSSQT 1n

Se )tabelado(FF 2n,1;calculado , rejeita-se 0H e conclui-se que existe a regressão de Y

sobre X .

ANÁLISE DE CORRELAÇÃO E REGRESSÃO 150

10.5.3 COEFICIENTE DE DETERMINAÇÃO OU EXPLICAÇÃO

O coeficiente de determinação, 2R , que indica quantos por cento a variação explicada

pela regressão representa da variação total. Este varia entre 0 e 1. Quanto mais próximo de 1,

maior é a explicação pelo modelo das variação total. A expressão de 2R é dada por:

SQT

SQER2

Exemplo: Os dados apresentados, a seguir, representam o desempenho (medido em km

percorridos por litro de gasolina) dos carros em estrada e o deslocamento do pistão no motor,

para uma amostra de 8 carros.

Sejam as variáveis: X= deslocamento do pistão )m( 3 e Y= km percorridos em estrada

por litro de gasolina.

CARROS X Y

1 215 13,2

2 201 13,7

3 196 14,1

4 226 12,9

5 226 12,3

6 348 11,1

7 226 13,1

8 348 11,2

a) construir o diagrama de dispersão;

b) Ajustar uma função geométrica aos dados;

c) testar a existência de regressão;

d) calcular o coeficiente de determinação.

Solução:

a) Diagrama de dispersão

DIAGRAMA DE DISPERSÃO

10,0

10,5

11,0

11,5

12,0

12,5

13,0

13,5

14,0

14,5

15,0

80 130 180 230 280 330 380

Deslocamento do pistão

Km/litro de

gasolina

SACHIKO ARAKI LIRA 151

Fazendo as transformações de variáveis necessárias, tem-se:

CARROS ix iy )yln(z ii )xln(t ii )Tt( i 2i )Tt( ii z)Tt(

1 215 13,2 2,5802 5,3706 -0,1191 0,0142 -0,3074

2 201 13,7 2,6174 5,3033 -0,1865 0,0348 -0,4880

3 196 14,1 2,6462 5,2781 -0,2116 0,0448 -0,5600

4 226 12,9 2,5572 5,4205 -0,0692 0,0048 -0,1770

5 226 12,3 2,5096 5,4205 -0,0692 0,0048 -0,1737

6 348 11,1 2,4069 5,8522 0,3624 0,1314 0,8724

7 226 13,1 2,5726 5,4205 -0,0692 0,0048 -0,1781

8 348 11,2 2,4159 5,8522 0,3624 0,1314 0,8756

SOMA 0,3709 -0,1362

MÉDIA 248,25 2,5383 5,4898

a) Cálculo das estimativas dos parâmetros

-0,36740,3709

0,1362-

)Tt(

z)Tt(

n

1i

2i

n

1iii

ˆ

4,55505,4898)3674,0(2,5383TZA ˆ

O modelo ajustado é:

T3674,05550,4TˆAZ

Mas tem-se que:

ˆlnA , logo, 95,10685550,4A eeˆ

O modelo ajustado na forma potencial será:

3674,0ˆX1068,95XY ˆ

O gráfico a seguir apresenta o diagrama de dispersão e a função potencial ajustada.

DIAGRAMA DE DISPERSÃO E CURVA POTENCIAL

AJUSTADA

10,0

10,5

11,0

11,5

12,0

12,5

13,0

13,5

14,0

14,5

80 130 180 230 280 330 380

Deslocamento do pistão

Km/litro de

gasolina

ANÁLISE DE CORRELAÇÃO E REGRESSÃO 152

b) Utilizando a ANOVA para testar a existência de regressão:

CARROS ix iy

)yln(z ii

)xln(t ii

)Zz( i

2

i )Zz(

)Tt( i )Zz()Tt( ii

1 215 13,2 2,5802 5,3706 0,0420 0,0018 -0,1191 -0,0050 2 201 13,7 2,6174 5,3033 0,0791 0,0063 -0,1865 -0,0148 3 196 14,1 2,6462 5,2781 0,1079 0,0116 -0,2116 -0,0228 4 226 12,9 2,5572 5,4205 0,0190 0,0004 -0,0692 -0,0013 5 226 12,3 2,5096 5,4205 -0,0287 0,0008 -0,0692 0,0020 6 348 11,1 2,4069 5,8522 -0,1313 0,0172 0,3624 -0,0476 7 226 13,1 2,5726 5,4205 0,0344 0,0012 -0,0692 -0,0024 8 348 11,2 2,4159 5,8522 -0,1223 0,0150 0,3624 -0,0443

SOMA 0,0543 -0,1362

MÉDIA 248,25 2,5383 5,4898

As variações ou somas dos quadrados são obtidos através de :

0,0543)Zz(SQTn

1i

2i

TZSSQE

onde: -0,1362)Zz()Tt(S ii

n

1iTZ

0,0500)1362,0(3674,0SSQE TZˆ

0,00430500,00543,0SQESQTSQR

FONTE DE VARIAÇÃO

SOMA DOS QUADRADOS

G.L. QUADRADO MÉDIO F

Devido à regressão 0500,0 1 0500,0

70,38 Residuo 0043,0 6 0,0007

Total 0543,0 7

Tem-se que 99,5F 6;1;05,0 . Como 5,99F38,70F 6;1;05,0 , conclui-se que existe

regressão, ao nível de 5% de significância.

Finalmente, para analisar o grau de explicação do modelo, calcular-se-á o coeficiente de

determinação.

0,92140543,0

0,0500

SQT

SQER2

O modelo ajustado explica 92,14% das variações ocorridas na variável Y.

10.6 AJUSTE DE FUNÇÃO EXPONENCIAL

Apresenta-se, a seguir, o ajuste de uma função exponencial XY , a um conjunto de

pontos )y,x( ii .

Graficamente, tem-se:

SACHIKO ARAKI LIRA 153

10.6.1 ESTIMATIVA DOS COEFICIENTES

O modelo estimado é:

XˆˆY

Fazendo a transformação logarítmica:

ˆˆ lnXlnYln , que poderá ser escrita como sendo:

XBAZ

onde:

YlnZ

ˆlnA

ˆlnB

Assim, reduz-se ao problema de ajuste de uma reta aos pontos )z,x( ii , onde iylnzi .

Os parâmetros A e B são estimados através dos dados amostrais e a reta estimada será da

forma:

XBAZ

Os valores de A e B serão obtidos a partir das equações apresentadas a seguir.

XBZA

n

1i

2i

n

1iii

)Xx(

z)Xx(

B

Para obter a estimativa do modelo na sua forma original, faz-se a transformação inversa

dos coeficientes A e B . Tem-se então que:

ˆlnA , logo, Aeˆ

ˆlnB , logo, Beˆ

E o modelo exponencial estimado será:

XˆˆY

FUNÇÃO EXPONENCIAL

0

20

40

60

80

100

120

140

160

180

200

0 5 10 15

X

Y

1

ANÁLISE DE CORRELAÇÃO E REGRESSÃO 154

10.6.2 TESTES DE HIPÓTESES NA REGRESSÃO

10.6.2.1 ANÁLISE DA VARIÂNCIA

A estatística utilizada para o teste é a variável aleatória com distribuição F de Snedecor,

com 1 grau de liberdade no numerador e n-2 graus de liberdade no denominador. As hipóteses

são:

regressãoexisteNão:H0

regressãoExiste:H1

As variações ou somas dos quadrados são obtidos através de :

n

1i

2i )Zz(totaisquadradosdeSomaSQT

XZSBlicadosexpquadradosdeSomaSQE

onde: )Zz()Xx(S ii

n

1iXZ

XZZZ SBSresiduaisquadradosdeSomaSQR

onde:

n

1i

2ZZ )Zz(S i

Tem-se que: SQRSQESQT .

Para a ANOVA, faz-se necessária elaborar a tabela abaixo:

FONTE DE VARIAÇÃO

SOMA DOS QUADRADOS

G.L. QUADRADO MÉDIO F

Explicada XZSBSQE 1 XZSBQME

QMR

QMEF

Residual XZZZ SBSSQR 2n 2n

SBSQMR XZZZ

Total ZZSSQT 1n

Se )tabelado(FF 2n,1;calculado , rejeita-se 0H e conclui-se que existe a regressão de Y

sobre X .

10.6.3. COEFICIENTE DE DETERMINAÇÃO OU EXPLICAÇÃO

O coeficiente de determinação, 2R , que indica quantos por cento a variação explicada

pela regressão representa da variação total. Este varia entre 0 e 1. Quanto mais próximo de 1,

maior é a explicação pelo modelo das variação total. A expressão de 2R é dada por:

SQT

SQER2

SACHIKO ARAKI LIRA 155

Exemplo:

1) Seja o processo de recobrimento de uma determinada peça com metal. O recobrimento é

feito com metal fundido.

X= quantidade utilizada de metal fundido (em gramas);

Y = porcentagem de recobrimento obtida (%).

QUANTIDADE DE METAL FUNDIDO UTILIZADA E PORCENTAGEM DE RECOBRIMENTO OBTIDA

OBSERVAÇÃO ix iy

1 6,0 10

2 4,0 10

3 6,0 20

4 8,0 20

5 7,5 30

6 8,5 40

7 9,5 45

8 11,0 50

9 12,0 60

10 12,0 65

a) ajustar uma função exponencial aos dados;

b) testar a existência de regressão utilizando nível de significância de 5%;

c) calcular o coeficiente de determinação.

Solução:

a) ajuste da função exponencial

OBS. ix iy )yln(z ii )Xx( i 2

i )Xx( ii z)Xx(

1 6,0 10 2,3026 -2,45 6,00 -5,6413

2 4,0 10 2,3026 -4,45 19,80 -10,2465

3 6,0 20 2,9957 -2,45 6,00 -7,3395

4 8,0 20 2,9957 -0,45 0,20 -1,3481

5 7,5 30 3,4012 -0,95 0,90 -3,2311

6 8,5 40 3,6889 0,05 0,00 0,1844

7 9,5 45 3,8067 1,05 1,10 3,9970

8 11,0 50 3,9120 2,55 6,50 9,9757

9 12,0 60 4,0943 3,55 12,60 14,5349

10 12,0 65 4,1744 3,55 12,60 14,8191

SOMA 84,5 350 65,73 15,7045

MÉDIA 8,45 35 3,3674

a.1) Cálculo do coeficiente B :

0,238965,73

15,7045

)Xx(

z)Xx(

Bn

1i

2i

n

1iii

a.2) Cálculo do coeficiente A

1,348345,8(0,2389)-XBZA 3674,3

ANÁLISE DE CORRELAÇÃO E REGRESSÃO 156

Assim, o modelo ajustado na forma linear será:

X2389,08511,3XBAZ

Mas tem-se que:

ˆlnA , logo, 3,8511ˆ 3483,1A ee

ˆlnB , logo, 2699,1ˆ 2389,0B ee

a.3) O modelo ajustado na forma exponencial é:

X9987,06271,17XY ˆˆ

Assim, tem-se que:

OBS. ix iy iy

1 6,0 10 16,15

2 4,0 10 10,02

3 6,0 20 16,15

4 8,0 20 26,05

5 7,5 30 23,11

6 8,5 40 29,35

7 9,5 45 37,27

8 11,0 50 53,34

9 12,0 60 67,74

10 12,0 65 67,74

O gráfico a seguir apresenta o diagrama de dispersão e a função exponencial

ajustada:

b) Teste para verificar a existência de regressão

DIAGRAMA DE DISPERSÃO E FUNÇÃO EXPONENCIAL

AJUSTADA

0

10

20

30

40

50

60

70

80

2 4 6 8 10 12 14

Quantidade de metal fundido

Recobrimento

(%)

SACHIKO ARAKI LIRA 157

OBS. ix iy )yln(z ii )Xx( i )Zz( i 2)Zz( i )Zz()Xx( ii

1 6,0 10 2,3026 -2,45 -1,0648 1,1338 2,6088

2 4,0 10 2,3026 -4,45 -1,0648 1,1338 4,7384

3 6,0 20 2,9957 -2,45 -0,3717 0,1381 0,9106

4 8,0 20 2,9957 -0,45 -0,3717 0,1381 0,1673

5 7,5 30 3,4012 -0,95 0,0338 0,0011 -0,0321

6 8,5 40 3,6889 0,05 0,3215 0,1033 0,0161

7 9,5 45 3,8067 1,05 0,4393 0,1930 0,4612

8 11,0 50 3,9120 2,55 0,5446 0,2966 1,3888

9 12,0 60 4,0943 3,55 0,7269 0,5284 2,5807

10 12,0 65 4,1744 3,55 0,8070 0,6512 2,8648

SOMA 84,5 350 4,3177 15,7045

MÉDIA 8,45 35 3,3674

Calculando-se a soma dos quadrados tem-se:

3177,4)Zz(SQTn

1i

2i

XZSSQE B

onde: 7045,15)Zz()Xx(S ii

n

1iXZ

3,75257045,152389,0SXZBSQE

0,56527525,33177,4SQRSQTSQR

Quadro da ANOVA

FONTE DE VARIAÇÃO

SOMA DE QUADRADOS

GRAUS DE LIBERDADE

QUADRADO MÉDIO F

Explicada 3,7525 1 3,7525

53,11 Residual 0,5652 8 0,0706

Total 4,3177 9

Tem-se que 32,5F 8;1;05,0 . Como 32,5F11,53F 8;1;05,0 , conclui-se que existe

regressão, ao nível de 5% de significância.

c) Cálculo do coeficiente de determinação

Finalmente, para analisar o grau de explicação do modelo, calcular-se-á o coeficiente de

determinação.

0,86913177,4

7525,3

SQT

SQER2

O modelo ajustado explica 86,91% das variações ocorridas na variável Y.

ANÁLISE DE CORRELAÇÃO E REGRESSÃO 158

LISTA DE EXERCÍCIOS NO. 9 – ANÁLISE DE CORRELAÇÃO E REGRESSÃO

1. A a seguir relaciona os pesos (em centenas de kg) e as taxas de rendimento de combustível

em rodovia (km/litro), numa amostra de 10 carros de passeio novos.

Peso 12 13 14 14 16 18 19 22 24 26

Rendimento 16 14 14 13 11 12 09 09 08 06

Pede-se:

a) Calcular o coeficiente linear de Pearson e testar a significância ao nível de 5%.

b) Ajustar a função linear e testar a existência de regressão, adotando 05,0 . Qual é o

coeficiente de explicação da função linear?

c) Ajustar a função potêncial e testar a existência de regressão, adotando 05,0 . Qual é o

coeficiente de explicação da função potencial?

d) Ajustar a função exponencial e testar a existência de regressão, adotando 05,0 . Qual é o

coeficiente de explicação da função exponencial?

e) Qual das três funções ajustadas é a melhor? Comente?

2) Um estudo foi desenvolvido para verificar o quanto o comprimento de um cabo da porta serial

de microcomputadores influencia na qualidade da transmissão de dados, medida através do

número de falhas em 100.000 lotes de dados transmitidos (taxa de falha). Os resultados foram:

Comp. do Cabo (m)

8 8 9 9 10 10 11 11 12

Taxa de Falha

2,2 2,1 3,0 2,9 4,1 4,5 6,2 5,9 9,8

Comp. do Cabo (m)

12 13 13 14 14 15

Taxa de Falha

8,7 12,5 13,1 19,3 17,4 28,2

Pede-se:

a) Calcular o coeficiente linear de Pearson e testar a significância ao nível de 5%.

b) Ajustar a função linear e testar a existência de regressão, adotando 05,0 . Qual é o

coeficiente de explicação da função linear?

c) Ajustar a função potêncial e testar a existência de regressão, adotando 05,0 . Qual é o

coeficiente de explicação da função potencial?

d) Ajustar a função exponencial e testar a existência de regressão, adotando 05,0 . Qual é o

coeficiente de explicação da função exponencial?

e) Qual das três funções ajustadas é a melhor? Comente.

3) No processo de queima de massa cerâmica, avaliou-se o efeito da temperatura do forno (X)

sobre a resistência mecânica da massa queimada (Y). Foram realizados 6 ensaios com níveis

de temperatura equidistantates, os quais designaremos por 1, 2, 3, 4, 5 e 6. Os valores obtidos

de resistência mecânica (MPa) foram: 41, 42, 50, 53, 54, 60, respectivamente.

Pede-se:

SACHIKO ARAKI LIRA 159

a) Ajustar a função linear e testar a existência de regressão, adotando 05,0 . Qual é o

coeficiente de explicação da função linear?

b) Ajustar a função potêncial e testar a existência de regressão, adotando 05,0 . Qual é o

coeficiente de explicação da função potencial?

c) Ajustar a função exponencial e testar a existência de regressão, adotando 05,0 . Qual é o

coeficiente de explicação da função exponencial?

d) Qual das três funções ajustadas é a melhor? Comente.

ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA 160

ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA

INTRODUÇAO

O modelo estatístico de uma regressão linear múltipla, sendo Y a variável dependente e, as k ( 1k ) variáveis independentes k21 X,X,X , será dado por:

kk2211 XXXY

Na forma matricial:

XY

n

2

1

k

1

0

kn2n1n

k22221

k11211

n

2

1

X...XX1

X...XX1

X...XX1

Y

Y

Y

A estimativa dessa equação de regressão será dada pelo modelo a seguir:

kk2211 XbXbXbbY 0

As estimativas k210 b,,b,b,b dos coeficientes k21 ,,,, , podem ser calculadas

pelo método dos mínimos quadrados, partindo de hipóteses análogas àquelas adotadas para

regressão linear simples.

Adotando-se a forma matricial, as estimativas dos coeficientes, são obtidas através de:

YX)XX( 1b

Onde:

k

1

0

b

b

b

b

;

n

2

1

Y

Y

Y

Y

;

kn2n1n

k22221

k11211

X...XX1

X...XX1

X...XX1

X

11.1 REGRESSÃO LINEAR COM 2 VARIÁVEIS INDEPENDENTES

O modelo de regressão com 2 variáveis independentes é dado por:

2211 XXY

A estimativa dessa equação é expressa por:

SACHIKO ARAKI LIRA 161

2211 XbXbbY 0

11.1.1 ESTIMATIVAS DOS COEFICIENTES DE REGRESSÃO

As estimativas dos coeficientes 21o e, podem ser obtidas através de:

YX)XX( 1b

Onde:

2

1

0

b

b

b

b ;

n

2

1

Y

Y

Y

Y

;

2n1n

2221

1211

XX1

XX1

XX1

X

1.1.2 TESTE PARA VERIFICAR A EXISTÊNCIA DE REGRESSÃO

O teste para verificar a existência de regressão é feito através da estatística F, utilizando

o quadro da ANOVA.

FONTE DE VARIAÇÃO

SOMA DOS QUADRADOS G.L. QUADRADO MÉDIO F

Explicada 21 YX2YX1 SbSbSQE 2 2

SQEQME

QMR

QMEF Residual 21 YX2YX1YY SbSbSSQR 3n

2n

SQRQMR

Total YYSSQT 1n

onde: n

y

yS

2n

1iin

1i

2iYY

, sendo a variância de Y.

n

xy

)xy(S

n

1ii1

n

1iin

1ii1i1YX

, que é a covariância entre Y e X1

n

xy

)xy(S

n

1ii2

n

1iin

1ii2i2YX

, que é a covariância entre Y e X2

Se 3n;2;calc FF , conclui-se que existe regressão de Y sobre X1 e X2.

11.1.3 CÁLCULO DO COEFICIENTE DE DETERMINAÇÃO OU EXPLICAÇÃO

O coeficiente de determinação 2R , indica quantos por cento a variação explicada pela

regressão representa da variação total. Este varia entre 0 e 1. Quanto mais próximo de 1, maior

é a explicação pelo modelo das variação total.

ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA 162

A expressão de 2R é dada por:

SQT

SQE

S

SbSbR

YY

YX2YX12 21

Exemplos:

1) Um estudo foi realizado sobre o desgaste de um mancal, Y, e sua relação com

X1=viscosidade do óleo e X2=carga. Os seguintes dados foram obtidos:

iy i1x i2x

243 1,6 851

230 15,5 816

172 22 1058

91 43 1201

58 33 1357

125 40 1115

190 35 918

256 13 834

256 11 845

240 8,9 820

Ajustar um modelo de regressão linear múltipla, testar a hipótese de que existe regressão

ao nível de 5% de significância e calcular o coeficiente de determinação.

Solução:

240

256

256

190

125

58

91

172

230

243

Y

8209,81

8450,111

8340,131

9180,351

11150,401

13570,331

10210,431

10580,221

8165,151

8516,11

X

8208458349181115135710211058816851

9,80,110,130,350,400,330,430,225,156,1

1111111111

X

SACHIKO ARAKI LIRA 163

9.961.201237.874,69.815

237.874,66.859,02223

9.81522310

XX

0,00000,0001-0,0055-

0,0001-0,00130,0441

0,0055-0,04414,5640

)XX( 1

0002,00002,00004,00014,00003,00020,00001,00006,00007,00006,0

0051,00043,00010,00209,00127,00141,00102,00060,00036,00167,0

4056,03594,05086,00123,11394,05122,12057,03378,07187,00,0883-

X)XX( 1

0,3011-

1,2114-

508,6320

YX)XX( 1b

O modelo estimado é: 21 X3011,0X2114,16320,508Y

OBS. iy i1x i2x i1ixy i2ixy 2

iy

1 243 1,6 851 388,8 206.793 59.049

2 230 15,5 816 3.565,0 187.680 52.900

3 172 22,0 1058 3.784,0 181.976 29.584

4 91 43,0 1201 3.913,0 109.291 8.281

5 58 33,0 1357 1.914,0 78.706 3.364

6 125 40,0 1115 5.000,0 139.375 15.625

7 190 35,0 918 6.650,0 174.420 36.100

8 256 13,0 834 3.328,0 213.504 65.536

9 256 11,0 845 2.816,0 216.320 65.536

10 240 8,9 820 2.136,0 196.800 57.600

SOMA 1861 223 9.815 33.494,8 1.704.865 393.575

MÉDIA 186,1 22,3 981,5

47.242,910

1.861- 393.575

n

y

yS2

2n

1iin

1i

2iYY

47.242,9SSQT YY

-8.005,510

2231.861- 33.494,8

n

xy

)xy(S

n

1ii1

n

1ii

n

1ii1i1YX

-121.706,55

9.815861.1- 1.704.865

n

xy

)xy(S

n

1ii2

n

1iin

1ii2i2YX

946.343,689-121.706,50,3011)-8.005,5(2114,1SbSbSQE 21 YX2YX1

899,21026899,343.469,242.47SbSbSSQR 21 YX2YX1YY

ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA 164

ANOVA para verificar a existência de regressão:

FONTE DE VARIAÇÃO

SOMA DOS QUADRADOS G.L. QUADRADO

MÉDIO F

Explicada 6899,343.46SQE 2 2.3171,84QME

180,38F Residual 2102,899SQR 7 128,4586QMR

Total 9,242.47SQT 9

Tem-se que : 74,4F 7,2;05,0

Conclusão: Como F calculado é igual a 180,38 e é maior que 74,4F 7,2;05,0 , conclui-se

que existe regressão, ao nível de 5% de significância.

Cálculo de coeficiente de determinação:

0,98109000,242.47

6899,343.46

SQT

SQE

S

SbSbR

YY

YX2YX12 21

O modelo ajustado explica 98,10% das variações ocorridas em Y.

2) Uma indústria fabrica um produto em dois tamanhos (pequeno e grande). Conhecendo-se o

consumo total de matéria-prima (Y), em kg, durante 5 meses, e as respectivas produções

mensais do tipo pequeno (X1) e do tipo grande (X2), pede-se:

a) ajustar um modelo de regressão linear múltipla;

b) verificar a existência de regressão, ao nível de significância de 10%;

c) calcular o coeficiente de determinação.

iy i1x i2x

145 151 70

210 221 91

193 215 92

229 247 122

195 243 79

Solução:

a) Cálculo das estimativas dos coeficientes

Tem-se que: YX)XX( 1b

195

229

193

210

145

Y ;

792431

1222471

922151

912211

701511

X ;

79122929170

243247215221151

11111

X

SACHIKO ARAKI LIRA 165

4277099792454

997922379251077

45410775

XX ;

0,001150,0004-0,0209-

0,0004-0,00030,0292-

0,0209-0,0292-8,3935

)XX( 1

0242,00234,00015,00019,00010,0

0128,00026,00006,00016,00112,0

3600,03758,11866,00322,05170,2

X)XX( 1

0,7175

0,4957

22,4821

YX)XX( 1b

O modelo estimado é: 21 X7175,0X4957,04821,22Y

OBS. iy i1x i2x i1ixy i2ixy 2

iy

1 145 151 70 21.895 10.150 21.025

2 210 221 91 46.410 19.110 44.100

3 193 215 92 41.495 17.756 37.249

4 229 247 122 56.563 27.938 52.441

5 195 243 79 47.385 15.405 38.025

SOMA 972 1077 454 213.748 90.359 192.840

MÉDIA 194,4 215,4 90,8

Cálculo das somas de quadrados:

3.883,25

972- 192.840

n

y

yS2

2n

1iin

1i

2iYY

2,883.3SSQT YY

4.379,25

1077972- 213.748

n

xy

)xy(S

n

1ii1

n

1iin

1ii1i1YX

2.101,45

454972- 90.359

n

xy

)xy(S

n

1ii2

n

1iin

1ii2i2YX

3.678,52394,101.27175,02,379.44957,0SbSbSQE 21 YX2YX1

204,67615239,36782,3833SbSbSSQR 21 YX2YX1YY

OU 204,67615239,678.32000,883.3SQESQTSQR

ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA 166

b) ANOVA para verificar a existência de regressão:

FONTE DE VARIAÇÃO

SOMA DOS QUADRADOS G.L. QUADRADO

MÉDIO F

Explicada 5239,678.3SQE 2 1839,262QME

17,97F Residual 6761,204SQR 2 102,338QMR

Total 2000,833.3SQT 4

Tem-se que : 2,2;10,0F

Conclusão: Como F calculado é igual a 17,97 e é maior que 00,9F 2,2;10,0 , conclui-se que

existe regressão, ao nível de 10% de significância.

c) Cálculo de coeficiente de determinação

0,94732,833.3

5239,678.3

SQT

SQE

S

SbSbR

YY

YX2YX12 21

O modelo ajustado explica 94,73% das variações ocorridas em Y.

LISTA DE EXERCÍCIOS NO. 10 – ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA

1) Uma investigação sobre um processo de fundição gerou os dados a seguir sobre 1X =

temperatura da fornalha, 2X = tempo de moldagem da matriz e Y = diferença de temperatura na

superfície de moldagem da matriz.

X1 1.250 1.300 1.350 1.250 1.300 1.250 1.300 1.350 1.350

X2 6 7 6 7 6 8 8 7 8

Y 80 95 101 85 92 87 96 106 108

Ajustar o modelo de regressão linear múltipla e testar a existência de regressão, adotando

05,0 . Qual é o coeficiente de explicação do modelo?

2) Um estudo realizado para investigar a relação entre a variável resposta relativa a quedas de

pressão em uma coluna de bolhas de uma chapa térmica e os previsores 1X = velocidade do

fluído superficial e 2X = viscosidade do líquido, gerou os dados a seguir.

OBS. VELOCIDADE VISCOSIDADE RESPOSTA

1 2,14 10,00 28,9

2 4,14 10,00 26,1

3 8,15 10,00 22,8

4 2,13 2,63 24,2

5 4,14 2,63 15,7

6 8,15 2,63 18,3

Continua

SACHIKO ARAKI LIRA 167

Continuação

7 5,60 1,25 18,1

8 4,30 2,63 19,1

9 4,30 2,63 15,4

10 5,60 10,10 12,0

11 5,60 10,10 19,8

12 4,30 10,10 18,6

13 2,40 10,10 13,2

14 5,60 10,10 22,8

15 2,14 112,00 41,8

16 4,14 112,00 48,6

17 5,60 10,10 19,2

18 5,60 10,10 18,4

19 5,60 10,10 15,0

Ajustar o modelo de regressão linear múltipla e testar a existência de regressão, adotando

01,0 . Qual é o coeficiente de explicação do modelo?

BIBLIOGRAFIA 168

BIBLIOGRAFIA

1. BARBETTA, Pedro A.; REIS, Marcelo M.; BORNIA, Antonio C. Estatística para cursos de Engenharia e Infomática. 3a. ed. São Paulo: Editora Atlas S. A. , 2010.

2. BUSSAB, W.O. & MORETTIN, P. A. Estatística Básica. 5ª Edição, Editora Saraiva, 2002.

3. COSTA NETO, Pedro Luiz O. Estatística. 2 ed rev. São Paulo: Edgard Blücher, 1994.

4. DEVORE, Jay L. Probabilidade e Estatística para Engenharia e Ciências. São Paulo: Pioneira Thomson Learning, 2006.

5. MARQUES, Jair M.; MARQUES, Marcos A. M. Estatística Básica para os Cursos de Engenharia. Curitiba: Domínio do Saber. 2009.

6. MEYER, Paul L. Probabilidade. Aplicações à Estatística. Rio de Janeiro: Livros Técnicos e Científicos, 1978.

7. MONTGOMERY, Douglas C.; RUNGER, George C. Estatística Aplicada e Probabilidade para Engenheiros. 4 ed. Rio de Janeiro: LTC, 2009.

8. RYAN, Thomas. Estatística Moderna para Engenharia. Rio de Janeiro: Elsevier, 2009.

9. Universidade Federal do Paraná. Normas para apresentação de documentos científicos, v. 5. Curitiba: Ed. UFPR,2007.

SACHIKO ARAKI LIRA 169

TABELAS

TABELA A1.1 – ÁREAS SOB A CURVA NORMAL

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

-0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641

-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247

-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859

-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483

-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121

-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776

-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451

-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148

-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867

-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611

-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379

-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170

-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985

-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823

-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681

-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559

-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455

-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367

-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294

-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233

-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183

-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143

-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110

-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084

-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064

-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048

-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036

-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026

-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019

-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014

-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010

-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007

-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005

-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003

-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002

-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002

-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001

-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001

-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001

-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

TABELAS 170

TABELA A1.2 – ÁREAS SOB A CURVA NORMAL

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359

0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753

0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141

0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517

0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879

0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224

0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549

0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852

0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133

0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389

1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621

1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830

1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015

1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177

1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319

1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441

1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545

1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633

1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706

1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767

2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817

2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857

2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890

2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916

2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936

2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952

2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964

2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974

2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981

2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986

3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990

3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993

3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995

3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997

3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998

3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998

3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999

3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999

3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999

3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

SACHIKO ARAKI LIRA 171

TABELA A2 - DISTRIBUIÇÃO „ t ‟ DE STUDENT

TESTE UNILATERAL

P 0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900 0,950 0,975 0,990 0,995

1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657

2 0,142 0,289 0,445 0,617 0,817 1,061 1,386 1,886 2,920 4,303 6,965 9,925

3 0,137 0,277 0,424 0,584 0,765 0,979 1,250 1,638 2,353 3,182 4,541 5,841

4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604

5 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032

6 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707

7 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,500

8 0,130 0,262 0,400 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,897 3,355

9 0,129 0,261 0,398 0,544 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250

10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,813 2,228 2,764 3,169

11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106

12 0,128 0,259 0,395 0,539 0,696 0,873 1,083 1,356 1,782 2,179 2,681 3,055

13 0,128 0,259 0,394 0,538 0,694 0,870 1,080 1,350 1,771 2,160 2,650 3,012

14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,625 2,977

15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,603 2,947

16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,584 2,921

17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898

18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878

19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,540 2,861

20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845

21 0,127 0,257 0,391 0,533 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831

22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819

23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,320 1,714 2,069 2,500 2,807

24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797

25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787

26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779

27 0,127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771

28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763

29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756

30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750

40 0,127 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,705

50 0,126 0,255 0,388 0,528 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678

60 0,126 0,255 0,387 0,527 0,679 0,848 1,046 1,296 1,671 2,000 2,390 2,660

70 0,126 0,254 0,387 0,527 0,678 0,847 1,044 1,294 1,667 1,994 2,381 2,648

80 0,126 0,254 0,387 0,527 0,678 0,846 1,043 1,292 1,664 1,990 2,374 2,639

90 0,126 0,254 0,387 0,526 0,677 0,846 1,042 1,291 1,662 1,987 2,369 2,632

100 0,126 0,254 0,386 0,526 0,677 0,845 1,042 1,290 1,660 1,984 2,364 2,626

200 0,126 0,254 0,386 0,525 0,676 0,843 1,039 1,286 1,653 1,972 2,345 2,601

300 0,126 0,254 0,386 0,525 0,675 0,843 1,038 1,284 1,650 1,968 2,339 2,592

400 0,126 0,254 0,386 0,525 0,675 0,843 1,038 1,284 1,649 1,966 2,336 2,588

0,126 0,253 0,385 0,524 0,675 0,842 1,036 1,282 1,645 1,960 2,326 2,576

P 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950 0,980 0,990

TESTE BILATERAL

TABELAS 172

TABELA A3 - DISTRIBUIÇÃO DE 2

P 0,005 0,010 0,025 0,050 0,100 0,250 0,750 0,900 0,950 0,975 0,990 0,995

1 0,000 0,000 0,001 0,004 0,016 0,102 1,323 2,706 3,842 5,024 6,635 7,879

2 0,010 0,020 0,051 0,103 0,211 0,575 2,773 4,605 5,992 7,378 9,210 10,597

3 0,072 0,115 0,216 0,352 0,584 1,213 4,108 6,251 7,815 9,348 11,345 12,838

4 0,207 0,297 0,484 0,711 1,064 1,923 5,385 7,779 9,488 11,143 13,277 14,860

5 0,412 0,554 0,831 1,146 1,610 2,675 6,626 9,236 11,071 12,833 15,086 16,750

6 0,676 0,872 1,237 1,635 2,204 3,455 7,841 10,645 12,592 14,449 16,812 18,548

7 0,989 1,239 1,690 2,167 2,833 4,255 9,037 12,017 14,067 16,013 18,475 20,278

8 1,344 1,647 2,180 2,733 3,490 5,071 10,219 13,362 15,507 17,535 20,090 21,955

9 1,735 2,088 2,700 3,325 4,168 5,899 11,389 14,684 16,919 19,023 21,666 23,589

10 2,156 2,558 3,247 3,940 4,865 6,737 12,549 15,987 18,307 20,483 23,209 25,188

11 2,603 3,054 3,816 4,575 5,578 7,584 13,701 17,275 19,675 21,920 24,725 26,757

12 3,074 3,571 4,404 5,226 6,304 8,438 14,845 18,549 21,026 23,337 26,217 28,300

13 3,565 4,107 5,009 5,892 7,042 9,299 15,984 19,812 22,362 24,736 27,688 29,820

14 4,075 4,660 5,629 6,571 7,790 10,165 17,117 21,064 23,685 26,119 29,141 31,319

15 4,601 5,229 6,262 7,261 8,547 11,037 18,245 22,307 24,996 27,488 30,578 32,801

16 5,142 5,812 6,908 7,962 9,312 11,912 19,369 23,542 26,296 28,845 32,000 34,267

17 5,697 6,408 7,564 8,672 10,085 12,792 20,489 24,769 27,587 30,191 33,409 35,719

18 6,265 7,015 8,231 9,391 10,865 13,675 21,605 25,989 28,869 31,526 34,805 37,157

19 6,844 7,633 8,907 10,117 11,651 14,562 22,718 27,204 30,144 32,852 36,191 38,582

20 7,434 8,260 9,591 10,851 12,443 15,452 23,828 28,412 31,410 34,170 37,566 39,997

21 8,034 8,897 10,283 11,591 13,240 16,344 24,935 29,615 32,671 35,479 38,932 41,401

22 8,643 9,543 10,982 12,338 14,042 17,240 26,039 30,813 33,924 36,781 40,289 42,796

23 9,260 10,196 11,689 13,091 14,848 18,137 27,141 32,007 35,173 38,076 41,638 44,181

24 9,886 10,856 12,401 13,848 15,659 19,037 28,241 33,196 36,415 39,364 42,980 45,559

25 10,520 11,524 13,120 14,611 16,473 19,939 29,339 34,382 37,653 40,647 44,314 46,928

26 11,160 12,198 13,844 15,379 17,292 20,843 30,435 35,563 38,885 41,923 45,642 48,290

27 11,808 12,879 14,573 16,151 18,114 21,749 31,528 36,741 40,113 43,195 46,963 49,645

28 12,461 13,565 15,308 16,928 18,939 22,657 32,621 37,916 41,337 44,461 48,278 50,993

29 13,121 14,257 16,047 17,708 19,768 23,567 33,711 39,088 42,557 45,722 49,588 52,336

30 13,787 14,954 16,791 18,493 20,599 24,478 34,800 40,256 43,773 46,979 50,892 53,672

35 17,192 18,509 20,569 22,465 24,797 29,054 40,223 46,059 49,802 53,203 57,342 60,275

40 20,707 22,164 24,433 26,509 29,051 33,660 45,616 51,805 55,759 59,342 63,691 66,766

45 24,311 25,901 28,366 30,612 33,350 38,291 50,985 57,505 61,656 65,410 69,957 73,166

50 27,991 29,707 32,357 34,764 37,689 42,942 56,334 63,167 67,505 71,420 76,154 79,490

55 31,735 33,571 36,398 38,958 42,060 47,611 61,665 68,796 73,312 77,381 82,292 85,749

60 35,535 37,485 40,482 43,188 46,459 52,294 66,982 74,397 79,082 83,298 88,379 91,952

65 39,383 41,444 44,603 47,450 50,883 56,990 72,285 79,973 84,821 89,177 94,422 98,105

70 43,275 45,442 48,758 51,739 55,329 61,698 77,577 85,527 90,531 95,023 100,425 104,215

75 47,206 49,475 52,942 56,054 59,795 66,417 82,858 91,062 96,217 100,839 106,393 110,286

80 51,172 53,540 57,153 60,392 64,278 71,145 88,130 96,578 101,880 106,629 112,329 116,321

85 55,170 57,634 61,389 64,749 68,777 75,881 93,394 102,079 107,522 112,393 118,236 122,325

90 59,196 61,754 65,647 69,126 73,291 80,625 98,650 107,565 113,145 118,136 124,116 128,299

95 63,250 65,898 69,925 73,520 77,818 85,376 103,899 113,038 118,752 123,858 129,973 134,247

100 67,328 70,065 74,222 77,930 82,358 90,133 109,141 118,498 124,342 129,561 135,807 140,170

110 75,550 78,458 82,867 86,792 91,471 99,666 119,608 129,385 135,480 140,917 147,414 151,949

SACHIKO ARAKI LIRA 173

TABELA A4 - DISTRIBUIÇÃO „F‟ DE SNEDECOR

Nível de significância de %1

1 1 2 3 4 5 6 7 8 12 24

2

1 4.052,18 4.999,50 5.403,35 5.624,58 5.763,65 5.858,99 5.928,36 5.981,07 6.106,32 6.234,63 6.365,83

2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,42 99,46 99,50

3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,05 26,60 26,13

4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,37 13,93 13,46

5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 9,89 9,47 9,02

6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,72 7,31 6,88

7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,47 6,07 5,65

8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,67 5,28 4,86

9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,11 4,73 4,31

10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,71 4,33 3,91

11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,40 4,02 3,60

12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,16 3,78 3,36

13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 3,96 3,59 3,17

14 8,86 6,51 5,56 5,04 4,70 4,46 4,28 4,14 3,80 3,43 3,00

15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,67 3,29 2,87

16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,55 3,18 2,75

17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,46 3,08 2,65

18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,37 3,00 2,57

19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,30 2,92 2,49

20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,23 2,86 2,42

21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,17 2,80 2,36

22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,12 2,75 2,31

23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,07 2,70 2,26

24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,03 2,66 2,21

25 7,77 5,57 4,68 4,18 3,86 3,63 3,46 3,32 2,99 2,62 2,17

26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 2,96 2,58 2,13

27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 2,93 2,55 2,10

28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 2,90 2,52 2,06

29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 2,87 2,49 2,03

30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 2,84 2,47 2,01

40

7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,66 2,29 1,80

60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,50 2,12 1,60

120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,34 1,95 1,38

6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,18 1,79 1,01

TABELAS 174

TABELA A5 - DISTRIBUIÇÃO „F‟ DE SNEDECOR

Nível de significância de %5

1 GRAUS DE LIBERDADE DO NUMERADOR

1 2 3 4 5 6 7 8 12 24

2

1 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 243,91 249,05 254,31

2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,41 19,45 19,50

3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,74 8,64 8,53

4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 5,91 5,77 5,63

5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,68 4,53 4,37

6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,00 3,84 3,67

7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,57 3,41 3,23

8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,28 3,12 2,93

9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,07 2,90 2,71

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 2,91 2,74 2,54

11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,79 2,61 2,40

12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,69 2,51 2,30

13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,60 2,42 2,21

14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,53 2,35 2,13

15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,48 2,29 2,07

16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,42 2,24 2,01

17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,38 2,19 1,96

18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,34 2,15 1,92

19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,31 2,11 1,88

20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,28 2,08 1,84

21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,25 2,05 1,81

22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,23 2,03 1,78

23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,20 2,01 1,76

24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,18 1,98 1,73

25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,16 1,96 1,71

26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,15 1,95 1,69

27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,13 1,93 1,67

28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,12 1,91 1,65

29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,10 1,90 1,64

30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,09 1,89 1,62

40

4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,00 1,79 1,51

60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 1,92 1,70 1,39

120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,83 1,61 1,25

3,84 3,00 2,61 2,37 2,21 2,10 2,01 1,94 1,75 1,52 1,01

SACHIKO ARAKI LIRA 175

TABELA A6 - DISTRIBUIÇÃO „F‟ DE SNEDECOR

Nível de significância de %10

1 GRAUS DE LIBERDADE DO NUMERADOR

1 2 3 4 5 6 7 8 12 24

2

1 39,86 49,50 53,59 55,83 57,24 58,20 58,91 59,44 60,71 62,00 63,33

2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,41 9,45 9,49

3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,22 5,18 5,13

4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,90 3,83 3,76

5 4,06 3,78 3,62 3,52 3,45 3,40 3,37 3,34 3,27 3,19 3,11

6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,90 2,82 2,72

7 3,59 3,26 3,07 2,96 2,88 2,83 2,78 2,75 2,67 2,58 2,47

8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,50 2,40 2,29

9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,38 2,28 2,16

10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,28 2,18 2,06

11 3,23 2,86 2,66 2,54 2,45 2,39 2,34 2,30 2,21 2,10 1,97

12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,24 2,15 2,04 1,90

13 3,14 2,76 2,56 2,43 2,35 2,28 2,23 2,20 2,10 1,98 1,85

14 3,10 2,73 2,52 2,39 2,31 2,24 2,19 2,15 2,05 1,94 1,80

15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,02 1,90 1,76

16 3,05 2,67 2,46 2,33 2,24 2,18 2,13 2,09 1,99 1,87 1,72

17 3,03 2,64 2,44 2,31 2,22 2,15 2,10 2,06 1,96 1,84 1,69

18 3,01 2,62 2,42 2,29 2,20 2,13 2,08 2,04 1,93 1,81 1,66

19 2,99 2,61 2,40 2,27 2,18 2,11 2,06 2,02 1,91 1,79 1,63

20 2,97 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,89 1,77 1,61

21 2,96 2,57 2,36 2,23 2,14 2,08 2,02 1,98 1,88 1,75 1,59

22 2,95 2,56 2,35 2,22 2,13 2,06 2,01 1,97 1,86 1,73 1,57

23 2,94 2,55 2,34 2,21 2,11 2,05 1,99 1,95 1,85 1,72 1,55

24 2,93 2,54 2,33 2,19 2,10 2,04 1,98 1,94 1,83 1,70 1,53

25 2,92 2,53 2,32 2,18 2,09 2,02 1,97 1,93 1,82 1,69 1,52

26 2,91 2,52 2,31 2,17 2,08 2,01 1,96 1,92 1,81 1,68 1,50

27 2,90 2,51 2,30 2,17 2,07 2,00 1,95 1,91 1,80 1,67 1,49

28 2,89 2,50 2,29 2,16 2,06 2,00 1,94 1,90 1,79 1,66 1,48

29 2,89 2,50 2,28 2,15 2,06 1,99 1,93 1,89 1,78 1,65 1,47

30 2,88 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,77 1,64 1,46

40

2,84 2,44 2,23 2,09 2,00 1,93 1,87 1,83 1,71 1,57 1,38

60 2,79 2,39 2,18 2,04 1,95 1,87 1,82 1,77 1,66 1,51 1,29

120 2,75 2,35 2,13 1,99 1,90 1,82 1,77 1,72 1,60 1,45 1,19

2,71 2,30 2,08 1,94 1,85 1,77 1,72 1,67 1,55 1,38 1,01

TABELAS 176

TABELA A7 - VALORES CRÍTICOS )cd( PARA TESTE DE LILLIERFORS

n %5 %1

4 0,381 0,417

5 0,337 0,405

6 0,319 0,364

7 0,300 0,348

8 0,285 0,331

9 0,271 0,311

10 0,258 0,294

11 0,249 0,284

12 0,242 0,275

13 0,234 0,268

14 0,227 0,261

15 0,220 0,257

16 0,213 0,250

17 0,206 0,245

18 0,200 0,239

19 0,179 0,235

20 0,190 0,231

25 0,173 0,200

30 0,161 0,187

30n n

886,0cd

n

031,1cd