desvio_padrao
-
Upload
rogerio-morandi -
Category
Documents
-
view
215 -
download
0
description
Transcript of desvio_padrao
Estatísticaamintas paiva
afonso
Estimativa pontualIntervalo de ConfiançaTamanho da amostra
Estimativa pontual para a média
ESTIMAR A MÉDIA DA POPULAÇÃO
Média amostral
(média das médias)
Como foi visto anteriormente a média da população é igual à média das médias
Como podemos estimar o verdadeiro valor da média da população se temos em mãos a média de uma amostra?
Intervalo de Confiança
É uma faixa de possíveis valores em torno da média amostral, e a probabilidade de que esta faixa realmente contenha o valor real da média da população
O Intervalo de confiança terá uma certa probabilidade chamada de nível de confiança (simbolizada por 1 – ) de conter a média da população.
x
1 – α/2 /2
Intervalo de confiança
1 – α = nível de confiança
α = nível de significância (probabilidade de erro)
Há uma probabilidade de 1 – da média estar contida no intervalo definido
Há uma probabilidade de a média amostral estar fora do intervalo definido (área hachurada)
Se usarmos um desvio padrão em torno da média (Z = 1), a chance de erro ao estimar a média será de 31,74%. Mas, se usarmos dois (Z = 2), a chance de erro será de 4,56%.
Intervalo de Confiança
z2z1
Erro = z . Desvio padrão amostral
nz.e intervalo
errox errox
(μ)
1)( exexP
α /2 α /2
= desvio padrão da população
1 - α = grau de confiança
Distribuição das médias amostrais
x
1 – α
Intervalo de Confiança
Se o desvio padrão da população é conhecido:
A estimativa intervalar da média populacional se baseia na hipótese de que a distribuição amostral das médias amostrais é normal. Para grandes amostras isto não apresenta dificuldade especial, pois se aplica o teorema do limite central.
Todavia, para amostras de 30 ou menos observações, é importante saber se a população tem distribuição normal ou aproximada.
XzX .:
nX
Intervalo de Confiança
Se o desvio padrão da população é desconhecido:
Quando o desvio padrão da população não é conhecido (o que é o caso, geralmente), usa-se o desvio padrão da amostra como estimativa, substituindo-se x por Sx nas equações. Isto não acarreta maiores dificuldades, pois o desvio padrão amostral dá uma aproximação bastante razoável do verdadeiro valor, na maioria dos casos.
Além disso, pelo teorema do limite central, sabemos que, quando a amostra é maior que 30, a distribuição das médias é aproximadamente normal.
Para amostras menores que 30, a aproximação normal não é adequada. Devemos então usar a distribuição t. A forma da distribuição t é bem parecida com a normal.
n
SzX X.
Intervalo de Confiança
exouexex Quando tem n > 30 e
é conhecido
Quando tem n > 30 e
σ é desconhecido
Substitui o desvio padrão
da população pelo desvio padrão da amostra s
Região Crítica
Região Crítica
Z/2Z/2
ZcríticoZcrítico
1 - α
xnX
XzX .:
nze
.
n
Sze X.
n
SzX X.
Intervalo de Confiança
X5050403020 807060Amostra1
2
3
...
45
46
47...
98
99100 =50
Se em um estudo, forem retiradas várias amostras aleatórias de tamanho n da população e que, para cada amostra, seja construído um intervalo de (1-) de confiança para a variável desejada.
Os intervalos obtidos serão diferentes, mas (1-)% destes intervalos conterão entre os seus intervalos o valor real do parâmetro.
Ao nível de 95% de confiança espera-se que em 100 intervalos para as amostras, 95 deles contenham a média μ
Interpretação:
Intervalo de Confiança
E quando o tamanho da amostra é menor que 30 (n < 30) e o desvio padrão da população () é desconhecido?
Neste caso não podemos usar a distribuição normal (a distribuição das médias não é normal).
Devemos usar a distribuição t (t de student).
A distribuição t é similar à distribuição normal, mas tem maior variação nas caudas (nas pontas da curva).
Distribuição t de Student
Distribuição t de student com n = 3
Distribuição t de student com n = 12
Distribuição normal padronizada
A curva t nos dá a probabilidade de ocorrer um evento a t desvios padrão da média (para mais ou para menos)
os valores de t (valores correspondentes à área sob a curva nas caudas) são tabelados e dependem de dois fatores:
n-1 = graus de liberdade
grau de confiança desejado (1- α)
Intervalo de Confiança
exouexex
n
ste n 1,2/
n
ste ncrítico 1,
n
ste
Quando tem n < 30 e σ é desconhecido
Substitui o desvio padrão da população pelo desvio padrão da amostra s
ouou
Intervalo de Confiança
Imagine que tivéssemos uma amostra de tamanho tão grande que tendesse ao infinito. O que ocorreria?
O erro seria próximo de zero (desconsiderável) e a média da amostra seria igual a média da população, sem a necessidade
de estimar um intervalo.
Escolha a distribuição adequada
Início
n > 30?
população tem
distr. normal?
população
é conhecido
Usar distribuição t
usar métodos não-paramétricos ou de reamostragem
sim
sim
sim
não
não
não
Pelo teorema do limite central podemos usar a distrib. normal (use s se não for conhecido)
nze
2/
usar a distribuição normal
nze
2/
n
ste n 2/,1
Exercícios
Determine o valor crítico que corresponde ao
grau de confiança indicado:
2/Z
a) 99%
b) 94%
c) 92%
d) 90%
Exercícios
Resolução:
0,01 2,58
0,10 1,65
0,08 1,75
0,06 1,88
Grau de Confiança
(1 – α)
Valor Crítico
(Z α/2)
99%
94%
92%
90%
ExercíciosUm dos principais produtos de uma indústria siderúrgica é a folha de flandres. Havia uma preocupação com a possibilidade de haver um número de folhas fora da faixa de especificação de dureza (LIE = 58,0 HR e LSE = 64,0 HR). A partir desta informação a empresa decidiu estimar a dureza média das folhas de flandres () coletando uma amostra aleatória de 49 folhas.
61,0 60,2 60,3 60,3 60,0 61,0 60,360,0 60,0 60,9 61,0 61,2 59,2 60,960,0 60,5 59,8 59,3 61,0 59,6 59,859,6 60,1 58,0 59,8 58,9 57,6 58,060,5 60,1 61,6 61,1 59,7 58,3 61,659,5 59,0 60,3 58,7 59,6 54,2 60,361,0 59,7 59,9 59,9 60,0 58,6 59,9
Medidas de dureza (HR) das folhas-de-flandres fabricadas pela siderúrgica
61,0
21,60
s
X
Para um grau de confiança de 95%, determine a margem de erro (E) e o intervalo de confiança para média populacional ().
Exercícios
49
61,0
21,60
n
s
X
n
sZE
2
Margem de erro:
17,01708,049
61,0.96,1 E
Dados:
Grau de confiança de 95% implica em: 1 – = 95%,
logo α = 5% = 0,05 e α/2 = 0,025. Z α/2 = Z0,025 = 1,96
-Z/2Z/2
1 - α
0
/2 /2
Exercícios
ExEx Intervalo de confiança:
17,021,6017,021,60
[60,04 ; 60,38]HR
Interpretação:
Se fôssemos selecionar muitas amostras de 49 elementos da produção de folhas e construíssemos um intervalo de 95% de confiança para cada amostra, 95% desses intervalos conteriam a média populacional .
38,6004,60
Exercícios
Uma máquina automática de suco industrial é regulada de modo que a quantidade suprida de cada vez, tenha distribuição aproximadamente normal com desvio-padrão de 35ml. Determine um intervalo de 96% de confiança para a quantidade média de toda produção, sabendo que uma amostra de 30 embalagens teve um conteúdo médio de 290 ml.
mls
mlX
35
290
n = 30
n
sZE .
2
10,1330
35.05,2 E
Grau de confiança de 96% implica em:1 - = 96% = 4% = 0,04
05,202,0
2
ZZ
ExEx 10,1329010,13290
[276,90 ; 303,10] ml
Dados:
-Z/2Z/2
1 - α
0
/2 /2
10,30390,276
Cálculo do Tamanho da Amostra• O conceito de nível de confiança pode ser utilizado para o cálculo do tamanho da amostra, necessário para fazermos inferências confiáveis.
• Se a amostra empregada for muito pequena, a margem de erro será grande, o que impossibilita ou inviabiliza a tomada de decisão.
• Por outro lado, se a amostra for muito grande, o intervalo obtido pode ser mais estreito do que o necessário (gastos desnecessários);
Como o tamanho da amostra afeta o erro de amostragem?
2
2/ .
E
sZn
n
sZE .
2
Cálculo do Tamanho da Amostra
500 1000 1500 2000 2500 3000
Tamanho da amostra
Mar
gem
de
erro
(E
)
0,5
1,0
1,5
3,0
2,0
2,5
Tamanho de amostra e margens de erromantendo fixos (s=10 e 95% de confiança)
• Os ganhos em precisão conseguidos com aumentos fixos dos tamanhos das amostras não são constantes;• Tamanho de amostra 5.000 podem ser um perda de tempo e dinheiro porque elas fornecem pouca precisão adicional;
Exercícios
Em um estudo para a determinação do perfil dos alunos da Faculdade Pitágoras, a característica de maior interesse tem s = 0,3. Qual deve ser o tamanho da amostra para que tenhamos 95% de confiança em que o erro da estimativa da correspondente a esta característica não supere 0,05?
2
2/ .
E
sZn
13905,0
)3,0).(96,1(.22
2/
E
sZn
Dados:E = 0,05s = 0,3 =0,05
Refaça o cálculo supondo que se deseja ter 98% de confiança.
Conclusões
• Intervalos de confiança são muito mais informativos do que as estimativas pontuais;
• Toda estimativa intervalar está associada a um grau de confiança;
• Quando se tem n < 30 ou não se conhece o desvio-padrão da população usamos a distribuição t.
Referência Bibliográfica
Triola – Introdução a Estatística, p.144-158;Stevenson - Estatística aplicada à AdministraçãoSlack – Estatística para Administração; p. 262-277.Soares et al.; - Introdução a Estatística; p.132 –155
Estimativa pontual para proporção
• A estimativa de proporções populacionais é muito semelhante à de médias populacionais;
Estimadores
Estimativa pontual de uma proporção
Estimativa intervalar de uma proporção
• 21% das peças são defeituosas;•45% dos eleitores votariam novamente no Presidente Lula
• Entre 18 e 23% das peças são defeituosas;• A proporção de votos para reeleição do Presidente está entre 15 a 25%.
• A média de uma distribuição amostral de proporções amostrais é sempre igual a verdadeira proporção da população.
Intervalo de Confiança
O QUE É PROPORÇÃO?
Num lote de 1000 peças foram encontradas 150 peças defeituosas, logo
Proporção de peças defeituosas é P = (150/1000)*100 = 15%
Existem 15% de peças defeituosas no lote.
O que podemos falar sobre esta proporção na população?
Nos outros lotes a proporção é a mesma? Possivelmente serão diferentes.
Precisamos estimar
Intervalo de confiança
Estimativa pontual para a média
Sendo:
π = p = proporção da população
= proporção média das proporções amostrais (x/n)
= 1-
n
qpze
ˆˆ2/
eppep
epp
ˆˆ
ˆ
Erro
Intervalo de confiança1- α = grau de confiança
α = nível de significância (probabilidade de erro)
Desvio padrão da distribuição das médias das proporções
n
qpp
ˆˆ
p̂
q̂ p̂
Intervalo de Confiança
Estimativa pontual Estimativa intervalar
n
xp ˆ
O estimador da proporção amostral:
Sendo X o número de elementos da amostra (n)
que apresenta a característica de estudo;
O erro-padrão da estimativa:
n
qppEP
ˆ.ˆ)( pq ˆ1ˆ
Sendo:
n
qpZp
ˆ.ˆ.ˆ
2
• Intervalo de (1-)% de confiança;
• Supondo amostras grandes (n > 40);
• Se população for finita e n > 5% de N:
1
.ˆ.ˆ
.ˆ2 N
nN
n
qpZp
22
2
ˆ.ˆ
E
qpZn
Para o cálculo do tamanho da
amostra:
A proporção populacional é igual a proporção amostral!
Intervalo de Confiança
Populações grandes ou infinitas
Não há necessidade de reposição
Probabilidades de cada prova é constante
Populações finitas ou quando amostra é superior a 5% da
população ( n/ N > 5%)
Não se faz a reposição;
A probabilidade de cada prova varia
Os desvios padrões das distribuições amostrais devem ser multiplicados pelo fator de correção finita
N – população
n - amostra1
N
nN
Correções p/ Populações Finitas
Desvio padrão das médias amostrais
Desvio padrão das proporções amostrais
1
N
nN
nx
1
ˆˆ
N
nN
n
qpp
Exercícios
Uma amostra de 200 observações acusou 20 baterias defeituosas numa remessa. Usando uma confiança de 99%, determine o erro de estimação máximo provável.
10,0200
20ˆ
n
xp 90,010,01ˆ1ˆ pq
0547,0200
)90,0).(10,0(58,2
ˆ.ˆ.)ˆ(
2
n
qpZpE
Grau de confiança de 95% implica em:1 - = 99% = 1% = 0,010
58,2005,0
2
ZZ
5,47%
Exercícios
Um fabricante de cintos de segurança deseja estimar a probabilidade dos cintos resistirem a um esforço. Como o teste é destrutível, ele deseja manter o tamanho da amostra o menor possível. Determine o número de observações que devem ser feitas para estimar a probabilidade a menos de 0,04 com 95% de confiança, se ele crê (baseando-se em experimentos anteriores) que a percentagem de defeituosos não supere a 6%.
1364,13504,0
)94,0.(06,0.96,1
ˆ.ˆ2
22
2
E
qpZn
ExercíciosQual o tamanho da amostra necessária para estimar o tempo médio que um vendedor de uma loja de móveis gasta com cada cliente, a menos de 2 minutos do verdadeiro valor, para obter um nível de confiança de 99% de confiança? Suponha o desvio da população igual a 12 minutos (obs.: sempre arredondamos a resposta para o próximo número inteiro superior.)
24063,2392
)12).(58,2(.22
2/
E
Zn
E = 2 minutos
= 12 minutos
Grau de confiança de 99% implica em:1 - = 99% = 1% = 0,01 58,20050,0
2
ZZ
ExercíciosA Polícia Rodoviária faz mensalmente uma pesquisa para avaliar a velocidade desenvolvida nas rodovias durante o período de 2 às 4 horas da madrugada. Num período de observação e em um trecho específico, 100 carros passaram por um aparelho de radar a uma velocidade média de 115 Km/h, com desvio padrão de 10 Km/h. a) Estime a verdadeira média (estimativa pontual) da população;b) Construa um intervalo de 98% de confiança para a média da população;
115 Km/h
33,2100
10.33,2.
2
n
sZE
Margem de erro:
Grau de confiança de 98% implica em:1 - = 98% = 2% = 0,02
33,201,0
2
ZZ ExEx Intervalo de confiança
33,211533,2115
[112,67 ;117,33]Km/h
ExercíciosUma amostra aleatória de 40 contas não-comerciais na filial de um banco acusou saldo médio de R$140,00 com desvio-padrão de R$30,00.a) Construa um intervalo de 95% confiança para a verdadeira média.b) Construa um intervalo de 99% confiança para a verdadeira média.c) A que conclusão podemos chegar com os resultados das letras anteriores?
30,940
30.96,1.
2
n
sZE
Margem de erro:
96,1025,0
2
ZZ
Intervalo de confiança
30,914030,9140
[130,70 ; 149,30] R$
24,1240
30.58,2.
2
n
sZE
Margem de erro:
58,2005,0
2
ZZ
Intervalo de confiança
24,1214024,12140
[127,76 ; 152,24]R$
140+9,30 140+12,24
ExercíciosUm grupo de pesquisa de mercado constatou que 25% dos 200 fregueses recentemente entrevistados num grande shopping center de Belo Horizonte residem a mais de 5 Km deste local.a) Construa um intervalo de 95% de confiança para a percentagem efetiva de fregueses que moram a mais de 5 km do Shopping Center;b) Qual é o erro provável máximo associado ao intervalo?
25,0ˆ n
Xp
0600,0200
)75,0).(25,0(.96,1
ˆ.ˆ
2
n
qpZE
310,0190,0
0600,0250,00600,0250,0
ˆˆ
p
p
EppEp Intervalo de
confiança
75,025,01ˆ1ˆ pq
Erro máximo 6%.
Estimativa pontual para a médiaA Biblioteca da faculdade deseja estimar a percentagem de livros de seu acervo que são publicados até 1995. Qual deve ser o tamanho da amostra aleatória para se ter 90% de confiança de ficar menos de 5% da verdadeira proporção?
27325,27205,0
)5,01.(5,0.65,1
ˆ.ˆ2
22
2
2
E
qpZn
Grau de confiança de 90% implica em:1 - = 90% = 10% = 0,10
65,105,0
2
ZZ
Quando, o enunciado do problema não contém informação sobre o tamanho possível da proporção populacional, os cálculos devem basear-se no intervalo mais amplo possível, o que ocorre quando o valor amostral da proporção é igual à: 50,0ˆ p
A proporção de uma amostra piloto seria uma 2ª opção
www.matematiques.com.bramintas paiva
afonso