Slide8 - Teoria Da Estimação
Click here to load reader
-
Upload
leuca-run-antis-run -
Category
Documents
-
view
2 -
download
0
Transcript of Slide8 - Teoria Da Estimação
Estimação
PopulaçãoAmostra aleatória de
tamanho n
“Característica” da população ou parâmetro
Amostragem
Inferência estatística
“Característica” da amostra
O objetivo da inferência estatística é produzir afirmações sobre uma dada característica da população na qual estamos interessados, a partir de informações colhidas de uma parte dessa população (amostra).
População é o conjunto de indivíduos (ou objetos), tendo pelo menos uma variável comum observável.
Amostra é qualquer subconjunto de elementos da população. Em inferência estatística, no entanto, trabalhamos apenas com amostras aleatórias, onde todos os elementos da população têm a mesma probabilidade de serem escolhidos.
Qualquer valor calculado com base nos elementos de uma amostra é chamado uma estatística. Por exemplo, a média amostral, ou seja, a média dos elementos da amostra, a mediana amostral, a variância amostral etc.
As estatísticas variam de uma amostra para outra, sendo, por elas próprias, variáveis.
Exemplos de estatísticas:
média da amostra: Xn
X ii
n
1
1
proporção de elementos da amostra com uma determinada característica: P
73
Um parâmetro é uma medida usada para descrever uma característica da população
Símbolos mais comuns para alguns parâmetros e estatísticas:
Parâmetro Estatística
Média X
Variância 2 s2
Proporção p P
Exercício: Uma pesquisa de consumo de combustível, realizada com 100 carros, apontou o consumo semanal (em litros) de cada veículo. Obtenha uma amostra aleatória simples de tamanho n = 10.
16,0 54,7 27,7 29,2 10,7 38,9 24,3 38,2 11,8 24,083,7 10,8 17,6 31,6 27,9 20,1 36,8 39,8 11,6 22,611,9 49,8 15,5 22,5 17,6 36,7 56,1 15,8 28,8 20,920,3 20,6 48,3 26,0 76,4 56,0 18,5 44,8 37,3 51,738,9 21,7 12,6 52,9 24,6 39,7 12,1 34,4 70,4 42,822,4 21,2 14,9 20,0 12,2 27,7 28,2 43,3 40,7 43,421,9 30,2 14,6 37,0 24,3 10,5 15,1 18,0 16,2 16,135,7 41,3 13,0 11,4 16,6 31,2 14,3 38,2 11,2 30,356,5 21,6 17,1 27,3 13,5 13,6 37,3 18,3 39,4 22,012,3 23,1 34,2 13,6 34,3 91,7 81,1 39,6 15,6 54,5
Calcular o consumo médio e a variância dos carros selecionados nessa amostra aleatória simples de tamanho n = 10.
Calcular a proporção de carros dessa amostra, com consumo superior a 20 litros
Quais são os parâmetros e quais são as estatísticas neste exemplo?
74
Teorema Central do Limite: Se a população original tem uma distribuição qualquer com média e
variância 2 , para n “suficientemente grande” (na prática, quando n >30 ), então X tem distribuição aproximadamente Normal:
em que a significa aproximadamente distribuído.
Estimação por Intervalo
Quando estamos interessados em um determinado parâmetro de uma população, lançamos mão de uma amostra extraída dessa população e procuramos, através dessa amostra, estimar o parâmetro populacional.
Exemplo: Suponha que para um determinado exemplo obtivemos uma amostra de tamanho n = 10 e estimamos os parâmetros populacionais e 2
através dos estimadores
e ,
75
que produziram, para a amostra selecionada, as seguintes estimativas pontuais (são chamadas pontuais, pois são únicas para cada amostra selecionada):
e .
Vejamos agora como obter estimativas intervalares para o parâmetro de interesse, isto é, como determinar intervalos com limites que abranjam o valor do parâmetro populacional com uma margem de segurança prefixada.
Intervalo de confiança para a média populacional
População normal, variância populacional 2 conhecida
-3 -2 -1 0 1 2 3
x1 x2 x
zT zT
2
2
0 z
Mas , logo,
Sorteada uma amostra de tamanho n, encontrada sua média e supondo a variância populacional conhecida 2 , podemos construir o intervalo
76
chamado intervalo de 100(1)% de confiança para a média populacional .
Exemplo. Para uma amostra de 36 observações de uma população normal com variância conhecida e média desconhecida, seja
a média amostral. Construir os intervalos de 95% e 99% de confiança para .
Interpretação: Temos 95% de confiança de que o intervalo ( ; ) contenha a
média populacional . Temos 99% de confiança de que o intervalo ( ; ) contenha a
média populacional .
Exercício. A experiência com trabalhadores de uma certa indústria indica que o tempo necessário para que um trabalhador, aleatoriamente selecionado, realize uma tarefa é distribuído de maneira aproximadamente normal, com desvio padrão de 12 minutos. Em uma amostra de 25 trabalhadores, observou-se que eles levaram média de 140 minutos para realizar a tarefa. Determinar os limites de confiança de 98% para a média da população de todos os trabalhadores que realizam essa tarefa.
População normal, variância populacional 2 desconhecidaNeste caso, o intervalo de confiança é calculado utilizando-se uma nova estatística:
em que s2 é o estimador da variância populacional . Esta estatística tem distribuição t de Student com (n 1) graus de liberdade.
DISTRIBUIÇÃO t DE STUDENT
É simétrica em relação ao 0.
77
É semelhante à distribuição normal padrão, porém, apresenta “caudas mais grossas” do que a normal padrão.
Quando (na prática, n 30) a distribuição t tende para a normal padrão.
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
-3 -2 -1 0 1 2 3
f(z)
f(t)
Figura 1. Distribuição t de Student com 1 grau de liberdade () e distribuição normal padrão (- - -)
Nesse caso, o intervalo de confiança para a média populacional , supondo que a população tem distribuição normal com variância desconhecida é dado por:
Exemplo. O tempo de reação de um novo medicamento, por analogia a produtos similares, pode ser considerado como tendo distribuição Normal. Vinte pacientes foram sorteados, receberam o medicamento e tiveram seu tempo de reação anotado. Os resultados foram
2,9 3,4 3,5 4,1 4,6 4,7 4,5 3,8 5,3 4,94,8 5,7 5,8 5,0 3,4 5,9 6,3 4,6 5,5 6,2
Pede-se: Construir um intervalo de 95% de confiança para ;
Exercício. Um pesquisador deseja estabelecer o peso médio dos jovens entre 14 e 20 anos. Apesar de desconhecer a média e o desvio padrão da população, sabe por literatura da área que a distribuição dos pesos é aproximadamente normal. Retira-se uma amostra de 10 jovens obtendo peso
78
médio de 67kg e desvio padrão de 9kg. Estabeleça o intervalo de 98% de confiança para o peso médio da população.
Intervalo de confiança para a proporção populacional p
Pelo Teorema Central do Limite, para n “suficientemente grande” (na prática n30),
e utilizando-se como estimador de ,
.
Exemplo. Na observação de 30 medicamentos escolhidos aos acaso em uma determinada farmácia, verificou-se que 6 apresentavam prazo de validade vencido.a) Estimar a porcentagem de medicamentos vencidos na farmácia.b) Construir um intervalo de 95% de confiança para a porcentagem de
medicamentos vencidos nesta farmácia.c) Construir um intervalo de 99% de confiança para a porcentagem de
medicamentos vencidos nesta farmácia.Exercício. Na observação de 80 produtos alimentares em supermercado quanto ao prazo de validade, obteve-se o seguinte resultado:
Normal: 54Vencido: 26
a) Estimar a proporção de produtos dentro do prazo (prazo de validade normal).
b) Construir um intervalo de 95% de confiança para a proporção de produtos com prazo de validade normal.
Comparação entre dois intervalos de confiança
Uma organização universitária deseja estimar a porcentagem de estudantes que são favoráveis a avaliação realizada pelo Enade. Ela seleciona uma amostra de 200 estudantes, aleatoriamente, sendo 120 do sexo feminino e 80 do sexo masculino. Constatou-se que 72 estudantes do sexo feminino e 44 do
79
sexo masculino são favoráveis a esta avaliação.
a) Faça um intervalo de 95% de confiança para a proporção de favoráveis ao Enade, em cada sexo;
b) Pode-se afirmar que a proporção de favoráveis do sexo feminino e masculino são iguais?
80