Slide8 - Teoria Da Estimação

10

Click here to load reader

Transcript of Slide8 - Teoria Da Estimação

Page 1: Slide8 - Teoria Da Estimação

Estimação

PopulaçãoAmostra aleatória de

tamanho n

“Característica” da população ou parâmetro

Amostragem

Inferência estatística

“Característica” da amostra

O objetivo da inferência estatística é produzir afirmações sobre uma dada característica da população na qual estamos interessados, a partir de informações colhidas de uma parte dessa população (amostra).

População é o conjunto de indivíduos (ou objetos), tendo pelo menos uma variável comum observável.

Amostra é qualquer subconjunto de elementos da população. Em inferência estatística, no entanto, trabalhamos apenas com amostras aleatórias, onde todos os elementos da população têm a mesma probabilidade de serem escolhidos.

Qualquer valor calculado com base nos elementos de uma amostra é chamado uma estatística. Por exemplo, a média amostral, ou seja, a média dos elementos da amostra, a mediana amostral, a variância amostral etc.

As estatísticas variam de uma amostra para outra, sendo, por elas próprias, variáveis.

Exemplos de estatísticas:

média da amostra: Xn

X ii

n

1

1

proporção de elementos da amostra com uma determinada característica: P

73

Page 2: Slide8 - Teoria Da Estimação

Um parâmetro é uma medida usada para descrever uma característica da população

Símbolos mais comuns para alguns parâmetros e estatísticas:

Parâmetro Estatística

Média X

Variância 2 s2

Proporção p P

Exercício: Uma pesquisa de consumo de combustível, realizada com 100 carros, apontou o consumo semanal (em litros) de cada veículo. Obtenha uma amostra aleatória simples de tamanho n = 10.

16,0 54,7 27,7 29,2 10,7 38,9 24,3 38,2 11,8 24,083,7 10,8 17,6 31,6 27,9 20,1 36,8 39,8 11,6 22,611,9 49,8 15,5 22,5 17,6 36,7 56,1 15,8 28,8 20,920,3 20,6 48,3 26,0 76,4 56,0 18,5 44,8 37,3 51,738,9 21,7 12,6 52,9 24,6 39,7 12,1 34,4 70,4 42,822,4 21,2 14,9 20,0 12,2 27,7 28,2 43,3 40,7 43,421,9 30,2 14,6 37,0 24,3 10,5 15,1 18,0 16,2 16,135,7 41,3 13,0 11,4 16,6 31,2 14,3 38,2 11,2 30,356,5 21,6 17,1 27,3 13,5 13,6 37,3 18,3 39,4 22,012,3 23,1 34,2 13,6 34,3 91,7 81,1 39,6 15,6 54,5

Calcular o consumo médio e a variância dos carros selecionados nessa amostra aleatória simples de tamanho n = 10.

Calcular a proporção de carros dessa amostra, com consumo superior a 20 litros

Quais são os parâmetros e quais são as estatísticas neste exemplo?

74

Teorema Central do Limite: Se a população original tem uma distribuição qualquer com média e

variância 2 , para n “suficientemente grande” (na prática, quando n >30 ), então X tem distribuição aproximadamente Normal:

em que a significa aproximadamente distribuído.

Page 3: Slide8 - Teoria Da Estimação

Estimação por Intervalo

Quando estamos interessados em um determinado parâmetro de uma população, lançamos mão de uma amostra extraída dessa população e procuramos, através dessa amostra, estimar o parâmetro populacional.

Exemplo: Suponha que para um determinado exemplo obtivemos uma amostra de tamanho n = 10 e estimamos os parâmetros populacionais e 2

através dos estimadores

e ,

75

Page 4: Slide8 - Teoria Da Estimação

que produziram, para a amostra selecionada, as seguintes estimativas pontuais (são chamadas pontuais, pois são únicas para cada amostra selecionada):

e .

Vejamos agora como obter estimativas intervalares para o parâmetro de interesse, isto é, como determinar intervalos com limites que abranjam o valor do parâmetro populacional com uma margem de segurança prefixada.

Intervalo de confiança para a média populacional

População normal, variância populacional 2 conhecida

-3 -2 -1 0 1 2 3

x1 x2 x

zT zT

2

2

0 z

Mas , logo,

Sorteada uma amostra de tamanho n, encontrada sua média e supondo a variância populacional conhecida 2 , podemos construir o intervalo

76

Page 5: Slide8 - Teoria Da Estimação

chamado intervalo de 100(1)% de confiança para a média populacional .

Exemplo. Para uma amostra de 36 observações de uma população normal com variância conhecida e média desconhecida, seja

a média amostral. Construir os intervalos de 95% e 99% de confiança para .

Interpretação: Temos 95% de confiança de que o intervalo ( ; ) contenha a

média populacional . Temos 99% de confiança de que o intervalo ( ; ) contenha a

média populacional .

Exercício. A experiência com trabalhadores de uma certa indústria indica que o tempo necessário para que um trabalhador, aleatoriamente selecionado, realize uma tarefa é distribuído de maneira aproximadamente normal, com desvio padrão de 12 minutos. Em uma amostra de 25 trabalhadores, observou-se que eles levaram média de 140 minutos para realizar a tarefa. Determinar os limites de confiança de 98% para a média da população de todos os trabalhadores que realizam essa tarefa.

População normal, variância populacional 2 desconhecidaNeste caso, o intervalo de confiança é calculado utilizando-se uma nova estatística:

em que s2 é o estimador da variância populacional . Esta estatística tem distribuição t de Student com (n 1) graus de liberdade.

DISTRIBUIÇÃO t DE STUDENT

É simétrica em relação ao 0.

77

Page 6: Slide8 - Teoria Da Estimação

É semelhante à distribuição normal padrão, porém, apresenta “caudas mais grossas” do que a normal padrão.

Quando (na prática, n 30) a distribuição t tende para a normal padrão.

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

-3 -2 -1 0 1 2 3

f(z)

f(t)

Figura 1. Distribuição t de Student com 1 grau de liberdade () e distribuição normal padrão (- - -)

Nesse caso, o intervalo de confiança para a média populacional , supondo que a população tem distribuição normal com variância desconhecida é dado por:

Exemplo. O tempo de reação de um novo medicamento, por analogia a produtos similares, pode ser considerado como tendo distribuição Normal. Vinte pacientes foram sorteados, receberam o medicamento e tiveram seu tempo de reação anotado. Os resultados foram

2,9 3,4 3,5 4,1 4,6 4,7 4,5 3,8 5,3 4,94,8 5,7 5,8 5,0 3,4 5,9 6,3 4,6 5,5 6,2

Pede-se: Construir um intervalo de 95% de confiança para ;

Exercício. Um pesquisador deseja estabelecer o peso médio dos jovens entre 14 e 20 anos. Apesar de desconhecer a média e o desvio padrão da população, sabe por literatura da área que a distribuição dos pesos é aproximadamente normal. Retira-se uma amostra de 10 jovens obtendo peso

78

Page 7: Slide8 - Teoria Da Estimação

médio de 67kg e desvio padrão de 9kg. Estabeleça o intervalo de 98% de confiança para o peso médio da população.

Intervalo de confiança para a proporção populacional p

Pelo Teorema Central do Limite, para n “suficientemente grande” (na prática n30),

e utilizando-se como estimador de ,

.

Exemplo. Na observação de 30 medicamentos escolhidos aos acaso em uma determinada farmácia, verificou-se que 6 apresentavam prazo de validade vencido.a) Estimar a porcentagem de medicamentos vencidos na farmácia.b) Construir um intervalo de 95% de confiança para a porcentagem de

medicamentos vencidos nesta farmácia.c) Construir um intervalo de 99% de confiança para a porcentagem de

medicamentos vencidos nesta farmácia.Exercício. Na observação de 80 produtos alimentares em supermercado quanto ao prazo de validade, obteve-se o seguinte resultado:

Normal: 54Vencido: 26

a) Estimar a proporção de produtos dentro do prazo (prazo de validade normal).

b) Construir um intervalo de 95% de confiança para a proporção de produtos com prazo de validade normal.

Comparação entre dois intervalos de confiança

Uma organização universitária deseja estimar a porcentagem de estudantes que são favoráveis a avaliação realizada pelo Enade. Ela seleciona uma amostra de 200 estudantes, aleatoriamente, sendo 120 do sexo feminino e 80 do sexo masculino. Constatou-se que 72 estudantes do sexo feminino e 44 do

79

Page 8: Slide8 - Teoria Da Estimação

sexo masculino são favoráveis a esta avaliação.

a) Faça um intervalo de 95% de confiança para a proporção de favoráveis ao Enade, em cada sexo;

b) Pode-se afirmar que a proporção de favoráveis do sexo feminino e masculino são iguais?

80