Aula parte6 distribuicao_amostral

44
DISTRIBUIÇÃO AMOSTRAL

Transcript of Aula parte6 distribuicao_amostral

Page 1: Aula parte6 distribuicao_amostral

DISTRIBUIÇÃO AMOSTRAL

Page 2: Aula parte6 distribuicao_amostral

Com a média de uma amostra extraída de uma população será estimada a média dessa população.

Entretanto, de uma mesma população pode-se tomar muitas amostras diferentes do mesmo tamanho.

A principal preocupação numa inferência estatística é obter conclusões sobre a população.

Por exemplo:

Page 3: Aula parte6 distribuicao_amostral

Na determinação da vida média de uma lâmpada fluorescente especificada pelo fabricante fazem parte: Do controle de qualidade da empresa.

Se a vida média das lâmpadas fluorescentes de uma amostra retirada de um lote de produção não atender à especificação estabelecida, então o lote deverá ser rejeitado.

Do órgão de defesa do consumidor. Se a vida média das lâmpadas fluorescentes da amostra

retirada de diversos pontos de venda atender à especificação do fabricante, então a reclamação dos consumidores não deverá ser aceita.

Page 4: Aula parte6 distribuicao_amostral

Avaliação de um novo produto. Antes de seu lançamento, em muitos casos, o novo

produto é distribuído a um grupo de consumidores potenciais que respondem um questionário.

Se os resultados dos questionários mostrarem que o novo produto foi bem aceito, então o grupo de marketing terá suporte para defender o lançamento desse novo produto.

Page 5: Aula parte6 distribuicao_amostral

Previsão do tempo médio de espera dos clientes no caixa de um banco. Se o tempo médio de espera de uma amostra de clientes

for maior que o tempo médio afirmado pelo gerente da agência, então será bastante provável que as reclamações dos clientes tenham fundamento.

Page 6: Aula parte6 distribuicao_amostral

Um denominador comum nos três casos apresentados é que as decisões que deverão ser tomadas serão apoiadas em informações incompletas.

No dia-a-dia, estamos acostumados a tomar decisões com informações incompletas baseadas na própria experiência ou em amostras. Por exemplo, o procedimento de degustar uma porção de

fruta ou queijo antes de comprar. Ao aprovar a amostra degustada e comprar uma

quantidade da fruta ou do queijo, estamos aceitando que o resto do lote de fruta ou peça de queijo tem a mesma característica que apreciamos na amostra.

A experiência mostra que é mais fácil acertar no caso do queijo que no da fruta, salvo que o pedaço de queijo comprado seja de outra peça não amostrada.

Seja qual for a decisão tomada, estará sendo aplicada a distribuição das médias das amostras.

Page 7: Aula parte6 distribuicao_amostral

Parâmetro é uma medida numérica que descreve uma população.

Estatística é uma medida numérica que descreve uma amostra.

Page 8: Aula parte6 distribuicao_amostral

Exemplo

A coordenadora do ensino de primeiro grau tem interesse em conhecer a estatura média dos alunos da primeira série da rede escolar.

Se a variável estatura estivesse registrada no cadastro dos alunos seria fácil calcular a média das estaturas dos alunos da primeira série, entretanto, essa informação não está disponível.

Uma tentativa de alcançar o objetivo é estimar a média de todos os alunos utilizando a média de uma amostra dos alunos da primeira série, tendo presente que essa amostra será representativa da população; isto é, a amostra possuirá características similares às que seriam observadas na população se estivesse disponível.

Page 9: Aula parte6 distribuicao_amostral

Para testar a idéia, a coordenadora preparou dez funcionários com a tarefa individual de selecionar aleatoriamente trinta alunos da primeira série da escola designada, medir a estatura dos trinta alunos e finalmente calcular e registrar a média dessa amostra.

Terminada a tarefa, a coordenadora receberá as dez médias amostrais

que, em geral, serão diferentes entre si devido à variabilidade amostral. Além disso, essas dez médias deverão ser diferentes da média da população.

1021 ,,, XXX

Page 10: Aula parte6 distribuicao_amostral

Analisemos o resultado da tarefa dos dez funcionários: O parâmetro média da população é um valor único e

desconhecido. A estatística média da amostra é um valor conhecido, porém

pode variar de amostra para amostra. Se os dez funcionários realizarem novas amostragens aleatórias

do mesmo tamanho, as médias das novas amostras não deverão ser iguais às dez primeiras.

Apesar de a média da população não ter mudado, a média da amostra dependerá de cada amostra.

Page 11: Aula parte6 distribuicao_amostral

Com as médias das amostras, é possível construir a distribuição de freqüências das médias das amostras, denominada distribuição amostral, cuja média denomina-se média amostral e seu desvio padrão, erro padrão.

Embora os parâmetros média e desvio padrão da população não sejam conhecidos, para ajudar na compreensão da distribuição amostral, inicialmente, esses parâmetros serão considerados como conhecidos.

Page 12: Aula parte6 distribuicao_amostral
Page 13: Aula parte6 distribuicao_amostral
Page 14: Aula parte6 distribuicao_amostral
Page 15: Aula parte6 distribuicao_amostral
Page 16: Aula parte6 distribuicao_amostral
Page 17: Aula parte6 distribuicao_amostral

O desvio padrão é conhecido como erro amostral.

Page 18: Aula parte6 distribuicao_amostral
Page 19: Aula parte6 distribuicao_amostral

O erro padrão da distribuição das médias amostrais diminui quando aumenta o tamanho da amostra n.

Isso significa que à medida que n aumenta e mais informações são utilizadas, a média da amostra se aproxima da média da população, como pode-se ver na expressão do erro padrão.

nXσ=σ

Page 20: Aula parte6 distribuicao_amostral

FORMA DA DISTRIBUIÇÃO AMOSTRAL

Ao estudar as medidas estatísticas descritivas, foi observado que a forma da distribuição da variável é importante.

A distribuição amostral do Exemplo 10.1 é simétrica, embora a distribuição da população seja uniforme.

De forma geral, a forma da distribuição amostral depende da forma da distribuição da população.

Se a distribuição da população for normal N(µ, σ), a distribuição da média amostral também será normal,

seja qual for o tamanho n da amostra.

)/,( nN σµ

Page 21: Aula parte6 distribuicao_amostral

Se a distribuição da população não for normal, à medida que o tamanho da amostra aumentar, a distribuição da média amostral se aproximará da distribuição normal.

De acordo com o teorema central do limite, a distribuição das médias de amostras de tamanho suficientemente grande poderá ser considerada como normal,

seja qual for a forma da distribuição da população.

)/,( nN σµ

Page 22: Aula parte6 distribuicao_amostral
Page 23: Aula parte6 distribuicao_amostral

O teorema central do limite é muito importante, pois permite utilizar a distribuição normal para realizar inferências da média amostral, seja qual for a forma da distribuição da população.

Como aplicação prática, podemos dizer que a soma de um número de efeitos aleatórios, sem dominância de nenhum deles sobre o resultado total, produz uma variável aleatória com distribuição normal. Por exemplo:

Um cabo de aço trançado utilizado num elevador é formado por muitos fios de aço que adequadamente entrelaçados conferem uma forte resistência ao cabo, cuja capacidade é igual à soma das capacidades individuais dos fios de aço. Se o número de fios que formam o cabo for

adequadamente grande, mesmo que a distribuição da capacidade dos fios de aço não seja normal, a distribuição da capacidade do cabo será normal.

Page 24: Aula parte6 distribuicao_amostral

SIMULADOR O teorema central do limite pode ser verificado na prática

realizando simulações repetidas de um experimento, como o lançamento de um dado que tem seis resultados possíveis {1, 2, 3, 4, 5, 6} com a mesma probabilidade 1/6 de ocorrer.

O histograma desse experimento mostra que sua distribuição de freqüências é discreta e uniforme com média igual a 3,50, variância 2,917 e desvio padrão 1,71.

Page 25: Aula parte6 distribuicao_amostral

O simulador permite realizar simulações para três tamanhos de amostra, n=15, 30 e 50 resultados aleatórios de um dado obtidos com a fórmula =ARRED(ALEATÓRIO()*(6-1)+1;0) registrada em cada célula da tabela de trinta lançamentos de um dado repetido cinco mil vezes.

A última coluna da tabela registra a média de cada lançamento de n=15, 30 e 50 dados. Cada vez que o botão Simulação é pressionado, o modelo atualiza os seguintes resultados para o tamanho n previamente definido: Calcula a média e o desvio padrão das médias amostrais,

intervalo de células C10:F11. Calcula a tabela de freqüências absolutas e apresenta o

histograma de 200, 500, 1.000 e 5.000 lançamentos de n=15, 30 e 50 dados, como mostra o slide seguinte no caso de n=30.

Page 26: Aula parte6 distribuicao_amostral
Page 27: Aula parte6 distribuicao_amostral

Os quatro histogramas mostram que, ao aumentar o número de simulações, acentua-se a concentração das médias amostrais ao redor da média da população.

Também se for aumentado o tamanho da amostra para n=50 essa concentração ao redor da média começa a perceber-se com menos simulações, confirmando que à medida que n aumenta têm-se mais informações, como mostra o slide seguinte.

Page 28: Aula parte6 distribuicao_amostral
Page 29: Aula parte6 distribuicao_amostral

Repetindo o que já foi apresentado: A soma de um número de efeitos aleatórios, sem

dominância de nenhum deles sobre o resultado total, produz uma variável aleatória com distribuição normal.

Page 30: Aula parte6 distribuicao_amostral

FATOR DE CORREÇÃO FINITA

As premissas incluídas nas expressões apresentadas estabelecem que a população é suficientemente grande, os valores da amostra são independentes e a amostragem é realizada com reposição.

Se numa população pequena for realizada uma amostragem sem reposição de tamanho maior que 5% do tamanho da população, no cálculo do erro padrão deverá ser incluído o fator de correção finita

1−−

NnN

Page 31: Aula parte6 distribuicao_amostral
Page 32: Aula parte6 distribuicao_amostral

A tabela seguinte mostra valores do coeficiente de correção finita em função do tamanho n da amostra numa população de tamanho N=1.000.

Page 33: Aula parte6 distribuicao_amostral

UTILIZAÇÃO

Quanto maior for o tamanho n da amostra, mais a média amostral se aproximará da média da população, pois à medida que n aumenta, o erro padrão diminui e no limite, quando n tender à própria população, o erro padrão tenderá a zero.

As propriedades da distribuição amostral asseguram que a média de uma amostra é uma boa estatística para inferir sobre a média da população µ da qual foi extraída.

Ao mesmo tempo, o teorema central do limite estabelece que se o tamanho da amostra n for suficientemente grande a distribuição da média amostral será normal, qualquer que seja a forma da distribuição da população.

Portanto, o teorema central do limite permite aplicar a distribuição normal para obter respostas da média de uma amostra de tamanho suficientemente grande retirada de uma população qualquer.

Page 34: Aula parte6 distribuicao_amostral
Page 35: Aula parte6 distribuicao_amostral
Page 36: Aula parte6 distribuicao_amostral
Page 37: Aula parte6 distribuicao_amostral
Page 38: Aula parte6 distribuicao_amostral

Qual o significado da probabilidade 6,68%? Tendo presente que a distribuição amostral fornece a distribuição

teórica de todas as possíveis amostras de tamanho nove, a probabilidade 6,68% é a proporção de amostras de tamanho nove que têm media menor ou igual a 149,75 centímetros cúbicos.

Page 39: Aula parte6 distribuicao_amostral
Page 40: Aula parte6 distribuicao_amostral

Qual o significado da probabilidade 0,62%? Considerando que a distribuição amostral fornece a distribuição

teórica de todas as possíveis amostras de tamanho vinte e cinco, a probabilidade 0,62% é a proporção de amostras de tamanho nove que têm media menor ou igual a 149,75 centímetros cúbicos.

Page 41: Aula parte6 distribuicao_amostral

A probabilidade 0,62% confirma que o volume de enchimento realizado pela máquina automática é de 150 centímetros cúbicos? Vejamos: Se for retirado apenas um único frasco de detergente como

amostra, a probabilidade de o volume desse frasco ser menor ou igual a 149,75 centímetros cúbicos é 30,85%, resultado obtido com a fórmula =DIST.NORM(149,75;150;0,5;VERDADEIRO). A probabilidade 30,85% é bastante alta comparada às probabilidades com a média de uma amostra dos exemplos anteriores.

Page 42: Aula parte6 distribuicao_amostral

A probabilidade 6,68% da amostra do Exemplo 10.3 não é suficiente para afirmar que a máquina esteja enchendo realmente com média igual a 150, pois a proporção de amostras de tamanho nove com media menor ou igual a 149,75 centímetros cúbicos não é pequena.

A probabilidade da amostra do Exemplo 10.4 é pequena, o que nos leva a aceitar que o volume médio de enchimento da máquina seja 150.

A aceitação do volume de enchimento da máquina automática depende do tamanho da amostra n, pois quanto maior for n, maior será a chance de aceitação.

Page 43: Aula parte6 distribuicao_amostral
Page 44: Aula parte6 distribuicao_amostral

Modelo Distribuição Amostral