Aula 9 - Amostragem, probabilidade, distribuição binomial 1 Tópicos iniciais de amostragem.
Amostragem - pmbortolon.wdfiles.compmbortolon.wdfiles.com/local--files/home/Aula 3_Amostragem.pdf A...
Transcript of Amostragem - pmbortolon.wdfiles.compmbortolon.wdfiles.com/local--files/home/Aula 3_Amostragem.pdf A...
Amostragem
Fonte: CORRAR, L. J.; THEÓPHILO, C. R.; Pesquisa Operacional
para Decisão em Contabilidade e Administração,
Editora Atlas, São Paulo, 2ª. Edição, 2010.
Objetivos:
Neste capítulo, você aprenderá:
A distinguir entre diferentes métodos de amostragem
Compreender o processo de obtenção de amostras
aleatórias
Reconhecer as aplicações da teoria da amostragem
em áreas do conhecimento tais como finanças,
auditoria, contabilidade, marketing, etc…
Utilizar a amostragem como instrumento auxiliar
nos campos científico e profissional.
População
População: é o “todo”
Também designado universo
Podem ser indivíduos, firmas, produtos manufaturados,
inventários, escolas, notas de aula, preços ou qualquer coisa que
possa ser mensurada, contada ou ordenada por postos;
Podem ser finitas ou infinitas;
Finitas: os produtos de um supermercado, os livros de uma biblioteca
Infinitas: produção futura de uma fábrica, nascimentos de insetos,
extrações com reposição de bolas de uma urna. Consistem
tipicamente em um processo que gera itens.
Refere-se a um conjunto específico de circunstâncias;
Ex: os alunos de uma sala de aula podem representar uma população
da qual extrairemos amostras para análise; em outra situação os
alunos da mesma sala de aula podem ser uma amostra de todos os
alunos do colégio, ou de toda a universidade.
Amostra
É a parcela do grupo que é examinada
População
Amostra
Estatística: Prof. André Carvalhal
Censo x Amostra
Censo: envolve estudar TODOS os elementos da população
Quando a amostragem é mais vantajosa:
Quando a população é infinita (processos que nunca
terminam)
A amostra pode ser mais atualizada que o censo
Quando a população tende a se modificar com o tempo
Quando a população tende a se deteriorar (ex: frutas
perecíveis, pesquisa em propagação de doenças)
Testes destrutivos (lâmpadas, munição, resistência de
concreto)
Quando o custo do censo é proibitivo
Quando o censo puder ter problemas de precisão (vários
agentes coletores aumentam a chance de erros)
Censo x Amostra
Quando o censo é mais vantajoso:
Quando a população é pequena
Quando o tamanho da amostra é grande em
relação ao da população. Ex: quando há grande
variabilidade na população a amostra terá que
ser grande para ser representativa, neste caso o
custo adicional para realizar o censo pode ser
pequeno
Se é necessário precisão completa Ex:
contagem de dinheiro em guichês de bancos
Tipos de Métodos de Amostragens
Amostra não-probabilística (ou não aleatória):
Os itens ou indivíduos são selecionados sem conhecer suas
respectivas probabilidades de seleção
As teorias da estatística inferencial não se aplicam
Exemplos de métodos: amostragem por conveniência e
amostragem por julgamento
Podem trazer problema de viés
Amostra probabilística (ou aleatória):
Itens selecionados com base em probabilidades conhecidas
Permite que se faça inferências isentas de viés
Na prática é difícil ou quase impossível obtê-la...
... mas você deve tentar e reconhecer eventuais vieses da
sua seleção.
Vantagens e Desvantagens
Vantagens Desvantagens
Aleatória
• a subjetividade do investigador não
interfere na escolha da amostra
• dificuldade de obter listagens
completas da população
• possibilidade de definir o tamanho da
amostra a partir da precisão e grau de
confiança desejado
• a seleção aleatória pode gerar amostra
dispersa geograficamente aumentando
os custos do estudo
Não aleatória
• menor custo • há unidades no universo que não tem
possibilidade de serem escolhidos
• menor necessidade de pessoal • pode ocorrer viés de opinião pessoal
• menor tempo de estudo • não se sabe com que grau de
confiança as conclusões obtidas podem
ser inferidas da população
Amostragem com ou sem reposição?
Quando há a reposição cada elemento permanece com a
mesma probabilidade de ser selecionado, igual a 1/N, onde
N é o tamanho da população.
Questão relevante quando tratamos de populações finitas.
Se o tamanho da amostra é pequeno em relação à
população a questão torna-se irrelevante.
Uma regra prática é fazer a reposição quando o
tamanho da amostra excede 5% do tamanho da
população.
Amostragem com ou sem reposição?
A extração de toda uma amostra de uma só vez equivale à
amostragem sem reposição.
Na amostragem com reposição é possível extrair um
mesmo item mais de uma vez.
Algumas situações em que a amostragem sem reposição é
justificada:
Quando os testes destroem os elementos;
Quando o teste é muito caro, e a reposição pode implicar
reaplicar o teste em uma mesma unidade.
Amostras probabilísticas e não
probabilísticas
Amostras probabilísticas ou aleatórias Obtida por meios que envolvem o acaso
Cada elemento da amostra tem uma probabilidade conhecida e
diferente de zero de ser escolhido
Obtida por meio de processo aleatório => processo aleatório =
quando você não consegue saber com antecedência quais serão os
elementos que comporão a amostra
O pesquisador não influencia a amostra
Pode-se usar sorteios, tabelas de nos. aleatórios e programas de
computador
Amostras probabilísticas e não
probabilísticas
Amostras não probabilísticas
Os itens ou indivíduos são selecionados sem conhecer
suas respectivas probabilidades de seleção
As teorias da estatística inferencial não se aplicam
Exemplos de métodos: amostragem por conveniência e
amostragem por julgamento
Podem trazer problema de viés
Tipos de Amostras
Técnicas de Amostragem
Probabilística ou Aleatória
Simples
Estratificada
Sistemática
Conglomerado
Não Probabilística ou
Não Aleatória
Por conveniência
Por julgamento
Por quotas
Amostragem aleatória simples
Etapas: Atribui-se um no. para cada elemento da população
Determina-se o tamanho da amostra adequado
Emprega-se um procedimento aleatório, para sortear os elementos que irão compor a amostra
Se a amostragem for com reposição o elemento volta para a população, se não o sorteio continua até atingir o tamanho da amostra
Função excel: aleatórioentre
Função excel: procv
Ferramenta de análise excel: amostragem
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc.
Chap 5-14
Amostragem Sistemática
Conveniente quando a população está ordenada sob algum critério:
fichas de um fichário, lista telefônica
Calcula-se o intervalo de amostragem N/n aproximando-se para o
inteiro mais próximo: a.
Sorteia-se um no. aleatório x entre 1 e a.
A amostra será composta dos elementos x; x+a; x+2a;...
Exemplo: N=1000, n=200. Logo: a=1000/200=5
se 3 for o no. sorteado entre 1 e 5 os elementos da população
numerados por 3, 8, 13, ..., 998 irão compor a amostra
Frequentemente utilizada em pesquisas de opinião, realizadas em
locais públicos
Vantagens: amostras mais dispersas, fácil de ser conduzida
Desvantagem: a presença de periodicidades ocultas pode produzir
resultados tendenciosos
Amostragem aleatória estratificada
A população é dividida em subgrupos e a
amostragem aleatória é feita em cada subgrupo
Muito aplicada em populações com subgrupos
homogêneos internamente, mas diferentes entre si
Tamanhos de amostra para alocação proporcional População de tamanho N
k estratos de tamanhos N1, N2,..., Nk
Amostras de tamanhos n1, n2, ..., nk
keiparanN
Nn i
i ,...2,1
Amostragem por conglomerado
A população é subdividida em várias partes, e algumas dessas subdivisões
ou conglomerados são selecionados aleatoriamente para integrar a
amostra global.
Os subgrupos devem ser tão heterogêneos quanto a população. Como se
fossem grupos populacionais em escala reduzida.
Útil quando a população é muito dispersa e a realização da amostragem
aleatória simples revelar-se dispendiosa e demorada.
Dentro de cada conglomerado pode-se selecionar todos ou alguns
elementos. Se forem selecionados alguns, diz-se que a amostragem é em
dois estágios.
Não exige a listagem de todos os elementos da população, apenas os dos
conglomerados selecionados.
Conglomerado x Aleatória Estratificada
Conglomerado
• Heterogeneidade dentro deles
• Homogeneidade entre grupos
Aleatória estratificada
• Estratos com características semelhantes
• Homogeneidade dentro dos estratos
• Heterogeneidade entre os estratos
Amostragem por Conveniência
Quando a participação é voluntária
Quando os elementos da amostra são escolhidos por uma
questão de conveniência ou simplicidade
A amostra não é representativa da população
Deve ser empregada somente em casos especiais
Exemplo: um pesquisador deseja estudar o comportamento
dos preços de imóveis residenciais em lançamento em
Florianópolis e desenvolve sua amostragem coletando dados
em dois jornais da cidade
Amostragem por Julgamento
A amostra é escolhida segundo opinião de
um especialista
Não deve ser considerada representativa da
população
Exemplo: em uma pesquisa sobre os livros
mais relevantes para o mestrado e doutorado
em Contábeis um especialista elaborou a lista
dos alunos a serem entrevistados.
Amostragem por Quotas
Difere da amostragem estratificada pelo fato da seleção dos
elementos da população não ser aleatória
As vantagens do método estão na rapidez, economia e
facilidade de administração.
Exemplo: uma empresa deseja lançar um novo produto
de emagrecimento e o público-alvo são mulheres entre
15 e 40 anos das classes sociais A e B. A população é
dividida em categorias de acordo com as variáveis de
controle (idade e classe social). Uma amostra de 5% da
população recebe uma amostra grátis do produto.
Nomenclatura
Estatística Parâmetro
População Amostra
E usamos estatíticas das amostras
para estimar parâmetros da população
Notação
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc.
Chap 5-23
Medida Amostra População
Média x
Desvio Padrão
Variância
Tamanho n N
x
22
x
Variabilidade Amostral
Você pode retirar várias amostras diferentes
de uma mesma população!!
Cada amostra pode te dar diferentes valores
para a média, desvio-padrão ou proporção.
Como saber então qual o valor do parâmetro
na população?
É preciso conhecer como a estatística varia
de amostra para amostra...
Exemplo
Vamos supor uma população finita com 5 elementos, que são os
números 3, 5, 7, 9, 11.
Neste caso, é fácil calcular os parâmetros média e desvio padrão
da população:
A média dessa população é
E seu desvio padrão é
Vamos supor que eu não pudesse calcular diretamente a média
da população e tivesse que fazê-lo através de estimativas com
base em amostras de 2 elementos...
75
119753
83,28
5
7117977757322222
Exemplo
Quantas amostras diferentes seria possível montar?
Vamos listar as amostras e suas médias:
Cada amostra tem uma probabilidade de ser escolhida
igual a 1/10.
10!32
!345
!3!2
!5
2
5
x
xx
Amostras 3 e 5 3 e 7 3 e 9 3 e 11 5 e 7 5 e 9 5 e 11 7 e 9 7 e 11 9 e 11
Médias 4 5 6 7 6 7 8 8 9 10
Exemplo
Posso calcular a probabilidade de encontrar cada um dos diferentes valores de
média nas amostras, que será:
Prob.
4 1/10
5 1/10
6 2/10
7 2/10
8 2/10
9 1/10
10 1/10
x
0,00
0,05
0,10
0,15
0,20
0,25
4 5 6 7 8 9 10
O que acabamos de
construir foi uma
distribuição de
probabilidades da
média da amostra
Mas isso nada mais é
do que uma
Distribuição Amostral!!
Distribuição Amostral
Uma distribuição amostral é uma distribuição de probabilidades
que indica até que ponto uma estatística amostral tende a variar
devido a variações casuais na amostragem aleatória.
Voltando ao Exemplo
No nosso exemplo qual a média das médias nas amostras? E
qual o desvio-padrão dessas médias?
Prob.
4 1/10
5 1/10
6 2/10
7 2/10
8 2/10
9 1/10
10 1/10
710
110
10
19
10
28
10
27
10
26
10
15
10
14 x
3
310
1710
10
179
10
278
10
277
10
276
10
175
10
174
22222222
x
x
x
É igual a média
da população
É menor que o
desvio padrão da
população
Vamos ver outro exemplo, agora fazendo a
amostragem com reposição...
Exemplo 2
Suponha uma população (simplificada) de quatro
pessoas de seu departamento.
Tamanho da população N=4
Variável aleatória, X, é a idade dos indivíduos
Valores de X: 18, 20, 22, 24 (anos)
Exemplo 2
Parâmetros da distribuição da População:
214
24222018
N
Xμ i
2.236N
μ)(Xσ
2
i
.3
.2
.1
0 18 20 22 24
A B C D
P(x)
x
Distribuição Uniforme
Exemplo 2
1o.
Obs.
2o. Observação
18 20 22 24
18 18,18 18,20 18,22 18,24
20 20,18 20,20 20,22 20,24
22 22,18 22,20 22,22 22,24
24 24,18 24,20 24,22 24,24
Agora, considere todas as amostras possíveis de
tamanho n=2
1o.
Obs.
2o. Observação
18 20 22 24
18 18 19 20 21
20 19 20 21 22
22 20 21 22 23
24 21 22 23 24
16 médias
amostrais
16 amostras possíveis
(amostragem com
reposição)
Exemplo 2
Distribuição Amostral de todas as médias
amostrais
1o.
Obs
2o. Observação
18 20 22 24
18 18 19 20 21
20 19 20 21 22
22 20 21 22 23
24 21 22 23 24
16 médias
amostrais
18 19 20 21 22 23 24 0
.1
.2
.3
P(X)
X
(não é mais uniforme)
Distribuição das
médias amostrais
_
Exemplo 2
2116
24211918
N
Xμ i
X
1.5816
21)-(2421)-(1921)-(18
N
)μX(σ
222
2
Xi
X
Parâmetros da distribuição amostral da média
Exemplo 2
População
N = 4
1.58σ 21μX
X
2.236σ 21μ
Distribuição Amostral da Média n = 2
18 20 22 24
A B C D
0
.1
.2
.3
P(X)
X 18 19 20 21 22 23 24 0
.1
.2
.3 P(X)
X _
_
Por enquanto... pelo menos em nossos
exemplos...
x, a média da distribuição amostral de x , é igual a , a
média da população; x , o desvio padrão da distribuição
amostral de x , é menor do que
, o desvio padrão
populacional.
Observem a notação!!!!
x, a média da distribuição amostral de x , é igual a , a
média da população; x , o desvio padrão da distribuição
amostral de x , é menor do que
, o desvio padrão
populacional.
Observem a notação!!!!
Mas... será que sempre podemos enumerar todas as amostras
possíveis para então analisar a média amostral e quanto ela
está próxima da média da população?
Não!!
Alguns teoremas solucionam a questão...
Teorema 1:
Para amostras aleatórias de tamanho n extraídas de uma
população com média e o desvio padrão
, a distribuição
amostral de x tem média x .
Erro Padrão
Desvio padrão da estimativa
Erro padrão: quanto menor, melhor!
Erro padrão da média para populações infinitas e finitas:
1
N
nN
nou
nxx
O que acontece se o erro padrão é pequeno? E se ele for grande?
O que determina o tamanho do erro padrão?
Você lembra?
Fator de
correção
para populações
finitas!!
Veja que interessante...
No primeiro exemplo dessa aula tínhamos uma população com 5 elementos:
3, 5, 7, 9, 11
A média e o desvio padrão da população eram:
Aí, listamos todas as amostras possíveis e calculamos a média e o desvio-
padrão (erro padrão) das médias das amostras:
Mas, se calcularmos o erro-padrão pela expressão do slide anterior, teremos:
87 e
37 xx e
342
38
15
25
2
8
1
N
nN
nx
As expressões nos dão o erro padrão sem que seja necessário listar todas as
amostras possíveis, calcular suas médias e então obter o erro padrão da média
das amostras!!
Efeito do tamanho da amostra sobre uma
distribuição amostral
À medida que aumenta o tamanho da amostra, há
variabilidade cada vez menor entre as médias das
amostras;
A média da distribuição amostral é igual ao
parâmetro da população, ou seja, é igual à média da
população;
Na medida em que o tamanho da amostra aumenta, a
distribuição dos resultados amostrais tende para a
forma da distribuição.
Distribuição Amostral da Média
Erro Padrão: População Normal
μμX
n
σσ
X
Se a população é normal com média μ e desvio-padrão σ, a
distribuição amostral da média é também distribuída
normalmente com
e
(Assume-se que a amostragem é feita com reposição ou sem
reposição em uma população infinita)
Distribuição Amostral da Média
Valor Z: População Normal
n
σ
μ)X(
σ
)μX(Z
X
X
• Valor-Z para a distribuição amostral da média:
onde: = média da amostra
= média da população
= desvio padrão da população
n = tamanho da amostra
Xμ
σ
Distribuição Amostral da Média
Propriedades: População Normal
(i.e. é não viesada )
População segue
Distribuição Normal
Distribuição Amostral da
média segue Distribuição
Normal
(com a mesma média)
μμx
xx
x
μ
xμ
Distribuição Amostral da Média
Propriedades: População Normal
Para amostragem com reposição:
À medida que n aumenta,
diminui xσMaior tamanho
de amostra
Menor tamanho
de amostra
xμ
Teorema do Limite Central
Para grandes amostras, a distribuição amostral da média pode
ser muito bem aproximada por uma distribuição normal,
lembrando que para populações infinitas:
Podemos então dizer formalmente que: n
e xx
Se x é a média de uma amostra aleatória de tamanho n de uma população
infinita com a média μ e o desvio padrão σ e se n é grande então
n
xz
/
tem aproximadamente a distribuição normal padrão.
Teorema do Limite Central
Se aplica a populações infinitas...
... e a populações finitas em que n é grande mas representa
uma porção pequena da população, ou seja, n/N é pequeno
Para a maioria das distribuições, n > 30 dará uma
distribuição amostral próxima da normal
Para distribuições aproximadamente simétricas, n > 15, a
distribuição amostral também estará próxima da normal
Quando sabemos que a população tem distribuição normal, a
distribuição amostral da média pode ser aproximada pela
normal, independentemente do tamanho de n.
X
Teorema do Limite Central
À medida
em que o
tamanho
da
amostra
aumenta
(n 30) ...
Estatística: Prof. André Carvalhal
X
Teorema do Limite Central
A distribuição
amostral torna-
se praticamente
normal.
À medida
em que o
tamanho
da
amostra
aumenta
(n 30) ...
Estatística: Prof. André Carvalhal
X
Teorema do Limite Central
A distribuição
amostral torna-
se praticamente
normal.
À medida
em que o
tamanho
da
amostra
aumenta
(n 30) ...
xn
x
Estatística: Prof. André Carvalhal
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc.
Chap 7-51
Distribuições de Amostragens
População não-normal
Distribuição da População
Distribuição das amostras
(aproxima-se da normal quando n cresce)
x
x
Amostra
grande Amostra pequena
xμ
μ
Distribuição Amostral da Média
Exemplo
Suponha uma população com média μ = 8 e desvio-padrão σ = 3.
Suponha uma amostra aleatória de tamanho n = 36 é selecionada.
Qual a probabilidade de que a média amostral esteja entre 7.75 e
8.25?
Mesmo que a população não seja normalmente distribuída, o
Teorema do Limite Central pode ser usado (n > 30).
Então, a distribuição amostral da média é aproximadamente normal
com
8μx 0.536
3
n
σσx
Distribuição Amostral da Média
Exemplo
5.0
363
8-8.25
5.0
363
8-7.75
Z
Z
Primeiro, vamos calcular os valores-Z para 7.75
e 8.25.
0.38300.5)ZP(-0.5 8.25) μ P(7.75X
Agora, usando uma tabela de probabilidades da
Distribuição Normal teremos:
Distribuição Amostral da Média
Exemplo
= 2(.5000-.3085)
= 2(.1915)
= 0.3830
Z -0.5 0.5
Distribuição Normal
Padrão
0μz 7.75 8.25
Distribuição
Amostral
Amostra
8μX
x
Distribuição da
População
8μ X
Distribuição Amostral da Proporção
amostra da tamanho
interesse de ticacaracterís a com amostra na de número
n
X itensp
• A proporção da população com determinada
característica é denotada por π.
• A proporção da amostra ( p ) com esta característica dá
uma estimativa de π:
– 0 ≤ p ≤ 1
– p segue uma Distribuição Binomial
(Assume-se que a amostragem é feita com reposição ou sem reposição em uma
população infinita)
Distribuição Amostral da Proporção
Erro padrão para a proporção:
n
)(1σp
n
)(1σZ
p
pp
• Valor-Z para a proporção:
Distribuição Amostral da Proporção
Exemplo
Se em um plebiscito a proporção de votantes à favor
da Proposta A é π = .4, qual a probabilidade de que
em uma amostra de 200 pessoas a proporção de
votantes a favor esteja entre .40 and .45?
• Em outras palavras, se π = .4 e n = 200, qual a
P(.40 ≤ p ≤ .45) ?
Distribuição Amostral da Proporção
Exemplo
.03464200
.4).4(1
n
)(1σ
p
1.44)ZP(0
.03464
.40.45Z
.03464
.40.40P.45)P(.40
p
Encontre :
Converta para
a Normal
Padronizada:
pσ
Distribuição Amostral da Proporção
Exemplo
Use a tabela de probabilidade Normal acumulada:
P(0 ≤ Z ≤ 1.44) = P(Z ≤ 1.44) – 0.5 = .4251
Z .45 1.44
.4251
Padronize
Distribuição Amostral Distribuição Normal
Padronizada
.40 0 p