Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-1
Capítulo 5
Algumas Distribuições de
Probabilidades Discretas Importantes
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-2
Objetivos:
Neste capítulo você aprenderá:
As propriedades de uma distribuição de probabilidades
A calcular o valor esperado e a variância de uma
distribuição de probabilidades
A calcular a covariância e a compreender o seu uso em
finanças
A calcular probabilidades a partir de distribuições
binomiais, hipergeométricas e de Poisson
A utilizar distribuições binomiais, hipergeométricas e de
Poisson para solucionar problemas ligados aos negócios
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-3
Definições
Variáveis Aleatórias
Uma variável aleatória representa um valor numérico possível de um evento incerto.
Variáveis aleatórias discretas produzemresultados que advém de um processo de contagem (ex.: no. de disciplinas que vocêcursa).
Variáveis aleatórias contínuas produzemresultados que advém de um processo de medição (ex.: seu salário anual ou seu peso).
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-4
Variáveis Aleatórias Discretas
Exemplos
Variáveis aleatórias discretas só podem assumir um número
contável de valores
Exemplos:
Jogar um dado duas vezes
Seja X o no. de vezes em que o 4 aparece (então X pode ser 0,
1, ou 2 vezes)
Lançar uma moeda 5 vezes.
Seja X o no. de caras (então X = 0, 1, 2, 3, 4, ou 5)
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-5
Definições
Variáveis Aleatórias
Variáveis
Aleatórias
Discreta
V. A.
Contínua
V. A.Cap. 5 Cap. 6
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-6
Definições
Distribuição de Probabilidades
Uma distribuição de probabilidades para uma variávelaleatória discreta é uma lista mutuamente excludente de todos os resultados numéricos possíveis para aquela variável, de modo a que uma determinada probabilidade de ocorrênciaesteja associada a cada resultado.
No. de disciplinas Probabilidade
2 0.2
3 0.4
4 0.24
5 0.16
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-7
Definições
Distribuição de Probabilidades
Experimento: Duas jogadas de uma moeda.
Seja X = # caras.
Distribuição de Probabilidades
Valor X Probabilidade
0 1/4 = .25
1 2/4 = .50
2 1/4 = .250 1 2 X
.50
.25
Pro
bab
ilit
y
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-8
Variáveis Aleatórias Discretas
Valor Esperado
Valor Esperado (ou média) de uma distribuição discreta(Média Ponderada)
Exemplo: 2 jogadas moeda, X = # de caras,
Calcule o valor esperado de X:
E(X) = (0)(.25) + (1)(.50) + (2)(.25)
= 1.0
N
i
ii XPX1
)( E(X)
Valor Probabilidade
0 1/4 = .25
1 2/4 = .50
2 1/4 = .25
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-9
Variáveis Aleatórias Discretas
Valor Esperado
Calcule o valor
esperado da
distribuição:
No. de
disciplinas
Probabilidade
2 0.2
3 0.4
4 0.24
5 0.16
E(X) = 2(.2) + 3(.4) + 4(.24) + 5(.16) = 3.36
Então, o no. médio de disciplinas por aluno é de
3.36.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-10
Variáveis Aleatórias Discretas
Dispersão
Variância de uma variável aleatória discreta
Desvio Padrão de uma variável aleatória discreta
onde:
E(X) = Valor esperado da variável aleatória discreta X
Xi = o io. resultado de X
P(Xi) = Probabilidade do io. resultado de X ocorrer
N
1i
i
2
i
2 )P(XE(X)][Xσ
N
1i
i
2
i
2 )P(XE(X)][Xσσ
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-11
Variáveis Aleatórias Discretas
Dispersão
Exemplo: Duas jogadas de uma moeda, X = #
caras, calcule o desvio padrão (lembrar que E(X)
= 1)
N
1i
i
2
i
2 )P(XE(X)][Xσσ
.707.50(.25)1)(2(.50)1)(1(.25)1)(0σ 222
Nos. possíveis de caras = 0, 1, or 2
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-12
Covariância
A covariância é uma medida da força da
relação linear entre duas variáveis aleatórias
X e Y.
Uma covariância positiva indica uma relação
positiva.
Uma covariância negativa indica uma relação
negativa.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-13
Covariância
Fórmula da Covariância:
)()]()][(([σ1
N
i
iiiiXY YXPYEYXEX
onde: X = variável aleatória discreta X
Xi = o i-ésimo resultado de X
Y = variável aleatória discreta Y
Yi = o i-ésimo resultado de Y
P(XiYi) = probabilidade de ocorrência do i-ésimo resultado de
X e do i-ésimo resultado de Y
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-14
Retornos de Investimentos
A MédiaConsidere o retorno de $1000 investidos em cada
um dos dois tipos de fundos de investimentos
abaixo.
Situação da Economia
P(XiYi)
Investimento
Fundo Passivo X Fundo Agressivo Y
0.2 Recessão - $25 - $200
0.5 Estabilidade + $50 + $60
0.3 Expansão + $100 + $350
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-15
Retornos de Investimentos
A Média
E(X) = μX = (-25)(.2) +(50)(.5) + (100)(.3) = 50
E(Y) = μY = (-200)(.2) +(60)(.5) + (350)(.3) = 95
Interpretação: O fundo X tem um retorno médio de
$50.00 e o fundo Y um retorno médio de $95.00 para
cada $1000 investido.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-16
Retornos de Investimentos
Desvio Padrão
43.30
(.3)50)(100(.5)50)(50(.2)50)(-25σ 222
X
71.193
)3(.)95350()5(.)9560()2(.)95200-(σ 222
Y
Interpretação: Apesar do fundo Y ter um retorno
esperado maior, está sujeito a uma variabilidade de
resultados maior.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-17
Retornos de Investimentos
Covariância
8250
95)(.3)50)(350(100
95)(.5)50)(60(5095)(.2)200-50)((-25σXY
Interpretação: Como a covariância é alta e positiva,
há uma relação linear positiva entre os retornos dos
dois fundos, significando que provavelmente eles
terão seus movimentos de alta e queda nos mesmos
momentos.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-18
A soma de duas variáveis aleatórias
Valor Espereado:
Variância:
Desvio-Padrão:
XYYXYXYX 2σσσσ)Var( 222
)()()( YEXEYXE
2σσ YXYX
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-19
Retorno Esperado de uma Carteira
de Títulos e Risco da Carteira
Carteiras de investimentos geralmente têm
diversos fundos (ou ações) diferentes
(variável aleatória)
O retorno esperado e o desvio padrão de dois
fundos pode agora ser calculado.
Objetivo do Investimento: Maximizar o
retorno (média) minimizando o risco (desvio
padrão).
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-20
Retorno Esperado da Carteira e
Risco da Carteira
Retorno Esperado da Carteira (média ponderada dos
retornos):
Risco da carteira (variabilidade ponderada)
onde w = proporção do valor da carteira investida no
ativo X
(1 - w) = proporção da carteira no ativoY
)()1()(E(P) YEwXEw
XY
2
Y
22
X
2
P w)σ-2w(1σ)w1(σwσ
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-21
Retorno Esperado da Carteira e
Risco da Carteira
Lembrar: Investment X: E(X) = 50 σX = 43.30
Investment Y: E(Y) = 95 σY = 193.21
σXY = 8250
Suponha que 40% do valor da carteira esteja investido no fundo X e 60% no fundo Y:
O retorno esperado fica entre os retornos individuais dos fundos X e Y individualmente considerados.
77)95()6(.)50(4.E(P)
04.133
8250)2(.4)(.6)((193.21))6(.(43.30)(.4)σ 2222
P
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-22
Distribuições de Probabilidades
Distribuições de
Probabilidades
Contínuas
Binomial
Hipergeométrica
Poisson
Distribuições de
Probabilidades
Distribuições de
Probabilidades
Discretas
Normal
Uniforme
Exponencial
Cap. 5 Cap. 6
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-23
A Distribuição Binomial:
Propriedades
A amostra consiste em um no. fixo de observações, n
ex. 15 jogadas de uma moeda; 10 lâmpadas retiradas de um depósito
Duas categorias mutuamente exclusivas e coletivamente
exaustivas
ex. Cara ou coroa em cada jogada da moeda; defeituosa ounão defeituosa no caso das lâmpadas.
Geralmente chamadas de “sucesso” e “fracasso”
Probabilidade de sucesso é p, probabilidade de fracasso é 1 – p
Probabilidade constante para cada observação
ex. Probabilidade de tirar cara é a mesma em cada jogada da
moeda
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-24
A Distribuição Binomial:
Propriedades
As observações são independentes
O resultado de uma observação não afeta o resultadode outra observação
Dois métodos de amostragem
Sem reposição para populações infinitas
Com reposição para populações finitas
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-25
Aplicações da Distribuição Binomial
Uma fábrica classificando itens como defeituosos
ou aceitáveis
Uma firma submetendo propostas pode assinar ou
não um contrato
Uma pesquisa de marketing identificando intenções
de compra pode receber respostas “sim, eu
comprarei” ou “não, eu não comprarei”
Candidatos a um emprego podem ser ou não
contratados
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-26
A Distribuição Binomial
Técnicas de Contagem
Suponha que sucesso seja definido comoobter pelo menos duas caras em três jogadasde uma moeda equilibrada. De quantasmaneiras isso pode ocorrer?
Sucessos Possíveis: CCK, CKC, KCC, CCC, Portanto, há quatro maneiras possíveis.
Esta situação é extremamente simples. Precisamos de uma forma de contar sucessosem situações mais complicadas.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-27
Técnicas de Contagem
Combinações
O no. de formas de selecionar X objetos em
um conjunto de n objetos é:
X)!(nX!
n!
X
nCXn
onde:
n! =n(n - 1)(n - 2) . . . (2)(1)
X! = X(X - 1)(X - 2) . . . (2)(1)
0! = 1 (por definição)
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-28
Técnicas de Contagem
Combinações
Quantas combinações diferentes de 3 sabores de
sorvete você pode criar a partir de um cardápio com
31 sabores?
44952953128!123
28!293031
3!28!
31!
3)!(313!
31!
3
31C331
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-29
Distribuição Binomial
Formula
XnX )(1X)!(nX!
n!P(X)
pp
P(X) = probabilidade de X sucessos em ntentativas, com probabilidade de sucessop em cada tentativa
X = no. de “sucessos” na amostra,
(X = 0, 1, 2, ..., n)
n = tamanho da amostra (no. de tentativas
ou observações)
p = probabilidade de “sucesso”
Exemplo: jogar uma moeda
4 vezes; seja x = # caras:
n = 4
p = 0.5
1 - p = (1 - .5) = .5
X = 0, 1, 2, 3, 4
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-30
Distribuição Binomial
Exemplo
.32805
)(5)(.1)(.9
.1)(1(.1)1)!(51!
5!
)(1X)!(nX!
n!1)P(X
4
151
XnX
pp
Qual a probabilidade de um sucesso em 5 observações
se a probabilidade de sucesso é .1?
X = 1, n = 5, e p = .1
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-31
Distribuição Binomial
Exemplo
Suponha que a probabilidade de comprar um
computador defeituoso seja de 0.02. Qual a
probabilidade de comprar 2 computadores defeituosos
em um lote de 10?
X = 2, n = 10, e p = .02
.01531
)(.8508)(45)(.0004
.02)(1(.02)2)!(102!
10!
)(1X)!(nX!
n!2)P(X
2102
XnX
pp
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-32
Distribuição Binomial
Formato
n = 5 p = 0.1
0
.2
.4
.6
0 1 2 3 4 5 X
P(X)
n = 5 p = 0.5
.2
.4
.6
0 1 2 3 4 5 X
P(X)
0
O formato da distribuiçãobinomial depende do valor p e n
Aqui, n = 5 e p = .1
Aqui, n = 5 e p = .5
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-33
Distribuição Binomial
Usando as Tabelas Binomiaisn = 10
x … p=.20 p=.25 p=.30 p=.35 p=.40 p=.45 p=.50
0
1
2
3
4
5
6
7
8
9
10
…
…
…
…
…
…
…
…
…
…
…
0.1074
0.2684
0.3020
0.2013
0.0881
0.0264
0.0055
0.0008
0.0001
0.0000
0.0000
0.0563
0.1877
0.2816
0.2503
0.1460
0.0584
0.0162
0.0031
0.0004
0.0000
0.0000
0.0282
0.1211
0.2335
0.2668
0.2001
0.1029
0.0368
0.0090
0.0014
0.0001
0.0000
0.0135
0.0725
0.1757
0.2522
0.2377
0.1536
0.0689
0.0212
0.0043
0.0005
0.0000
0.0060
0.0403
0.1209
0.2150
0.2508
0.2007
0.1115
0.0425
0.0106
0.0016
0.0001
0.0025
0.0207
0.0763
0.1665
0.2384
0.2340
0.1596
0.0746
0.0229
0.0042
0.0003
0.0010
0.0098
0.0439
0.1172
0.2051
0.2461
0.2051
0.1172
0.0439
0.0098
0.0010
10
9
8
7
6
5
4
3
2
1
0
… p=.80 p=.75 p=.70 p=.65 p=.60 p=.55 p=.50 x
Exemplos:
n = 10, p = .35, x = 3: P(x = 3|n =10, p = .35) = .2522
n = 10, p = .75, x = 2: P(x = 2|n =10, p = .75) = .0004
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-34
Distribuição Binomial
Características
Média
Variância e Desvio Padrão
pnE(x)μ
)-(1nσ2 pp )-(1nσ pp
onde n = tamanho da amostra
p = probabilidade de sucesso
(1 – p) = probabilidade de fracasso
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-35
Distribuição Binomial
Características
n = 5 p = 0.1
0
.2
.4
.6
0 1 2 3 4 5 X
P(X)
n = 5 p = 0.5
.2
.4
.6
0 1 2 3 4 5 X
P(X)
0
0.5(5)(.1)nμ p
0.6708
.1)(5)(.1)(1)-(1nσ
pp
2.5(5)(.5)nμ p
1.118
.5)(5)(.5)(1)-(1nσ
pp
Exemplos
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-36
Distribuição de Poisson
Definições
Uma área de oportunidade é uma unidade
contínua ou um intervalo de tempo, volume
ou área tal que nela possa acontecer mais de
uma ocorrência de um evento.
ex. No. de arranhões na pintura de um carro
ex. No. de picadas de mosquito em uma pessoa
ex. No. de falhas em um computador em um
dia
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-37
Distribuição de Poisson
Propriedades
Aplique a Distribuição de Poisson quando:
Você deseja contar o no. de vezes que um evento ocorre em umadada área de oportunidade
A probabilidade que um evento ocorra em uma área de oportunidade é a mesma que ele ocorra em qualquer outra áreade oportunidade
O no. de ocorrências do evento em uma área de oportunidade é independente o no. de ocorrência nas outras áreas de oportunidade
A probabilidade de que dois ou mais eventos ocorram em umamesma área de oportunidade aproxima-se de zero à medida que a a área de oportunidade vai se tornando menor
O no. médio de eventos por unidade é (lambda)
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-38
Distribuição de Poisson
Formula
X!
λeP(X)
xλ
onde:
X = no. de eventos em uma área de oportunidade
= no. esperado de eventos
e = constante matemática aproximada por 2.71828…
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-39
Distribuição de Poisson
Exemplo
Suponha que, em média, 5 carros entram em um
estacionamento por minuto. Qual a probabilidade
de que em um dado minuto, 7 carros entrem?
Então, X = 7 e λ = 5
0.1047!
5e
X!
λeP(7)
75xλ
Então, há uma chance de 10.4% de que 7 carros
entrem no estacionamento em um dado minuto.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-40
Distribuição de Poisson
Usando as Tabelas de Poisson
X
0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90
0
1
2
3
4
5
6
7
0.9048
0.0905
0.0045
0.0002
0.0000
0.0000
0.0000
0.0000
0.8187
0.1637
0.0164
0.0011
0.0001
0.0000
0.0000
0.0000
0.7408
0.2222
0.0333
0.0033
0.0003
0.0000
0.0000
0.0000
0.6703
0.2681
0.0536
0.0072
0.0007
0.0001
0.0000
0.0000
0.6065
0.3033
0.0758
0.0126
0.0016
0.0002
0.0000
0.0000
0.5488
0.3293
0.0988
0.0198
0.0030
0.0004
0.0000
0.0000
0.4966
0.3476
0.1217
0.0284
0.0050
0.0007
0.0001
0.0000
0.4493
0.3595
0.1438
0.0383
0.0077
0.0012
0.0002
0.0000
0.4066
0.3659
0.1647
0.0494
0.0111
0.0020
0.0003
0.0000
Exemple: Encontre P(X = 2) se = .50
.07582!
(0.50)e
X!
λe2)P(X
20.50Xλ
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-41
Distribuição de Poisson
Formato
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0 1 2 3 4 5 6 7
x
P(x
)
P(X = 2) = .0758
X P(X)
0
1
2
3
4
5
6
7
0.6065
0.3033
0.0758
0.0126
0.0016
0.0002
0.0000
0.0000
= .50
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-42
Distribuição de Poisson
Formato
0.00
0.05
0.10
0.15
0.20
0.25
1 2 3 4 5 6 7 8 9 10 11 12
x
P(x
)
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0 1 2 3 4 5 6 7
x
P(x
)
= 0.50 = 3.00
O formato da Distribuição de Poisson depende
do parâmetro :
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-43
Distribuição Hipergeométrica
A distribuição binomial é aplicável quando
a seleção é feita em uma população finita
com reposição ou sem reposição em uma
população infinita.
A distribuição hipergeométrica é aplicável
quando a seleção é feita sem reposição em
uma população finita.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-44
Distribuição Hipergeométrica
“n” tentativas em uma amostra retirada de uma
população finita de tamanho N
Amostragem feita sem reposição
O resultado de uma observação é dependente
dos resultados das observações anteriores
Permite encontrar a probabilidade de “X”
sucessos em uma amostra retirada de uma
população onde há “A” sucessos
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-45
Distribuição Hipergeométrica
n
N
Xn
AN
X
A
XP )(
Onde:
N = tamanho da população
A = número de sucessos na população
N – A = número de fracassos na população
n = tamanho da amostra
X = número de sucessos na amostra
n – X = número de fracassos na amostra
Para entender a fórmula...
Uma floricultura envia limoeiros de três anos em lotes de 24 e, quando eles
chegam ao destino, um inspetor seleciona ao acaso três de cada lote. Se essas
três árvores são saudáveis, todo o lote é aceito; caso contrário, as outras 21
árvores do lote também são inspecionadas. Como um lote pode ser aceito sem
inspeção adicional, mesmo que haja muitas árvores em más condições, esse
procedimento de inspeção envolve um risco considerável. Para ilustrar a
magnitude do risco, vamos supor que, na realidade 6 das 24 árvores estejam
em más condições e determinemos a probabilidade de que um lote inteiro seja,
mesmo assim, aceito sem inspeção adicional. Isso significa que devemos
encontrar a probabilidade de três sucessos (árvores saudáveis) em três provas
(árvores inspecionadas) e poderíamos ser tentados a argumentar que, como 18
das 24 árvores no lote estão saudáveis, a probabilidade é de 18/24=3/4 que
alguma delas esteja saudável...
Para entender a fórmula...
... e portanto a probabilidade procurada é
Esse resultado, obtido com a fórmula da distribuição binomial, seria correto se a amostragem fosse com reposição, mas não é isso que ocorre em problemas reais de inspeção por amostragem. Para obtermos a resposta correta de nosso problema quando a amostragem é sem reposição, devemos raciocinar como segue: há um total de
maneiras de escolher três das 24 árvores, e todas elas são equiprováveis em virtude da hipótese de que a seleção é aleatória. Entre estas, há maneiras de selecionar 3
das 18 árvores saudáveis e decorre, portanto, que a probabilidade procurada é 816/2.024=0,40.
42,04
1
4
3
3
3)3(
03
XP
024.23
24
8163
18
Para entender a fórmula...
A expressão da Distribuição Hipergeométrica é uma generalização do
método que usamos no caso das árvores.
Suponha que devamos escolher n objetos em um conjunto de N objetos e
que neste conjunto de N objetos haja A que são de um tipo (sucesso) e N-
A que sejam de outro tipo (fracasso), que a amostragem seja sem
reposição e que estejamos interessados na probabilidade de obter X
sucessos e n-X fracassos.
Para entender a fórmula...
Argumentando como anteriormente, vemos que é possível escolher n
objetos de um conjunto total de N objetos de
maneiras, e que X dos A sucessos e n-X dos N-A fracassos podem ser
escolhidos de maneiras. Decorre que,
na amostragem sem reposição, a probabilidade de “x sucessos em n
provas” é
n
N
Xn
AN
X
A
n
N
Xn
AN
X
A
XP )(
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-50
Distribuição Hipergeométrica
Características
A média, ou valor esperado, da distribuição
hipergeométrica é :
N
nAE(x)μ
O desvio padrão é :
1- N
n-N
N
A)-nA(Nσ
2
1- N
n-NOnde é conhecido como “Fator de Correção para
Populações Finitas”, para amostras sem reposição extraídas de
populações finitas.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-51
Distribuição Hipergeométrica
Exemplo
Computadores são checados em um departamento com 10 computadores. 4 dos 10 computadores tem software ilegalinstalado. Qual é a probabilidade de que ao selecionar trêspara checagem, 2 deles tenham softwares ilegaisinstalados?
Então, N = 10, n = 3, A = 4, X = 2
0.3120
(6)(6)
3
10
1
6
2
4
n
N
Xn
AN
X
A
2)P(X
A probabilidade de que 2 dos 3 computadores selecionados
tenham software ilegal é de 0,30 ou 30%.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-52
Capítulo 6
A Distribuição Normal e Outras
Distribuições Contínuas
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-53
Objetivos:
Neste capítulo, você aprenderá:
Calcular probabilidades a partir da distribuição
normal
Utilizar o gráfico da probabilidade normal para
determinar se um conjunto de dados está distribuído
aproximadamente nos moldes da distribuição normal
Calcular probabilidades a partir da distribuição
uniforme
Calcular probabilidades a partir da ditribuição
exponencial
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-54
Distribuições de Probabilidades
Contínuas
Uma variável aleatória contínua é uma variável que
pode assumir qualquer valor em um continuum (pode
assumir um no. incontável de valores)
Espessura de um item
Tempo necessário para concluir uma tarefa
Temperatura de uma solução
Peso
As variáveis acima pode assumir qualquer valor,
dependendo apenas do nível de precisão com que serão
medidas.
Variável Aleatória Contínua
Para v.a. contínua não faz sentido estabeler um par entre xi e p(xi)
A probabilidade de ocorrer um xi específico é zero
A distribuição de probabilidades é denominada função densidade de probabilidade que é uma função não negativa
A probabilidade de ocorrer valores entre a e b é definida pela área sob a curva entre os valores a e b.
a b
f(X)
(Note que a
probabilidade de
qualquer valor individual
é zero)
P(a ≤ X ≤ b)
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-56
Distribuição Normal
Propriedades
tem o formato de “sino”
Simétrica
Média, Mediana e Moda são iguais
a posição é caracterizada pela média, μ
a dispersão é caracterizada pelo desvio-padrão, σ
a variável aleatória possui amplitude infinita: - a +
caso limite para diversas outrasdistribuições
fundamental para a inferência estatística
definida por dois parâmetros (μ , σ)
Média
= Mediana
= Moda
f(X)
μ
σ
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-57
Distribuição Normal
Função Densidade
2μ)(X
2
1
e2π
1f(X)
• A fórmula para a função densidade de probabilidade da
distribuição Normal é
Onde e = constante matemática aproximada para 2,71828
π = constante matemática aproximada para 3,14159
μ = média da população
σ = desvio padrão da população
X = qualquer valor da variável contínua, em que
- < X < +
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-58
Distribuição Normal
Forma
Variando os parâmetros μ e σ, obtemos diferentes
distribuições normais
X
f(X)
CA
B
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-59
Distribuição Normal
Forma
X
f(X)
μ
σ
Mudando μ a
distribuição move-se
para a direita ou
esquerda.
Mudando σ a dispersão é
aumentada ou diminuída.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-60
Distribuição Normal Padrão
• Qualquer distribuição normal (com qualquercombinação de média e desvio padrão) podeser transformada em uma distribuição normal padrão (Z).
• Necessário transformar X unidades em Zunidades.
• A distribuição normal padrão tem média 0 e desvio padrão igual a 1.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-61
Distribuição Normal Padrão
σ
μXZ
Para converter qualquer variável aleatória normal,
X, em uma variável aleatória normal padronizada,
Z, subtrai-se a média de X e divide-se pelo desvio
padrão:
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-62
Distribuição Normal Padrão: Função
Densidade de Probabilidade
2
Z2
e2π
1f(Z)
A fórmula da função densidade de probabilidade normal
padrão é:
Onde: e = constante matemática aproximada para 2,71828
π = constante matemática aproximada para 3,14159
Z = qualquer valor da distribuição normal padrão
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-63
Distribuição Normal Padrão
Forma
Z
f(Z)
0
1
• Também conhecida como distribuição “Z”
• Media é 0
• Desvio Padrão é 1
Valores acima da média têm valores-Z positivos, valores
abaixo da média têm valores-Z negativos
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-64
Distribuição Normal Padrão
Exemplo
2.050
100200
σ
μXZ
• Se X é uma variável aleatória normalmente distribuída
com média 100 e desvio padrão igual a 50, o valor-Z
para um valor X = 200 é
• Isto quer dizer que X = 200 está dois desvios-padrão (2
incrementos de 50 unidades) acima da média 100.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-65
Distribuição Normal Padrão
Exemplo
Z
100
2.00
200 X (μ = 100, σ = 50)
(μ = 0, σ = 1)
Observe que a distribuição é a mesma, somente a
escala é diferente. Nós podemos expressar o
problema na unidade original (X) ou em unidades
padronizadas (Z)
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-66
Probabilidades na Distribuição
Normal
a b
f(X)
(Observe que a
probabilidade de
ocorrência de qualquer
valor individual é zero)
A probabilidade, como em qualquer distribuição
contínua, é medida pela área sob a curva
P(a ≤ X ≤ b)
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-67
Normal Probabilities
A área total sob a curva é 1,0, e a curva é simétrica,
então, metade está acima da média e metade está
abaixo da média.
f(X)
0.50.5
1.0)XP(
0.5)XP(μ 0.5μ)XP(
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-68
Tabelas da Distribuição Normal
Exemplo:
P(Z < 2.00) = .9772
A tabela da Normal Padronizada no livro texto
(Apêndice E.2) dá a probabilidade de valores
menores do que Z (ou seja, do negativo infinito
até Z)
Z0 2.00
.9772
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-69
Tabelas da Distribuição Normal
O valor da tabela dá a probabilidade de que Z esteja entre Z = e Z igual ao valor desejado.
.9772
2.0P(Z < 2.00) = .9772
A linha mostra o
valor de Z para a
primeira casa
decimal
A coluna dá o valor de Z na segunda
casa decimal
2.0
.
.
.
Z 0.00 0.01 0.02 …
0.0
0.1
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-70
Encontrando Probabilidades Normais
Procedimento
• Especifique a distribuição normal do seu problema em
termos da variável X.
• Transforme os valores-X em valores-Z.
• Use as tabelas da distribuição Normal padrão.
Para encontrar a P(a < X < b) quando
X é distribuído normalmente:
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-71
Encontrando Probabilidades Normais
Exemplo
Seja X uma variável aleatória que represente o tempo (em segundos) para fazer o download de um arquivo na internet.
Suponha que X tenha distribuição normal com média 8,0 e desvio-padrão 5,0
Encontre P(X < 8,6)
X
8.6
8.0
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-72
Encontrando Probabilidades Normais
Exemplo
0.125.0
8.08.6
σ
μXZ
Supondo que X seja normal com média 8,0 e desvio-
padrão 5,0. Encontre a P(X < 8,6).
Z0.120
X8.68
μ = 8
σ = 10
μ = 0
σ = 1
P(X < 8.6) P(Z < 0.12)
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-73
Encontrando Probabilidades Normais
Exemplo
Z .00 .01 .02
0.0 .5000 .5040 .5080
0.1 .5398 .5438 .5478
0.2 .5793 .5832 .5871
0.3 .6179 .6217 .6255
Tabela da Distribuição Normal
Padronizada (Extrato)
Z0.120
μ = 0
σ = 1
.5478
= P(Z < 0.12)
P(X < 8.6)
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-74
Encontrando Probabilidades Normais
Exemplo
Encontrando P(X > 8.6)…
P(X > 8.6) = P(Z > 0.12) = 1.0 - P(Z ≤ 0.12)
= 1.0 - .5478 = .4522
Z
0.12
0
.5478
1.0 - .5478 = .4522
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-75
Encontrando Probabilidades Normais
Entre dois valores
• Suponha X uma v.a. com distribuição normal com média
8,0 e desvio padrão 5,0. Encontre P(8 < X < 8,6)
P(8 < X < 8.6)
= P(0 < Z < 0.12)
05
88
σ
μXZ
0.125
88.6
σ
μXZ
Calcule os valores Z:
Z0.120
X8.68
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-76
Encontrando Probabilidades Normais
Entre dois valores
Z .00 .01 .02
0.0 .5000 .5040 .5080
0.1 .5398 .5438 .5478
0.2 .5793 .5832 .5871
0.3 .6179 .6217 .6255
Tabela da Distribuição Normal
Padronizada (Extrato)
Z
0.12
.0478
0.00
= P(0 < Z < 0.12)
P(8 < X < 8.6)
= P(Z < 0.12) – P(Z ≤ 0)
= .5478 - .5000 = .0478
.5000
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-77
Dada a Probabilidade Normal,
Encontrar o valor X
Seja X uma v.a. que represente o tempo (em segundos) para fazer o download de um arquivo na Internet.
Suponha que X siga uma distribuição Normal com média8,0 e desvio padrão 5,0
Encontre X tal que 20% dos tempos para download sejaminferiores a X.
X? 8.0
.2000
Z? 0
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-78
Dada a Probabilidade Normal,
Encontrar o valor X
Primeiro, encontre o valor-Z correspondente
à probabilidade conhecida usando a tabela.
Z …. .03 .04 .05
-0.9 …. .1762 .1736 .1711
-0.8 …. .2033 .2005 .1977
-0.7 …. .2327 .2296 .2266
X? 8.0
.2000
Z-0.84 0
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-79
Dada a Probabilidade Normal,
Encontrar o valor X
A seguir, converta o valor-Z em valor-X
usando a fórmula.
Então 20% dos tempos para fazer o download são
menores do que 3,80 segundos.
80,3
0,5)84,0(0,8
ZσμX
-X
-XZ
Z
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-80
Avaliando a Normalidade
É importante saber avaliar o quão bem a distribuição dos dados pode ser aproximada poruma distribuição normal.
Dados normalmente distribuídos deveriamseguir as propriedades teóricas da distribuiçãoNormal: A distribuição Normal é em forma de sino
(simétrica) sendo a média igual à mediana.
As regras empíricas aplicam-se à distribuiçãonormal.
A amplitude interquartil é igual a 1,33 desvios-padrão.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-81
Avaliando a Normalidade
Construa gráficos
Para conjuntos de dados de tamanho pequeno oumoderado, construa uma disposição ramo e folha e um box-plot. Eles parecem simétricos?
Para conjuntos grandes de dados, construa um histograma. Ele tem a forma de sino?
Calcule as estatísticas descritivas
A média, mediana e moda têm valores semelhantes?
A amplitude interquartil é aproximadamente igual a 1.33 σ?
A amplitude é aproximadamente igual a 6 σ?
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-82
Avaliando a Normalidade
Observe a distribuição do conjunto de dados
Aproximadamente 2/3 dos valores se posicionamentre a média aritmética e ± 1 desvio-padrão?
Aproximadamente 80% dos valores se posicionamentre a média aritmética e ± 1.28 desvio-padrão?
Aproximadamente 95% dos valores se posicionamentre a média aritmética e ± 2 desvios-padrão?
Avalie o gráfico da probabilidade normal
O gráfico da probabilidade normal é aproximadamente linear com inclinação positiva?
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-83
O Gráfico da Probabilidade Normal
Gráfico da Probabilidade Normal (etapas):
Organize os dados em uma sequência ordenada
Transforme cada valor ordenado em um valor de Z
Disponha em um gráfico os pares de valores. Os valores
observados da variável X no eixo vertical e no eixo
horizontal os valores de Z calculados com base na
ordem de cada valor observado.
Verifique visualmente se há evidências de linearidade.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-84
O Gráfico da Probabilidade Normal
30
60
90
-2 -1 0 1 2 Z
X
O gráfico da probabilidade normal para um conjunto de
dados com distribuição aproximadamente normal terá a
seguinte aparência:
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-85
O Gráfico da Probabilidade Normal
Assimetria à esquerda Assimetria à direita
Retangular
30
60
90
-2 -1 0 1 2 Z
X
30
60
90
-2 -1 0 1 2 Z
X
30
60
90
-2 -1 0 1 2 Z
X Gráficos não lineares
indicam um afastamento
do modelo de
distribuição normal.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-86
Distribuição Uniforme
A distribuição uniforme é uma distribuição de
probabilidade que tem probabilidades iguais
para todos os possíveis resultados da variável
aleatória. Todos os valores do espaço amostral
têm a mesma probabilidade de ocorrer.
Por causa disso ela é também chamada de
distribuição retangular
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-87
Distribuição Uniforme
A função densidade de probabilidade da Distribuição Uniforme :
contrário caso 0
bXaseab
1
Onde:
f(X) = valor da função densidade para qualquer valor de X
a = valor mínimo de X
b = valor máximo de X
f(X) =
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-88
Distribuição Uniforme
2
baμ
12
a)-(bσ
2
A média, ou valor esperado, de uma variável
que segue a distribuição uniforme é :
O desvio-padrão é :
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-89
Distribuição Uniforme
Exemplo: encontre os parâmetros (média e desvio
padrão) de uma v.a. que segue a distribuição
uniforme e assume valores entre 2 ≤ X ≤ 6 :
42
62
2
baμ
1547.112
2)-(6
12
a)-(bσ
22
f(X) = = .25 for 2 ≤ X ≤ 66 - 21
2 6
.25
X
f(X)
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-90
Distribuição Exponencial
Usada para modelar o tempo entre duas ocorrências
de um evento
Muito utilizada em Teoria das Filas para estudar o
tempo entre duas chegadas
Exemplos:
Tempo entre a chegada de clientes a um supermercado
Tempo entre chamadas telefônicas
Tempo entre transações em um terminal ATM
É uma distribuição assimétrica à direita que se
extende de zero até o infinito positivo
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-91
Distribuição Exponencial
Xe1X)chegada próxima da antes P(tempo λ
Definida por um único parâmetro, sua média λ
(lambda)
A probabilidade de que o tempo de chegada seja
menor que um tempo especificado X é
onde e = constante matemática aproximadamente igual a
2.71828
λ = a média aritmética do número de chegadas por
unidade
X = qualquer valor da variável contínua, em que
0 < X <
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 6-92
Distribuição Exponencial
Exemplo: Clientes chegam a um balcão de atendimento a
uma taxa de 15 por hora. Qual a probabilidade de que o
tempo de chegada entre dois clientes consecutivos seja
menor do que 3 minutos?
A média do número de chegadas por hora é 15, então λ = 15
3 minutos é igual a 0,05 horas
P(tempo entre chegadas < .05) = 1 – e-λX = 1 – e-(15)(0,05) =
0,5276
Então há 52,76% de probabilidade de que o tempo entre
chegadas sucessivas de clientes seja menor do que 3 minutos
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 7-93
Capítulo 7
Amostragem e Distribuições de
Amostragens
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 7-94
Objetivos
Neste capítulo, você aprenderá:
A distinguir entre diferentes métodos de
amostragem
O conceito de distribuição de amostragens
A calcular probabilidades relacionadas à
média aritmética da amostra e à proporção da
amostra
A importância do Teorema do Limite Central
População
População: é o “todo”
Também designado universo
Podem ser indivíduos, firmas, produtos manufaturados,
inventários, escolas, notas de aula, preços ou qualquer coisa que
possa ser mensurada, contada ou ordenada por postos;
Podem ser finitas ou infinitas;
Finitas: os produtos de um supermercado, os livros de uma biblioteca
Infinitas: produção futura de uma fábrica, nascimentos de insetos,
extrações com reposição de bolas de uma urna. Consistem
tipicamente em um processo que gera itens.
Refere-se a um conjunto específico de circunstâncias;
Ex: os alunos de uma sala de aula podem representar uma população
da qual extrairemos amostras para análise; em outra situação os
alunos da mesma sala de aula podem ser uma amostra de todos os
alunos do colégio, ou de toda a universidade.
Amostra
É a parcela do grupo que é examinada
População
Amostra
Estatística: Prof. André Carvalhal
Censo x Amostra
Censo: envolve estudar TODOS os elementos da população
Quando a amostragem é mais vantajosa:
Quando a população é infinita (processos que nunca
terminam)
A amostra pode ser mais atualizada que o censo
Quando a população tende a se modificar com o tempo
Quando a população tende a se deteriorar (ex: frutas
perecíveis, pesquisa em propagação de doenças)
Testes destrutivos (lâmpadas, munição, resistência de
concreto)
Quando o custo do censo é proibitivo
Quando o censo puder ter problemas de precisão (vários
agentes coletores aumentam a chance de erros)
Censo x Amostra
Quando o censo é mais vantajoso:
Quando a população é pequena
Quando o tamanho da amostra é grande em
relação ao da população. Ex: quando há grande
variabilidade na população a amostra terá que
ser grande para ser representativa, neste caso o
custo adicional para realizar o censo pode ser
pequeno
Se é necessário precisão completa Ex:
contagem de dinheiro em guichês de bancos
Tipos de Métodos de Amostragens
Amostra não-probabilística (ou não aleatória):
Os itens ou indivíduos são selecionados sem conhecer suas
respectivas probabilidades de seleção
As teorias da estatística inferencial não se aplicam
Exemplos de métodos: amostragem por conveniência e
amostragem por julgamento
Podem trazer problema de viés
Amostra probabilística (ou aleatória):
Itens selecionados com base em probabilidades conhecidas
Permite que se faça inferências isentas de viés
Na prática é difícil ou quase impossível obtê-la...
... mas você deve tentar e reconhecer eventuais vieses da
sua seleção.
Vantagens e Desvantagens
Vantagens Desvantagens
Aleatória
• a subjetividade do investigador não
interfere na escolha da amostra
• dificuldade de obter listagens
completas da população
• possibilidade de definir o tamanho da
amostra a partir da precisão e grau de
confiança desejado
• a seleção aleatória pode gerar amostra
dispersa geograficamente aumentando
os custos do estudo
Não aleatória
• menor custo • há unidades no universo que não tem
possibilidade de serem escolhidos
• menor necessidade de pessoal • pode ocorrer viés de opinião pessoal
• menor tempo de estudo • não se sabe com que grau de
confiança as conclusões obtidas podem
ser inferidas da população
Principais técnicas de amostragem
Técnicas de Amostragem
Probabilística ou
Aleatória
Não Probabilística ou
Não Aleatória
Simples
Estratificada
Sistemática
Conglomerado
Por conveniência
Por julgamento
Por quotas
Bola de neve
Amostragem aleatória de uma
população finita
Quantas amostras de tamanho n diferentes podem ser extraídas de uma
população finita de tamanho N, se:
(a) n = 2 e N = 12;
(b) n = 3 e N = 50?
Resposta: Combinação de N elementos tomados n a n
)!(!
!),(
nNn
N
n
NnNC
Uma amostra de tamanho n extraída de uma população finita de tamanho N é aleatória se é escolhida de tal modo que cada uma das
n
N amostras possíveis tem a mesma probabilidade
n
N
1 de serem
escolhidas.
Amostragem aleatória de uma
população finita
Como escolher as amostras?
Listando todas as amostras possíveis em pedacinhos de
papel, misturá-los e retirar “sem olhar”?
Listar os N elementos da população finita em
pedacinhos de papel e extrair n deles, um de cada vez,
sem reposição.
Exemplo: extrair n=12 de N=138 locais de escavação
arqueológica
No excel: função aleatórioentre(x;y)
Importante: todas as amostras extraídas devem ter a
mesma probabilidade de serem escolhidas/sorteadas
n
N
1
Amostragem aleatória de uma população
infinita
Uma amostra de tamanho n de uma população infinita é
aleatória se consiste em valores de variáveis aleatórias
independentes que têm a mesma distribuição.
O que é distribuição? normal, binomial etc..
Como assim independentes? A probabilidade de que cada variável
ocorra é a mesma e não depende das ocorrências anteriores.
Exemplo: resultado de doze jogadas de um dado {2, 5, 1, 3, 6, 4, 4, 5,
2, 4, 1, 2} são uma amostra aleatória se as variáveis são independentes
e têm a mesma distribuição de probabilidade
6,5,4,3,2,16
1)( ouxparaxf
Amostragem Sistemática
Conveniente quando a população está ordenada sob algum critério:
fichas de um fichário, lista telefônica
Calcula-se o intervalo de amostragem N/n aproximando-se para o
inteiro mais próximo: a.
Sorteia-se um no. aleatório x entre 1 e a.
A amostra será composta dos elementos x; x+a; x+2a;...
Exemplo: N=1000, n=200. Logo: a=1000/200=5
se 3 for o no. sorteado entre 1 e 5 os elementos da população
numerados por 3, 8, 13, ..., 998 irão compor a amostra
Frequentemente utilizada em pesquisas de opinião, realizadas em
locais públicos
Vantagens: amostras mais dispersas, fácil de ser conduzida
Desvantagem: a presença de periodicidades ocultas pode produzir
resultados tendenciosos
Amostragem aleatória estratificada
A população é dividida em subgrupos e a
amostragem aleatória é feita em cada subgrupo
Muito aplicada em populações com subgrupos
homogêneos internamente, mas diferentes entre si
Tamanhos de amostra para alocação proporcional População de tamanho N
k estratos de tamanhos N1, N2,..., Nk
Amostras de tamanhos n1, n2, ..., nk
keiparanN
Nn i
i ,...2,1
Amostragem por conglomerado
A população é subdividida em várias partes,
e algumas dessas subdivisões ou
conglomerados são selecionados
aleatoriamente para integrar a amostra
global.
Dentro de cada conglomerado pode-se
selecionar todos ou alguns elementos.
Principais técnicas de amostragemTécnicas de Amostragem
Probabilística ou
Aleatória
Não Probabilística ou
Não Aleatória
Simples
Estratificada
Sistemática
Conglomerado
Por conveniência
Por julgamento
Por quotas
Bola de neve
Amostragem por Conveniência
Quando a participação é voluntária
Quando os elementos da amostra são escolhidos por uma
questão de conveniência ou simplicidade
A amostra não é representativa da população
Deve ser empregada somente em casos especiais
Exemplo: um pesquisador deseja estudar o comportamento
dos preços de imóveis residenciais em lançamento em
Florianópolis e desenvolve sua amostragem coletando dados
em dois jornais da cidade
Amostragem por Julgamento
A amostra é escolhida segundo opinião de
um especialista
Não deve ser considerada representativa da
população
Exemplo: em uma pesquisa sobre os livros
mais relevantes para o mestrado e doutorado
em Contábeis um especialista elaborou a lista
dos alunos a serem entrevistados.
Amostragem por Quotas
Difere da amostragem estratificada pelo fato da seleção dos
elementos da população não ser aleatória
As vantagens do método estão na rapidez, economia e
facilidade de administração.
Exemplo: uma empresa deseja lançar um novo produto
de emagrecimento e o público-alvo são mulheres entre
15 e 40 anos das classes sociais A e B. A população é
dividida em categorias de acordo com as variáveis de
controle (idade e classe social). Uma amostra de 5% da
população recebe uma amostra grátis do produto.
Amostragem Bola de Neve
Identificam-se um ou mais indivíduos da população alvo,
e estes identificam outras observações que pertencem à
mesma população.
Bastante utilizado quando os elementos da população são
raros ou de difícil acesso.
Pode causar viés em função da indicação de amigos ou
especialistas
Exemplo: em uma pesquisa sobre potenciais novos
alunos uma escola de idiomas pretende atrair novos
alunos e, para cada aluno matriculado, oferece-se um
desconto na mensalidade se ele trouxer um novo aluno
para a escola.
Amostragem com ou sem reposição?
Questão relevante quando tratamos de populações finitas.
Se o tamanho da amostra é pequeno em relação à
população a questão torna-se irrelevante.
Uma regra prática é fazer a reposição quando o
tamanho da amostra excede 5% do tamanho da
população.
A extração de toda uma amostra de uma só vez equivale à
amostragem sem reposição.
Na amostragem com reposição é possível extrair um
mesmo item mais de uma vez.
Amostragem com ou sem reposição?
Há várias razões que justificam a amostragem sem reposição:
Os efeitos podem ser desprezíveis, e ela pode ser mais conveniente;
Se o teste for destrutivo é impossível repor os itens;
Na amostragem industrial pode ser difícil convencer os técnicos a
repor na população itens defeituosos;
Quando o exame de um item é custoso, a chance de examinar o
mesmo item mais de uma vez pode não ser desejável.
Quando a amostragem sem reposição é necessária e o tamanho da
amostra é relativamente grande em relação ao tamanho da população, o
cálculo das probabilidades relevantes se faz pela distribuição
hipergeométrica.
Avaliando a validade da pesquisa
Erros em pesquisas:
Erro de cobertura: quando certos grupos (ou extratos) da população
não foram identificados e portanto não estarão representados na
amostra. Causam viés de seleção.
Erro por falta de resposta: por exemplo quando pessoas não
respondem a questionários enviados. Causa viés por falta de
resposta.
Erro de amostragem: quando uma amostra é selecionada porque é
mais simples, menos dispendiosa e mais eficaz.
Erro de medição: pode ocorrer por deficiências na formulação da
pergunta; por influência do entrevistador sobre o entrevistado; e
por erro do respondente.
Antes de tudo...
... vocês lembram que:
Estatística Parâmetro
PopulaçãoAmostra
E usamos estatíticas das amostras
para estimar parâmetros da população
Finalidade da amostragem
Obter uma indicação do valor de um ou mais
parâmetros de uma população, tais como
média, o desvio padrão populacional, ou a
proporção de itens que possuem
determinadas característica.
Variabilidade Amostral
Mas você pode retirar várias amostras
diferentes de uma mesma população!!
Cada amostra pode te dar diferentes valores
para a média, desvio-padrão ou proporção.
Como saber então qual o valor do parâmetro
na população?
É preciso conhecer como a estatística varia
de amostra para amostra...
Exemplo
Vamos supor uma população finita com 5 elementos, que são os
números 3, 5, 7, 9, 11.
Neste caso, é fácil calcular os parâmetros média e desvio padrão
da população:
A média dessa população é
E seu desvio padrão é
Vamos supor que eu não pudesse calcular diretamente a média
da população e tivesse que fazê-lo através de estimativas com
base em amostras de 2 elementos...
75
119753
83,28
5
7117977757322222
Exemplo
Quantas amostras diferentes seria possível montar?
Vamos listar as amostras e suas médias:
Cada amostra tem uma probabilidade de ser escolhida
igual a 1/10.
10!32
!345
!3!2
!5
2
5
x
xx
Amostras 3 e 5 3 e 7 3 e 9 3 e 11 5 e 7 5 e 9 5 e 11 7 e 9 7 e 11 9 e 11
Médias 4 5 6 7 6 7 8 8 9 10
Exemplo
Posso calcular a probabilidade de encontrar cada um dos diferentes valores de
média nas amostras, que será:
Prob.
4 1/10
5 1/10
6 2/10
7 2/10
8 2/10
9 1/10
10 1/10
x
0,00
0,05
0,10
0,15
0,20
0,25
4 5 6 7 8 9 10
O que acabamos de
construir foi uma
distribuição de
probabilidades da
média da amostra
Mas isso nada mais é
do que uma
Distribuição Amostral!!
Distribuição Amostral
Uma distribuição amostral é uma distribuição de probabilidades
que indica até que ponto uma estatística amostral tende a variar
devido a variações casuais na amostragem aleatória.
Voltando ao Exemplo
No nosso exemplo qual a média das médias nas amostras? E
qual o desvio-padrão dessas médias?
Prob.
4 1/10
5 1/10
6 2/10
7 2/10
8 2/10
9 1/10
10 1/10
710
110
10
19
10
28
10
27
10
26
10
15
10
14 x
3
310
1710
10
179
10
278
10
277
10
276
10
175
10
174
22222222
x
x
x
É igual a média
da população
É menor que o
desvio padrão da
população
Vamos ver outro exemplo, agora fazendo a
amostragem com reposição...
Exemplo 2
Suponha uma população (simplificada) de quatro
pessoas de seu departamento.
Tamanho da população N=4
Variável aleatória, X, é a idade dos indivíduos
Valores de X: 18, 20, 22, 24 (anos)
Exemplo 2
Parâmetros da distribuição da População:
214
24222018
N
Xμ i
2.236N
μ)(Xσ
2
i
.3
.2
.1
018 20 22 24
A B C D
P(x)
x
Distribuição Uniforme
Exemplo 2
1o.
Obs.
2o. Observação
18 20 22 24
18 18,18 18,20 18,22 18,24
20 20,18 20,20 20,22 20,24
22 22,18 22,20 22,22 22,24
24 24,18 24,20 24,22 24,24
Agora, considere todas as amostras possíveis de
tamanho n=2
1o.
Obs.
2o. Observação
18 20 22 24
18 18 19 20 21
20 19 20 21 22
22 20 21 22 23
24 21 22 23 24
16 médias
amostrais
16 amostras possíveis
(amostragem com
reposição)
Exemplo 2
Distribuição Amostral de todas as médias
amostrais
1o.
Obs
2o. Observação
18 20 22 24
18 18 19 20 21
20 19 20 21 22
22 20 21 22 23
24 21 22 23 24
16 médias
amostrais
18 19 20 21 22 23 240
.1
.2
.3
P(X)
X
(não é mais uniforme)
Distribuição das
médias amostrais
_
Exemplo 2
2116
24211918
N
Xμ i
X
1.5816
21)-(2421)-(1921)-(18
N
)μX(σ
222
2
Xi
X
Parâmetros da distribuição amostral da média
Exemplo 2
População
N = 4
1.58σ 21μX
X2.236σ 21μ
Distribuição Amostral da Médian = 2
18 20 22 24
A B C D
0
.1
.2
.3
P(X)
X 18 19 20 21 22 23 240
.1
.2
.3 P(X)
X_
_
Por enquanto... pelo menos em nossos
exemplos...
x , a média da distribuição amostral de x , é igual a , a
média da população; x , o desvio padrão da distribuição
amostral de x , é menor do que
, o desvio padrão
populacional.
Observem a notação!!!!
x , a média da distribuição amostral de x , é igual a , a
média da população; x , o desvio padrão da distribuição
amostral de x , é menor do que
, o desvio padrão
populacional.
Observem a notação!!!!
Mas... será que sempre podemos enumerar todas as amostras
possíveis para então analisar a média amostral e quanto ela
está próxima da média da população?
Não!!
Alguns teoremas solucionam a questão...
Teorema 1:
Para amostras aleatórias de tamanho n extraídas de uma
população com média e o desvio padrão
, a distribuição
amostral de x tem média x .
Erro Padrão
Desvio padrão da estimativa
Erro padrão: quanto menor, melhor!
Erro padrão da média para populações infinitas e finitas:
1
N
nN
nou
nxx
O que acontece se o erro padrão é pequeno? E se ele for grande?
O que determina o tamanho do erro padrão?
Você lembra?
Fator de
correção
para populações
finitas!!
Veja que interessante...
No primeiro exemplo dessa aula tínhamos uma população com 5 elementos:
3, 5, 7, 9, 11
A média e o desvio padrão da população eram:
Aí, listamos todas as amostras possíveis e calculamos a média e o desvio-
padrão (erro padrão) das médias das amostras:
Mas, se calcularmos o erro-padrão pela expressão do slide anterior, teremos:
87 e
37 xx e
342
38
15
25
2
8
1
N
nN
nx
As expressões nos dão o erro padrão sem que seja necessário listar todas as
amostras possíveis, calcular suas médias e então obter o erro padrão da média
das amostras!!
Efeito do tamanho da amostra sobre uma
distribuição amostral
À medida que aumenta o tamanho da amostra, há
variabilidade cada vez menor entre as médias das
amostras;
A média da distribuição amostral é igual ao
parâmetro da população, ou seja, é igual à média da
população;
Na medida em que o tamanho da amostra aumenta, a
distribuição dos resultados amostrais tende para a
forma da distribuição.
Distribuição Amostral da Média
Erro Padrão: População Normal
μμX
n
σσ
X
Se a população é normal com média μ e desvio-padrão σ, a
distribuição amostral da média é também distribuída
normalmente com
e
(Assume-se que a amostragem é feita com reposição ou sem
reposição em uma população infinita)
Distribuição Amostral da Média
Valor Z: População Normal
n
σ
μ)X(
σ
)μX(Z
X
X
• Valor-Z para a distribuição amostral da média:
onde: = média da amostra
= média da população
= desvio padrão da população
n = tamanho da amostra
Xμ
σ
Distribuição Amostral da Média
Propriedades: População Normal
(i.e. é nãoviesada )
População segue
Distribuição Normal
Distribuição Amostral da
média segue Distribuição
Normal
(com a mesma média)
μμx
xx
x
μ
xμ
Distribuição Amostral da Média
Propriedades: População Normal
Para amostragem com reposição:
À medida que n aumenta,
diminuixσMaior tamanho
de amostra
Menor tamanho
de amostra
xμ
Teorema do Limite Central
Para grandes amostras, a distribuição amostral da média pode
ser muito bem aproximada por uma distribuição normal,
lembrando que para populações infinitas:
Podemos então dizer formalmente que:n
e xx
Se x é a média de uma amostra aleatória de tamanho n de uma população
infinita com a média μ e o desvio padrão σ e se n é grande então
n
xz
/
tem aproximadamente a distribuição normal padrão.
Teorema do Limite Central
Se aplica a populações infinitas...
... e a populações finitas em que n é grande mas representa
uma porção pequena da população, ou seja, n/N é pequeno
Para a maioria das distribuições, n > 30 dará uma
distribuição amostral próxima da normal
Para distribuições aproximadamente simétricas, n > 15, a
distribuição amostral também estará próxima da normal
Quando sabemos que a população tem distribuição normal, a
distribuição amostral da média pode ser aproximada pela
normal, independentemente do tamanho de n.
X
Teorema do Limite Central
À medida
em que o
tamanho
da
amostra
aumenta
(n 30) ...
Estatística: Prof. André Carvalhal
X
Teorema do Limite Central
A distribuição
amostral torna-
se praticamente
normal.
À medida
em que o
tamanho
da
amostra
aumenta
(n 30) ...
Estatística: Prof. André Carvalhal
X
Teorema do Limite Central
A distribuição
amostral torna-
se praticamente
normal.
À medida
em que o
tamanho
da
amostra
aumenta
(n 30) ...
xn
x
Estatística: Prof. André Carvalhal
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 7-145
Distribuições de Amostragens
População não-normal
Distribuição da População
Distribuição das amostras
(aproxima-se da normal quando n cresce)
x
x
Amostra
grandeAmostra pequena
xμ
μ
Distribuição Amostral da Média
Exemplo
Suponha uma população com média μ = 8 e desvio-padrão σ = 3.
Suponha uma amostra aleatória de tamanho n = 36 é selecionada.
Qual a probabilidade de que a média amostral esteja entre 7.75 e
8.25?
Mesmo que a população não seja normalmente distribuída, o
Teorema do Limite Central pode ser usado (n > 30).
Então, a distribuição amostral da média é aproximadamente normal
com
8μx 0.536
3
n
σσx
Distribuição Amostral da Média
Exemplo
5.0
363
8-8.25
5.0
363
8-7.75
Z
Z
Primeiro, vamos calcular os valores-Z para 7.75
e 8.25.
0.38300.5)ZP(-0.5 8.25) μ P(7.75X
Agora, usando uma tabela de probabilidades da
Distribuição Normal teremos:
Distribuição Amostral da Média
Exemplo
= 2(.5000-.3085)
= 2(.1915)
= 0.3830
Z-0.5 0.5
Distribuição Normal
Padrão
0μz 7.75 8.25
Distribuição
Amostral
Amostra
8μX x
Distribuição da
População
8μ X
Distribuição Amostral da Proporção
amostra da tamanho
interesse de ticacaracterís a com amostra na de número
n
X itensp
• A proporção da população com determinada
característica é denotada por π.
• A proporção da amostra ( p ) com esta característica dá
uma estimativa de π:
– 0 ≤ p ≤ 1
– p segue uma Distribuição Binomial
(Assume-se que a amostragem é feita com reposição ou sem reposição em uma
população infinita)
Distribuição Amostral da Proporção
Erro padrão para a proporção:
n
)(1σp
n
)(1σZ
p
pp
• Valor-Z para a proporção:
Distribuição Amostral da Proporção
Exemplo
Se em um plebiscito a proporção de votantes à favor
da Proposta A é π = .4, qual a probabilidade de que
em uma amostra de 200 pessoas a proporção de
votantes a favor esteja entre .40 and .45?
• Em outras palavras, se π = .4 e n = 200, qual a
P(.40 ≤ p ≤ .45) ?
Distribuição Amostral da Proporção
Exemplo
.03464200
.4).4(1
n
)(1σ
p
1.44)ZP(0
.03464
.40.45Z
.03464
.40.40P.45)P(.40
p
Encontre :
Converta para
a Normal
Padronizada:
pσ
Distribuição Amostral da Proporção
Exemplo
Use a tabela de probabilidade Normal acumulada:
P(0 ≤ Z ≤ 1.44) = P(Z ≤ 1.44) – 0.5 = .4251
Z.45 1.44
.4251
Padronize
Distribuição AmostralDistribuição Normal
Padronizada
.40 0p
Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 5-154
Resumo da AulaHoje vimos:
Probabilidades de variáveis aleatórias discretas
Definimos covariância e sua aplicação em finanças
Discutimos as distribuições Binomial, de Poisson e Hipergeométrica
Estudamos as distribuições contínuas: normal, uniforme e exponencial
Calculamos probabilidades usando fórmulas e tabelas
Identificamos como avaliar a normalidade
Descrevemos as diferentes formas de amostragem
Itroduzimos as distribuições de amostragens
Descrevemos a distribuição amostral da média
Para populações normais Usando o Teorema do Limite Central
Descrevemos a distribuição amostral da proporção
Calculamos probabilidades usando as distribuições amostrais
Top Related