Distribuições amostragem

59
ESTATÍSTICA O Professor: Manuel do Carmo 88 DISTRIBUIÇÕES POR AMOSTRAGEM 1. Introdução Neste ponto encerra-se o percurso dedutivo “população amostra”. Partindo do conhecimento da população, caracterizar-se-ão as distribuições de certas estatísticas amostrais, ou seja, analisar-se-á a forma como tais estatísticas variam de amostra para amostra. Para que tal seja possível, é necessário que as amostras sejam seleccionadas de acordo com processos probabilísticos (isto é, processos que tornem possível o cálculo da probabilidade de cada

Transcript of Distribuições amostragem

Page 1: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 88

DISTRIBUIÇÕES POR AMOSTRAGEM

1. Introdução

Neste ponto encerra-se o percurso dedutivo “população → amostra”.

Partindo do conhecimento da população, caracterizar-se-ão as

distribuições de certas estatísticas amostrais, ou seja, analisar-se-á a

forma como tais estatísticas variam de amostra para amostra. Para

que tal seja possível, é necessário que as amostras sejam

seleccionadas de acordo com processos probabilísticos (isto é,

processos que tornem possível o cálculo da probabilidade de cada

Page 2: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 89

elemento da população ser incluído em cada amostra). Nesta

disciplina considerar-se-á apenas o processo de amostragem

aleatória, como o mais importante dos processos probabilísticos. Note-

se que se utilizam frequentemente outros processos de amostragem,

designadamente os processos de amostragem estratificada e por

conglomerados.

DEF. 1 – Amostragem Aleatória Quando as n variáveis aleatórias observadas, componentes do vector

(X1, X2,...., Xn) são independentes e identicamente distribuídas –

simbolicamente iid – diz-se que se trata de amostragem casual ou

aleatória.

Page 3: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 90

Ao pedir que as variáveis sejam identicamente distribuídas pretende-

se que os Xi, i=1, 2,..., n, sejam “cópias” da variável aleatória X que

representa o atributo da população em estudo. Ao pedir independência

está a pensar-se que, se a função de distribuição de X é F(x), a função

de distribuição conjunta das n variáveis Xi que compõem a amostra

aleatória se determina facilmente, pelo produto

F(x1,x2,….,xn) = F(x1)F(x2).....F(xn) (1)

Que se designa por distribuição da amostra. Esta distribuição traduz a

estrutura da população de amostras de dimensão n (do espaço -

amostra) obtidas da população representada pela variável aleatória X.

Page 4: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 91

Na maior parte das situações estamos em situação de inferência

estatística paramétrica.

Neste caso, a forma de F é, ou supõe-se, conhecida, seja F(x|θ), e

desconhece-se apenas o “verdadeiro” valor do parâmetro (escalar ou

vector), isto é, o valor particular que indexa a função de distribuição

que descreve “apropriadamente” as condições em que se observam

as variáveis ou, como também se diz, o processo gerador de dados.

A especificação consiste, neste caso, em admitir que F(x|θ) pertence a

uma família de expressão analítica conhecida,

ℱθ={F(x|θ): θ ∈ Θ}, (2)

Page 5: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 92

em que o parâmetro, escalar ou vector, assume valores em dado

conjunto Θ designado por espaço-parâmetro. O conjunto ℱθ é a família

das funções de distribuiçao F para todos os valores possíveis de θ ∈

Θ, e constitui o modelo probabilístico a considerar na inferência

estatística paramétrica.

DEF. 2 – Estatística Uma estatística é uma variável, ou vector aleatório, T(X1, X2,...., Xn),

função da amostra aleatória X1, X2,...., Xn, que não envolve qualquer

parâmetro desconhecido.

Page 6: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 93

Se X1, X2,...., Xn é amostra casual de população normal N(μ, σ2) com

parâmetros μ e σ2 desconhecidos, são exemplos de estatísticas

unidimensionais:

iiX∑ , 1

iiX X

n= ∑ , 2

iiX∑ , 21

iiX

n ∑

não são estatísticas as funções:

1 ( )iX μσ

−∑ , 1ii

Xσ ∑ , 2

21

iiX

σ ∑

porque dependem de parâmetros desconhecidos.

Page 7: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 94

2. Primeiros resultados sobre a média e a variância amostrais

Vamos neste ponto determinar o valor esperado e a variância das

estatísticas, 1

iiX X

n= ∑ e 2 21 ( )iS X X

n= −∑ , que são como se sabe, a

média amostral e a variância amostral, respectivamente.

Os teoremas que se seguem são de estrema importância, para

distinguir entre parâmetros da população e parâmetros da distribuição

por amostragem, bem como estabelecer relações entre eles.

Page 8: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 95

Teorema: 1 Se (X1, X2,...., Xn) é amostra casual de população para a qual existem

média μ = E(Xi) e variância σ2 = Var(Xi) (i=1, 2,.....,n), tem-se

( )E X μ= , Var

2

( )Xnσ

= (3)

Teorema: 2 Se (X1, X2,...., Xn) é amostra casual de população para a qual existem

média μ = E(Xi) e variância σ2 = Var(Xi) (i=1, 2,.....,n), tem-se

2 21( ) nE Sn

σ−= , (4)

Page 9: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 96

Para o caso de se tratar de amostras de pequena dimensão (n<30), é

usual propor outra estatística para estimar σ2, a designada variância

corrigida,

2 21´ ( )1 iS X X

n= −

− ∑ , que verifica E(S´2) = σ2, e que não subavalia,

em média, a variância da população.

De modo a “justificar” alguns dos resultados a utilizar posteriormente,

vamos de seguida enunciar um teorema, encarado por muitos como

fundamental para a inferência estatística amostral.

Page 10: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 97

Teorema: 3 – Teorema do limite central Dada a sucessão de variáveis aleatórias iid, X1, X2,...., Xn,...., com

média μ e variância σ2, então, quando n→+∞, a função de distribuição

da variável aleatória, 1

nii

n

X nZ

n

μ

σ=

−= ∑ (5)

tende para uma função de distribuição N(0, 1), ou seja, a distribuição

assimptótica de Zn é N(0, 1). Simbolicamente, Zn a~ N(0, 1).

A conclusão do teorema, pode exprimir-se na forma alternativa

1lim ( ) lim ( )n

iinn n

X nP Z x P x x

n

μ

σ=

→+∞ →+∞

⎛ ⎞−⎜ ⎟≤ = ≤ = Φ⎜ ⎟⎝ ⎠

∑ ,

Page 11: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 98

ou, ainda,

1( ) ( )n

iin

X nP Z x P x x

n

μ

σ=

⎛ ⎞−⎜ ⎟≤ = ≤ ≈ Φ⎜ ⎟⎝ ⎠

∑ (n grande).

Exemplo 1

Analisando o mercado de certo produto, uma empresa conclui que a

procura diária (em centenas de quilogramas) a satisfazer é uma

variável aleatória X com média 40 e variância 25. Sendo a produção

anual planeada de 11 500, pretende calcular-se a probabilidade de

haver procura anual excedentária, considerando que um ano tem 289

dias úteis.

Page 12: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 99

Representando por Xi, i=1, 2, 289, a variável aleatória que exprime a

procura no i-ésimo dia, tem-se E(Xi) = 40 e Var(Xi) = 25; pretende

calcular-se ( )289

111 500ii

P X=

>∑ , como não se conhece a distribuição

das variáveis aleatórias Xi, o cálculo é efectuado através do teorema

0.8.

Tem-se,

( )289

111 500ii

P X=

>∑ =

289

1289 40 11500 289 40

25 289 25 289ii

XP =⎛ ⎞− × − ×⎜ ⎟>⎜ ⎟× ×⎝ ⎠

≈ 1 - Φ(-0.71) = 1 – [1 -Φ(0.71)] = Φ(0.71) =0.7611.

Page 13: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 100

Corolário: Dada a sucessão de variáveis aleatórias iid, X1, X2,..., Xn,..., com

média μ e variância σ2, então ~ (0,1)aX N

n

μσ− (6)

onde 1

nii

XX

n== ∑

Uma forma alternativa de expressar o corolário anterior, é 2

~ ,a

X Nnσμ

⎛ ⎞⎜ ⎟⎝ ⎠

(7)

Page 14: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 101

3. Aproximações para distribuições discretas

Considere-se, em primeiro lugar, a aproximação da distribuição de

Bernoulli pela Normal.

Corolário: Dada a sucessão de variáveis aleatórias iid, X1, X2,..., Xn,..., com

distribuição de Bernoulli média E(Xi)=θ, e portanto, Var(Xi)=θ(1-θ), tem-

se 1 ~ (0,1)(1 )

na

iiX n

Nn

θ

θ θ=

−∑ (8)

De outra forma, considere-se 1

nii

X X=

= ∑ , variável aleatória com

distribuição binomial. Assim, quando n é grande, as probabilidades

Page 15: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 102

binomiais que exigem cálculos laboriosos podem obter-se rapidamente

de forma aproximada recorrendo ao corolário anterior.

Suponha-se que, com X ∼ B(n, θ), pretende calcular-se P(a ≤ X ≤ b), a

e b inteiros, 0 ≤ a < b ≤ n. Como se sabe, P(a ≤ X ≤ b) =

(1 )b n x n xxx a

C θ θ −=

−∑ , para valor exacto da probabilidade pretendida.

Com n grande, o cálculo da expressão do segundo membro é muito

trabalhoso, principalmente se não for possível recorrer a um

computador.

Page 16: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 103

Contudo, P(a ≤ X ≤ b) = (1 ) (1 ) (1 )

a n X n b nPn n n

θ θ θθ θ θ θ θ θ

⎛ ⎞− − −≤ ≤⎜ ⎟⎜ ⎟− − −⎝ ⎠

, e

em virtude do corolário anterior ~(1 )

aX nn

θθ θ−−

N(0, 1)

e, portanto, P(a ≤ X ≤ b) ≈Φ

(1 )b nn

θθ θ

⎛ ⎞−⎜ ⎟⎜ ⎟−⎝ ⎠

- Φ

(1 )a nn

θθ θ

⎛ ⎞−⎜ ⎟⎜ ⎟−⎝ ⎠

(9)

Caso n não seja muito grande, ou então se nos pedem P(X = x),

devemos substituir a por a - 0.5 e b por b + 0.5. Nesta situação, os

resultados obtidos são mais aproximados.

Page 17: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 104

Considerem-se, agora, algumas regras práticas para o cálculo de

probabilidades que envolvem a distribuição binomial. - Se n ≤ 20, deve utilizar-se directamente a distribuição binomial, o que permite o cálculo

exacto das probabilidades a partir dos valores apresentados em qualquer tabela da

distribuição em causa;

- Se n > 20, o cálculo aproximado das probabilidades deve atender aos seguintes casos:

Se θ ≤ 0.1, deve utilizar-se a aproximação de Poisson1 à Binomial;

Se θ ≥ 0.9, também se deve utilizar a já referida aproximação, considerando o

respectivo acontecimento complementar,

Se 0.1 < θ < 0.9, recorre-se à aproximação pela normal standardizada.

1 Def: Distribuição de Poisson

Uma variável aleatória X com função de probabilidade f(x|λ)=!x

e xλλ−, x=0, 1, 2,....,...(λ>0), diz-se que tem distribuição de Poisson. Simbolicamente, X ∼ Po(λ). As suas média e variância,

são respectivamente: E(X)=λ e Var(X)=λ

Page 18: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 105

Refira-se, no entanto, que neste curso as situações a estudar devem

contemplar, unicamente, o último caso.

Exemplo 2

Seja a variável aleatória X ∼ B(200, 0.5). Neste caso, Θ = P(95 ≤ X ≤

105) deve interpretar-se como sendo a probabilidade par que, em 200

lançamentos de uma moeda, o número de “faces” não apresente em

relação a E(X) = 200 × 0.5 = 100 um desvio superior a 5. O valor

exacto de Θ é, Θ = 105 200 20095

(0.5) (0.5)x xxx

C −=∑ = 0.563246, sendo o

cálculo tedioso caso se não disponha de computador. Recorrendo à

aproximação 9 e a uma tabela da distribuição Binomial,

Page 19: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 106

Θ = 95 200 0.5 200 0.5 105 200 0.5200 0.5 0.5 200 0.5 0.5 200 0.5 0.5

XP − × − × − ×⎛ ⎞≤ ≤⎜ ⎟× × × × × ×⎝ ⎠

≈ Φ 105 100

50−⎛ ⎞

⎜ ⎟⎝ ⎠

- Φ 95 100

50−⎛ ⎞

⎜ ⎟⎝ ⎠

≈ Φ(0.7071) - Φ(-0.7071) = 2×Φ(0.7071) – 1 = 0.520498

No entanto, se substituíssemos 105 por 105+0.5 e 95 por 95-0.5, a

aproximação era muito melhor, pois

Θ ≈ Φ 105 0.5 100

50+ −⎛ ⎞

⎜ ⎟⎝ ⎠

- Φ 95 0.5 100

50− −⎛ ⎞

⎜ ⎟⎝ ⎠

≈ Φ(0.7778) - Φ(-0.7778) = 2×Φ(0.7778) –1 = 0.563316

Page 20: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 107

4. Amostragem de população de Bernoulli. Caso de uma

proporção.

Considere-se uma população de Bernoulli. Esta população é

composta por elementos de dois tipos – os que possuem e os que não

possuem determinado atributo – e é caracterizada por uma função

probabilidade da família,

ℱθ = {f(x|θ) = θx (1 - θ)1-x : x ∈ {0, 1} ∧ 0 < θ < 1}.

O parâmetro θ, que também se designa por proporção verdadeira, é

naturalmente a principal incógnita na amostragem de populações de

Bernoulli.

Page 21: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 108

A amostra casual de populações de Bernoulli, (X1, X2,........, Xn), é o

conjunto de n variáveis aleatórias independentes e identicamente

distribuídas, com função probabilidade individual da família ℱθ e

função probabilidades conjunta

1ni=Π f(xi|θ) = (1 )i ii i

x n xθ θ −∑ ∑− , 0 < θ < 1, xi ∈ {0, 1}, i = 1, 2,…..n (10)

Na amostragem de populações de Bernoulli interessa sobretudo

estabelecer a distribuição por amostragem de duas estatísticas:

- Y = Σi Xi, que representa o número (frequência absoluta) de

elementos que na amostra possuem o atributo;

Page 22: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 109

- X = Σi Xi /n, que representa a proporção observada, isto é, a

frequência relativa de elementos que na amostra possuem o

atributo.

A solução para tais “problemas” aparece, naturalmente, através da

distribuição binomial.

Considere-se Y, soma de n variáveis aleatórias independentes com

distribuição de Bernoulli, ou seja Y ∼ B(n, θ), e

P(Y = y) = nCy θy (1 - θ)n-y, y = 0, 1, 2,……n

P( X = z) = P(Y = nz) =

= nCnz θnz (1 - θ)n-nz, z = 0/n, 1/n, 2/n,……n/n (11)

Page 23: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 110

A distribuição binomial aparece, desta forma, acometida em

distribuição por amostragem.

Quando a dimensão da amostra é razoavelmente grande, podemos

escrever

~ (0,1)(1 )

aY n Nn

θθ θ−−

(12)

ou

~ (0,1)(1 )

aX N

n

θθ θ

−−

(13)

As aproximações consideradas poderão ser melhoradas se utilizarmos

as correcções de continuidade consideradas anteriormente.

Page 24: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 111

Com efeito, se substituirmos a por a-0.5 e b por b+0.5, obtemos a

sequência

P(a ≤ X ≤ b) ≈ Φ 0.5

(1 )b n

θ θ

⎛ ⎞+ −⎜ ⎟⎜ ⎟−⎝ ⎠

- Φ 0.5

(1 )a n

θ θ

⎛ ⎞− −⎜ ⎟⎜ ⎟−⎝ ⎠

, 0 < a < b ≤ n (14)

ou de forma equivalente

a bP Xn n

⎛ ⎞≤ ≤⎜ ⎟⎝ ⎠

≈ Φ

12(1 )

bn n

n

θ

θ θ

⎛ ⎞+ −⎜ ⎟

⎜ ⎟−⎜ ⎟

⎜ ⎟⎝ ⎠

- Φ

12(1 )

an n

n

θ

θ θ

⎛ ⎞− −⎜ ⎟

⎜ ⎟−⎜ ⎟

⎜ ⎟⎝ ⎠

, 0 < an

< bn

≤ 1 (15)

Assim, quando a dimensão da amostra o permite, os problemas

binomiais são “transportados” para a esfera de aplicação da

Page 25: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 112

distribuição normal e tornam mais acessíveis os cálculos. Por vezes,

torna-se aconselhável recorrer à lei dos acontecimentos raros,

utilizando a distribuição de Poisson para lidar com problemas de

Bernoulli.

Exemplo 3

Admita-se que uma instituição bancária classifica os seus clientes

possuidores de cartão de crédito em “maus” e “bons” riscos, conforme

tenham ou não faltado a um pagamento nos últimos 2 anos. Suponha-

se que a proporção de “maus” riscos (classificados com X=1) é de

0.05 para as agências da zona de Lisboa.

Page 26: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 113

Qual a probabilidade de se obter pelo menos 10% de “maus” riscos

numa amostra de:

a) 10 clientes;

b) 50 clientes;

c) 400 clientes?

Para responder a qualquer uma das alíneas, devemos calcular

( 0.1)P X ≥ , sabendo-se que Xi ∼ B(1, 0.05) para i=1,2,...,n.

a) Neste caso, pequena amostra, utiliza-se a distribuição Binomial,

( 0.1)P X ≥ = 10

1( 10 0.1)ii

P X=

≥ ×∑ = 10

1( 1)ii

P X=

≥∑ =1- 10

1( 0)ii

P X=

=∑ =1-

0.5987=0.4013,

recorrendo à Tabela da Binomial.

Page 27: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 114

b) Nesta situação, o recurso à distribuição Binomial, é muito

“laborioso”, no entanto nθ=50×0.05=2.5<5. Como θ é pequeno pode

utilizar-se a lei dos acontecimentos raros, ou seja, a aproximação à

Poisson2 de parâmetro igual a nθ.

Assim, ( 0.1)P X ≥

= ( ) ( ) ( )50 50 50

1 1 150 0.1 5 1 4i i ii i i

P X P X P X= = =

≥ × = ≥ = − ≤∑ ∑ ∑

≈ 1 – (0.0821+0.2052+0.2565+0.2138+0.1336)=0.1088, utilizando a

tabela da distribuição de Poisson, com parâmetro 2.5.

c) Como se trata de uma grande amostra, utilizamos (14), isto é, 2 A regra prática para utilizar esta “lei” deve basear-se no pressuposto de que se tem um acontecimento raro e um número “elevado” de observações. Assim, não é aconselhável fazer a

Page 28: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 115

( 0.1)P X ≥ = 0.05 0.1 0.05

0.05(1 0.05) 0.05(1 0.05)400 400

XP

⎛ ⎞⎜ ⎟− −⎜ ⎟≥

− −⎜ ⎟⎜ ⎟⎝ ⎠

≈1-Φ 0.1 0.05

0.05(1 0.05)400

⎛ ⎞⎜ ⎟−⎜ ⎟

−⎜ ⎟⎜ ⎟⎝ ⎠

≈ 1 - Φ(4.59) ≈ 0, se não se proceder à correcção de continuidade,

ou então

aproximação quando 0.1<θ<0.9 (quando θ≥0.9, é evidente que o acontecimento em causa não é “raro”; é o, sim, o seu complementar) ou quando n≤20.

Page 29: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 116

( 0.1)P X ≥ =

10.1 0.050.05 8000.05(1 0.05) 0.05(1 0.05)

400 400

XP

⎛ ⎞− −⎜ ⎟−⎜ ⎟≥

− −⎜ ⎟⎜ ⎟⎝ ⎠

≈1-Φ

10.1 0.05800

0.05(1 0.05)400

⎛ ⎞− −⎜ ⎟

⎜ ⎟−⎜ ⎟

⎜ ⎟⎝ ⎠

≈ 1 - Φ(4.47) ≈ 0, o que é teoricamente mais correcto.

Page 30: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 117

5. Amostragem de população de Bernoulli. Caso de duas

proporções.

Considerem-se agora duas populações de Bernoulli, com parâmetros

θ1 e θ2. A ideia de comparar as duas proporções verdadeiras, θ1 e θ2,

surge em muitas situações praticas (por exemplo, proporção de curas

nos doentes tratados com o medicamento A e nos doentes tratados

com o medicamento B; proporção de peças defeituosas quando se

emprega o processo A e quando se emprega o processo B).

Então, nos estudos de amostragem, a diferença entre proporções

verdadeiras, θ1 - θ2, nunca pode ser conhecida exactamente; no

Page 31: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 118

entanto, podem estabelecer-se inferências através da estatística

1 2X X− (a diferença entre proporções observadas) calculadas,

respectivamente, a partir de amostra casual da primeira população,

(X11, X12,...., X1m) ⇒ 11 1

m ii

XXm=

= ∑ ,

e de amostra casual da segunda população,

(X21, X22,...., X2n) ⇒ 22 1

n jj

XX

n== ∑ ,

amostras que se supõem escolhidas independentemente uma da

outra.

Page 32: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 119

Como não se conhece a distribuição exacta, só pode estudar-se a

distribuição assimptótica de 1 2X X− , válida quando as dimensões das

amostras são razoavelmente grandes. Tem-se, então

1 11 1

(1 )~ ,a

X Nm

θ θθ −⎛ ⎞⎜ ⎟⎝ ⎠

, e 2 22 2

(1 )~ ,a

X Nn

θ θθ −⎛ ⎞⎜ ⎟⎝ ⎠

(16)

Consequentemente, e utilizando a propriedade (corolário anterior) que

estabelece que a diferença de duas variáveis aleatórias independentes

com distribuição normal (aproximadamente normal) tem distribuição

Page 33: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 120

normal (aproximadamente normal), tem-se, depois de estandardizar, o

resultado

( )1 2 1 2

1 1 2 2

~ (0,1)(1 ) (1 )

aX XN

m n

θ θθ θ θ θ

− − −

− −+

(17)

Para tal, basta notar que

E( 1 2X X− ) = E( 1X ) – E( 2X ) = θ1 - θ2,

e Var( 1 2X X− ) = Var( 1X ) + Var( 2X ) = 1 1 2 2(1 ) (1 )m n

θ θ θ θ− −+

Page 34: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 121

Exemplo 4

Retome-se o exemplo 3 e suponha-se que a percentagem de “maus”

riscos na zona do Porto é de 0.06. recolhidas amostras independentes

nas zonas de Lisboa e Porto de dimensões 400 e 500,

respectivamente, qual a probabilidade de se observar uma proporção

maior de “maus” riscos em Lisboa do que no Porto?

A resposta é, então, encontrada calculando P( 1 2X X− >0), onde o

índice 1 designa a amostra de Lisboa, e o índice 2, a do Porto. Como

se trata de grandes amostras, recorremos a (17)

Page 35: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 122

P( 1 2X X− >0)= 1 2 1 2

1 1 2 2

( ) 0 (0.05 0.06)(1 ) (1 ) 0.05 0.95 0.06 0.94

400 500

X XP

m n

θ θθ θ θ θ

⎛ ⎞⎜ ⎟− − − − −⎜ ⎟>

− − × ×⎜ ⎟++⎜ ⎟⎝ ⎠

≈1-Φ(0.66)≈0.2546

Valor que evidencia os cuidados que devemos ter, no processo de

inferência, nas conclusões amostrais para a população. Com efeito,

embora a proporção de “maus” riscos seja menor em Lisboa do que no

Porto, mesmo assim a probabilidade de a média da amostra de Lisboa

ser superior à média da amostra do Porto é aproximadamente 25%.

Page 36: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 123

6. População normal: distribuição da média.

Considere-se agora (X1, X2,....., Xn) uma amostra casual da

população normal N(μ, σ2). Para obtermos a distribuição por

amostragem da média, X , aplicamos o corolário (6), depois de se

recordar que E( X )=μ e que Var( X )=σ2/n. Naturalmente, se (X1, X2,.....,

Xn) é uma amostra casual da população normal, N(μ, σ2), então

X ~ N2

,nσμ

⎛ ⎞⎜ ⎟⎝ ⎠

(18)

o resultado anterior pode ainda escrever-se, de forma equivalente e

mais adequada às aplicações práticas, por

Page 37: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 124

~ (0,1)X n Nμσ− (19)

Exemplo 5

Considere-se que a duração das chamadas telefónicas locais em

determinada empresa pode ser aproximada por uma distribuição

normal com média igual a 17 minutos e variância 25. Qual a

probabilidade de, numa amostra aleatória de n chamadas, a duração

média se situar entre 16 e 18 minutos?

Quando n=25, temos

Page 38: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 125

P(16 < 25X < 18) = 2516 17 17 18 1725 25 2525 25 25

XP⎛ ⎞− − −

< <⎜ ⎟⎝ ⎠

= Φ(1) - Φ(-1) = 2×Φ(1) – 1 ≈ 0.6826.

Faça o mesmo exercício, para n=100 e tire conclusões.

7. População normal: distribuição da variância.

Relembre-se, que a variável aleatória ( )2

21

n ii

X μσ=

−∑ tem distribuição

2χ (n) desde que as variáveis Xi sejam independentes e tenham

distribuição N(μ, σ2).

Page 39: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 126

Deste modo, considere-se uma amostra casual (X1, X2,....., Xn) de

população normal, N(μ, σ2), e as estatísticas X e S2.

Então prova-se que:

Teorema:4 Se (X1, X2,..., Xn) é uma amostra casual de uma população normal,

N(μ, σ2), então ( )2

21 2

2 2 ~ ( 1)n

iiX XnS nχ

σ σ=

−= −∑

(20)

Desta forma podemos, facilmente, concluir que 2

22

( 1) ´ ~ ( 1)n S nχσ−

pois, nS2=(n-1)S´2.

Page 40: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 127

A comparação entre ( )2

212 ~ ( )

nii

Xn

μχ

σ=

−∑ e

( )2

1 22 ~ ( 1)

nii

X Xnχ

σ=

−−

∑ mostra que se perde um grau de liberdade

quando, na expressão da soma de quadrados, a média da população

é substituída pela média da amostra.

Page 41: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 128

Exemplo 6

Considere-se uma população normal da qual se extraiu uma amostra

de dimensão 25.

Supondo que se procura calcular a probabilidade de o quociente entre

a variância corrigida da amostra e a variância da população se situar

entre 0.79 e 1.18, obtém-se ´2 ´2

2 2( 1)0.79 1.18 24 0.79 24 1.18S n SP P

σ σ⎛ ⎞ ⎛ ⎞−

< < = × < < ×⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

≈ 0.75-0.25=0.5

Page 42: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 129

8. População normal: Rácio de Student.

No caso de amostragem de populações normais, o resultado (19) é

utilizado para estabelecer inferência sobre a média da população μ, a

partir da média da amostra, X , quando a variância, σ2 é conhecida.

Se a variância, σ2 é desconhecida – caso em que se diz que σ2 (ou σ)

é um parâmetro perturbador na óptica das inferências sobre μ - a

presença de σ em (19) torna impraticável a realização de inferência

com base neste resultado.

Durante anos pensou-se que o rácio de Student,

´X n

Sμ− ou 1X n

Sμ−

− (21)

Page 43: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 130

tinha distribuição normal, isto é, admitiu-se que a substituição de σ por

S´ no denominador de (21) não alterava a distribuição. Assim

acontece, com razoável aproximação, quando n é suficientemente grande, caso em que pode empregar-se a distribuição assimptótica,

~ (0,1)´

aX n NSμ− (22)

Contudo, para pequenas amostras, S´ é vulnerável a grandes

flutuações de amostra para amostra, o que faz com que o rácio de

Student siga outra distribuição – a distribuição t-Student – e não a

distribuição normal. (ver distribuições teóricas)

Page 44: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 131

Desta forma, tem-se

~ ( 1)´

X n t nSμ−

− (23)

Exemplo 7

De uma população com distribuição normal de média e variância

desconhecidas, extraiu-se uma amostra casual de dimensão 25, cuja

variância corrigida é 49. Qual a probabilidade de a média da amostra

diferir da média da população, em valor absoluto, por uma valor

inferior a 2.4?

Page 45: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 132

A formulação, para resposta ao problema, é dada através de

P(|X - μ| < 2.4) ou então por P(-2.4 < X - μ < 2.4).

Então, P(-2.4 < X - μ < 2.4) = 2.4 2.449 / 25 ´/ 49 / 25

XPS n

μ⎛ ⎞− −< <⎜ ⎟

⎝ ⎠

= 1.711 1.711´/

XPS n

μ⎛ ⎞−− < <⎜ ⎟⎝ ⎠

=1-2×P 1.711´/

XS n

μ⎛ ⎞−>⎜ ⎟

⎝ ⎠=1-2×0.05=0.9

Page 46: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 133

9. Populações normais: diferença entre duas médias.

Considerem-se duas amostras casuais, X11, X12,....., X1m, X21,

X22,......., X2n, obtidas, de forma independente, das populações normais

N(μ1, σ12) e N(μ2, σ2

2), respectivamente. Considerem-se, ainda,

1 11

1 mii

X Xm =

= ∑ e 2 21

1 njj

X Xn =

= ∑ as respectivas médias.

Então, podemos concluir que 2 21 2

1 2 1 2~ ,X X Nm nσ σμ μ

⎛ ⎞− − +⎜ ⎟

⎝ ⎠ (24)

e de forma “mais simpática”

Page 47: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 134

( ) ( )1 2 1 2

2 21 2

~ (0,1)X X

N

m n

μ μ

σ σ

− − −

+

(25)

Contudo, as distribuições descritas, têm aplicação quando as

variâncias das duas populações são conhecidas. Quando se sabe que

as variâncias, embora desconhecidas, são iguais, pode recorrer-se a

outro resultado para estabelecer inferências sobre μ1 - μ2.

Supondo que σ12 = σ2

2 = σ2, o resultado (25) pode escrever-se

( ) ( )1 2 1 2 ~ (0,1)1 1

X XU N

m n

μ μ

σ

− − −=

+

Page 48: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 135

Considerem-se agora, as variâncias corrigidas das duas amostras

´2 211 11

1 ( )1

mii

S X Xm =

= −− ∑ , e ´2 2

22 21

1 ( )1

njj

S X Xn =

= −− ∑

atendendo a (20), tem-se que ( ) ( )´2 ´21 2 2

2

1 1~ ( 2)

m S n SV m nχ

σ− + −

= + −

e como as variáveis U e V são independentes, podemos aplicar a

definição 0.5, obtendo assim,

( )

( ) ( )

1 2 1 2

´2 ´21 2

1 1

~ ( 2)1 1

2

X X

m nT t m nm S n S

m n

μ μ− − −

+= + −

− + −+ −

(26)

Page 49: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 136

pois ( ) ( )´2 ´21 2´2 1 1

2m S n S

Sm n

− + −=

+ − traduz a melhor aproximação ao valor

de σ2, comum às duas populações, que, no entanto, têm médias

diferentes.

De facto, na expressão ( ) ( )2 2

1 21 21 1´2

2

m ni ji j

X X X XS

m n= =

− + −=

+ −∑ ∑

o

numerador corresponde à soma habitual adaptada à nova situação, e

o denominador é igual ao número total de observações menos duas,

uma vez que se utilizam as estatísticas 1X e 2X em substituição das

médias desconhecidas das populações, μ1 e μ2 (perderam-se dois

graus de liberdade). Não sendo válidas as expressões (25) e (26),

Page 50: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 137

quando as variâncias das populações são desconhecidas e diferentes,

as inferências sobre μ1 - μ2 tornam-se mais complexas.

Assim, quando a dimensão das amostras o permite, pode operar-se

com a distribuição normal assimptótica que resulta de substituir em

(25) as variâncias da população pelas variâncias das amostras.

Quando as amostras são pequenas, em particular se forem de

diferentes dimensões, uma solução possível consiste em recorrer à

aproximação de Welch. Este autor mostrou que

Page 51: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 138

( ) ( )1 2 1 2

´2 ´21 2

~ ( )aX X

Z t vS Sm n

μ μ− − −=

+

onde v é dado pelo maior inteiro

contido em

2´2 ´21 2

2 2´2 ´21 21 1

1 1

s sm n

rs s

m m n n

⎛ ⎞+⎜ ⎟

⎝ ⎠=⎛ ⎞ ⎛ ⎞

+⎜ ⎟ ⎜ ⎟− −⎝ ⎠ ⎝ ⎠

sendo ´21s e ´2

2s os valores

observados nas amostras para ´21S e ´2

2S , respectivamente. Assim,

quando o valor de r não é inteiro, arredonda-se por defeito.

Page 52: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 139

Exemplo 8

Admita-se que os resultados do teste de QI são bem modelados por

distribuições normais de média 100 nos países A e B.

a) Recolhida uma amostra de dimensão 16 no país A, e outra, de

dimensão 10 no país B, calcule-se a probabilidade de a média da

primeira amostra ser superior em mais que 5 pontos à média da

segunda amostra, sabendo que se observou uma variância

amostral corrigida de 12 no país A e de 18 no país B?

b) Repita-se a questão anterior agora que, embora desconhecidas,

as variâncias nas duas populações são iguais.

Page 53: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 140

Nas duas questões é necessário calcular ( )5A BP X X− > , sendo

desconhecidas as variâncias das duas populações. Em a), não

existindo razoes para admitir que as variâncias são iguais, utiliza-se a

fórmula de Welch, obtendo-se

2

2 2

12 1816 10

1 12 1 1815 16 9 10

r

⎛ ⎞+⎜ ⎟⎝ ⎠=⎛ ⎞ ⎛ ⎞+⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

≈16.36, e

portanto, utiliza-se uma distribuição t-Student com 16 graus de

liberdade.

Como μA - μB = 100 - 100 = 0,

Page 54: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 141

( )5A BP X X− > ( ) ( )

´2 ´2

5 012 1816 10

A B A B

A B

A B

X XP

S Sn n

μ μ⎛ ⎞⎜ ⎟− − − −⎜ ⎟= >⎜ ⎟

+⎜ ⎟+⎜ ⎟⎝ ⎠

= P(Z > 3.13)

≈ 0.001em b), recorremos à expressão (26)

( )5A BP X X− >

( ) ( )

( ) ( )´2 ´2

5 01 1 1 1

16 1015 12 9 181 1

16 10 22

A B A B

A B

A A B B

A B

X X

n nP

n S n Sn n

μ μ⎛ ⎞− − − −⎜ ⎟⎜ ⎟

+ +⎜ ⎟⎜ ⎟= >⎜ ⎟× + ×− + −⎜ ⎟+ −+ −⎜ ⎟⎜ ⎟⎝ ⎠

Page 55: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 142

= P(X > 3.286) ≈ 0.001 (t-Student, com 24 graus de liberdade)

6.10. Populações normais: relação entre duas variâncias.

Vamos, por fim, estabelecer inferências sobre a relação entre as

variâncias, 2122

σσ

, de duas populações normais independentes, onde

será natural pensar na estatística ´21´22

SS

. Sendo as duas amostras

independentes, torna-se fácil ver que esta estatística pode ser

relacionada com o quociente de duas variáveis independentes com

distribuição do qui-quadrado, cada uma delas sendo dividida pelos

Page 56: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 143

respectivos graus de liberdade. Então, considerando as variáveis

aleatórias independentes,

( ) ´21 2

21

1~ ( 1)

m SU mχ

σ−

= − e ( ) ´22 2

22

1~ ( 1)

n SV nχ

σ−

= − ,

obtém-se ´2 21 2´2 22 1

/( 1)/( 1)

SU mFV n S

σσ

−= =

− (27)

onde F designa a, estudada, distribuição de Fisher.

Com efeito, suponha-se que se tem duas populações normais,

N(μ1, σ12) e N(μ2, σ2

2). Sejam ´21S e ´2

2S as variâncias corrigidas de

amostras casuais independentes de dimensão m e n,

Page 57: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 144

respectivamente. Atendendo a (27) e à definição 0.6, concluímos

imediatamente que ´2 21 2´2 22 1

SS

σσ

~F(m-1,n-1) (28)

e em particular, quando σ12 = σ2

2, obtém-se ´21´22

SS

~F(m-1,n-1) (29)

Exemplo 9

Considere-se, novamente, o exemplo 8, referente aos resultados dos

testes de QI em dois países. Admita-se que ambas as populações são

normais no que se refere aos resultados obtidos nestes testes e que

se recolheu uma amostra de dimensão 16 no país A, e outra, de

Page 58: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 145

dimensão 10, no país B. Admitindo que as variâncias nas duas

populações são iguais, qual a probabilidade de o quociente entre as

variâncias corrigidas das duas amostras, ´2

´2A

B

SS

ser superior a 3.77?

A resposta obtém-se, calculando ´2

´2 3.77A

B

SPS

⎛ ⎞>⎜ ⎟

⎝ ⎠, utilizando a tabela da

distribuição de Fisher, com 15 e 9 graus de liberdade [F(16-1, 10-

1)=F(15,9)], temos que a referida probabilidade é aproximadamente

0.025. É de salientar que, não sendo as amostras de dimensão igual, ´2

´2 3.77A

B

SPS

⎛ ⎞>⎜ ⎟

⎝ ⎠ ≠

´2

´2 3.77B

A

SPS

⎛ ⎞>⎜ ⎟

⎝ ⎠, como facilmente pode ser

Page 59: Distribuições amostragem

ESTATÍSTICA

O Professor: Manuel do Carmo 146

comprovado. Suponha-se agora que pretendíamos calcular a

probabilidade de o quociente entre variâncias corrigidas, ´2

´2A

B

SS

, ser

inferior a 0.386. Então vamos calcular ´2

´2 0.386A

B

SPS

⎛ ⎞<⎜ ⎟

⎝ ⎠, mas para tal

devemos recorrer à propriedade, enunciada anteriormente no final da

Folha 12, da distribuição de Fisher.

Seja, ´2

´2 0.386A

B

SPS

⎛ ⎞<⎜ ⎟

⎝ ⎠ =

´2

´21

0.386B

A

SPS

⎛ ⎞>⎜ ⎟

⎝ ⎠

= ´2

´2 2.59B

A

SPS

⎛ ⎞>⎜ ⎟

⎝ ⎠ ≈ 0.05 [F(10-1,16-1) = F(9,15)]