1
Amostragem de Conglomerados em Um Único Estágio – Conglomerados de
Tamanhos Diferentes• Notação:– População:
1 2 i M. . . . . .
XiT é o total do cluster i;
Ni é o tamanho do cluster i;
é a média do cluster i.
iX
iN
jijiT XX
1
Xij valor da variável de interesse do elemento j e cluster i.
2
Amostra: a amostra de cluster consiste de todos os elementos de cada um dos m cluster selecionados aleatoriamente a partir dos M cluster da população.
1 2 i m. . . . . .
ix
xiT é o total do cluster i;
ni é o tamanho do cluster i;
é a média do cluster i.
Unidade primárias: são os clusters;Unidades secundárias: são os elementos da população dentro dos clusters;
A amostra de cluster é uma amostra aleatória simples de clusters.
3
A média populacional geral () (isto é, o valor médio de X das unidades secundárias) é:
M
ii
M
iiT
M
ii
M
i
N
jij NXNX
i
1111 1
Interpretação: razão do total dos valores XiT para o total dos valores Ni.
Estimação: desejamos estimar a partir de uma amostra de conglomerados.
m
ii
m
iiTc nxx
11
A qual é a razão da soma dos totais de clusters para a soma dos tamanhos de clusters, na amostra de clusters selecionada.
4
Variância de pode ser estimada a partir da amostra por:
cx
2
2
11 ci
m
i
ic xx
N
n
mm
MmMxVar
E se N for desconhecido, ele pode ser substituído pelo estimador Mn/m, onde n é o tamanho efetivo da amostra, obtendo-se:
2
2
11 ci
m
i
ic xx
n
n
mM
mmMxVar
(amostragem sem reposição)
cc xVartxCI .:%95;..
5
Estimação do total geral XT
cT
cT
xVarNxVar
xNx2
6
Exemplo:
Trata-se de avaliar o rendimento dos alunos da primeira série do primeiro grau, na rede de ensino público de certa localidade.
A partir da relação das 3500 turmas existentes, foram preparados conglomerados (clusters), juntando turmas de diferentes escolas, com o objetivo de agrupar alunos o mais possível diferentes no que se refere ao rendimento (necessidade dos conglomerados serem heterogêneos).
Os conglomerados foram formados com 5 turmas de, aproximadamente, 150 alunos, supondo uma base de 30 alunos por turma. Na população temos 700 clusters.
Deseja-se observar uma amostra de 1500 alunos.
Considerando:
dosconglomera 10150/1500 Nmn
Prob(cluster) = 10/700 = 0,014286
7
Conglomerados da amostra
Número de alunosni
Soma dos escoresXiT
1 162 1004,4
2 170 952,0
3 145 1015,0
4 151 830,5
5 160 960,0
6 162 793,8
7 145 855,5
8 148 947,2
9 171 1214,1
10 178 1032,4
Total 1592 9604,9
8
Estimativa do rendimento médio por aluno
m
ii
m
iiTc nxx
11
033,61592/9,9604 cx
9
Estimativa da variância da média de conglomerado
2
2
11 ci
m
i
ic xx
n
n
mM
mmMxVar
Conglomerados
1 0,1018 0,0104 0,1670 0,0279 0,00029 2 0,1068 0,0114 -0,4330 0,1875 0,002138 3 0,0911 0,0083 0,9670 0,9351 0,007761 4 0,0948 0,0090 -0,5330 0,2841 0,002557 5 0,1005 0,0101 -0,0330 0,0011 1,11E-05 6 0,1018 0,0104 -1,1330 1,2837 0,01335 7 0,0911 0,0083 -0,1330 0,0177 0,000147 8 0,0930 0,0086 0,3670 0,1347 0,001158 9 0,1074 0,0115 1,0670 1,1385 0,013093
10 0,1118 0,0125 -0,2330 0,0543 0,000679 TOTAL 0,041184
10
5133,6 ;5526,5
212368,0.262,2033,6:
212368,00451,0
0451,0041184,0110700
1010700
IC
xDP
xVar
c
c
Distribuição t de Student com 10-1 = 9 graus de liberdade
11
Estimativa do coeficiente de variação da média de conglomerado
Indica a precisão da média e o padrão é que ele seja inferior a 10%.
0352,0
033,6
212368,0
c
cc x
xDPxCV
Exercício:
Estimar o total geral XT.
12
Estimação de uma proporção
• Notação– X é uma variável de interesse de estudo. Por
exemplo: 1) proporção de famílias com casa própria e 2) proporção de domicílios com pelo menos um automóvel.
– Xij = 1 se o elemento j do conglomerado i tem o atributo em estudo;
– Xij = 0 se o elemento j do conglomerado i não tem o atributo em estudo;
13
População:
XiT é a quantidade de elementos que possui o atributo ou a característica em estudo no conglomerado i.
PN
X
PN
XX
XX
M
i
M
iiT
X
ii
iTi
N
jijiT
i
i
1
1
1
A proporção de elementos que possuem o atributo ou a característica no conglomerado i.
A proporção de elementos que possuem o atributo ou a característica na população.
O total de elementos que possuem o atributo ou a característica no conglomerado i.
14
Estimador:
Proporção na amostra
m
ii
m
iiT
c
n
xp
1
1
xiT é a quantidade de elementos que possuem o atributo no conglomerado i.
Ni é o tamanho (a quantidade de registros, casos) no conglomerado i selecionado.
15
Variância da proporção da amostra
m
ici
ic pp
n
n
mM
mmMpVar
1
22
1
n é a quantidade total de registros, casos ou observações na amostra selecionada.
pi é a proporção amostral de elementos com o atributo no conglomerado i selecionado.
cc pDPpCI .96,1:%95;..
cc pVarpDP
16
Conglomerados da amostra
Número de alunosni
Número de alunos que compram
lanchexiT
1 162 50
2 170 63
3 145 47
4 151 48
5 160 68
6 162 59
7 145 36
8 148 45
9 171 71
10 178 75
Total 1592 562
Exemplo:No exemplo anterior observou-se, também, o número de alunos que compram lanche, cujos resultados foram:
17
Estimativa da proporção dos alunos que compram lanche
Estimativa da variância da proporção dos alunos que compram lanche
3530,01592
562
1
1
m
ii
m
iiT
c
n
xp
m
ici
ic pp
n
n
mM
mmMpVar
1
22
1
18
Conglomerados da amostra
1 162 50 0,101759 0,010355 0,308642 0,001969 0,0000203884 2 170 63 0,106784 0,011403 0,370588 0,000309 0,0000035214 3 145 47 0,09108 0,008296 0,324138 0,000834 0,0000069177 4 151 48 0,094849 0,008996 0,317881 0,001234 0,0000111053 5 160 68 0,100503 0,010101 0,425000 0,005182 0,0000523404 6 162 59 0,101759 0,010355 0,364198 0,000125 0,0000012949 7 145 36 0,09108 0,008296 0,248276 0,010970 0,0000910057 8 148 45 0,092965 0,008642 0,304054 0,002397 0,0000207175 9 171 71 0,107412 0,011537 0,415205 0,003868 0,0000446212
10 178 75 0,111809 0,012501 0,421348 0,004669 0,0000583738 Total 0,0003102866
018433,00003398,0
0003398,0000310286,0110700
1010700
c
c
pDP
pVar
19
8910,3169;0,3
018433,0.96,13530,0:%95;..
.96,1:%95;..
CI
pDPpCI cc
Top Related