Técnicas de Amostragem
É a parte da Teoria Estatística que define os procedimentos para os
planejamentos amostrais e as técnicas de estimação utilizadas.
As técnicas de amostragem, tal como o planejamento amostral, são
amplamente utilizados nas pesquisas científicas e de opinião para
se conhecer alguma característica da população.
Nos planejamentos amostrais, a coleta dos dados deve ser
realizada observando-se uma metodologia adequada para que os
resultados possam ser extrapolados para a população como um
todo.
Esse processo de extensão dos resultados para a população é o
que, na estatística, chamamos de INFERÊNCIA.
I- Conceitos Básicos
i) População objetivo e população amostral:
População objetivo: também chamada de população alvo, é
formada pelo conjunto de indivíduos (ou itens) que queremos
abranger em nosso estudo e para os quais desejamos que as
conclusões da pesquisa (inferências) sejam válidas.
Em alguns estudos a população não pode ser representada por um
“ente físico”. Nesses casos a estatística define a população pelo
conjunto de todos os valores possíveis de serem observados.
A definição da população depende dos objetivos da pesquisa.
População amostral: ocorre, entretanto, que nem todos os
indivíduos, ou elementos, da população podem ser observados.
Desta forma, define-se como população amostral ou acessível ao
conjunto de indivíduos que serão efetivamente observados.
“Os indivíduos que constituem a população têm, portanto, pelo menos uma característica em comum”.
Exemplos:
1) Um estudo foi realizado entre os professores da UFSCar para
saber as suas opiniões a respeito das decisões do Reitor.
População objetivo: a população objetivo é formada por todos os
professores da UFSCar.
População amostral: deve ser definida excluindo-se os professores
aposentados, afastados por doença ou capacitação, que ocupem
cargo junto a Reitoria, etc...
É importante destacar que nem sempre é fácil diferenciar as duas
populações, conforme vemos no exemplo a seguir:
2) Estudo realizado na cidade de São Carlos para avaliar como os
moradores avaliam o transporte público.
População objetivo: moradores da cidade de São Carlos (que
utilizam o transporte público).
População amostral: moradores da cidade de São Carlos que
utilizam o transporte público.
muitas vezes, especialmente em experimentos controlados, a
população objetivo população amostral.
ii) Amostra: é a parcela da população amostral efetivamente
selecionada para a realização do estudo, segundo um processo
de seleção adequado.
iii) Unidade amostral: é o indivíduo (ou elemento) da população
amostral que severa ser selecionado para participar da amostra.
As unidades amostrais podem ser os próprios elementos da
população amostral sobre os quais as medidas de interesse
serão observadas, ou, podem ser formadas por grupos de
elementos, compondo o que será chamado de conglomerado.
Conglomerados podem ser formados por:
quarteirões;
ruas (face dos quarteirões);
departamentos;
prateleiras;
lotes de produtos;
etc...
iv) Parâmetro: é uma característica fixa e desconhecida da
população a qual se tem interesse em estudar.
Os parâmetros representam quantidades numéricas que podem
ser interpretadas pelo pesquisador, como por exemplo: média;
proporção; variação; taxa de crescimento; etc...
Exemplos:
tempo até a cura de pacientes submetidos a um novo tratamento
ou a uma nova droga;
percentual de intenção de votos para um candidato numa
pesquisa eleitoral;
Proporção de crianças com a cobertura vacinal completa (estudo
PI);
número de latrocínios em Minas Gerais, por região
administrativa;
medida do desempenho escolar de crianças expostas à violência
doméstica do pai contra a mãe.
v) Estimativa: valor calculado a partir dos dados obtidos pela
amostra para se estimar o valor desconhecido do parâmetro.
Exemplos: média amostral, proporção amostral, variância amostral,
etc...
vi) Sistema de referência: é uma listagem completa de todas as
unidades da população amostral (aptas a serem selecionadas na
amostra);
vii) Amostragem probabilística: é a pesquisa por amostragem
realizada segundo critérios bem definidos da teoria estatística
das probabilidades.
Na amostragem probabilística todas as unidades da população
amostral devem ter a mesma probabilidade de serem
selecionadas.
Por que fazer amostragem ao invés de um censo?
Vantagens da pesquisa por amostragem em relação ao censo:
a) é mais barata;
b) é mais rápida;
c) é mais fácil de ser controlada por envolver operações menores.
Desvantagens da pesquisa por amostragem em relação ao censo:
a) o censo pode ser mais vantajoso quando a população é pequena
e/ou as informações são de fácil obtenção.
b) os resultados da pesquisa por amostragem carregam erro;
c) se a população for muito heterogênea o erro pode ser muito
grande (e a precisão muita baixa), sendo necessário uma
amostra muito grande.
viii) Dados
São os resultados observados para uma, ou mais, variáveis. Podem
ser secundários ou primários:
Dados secundários: podem ser obtidos de algum banco de dados
já existente, como por exemplo, IBGE, SEADE, fichas de cadastro
de clientes, em publicações (artigos, livros, revistas), etc...
Dados primários: necessitam ser coletados da população
amostral. São obtidos pela aplicação de um instrumento de coleta,
que será chamado de questionário.
Após serem coletados, os dados devem ser codificados e organizados para facilitar a tabulação e análise.
É importante, nesta fase, um sistema de processamento que
seja consistente.
a) Elaboração e aplicação do questionário
Na coleta efetuada com a aplicação de questionários, a elaboração
dos mesmos deve ser bastante criteriosa para evitar mal-entendidos
e ambiguidades.
Os objetivos da pesquisa devem estar bem definidos para que as
características de interesse (variáveis) sejam adequadamente
escolhidas.
Cuidados a serem seguidos na montagem do questionário
ter bem claro as variáveis a serem observadas;
estudar as formas de como essas variáveis devem ser medidas;
as formas e instrumentos de medição devem ser bem claros;
agrupar as perguntas por variáveis similares/complementares;
as perguntas devem ser simples e objetivas e devem estar numa
linguagem apropriada ao perfil dos respondentes;
os itens de resposta devem ser planejados de maneira a evitar
respostas conduzidas ou viciadas;
o questionário não deve ser longo e nem conter perguntas fora
do contexto.
b) Formas de aplicação do questionário
Entrevistas pessoais: aplicado por entrevistadores bem
treinados que tomam nota das respostas.
Prós: a taxa de “não resposta” é baixa.
Contras: requerem entrevistadores treinados, o que “eleva o
custo” da pesquisa.
Questionário auto-aplicativo: é respondido pelo próprio
entrevistado, que assinala as respostas.
Os questionários podem ser enviados pelo correio, em revistas
ou jornais, deixados para pegar depois, etc...
Nesses casos os questionários devem encorajar a participação,
podendo até oferecer prêmios.
Prós: não requerem entrevistadores, tornando a pesquisa mais
barata.
Contras: alta taxa de “não resposta”;
vícios em função de respostas por grupos de
interesse.
Entrevistas por telefone: o questionário é aplicado pelo
telefone.
Prós: requerem entrevistadores, mas é mais barata, pois não
incluí gastos com locomoção.
Contras: os entrevistadores devem ser bem treinados para
convencerem o indivíduo a participar;
a população alvo deve ser bem representada pelos
proprietários de telefone;
as entrevistas devem ser curtas e objetivas.
c) Alguns cuidados a serem tomados na aplicação do
questionário
i) Anonimato dos entrevistados em pesquisas que envolvam
aspectos íntimos ou temas polêmicos;
ii) Treinamento dos entrevistadores;
iii) Checagem de alguns questionários escolhidos aleatoriamente,
por parte de um supervisor;
iv) Os entrevistadores devem portar identificação (crachás),
estarem apresentáveis e serem amáveis. Se forem escalados em
duplas, devem formar um casal para passar mais confiança;
v) É aconselhável, alguns dias antes da pesquisa, fazer uma
divulgação através dos meios de comunicação.
vi) Antes de se aplicar o questionário é importante a realização de
uma pré-amostra, ou pré-teste, para se verificar se o
questionário está bom e corrigir possíveis falhas. A pré-
amostra deve ser aplicada num grupo reduzido de indivíduos
da população em estudo.
II- Planos de Amostragem
Para a definição do plano amostral devem-se ter bem definidos:
i) Unidade amostral: indivíduos ou grupos de indivíduos
(conglomerados);
ii) Sistema de referência: lista completa das unidades amostrais.
iii) N = tamanho da população, é definido pelo número de
indivíduos da população amostral;
iv) n = tamanho da amostra, definido pelo número de indivíduos
selecionados na amostra.
n < N
Fatores que interferem na escolha do Plano Amostral:
Tamanho da população N;
Custo;
Heterogeneidade da população;
Os elementos da amostra devem ser selecionados da população
amostral segundo alguma forma de sorteio.
Os Planos de Amostragem mais comuns são:
A) Amostragem Aleatória Simples (A.A.S.):
Na A.A.S., a amostra de tamanho n é selecionada ao acaso dentre
os N elementos da população amostral.
Procedimento de sorteio:
i) Na A.A.S. a probabilidade de qualquer indivíduo, ou elemento,
da população fazer parte da amostra é igual a N
n.
ii) Um indivíduo é selecionado ao acaso dentre os N possíveis;
iii) O segundo indivíduo é selecionado ao acaso dentre os (N – 1)
restantes...
iv) . . . e assim por diante, até que todos os n indivíduos sejam
sorteados.
Esse procedimento tem a característica de ser “sem reposição”,
significando que: cada indivíduo aparece uma única vez na
amostra.
Obs:
1) Procedimentos “com reposição” são definidos tais que o
indivíduo pode aparecer mais de uma vez na amostra, porém são
poucos comuns na prática;
2) Quando o tamanho da população for muito grande, os dois
procedimentos de sorteio (sem e com reposição) são
equivalentes.
Como realizar o sorteio:
i) geração de números aleatórios pelo computador;
ii) tabela de números aleatórios;
iii) globos com bolinhas numeradas;
iv) qualquer outra forma aleatória de escolha que preserve a
propriedade de que cada unidade amostral tenha a mesma
chance de ser selecionada.
B) Amostragem Aleatória Estratificada (A.A.E.):
Quando a população é muito heterogênea, ou seja, quando as
características observadas variam muito de um indivíduo para
outro, é aconselhável subdividir a população em estratos
homogêneos.
A população é, então, dividida em k estratos sendo que, uma A.A.S.
é aplicada em cada um deles.
Definições:
i) tamanhos dos estratos: N1, N2, N3, . . . , Nk.
N1 + N2 + N3 + . . . + Nk = N
ii) tamanhos das amostras em cada estrados: n1, n2, n3, . . . , nk.
n1 + n2 + n3 + . . . + nk = n
Obs:
1) A A.A.E. produz resultados mais precisos do que a A.A.S.
com o mesmo tamanho de amostra.
2) É mais cara, por segmentar a população.
Pergunta:
Sabendo que o tamanho da amostra é n, como alocar, ou,
determinar o número de indivíduos a serem selecionados em cada
um dos estratos?
i) Alocação por igual: utilizada quando se desconfia que os estratos
são de tamanhos parecidos, ou seja,
N1 ≈ N2 ≈ N3 ≈ . . . ≈ Nk
Neste caso pode-se utilizar: n1 = n2 = n3 = . . . = nk = k
n
Exemplo: Se, numa população com k = 4 estratos, de tamanhos
parecidos, for retirada uma amostra de tamanho n = 56, então, os
tamanhos das amostras em cada estrato deve ser:
n1 = n2 = n3 = n4 = 14.
ii) Alocação proporcional ao tamanho do estrato: na alocação
proporcional ao tamanho, os tamanhos das amostras devem
seguir a mesma relação de proporcionalidade dos tamanhos dos
estratos, ou seja,
N
N
n
n 11 , N
N
n
n 22 , . . . N
N
n
n kk
Desta forma, tem-se
N
nNn 1
1 , N
nNn 2
2 , . . . N
nNn k
k
Exemplo:
Considere uma amostra de tamanho n = 48 a ser selecionada de
uma população dividida em 3 estratos, tais que N1 = 40, N2 = 80
e N3 = 120, então:
N = 20 + 60 + 180 = 240
N
N1 = 240
40 =
6
1 n1 =
6
48 = 8
N
N2 = 240
80 =
3
1 n2 =
3
48 = 16
N
N3 = 240
120 =
2
1 n3 =
2
48 = 24
Portanto, n1 = 8, n2 = 16 e n3 = 24 é a alocação proporcional ao
tamanho dos estratos.
Esse resultado significa que se deve selecionar 8 indivíduos do
primeiro estrato, 16 do segundo estrato e 24 do terceiro.
iii) Alocação ótima: alocação que otimiza uma relação conhecida
(função), que normalmente envolve o tamanho dos estratos, as
medidas de suas heterogeneidades e o custo da amostragem.
Por otimizar entende-se escolher os tamanhos de amostras em
cada estratos que maximizam, ou minimizam, a função escolhida.
C) Amostragem Aleatória por Conglomerados (A.A.C.):
Na amostragem por conglomerados os elementos da população
são agrupados em conglomerados ou clusters (grupos), que serão
as unidades amostrais.
A divisão deve ser feita de forma que os conglomerados
tenham as mesmas características da população.
Na A.A.C. uma A.A.S. é aplicada para a seleção aleatória de k
conglomerados.
Uma vez selecionados os conglomerados, todos os seus
elementos devem são observados.
O procedimento descrito acima é uma A.A.C. em um estágio,
quando se realiza uma única seleção de conglomerados.
A A.A.C. pode, ainda, ser aplicada em dois ou mais estágios:
Na A.A.C. em dois estágios, após a escolha dos
conglomerados, aplica-se um segundo sorteio aleatório dentre os
seus elementos.
Exemplo: Estudo sobre a percepção social dos problemas de
quantidade, qualidade e custo dos recursos hídricos em São Carlos.
Definindo-se os quarteirões como sendo os conglomerados:
a) A.A.C. em 1 estágio:
Uma A.A.S. é aplicada para a seleção de uma amostra aleatória
de quarteirões, e o questionário é aplicado a todos os domicílios
dos quarteirões selecionados.
b) A.A.C. em 2 estágios:
no 1º. estágio: aplica-se uma A.A.S. para se selecionar uma
amostra de quarteirões;
no 2º. estágio: dentre os quarteirões selecionados no 1º.
estágio, sorteia-se uma amostra aleatória de domicílios que
efetivamente participarão da amostra.
Quadro comparativo entre os três métodos de amostragem:
A.A.E. Mais precisa do que a A.A.S., porém mais cara.
• considera a heterogeneidade da população
A.A.S.
Planejamento ideal.
• pode ser muito cara
• não considera a heterogeneidade da população
A.A.C.
Menos precisa do que a A.A.S. e A.A.E., porém mais
barata.
• resolve o problema do custo
D) Amostragem Sistemática (A.S.):
A A.S. pode ser aplicada quando se tem em mãos um sistema de
referência de fácil acesso. Além disso, a informação a ser coletada
também é de fácil acesso.
Exemplos de sistemas de referências de fácil acesso:
Fichas de cadastro de assinantes (revistas, provedores de acesso
à internet, serviço telefônico, etc...);
Cadastro de funcionários;
Peças numa linha de produção;
Mudas num canteiro; etc...
Procedimento:
Com o sistema de referência em mãos
a) determina-se o intervalo de seleção, que é dado por: n
NR ;
b) sorteia-se um indivíduo, ou item, dentre os R primeiros da
relação;
c) a partir daí, seleciona-se os indivíduos sistematicamente a cada
intervalo de tamanho R.
Exemplo: se a população tem tamanho N = 84 e deve-se selecionar
uma amostra de tamanho n = 6, então, tendo-se em mão uma
relação com os 84 indivíduos da população:
i) divide-se população em 6 seções de tamanho R= 6
84 = 14;
ii) sorteia-se aleatoriamente o primeiro indivíduo da amostra
dentre os 14 primeiros da lista (por exemplo, o de número 5);
iii) o segundo indivíduo a ser selecionado é o 5 + 14 = 19, ou
seja, o 19o da relação;
iv) o terceiro é o 19 + 14 = 33, ou seja, o 33o da relação, e assim
por diante.
Indivíduos selecionados sistematicamente
pelo procedimento acima:
ordem indivíduo selecionado
1 5o
2 19o
3 33o
4 47o
5 61o
6 75o
Outro exemplo: N = 79 e n = 7 => 7
79 = 11.3 ≈ 11
* O primeiro selecionado é o 3o, e, dai por diante a seleção é feita
em intervalos de tamanho 11 (ver tabela).
Indivíduos selecionados sistematicamente
pelo procedimento acima:
ordem indivíduo selecionado
1 3o
2 14o
3 25o
4 36o
5 47o
6 58o
7 69o
Situações especiais: se, por acaso N = 68 e n = 7
=> R = 7
68 = 9.7 ≈ 10
* Supor que o primeiro selecionado é o 9o, logo,
Indivíduos selecionados sistematicamente
pelo procedimento acima:
ordem Indivíduo selecionado
1 9o
2 19o
3 29o
4 39o
5 49o
6 59o
7 69o !
Note que nesse caso, não há o 69o indivíduo, pois N = 68, logo, a
amostra fica com uma unidade a menos.
Ou ainda: N = 80 e n = 7 => R = 7
80 = 11.4 ≈ 11
* O primeiro selecionado é o 2o
Indivíduos selecionados sistematicamente
pelo procedimento acima:
ordem indivíduo selecionado
1 2o
2 13o
3 24o
4 35o
5 46o
6 57o
7 68o
8 79o
Já, nesse caso, o 79o indivíduo é o penúltimo da relação e deve ser
incluído, logo, a amostra fica com uma unidade a mais.
* A amostra pode ter uma unidade a mais ou a menos em função
do arredondamento.
E) Amostragens não aleatórias
Muitas vezes não se tem acesso a um sistema referência para a
realização do sorteio.
A A.A.C. pode resolver a maioria desses casos.
Outra saída, entretanto, é a utilização de métodos de amostragem
não aleatórios.
i) Amostragem por cotas: a população é dividida em grupos,
assemelhando-se à A.A.E., mas a seleção não é aleatória.
ii) Amostragem por julgamento e estudos comparativos:
selecionam-se as unidades da amostra segundo um
determinado perfil definido segundo os objetivos da pesquisa.
No estudo comparativo certas características são comparadas em
duas, ou mais, populações através de amostras escolhidas por
julgamento.
Exemplos:
1) Estudo sobre a produção científica dos departamentos de ensino
de uma universidade.
2) Estudo sobre a percepção do conceito de morte em crianças de
diferentes períodos de desenvolvimento cognitivo (subperíodo
pré-operacional, subperíodo das operações concretas, período
formal).
3) Estudo comparativo da incidência de câncer de pulmão em
grupos de fumantes e não fumantes.
Obs:
1) Nos estudos comparativos, normalmente não se busca a
generalidade, mas sim as diferenças entre os grupos em análise.
2) Nesse contexto, as amostras devem ser o mais similares
possíveis, diferindo apenas em relação ao fator de comparação.
III- O Erro Amostral
O erro amostral é definido como sendo a diferença entre a
estimativa obtida para um parâmetro (que será denotado por ) e
o seu verdadeiro valor.
É decorrente da variabilidade natural das unidades amostrais,
sendo assim, aleatório.
erro amostral = estimativa –
Como medir o erro?
A amostra é retirada sem erro?
O erro decorrente da coleta dos dados é chamado de erro não
amostral.
Os planejamentos e a execução da pesquisa devem ser feitos com
muita cautela para evitar os erros não amostrais.
Alguns erros em amostragem:
i) População acessível diferente da população alvo;
ii) Falta de resposta;
iii) Erros de mensuração.
A) Determinação do tamanho da amostra
A determinação do tamanho da amostra é, talvez, o grande dilema
dos pesquisadores, pois deve levar em conta um a precisão
desejada e, por consequência, um erro tolerável e a probabilidade
de se cometer tal erro.
O erro tolerável é uma margem de erro das estimativas em
relação ao parâmetro θ, para mais ou para menos, o qual o
pesquisador está disposto a aceitar.
O tamanho da amostra é determinado tal que a probabilidade de
que a estimativa do parâmetro esteja dentro da margem de erro
seja alta, como por exemplo, igual a 0.95.
P( estimativa de estar dentro da margem de erro ) = 0.95
Em linguagem estatística:
)( EestimativaP = 0.95
Obs:
Para o cálculo acima, deve-se associar uma distribuição de
probabilidades para a estimativa, normalmente a normal (ou
Gaussiana).
Procedimento simplificado para determinação do tamanho da
amostra:
Na prática, pode-se escolher um tamanho inicial n0 em função de
um erro relativo tal que:
20
1
RelativoErron
Conhecendo o tamanho da população, deve-se fazer a correção:
0
0
nN
nNn
Exemplo:
Considere N = 780 e um erro relativo de 5%, então
20
05.0
1n = 400
Fazendo a correção pelo tamanho da população, tem-se
1180
312000
780400
780400
n = 264,4 ≈ 265,
ou seja, a amostra deve ser de 265 unidades amostrais.
Obs:
10
0
0
0
N
n
n
nN
nNn
desta forma, se a população é muito grande, ou seja, N é
muito grande, então, 00 N
n, logo n = n0
IV- Exemplo de aplicação:
Estudar a influência do fato do chefe da família ser analfabeto e/ou mulher
no perfil sócio-econômico das famílias de UFSCarlândia.
Exemplo prático: Pesquisa em UFSCarlândia.
População amostral: Chefes de família de UFSCarlândia aptos a participar
da amostra.
Características a serem observadas:
i) número de moradores no domicílio;
ii) número de filhos estudando;
iii) chefe da família é analfabeto sim/não;
iv) chefe da família é mulher sim/não;
v) renda familiar, em salários mínimos (1s.m.= R$ 788,00).
Dados da População:
i) 250 domicílios;
ii) 1046 moradores (UFSCarlenses).
Amostra:
i) AAS: selecionar n = 30 domicílios;
ii) AAC: selecionar k = 5 quarteirões (conglomerados).
1ª Etapa: identificação dos quarteirões (lista de referência para a AAC)
Figura 2: Mapa de UFSCarlândia com quarteirões identificados.
2ª Etapa: identificação dos domicílios (lista de referência para a AAS)
Figura 3: Mapa de UFSCarlândia com domicílios.
3ª Etapa: sorteio dos domicílios da amostra
Como realizar o sorteio?
v) geração números aleatórios, pelo computador;
vi) tabela de números aleatórios (em desuso, substituído pela geração via
computador);
vii) globo com bolinhas numeradas;
viii) qualquer outra forma aleatória de escolha que preserve a propriedade
de que cada unidade amostral tenha a mesma chance de ser
selecionada.
3.1. Sorteio da AAS no R:
## gerando a relação dos 250 domicílios:
> domicilios <- seq(1,250)
## sorteando a amostra de tamanho 30, dentre os 250 domicílios:
> aas <- sample(domicilios, 30, replace=FALSE)
## mostrando a amostra selecionada:
> aas
[1] 1 5 7 18 30 36 38 40 56 61 63 66 108 114 117
127 130 143 152 153 156 172 179 190 197 217 221 222
235 248
3.2. Sorteio da AAC no R:
## gerando a relação dos 34 quarteirões:
> quadras <- seq(1,34)
## sorteando a amostra de tamanho 5, dentre os 34 quarteirões:
> aac <- sample(quadras, 5, replace=FALSE)
## mostrando a amostra selecionada:
> aac
[1] 12 16 17 20 26
Domicílios sorteados na AAS: ( tamanho da amostra n = 30 domicílios )
Figura 5: AAS com os domicílios sorteados em destaque.
4ª Etapa: dados na AAS ( n = 30 domicílios sorteados )
# Domicílios
sorteados
Chefe
analf
Chefe
mulher
Num.
estud
Num.
morad
Renda
(sm)
1 1 N N 2 4 3.8
2 5 SIM N 0 4 3.8
3 7 N N 1 4 9.8
4 18 N N 2 4 9.1
5 30 N SIM 2 4 4.5
6 36 N N 2 6 6.9
7 38 N N 2 4 5.4
8 40 SIM N 1 3 2.6
9 56 SIM N 1 3 2.6
10 61 N N 1 3 4.6
11 63 N N 2 5 6.2
12 66 N N 2 5 5.6
13 108 N N 1 5 5.5
14 114 N N 1 5 7.5
15 117 N N 1 5 5.8
16 127 SIM N 2 4 3.5
17 130 N N 0 2 5.9
18 143 N N 0 1 4.6
19 152 N N 1 5 6.3
20 153 N N 1 5 5.5
21 156 N SIM 1 3 2.6
22 172 SIM SIM 1 5 3.1
23 179 N N 2 4 8.2
24 190 SIM SIM 1 5 3.4
25 197 N N 1 4 7.7
26 217 N N 1 5 7.9
27 221 N SIM 0 2 2.7
28 222 SIM SIM 1 5 2.1
29 235 N N 1 4 4.7
30 248 N N 1 5 8.4
Totais/somas 7 6 35 123 160.1
Médias/porcentagens 23.3 20.0 1.2 4.1 5.3
Quarteirões sorteados na AAC: ( tamanho da amostra k = 5 quarteirões )
Figura 6: AAC com os quarteirões sorteados em destaque.
4ª Etapa: dados na AAC ( k = 5 quarteirões e n = 37 domicílios )
# Quarteirões
sorteados
Chefe
analf
Chefe
mulher
Num.
estud
Num.
morad
renda
(sm)
1 12 N N 2 4 6.8
2 12 SIM N 0 2 2.1
3 12 N N 1 6 8.0
4 12 SIM N 2 5 2.6
5 12 N N 1 5 5.5
6 12 SIM N 1 4 2.1
7 12 N SIM 1 6 11.7
8 16 N N 0 5 8.0
9 16 N N 1 5 8.5
10 16 N N 1 4 4.7
11 16 N N 1 5 5.5
12 16 SIM SIM 2 4 3.1
13 16 N N 2 4 6.6
14 16 N SIM 1 5 5.7
15 16 N N 0 5 7.6
16 17 N N 1 4 5.4
17 17 N N 1 5 7.5
18 17 N N 2 4 5.0
19 17 N N 1 5 5.6
20 17 N N 1 5 5.8
21 17 N N 2 5 5.4
22 17 N N 0 1 3.3
23 17 SIM N 2 5 2.4
24 20 N N 2 5 5.8
25 20 N N 3 5 4.8
26 20 N N 1 4 6.3
27 20 N N 1 5 6.1
28 20 N N 1 4 4.6
29 20 N N 1 5 8.5
30 26 N N 0 3 6.4
31 26 N N 1 6 7.6
32 26 N N 0 4 5.4
33 26 N N 1 4 7.1
34 26 N N 1 4 7.2
35 26 SIM SIM 1 5 3.4
36 26 N N 2 4 3.7
37 26 N N 0 5 13.6
Totais/somas 6 4 41 134 219.3
Médias/porcentagens 16.2 10.8 1.1 3.6 5.9
5ª Etapa: análise estatística dos dados
Será realizada posteriormente na disciplina, durante os tópicos de análise
descritiva de dados.
Anexo 1: Dados da população de UFSCarlândia:
domicílio quadra analfabeto chefe mulher estudantes moradores renda
1 1 N N 2 4 3.8
2 1 N N 2 4 4.0
3 1 N N 1 4 7.5
4 1 N N 1 6 7.2
5 2 SIM N 0 4 3.8
6 2 N N 1 5 6.2
7 2 N N 1 4 9.8
8 2 N N 0 5 6.6
9 2 N N 1 4 4.4
10 3 N N 2 4 6.1
11 3 N N 0 2 2.4
12 3 N N 1 3 3.9
13 3 N N 1 5 5.5
14 3 N N 2 4 4.3
15 3 N N 2 4 4.6
16 3 SIM N 3 5 2.7
17 3 N N 1 5 9.4
18 4 N N 2 4 9.1
19 4 N N 1 4 5.4
20 4 N SIM 1 5 5.8
21 4 N N 0 4 4.4
22 4 N N 2 4 4.9
23 4 N SIM 1 5 11.4
24 4 N SIM 2 5 8.0
25 5 SIM N 2 5 4.6
26 5 N N 1 5 5.9
27 5 SIM N 2 5 2.5
28 5 SIM SIM 2 4 2.1
29 5 N N 0 4 10.9
30 5 N SIM 2 4 4.5
31 5 SIM N 3 5 3.8
32 5 N SIM 1 5 5.6
33 6 N N 2 5 6.2
34 6 SIM N 2 4 3.5
35 6 N N 1 3 3.2
36 6 N N 2 6 6.9
37 6 N N 1 5 5.8
38 6 N N 2 4 5.4
39 6 N SIM 1 4 4.7
40 6 SIM N 1 3 2.6
41 7 N N 2 4 7.5
42 7 SIM N 2 4 2.5
43 7 N N 1 4 7.5
44 7 N N 2 4 4.6
45 7 N N 2 5 8.0
46 7 N N 2 4 3.7
47 7 SIM N 1 2 2.1
48 7 N N 1 3 3.4
domicílio quadra analfabeto chefe mulher estudantes moradores renda
49 8 N N 2 4 5.8
50 8 N N 2 5 6.5
51 8 N N 1 5 5.6
52 8 N N 3 5 6.1
53 8 N N 1 4 4.4
54 8 N N 1 3 3.9
55 8 N N 2 4 4.3
56 9 SIM N 1 3 2.6
57 9 N N 1 4 5.6
58 9 N N 2 4 3.7
59 9 N N 1 4 5.5
60 9 N N 0 4 4.5
61 9 N N 1 3 4.6
62 10 N N 1 3 3.7
63 10 N N 2 5 6.2
64 10 N N 1 3 4.7
65 10 N N 1 3 3.2
66 10 N N 2 5 5.6
67 10 N N 2 4 6.1
68 10 N N 0 4 5.6
69 11 N N 2 5 5.4
70 11 N N 2 5 6.8
71 11 N N 2 4 3.8
72 11 N N 2 4 5.5
73 11 N N 2 4 4.4
74 12 N N 2 4 6.8
75 12 SIM N 0 2 2.1
76 12 N N 1 6 8.0
77 12 SIM N 2 5 2.6
78 12 N N 1 5 5.5
79 12 SIM N 1 4 2.1
80 12 N SIM 1 6 11.7
81 13 SIM N 1 4 3.5
82 13 SIM N 2 4 2.0
83 13 N N 2 4 5.0
84 13 N N 2 5 8.4
85 13 N N 1 4 5.5
86 13 SIM N 0 4 3.8
87 13 N N 1 6 9.5
88 13 N SIM 0 4 2.0
89 13 N N 0 2 2.2
90 14 N N 1 4 10.4
91 14 N N 1 5 7.7
92 14 N N 1 4 7.2
93 14 N N 1 4 4.9
94 14 N N 1 4 6.4
95 14 SIM SIM 0 2 2.1
96 14 N N 1 3 3.4
97 14 N N 1 4 4.5
domicílio quadra analfabeto chefe mulher estudantes moradores renda
98 15 N N 1 2 3.1
99 15 N N 1 3 5.9
100 15 SIM N 0 1 2.2
101 15 SIM SIM 1 3 2.3
102 15 N N 1 3 3.1
103 15 N N 2 4 5.6
104 15 N N 1 5 6.1
105 16 N N 0 5 8.0
106 16 N N 1 5 8.5
107 16 N N 1 4 4.7
108 16 N N 1 5 5.5
109 16 SIM SIM 2 4 3.1
110 16 N N 2 4 6.6
111 16 N SIM 1 5 5.7
112 16 N N 0 5 7.6
113 17 N N 1 4 5.4
114 17 N N 1 5 7.5
115 17 N N 2 4 5.0
116 17 N N 1 5 5.6
117 17 N N 1 5 5.8
118 17 N N 2 5 5.4
119 17 N N 0 1 3.3
120 17 SIM N 2 5 2.4
121 18 SIM N 1 5 3.1
122 18 N N 1 5 6.7
123 18 N SIM 1 4 4.9
124 18 N N 1 4 9.5
125 18 N N 1 4 4.6
126 18 N N 2 4 6.5
127 18 SIM N 2 4 3.5
128 18 N N 1 3 2.9
129 19 N N 2 4 4.8
130 19 N N 0 2 5.9
131 19 N N 1 4 4.7
132 19 SIM N 3 6 3.1
133 19 N N 1 4 7.3
134 19 N N 1 4 6.4
135 19 N N 1 4 4.9
136 20 N N 2 5 5.8
137 20 N N 3 5 4.8
138 20 N N 1 4 6.3
139 20 N N 1 5 6.1
140 20 N N 1 4 4.6
141 20 N N 1 5 8.5
142 21 N N 2 3 3.2
143 21 N N 0 1 4.6
144 21 SIM N 0 5 4.7
145 21 N N 1 6 9.5
146 21 N N 0 3 7.8
147 21 N N 2 5 6.1
148 21 N N 1 4 4.6
149 21 N N 2 4 7.2
domicílio quadra analfabeto chefe mulher estudantes moradores renda
150 22 N N 0 1 4.3
151 22 N N 2 5 8.1
152 22 N N 1 5 6.3
153 22 N N 1 5 5.5
154 22 N N 1 4 5.5
155 22 SIM N 1 4 3.5
156 22 N SIM 1 3 2.6
157 22 SIM N 3 6 5.4
158 22 N N 3 5 4.9
159 23 N N 1 5 5.6
160 23 N N 1 3 4.3
161 23 SIM N 0 5 4.8
162 23 N SIM 2 4 3.5
163 23 SIM SIM 1 4 3.3
164 23 SIM N 2 4 3.5
165 23 N N 2 4 4.3
166 23 N N 1 4 4.5
167 24 N N 1 4 7.9
168 24 N N 1 6 7.8
169 24 N N 1 6 7.2
170 24 N N 0 2 6.0
171 24 N N 0 2 6.6
172 24 SIM SIM 1 5 3.1
173 24 N N 2 6 7.5
174 24 N N 2 4 4.9
175 24 N N 2 4 4.4
176 25 SIM N 1 5 3.7
177 25 N N 2 4 4.0
178 25 N N 2 4 3.7
179 25 N N 2 4 8.2
180 25 N SIM 1 4 3.6
181 25 N N 2 4 4.3
182 25 N N 0 4 4.7
183 25 SIM SIM 2 4 2.3
184 25 SIM N 1 3 2.7
185 26 N N 0 3 6.4
186 26 N N 1 6 7.6
187 26 N N 0 4 5.4
188 26 N N 1 4 7.1
189 26 N N 1 4 7.2
190 26 SIM SIM 1 5 3.4
191 26 N N 2 4 3.7
192 26 N N 0 5 13.6
193 27 N SIM 1 4 4.3
194 27 N N 1 4 4.7
195 27 N SIM 3 5 4.8
196 27 N SIM 2 4 3.7
197 27 N N 1 4 7.7
198 27 N N 1 4 5.6
199 27 N N 0 2 2.2
200 27 N N 1 5 5.6
domicílio quadra analfabeto chefe mulher estudantes moradores renda
201 28 SIM N 0 3 2.7
202 28 N N 2 4 3.9
203 28 N SIM 1 3 8.2
204 28 N N 2 4 4.9
205 28 N N 1 5 5.6
206 28 SIM N 2 5 4.3
207 28 N N 2 4 3.7
208 28 SIM N 1 4 3.6
209 29 N N 0 4 7.5
210 29 N N 1 4 5.8
211 29 SIM N 1 4 3.6
212 29 N SIM 1 4 4.6
213 29 N N 2 5 7.8
214 29 N N 1 5 5.5
215 29 N N 2 3 3.5
216 29 SIM N 2 4 3.2
217 30 N N 1 5 7.9
218 30 N N 0 4 4.6
219 30 N SIM 0 4 9.4
220 30 SIM N 3 5 4.0
221 30 N SIM 0 2 2.7
222 30 SIM SIM 1 5 2.1
223 30 N N 3 5 6.5
224 30 N N 1 4 4.9
225 31 SIM N 1 3 2.6
226 31 N N 2 4 6.4
227 31 N N 2 4 5.5
228 31 N N 0 4 4.4
229 31 N N 2 5 7.2
230 31 N N 1 5 6.3
231 31 N N 1 4 8.7
232 32 N N 1 5 7.5
233 32 N N 2 4 3.7
234 32 N N 2 5 5.5
235 32 N N 1 4 4.7
236 32 N SIM 1 5 5.5
237 32 N N 1 6 7.3
238 33 N N 1 5 6.3
239 33 N SIM 1 6 5.7
240 33 N N 1 5 5.6
241 33 SIM SIM 1 4 3.9
242 33 N SIM 1 3 2.1
243 33 N N 1 4 7.2
244 34 N N 1 6 7.1
245 34 SIM N 1 6 3.2
246 34 N N 1 3 3.7
247 34 SIM N 1 4 3.4
248 34 N N 1 5 8.4
249 34 N N 0 4 4.5
250 34 N N 2 5 11.2
Anexo 2: Parâmetros da população:
Chefe Mulher:
casos
33 => proporção = 0.132
13.2 %
Chefe Analfabeto:
casos
47 => proporção = 0.188
18.8 %
Chefe Mulher e Analfabeta:
casos
10 => proporção = 0.040
4.0 %
Crianças na escola:
num. freq. fi xi fi
0 36 0.144 0.000
1 126 0.504 0.504
2 78 0.312 0.624
3 10 0.040 0.120
total 250 1 1.248
Média de crianças estudando: 1.25/domicílio
Moradores por domicílio:
num. freq. fi xi fi
1 4 0.016 0.016
2 11 0.044 0.088
3 27 0.108 0.324
4 117 0.468 1.872
5 75 0.300 1.500
6 16 0.064 0.384
total 250 1 4.184
Média de moradores: 4.2 / domicílio
Top Related