$PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh...

52
2. Noções de Amostragem 2. Noções de Amostragem Disciplina: 221171 2. Noções de Amostragem 2. Noções de Amostragem Prof. a Dr. a Simone Daniela Sartorio de Medeiros DTAiSeR-Ar 1

Transcript of $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh...

Page 1: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

2. Noções de Amostragem2. Noções de Amostragem

Disciplina: 221171

2. Noções de Amostragem2. Noções de Amostragem

Prof.a Dr.a Simone Daniela Sartorio de Medeiros

DTAiSeR-Ar

1

Page 2: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

População (Mundo Real)Amostra

Amostragem

2

Conjunto de todos os elementos sobre os quais se desejam uma informação

(tem uma característica em comum).

Pode ser: Finitas ou Infinitas

A população deve estar bem definida

É todo subconjunto de elementos retirados de uma população.

Seus elementos devem ser representativos da população.

Page 3: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

_Todos os valores possíveis da produção de milho da variedade W, em kg por hectare;

Exemplos de amostra:

_ Os rendimentos de milho da variedade W, em kg/ha, de uma amostra de 5 unidades experimentais (canteiros);

Exemplos de população:

3

_ Todos os pesos ao nascer de suínos da raça X, em gramas.

_ Os pesos ao nascer de uma ninhada de suínos da raça X.

Page 4: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Como obter informações Como obter informações

4

destes conjuntos?destes conjuntos?

Page 5: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

RecenseamentoRecenseamento:

Quando são coletados dados sobre TODOS os elementos da população.

O censo é sempre o melhor método para obtermos informações úteis?

CensoCenso

Conjunto de dados obtidos pelo recenseamento.

PopulaçãoPopulação

5

Limitações do Censo

IneficazIneficaz: maior possibilidade de erro dada aquantidade de observações/medições;

ImpossívelImpossível: no diagnóstico e monitoramentode populações extremamente dinâmicas;

ImpraticávelImpraticável:: custo e tempo de execução emgeral são excessivos.Alternativa?

Utilizar amostras

Page 6: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Os dados de uma amostra pode ser obtida por:

AmostraAmostra

6

a) Pesquisa de opinião;b) Observação;c) Realização de um experimento; oud) Realizando uma simulação.

Os dados de uma amostra pode ser obtida por:

Page 7: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

a) Pesquisa de opinião a) Pesquisa de opinião É o levantamento das opiniões de uma amostra de pessoas, com a finalidade

de conhecer as opiniões da população em geral (opinião pública) sobre determinado assunto, em particular.

Algumas pessoas não falam com estranhos, ou não respondem perguntas por telefone (por exemplo).

Formam o grupo dos não respondentes.

Na interpretação dos dados, é preciso levar em consideração tanto falta de

resposta como erro de resposta.

Portanto, a população efetivamente amostrada é um pouco diferente da população alvo da pesquisa

7

Page 8: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

b) Observaçãob) ObservaçãoÉ a observação direta dos fenômenos em

laboratórios ou na natureza.

8

Page 9: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

É aplicado um tratamento (ou mais) a uma parte da população e são observadas as respostas.

A outra parte da população é, em geral, usada como um grupo controle. Esse grupo não recebe tratamento algum ou então recebe o placebo.

Após serem observadas as respostas dos dois (ou mais) grupos, os resultadossão comparados.

c) Realizando um experimentoc) Realizando um experimento

são comparados.

9

Page 10: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

d) Fazendo uma simulaçãod) Fazendo uma simulação

É o uso de um modelo matemático ou físico para reproduzir as condições calculadas de um situação

ou de um processo. A coleta de dados frequentemente compreende o uso de computadores.

As simulações permitem estudar situações que seria pouco prático ou

Exemplo: Exemplo:

Fabricantes de automóveis usam simulações com bonecos para estudar os efeitos que as colisões

têm em seres humanos;

As simulações permitem estudar situações que seria pouco prático ou até mesmo perigoso criar na vida real, além de frequentemente poupar

tempo e dinheiro.

10

Page 11: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Porque amostrar?Porque amostrar?

11

Porque amostrar?Porque amostrar?

Page 12: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Porque amostrar?Porque amostrar?

a) Algumas populações são muitograndes que só podem ser estudadaspor meio de amostras.

b) Custo e a demora: obter os dados,Censos Informações obsoletas.

Numa pesquisa eleitoral, a 3dias de uma eleição presidencialnão haveria tempo suficientepara pesquisar a população deeleitores do país, mesmo quehouvesse recurso financeiros emabundância.

12

c) É impossível estudar algumas populações.

Uma empresa de fósforo e deseja-setestar a qualidade do produto quefabrica, não pode acender todos osfósforos que fabricou – mas apenasalguns deles.

d) Estudar cuidadosamente umaamostra tem mais valor científico doque estudar rapidamente toda apopulação

É mais fácil realizar operações de pequena escala

e evitando erros, pois um dos problemas típicos nos

grandes censos é o controle dos entrevistados.

Page 13: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Logo, tudo será realizado por meio de uma (ou mais) amostra(s)!!!

...Mas CUIDADO:...Mas CUIDADO:

13

Page 14: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Característica de fácil mensuraçãoCaracterística de fácil mensuraçãoMesmo que a população não seja tão pequena, mas a variável que se querobservar é de tão fácil mensuração, que não compensa investir numplano de amostragem.

Situações em que o uso da Situações em que o uso da amostragem não é interessanteamostragem não é interessante

População pequenaPopulação pequenaSe a população for pequena (50 elementos ou menos) para se ter uma amostra capaz degerar resultados precisos para os parâmetros da população, será necessário umaamostra relativamente grande (em torno de 80% da população).

plano de amostragem.Exemplo: para verificar a porcentagem de funcionários favoráveis à mudança nohorário de um turno de trabalho, pode-se entrevistar toda a população no própriolocal de trabalho.

Desta forma este parâmetro precisa ser avaliado com grande precisão e, por isto, se pesquisa toda a população.

Necessidade de alta precisãoNecessidade de alta precisãoA cada 10 anos o IBGE realiza um censo demográfico para estudar diversascaracterísticas da população brasileira. Dentre estas características têm-se o parâmetronúmero de habitantes residentes no país, que é fundamental para o planejamento dopaís.

14

Page 15: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Plano de amostragemPlano de amostragemPlano de amostragemPlano de amostragem

15

Page 16: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Plano de AmostragemPlano de Amostragem

É necessário ter bem definidos:

os objetivos da pesquisa, a população a ser amostrada, bem como os parâmetros que precisam ser estimados para atingir os objetivos da pesquisa.

Nesse plano de amostragem deve constar :

a definição da unidade de amostragem, a forma de seleção dos elementos da população; e o tamanho da amostra.

16

Page 17: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

AmostragemAmostragem

17

É o processo da escolha criteriosa da amostra, ou seja, dos elementos a serem submetidos ao estudo.

A solução adequadas para problemas de amostragem exige, em geral, muito bom-senso, conhecimento do

fenômeno biológico e experiência.

Page 18: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Compra-se a caixa de morango com os morangos

mais bonitos por cima.

E os debaixo?

A minha opinião sobre como anda a administração da cidade depende dos

lugares onde vou e das ruas por ande passo.

Será que os lugares e ruas que conheço representam todos os lugares/ruas da cidade?

Tendências da amostragemTendências da amostragem

Tendência natural das pessoas é buscar a

informação do modo mais “conveniente” A minha noção da opinião pública

depende das pessoas com que convivo.

Será que os meus conhecidos e amigos representam a população brasileira?

18

Page 19: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

A seleção dos elementos que irão compor a amostra pode ser feita de

várias maneiras e irá depender do conhecimento que se tem da

população e da quantidade de recursos disponíveis.

O sucesso da amostragem vai dependerde um planejamento adequado.

19

Page 20: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Métodos de AmostragemMétodos de Amostragem

1) Amostragem probabilística (ou aleatória)Os resultados podem ser projetáveis para a população total

20

Para a escolha do processo de amostragem, o pesquisador deve levar emconta: o tipo de pesquisa, a acessibilidade aos elementos da população, adisponibilidade ou não de ter os elementos da população, a representatividadedesejada ou necessária, a oportunidade apresentada pela ocorrência de fatos oueventos, a disponibilidade de tempo, recursos financeiros e humanos etc.

2) Amostragem não probabilística (ou não aleatória)Os resultados não podem ser generalizados.

Page 21: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Amostras obtidas através de algum tipo de sorteio;

Permitem a utilização das técnicas clássicas de inferência estatística

1)1) Amostragem ProbabilísticaAmostragem Probabilísticacada elemento da população tem uma chance conhecida e diferente de zero de ser

selecionado para compor a amostra.

As amostragens probabilísticas geram amostras probabilísticas.

Fornecendo maior segurança ao generalizar

resultados da amostra para a população.

O processo aleatório de seleção das unidades elimina qualquer

interferência de escolha humana na escolha dos elementos da amostra.

O “sorteio” pode ser obtido:a) Manualmente;b) Por meio de tabelas de números aleatórios, ouc) Usando o computador (Excel, ou software R). 21

Page 22: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Em uma urna coloca-se 10 bolas de mesmo tamanho, peso, superfície, etc(elementos homogêneos)

contendo os números: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9

Antes de cada sorteio, os números são “misturados” na urna.

Ao sortear um número ele pode:

a) Obtendo uma amostra aleatória manualmentea) Obtendo uma amostra aleatória manualmente

2

6

8

9

3

7

1

5

4

Ao sortear um número ele pode:

Retornar à urna Amostragem com reposiçãoAmostragem com reposição

Qualquer elemento tem exatamente a mesma chance de ser obtido.

0

Ficar separado Amostragem sem reposiçãoAmostragem sem reposição

22

Page 23: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

b) Tabelas de números aleatóriosb) Tabelas de números aleatórios

23

Page 24: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

set.seed(2081) # sementeN = 10 # N = tamanho da populaçãovalores<- factor(1:N); valores # Ordem padrão

r<- runif(N) # gerando uma dist. U[0,1] de tamanho Nsorteio1<- order(r) # sorteio 1

c) Obtendo uma amostra aleatória usando o computadorc) Obtendo uma amostra aleatória usando o computador

No Excel

No software R:

Função: =ALEATORIOENTRE(inferior; superior)

sorteio1<- order(r) # sorteio 1cbind(r,sorteio1) # concatenando os vetores

# Selecionar uma amostra de tamanho n=4amostra1<- sorteio1[1:4]; amostra1

24

Page 25: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

c) Obtendo uma amostra aleatória usando o computadorc) Obtendo uma amostra aleatória usando o computador

No Excel

No software R:

Função: =ALEATORIOENTRE(inferior; superior)

Com

repo

siçã

o

set.seed(2081) # sementeN = 10 # N = tamanho da populaçãovalores<- factor(1:N); valores # Ordem padrão[1] 1 2 3 4 5 6 7 8 9 10Levels: 1 2 3 4 5 6 7 8 9 10r<- runif(N) # gerando uma dist. U[0,1] de tamanho N

25

Sem

repo

siçã

o

r<- runif(N) # gerando uma dist. U[0,1] de tamanho Nsorteio1<- order(r) # sorteio 1cbind(r,sorteio1) # concatenando os vetores

r sorteio1[1,] 0.81187589 10[2,] 0.46084606 9[3,] 0.87486624 6[4,] 0.28889513 4[5,] 0.89431621 2[6,] 0.27789351 1[7,] 0.98824797 8[8,] 0.85706378 3[9,] 0.12791121 5[10,] 0.07989472 7# Selecionar uma amostra de tamanho n=4amostra1<- sorteio1[1:4]; amostra1[1] 10 9 6 4

Page 26: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Podem levar a resultados úteis;

Não se prestam à utilização de processos estatísticos inferenciais;

Inacessibilidade a toda a população.

Observa-se as unidade mais acessíveis (“conveniente”) da população.

2) Amostragem Não Probabilística2) Amostragem Não Probabilística

São realizadas pela simplicidade ou por impossibilidade de se obter amostras probabilísticas.

Observa-se as unidade mais acessíveis (“conveniente”) da população.

Amostragem de conveniência é

sempre ENVIESADA, isto é,

possui VIÉS

As unidades “inconvenientes” de serem observadas

jamais serão amostradas.

Não importa quão grande seja a amostra, a

amostragem de conveniência nunca será totalmente

representativa da população.

26

Page 27: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Amostragem probabilísticaAmostragem probabilísticaOs métodos mais comuns são:

a) Amostragem Aleatória Simples (AAS)

b) Amostragem Aleatória Estratificada (AAE)

c) Amostragem Sistemática (AS)

d) Amostragem por Conglomerado (AC)

27

Page 28: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Exemplo 1Exemplo 1

Deseja-se selecionar uma amostra de 5 alunos a partir de uma classe de 50 alunos.

a) Como podemos selecionar esta amostra?

b) Qual amostragem seria mais indicada? Porque?

c) Descreva todo o procedimento.

28

c) Descreva todo o procedimento.

Page 29: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

A técnica exige que a população seja HOMOGÊNEA, isto é, seja constituída por unidades similares, sob o ponto de vista da variável em estudo.

É o equivalente a um sorteio lotérico.

TODOS os elementos da população têm igual chance (probabilidade) de

É a mais simples e talvez o mais importante em estatística.

1) Amostragem Aleatória Simples (AAS)1) Amostragem Aleatória Simples (AAS)

TODOS os elementos da população têm igual chance (probabilidade) de pertencer a amostra.

29

Uma amostra de um dado tamanho tem a mesma chance de ser

selecionada que qualquer outra amostra possível de mesmo tamanho.

Amostras de diferentestamanhos podem ter chances

diferentes.

Page 30: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Procedimento para a obtenção de uma amostra aleatória simplesde tamanho n

1) Enumerar os N elementos da população de 1 a N.

2) Sortear, sem preposição, n números compreendidos de 1 a N.

3) Os elementos correspondentes aos números escolhidos formarão a amostra.

30

Page 31: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Exemplo 2:Exemplo 2:O esquema abaixo representa uma pequena área com

laranjeiras de 3 diferentes variedades.Deseja-se estimar o número total de frutos dessa área

observando-se apenas 10 laranjeiras.

Como você realizaria a amostragem?Você recomendaria o uso da amostragem aleatória simples? Por que?

# # # # # # # # # # # #

Legenda Variedade# AX B* C

# # # # # # # # # # # #

# # # # # # # # # # # #

# # # # # # # # # # #

* * * * * X X X X X X X

* * * * * X X X X X X X

* * * * * X X X X X X X

* * * * X X X X X X

OBS: a população é HETEROGÊNEA 31

Page 32: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

2) Amostragem Aleatória Estratificada (AAE)2) Amostragem Aleatória Estratificada (AAE)

A população é subdividida em grupos mutuamente exclusivos(subpopulações) chamados estratos que compartilham uma característicasimilar: idade, etnicidade, renda, bairro, sexo, variedade, etc.

Uma AAS é tomada dentro de cada estrato, e as estimativas dos estratos sãocombinadas numa única amostra:

menor variabilidade entre amostras da população; menor variabilidade entre amostras da população;

maior precisão na amostragem.

A variável de interesse apresenta comportamento homogêneo dentro dosestratos e heterogêneo entre os estratos.

Se os estratos forem internamentemais homogêneos que a população

em termos da variável que foi medida

a AAE será mais precisa que a AAS

32

Page 33: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Resolução do exemplo 2Resolução do exemplo 2:

Legenda Variedade Ni# A 35X B 27* C 19N 81

Temos k = 3 estratos.

# # # # # # # # # # # #

# # # # # # # # # # # #

# # # # # # # # # # #

* * * * * X X X X X X X

* * * * * X X X X X X X

* * * * * X X X X X X X

Sabendo que n = 10.

Calcule n1, n2 e n3.

* * * * X X X X X X

33

Page 34: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Procedimento para a obtenção de uma amostra estratificada proporcional de tamanho n

Considerando:

N o número de elementos da população;

k o número de estratos;

Ni o número de elementos do estrato i (OBS: N = N1 + N2 + ... + Nk)

n o tamanho da amostra a ser selecionada.

Calcule a fração da amostragem dada por : f = nN

Calcular o número de elementos a serem sorteados em cada estrato:n1 N1 f n2 N2 f n3 N3 f ... nk Nk f

comn = n1 + n2 + n3 + ... + nk

34

Page 35: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Existem diversas formas de se alocar (partilhar) a amostra nos diversos estratos k. Dentre elas podemos citar:

fNN

nNn hhh

2.1.) Partilha proporcional:

, h = 1, ..., k

2.3.) Partilha ótima(ou alocação de Neyman)

, h = 1, ..., knN

Nn

h

k

hh

hhh

1

2.2.) Partilha igual (ou Partilha uniforme):

, h = 1, ..., kk

nnh

Só é recomendada quando os estratos populacionais forem

uniformes e de mesmo tamanho.

É uma partilha de n unidade para os k estratos que resulta numa média (estimada) com

variância mínima.

h1

35

Page 36: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Exemplo 3Exemplo 3::

Uma loja de materiais de construção deseja conhecer o perfil dos seus compradores. Imagine que esta tem 1000 cadastros arquivados e tem

condições para entrevistar 200 dos mesmos.

ASD BTD CHS DOF EVT FDY GDA HYJ IYF IE JA JSG KDE

KSJ LJE LH LS LZD MN MO NEG NH OM PIS QAG RVA

RP ...

Como você faria a amostragem?

36

Page 37: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

3) Amostragem Sistemática (AS)3) Amostragem Sistemática (AS)

Quando os elementos da população se apresentam ordenados e a retirada dos elementos da amostra é feita periodicamente.

Para uma amostra sistemática de “1-em-cada-k-unidades”, você primeiro seleciona aleatoriamente uma das k primeiras unidades. A partir da unidade selecionada toma-se sempre a k-ésima unidade.partir da unidade selecionada toma-se sempre a k-ésima unidade.

OBS: Somente a primeira unidade é selecionada aleatoriamente, todas as demais são tomadas

sistematicamente.

37

Page 38: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Procedimento para a obtenção de uma amostra sistemática(1 em cada k elementos)

Definir a porcentagem p de elementos da população que farão parteda amostra. OBS: p = número entre [0,1];

Obter o valor de k, inteiro, dado por:

k 1 p

Sortear um número r inteiro entre 1 e k;

A amostra será composta pelos elementos de ordem

r, r + k, r+2k, r+3k, ...

38

Page 39: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Amostragem não Amostragem não probabilísticaprobabilística

a) Amostragem por conveniência

b) Amostragem por julgamento

c) Amostragem por quotas

39

Page 40: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Amostragem Não ProbabilísticaAmostragem Não ProbabilísticaÉ aquela em que a seleção dos elementos da população para compor a amostra

depende ao menos em parte do julgamento do pesquisador ou do entrevistador no campo.

AmostragemAmostragem não probabilísticanão probabilística

Amostra por conveniênciaO pesquisador seleciona membros dapopulação mais acessíveis.

40

população mais acessíveis.

Amostra por julgamento

O pesquisador usa o seu julgamentopara selecionar os membros dapopulação que são boas fontes deinformação precisa.

Amostra por quotaO pesquisador entrevista um númeropredefinido de pessoas em cada umadas várias categorias.

Page 41: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Exemplo 1: Exemplo 1:

Imagine que a população de uma cidade é composta, de acordo com o Censo, por 4/8 de jovens, 3/8 de adultos e 1/8 de idosos, descontadas

as crianças.

Você sai às ruas da cidade com a incumbência de entrevistar 800 pessoas selecionadas segundo a técnica de amostragem por quotas.

Descreva como será composta sua amostra?Descreva como será composta sua amostra?

Para compor sua amostra, deve entrevistar :

_4/8 de jovens, ou seja, 400,

_3/8 de adultos, ou seja, 300, e

_1/8 de idosos, ou seja, 100, à sua escolha.

Você completa assim a sua amostra, composta por quotas de faixas etárias iguais às da população.

41

Solução:

Page 42: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Qual o tamanho da Qual o tamanho da Amostra?Amostra?

42

Page 43: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

A amostra demasiadamente pequena, mesmo sendo estudo de caso, são inúteis porque, em geral, não fornecem boas estimativas. Logo, não permite fazer inferências estatísticas.

A amostra deve ter o tamanho usual da área em que a pesquisa se enquadra.

O tamanho da amostraO tamanho da amostra

Por outro lado, desconfie de amostras grandes. Será que opesquisador observou cada unidade amostrada com o devido cuidado?Amostras grandes, porém malfeitas, são piores, porque dão a ilusão deconter uma verdade que não contêm.

Também é preciso verificar se a amostra foi retirada da população usando técnica estatística consagrada e

delineada segundo critérios estatísticos. Se isso não for feito, a amostra pode ser tendenciosa.

43

Page 44: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Como determinar o tamanho da amostra?Como determinar o tamanho da amostra?

Na prática, o tamanho da amostra é determinado mais por considerações reais ou imaginárias a respeito do custo de cada unidade amostrada do

que por técnicas estatísticas.

Temos duas regras:

Veja o que se faz na sua área consultando trabalhos similares (ouseja, consultando a literatura) e verifique o que seu orçamento permiteseja, consultando a literatura) e verifique o que seu orçamento permitefazer. Se seu orçamento for curto, não tente enquadrar nele uma pesquisaambiciosa.

De qualquer forma, o tamanho da amostra pode ser determinadopor critérios estatísticos. As fórmulas de cálculo são bem conhecidas,mas esses cálculos exigem conhecimentos maiores.

44

Portanto, vai ficar para depois!!!

Page 45: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

O que iremos fazer com O que iremos fazer com a amostra?a amostra?

45

Page 46: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Aluno Horas de Estudo

1 1

2 3

3 4

4 2

ObserveObserve

Suponhamos que a nossa população seja apenas um grupo de 5 alunos de estatística e a variável de interesse seja o número de horas por semana dedicadas

ao estudo da disciplina.

a) Calcule o tempo médio dedicado à disciplina nesta população (parâmetro);

b) Tomemos uma amostra de tamanho 2 desta população, qual o valor da estatística se:

_ Os alunos 1 e 4 forem selecionados?

_ Os alunos 2 e 3 forem selecionados?

_ Os alunos 1 e 5 forem selecionados?

4 2

5 5

O valor do parâmetro e da estimativa são sempre iguais?

população, qual o valor da estatística se:

Não existe garantia de que a estatística tenha valor igual, ou mesmo próximo, do valor do parâmetro que se pretende

estimar.

No entanto, se a amostra for suficientemente grande e obtida de acordo

com a técnica correta, na maioria das vezes isso ocorrerá. 46

Page 47: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Mundo Real (população) Amostra

EstimativaÉ uma descrição numérica Parâmetro

Amostragem

É uma descrição numérica de uma característica de interesse (variável) em

relação a amostra.

Parâmetro

É a descrição numérica de uma característica de interesse (variável) da

população..

Valor variável e conhecido(depende da amostra obtida)

47

(Valor fixo e desconhecido)

A fórmula para obter esta estimativa (valor) é denominada de estimador.

Page 48: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

ObservaçõesObservaçõesObservaçõesObservações

48

Page 49: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Parâmetro, estatística e estimativaParâmetro, estatística e estimativa

“Não é preciso comer todo o boi para saber se a carne está macia”.

Para “ter idéia” do valor do parâmetro, ou seja, para estimá-lo, basta que o pesquisador obtenha uma amostra.

“Não é preciso comer toda sopa para saber se está boa de sal”.

49

Page 50: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Tendência, viés, vício, ou erro amostral é a diferença entre a estimativa que se obteve na amostra e o parâmetro que se quer estimar.

Por exemplo:

Teoricamente:

amostralerro ˆ

Dessa forma, muitos cuidados são necessários, pois erros de amostragem podem ser sérios!!!

Uma amostra tendenciosa não fornece estimativa minimamente razoável do parâmetro que se deseja estimar.

amostralerro

Logo, TODO levantamento por amostragem tem um grau de incerteza (erro

amostral)

O erro amostral pode ser um valor negativo ou positivo, pequeno, nulo ou grande.

A estimativa será precisa se tivermos alto grau de confiança de que o erro amostra associado à

estimativa em questão é pequeno.

50

Page 51: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

Logo, para interpretar bem os dados e tirar conclusões adequadas, não basta olhar os números:

é preciso entender como a amostra foi tomada; e

verificar se não incidiram, no processo de amostragem, alguns fatores que poderiam trazer certa tendência aos dados.

A precisão e a confiança são dois conceitos-chaves nesse estudo:A precisão e a confiança são dois conceitos-chaves nesse estudo:

A precisão, pode ser entendida como a diferença máxima entre a estatística e o parâmetro que o pesquisador deseja considerar no

seu estudo.

A confiança, pode ser entendida como a chance que o pesquisador tem de que a diferença máxima desejada não seja superada.

51

Page 52: $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh plokr gd ydulhgdgh : hp nj sru khfwduh ([hpsorv gh dprvwud b 2v uhqglphqwrv gh plokr

PrecisãoPrecisão

Capacidade dos sistemas de amostragem de gerar Estatísticas com pequena variabilidade entre amostras (de mesmo tamanho) tomadas

numa mesma população.

Qual o sistema de amostragem ideal?Qual o sistema de amostragem ideal?

X

Sem viésSem viésSem precisãoSem precisão

Com viésCom precisão

Sem viésCom precisão

XX

X

X XX

X XXXXXXX

XXXX

XXXX

Para um mesmo tamanho de amostra, sistemas diferentes de amostragem podem resultar em precisão diferente.

52