Técnicas de Amostragem - econpolrg.files.wordpress.com · Conveniente no estudo de populações...

182

Transcript of Técnicas de Amostragem - econpolrg.files.wordpress.com · Conveniente no estudo de populações...

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Técnicas de Amostragem

Prof. Alan Ricardo da Silva

Departamento de Estatística

Universidade de Brasília - UnB

IE-Instituto de Ciências Exatas

Abril de 2018

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 1-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Agenda

1 Vantagens do Método de Amostragem;

2 Fases de um Levantamento por Amostragem;

3 Amostragem Aleatória Simples;

4 Amostragem Aleatória Estrati�cada;

5 Amostragem Sistemática;

6 Amostragem por Conglomerado;

7 Regressão com Plano Amostral.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 2-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Vantagens do Método de Amostragem

Objetivo Principal:Obter informações sobre o todo, baseando-se no resultado de umaamostra.Importância

Conveniente no estudo de populações grandes;

Indispensável no estudo de populações in�nitas;

Indispensável quando ocorre destruição de material.

Vantagens

Redução de Custo;

Maior Velocidade;

Maior Escopo;

Maior Precisão.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 3-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Fases de um Levantamento por Amostragem

1 Objetivos;

2 População a ser amostrada;3 Dados a serem coletados;4 Grau de precisão;5 Métodos de mensuração;6 Cadastro (frame);7 Tamanho da amostra/seleção;8 Pré-teste (não-aleatório);9 Organização do trabalho de campo;10 Análise dos resultados;11 Informação obtida para levantamentos futuros;12 Relatório �nal.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 4-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Fases de um Levantamento por Amostragem

1 Objetivos;2 População a ser amostrada;

3 Dados a serem coletados;4 Grau de precisão;5 Métodos de mensuração;6 Cadastro (frame);7 Tamanho da amostra/seleção;8 Pré-teste (não-aleatório);9 Organização do trabalho de campo;10 Análise dos resultados;11 Informação obtida para levantamentos futuros;12 Relatório �nal.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 4-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Fases de um Levantamento por Amostragem

1 Objetivos;2 População a ser amostrada;3 Dados a serem coletados;

4 Grau de precisão;5 Métodos de mensuração;6 Cadastro (frame);7 Tamanho da amostra/seleção;8 Pré-teste (não-aleatório);9 Organização do trabalho de campo;10 Análise dos resultados;11 Informação obtida para levantamentos futuros;12 Relatório �nal.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 4-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Fases de um Levantamento por Amostragem

1 Objetivos;2 População a ser amostrada;3 Dados a serem coletados;4 Grau de precisão;

5 Métodos de mensuração;6 Cadastro (frame);7 Tamanho da amostra/seleção;8 Pré-teste (não-aleatório);9 Organização do trabalho de campo;10 Análise dos resultados;11 Informação obtida para levantamentos futuros;12 Relatório �nal.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 4-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Fases de um Levantamento por Amostragem

1 Objetivos;2 População a ser amostrada;3 Dados a serem coletados;4 Grau de precisão;5 Métodos de mensuração;

6 Cadastro (frame);7 Tamanho da amostra/seleção;8 Pré-teste (não-aleatório);9 Organização do trabalho de campo;10 Análise dos resultados;11 Informação obtida para levantamentos futuros;12 Relatório �nal.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 4-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Fases de um Levantamento por Amostragem

1 Objetivos;2 População a ser amostrada;3 Dados a serem coletados;4 Grau de precisão;5 Métodos de mensuração;6 Cadastro (frame);

7 Tamanho da amostra/seleção;8 Pré-teste (não-aleatório);9 Organização do trabalho de campo;10 Análise dos resultados;11 Informação obtida para levantamentos futuros;12 Relatório �nal.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 4-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Fases de um Levantamento por Amostragem

1 Objetivos;2 População a ser amostrada;3 Dados a serem coletados;4 Grau de precisão;5 Métodos de mensuração;6 Cadastro (frame);7 Tamanho da amostra/seleção;

8 Pré-teste (não-aleatório);9 Organização do trabalho de campo;10 Análise dos resultados;11 Informação obtida para levantamentos futuros;12 Relatório �nal.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 4-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Fases de um Levantamento por Amostragem

1 Objetivos;2 População a ser amostrada;3 Dados a serem coletados;4 Grau de precisão;5 Métodos de mensuração;6 Cadastro (frame);7 Tamanho da amostra/seleção;8 Pré-teste (não-aleatório);

9 Organização do trabalho de campo;10 Análise dos resultados;11 Informação obtida para levantamentos futuros;12 Relatório �nal.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 4-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Fases de um Levantamento por Amostragem

1 Objetivos;2 População a ser amostrada;3 Dados a serem coletados;4 Grau de precisão;5 Métodos de mensuração;6 Cadastro (frame);7 Tamanho da amostra/seleção;8 Pré-teste (não-aleatório);9 Organização do trabalho de campo;

10 Análise dos resultados;11 Informação obtida para levantamentos futuros;12 Relatório �nal.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 4-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Fases de um Levantamento por Amostragem

1 Objetivos;2 População a ser amostrada;3 Dados a serem coletados;4 Grau de precisão;5 Métodos de mensuração;6 Cadastro (frame);7 Tamanho da amostra/seleção;8 Pré-teste (não-aleatório);9 Organização do trabalho de campo;10 Análise dos resultados;

11 Informação obtida para levantamentos futuros;12 Relatório �nal.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 4-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Fases de um Levantamento por Amostragem

1 Objetivos;2 População a ser amostrada;3 Dados a serem coletados;4 Grau de precisão;5 Métodos de mensuração;6 Cadastro (frame);7 Tamanho da amostra/seleção;8 Pré-teste (não-aleatório);9 Organização do trabalho de campo;10 Análise dos resultados;11 Informação obtida para levantamentos futuros;

12 Relatório �nal.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 4-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Fases de um Levantamento por Amostragem

1 Objetivos;2 População a ser amostrada;3 Dados a serem coletados;4 Grau de precisão;5 Métodos de mensuração;6 Cadastro (frame);7 Tamanho da amostra/seleção;8 Pré-teste (não-aleatório);9 Organização do trabalho de campo;10 Análise dos resultados;11 Informação obtida para levantamentos futuros;12 Relatório �nal.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 4-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Tipos de Amostragem

O papel da teoria de amostragem é fazer amostragem maise�ciente, ou seja, com o menor custo possível produzir estimativasmais precisas.Tipos de Amostragem

Amostragem Acidental;

Amostragem Típica;

Amostragem Proposital;

Amostragem por Cotas;

Amostragem Probabilística.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 5-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Tipos de Amostragem

O papel da teoria de amostragem é fazer amostragem maise�ciente, ou seja, com o menor custo possível produzir estimativasmais precisas.Tipos de Amostragem

Amostragem Acidental;

Amostragem Típica;

Amostragem Proposital;

Amostragem por Cotas;

Amostragem Probabilística.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 5-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Tipos de Amostragem

O papel da teoria de amostragem é fazer amostragem maise�ciente, ou seja, com o menor custo possível produzir estimativasmais precisas.Tipos de Amostragem

Amostragem Acidental;

Amostragem Típica;

Amostragem Proposital;

Amostragem por Cotas;

Amostragem Probabilística.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 5-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Tipos de Amostragem

O papel da teoria de amostragem é fazer amostragem maise�ciente, ou seja, com o menor custo possível produzir estimativasmais precisas.Tipos de Amostragem

Amostragem Acidental;

Amostragem Típica;

Amostragem Proposital;

Amostragem por Cotas;

Amostragem Probabilística.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 5-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Tipos de Amostragem

O papel da teoria de amostragem é fazer amostragem maise�ciente, ou seja, com o menor custo possível produzir estimativasmais precisas.Tipos de Amostragem

Amostragem Acidental;

Amostragem Típica;

Amostragem Proposital;

Amostragem por Cotas;

Amostragem Probabilística.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 5-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Vantagens do Método de Amostragem

Exemplo: População com 6 elementos. Amostra de tamanho 2.C6

2 = 15S1 = (1, 2), S2 = (1, 3), . . . , S15 = (5, 6).Sorteia-se um número entre 1 e 15.Se o número é j, Sj é a amostra selecionada.

Com reposição;Com probabilidades iguais;Com probabilidades diferentes;

Sem Reposição.Com probabilidades iguais;Com probabilidades diferentes;

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 6-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Aleatória Simples (AAS)

AAS é um método de selecionar n unidades de N tal qualquer umadas CN

n amostras distintas tenha mesma chance de ser selecionada.Exemplo: Pop = {a,b,c,d}. C4

2 = 6abacad p = 1

6 = 1CN

nbcbdcdnN . n−1

N−1 . n−2N−2 ... 1

N−n+1 = n!(N−n)!N! = 1

CNn

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 7-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Aleatória Simples (AAS)

O Plano é descrito do seguinte modo:Seja o Universo U = {1, 2, . . . , N}i) Utilizando-se de um processo aleatório, sorteia-se com igual

probabilidade um elemento da população U.

ii) Repete-se o processo anterior até que sejam sorteadas nunidades.

iii) Caso seja permitido o sorteio de uma unidade mais de umavez, tem-se o processo AAS com reposição (AASc). Quando oelemento sorteado é removido de U antes do sorteio dapróxima unidade, tem-se o plano AAS sem reposição (AASs).

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 8-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Aleatória Simples (AAS)

Do ponto de vista prático, o plano AASs é muito mais interessante,pois é intuitivo �Não se ganha mais informação se uma mesmaunidade aparece mais de uma vez na amostra�. Por outro lado, oplano AASc introduz vantagens matemáticas e estatísticas, como aindependência entre as unidades sorteadas, o que facilita muito adeterminação das propriedades dos estimadores.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 9-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Aleatória Simples (AAS)

Parâmetros da PopulaçãoTOTAL: T = ∑N

j=1 Yj = NY

MÉDIA: Y =∑N

j=1 Yj

N = µ

VARIÂNCIA: σ2 =∑N

j=1(Yj−Y)2

N S2 =∑N

j=1(Yj−Y)2

N−1

EstimadoresTOTAL: T = Ny

MÉDIA: y =∑n

j=1 yj

n

VARIÂNCIA: s2 =∑n

j=1(yj−y)2

n−1

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 10-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Aleatória Simples com Reposição (AASc)

Exemplo: Seja a variável renda familiar dada por (12, 30, 18), comT = 60, µ = 20 e σ2 = 168/3 = 56. Tomada uma amostra den = 2, tem-se as seguintes amostras.

(12,12) (12,30) (12,18) (30,12) (30,30) (30,18) (18,12) (18,30) (18,18)

P 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9y 12 21 15 21 30 24 15 24 18

s2 0 162 18 162 0 72 18 72 0

T 24 42 30 42 60 48 30 48 36

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 11-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Aleatória Simples com Reposição (AASc)

y 12 15 18 21 24 30P 1/9 2/9 1/9 2/9 2/9 1/9

E(y) = 12+30+18+42+48+309 = 180

9 = 20 = µ

Var(y) = σ2

n = 562 = 28

s2 0 18 72 162P 3/9 2/9 2/9 2/9

E(s2) = 0+36+144+3249 = 504

9 = 56 = σ2

T 24 30 36 42 48 60P 1/9 2/9 1/9 2/9 2/9 1/9

E(T) = 24+60+36+84+96+609 = 360

9 = 40 6= TProf. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 12-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Normalidade Assintótica e Intervalos de Con�ança

À medida que o tamanho da amostra aumenta, as distribuições dey e T vão se aproximando da distribuição normal de acordo com oTeorema Central do Limite (TCL). Então, para n su�cientementegrande, temos que

y− µ√σ2/n

a∼ N(0, 1)

T− TN√

σ2/na∼ N(0, 1)

Isso possibilita a obtenção de intervalos de con�ança aproximadospara y e T.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 13-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Normalidade Assintótica e Intervalos de Con�ança

Assim, com relação à média populacional

P(|y− µ|√

σ2/n≤ zα/2

)≈ 1− α

n grande

P(

y− zα/2

√σ2/n ≤ µ ≤ y + zα/2

√σ2/n

)≈ 1− α

Na falta de σ2, usar s2.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 14-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Determinação do Tamanho da Amostra

Determinar o tamanho da amostra n, de tal forma que o estimadorobtido tenha um erro máximo de estimação igual a �ε�, comdeterminado grau de con�ança γ.

P(|y− µ| ≤ ε) ≈ 1− α

n grande P(|y− µ| ≤ zα/2

√σ2/n) ≈ 1− α

ε = zα/2

√σ2

n⇒ n =

z2α/2σ2

ε2

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 15-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Determinação do Tamanho da Amostra

Exemplo1: Seja o intervalo (18± 1, 96√

48/10) = (18± 4, 29)para a renda familiar com 95% de con�ança. Sabendo que σ2 = 48,qual o tamanho da amostra para se ter um erro máximo de

√2.

n = 1,962×48(√

2)2 = 3,84×482 = 3, 84× 24 ≈ 93

Exemplo2: Deseja-se estimar determinada característica dapopulação com 95% de con�ança e erro máximo de 10% da média.Qual o tamanho da amostra sabendo que CV = 20%?

n = 1,962×0,22

0,12 = 3,84×0,040,01 = 0,1536

0,01 ≈ 16

P(|y− Y| ≤ rY) = 1− α ⇒ n =(

zα/2×σ

rY

)2n =

(zα/2×CV

r

)2

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 16-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Determinação do Tamanho da Amostra

Exemplo1: Seja o intervalo (18± 1, 96√

48/10) = (18± 4, 29)para a renda familiar com 95% de con�ança. Sabendo que σ2 = 48,qual o tamanho da amostra para se ter um erro máximo de

√2.

n = 1,962×48(√

2)2 = 3,84×482 = 3, 84× 24 ≈ 93

Exemplo2: Deseja-se estimar determinada característica dapopulação com 95% de con�ança e erro máximo de 10% da média.Qual o tamanho da amostra sabendo que CV = 20%?

n = 1,962×0,22

0,12 = 3,84×0,040,01 = 0,1536

0,01 ≈ 16

P(|y− Y| ≤ rY) = 1− α ⇒ n =(

zα/2×σ

rY

)2n =

(zα/2×CV

r

)2

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 16-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Determinação do Tamanho da Amostra

Exemplo1: Seja o intervalo (18± 1, 96√

48/10) = (18± 4, 29)para a renda familiar com 95% de con�ança. Sabendo que σ2 = 48,qual o tamanho da amostra para se ter um erro máximo de

√2.

n = 1,962×48(√

2)2 = 3,84×482 = 3, 84× 24 ≈ 93

Exemplo2: Deseja-se estimar determinada característica dapopulação com 95% de con�ança e erro máximo de 10% da média.Qual o tamanho da amostra sabendo que CV = 20%?

n = 1,962×0,22

0,12 = 3,84×0,040,01 = 0,1536

0,01 ≈ 16

P(|y− Y| ≤ rY) = 1− α ⇒ n =(

zα/2×σ

rY

)2n =

(zα/2×CV

r

)2

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 16-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Determinação do Tamanho da Amostra

Exemplo1: Seja o intervalo (18± 1, 96√

48/10) = (18± 4, 29)para a renda familiar com 95% de con�ança. Sabendo que σ2 = 48,qual o tamanho da amostra para se ter um erro máximo de

√2.

n = 1,962×48(√

2)2 = 3,84×482 = 3, 84× 24 ≈ 93

Exemplo2: Deseja-se estimar determinada característica dapopulação com 95% de con�ança e erro máximo de 10% da média.Qual o tamanho da amostra sabendo que CV = 20%?

n = 1,962×0,22

0,12 = 3,84×0,040,01 = 0,1536

0,01 ≈ 16

P(|y− Y| ≤ rY) = 1− α ⇒ n =(

zα/2×σ

rY

)2n =

(zα/2×CV

r

)2

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 16-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Determinação do Tamanho da Amostra

Exemplo1: Seja o intervalo (18± 1, 96√

48/10) = (18± 4, 29)para a renda familiar com 95% de con�ança. Sabendo que σ2 = 48,qual o tamanho da amostra para se ter um erro máximo de

√2.

n = 1,962×48(√

2)2 = 3,84×482 = 3, 84× 24 ≈ 93

Exemplo2: Deseja-se estimar determinada característica dapopulação com 95% de con�ança e erro máximo de 10% da média.Qual o tamanho da amostra sabendo que CV = 20%?

n = 1,962×0,22

0,12 = 3,84×0,040,01 = 0,1536

0,01 ≈ 16

P(|y− Y| ≤ rY) = 1− α ⇒ n =(

zα/2×σ

rY

)2n =

(zα/2×CV

r

)2

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 16-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Aleatória Simples sem Reposição (AASs) - CNn

A AASs funciona de modo idêntico à AASc, a não ser pela nãorecolocação do elemento sorteado. Portanto, cada elemento dapopulação só pode aparecer uma vez na amostra.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 17-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estimação do Total e da Média Populacional

Não é di�cil mostrar que os estimadores não-viesados para µ e Tsão:

y = 1n ∑n

i=1 yi

Var(y) = (1− f )S2

n = N−nN−1

σ2

n , f = nN

T = Ny

Var(T) = N2 N−nN−1

σ2

n

onde N−nN−1 é chamado de Correção para Populações Finitas (CPF),

ou do inglês Finite Population Correction (FPC).

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 18-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Aleatória Simples sem Reposição (AASs)

evar(y) = (1− f ) s2

n var(T) = N2(1− f ) s2

n

Exemplo: Considere o mesmo exemplo da renda familiar, comvalores (12, 30, 18), e T = 60, µ = 20 e S2 = 168/2 = 84.Tomada uma amostra de n = 2, tem-se as seguintes amostras.

(12,30) (12,18) (30,18)P 1/3 1/3 1/3y 21 15 24s2 162 18 72T 42 30 48

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 19-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Aleatória Simples sem Reposição (AASs)

y 15 21 24P 1/3 1/3 1/3

E(y) = 15+21+243 = 60

3 = 20 = µ

Var(y) = (1− f )S2

n =(1− 2

3

) 842 = 14

s2 18 72 162P 1/3 1/3 1/3

E(s2) = 18+72+1623 = 252

3 = 84 = S2

T 30 42 48P 1/3 1/3 1/3

E(T) = 30+42+483 = 120

3 = 40 6= TProf. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 20-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Normalidade Assintótica e Intervalos de Con�ança

Veri�que que a Variância de y é menor do que na AASc.

y− µ√(1− f )S2/n

a∼ N(0, 1)T− T

N√(1− f )S2/n

a∼ N(0, 1)

P

(|y− µ|√

(1− f )S2/n≤ zα/2

)≈ 1− α

P(

y− zα/2

√(1− f )S2/n ≤ µ ≤ y + zα/2

√(1− f )S2/n

)≈ 1− α

Se n < 50, utilizar t de Student com n− 1 graus de liberdade.Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 21-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Normalidade Assintótica e Intervalos de Con�ança

Exemplo: Seja y = 1, 296, s2 = 2, 397, n = 1000 e N = 36000.Estime o intervalo para µ com 95% de con�ança.

IC(µ; 0, 95) =(

1, 296± 1, 96√(

1− 100036000

) 2,3971000

)IC(µ; 0, 95) =

(1, 296± 1, 96

√3536

2,3971000

)IC(µ; 0, 95) = (1, 296± 1, 96× 0, 048) = (1, 296± 0, 094)IC(µ; 0, 95) = (1, 20; 1, 39)

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 22-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Normalidade Assintótica e Intervalos de Con�ança

Exemplo: Seja y = 1, 296, s2 = 2, 397, n = 1000 e N = 36000.Estime o intervalo para µ com 95% de con�ança.

IC(µ; 0, 95) =(

1, 296± 1, 96√(

1− 100036000

) 2,3971000

)

IC(µ; 0, 95) =(

1, 296± 1, 96√

3536

2,3971000

)IC(µ; 0, 95) = (1, 296± 1, 96× 0, 048) = (1, 296± 0, 094)IC(µ; 0, 95) = (1, 20; 1, 39)

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 22-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Normalidade Assintótica e Intervalos de Con�ança

Exemplo: Seja y = 1, 296, s2 = 2, 397, n = 1000 e N = 36000.Estime o intervalo para µ com 95% de con�ança.

IC(µ; 0, 95) =(

1, 296± 1, 96√(

1− 100036000

) 2,3971000

)IC(µ; 0, 95) =

(1, 296± 1, 96

√3536

2,3971000

)

IC(µ; 0, 95) = (1, 296± 1, 96× 0, 048) = (1, 296± 0, 094)IC(µ; 0, 95) = (1, 20; 1, 39)

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 22-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Normalidade Assintótica e Intervalos de Con�ança

Exemplo: Seja y = 1, 296, s2 = 2, 397, n = 1000 e N = 36000.Estime o intervalo para µ com 95% de con�ança.

IC(µ; 0, 95) =(

1, 296± 1, 96√(

1− 100036000

) 2,3971000

)IC(µ; 0, 95) =

(1, 296± 1, 96

√3536

2,3971000

)IC(µ; 0, 95) = (1, 296± 1, 96× 0, 048) = (1, 296± 0, 094)IC(µ; 0, 95) = (1, 20; 1, 39)

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 22-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Determinação do Tamanho da Amostra

Determinar o tamanho da amostra n, de tal forma que o estimadorobtido tenha um erro máximo de estimação igual a �ε�, comdeterminado grau de con�ança γ.

Var(y) = (1− f )S2

n = S2n

(1−f )= S2

n′ , onde n′ = n1−f

ε = zα/2√

S2/n′ ⇒ n′ =z2

α/2S2

ε2

Note que n′ = n1− n

N⇒

n =n′

1 + n′N

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 23-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Determinação do Tamanho da Amostra

Exemplo: Considere o exemplo anterior. Qual o tamanho daamostra com 95% de con�ança para se ter um erro de 0, 05.

n′ =1, 962 × 2, 397

(0, 05)2 =3, 84× 2, 397

0, 0025= 3683, 8

n =3683, 8

1 + 3683,836000

=3683, 81, 10

≈ 3342

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 24-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Determinação do Tamanho da Amostra

Exemplo: Considere o exemplo anterior. Qual o tamanho daamostra com 95% de con�ança para se ter um erro de 0, 05.

n′ =1, 962 × 2, 397

(0, 05)2 =3, 84× 2, 397

0, 0025= 3683, 8

n =3683, 8

1 + 3683,836000

=3683, 81, 10

≈ 3342

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 24-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Determinação do Tamanho da Amostra

Exemplo: Considere o exemplo anterior. Qual o tamanho daamostra com 95% de con�ança para se ter um erro de 0, 05.

n′ =1, 962 × 2, 397

(0, 05)2 =3, 84× 2, 397

0, 0025= 3683, 8

n =3683, 8

1 + 3683,836000

=3683, 81, 10

≈ 3342

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 24-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Comparação entre AASc e AASs

Quando existem 2 planos amostrais é importante saber qual é o�melhor�. Um conceito importante, chamado de Efeito doPlanejamento (EPA) ou do inglês Design E�ect (De�), compara avariância de um plano amostral qualquer com relação a um planoconsiderado padrão. A estatística y é em ambos os planos umestimador não-viesado de µ. Assim,

Deff = EPA = Var(AASs(y))Var(AASc(y))

= (1−f )S2/nσ2/n =

N−nN−1 σ2/n

σ2/n = N−nN−1

Quando Deff > 1, tem-se que o plano do numerador é menose�ciente que o padrão e quando Deff < 1, tem-se a situaçãocontrária. Da expressão acima veri�ca-se que

N− nN− 1

< 1, n > 1

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 25-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Comparação entre AASc e AASs

ou seja, o plano AASs é sempre �melhor� do que o plano AASc.Note que esse resultado con�rma a intuição popular de queamostras sem reposição são �melhores� do aquelas com elementosrepetidos.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 26-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem para Proporções e Porcentagens

Algumas vezes desejamos estimar o número total, a proporção ou aporcentagem de unidades na população que possuem algumacaracterística ou atributo.

Exemplos: Número de pessoas desempregadas; a porcentagem dapopulação que é nativa; porcentagem de votos de determinadocandidato.

A classi�cação pode ser introduzida diretamente no questionáriocom questões do tipo �Sim� ou �Não�.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 27-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Variância da Estimativa Amostral

AAS(n) A = {e1, e2, . . . , en}

De�na: yi = 1, se ei possui A; e yi = 0, caso contrário.

y = 1n ∑n

i=1 yi = p é um estimador não-viesado de P.

s2 = 1n−1 ∑n

i=1(yi − y)2 = nn−1 pq

Var(p) = Var(y) = N−nN

S2

n = N−nNn

NPQN−1 = N−n

N−1PQn

Var(p) = N−nN

s2

n = N−nNn

npqn−1 = N−n

Npq

n−1 = (1− f ) pqn−1

f = nN Se N ↑ N−n

N ≈ 1 ⇒ Var(p) = pqn−1

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 28-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Total com o Atributo A

NA = Np

Var(NA) = N2Var(p) = N2 N−nN

pqn−1 = N(N−n)pq

n−1

Exemplo: De uma lista de 3042 nomes e endereços, uma AAS de200 nomes mostrou 38 endereços errados. Estime o número totalde endereços que precisam de correção na lista e encontre o erropadrão dessa estimativa.

N = 3042, n = 200, nA = 38, p = 38/200 = 0, 19NA = Np = 3042× 0, 19 = 578

EP(NA) = N√

3042(3042−200)200−1 × 0, 19× 0, 81 =

√6686 = 81, 8

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 29-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Total com o Atributo A

NA = Np

Var(NA) = N2Var(p) = N2 N−nN

pqn−1 = N(N−n)pq

n−1

Exemplo: De uma lista de 3042 nomes e endereços, uma AAS de200 nomes mostrou 38 endereços errados. Estime o número totalde endereços que precisam de correção na lista e encontre o erropadrão dessa estimativa.N = 3042, n = 200, nA = 38, p = 38/200 = 0, 19

NA = Np = 3042× 0, 19 = 578

EP(NA) = N√

3042(3042−200)200−1 × 0, 19× 0, 81 =

√6686 = 81, 8

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 29-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Total com o Atributo A

NA = Np

Var(NA) = N2Var(p) = N2 N−nN

pqn−1 = N(N−n)pq

n−1

Exemplo: De uma lista de 3042 nomes e endereços, uma AAS de200 nomes mostrou 38 endereços errados. Estime o número totalde endereços que precisam de correção na lista e encontre o erropadrão dessa estimativa.N = 3042, n = 200, nA = 38, p = 38/200 = 0, 19NA = Np = 3042× 0, 19 = 578

EP(NA) = N√

3042(3042−200)200−1 × 0, 19× 0, 81 =

√6686 = 81, 8

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 29-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Total com o Atributo A

NA = Np

Var(NA) = N2Var(p) = N2 N−nN

pqn−1 = N(N−n)pq

n−1

Exemplo: De uma lista de 3042 nomes e endereços, uma AAS de200 nomes mostrou 38 endereços errados. Estime o número totalde endereços que precisam de correção na lista e encontre o erropadrão dessa estimativa.N = 3042, n = 200, nA = 38, p = 38/200 = 0, 19NA = Np = 3042× 0, 19 = 578

EP(NA) = N√

3042(3042−200)200−1 × 0, 19× 0, 81 =

√6686 = 81, 8

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 29-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Intervalo de Con�ança para P

y ≈ N(Y, Var(y))

P(

y− zα/2

√Var(y) ≤ Y ≤ y + zα/2

√Var(y)

)≈ 1− α

IC(P; γ) = p± zα/2√(1− f )pq/(n− 1)

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 30-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Tamanho de Amostra para Proporções

P(|p− P| ≥ d) = αp é normalmente distribuídoσ2

p = Var(p) = N−nN−1

PQn

d = zα/2

√N−nN−1

PQn ⇒ n =

z2α/2PQ

d2

1+ 1N

[(z2α/2PQ

d2

)−1

]

n0 =z2

α/2PQd2 n = n0

1+ n0N

Se N ↑ ⇒ n ≈ z2α/2PQ

d2

P = 0, 5 ⇒ PQ = 0, 25 n = 22

4×d2 = 1d2

α = 0, 05 ⇒ zα/2 ≈ 2Essa fórmula só é válida se 0, 25 ≤ P ≤ 0, 75

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 31-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Tamanho de Amostra para Proporções

Exemplo: d = 0, 05 ⇒ n = 10,052 = 1

0,0025 = 400

Se N = 3200 ⇒ n = 356

Fazendo o tamanho mínimo temos:

α = 0, 05 d = 0, 05 ⇒ n = 1,962×0,250,052 = 385

Considerando um erro de 2%:

d = 0, 02 ⇒ n = 10,022 = 1

0,0004 = 2500

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 32-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Tamanho de Amostra para Proporções

Exemplo: d = 0, 05 ⇒ n = 10,052 = 1

0,0025 = 400

Se N = 3200 ⇒ n = 356

Fazendo o tamanho mínimo temos:

α = 0, 05 d = 0, 05 ⇒ n = 1,962×0,250,052 = 385

Considerando um erro de 2%:

d = 0, 02 ⇒ n = 10,022 = 1

0,0004 = 2500

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 32-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Tamanho de Amostra para Proporções

Exemplo: d = 0, 05 ⇒ n = 10,052 = 1

0,0025 = 400

Se N = 3200 ⇒ n = 356

Fazendo o tamanho mínimo temos:

α = 0, 05 d = 0, 05 ⇒ n = 1,962×0,250,052 = 385

Considerando um erro de 2%:

d = 0, 02 ⇒ n = 10,022 = 1

0,0004 = 2500

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 32-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Estrati�cada

Na amostragem estrati�cada a população de N unidades é primeirodividida em subpopulações de N1, N2, . . . , NL unidades. Essassubpopulações, que são chamadas de estratos, não se sobrepõem ejuntas compreendem toda a população, tal queN1 + N2 + . . . + NL = N.

Para obter o benefício total da estrati�cação, os valores de Nhprecisam ser conhecidos. Os tamanhos das amostras dentro decada estrato são denotados por n1, n2, . . . , nL, respectivamente.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 33-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Estrati�cada

Na amostragem estrati�cada a população de N unidades é primeirodividida em subpopulações de N1, N2, . . . , NL unidades. Essassubpopulações, que são chamadas de estratos, não se sobrepõem ejuntas compreendem toda a população, tal queN1 + N2 + . . . + NL = N.

Para obter o benefício total da estrati�cação, os valores de Nhprecisam ser conhecidos. Os tamanhos das amostras dentro decada estrato são denotados por n1, n2, . . . , nL, respectivamente.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 33-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Estrati�cada

A estrati�cação é usada principalmente para resolver algunsproblemas como:

1 A melhoria da precisão das estimativas;2 Produzir estimativas para toda a população e subpopulações;3 Garantir que elementos de cada subpopulação estejam na

amostra.

Vamos abordar muito mais o primeiro problema. Considere que sejapossível dividir uma população heterogênea em subpopulações ouestratos internamente homogêneos. Se cada estrato é homogêneo,em que as medições variam pouco de uma unidade para outra, umaestimativa precisa da média de qualquer estrato pode ser obtida deuma amostra menor desses estratos. Essa estimativas podem entãoser combinadas dentro de uma estimativa precisa para toda apopulação.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 34-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Estrati�cada

A estrati�cação é usada principalmente para resolver algunsproblemas como:

1 A melhoria da precisão das estimativas;2 Produzir estimativas para toda a população e subpopulações;3 Garantir que elementos de cada subpopulação estejam na

amostra.Vamos abordar muito mais o primeiro problema. Considere que sejapossível dividir uma população heterogênea em subpopulações ouestratos internamente homogêneos. Se cada estrato é homogêneo,em que as medições variam pouco de uma unidade para outra, umaestimativa precisa da média de qualquer estrato pode ser obtida deuma amostra menor desses estratos. Essa estimativas podem entãoser combinadas dentro de uma estimativa precisa para toda apopulação.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 34-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Estrati�cada

Exemplo: Considere uma pesquisa feita em uma população comN = 8 domicílios, onde são conhecidas as variáveis RendaDomiciliar (Y) e o Local do Domicílio (W), com os códigos �A�para Região de Alta Renda e �B� para Região de Baixa Renda.Tem-se então

Y 13 17 6 5 10 12 19 6W B A B B B A A B

µ = 13+17+6+5+10+12+19+68 = 88

8 = 11

σ2 = 22+62+52+62+12+12+82+52

8 = 4+36+25+36+1+1+64+258 = 192

8σ2 = 24

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 35-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Estrati�cada

Retirando uma AASc de tamanho n = 4, sabe-se queVar(y) = σ2

n = 244 = 6

Usando W para estrati�car a população em 2 estratos, constrói-seas seguintes subpopulações:

YA 17 12 19 µA = 16 σ2A = 8, 7

YB 13 6 5 10 6 µB = 8 σ2B = 9, 2

Sorteando-se em cada estrato uma AASc de tamanho n = 2

Var(yA) =8,72 = 4, 35 Var(yB) =

9,22 = 4, 60

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 36-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Estrati�cada

Com base em yA e yB pode-se construir um estimador para µ

yes =3yA+5yB

3+5 =3yA+5yB

8

Var(yes) =( 3

8

)2 Var(yA) +( 5

8

)2 Var(yB) =964 4, 35 + 25

64 4, 60

Var(yes) = 2, 40

Deff = Var(yes)Var(y) = 2,40

6 = 0, 40

Ou seja, como o mesmo tamanho de amostra, diminuiu-se avariância do estimador em mais da metade. O resultado será maise�caz quanto mais homogêneos forem os estratos. Mas a simplesestrati�cação por si só não produz necessariamente estimativasmais e�cientes do que a AAS.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 37-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Estrati�cada

Exemplo: Considere que os estratos do exemplo anterior sejam:

YA 13 17 6 5 µA = 10, 25 σ2A = 24, 69

YB 10 12 19 6 µA = 11, 75 σ2A = 22, 19

Sorteando-se em cada estrato uma AASc de tamanho n = 2

Var(yA) =24,69

2 = 12, 34 Var(yB) =22,19

2 = 11, 09Var(yes) =

1664 12, 34 + 16

64 11, 09 = 5, 86

Deff = 5,866 = 0, 98

Ou seja, um desempenho bastante próximo do plano AASc.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 38-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Estrati�cada

A execução de um plano de amostragem estrati�cada (AE) possuios seguintes passos:

1 Divisão da população em subpopulações bem de�nidas(estratos);

2 De cada estrato retira-se uma amostra, geralmenteindependente;

3 Em cada estrato usam-se estimadores convenientes para osparâmetros do estrato;

4 Monta-se para a população um estimador combinando osestimadores de cada estrato e determinam-se suaspropriedades.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 39-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Estrati�cada

A execução de um plano de amostragem estrati�cada (AE) possuios seguintes passos:

1 Divisão da população em subpopulações bem de�nidas(estratos);

2 De cada estrato retira-se uma amostra, geralmenteindependente;

3 Em cada estrato usam-se estimadores convenientes para osparâmetros do estrato;

4 Monta-se para a população um estimador combinando osestimadores de cada estrato e determinam-se suaspropriedades.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 39-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Estrati�cada

A execução de um plano de amostragem estrati�cada (AE) possuios seguintes passos:

1 Divisão da população em subpopulações bem de�nidas(estratos);

2 De cada estrato retira-se uma amostra, geralmenteindependente;

3 Em cada estrato usam-se estimadores convenientes para osparâmetros do estrato;

4 Monta-se para a população um estimador combinando osestimadores de cada estrato e determinam-se suaspropriedades.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 39-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Estrati�cada

A execução de um plano de amostragem estrati�cada (AE) possuios seguintes passos:

1 Divisão da população em subpopulações bem de�nidas(estratos);

2 De cada estrato retira-se uma amostra, geralmenteindependente;

3 Em cada estrato usam-se estimadores convenientes para osparâmetros do estrato;

4 Monta-se para a população um estimador combinando osestimadores de cada estrato e determinam-se suaspropriedades.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 39-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Estrati�cada

A estimativa usada para a média na amostragem estrati�cada éyes = yst (es de estrati�cada e st de strati�ed).

yst =H

∑h=1

NhyhN

=H

∑h=1

Whyh

onde N = N1 + N2 + . . . + NH.y coincidirá com yst se para todo estrato

nhn = Nh

N ou nhNh

= nN ou fh = f

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 40-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Estrati�cada

Com a alocação proporcional, temos que nh = Whn = NhN n.

Substituindo na fórmula da Var(yst),

Var(yst) =(1−f )

n ∑ Whs2h

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 41-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Alocação Ótima

Em AE, o problema está em selecionar os valores de nh. Elespodem ser selecionados para minimizar a Var(yst) para um custoespeci�cado de tomar a amostra ou para minimizar o custo paraum valor especi�cado da Var(yst). A função de custo mais simplesé da forma:

C = Co + ∑Hh=1 Chnh

onde: C = custo total da amostragem;C0 = custo �xo da amostragem (conhecido);Ch = custo da unidade amostral no estrato h (conhecido).

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 42-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Alocação Ótima

Dentro de qualquer estrato o custo é proporcional ao tamanho daamostra, mas o custo por unidade Ch pode variar de estrato paraestrato. Se os custos de viagem entre unidades são substanciais,estudos matemáticos e empíricos sugerem que os custos sãomelhores representados pela expressão ∑ th

√nh.

1 Quais são os valores de n1, n2, . . . , nH tal que Var(yst) sejamínima?(custo �xo)

2 Quais são os valores de n1, n2, . . . , nH tal que C sejamínimo?(variância �xa)

Teorema: Em amostragem aleatória estrati�cada com uma funçãode custo linear, a variância da média estimada yst é mínima paraum cuto �xo C, e o custo é mínimo para uma variância �xa V,quando nh é proporcional a WhSh/

√Ch.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 43-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Alocação Ótima

Dentro de qualquer estrato o custo é proporcional ao tamanho daamostra, mas o custo por unidade Ch pode variar de estrato paraestrato. Se os custos de viagem entre unidades são substanciais,estudos matemáticos e empíricos sugerem que os custos sãomelhores representados pela expressão ∑ th

√nh.

1 Quais são os valores de n1, n2, . . . , nH tal que Var(yst) sejamínima?(custo �xo)

2 Quais são os valores de n1, n2, . . . , nH tal que C sejamínimo?(variância �xa)

Teorema: Em amostragem aleatória estrati�cada com uma funçãode custo linear, a variância da média estimada yst é mínima paraum cuto �xo C, e o custo é mínimo para uma variância �xa V,quando nh é proporcional a WhSh/

√Ch.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 43-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Alocação Ótima

Se Ch = C, isto é, se o custo por unidade é o mesmo em todos osestratos, a função de custo se torna C = C0 + Cn, e a alocaçãoótima para um custo �xo se reduz para uma alocação ótima paraum tamanho de amostra �xo.

Teorema: Em AE, a Var(yst) é minimizada para um tamanho deamostra total n �xa se

nh = n WhSh∑ WhSh

= n NhSh∑ NhSh

Essa alocação é denominada Alocação Ótima de Neyman(Neyman(1934) provou o resultado).

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 44-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Efeito do Planejamento

Se inteligentemente usada, a estrati�cação quase sempre resulta emuma menor variância para a média ou total estimado do que a dadapor uma AAS comparável. Não é verdade, entretanto, que qualquerAE fornece uma variância menor do que a AAS.

Se os valores de nh estão longe do ótimo, a AE pode ter umavariância maior. Por isso, vamos comparar a AAS com a AE comalocação proporcional e ótima. Essa comparação mostra como oganho devido à estrati�cação é alcançado.

Teorema: Com relação à AASc, tem-se que Vot ≤ Vpr ≤ VAASc .

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 45-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Efeito do Planejamento

Assim, sempre que os estratos tiverem médias distintas (σ2e

grande), deve-se usar alocação proporcional ou ótima. Se alémdisso, os desvios padrões de cada estrato diferirem muito entre si(σ2

dp grande), recomenda-se a alocação ótima. Daí

Deff (AEpr) =Vpr

VAASc=

σ2d

σ2 = 1− σ2e

σ2

Deff (AEot) =Vot

VAASc=

σ2d−σ2

dp

σ2 = 1− σ2e

σ2 −σ2

dp

σ2

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 46-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Efeito do Planejamento

Exemplo: Exemplo dos habitantes de 64 cidades americanas.

Cálculo da Alocação Ótima

Estrato Nh Sh NhSh nh1 16 232,04 3712,64 12,212 48 74,71 3586,08 11,79

Total 64 306,75 7298,72 24,00

Quando a estrati�cação produz ganhos substanciais?

1 A população é composta de unidades variando amplamente notamanho;

2 As principais variáveis a serem medidas estão fortementerelacionadas ao tamanho das instituições;

3 Uma boa medida de tamanho está disponível para separar osestratos.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 47-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Efeito do Planejamento

Exemplo: Exemplo dos habitantes de 64 cidades americanas.

Cálculo da Alocação Ótima

Estrato Nh Sh NhSh nh1 16 232,04 3712,64 12,212 48 74,71 3586,08 11,79

Total 64 306,75 7298,72 24,00

Quando a estrati�cação produz ganhos substanciais?

1 A população é composta de unidades variando amplamente notamanho;

2 As principais variáveis a serem medidas estão fortementerelacionadas ao tamanho das instituições;

3 Uma boa medida de tamanho está disponível para separar osestratos.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 47-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Efeito do Planejamento

Exemplo: Exemplo dos habitantes de 64 cidades americanas.

Cálculo da Alocação Ótima

Estrato Nh Sh NhSh nh1 16 232,04 3712,64 12,212 48 74,71 3586,08 11,79

Total 64 306,75 7298,72 24,00

Quando a estrati�cação produz ganhos substanciais?

1 A população é composta de unidades variando amplamente notamanho;

2 As principais variáveis a serem medidas estão fortementerelacionadas ao tamanho das instituições;

3 Uma boa medida de tamanho está disponível para separar osestratos.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 47-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Sistemática (todo k-ésimo)

IdealizaçãoVamos supor que uma população de N elementos está ordenada.Suponha ainda que N = nk, onde k é um inteiro. Deseja-se retiraruma amostra de tamanho n. Considere a seguinte estratégia:

1) Selecionar aleatoriamente um número entre 1 e k, ondek = N/n. Seja x esse número.2) Tome como elementos da amostra os seguintes:

x, x + k, x + 2k, . . . , x + (n− 1)kAAS(n) ⇒ CN

n (Número de amostras)AS(n) ⇒ k amostras (mutuamente excludentes)P(Ei ∈ A) = 1

k

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 48-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Sistemática (todo k-ésimo)

IdealizaçãoVamos supor que uma população de N elementos está ordenada.Suponha ainda que N = nk, onde k é um inteiro. Deseja-se retiraruma amostra de tamanho n. Considere a seguinte estratégia:1) Selecionar aleatoriamente um número entre 1 e k, ondek = N/n. Seja x esse número.

2) Tome como elementos da amostra os seguintes:x, x + k, x + 2k, . . . , x + (n− 1)k

AAS(n) ⇒ CNn (Número de amostras)

AS(n) ⇒ k amostras (mutuamente excludentes)P(Ei ∈ A) = 1

k

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 48-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Sistemática (todo k-ésimo)

IdealizaçãoVamos supor que uma população de N elementos está ordenada.Suponha ainda que N = nk, onde k é um inteiro. Deseja-se retiraruma amostra de tamanho n. Considere a seguinte estratégia:1) Selecionar aleatoriamente um número entre 1 e k, ondek = N/n. Seja x esse número.2) Tome como elementos da amostra os seguintes:

x, x + k, x + 2k, . . . , x + (n− 1)kAAS(n) ⇒ CN

n (Número de amostras)AS(n) ⇒ k amostras (mutuamente excludentes)P(Ei ∈ A) = 1

k

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 48-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Sistemática (todo k-ésimo)

Se N não é um número múltiplo de k, as diferentes amostrasvariam de tamanho de uma para outra.N = 23 n = 5 k = 23

5 ≈ 5 N 6= nk

Possíveis Amostras

I II III IV V1 2 3 4 56 7 8 9 1011 12 13 14 1516 17 18 19 2021 22 23

n = 5 n = 5 n = 5 n = 4 n = 4

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 49-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Sistemática (todo k-ésimo)

Se N não é um número múltiplo de k, as diferentes amostrasvariam de tamanho de uma para outra.N = 23 n = 5 k = 23

5 ≈ 5 N 6= nk

Possíveis Amostras

I II III IV V1 2 3 4 56 7 8 9 1011 12 13 14 1516 17 18 19 2021 22 23

n = 5 n = 5 n = 5 n = 4 n = 4

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 49-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Sistemática (todo k-ésimo)

Isso introduz uma pertubação na teoria de amostragem sistemática.Se n > 50 isso será ignorado, por simplicidade.

Outro método de seleção das amostras foi sugerido porLahiri(1952);1) Seja k o inteiro mais próximo de N

n ;

2) Suponha que os números estejam organizados como um círculo;3) Selecione aleatoriamente um número entre 1 e N. Seja x essenúmero;4) Selecione a amostra a partir desse número de k em k posições.

x, x + k, x + 2k, . . . ,retorno ao início.

Exemplo: k = 235 ≈ 5

x = 19 ⇒ 19, 1, 6, 11, 16 Todas as unidades tem igualx = 22 ⇒ 22, 4, 9, 14, 19 probabilidade de seleção.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 50-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Sistemática (todo k-ésimo)

Isso introduz uma pertubação na teoria de amostragem sistemática.Se n > 50 isso será ignorado, por simplicidade.

Outro método de seleção das amostras foi sugerido porLahiri(1952);1) Seja k o inteiro mais próximo de N

n ;2) Suponha que os números estejam organizados como um círculo;

3) Selecione aleatoriamente um número entre 1 e N. Seja x essenúmero;4) Selecione a amostra a partir desse número de k em k posições.

x, x + k, x + 2k, . . . ,retorno ao início.

Exemplo: k = 235 ≈ 5

x = 19 ⇒ 19, 1, 6, 11, 16 Todas as unidades tem igualx = 22 ⇒ 22, 4, 9, 14, 19 probabilidade de seleção.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 50-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Sistemática (todo k-ésimo)

Isso introduz uma pertubação na teoria de amostragem sistemática.Se n > 50 isso será ignorado, por simplicidade.

Outro método de seleção das amostras foi sugerido porLahiri(1952);1) Seja k o inteiro mais próximo de N

n ;2) Suponha que os números estejam organizados como um círculo;3) Selecione aleatoriamente um número entre 1 e N. Seja x essenúmero;

4) Selecione a amostra a partir desse número de k em k posições.x, x + k, x + 2k, . . . ,retorno ao início.

Exemplo: k = 235 ≈ 5

x = 19 ⇒ 19, 1, 6, 11, 16 Todas as unidades tem igualx = 22 ⇒ 22, 4, 9, 14, 19 probabilidade de seleção.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 50-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Sistemática (todo k-ésimo)

Isso introduz uma pertubação na teoria de amostragem sistemática.Se n > 50 isso será ignorado, por simplicidade.

Outro método de seleção das amostras foi sugerido porLahiri(1952);1) Seja k o inteiro mais próximo de N

n ;2) Suponha que os números estejam organizados como um círculo;3) Selecione aleatoriamente um número entre 1 e N. Seja x essenúmero;4) Selecione a amostra a partir desse número de k em k posições.

x, x + k, x + 2k, . . . ,retorno ao início.

Exemplo: k = 235 ≈ 5

x = 19 ⇒ 19, 1, 6, 11, 16 Todas as unidades tem igualx = 22 ⇒ 22, 4, 9, 14, 19 probabilidade de seleção.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 50-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Populações em Ordem Aleatória

A AS é algumas vezes usada, por sua conveniência, em populaçõesem que a numeração das unidades é efetivamente aleatória. Issoacontece em amostras de um arquivo organizado alfabeticamentepor nomes, se o item que está sendo medido não tem relação como nome do indivíduo.

Nessas situações esperamos que a AS seja equivalente à AAS, etenha a mesma variância. Para qualquer população �nita, dado n ek, isso não é exatamente verdade, principalmente quando n e k sãopequenos.Teorema: Considere todas as N! populações �nitas que sãoformadas pelas N! permutações de qualquer série �nita de númerosy1, y2, . . . , yN. Então, em média sobre essas populações �nitas

E(Var(ys)) = Var(y)n ↑ AS ≈ AAS

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 51-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Populações em Ordem Aleatória

A AS é algumas vezes usada, por sua conveniência, em populaçõesem que a numeração das unidades é efetivamente aleatória. Issoacontece em amostras de um arquivo organizado alfabeticamentepor nomes, se o item que está sendo medido não tem relação como nome do indivíduo.Nessas situações esperamos que a AS seja equivalente à AAS, etenha a mesma variância. Para qualquer população �nita, dado n ek, isso não é exatamente verdade, principalmente quando n e k sãopequenos.

Teorema: Considere todas as N! populações �nitas que sãoformadas pelas N! permutações de qualquer série �nita de númerosy1, y2, . . . , yN. Então, em média sobre essas populações �nitas

E(Var(ys)) = Var(y)n ↑ AS ≈ AAS

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 51-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Populações em Ordem Aleatória

A AS é algumas vezes usada, por sua conveniência, em populaçõesem que a numeração das unidades é efetivamente aleatória. Issoacontece em amostras de um arquivo organizado alfabeticamentepor nomes, se o item que está sendo medido não tem relação como nome do indivíduo.Nessas situações esperamos que a AS seja equivalente à AAS, etenha a mesma variância. Para qualquer população �nita, dado n ek, isso não é exatamente verdade, principalmente quando n e k sãopequenos.Teorema: Considere todas as N! populações �nitas que sãoformadas pelas N! permutações de qualquer série �nita de númerosy1, y2, . . . , yN. Então, em média sobre essas populações �nitas

E(Var(ys)) = Var(y)

n ↑ AS ≈ AAS

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 51-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Populações em Ordem Aleatória

A AS é algumas vezes usada, por sua conveniência, em populaçõesem que a numeração das unidades é efetivamente aleatória. Issoacontece em amostras de um arquivo organizado alfabeticamentepor nomes, se o item que está sendo medido não tem relação como nome do indivíduo.Nessas situações esperamos que a AS seja equivalente à AAS, etenha a mesma variância. Para qualquer população �nita, dado n ek, isso não é exatamente verdade, principalmente quando n e k sãopequenos.Teorema: Considere todas as N! populações �nitas que sãoformadas pelas N! permutações de qualquer série �nita de númerosy1, y2, . . . , yN. Então, em média sobre essas populações �nitas

E(Var(ys)) = Var(y)n ↑ AS ≈ AAS

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 51-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem por Conglomerados (Cluster)

Os planos amostrais vistos até agora sorteavam unidadeselementares diretamente da população ou de estratos desta mesmapopulação. Quando os sistemas de referências (�cadastros� ou�frames�) não são adequados e o custo de atualizá-los é muitoelevado, ou ainda quando a movimentação para identi�car asunidades elementares no campo é cara e consome muito tempo, atarefa amostral pode ser facilitada se forem selecionados grupos deunidades elementares, os chamados conglomerados ou clusters.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 52-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem por Conglomerados (Cluster)

Pop = {E1, E2, . . . , EN}Elemento: pessoa adulta que mora no Plano Piloto.

1) Em algumas situações não existe um cadastro dos elementos dapopulação. Existe um cadastro das residências.

Pop = { R1︸︷︷︸M1

, R2︸︷︷︸M2

, . . . , RN︸︷︷︸MN

}

Mi= número de pessoas adultas na Ri.

Cada residência é um �Conglomerado� de pessoas.

Conglomerado: é um conjunto de elementos da população.

A = {r1, r2, . . . , rn} - seleciona-se uma amostra de conglomerados.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 53-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem por Conglomerados (Cluster)

Pop = {E1, E2, . . . , EN}Elemento: pessoa adulta que mora no Plano Piloto.

1) Em algumas situações não existe um cadastro dos elementos dapopulação. Existe um cadastro das residências.

Pop = { R1︸︷︷︸M1

, R2︸︷︷︸M2

, . . . , RN︸︷︷︸MN

}

Mi= número de pessoas adultas na Ri.

Cada residência é um �Conglomerado� de pessoas.

Conglomerado: é um conjunto de elementos da população.

A = {r1, r2, . . . , rn} - seleciona-se uma amostra de conglomerados.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 53-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem por Conglomerados (Cluster)

2) Em algumas situações, mesmo existindo um cadastro, é maiseconômico a amostragem por conglomerados. Por exemplo, umaAAS de 600 casas cobre mais uniformemente uma cidade do que 20blocos contendo uma média de 30 casas cada um.

Mas grandes custos são envolvidos em localizar as 600 casas e naviagem entre elas do que em localizar 20 blocos e visitar todas ascasas desses blocos. Quando custo é balanceado contra precisão, aunidade maior pode se mostrar superior.

Um dos inconvenientes do uso da amostragem por conglomerados(AC) é que as unidades, dentro de um mesmo conglomerado,tendem a ter valores parecidos, e isto torna esses planos menose�cientes.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 54-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem por Conglomerados (Cluster)

2) Em algumas situações, mesmo existindo um cadastro, é maiseconômico a amostragem por conglomerados. Por exemplo, umaAAS de 600 casas cobre mais uniformemente uma cidade do que 20blocos contendo uma média de 30 casas cada um.

Mas grandes custos são envolvidos em localizar as 600 casas e naviagem entre elas do que em localizar 20 blocos e visitar todas ascasas desses blocos. Quando custo é balanceado contra precisão, aunidade maior pode se mostrar superior.

Um dos inconvenientes do uso da amostragem por conglomerados(AC) é que as unidades, dentro de um mesmo conglomerado,tendem a ter valores parecidos, e isto torna esses planos menose�cientes.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 54-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem por Conglomerados (Cluster)

2) Em algumas situações, mesmo existindo um cadastro, é maiseconômico a amostragem por conglomerados. Por exemplo, umaAAS de 600 casas cobre mais uniformemente uma cidade do que 20blocos contendo uma média de 30 casas cada um.

Mas grandes custos são envolvidos em localizar as 600 casas e naviagem entre elas do que em localizar 20 blocos e visitar todas ascasas desses blocos. Quando custo é balanceado contra precisão, aunidade maior pode se mostrar superior.

Um dos inconvenientes do uso da amostragem por conglomerados(AC) é que as unidades, dentro de um mesmo conglomerado,tendem a ter valores parecidos, e isto torna esses planos menose�cientes.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 54-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem por Conglomerados (Cluster)

A AC tende a:i) Ter um menor custo por elemento;ii) Ter maior variância; eiii) Maiores problemas para análises estatística.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 55-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem por Conglomerados (Cluster)

A AC tende a:i) Ter um menor custo por elemento;ii) Ter maior variância; eiii) Maiores problemas para análises estatística.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 55-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estimativas em Conglomerados

Se cada unidade contém o mesmo número m de elementos, sejapi =

aim a proporção de elementos na i-ésima unidade que cai na

classe C. A proporção caindo em C na amostra é

p = ∑ni=1 ainm = 1

n ∑nj=1 pj

ou seja, p é uma média não ponderada das quantidades pi.Consequentemente, se yi é substituído por pi, as fórmulas para amédia podem ser aplicadas diretamente para fornecer a verdadeira eestimada variância de p.

Var(p) = 1−fn ∑N

i=1(pi−P)2

N−1

Var(p) = 1−fn ∑n

i=1(pi−p)2

n−1

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 56-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estimativas em Conglomerados

Se o tamanho do conglomerado não é constante, seja mi o númerode elementos no i-ésimo conglomerado e seja pi =

aimi. A proporção

de unidades caindo na classe C na amostra é

p =∑n ai

∑n mi

← aleatório← aleatório

Estruturalmente, isso é uma típica estimativa de razão. Ela élevemente viesada, embora o viés raramente tenha importânciaprática.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 57-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estimativas em Conglomerados

Se trocarmos yi por ai e xi por mi

Var(R) = 1−f

nX21

N−1 ∑Ni=1(Yi − RXi)

2 R = YX

R = yx

P = ∑Ni=1 Ai

∑Ni=1 Mi

p = ∑ni=1 ai

∑ni=1 mi

A variância aproximada de p é

Var(p) = 1−f

nM21

N−1 ∑Ni=1(Ai − PMi)

2 M = ∑Ni=1 miN

Var(p) = 1−fnm2

1n−1 ∑n

i=1(ai − pmi)2 m = ∑n

i=1 min

ou Var(p) = 1−fnm2

∑ a2i−2p ∑ aimi+p2 ∑ m2

in−1

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 58-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estimativas em Conglomerados

Exemplo: Uma AAS de 30 domicílios foi retirada de uma populaçãode 15.000 domicílios e foi veri�cada a proporção de pessoas queconsultaram um médico no último ano.

Domicílio No. pessoas Masc Fem Visitou o MédicoSim Não

1 5 1 4 5 02 6 3 3 0 6...

......

......

...30 4 2 2 1 3

Total 104 53 51 30 74

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 59-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estimativas em Conglomerados

binomial: n = 104 p = 30104 = 0, 2885

Var(p) = pqn−1 = 0,2885×0,7115

104−1 = 0,20526775103 = 0, 00199

correto: n = 30 p = ∑ ai∑ mi =

30104 = 0, 2885 (como antes)

m = 10430 = 3, 4667 ∑ a2

i = 86 ∑ m2i = 404 ∑ aimi = 113

Var(p) = 86−2×0,2885×113+0,28852×40430×29×3,46672 = 0, 00520

Estimando a proporção de homens na população

binomial: Var(p) = 0, 00240

razão: Var(p) = 0, 00114

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 60-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

O termo �Amostragem Complexa� é utilizada quando a amostra écoletada utilizando conglomerados, estrati�cação e probabilidade deseleção desigual (Chambers e Skinner,2003).

Geralmente em pesquisas com grandes conjuntos de dados, aamostra é coletada a partir de uma combinação dessas técnicas,como por exemplo, uma pesquisa pode utilizar estrati�cação comdiversos estágios de conglomerados e utilizar estimadores tipo razãoe regressão para a estimação dos parâmetros (Lohr, 1999).Asfórmulas para estimação dos erros padrão se tornam horrendas,especialmente se existem diversos estágios de aglomeração semreposição.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 61-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

O termo �Amostragem Complexa� é utilizada quando a amostra écoletada utilizando conglomerados, estrati�cação e probabilidade deseleção desigual (Chambers e Skinner,2003).

Geralmente em pesquisas com grandes conjuntos de dados, aamostra é coletada a partir de uma combinação dessas técnicas,como por exemplo, uma pesquisa pode utilizar estrati�cação comdiversos estágios de conglomerados e utilizar estimadores tipo razãoe regressão para a estimação dos parâmetros (Lohr, 1999).

Asfórmulas para estimação dos erros padrão se tornam horrendas,especialmente se existem diversos estágios de aglomeração semreposição.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 61-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

O termo �Amostragem Complexa� é utilizada quando a amostra écoletada utilizando conglomerados, estrati�cação e probabilidade deseleção desigual (Chambers e Skinner,2003).

Geralmente em pesquisas com grandes conjuntos de dados, aamostra é coletada a partir de uma combinação dessas técnicas,como por exemplo, uma pesquisa pode utilizar estrati�cação comdiversos estágios de conglomerados e utilizar estimadores tipo razãoe regressão para a estimação dos parâmetros (Lohr, 1999).Asfórmulas para estimação dos erros padrão se tornam horrendas,especialmente se existem diversos estágios de aglomeração semreposição.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 61-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

Aplicar métodos estatísticos clássicos para analisar tais dados leva ainferências erradas. Em particular, ignorar o desenho amostral podelevar a uma séria subestimação do erro padrão das estimativas econsequentemente uma baixa cobertura dos intervalos de con�ançae uma superestimação dos níveis dos testes (Chambers eSkinner,2003).

Considere o exemplo a seguir sobre a estimação do total demosquiteiros em Gambia, na África, a �m de reduzir os casos deMalária (Lohr, 1999):Em 1991 um pesquisa nacional foi feita para estimar a prevalênciade mosquiteiros nas casas em áreas rurais. A amostra e osresultados estão descritos em D'Alessandro et al. (1994).

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 62-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

Aplicar métodos estatísticos clássicos para analisar tais dados leva ainferências erradas. Em particular, ignorar o desenho amostral podelevar a uma séria subestimação do erro padrão das estimativas econsequentemente uma baixa cobertura dos intervalos de con�ançae uma superestimação dos níveis dos testes (Chambers eSkinner,2003).

Considere o exemplo a seguir sobre a estimação do total demosquiteiros em Gambia, na África, a �m de reduzir os casos deMalária (Lohr, 1999):

Em 1991 um pesquisa nacional foi feita para estimar a prevalênciade mosquiteiros nas casas em áreas rurais. A amostra e osresultados estão descritos em D'Alessandro et al. (1994).

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 62-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

Aplicar métodos estatísticos clássicos para analisar tais dados leva ainferências erradas. Em particular, ignorar o desenho amostral podelevar a uma séria subestimação do erro padrão das estimativas econsequentemente uma baixa cobertura dos intervalos de con�ançae uma superestimação dos níveis dos testes (Chambers eSkinner,2003).

Considere o exemplo a seguir sobre a estimação do total demosquiteiros em Gambia, na África, a �m de reduzir os casos deMalária (Lohr, 1999):Em 1991 um pesquisa nacional foi feita para estimar a prevalênciade mosquiteiros nas casas em áreas rurais. A amostra e osresultados estão descritos em D'Alessandro et al. (1994).

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 62-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

O cadastro consiste de todas a vilas rurais com menos de 3000pessoas na Gambia.

As vilas foram estrati�cadas em três regiões geográ�cas (leste,central e oeste) e se a vila tem serviço de saúde pública ou não.Em cada região, 5 distritos foram selecionados com probabilidadeproporcional ao tamanho da população do distrito, estimada peloCenso Nacional de 1983.Em cada distrito, 4 vilas foram selecionadas, novamente comproporcional ao tamanho da população do distrito: 2 vilas comserviço de saúde pública e 2 sem serviço de saúde pública.Finalmente, 6 casa foram escolhidas de cada vila, e o pesquisadoranotou o número de camas e de mosquiteiros, junto com outrasinformações da residência.Em resumo, o desenho amostral está a seguir:

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 63-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

O cadastro consiste de todas a vilas rurais com menos de 3000pessoas na Gambia.As vilas foram estrati�cadas em três regiões geográ�cas (leste,central e oeste) e se a vila tem serviço de saúde pública ou não.

Em cada região, 5 distritos foram selecionados com probabilidadeproporcional ao tamanho da população do distrito, estimada peloCenso Nacional de 1983.Em cada distrito, 4 vilas foram selecionadas, novamente comproporcional ao tamanho da população do distrito: 2 vilas comserviço de saúde pública e 2 sem serviço de saúde pública.Finalmente, 6 casa foram escolhidas de cada vila, e o pesquisadoranotou o número de camas e de mosquiteiros, junto com outrasinformações da residência.Em resumo, o desenho amostral está a seguir:

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 63-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

O cadastro consiste de todas a vilas rurais com menos de 3000pessoas na Gambia.As vilas foram estrati�cadas em três regiões geográ�cas (leste,central e oeste) e se a vila tem serviço de saúde pública ou não.Em cada região, 5 distritos foram selecionados com probabilidadeproporcional ao tamanho da população do distrito, estimada peloCenso Nacional de 1983.

Em cada distrito, 4 vilas foram selecionadas, novamente comproporcional ao tamanho da população do distrito: 2 vilas comserviço de saúde pública e 2 sem serviço de saúde pública.Finalmente, 6 casa foram escolhidas de cada vila, e o pesquisadoranotou o número de camas e de mosquiteiros, junto com outrasinformações da residência.Em resumo, o desenho amostral está a seguir:

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 63-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

O cadastro consiste de todas a vilas rurais com menos de 3000pessoas na Gambia.As vilas foram estrati�cadas em três regiões geográ�cas (leste,central e oeste) e se a vila tem serviço de saúde pública ou não.Em cada região, 5 distritos foram selecionados com probabilidadeproporcional ao tamanho da população do distrito, estimada peloCenso Nacional de 1983.Em cada distrito, 4 vilas foram selecionadas, novamente comproporcional ao tamanho da população do distrito: 2 vilas comserviço de saúde pública e 2 sem serviço de saúde pública.

Finalmente, 6 casa foram escolhidas de cada vila, e o pesquisadoranotou o número de camas e de mosquiteiros, junto com outrasinformações da residência.Em resumo, o desenho amostral está a seguir:

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 63-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

O cadastro consiste de todas a vilas rurais com menos de 3000pessoas na Gambia.As vilas foram estrati�cadas em três regiões geográ�cas (leste,central e oeste) e se a vila tem serviço de saúde pública ou não.Em cada região, 5 distritos foram selecionados com probabilidadeproporcional ao tamanho da população do distrito, estimada peloCenso Nacional de 1983.Em cada distrito, 4 vilas foram selecionadas, novamente comproporcional ao tamanho da população do distrito: 2 vilas comserviço de saúde pública e 2 sem serviço de saúde pública.Finalmente, 6 casa foram escolhidas de cada vila, e o pesquisadoranotou o número de camas e de mosquiteiros, junto com outrasinformações da residência.

Em resumo, o desenho amostral está a seguir:

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 63-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

O cadastro consiste de todas a vilas rurais com menos de 3000pessoas na Gambia.As vilas foram estrati�cadas em três regiões geográ�cas (leste,central e oeste) e se a vila tem serviço de saúde pública ou não.Em cada região, 5 distritos foram selecionados com probabilidadeproporcional ao tamanho da população do distrito, estimada peloCenso Nacional de 1983.Em cada distrito, 4 vilas foram selecionadas, novamente comproporcional ao tamanho da população do distrito: 2 vilas comserviço de saúde pública e 2 sem serviço de saúde pública.Finalmente, 6 casa foram escolhidas de cada vila, e o pesquisadoranotou o número de camas e de mosquiteiros, junto com outrasinformações da residência.Em resumo, o desenho amostral está a seguir:

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 63-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

Estágio Unidade Amostral Estrati�cação1 Distrito Região2 Vila Serviço de Saúde Pública ou não3 Residência

Para calcular as estimativas pontuais e os erros padrão usando asfórmulas mostradas anteriomente, precisamos inicar no terceiroestágio e os seguintes passos para estimar o número total demosquiterios nas camas.

1 Registre o número total de mosquiteiros em cada residência;

2 Estime o número total de mosquiteiros em cada vila por(número de residências na vila)×(número médio demosquiteiros por residência);

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 64-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

Estágio Unidade Amostral Estrati�cação1 Distrito Região2 Vila Serviço de Saúde Pública ou não3 Residência

Para calcular as estimativas pontuais e os erros padrão usando asfórmulas mostradas anteriomente, precisamos inicar no terceiroestágio e os seguintes passos para estimar o número total demosquiterios nas camas.

1 Registre o número total de mosquiteiros em cada residência;

2 Estime o número total de mosquiteiros em cada vila por(número de residências na vila)×(número médio demosquiteiros por residência);

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 64-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

Estágio Unidade Amostral Estrati�cação1 Distrito Região2 Vila Serviço de Saúde Pública ou não3 Residência

Para calcular as estimativas pontuais e os erros padrão usando asfórmulas mostradas anteriomente, precisamos inicar no terceiroestágio e os seguintes passos para estimar o número total demosquiterios nas camas.

1 Registre o número total de mosquiteiros em cada residência;

2 Estime o número total de mosquiteiros em cada vila por(número de residências na vila)×(número médio demosquiteiros por residência);

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 64-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

Estágio Unidade Amostral Estrati�cação1 Distrito Região2 Vila Serviço de Saúde Pública ou não3 Residência

Para calcular as estimativas pontuais e os erros padrão usando asfórmulas mostradas anteriomente, precisamos inicar no terceiroestágio e os seguintes passos para estimar o número total demosquiterios nas camas.

1 Registre o número total de mosquiteiros em cada residência;

2 Estime o número total de mosquiteiros em cada vila por(número de residências na vila)×(número médio demosquiteiros por residência);

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 64-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

3 Estime o número total de mosquiteiros pelo serviço de saúdepública em cada distrito, usando as fórmulas paraprobabilidades proporcionais ao tamannho;

4 Adicione a estimativas dos 2 estratos (serviço de saúde públicaou não) à estimativa do número de mosquiteiros em cadadistrito. Some as variâncias estimadas dos 2 estratos àvariância estimada do distrito;

5 Nesse ponto você tem o número total de mosquiteirosestimados e a variância estimada para cada distrito. Agora useas fórmulas para amostragem em 2 estágios para estimar onúmero total de mosquiteiros para cada região;

6 Finalmente, some as estimativas de total para cada região paraestimar o número total de mosquiteiros em Gambia. Some asvariâncias das regiões pelas fórmulas da estrati�cada.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 65-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

3 Estime o número total de mosquiteiros pelo serviço de saúdepública em cada distrito, usando as fórmulas paraprobabilidades proporcionais ao tamannho;

4 Adicione a estimativas dos 2 estratos (serviço de saúde públicaou não) à estimativa do número de mosquiteiros em cadadistrito. Some as variâncias estimadas dos 2 estratos àvariância estimada do distrito;

5 Nesse ponto você tem o número total de mosquiteirosestimados e a variância estimada para cada distrito. Agora useas fórmulas para amostragem em 2 estágios para estimar onúmero total de mosquiteiros para cada região;

6 Finalmente, some as estimativas de total para cada região paraestimar o número total de mosquiteiros em Gambia. Some asvariâncias das regiões pelas fórmulas da estrati�cada.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 65-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

3 Estime o número total de mosquiteiros pelo serviço de saúdepública em cada distrito, usando as fórmulas paraprobabilidades proporcionais ao tamannho;

4 Adicione a estimativas dos 2 estratos (serviço de saúde públicaou não) à estimativa do número de mosquiteiros em cadadistrito. Some as variâncias estimadas dos 2 estratos àvariância estimada do distrito;

5 Nesse ponto você tem o número total de mosquiteirosestimados e a variância estimada para cada distrito. Agora useas fórmulas para amostragem em 2 estágios para estimar onúmero total de mosquiteiros para cada região;

6 Finalmente, some as estimativas de total para cada região paraestimar o número total de mosquiteiros em Gambia. Some asvariâncias das regiões pelas fórmulas da estrati�cada.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 65-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

3 Estime o número total de mosquiteiros pelo serviço de saúdepública em cada distrito, usando as fórmulas paraprobabilidades proporcionais ao tamannho;

4 Adicione a estimativas dos 2 estratos (serviço de saúde públicaou não) à estimativa do número de mosquiteiros em cadadistrito. Some as variâncias estimadas dos 2 estratos àvariância estimada do distrito;

5 Nesse ponto você tem o número total de mosquiteirosestimados e a variância estimada para cada distrito. Agora useas fórmulas para amostragem em 2 estágios para estimar onúmero total de mosquiteiros para cada região;

6 Finalmente, some as estimativas de total para cada região paraestimar o número total de mosquiteiros em Gambia. Some asvariâncias das regiões pelas fórmulas da estrati�cada.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 65-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

Parece complicado né?

Note ainda que toda a análise deve ser feita considerando os pesosamostrais, que nada mais são do que o inverso das probabilidades

Wi =1πi

Na amostragem estrati�cada, os pesos amostrais para a j-ésimaunidade no h-ésimo estrato são dados por whj = (Nh/nh), e o totalpode ser simplesmente estimado por

tstr =H

∑h=1

∑j∈sh

whjyhj

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 66-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

Parece complicado né?

Note ainda que toda a análise deve ser feita considerando os pesosamostrais, que nada mais são do que o inverso das probabilidades

Wi =1πi

Na amostragem estrati�cada, os pesos amostrais para a j-ésimaunidade no h-ésimo estrato são dados por whj = (Nh/nh), e o totalpode ser simplesmente estimado por

tstr =H

∑h=1

∑j∈sh

whjyhj

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 66-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

Parece complicado né?

Note ainda que toda a análise deve ser feita considerando os pesosamostrais, que nada mais são do que o inverso das probabilidades

Wi =1πi

Na amostragem estrati�cada, os pesos amostrais para a j-ésimaunidade no h-ésimo estrato são dados por whj = (Nh/nh), e o totalpode ser simplesmente estimado por

tstr =H

∑h=1

∑j∈sh

whjyhj

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 66-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

Na amostragem por conglomerados com probabilidades iguais, ospesos amostrais são dados por

wij =NMi

nmi=

1prob j-ésima SSU na i-ésima PSU esteja na amostra

e o total novamente pode ser estimado por

t = ∑i∈s

∑j∈si

wijyij

e a média por

y =t

∑i∈s ∑j∈siwij

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 67-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Complexa

Na amostragem por conglomerados com probabilidades iguais, ospesos amostrais são dados por

wij =NMi

nmi=

1prob j-ésima SSU na i-ésima PSU esteja na amostra

e o total novamente pode ser estimado por

t = ∑i∈s

∑j∈si

wijyij

e a média por

y =t

∑i∈s ∑j∈siwij

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 67-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Modelos de Regressão

Um modelo de regressão é geralmente utilizado quando se desejaexplicar uma variável por outras covariáveis, tendo estas umarelação linear com a variável dependente. A forma geral do modeloé dada por:

y = Xβ + ε

onde y é o vetor n× 1 dos valores observados da variável resposta,também denominado vetor observacional, β é o vetor p× 1 doscoe�cientes da regressão, ε o vetor n× 1 dos resíduos ou erros daregressão e X é a matriz n× p da forma:

X =

1 X11 ... X1p1 X21 ... X2p: : : :1 Xn1 ... Xnp

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 68-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Modelos de Regressão

O estimador de mínimos quadrados para β é:

β = (X′X)−1X

′y

A variância desse estimador é calculada como:

Var[β] = (X′X)−1σ2

onde σ2 = (y−Xβ)′(y−Xβ)n−p

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 69-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Modelos de Regressão com Plano Amostral

O cálculo para estimar os coe�cientes da regressão para dadosprovenientes de amostragem complexa é feito utilizando-se ométodo dos mínimos quadrados ponderados. Esse método éanálogo ao método OLS, diferenciando-se por incorporar os pesosamostrais.

Dessa forma, os coe�cientes da regressão para dados complexos sãocalculados por:

β = (X′WX)−1X

′Wy

No caso da variância do estimador β, é possível estimá-la porquatro metodologias diferentes: a linearização por séries de Taylor,replicação repetida balanceada (BRR em inglês), uma modi�caçãode BRR conhecida como Fay's BRR method e jackknife.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 70-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Modelos de Regressão com Plano Amostral

O cálculo para estimar os coe�cientes da regressão para dadosprovenientes de amostragem complexa é feito utilizando-se ométodo dos mínimos quadrados ponderados. Esse método éanálogo ao método OLS, diferenciando-se por incorporar os pesosamostrais.

Dessa forma, os coe�cientes da regressão para dados complexos sãocalculados por:

β = (X′WX)−1X

′Wy

No caso da variância do estimador β, é possível estimá-la porquatro metodologias diferentes: a linearização por séries de Taylor,replicação repetida balanceada (BRR em inglês), uma modi�caçãode BRR conhecida como Fay's BRR method e jackknife.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 70-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Modelos de Regressão com Plano Amostral

O cálculo para estimar os coe�cientes da regressão para dadosprovenientes de amostragem complexa é feito utilizando-se ométodo dos mínimos quadrados ponderados. Esse método éanálogo ao método OLS, diferenciando-se por incorporar os pesosamostrais.

Dessa forma, os coe�cientes da regressão para dados complexos sãocalculados por:

β = (X′WX)−1X

′Wy

No caso da variância do estimador β, é possível estimá-la porquatro metodologias diferentes:

a linearização por séries de Taylor,replicação repetida balanceada (BRR em inglês), uma modi�caçãode BRR conhecida como Fay's BRR method e jackknife.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 70-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Modelos de Regressão com Plano Amostral

O cálculo para estimar os coe�cientes da regressão para dadosprovenientes de amostragem complexa é feito utilizando-se ométodo dos mínimos quadrados ponderados. Esse método éanálogo ao método OLS, diferenciando-se por incorporar os pesosamostrais.

Dessa forma, os coe�cientes da regressão para dados complexos sãocalculados por:

β = (X′WX)−1X

′Wy

No caso da variância do estimador β, é possível estimá-la porquatro metodologias diferentes: a linearização por séries de Taylor,replicação repetida balanceada (BRR em inglês), uma modi�caçãode BRR conhecida como Fay's BRR method e jackknife.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 70-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Linearização de Taylor

Seja r = y− Xβ, tem-se a variância de β dada por:

Var(β) = (X′WX)−1G(X

′WX)−1

A matriz G é de�nida como (Woodru�, 1971; SAS, 2011):

G =n− 1n− p

H

∑h=1

nh(1− fh)nh − 1

nh

∑i=1

(ehi. − eh..)′(ehi. − eh..) (1)

onde ehij = whijrhijxhij, ehi. = ∑mhij=1 ehij, eh.. =

1nh

∑nhi=1 ehi., para os

quais whij é o peso associado a cada observação, H é o número deestratos, nh é o número de conglomerados dentro do h-ésimoestrato e mhi é o número de elementos dentro do i-ésimoconglomerdo contido no h-ésimo estrato.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 71-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Estrati�cada

Se a amostra é retirada usando apenas o plano estrati�cado, entãoa matrix G é calculada como:

G =n− 1n− p

H

∑h=1

nh(1− fh)nh − 1

(ehj − eh.)′(ehj − eh.)

onde: ehj = whjrhjxhj, eh. =1nh

∑nhi=1 ehj

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 72-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem por Conglomerado

Se a amostra é retirada usando apenas o plano por conglomerado,então a matrix G é calculada como:

G =n− 1n− p

nc(1− fc)nc − 1

mi

∑i=1

(ei. − ei.)′(ei. − ei.)

onde: eij = wijrijxij, ei. = ∑mij=1 eij, ei. =

1mi

∑mij=1 ei., nc é o número

de conglomerados e fc é a fração amostral para o conglomerado c.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 73-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Amostragem Aleatória Simples com Peso

Se deseja-se considerar apenas os pesos, sem considerarestrati�cação e conglomerados, então a matrix G é calculada como:

G =n− 1n− p

n(1− f )n− 1

n

∑i=1

(ei − e)′(ei − e)

onde: ei = pirixi, e = 1n ∑n

i=1 ei e f é a fração amostral.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 74-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estudo de caso

Dados da PNAD dos anos ímpares de 2001 até 2011.

Foram observadas as variáveis de identi�cação de estrato, pesoe cluster a �m de veri�car mudanças na nomenclatura.

Objetivo: criação de um programa em SAS para ajuste de ummodelo de regressão para os dados da PNAD, considerando oplano amostral sem a interferência do usuário (Monogra�a deFinal de curso em Estatística do aluno João Renato Falcão).

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 75-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estudo de caso

Dados da PNAD dos anos ímpares de 2001 até 2011.

Foram observadas as variáveis de identi�cação de estrato, pesoe cluster a �m de veri�car mudanças na nomenclatura.

Objetivo: criação de um programa em SAS para ajuste de ummodelo de regressão para os dados da PNAD, considerando oplano amostral sem a interferência do usuário (Monogra�a deFinal de curso em Estatística do aluno João Renato Falcão).

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 75-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estudo de caso

Dados da PNAD dos anos ímpares de 2001 até 2011.

Foram observadas as variáveis de identi�cação de estrato, pesoe cluster a �m de veri�car mudanças na nomenclatura.

Objetivo: criação de um programa em SAS para ajuste de ummodelo de regressão para os dados da PNAD, considerando oplano amostral sem a interferência do usuário (Monogra�a deFinal de curso em Estatística do aluno João Renato Falcão).

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 75-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estudo de caso

Tabela: Variáveis Correspondentes - PNAD

Variável Correspondente 2001 2003*** 2005 2007 2009 2011probabilidade do município* v4605 v4605 v4605 v4605 v4605 v4605probabilidade dosetor censitário** v4607 v4607 v4607 v4607 v4607 v4607peso do domicílio v4611 v4611 v4611 v4611 v4611 v4611peso da pessoa v4729 v4729 v4729 v4729 v4729 v4729identi�cação do estrato v4602 v4602 v4602 v4602 v4602 v4602identi�cação do município UPA v4615 UPA UPA UPA UPAunidade primária v4618 v4618 v4618 v4618 v4618 v4618identi�caçãodo setor censitário v0102 v0102 v0102 v0102 v0102 v0102* peso do município=1/(probabilidade do município)** peso do setor=1/(probabilidade do setor)***único ano para o qual a variável UPA é diferente

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 76-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estudo de caso

As variáveis de identi�cação não mudam ao longo dos anos,exceto a variável UPA, no ano de 2003.

É possível então utilizar a mesma programação para todosesses anos.

Ideia: Regressão simples da variável REMUNERAÇÃO emfunção dos ANOS DE ESTUDO;

Junção das tabelas PESSOAS com DOMICÍLIOS do ano de2007.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 77-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estudo de caso

As variáveis de identi�cação não mudam ao longo dos anos,exceto a variável UPA, no ano de 2003.

É possível então utilizar a mesma programação para todosesses anos.

Ideia: Regressão simples da variável REMUNERAÇÃO emfunção dos ANOS DE ESTUDO;

Junção das tabelas PESSOAS com DOMICÍLIOS do ano de2007.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 77-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estudo de caso

As variáveis de identi�cação não mudam ao longo dos anos,exceto a variável UPA, no ano de 2003.

É possível então utilizar a mesma programação para todosesses anos.

Ideia: Regressão simples da variável REMUNERAÇÃO emfunção dos ANOS DE ESTUDO;

Junção das tabelas PESSOAS com DOMICÍLIOS do ano de2007.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 77-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estudo de caso

As variáveis de identi�cação não mudam ao longo dos anos,exceto a variável UPA, no ano de 2003.

É possível então utilizar a mesma programação para todosesses anos.

Ideia: Regressão simples da variável REMUNERAÇÃO emfunção dos ANOS DE ESTUDO;

Junção das tabelas PESSOAS com DOMICÍLIOS do ano de2007.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 77-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estudo de caso

Várias regressões para comparação:

Regressão clássica (PROC REG);

Regressão clássica com os pesos observacionais (PROC REG);

Regressão Survey com os pesos (PROC SURVEYREG);

Regressão Survey com os pesos, estrati�cação e cluster

(PROC SURVEYREG);

Regressão Survey incluindo os três estágios de seleção (trêsPROC SURVEYREG).

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 78-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estudo de caso

Várias regressões para comparação:

Regressão clássica (PROC REG);

Regressão clássica com os pesos observacionais (PROC REG);

Regressão Survey com os pesos (PROC SURVEYREG);

Regressão Survey com os pesos, estrati�cação e cluster

(PROC SURVEYREG);

Regressão Survey incluindo os três estágios de seleção (trêsPROC SURVEYREG).

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 78-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estudo de caso

Várias regressões para comparação:

Regressão clássica (PROC REG);

Regressão clássica com os pesos observacionais (PROC REG);

Regressão Survey com os pesos (PROC SURVEYREG);

Regressão Survey com os pesos, estrati�cação e cluster

(PROC SURVEYREG);

Regressão Survey incluindo os três estágios de seleção (trêsPROC SURVEYREG).

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 78-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estudo de caso

Várias regressões para comparação:

Regressão clássica (PROC REG);

Regressão clássica com os pesos observacionais (PROC REG);

Regressão Survey com os pesos (PROC SURVEYREG);

Regressão Survey com os pesos, estrati�cação e cluster

(PROC SURVEYREG);

Regressão Survey incluindo os três estágios de seleção (trêsPROC SURVEYREG).

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 78-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estudo de caso

Várias regressões para comparação:

Regressão clássica (PROC REG);

Regressão clássica com os pesos observacionais (PROC REG);

Regressão Survey com os pesos (PROC SURVEYREG);

Regressão Survey com os pesos, estrati�cação e cluster

(PROC SURVEYREG);

Regressão Survey incluindo os três estágios de seleção (trêsPROC SURVEYREG).

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 78-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Estudo de caso

/*PRIMEIRO ESTÁGIO*/ods output parameterestimates=beta1;proc surveyreg data=pes2007rate=pes2007 (rename=_rate_1=_rate_);model remuneracao=anos_estudo;strata v4602 /nocollapse;cluster UPA;*cluster v4618; weight v4729;

run;quit;/*SEGUNDO ESTÁGIO*/ods output parameterestimates=beta2;proc surveyreg data=pes2007 rate=pes2007(rename=_rate2_=_rate_);model remuneracao=anos_estudo;strata UPA;*strata v4618;weight v4729;

run;quit;

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 79-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Resultados

Tabela: Estimativa dos coe�cientes

PROCEDIMENTO COEFICIENTE ESTIMATIVA ERROESTIMADO PONTUAL PADRÃO

PROC REG INTERCEPTO 6,2230100 10.50682(sem os pesos) ANOS DE ESTUDO 101,7026400 1,31954000PROC REG INTERCEPTO 52,5637100 9,64473000(com os pesos) ANOS DE ESTUDO 96,9074800 1,22296000PROC SURVEYREG INTERCEPTO 52,5637149 9,64900000(com pesos) ANOS DE ESTUDO 96,9074824 1,94282345PROC SURVEYREG INTERCEPTO 52,5637149 9,21411450(com estrato e cluster ) ANOS DE ESTUDO 96,9074824 1,85521335REGRESSÃO PNAD INTERCEPTO 52,5637149 10,1303(complexo) ANOS DE ESTUDO 96,9074824 2,0600

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 80-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Comparando os resultados utilizando a variável UPA e v4618

Tabela: Estimativa dos coe�cientes no primeiro estágio (com fpc) - UPA

COEFICIENTE ESTIMATIVA ERRO

PONTUAL PADRÃO

INTERCEPTO 52,5637149 5,32327415ANOS DE ESTUDO 96,9074824 1,06817261

Tabela: Estimativa dos coe�cientes no primeiro estágio (sem fpc) - UPA

COEFICIENTE ESTIMATIVA ERRO

PONTUAL PADRÃO

INTERCEPTO 52,5637149 5,68796021ANOS DE ESTUDO 96,9074824 1,15062836

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 81-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Comparando os resultados utilizando a variável UPA e v4618

Tabela: Estimativa dos coe�cientes no segundo estágio (com fpc) - UPA

COEFICIENTE ESTIMATIVA ERRO

PONTUAL PADRÃO

INTERCEPTO 52,5637149 8,61885870ANOS DE ESTUDO 96,9074824 1,76140147

Tabela: Estimativa dos coe�cientes no segundo estágio (sem fpc) - UPA

COEFICIENTE ESTIMATIVA ERRO

PONTUAL PADRÃO

INTERCEPTO 52,5637149 9,57390960ANOS DE ESTUDO 96,9074824 1,92436584

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 82-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Comparando os resultados utilizando a variável UPA e v4618

Tabela: Estimativa dos coe�cientes no terceiro estágio (com fpc) - UPA

COEFICIENTE ESTIMATIVA ERRO

PONTUAL PADRÃO

INTERCEPTO 52,5637149 0,41619480ANOS DE ESTUDO 96,9074824 0,07771342

Tabela: Estimativa dos coe�cientes no terceiro estágio (sem fpc) - UPA

COEFICIENTE ESTIMATIVA ERRO

PONTUAL PADRÃO

INTERCEPTO 52,5637149 9,24231189ANOS DE ESTUDO 96,9074824 1,83868719

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 83-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Comparando os resultados utilizando a variável UPA e v4618

A identi�cação de município não é utilizada no terceiro estágio,com isso para critério de comparação a variável v4618 só foiutilizada nos dois primeiros estágios.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 84-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Comparando os resultados utilizando a variável UPA e v4618

Tabela: Estimativa dos coe�cientes no primeiro estágio (com fpc) - v4618

COEFICIENTE ESTIMATIVA ERRO

PONTUAL PADRÃO

INTERCEPTO 52,5637149 5,35852627ANOS DE ESTUDO 96,9074824 1,05707613

Tabela: Estimativa dos coe�cientes no primeiro estágio (sem fpc) - v4618

COEFICIENTE ESTIMATIVA ERRO

PONTUAL PADRÃO

INTERCEPTO 52,5637149 12,6027111ANOS DE ESTUDO 96,9074824 2,7010110

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 85-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Comparando os resultados utilizando a variável UPA e v4618

Tabela: Estimativa dos coe�cientes no segundo estágio (com fpc) - v4618

COEFICIENTE ESTIMATIVA ERRO

PONTUAL PADRÃO

INTERCEPTO 52,5637149 8,10348683ANOS DE ESTUDO 96,9074824 1,64028432

Tabela: Estimativa dos coe�cientes no segundo estágio (sem fpc) - v4618

COEFICIENTE ESTIMATIVA ERRO

PONTUAL PADRÃO

INTERCEPTO 52,5637149 9,59782228ANOS DE ESTUDO 96,9074824 1,93075666

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 86-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Resultados

Qual variável escolher para o cluster: UPA ou v4618?;

Com a variável v4618 o erro padrão muda signi�cativamenteao ignorar o fpc ;

Com a variável UPA essa mudança é mínima;

O erro padrão no terceiro estágio é muito pequeno e nãoin�uencia a variância total;

O IBGE sinaliza que a variável que de�ne o cluster é a v4618.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 87-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Resultados

Qual variável escolher para o cluster: UPA ou v4618?;

Com a variável v4618 o erro padrão muda signi�cativamenteao ignorar o fpc ;

Com a variável UPA essa mudança é mínima;

O erro padrão no terceiro estágio é muito pequeno e nãoin�uencia a variância total;

O IBGE sinaliza que a variável que de�ne o cluster é a v4618.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 87-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Resultados

Qual variável escolher para o cluster: UPA ou v4618?;

Com a variável v4618 o erro padrão muda signi�cativamenteao ignorar o fpc ;

Com a variável UPA essa mudança é mínima;

O erro padrão no terceiro estágio é muito pequeno e nãoin�uencia a variância total;

O IBGE sinaliza que a variável que de�ne o cluster é a v4618.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 87-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Resultados

Qual variável escolher para o cluster: UPA ou v4618?;

Com a variável v4618 o erro padrão muda signi�cativamenteao ignorar o fpc ;

Com a variável UPA essa mudança é mínima;

O erro padrão no terceiro estágio é muito pequeno e nãoin�uencia a variância total;

O IBGE sinaliza que a variável que de�ne o cluster é a v4618.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 87-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Resultados

Qual variável escolher para o cluster: UPA ou v4618?;

Com a variável v4618 o erro padrão muda signi�cativamenteao ignorar o fpc ;

Com a variável UPA essa mudança é mínima;

O erro padrão no terceiro estágio é muito pequeno e nãoin�uencia a variância total;

O IBGE sinaliza que a variável que de�ne o cluster é a v4618.

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 87-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Resultados

Tabela: Estimativa �nal dos coe�cientes (com fpc) - UPA

COEFICIENTE ESTIMATIVA ERRO

PONTUAL PADRÃO

INTERCEPTO 52,5637149 10,1299

ANOS DE ESTUDO 96,9074824 2,0599

EPInt =√

5, 323274152 + 8, 618417692 + 0, 416194802 = 10, 1384EPInt =

√5, 323274152 + 8, 618417692 = 10, 1299

Tabela: Estimativa �nal dos coe�cientes (sem fpc) - UPA

COEFICIENTE ESTIMATIVA ERRO

PONTUAL PADRÃO

INTERCEPTO 52,5637149 11,1361

ANOS DE ESTUDO 96,9074824 2,2421Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 88-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Resultados

Tabela: Estimativa dos coe�cientes com fpc (algoritmo) - UPA

PROCEDIMENTO COEFICIENTE ESTIMATIVA ERROESTIMADO PONTUAL PADRÃO

REGRESSÃO PNAD INTERCEPTO 52,5637149 10.12933155(complexo) ANOS DE ESTUDO 96,9074824 2.05985089

Tabela: Estimativa dos coe�cientes sem fpc (algoritmo) - UPA

PROCEDIMENTO COEFICIENTE ESTIMATIVA ERROESTIMADO PONTUAL PADRÃO

REGRESSÃO PNAD INTERCEPTO 52,5637149 11.13609610(complexo) ANOS DE ESTUDO 96,9074824 2.24212611

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 89-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Resultados

Tabela: Estimativa �nal dos coe�cientes (com fpc) - v4618

COEFICIENTE ESTIMATIVA ERRO

PONTUAL PADRÃO

INTERCEPTO 52,5637149 9,7149

ANOS DE ESTUDO 96,9074824 1,9514

EPInt =√

5, 358526272 + 8, 103486832 = 9.7149

Tabela: Estimativa �nal dos coe�cientes (sem fpc) - v4618

COEFICIENTE ESTIMATIVA ERRO

PONTUAL PADRÃO

INTERCEPTO 52,5637149 15,8413

ANOS DE ESTUDO 96,9074824 3,3201

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 90-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Resultados

Tabela: Estimativa dos coe�cientes com fpc (algoritmo) - v4618

PROCEDIMENTO COEFICIENTE ESTIMATIVA ERROESTIMADO PONTUAL PADRÃO

REGRESSÃO PNAD INTERCEPTO 52,5637149 10.15723685(complexo) ANOS DE ESTUDO 96,9074824 2.05696017

Tabela: Estimativa dos coe�cientes sem fpc (algoritmo) - v4618

PROCEDIMENTO COEFICIENTE ESTIMATIVA ERROESTIMADO PONTUAL PADRÃO

REGRESSÃO PNAD INTERCEPTO 52,5637149 15.84129161(complexo) ANOS DE ESTUDO 96,9074824 3.32013276

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 91-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Macro %pnadsurveyreg

A macro %pnadsurveyreg(data=,y=,x=,intercept=YES,fpc=YES)é muito simples de usar e possui apenas 5 parâmetros (sendo 2destes com valores default):

(data=) O nome da tabela

(y=) O nome da variável dependente

(x=) Os nomes das variáveis explicativas

(intercept=YES/NO) Se deseja manter ou retirar o intercepto(com intercepto é o default)(fpc=YES/NO) Se deseja manter ou retirar o fpc (com fpc é odefault)

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 92-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Macro %pnadsurveyreg

A macro %pnadsurveyreg(data=,y=,x=,intercept=YES,fpc=YES)é muito simples de usar e possui apenas 5 parâmetros (sendo 2destes com valores default):

(data=) O nome da tabela

(y=) O nome da variável dependente

(x=) Os nomes das variáveis explicativas

(intercept=YES/NO) Se deseja manter ou retirar o intercepto(com intercepto é o default)(fpc=YES/NO) Se deseja manter ou retirar o fpc (com fpc é odefault)

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 92-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Macro %pnadsurveyreg

A macro %pnadsurveyreg(data=,y=,x=,intercept=YES,fpc=YES)é muito simples de usar e possui apenas 5 parâmetros (sendo 2destes com valores default):

(data=) O nome da tabela

(y=) O nome da variável dependente

(x=) Os nomes das variáveis explicativas

(intercept=YES/NO) Se deseja manter ou retirar o intercepto(com intercepto é o default)(fpc=YES/NO) Se deseja manter ou retirar o fpc (com fpc é odefault)

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 92-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Macro %pnadsurveyreg

A macro %pnadsurveyreg(data=,y=,x=,intercept=YES,fpc=YES)é muito simples de usar e possui apenas 5 parâmetros (sendo 2destes com valores default):

(data=) O nome da tabela

(y=) O nome da variável dependente

(x=) Os nomes das variáveis explicativas

(intercept=YES/NO) Se deseja manter ou retirar o intercepto(com intercepto é o default)(fpc=YES/NO) Se deseja manter ou retirar o fpc (com fpc é odefault)

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 92-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Macro %pnadsurveyreg

A macro %pnadsurveyreg(data=,y=,x=,intercept=YES,fpc=YES)é muito simples de usar e possui apenas 5 parâmetros (sendo 2destes com valores default):

(data=) O nome da tabela

(y=) O nome da variável dependente

(x=) Os nomes das variáveis explicativas

(intercept=YES/NO) Se deseja manter ou retirar o intercepto(com intercepto é o default)

(fpc=YES/NO) Se deseja manter ou retirar o fpc (com fpc é odefault)

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 92-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Macro %pnadsurveyreg

A macro %pnadsurveyreg(data=,y=,x=,intercept=YES,fpc=YES)é muito simples de usar e possui apenas 5 parâmetros (sendo 2destes com valores default):

(data=) O nome da tabela

(y=) O nome da variável dependente

(x=) Os nomes das variáveis explicativas

(intercept=YES/NO) Se deseja manter ou retirar o intercepto(com intercepto é o default)(fpc=YES/NO) Se deseja manter ou retirar o fpc (com fpc é odefault)

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 92-93

Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral

Macro %pnadsurveyreg

A saída para o programa elaborado está ilustrada a seguir.Design Summary

Number of Strata 545Number of Clusters 817

Number of Strata (2nd stage) 817

Data SummaryNumber of Observations Used 57862

Sum of Weights 28002586Weighted Mean of remuneracao 706.08461

Fit StatisticsR-square 0.0978967Root MSE 1202.7752

Regression Analysis for Dependent Variable remuneracao

Estimated Regression Coefficients

Parameter Estimate Std. Error t Value P > |t|

INTERCEPT 52.56371489 10.12933155 5.19 <.0001ANOS_ESTUDO 96.90748239 2.05985089 47.05 <.0001

NOTE: The denominator degrees of freedom for the t tests is 272 .

Prof. Alan Ricardo da Silva Universidade de Brasília

Técnicas de Amostragem 93-93