EM Amostragem 0910

32
1 Teoria AMOSTRAGEM Método e Desenho Unidade de amostragem Dimensão da amostra Métodos de amostragem Desenho amostral População Amostra Amostragem Inferência Inferência estatística : processo de prever ou estimar parâmetros populacionais baseado em dados amostrais

Transcript of EM Amostragem 0910

Page 1: EM Amostragem 0910

1

Teoria

AMOSTRAGEM Método e Desenho

Unidade de amostragem Dimensão da amostra

Métodos de amostragem Desenho amostral

População

Amostra

Amostragem Inferência

Inferência estatística: processo de prever ou estimar parâmetros populacionais baseado em dados amostrais

Page 2: EM Amostragem 0910

2

Métodos de amostragem

•  Amostragem aleatória simples (amostragem aleatória)

•  Amostragem aleatória estratificada

•  Amostragem sistemática

•  outros métodos (adaptativa, agregada, sequencial)

Amostragem aleatória simples

s2 =xi − x( )

2∑

n −1

Erro padrão da média populacional

x =xi∑

n

Estimativa da média

sx =s2

n( 1− n

N)

Variância

Page 3: EM Amostragem 0910

3

Como se define ESTRATO

•  Uma camada que possui características que servem para a distinguir de camadas adjacentes (como camadas de rocha ou zonas de vegetação em montanhas)

•  Em geral e para AMOSTRAGEM e ESTATÍSTICA, um estrato é uma camada ou zona que possui propriedades ambientais ou biológicas relativamente homogéneas, quando comparada com outras camadas ou zonas

•  Em amostragem é frequentemente sinónimo de habitate, subhabitate, e zonas num gradiente clinal como padrões de zonação

Zona de craca/mexilhão

Zona de algas vermelhas

Zona de algas verdes

Fenda com poliquetas coloniais

Page 4: EM Amostragem 0910

4

Zona de ostras Saccostrea cuccullata

Zona de cracas Chthamallus spp.

Zona de cracas Tetraclita spp.

Zona de cracas Tetraclita spp.

Superior Zona de baixa densidade < 50% cobertura

Médio Zona de alta densidade >50% cobertura < 75% cobertura

Inferior Zona de baixa densidade < 50% cobertura

Page 5: EM Amostragem 0910

5

Littoraria kraussi

Nodilittorina africana

Nodilittorina natalensis

HABITAT FRAGMENTADO eg: manchas de ervas marinhas e areia

Especial cuidade com efeito de fronteira. Usualmente amostragem a distância ‘de segurança’ da fronteira das manchas

Page 6: EM Amostragem 0910

6

Amostragem aleatória estratificada

sx =wi2si2

ni

(1− f i)⎡

⎣ ⎢

⎦ ⎥

i=1

L

x ST =

Nix ii=1

L

∑N

onde,

Ni é a dimensão do estrato i e N a dimensão de todos os estratos

wi =Ni

N

fi =niNi

Erro padrão da média Estimativa da média

Estrato A

Estrato B

Estrato C

1 2 1

3 4

Tabela de números aleatórios

Amostragem aleatória estratificada

Page 7: EM Amostragem 0910

7

Praia superior

Praia inferior

1 2 3 4 5 6

Sistemático (altura ou distância)

OR

Estratificado (zonas biológicas)

1 2 1

3 4

Amostragem aleatória estratificada

Tabela de números aleatórios

1 2 1

3 4 Table of random numbers

Amostragem aleatória estratificada

Page 8: EM Amostragem 0910

8

Como alocar amostras aos estratos?

•  Alocação proporcional

•  Alocação óptima (relatiuva a custos ou variância)

Amostragem aleatória estratificada

Em que condições a amostragem estratificada produz melhor estimativas comparada com

amostragem aleatória simples (AAS)?

•  Quando as estimativas diferem muito entre estratos

•  Quando a variância inter-estrato é alta e a variância intra-estrato é baixa

Senão AAS produzirá melhor resultado (não enviesada e com menor variância)

Amostragem aleatória estratificada

Page 9: EM Amostragem 0910

9

Métodos de amostragem

•  Desenhos aleatórios e estratificados são geralmente os mais adequados...

•  ... Especialmente quando queremos visar inferência estatística

•  Outros métodos são uteis ou produzem melhores estimativas em condições particulares

A investigação ecológica depara-se com problemas de

REPLICAÇÃO

CONTROLOS

CONFUSÃO

ESCALA

Page 10: EM Amostragem 0910

10

REPLICAÇÃO

Replicação apropirada deve ser usada para gerar precisão estatística, e para considerar a complexa heterogeneidade dos sistemas naturais: não há sistemas idênticos e estes variam no tempo e no espaço a escalas diferentes.

CONTROLOS

Controlos apropriados, especialmente em procedimentos experimentais, devem ser usados, para permitir uma verdadeira compreensão da significância dos nossos tratamentos experimentais.

Page 11: EM Amostragem 0910

11

CONFUSÃO

Frequentemente, diferentes variáveis e processos produzem os padrões observados em interacções complexas. É imperatrivo desenhar a amostragem/experiência de modo a isolar factores e discriminar a sua influência isolada e sinergística.

ESCALA

As escalas a que os fenómenos e padrões ocorrem podem interferir com as escalas usadas na nossa estratégia de amostragem.

Page 12: EM Amostragem 0910

12

As escalas dos padrões e processos variam. A sua expressão varia de lugar para lugar e de

tempo para tempo.

A variação tem de ser abordada simultâneamente a diferentes escalas espaciais, com amostragem que inclua replicação aleatória

em desenhos hierárquicos (anichados)

Tem de se tomar em conta a variação causada pela interacção entre processos e entre

processos e variabilidade espacial e temporal entre habitates

Tipo e forma óptima de unidade de amostragem

Os métodos de amostragem para abundância podem ser categorizados como

PLOT e PLOTLESS

Métodos ‘Plot’ incorporam o uso de fronteiras rígidas, usadas para reduzir o ‘bias’ e poupar tempo.

(Bias é um erro direccional sistemático)

Linhas de transecto ou amostragem agregada podem ter técnicas ‘plot’ ou ‘plotless’

Page 13: EM Amostragem 0910

13

Formas mais comuns (Pringle, 1984):

Quadrados (67%) Círculos (19%) Rectangulos (14%)

Transectos em linha Transectos radiais

1) Verificar se há padrões na literatura

2) Avaliar a questão e ambiente específico

Tipo e forma óptima de unidade de amostragem

Page 14: EM Amostragem 0910

14

O tipo e forma da unidade de amostragem varia em função de

Organism(s) alvo (séssil/móvel, individual/colonial, dimensão, padrão de distribuição, etc)

Ambiente específico (bentónico/pelágico, substrato duro/mole, homogéneo/heterogéneo, uniforme/gradiente, etc)

Questão e hipóteses de investigação (estimativa de densidade, padrão de distribuição, parâmetros biológicos, etc)

Estimativa de densidade

Organismo Medida Dimensão do ☐ (m)

Animais sésseis cobertura (%) 0.5x0.5 ou 0.25x0.25

Lapas n m-2 1.0x1.0 até 0.25x0.25 protegido até exposto

littorinídeos n m-2 0.25x0.25 ou 0.1x0.1 depende da densidade

cracas n m-2 0.1x0.1 ou 0.05x0.05 depende da densidade

Page 15: EM Amostragem 0910

15

Populações de dimensões diferentes

aleatório aleatório

Duas grelhas de diferentes dimensões simultâneamente

Page 16: EM Amostragem 0910

16

Estimativa da densidade

•  Presença/ausência em subquadrates (% cobertura)

•  Número por subquadrate ou em aleatoriamente seleccionados(pseudoreplicação) (nº por área)

•  Estimativa subjectiva da cobertura (% cobertura)

•  Número de intersecções (% cobertura)

50%

Estimativa da densidade – organismos sésseis

•  Presença/ausência em subquadrates (% cobertura)

•  Número por subquadrate ou em aleatoriamente seleccionados(pseudoreplicação) (nº por área)

•  Estimativa subjectiva da cobertura (% cobertura)

•  Número de intersecções (% cobertura)

Page 17: EM Amostragem 0910

17

17(25) = 68%

Sobre-estimativa

•  Presença/ausência em subquadrates (% cobertura)

•  Número por subquadrate ou em aleatoriamente seleccionados(pseudoreplicação) (nº por área)

•  Estimativa subjectiva da cobertura (% cobertura)

•  Número de intersecções (% cobertura)

Estimativa da densidade – organismos sésseis

9(16) = 56%

•  Presença/ausência em subquadrates (% cobertura)

•  Número por subquadrate ou em aleatoriamente seleccionados(pseudoreplicação) (nº por área)

•  Estimativa subjectiva da cobertura (% cobertura)

•  Número de intersecções (% cobertura)

Estimativa da densidade

Page 18: EM Amostragem 0910

18

4(25)

= 16%

Estimativa da densidade

16 intersecções

1 4(16) = 25%

Sobre-estimativa

2 2(16)

= 12.5% leve

Sub-estimativa

1

2

Estimativa da densidade

Page 19: EM Amostragem 0910

19

25 intersecções

1 4(25)

= 16% Bom

2 4(25)

= 16% Bom

1

2

Estimativa da densidade

2(25)

= 8%

Estimativa da densidade

Page 20: EM Amostragem 0910

20

16 intersecções

1 2(16)

= 12.5% Sobre-estimativa

2 1(16)

= 6.25% leve

Sub-estimativa

1

2

Estimativa da densidade

25 intersecções

1 2(25) = 8% Bom

2 2(25) = 8% Bom

1

2

Estimativa da densidade

Page 21: EM Amostragem 0910

21

1(25)

= 4%

Estimativa da densidade

16 intersecções

1 0(16)

= 0%=1% Sub-estimativa

2 1(16)

= 6.25% Sobre-estimativa

1

2

Estimativa da densidade

Page 22: EM Amostragem 0910

22

25 intersecções

1 1(25) = 4% Bom

2 1(25) = 4% Bom

1

2

Estimativa da densidade

1(50)

= 2%

Estimativa da densidade

Page 23: EM Amostragem 0910

23

16 intersecções

1 0(16)

= 0%=1% Sub-estimativa

2 1(16)

= 6.25% Sobre-estimativa

3 0(16)

= 0%=1% Sub-estimativa

1

2

3

Estimativa da densidade

25 intersecções

1 1(25) = 4%

Sobre-estimativa

2 0(25)

= 0% = 1% Sub-estimativa

3 0(25)

= 0% = 1% Sub-estimativa

1

2

3

Estimativa da densidade

Page 24: EM Amostragem 0910

24

36 intersecções

1 1(36)

= 2.77% Bom

2 0(25)

= 2.77% Bom

3 0(25)

= 2.77% Bom

1

2

3

Estimativa da densidade

Estimativa da densidade

O mais seguro (precisão para pequenos organismos/

colónias) e largamente usado

é

7 x 7 = 49 intersecções

Page 25: EM Amostragem 0910

25

Page 26: EM Amostragem 0910

26

E quanto à dimensão da amostra?

•  Há várias expressões que abordam a dimensão da amostra como uma função do erro da estimativa

•  Para usar a expressão correcta necessitamos de conhecer o parâmetro (média, variância, proporções, etc.) e a probabilidade da distribuição da variável aleatória

n = t 2 SD2 (E X)2

n = número de unidades t = valor t (n-1, gl) SD = desvio padrão E = erro permitido (eg 10% = 0.1) X = média

Número de unidades de amostragem em dados distribuídos normalmente (Cochram, 1977)

exemplo: comprimento médio de peixes

Page 27: EM Amostragem 0910

27

n ≈ ( ) 200

r

2 1 X

n = número de unidades ≈ = aproximadamente igual a r = erro permitido (%) X = média

Número de unidades de amostragem

numa distribuição de Poisson (aleatória) (Krebs, 1999)

exemplo: contagens de galerias de caranguejos em

zonas de maré

n = número de unidades ≈ = aproximadamente igual a t = valor t (n-1, gl) (=2 para 95% nível confiança) r = erro permitido (%) X = média

k = expoente da binomial negativa estimado

n ≈ ( ) (100 tα)2

r2 1 X

1 k

+

k = (X)2

(S)2 - X X = média

S = desvio padrão

Número de unidades de amostragem numa distribuição binomial negativa (aggregated) (Krebs, 1999)

exemplo: contagens de cracas

na costa rochosa

Page 28: EM Amostragem 0910

28

Padrões espaciais – tipos de distribuição

uniforme (regular)

agregada (contagiosa, sobre-dispersa)

aleatória

Unidade de amostragem grande

Distribuição uniforme

Page 29: EM Amostragem 0910

29

Distribuição agregada

Unidade de amostragem média

Distribuição aleatória

Unidade de amostragem pequena

Page 30: EM Amostragem 0910

30

Ausência de associação

Associação entre as espécies e

Associação entre as espécies , e

Dimensão do quadrate e associação de espécies de um comunidade

Variação da agregação no bivalve Mytilus edulis

Padrões seguem as características de retenção de água no substrato

Page 31: EM Amostragem 0910

31

Agregação de Cerithidea decollata e Terebralia palustris

Morisita’s Index (MI)

MI = S (∑n2 - N)

N (N-1)

n = total number of individuals in a quadrat N = total number of all individuals S = number of quadrats

IF MI > 1 REGULAR OR UNIFORM DISPERSION MI = 1 RANDOM DISPERSION MI < 1 CLUMPED DISPERSION

Page 32: EM Amostragem 0910

32

Standardized Morisita’s Index (MI) - Krebs (1999) independent of sample size and ranging -1 to +1

n = number of quadrats xi = number of organisms in quadrat i χ2

.975 = value of Chi-square from the table (n - 1 df) with 97.5% of the area to the right

χ2.025 = value of Chi-square from the table (n - 1 df)

with 2.5% of the area to the right

1) Calculate MI 2) Calculate two new indices, UNIFORM INDEX (Mu)

and CLUMPED INDEX (Mc)

Mu = χ2

.975 - n +∑xi (∑xi) - 1

χ2.025 - n +∑xi

(∑xi) - 1 Mc =

If MI ≥ Mc > 1.0 then

3) Calculate the Standardized Morisita’s Index (MIS)

MIS = 0.5 + 0.5 ( ) MI - Mc n - Mc

MIS = 0.5 ( ) MI - 1 Mu - 1

MIS = - 0.5 ( ) MI - 1 Mu - 1

MIS = - 0.5 + 0.5 ( ) MI - Mu

Mu

MIS > 0 = CLUMPED +1 = maximum aggregation MIS = 0 = RANDOM 0 = random distribution MIS < 0 = UNIFORM -1 = perfectly uniform distribution

If Mc > MI ≥ 1.0 then

If 1.0 > MI > Mu then

If 1.0 > Mu > MI then