Valério De Patta Pillar Departamento de Ecologia Universidade Federal do Rio Grande do Sul Porto...
Transcript of Valério De Patta Pillar Departamento de Ecologia Universidade Federal do Rio Grande do Sul Porto...
Valério De Patta PillarDepartamento de Ecologia
Universidade Federal do Rio Grande do SulPorto Alegre, Brasil
[email protected]://ecoqua.ecologia.ufrgs.br
Introdução à Análise Multivariada em Ecologia
• Em ecologia buscamos descobrir padrões1 e processos2 ao examinar conjuntos de unidades ecológicas frequentemente complexas, e por isso descritas por muitas variáveis.
Métodos de análise multivariada podem sintetizar conjuntos complexos de dados, permitido interpretações sobre padrões e
processos.
1Padrão: Arranjo ou sequência encontrada regularmente em objetos ou eventos comparáveis.
2Processo: Uma série de mudanças explicando a gênese de um dado padrão.
Amostragem
Universo amostral
Uma amostra(conjunto de unidades amostrais)
Uma unidade amostral (e.g.,
unidade de paisagem)
Ambiente amostrado• Padrões não-aleatórios• Dependência da escala• Unidades com limites arbitrários
Unidades maiores e mais heterogêneas
Unidades menores e mais homogêneas
O problema da amostragem em ecologia
• Unidades amostrais são agregados de componentes mais ou menos integrados entre si; portanto, as unidades amostrais não têm limites naturais.
• Os componentes estão em geral arranjados não-aleatoriamente.
• Interpretações sobre padrões dependem do tamanho da unidade amostral.
Kenkel, N. C., P. Juhász-Nagy & J. Podani. 1989. On sampling procedures in population and community ecology. Vegetatio 83: 195-207.
Orlóci, L. 1993. The complexities and scenarios of ecosystem analysis. In: Rao, C. R. Multivariate Analysis: Future Directions, p.421-430. Elsevier.
Uma unidade amostral pode ser um quadro de vegetação. A decisão sobre o tamanho da unidade amostral afetará a percepção de padrões.
Uma unidade amostral pode ser uma planta individual, em geral com limites naturais, e neste caso não é preciso decidir sobre o tamanho da unidade amostral.
Decisões para a amostragem
Para coletar dados precisamos decidir sobre:1. O tamanho e forma das unidades
amostrais2. Como serão selecionadas (ao acaso,
sistematicamente, preferencialmente)3. O número de unidades amostrais (tamanho
da amostra)
Tamanho da amostra (número de unidades amostrais) e tamanho da
unidade amostralDepende do objetivo:• Se é estimar uma quantidade (e.g., cobertura de
uma dada espécie):– Quanto menor a variação entre unidades
amostrais (unidades maiores), mais precisa será a estimativa com o mesmo tamanho de amostra.
• Se é a detecção de padrões:– Padrões serão borrados se a variação entre
unidades for baixa (unidades muito grandes).
Kenkel, N. C., P. Juhász-Nagy & J. Podani. 1989. On sampling procedures in population and community ecology. Vegetatio 83: 195-207.
Pillar, V. D. 1998. Sampling sufficiency in ecological surveys. Abstracta Botanica 22: 37-48.
Objetivos da amostragem podem estar aninhados
Objetivo é estimar quantidades das espécies em cada parcela grande
Objetivo é detectar padrões e interpretá-los
Atributos variáveis
Uma unidade amostral pode ser descrita por:• Variáveis qualitativas (escala nominal,
nenhuma ordem)e.g., tipo de substrato, tipo de clima, forma-vital.
• Variáveis binárias (0 ou 1)e.g., presença-ausência de uma espécie, de pêlos.
• Variáveis quantitativas (têm ordem; escalas ordinal, de intervalo, ou racional)
e.g., abundância de cada espécie, P disponível no solo, diversidade de tipos de uso da terra, precipitação annual, área foliar específica.
Tipos de dados multivariados
• Qualitativos (somente variáveis qualitativas)• Binários (somente variáveis binárias)• Quantitativos (somente variáveis quantitativas)• Dados mistos (variáveis de diferentes tipos)
Alguns métodos de análise multivariada podem ser aplicáveis somente a certos tipos de dados.
Sitio pHP
ppmK
ppmMO %
Al me/dl
Ca me/dl
Mg me/dl
S ppm Pos Umid
1 4.4 3.1 106 2.9 0.1 1.3 0.7 13.1 1 2
2 4.7 2.5 140 3.7 0.4 2.1 1.3 42.3 1 3
3 4.7 2 138 2.5 1 1.1 0.6 13.1 1 2
4 4.8 1.6 118 2.5 0.7 1.5 1 12.5 1 2
5 4.7 2.5 66 3 0.9 1.9 1.3 15.5 1 1
6 4.8 1.6 130 3.2 1.5 2 1.3 16.7 1 1
7 4.8 1.6 136 3.2 0.8 2.1 1.3 13.1 1 1
8 4.8 1.2 100 2.9 0.5 1.9 1.1 12.5 2 1
9 4.7 1.2 66 2.8 0.8 1.8 1 13.1 2 2
10 4.8 2 78 3.1 1 1.9 0.9 13.7 2 2
11 4.7 1.6 54 3.6 1.7 1 0.7 10.7 4 4
12 4.7 2 70 3.2 1.4 1.5 1.1 15.5 3 2
13 4.8 1.7 86 3 0.7 1.7 1.1 13.1 3 2
14 4.6 1.7 70 2.8 0.6 1.6 0.8 11.3 3 2
15 4.6 2.4 46 3.9 1.4 1.7 0.3 7.1 4 5
Uma amostra com 15 sítios de Campos descritos por 10 variáveis de solo
Pos = Posicao no relevo (1.topo, 2.encosta convexa, 3.encosta concava, 4.baixada)
Umid = Umidade do solo (1.muito seco, 2.seco, 3.mdio, 4.mido, 5.encharcado)
Análise de dados com o software MULTIV
Dataquantitative, qualitative, binary, mixed
Ordination
Transformation
Resemblancebetween variables or sampling units
Cluster analysis
Randomization
teststo compare groups of
sampling units (analysis of variance)
or to compare variables
Descriptive attributes and
bootstrap
Bootstrap Bootstrap
Disponível em http://ecoqua.ecologia.ufrgs.br
Valério De Patta PillarDepartamento de Ecologia
Universidade Federal do Rio Grande do SulPorto Alegre
[email protected]://ecoqua.ecologia.ufrgs.br
Medidas de SemelhançaIntrodução
Análise de dados com o software MULTIV
Dataquantitative, qualitative, binary, mixed
Ordination
Transformation
Resemblancebetween variables or sampling units
Cluster analysis
Randomization
teststo compare groups of
sampling units (analysis of variance)
or to compare variables
Descriptive attributes and
bootstrap
Bootstrap Bootstrap
Disponível em http://ecoqua.ecologia.ufrgs.br
Medidas de SemelhançaAvaliam objetivamente a similaridade ou dissimilaridade entre duas unidades amostrais ou variáveis.
X
2
X1
α
β
d αβ
Representação gráfica da distância euclidiana dαβ entre unidades
amostrais α e β descritas pelas variáveis X1 e X2: dαβ = [(X1α–X1β)2 + (X2α–X2β)2]1/2
Medidas de Semelhança
X
2
X1
α
β
d αβ
Distância euclidiana d12= [(237-234)2+(6-16)2+(25-47)2+(32-9)2]1/2=33.50
Distância euclidiana d13= [(237-269)2+(6-9)2+(25-22)2+(32-8)2]1/2= 40.22
Distância euclidiana d21,22= [(24-28)2+(1-1)2+(227-217)2+(41-43)2]1/2= 10.95
0.0033.50 0.0040.22 43.59 0.0049.75 26.63 69.56 0.00
105.21 86.75 128.59 60.38 0.00122.22 103.87 146.81 77.40 21.89 0.00235.35 221.41 263.74 194.82 136.14 118.41 0.00281.58 265.90 308.54 239.35 180.21 162.10 47.78 0.00246.21 235.51 277.59 209.25 153.71 135.37 35.44 57.40 0.00299.18 283.09 325.51 256.57 197.06 179.42 67.33 23.20 73.60 0.00292.11 278.01 320.47 251.41 192.59 174.57 58.03 21.14 55.79 22.38 0.00281.83 271.42 313.35 245.08 188.67 170.72 58.26 49.45 37.07 59.41 37.07 0.00288.94 278.22 320.07 251.79 194.62 177.04 61.95 46.66 45.63 54.01 32.22 10.86 0.00310.44 297.68 339.89 271.09 212.52 194.80 76.69 41.32 69.21 37.93 24.21 37.87 28.78 0.00313.08 300.11 342.33 273.51 214.80 197.12 78.87 41.93 72.64 37.66 26.10 41.53 32.36 4.12 0.00323.47 308.32 350.62 281.74 222.12 204.70 88.87 43.83 90.41 28.37 35.19 65.02 56.52 29.29 26.33 0.00307.62 293.44 335.79 266.83 207.68 189.96 72.92 31.46 70.97 22.49 16.52 46.14 38.41 15.78 15.36 19.82 0.00309.88 294.57 336.97 267.99 208.49 190.86 75.53 30.10 78.34 15.43 22.91 56.90 49.63 27.00 25.46 14.32 12.17 0.00308.67 294.92 337.20 268.30 209.24 191.59 73.93 34.15 70.77 27.31 18.57 43.85 35.45 11.09 10.49 21.24 5.10 16.19 0.00292.73 280.14 322.35 253.56 195.24 177.43 59.82 31.80 51.67 36.21 14.90 24.90 17.94 18.06 21.33 40.94 21.70 32.23 19.93 0.00293.73 278.84 321.25 252.23 192.96 175.19 59.62 17.61 62.38 13.64 9.54 46.05 40.68 28.58 29.29 30.81 16.06 17.03 19.70 23.04 0.00284.06 269.66 312.08 243.05 184.05 166.16 50.15 15.94 51.64 22.58 9.11 39.21 35.71 32.45 34.26 41.24 24.13 27.82 26.46 20.27 10.95 0.00
Matriz de distâncias euclidianas entre unidades amostrais, Cambará do Sul.
Medidas de semelhançaX
2
X1
α
β
d αβ
Distância de corda d12= [(237/240.5-234/239.4)2+(6/240.5-16/239.4)2+(25/240.5-47/239.4)2+(32/240.5-9/239.4)2]1/2=0.1395
Matriz de distâncias de corda entre unidades amostrais, Cambará do Sul.
Medidas de semelhançaX
2
X1
α
β
d αβ
Dissimilaridade Bray-Curtis b12= (|237-234| + |6-16| + |25-47| + |32-9|) / ( 237+234 + 6+16 + 25+47 + 32+9 ) = 0.0957
Matriz de dissimilaridades de Bray-Curtis entre unidades amostrais, Cambará do Sul.
Transformação de dados
Transformação de dados
Transformação de dados
Transformação de dados
Transformação de dados
Transformação de dados
Transformar dados?
Efeito de transformações escalares
Medidas de Semelhança
Medidas de semelhança