CAPÍTULO 5 Associação entre duas variáveis: análise bidimensional.

Post on 07-Apr-2016

236 views 5 download

Transcript of CAPÍTULO 5 Associação entre duas variáveis: análise bidimensional.

CAPÍTULO 5CAPÍTULO 5

Associação entre duas variáveis:

análise bidimensional

Associação entre duas variáveisAssociação entre duas variáveis

- g rá fic o d e b arras- p rop orç õ es- q u i-q u ad rad o

am b asq u a lita t ivas

- d iag ram a d e d is p ers ã o- coe fic ien te d e c o rre laçã o

am b asq u an tita t ivas

- g rá fico d e m é d ias- b ox-p lo t- tes tes d e m é d ias- tes tes n ã o p aram é tricos

u m a q u an tita tivaou tra q u a lita t iva

N a tu reza d asV ariá ve is

Ambas QualitativasAmbas Qualitativas• Tabela de freqüências: tabelas de dupla entrada “crosstabs” : % por linha, % por coluna, % total

• Gráfico apropriado: gráfico de barras duplas

• Parâmetros a serem comparados: proporções

• Medidas a serem calculadas: qui-quadrado (associação); Kappa (concordância), sensibilidade e especificidade (padrão ouro)

ExemploExemploPara os dados da Feira de Informação profissional da UFES, foram testadas as associações estatisticamente significantes entre pares de variáveis qualitativas.

- Tabelas cruzadas- Gráfico de barras- teste de hipóteses: Foram feitos testes 2 e o teste exato de Fisher (o apropriado em cada caso).

Exemplo 1Exemplo 1Área x Sexo

58 14 7239,2% 6,2% 19,3%

63 135 19842,6% 59,7% 52,9%

27 77 10418,2% 34,1% 27,8%

148 226 374100,0% 100,0% 100,0%

Freqüência% SexoFreqüência% SexoFreqüência% SexoFreqüência% Sexo

Exatas

Humanas

Biomédicas

Área

Total

Masculino Feminino

Sexo

Total

58 14 72

80,6% 19,4% 100,0%

39,2% 6,2% 19,3%

15,5% 3,7% 19,3%

63 135 198

31,8% 68,2% 100,0%

42,6% 59,7% 52,9%

16,8% 36,1% 52,9%

27 77 104

26,0% 74,0% 100,0%

18,2% 34,1% 27,8%

7,2% 20,6% 27,8%

148 226 374

39,6% 60,4% 100,0%

100,0% 100,0% 100,0%

39,6% 60,4% 100,0%

Exatas

Humanas

Biomédicas

Se respondeu não napergunta anterior. Játomou decisão sobre aárea?

Total

Masculino Feminino

Sexo

Total

Exemplo 1Exemplo 1

0

10

20

30

40

50

60

exata humana biomedica

masculinofeminino

Exemplo 2Exemplo 2Turno x Sexo

100 165 26567,6% 70,2% 69,2%

9 19 286,1% 8,1% 7,3%

27 31 5818,2% 13,2% 15,1%

12 20 328,1% 8,5% 8,4%148 235 383

100,0% 100,0% 100,0%

Freqüência% SexoFreqüência% SexoFreqüência% SexoFreqüência% SexoFreqüência% Sexo

Manhã

Tarde

Noite

Integral

Qual seria oturno de suapreferência paraestudar naUFES?

Total

Masculino Feminino

Sexo

Total

Exemplo 2Exemplo 2

manhã tarde noite integral

masculinofeminino0

20

40

60

80

masculinofeminino

Exemplo 3Exemplo 3

teste 1: nhh * teste 2: hbc Crosstabulation

Count

133 7 14026 153 179

159 160 319

não anêmicoanêmico

teste 1:nhh

Total

nãoanêmico anêmico

teste 2: hbc

Total

Kappa = 0,793; p = 0,000 (***)(***) p < 0,001

Ambas QuantitativasAmbas Quantitativas

- diagrama de dispersão

- covariância

- coeficiente de correlação

Diagrama de DispersãoDiagrama de Dispersão

O instrumento adequado para o estudo gráfico da associação entre duas variáveis quantitativas é o Diagrama de Dispersão.

É construído em um eixo cartesiano. O procedimento de construção consiste em escolher de forma conveniente as variáveis que serão plotadas no eixo horizontal(x) e no eixo vertical(y).

Diagrama de DispersãoDiagrama de Dispersão

543210-1-2-3-4

15

10

5

0

Eixo Horizontal

Eixo

Ver

tical

Diagrama de Dispersão

Diagrama de DispersãoDiagrama de Dispersão

Um diagrama de dispersão apresenta correlação positiva entre as variáveis quando, à medida que x aumenta, y também aumenta; a correlação negativa ocorre quando, à medida que x aumenta y diminui e vice-versa. Dependendo da dispersão dos pontos plotados esta correlação pode ser forte ou moderada. Duas variáveis não apresentarão relacionamento quando a nuvem de pontos tem a forma de um círculo.

CovariânciaCovariânciaA covariância é uma medida que resume a tendência e a força da relação linear entre duas variáveis.

Covariância entre X e Y: Covar(X,Y)

1/(n-1) *{ Soma [(X - média(X))*(Y - média(Y))]}

Propriedades da CovariânciaPropriedades da Covariância

• As duas variáveis devem ter o mesmo número de valores;

•A covariância é a média dos produtos dos desvios das duas variáveis, obtida como resultado de dividir a soma dos produtos dos desvios pela quantidade de valores das variáveis menos 1;

•A covariância pode assumir qualquer valor do conjunto dos números reais: = 0, > 0 e < 0.

Coeficiente de CorrelaçãoCoeficiente de CorrelaçãoPara facilitar a relação entre duas variáveis e evitar a unidade de medida da covariância, foi definido o coeficiente de correlação corr(X,Y) ou r(X,Y) como:

r(X,Y) = covar(X,Y) / [DP(X)*DP(Y)]

Propriedades da CorrelaçãoPropriedades da Correlação• Os valores de r(X,Y) estão limitados entre -1 e +1;

• É um valor único para a população ou amostra, tomando o cuidado de utilizar dados coerentes. Ex.: medir associação entre o número de cegonhas e números de bebês nascidos por ano;

• O coeficiente de correlação de uma variável com ela mesma é igual a 1;

IMPORTANTE!!!!IMPORTANTE!!!!

O COEFICIENTE DE CORRELAÇÃO NÃO DETERMINA UMA RELAÇÃO DE CAUSA E EFEITO. É UMA MEDIDA DE TENDÊNCIA E DA FORÇA DA RELAÇÃO LINEAR ENTRE AS VARIÁVEIS X E Y.

RELAÇÃO DE CAUSA E EFEITO: MODELOS DE REGRESSÃO!

Tabelas de correlaçõesTabelas de correlações

É uma matriz de diagonal principal 1 e simétrica.

r(X,Y) = r (Y,X).

Usada com um conjunto grande de variáveis.

Tabelas de correlaçõesTabelas de correlações

Pressão (mbar)

Umidade (%)

Radiação (W/m2)

Vel. vento (m/s)

r = 0,346r = 0,346

IDADE

7060504030

Col

este

rol

500

400

300

200

100

r = - 0,486r = - 0,486

Vegetação

5,55,04,54,03,53,02,52,01,5

Mac

hos

8

6

4

2

0

-2

r = 0,788r = 0,788

Total Noite

50403020100

Tota

l Dia

70

60

50

40

30

20

10

0

Quantitativa e qualitativaQuantitativa e qualitativa

- gráficos box-plot e gráficos de médias

- os parâmetros a serem comparados são médias, medianas, desvios padrões

- fazer tabelas das medidas em cada grupo da variável qualitativa (fatores)

- em geral, a variável de estudo é a variável quantitativa

- fazer testes de hipóteses apropriados

Exemplo 1Exemplo 1

Estudar as concentrações de metais (variável quantiativa) em ostras e sururus (fator espécie) medidas em diferentes locais (fator estuário) e em diferentes períodos (fator estação)

Fator estaçãoFator estação

12061127106N =

Estação

invernooutonoverãoprimavera

Méd

ia +

- 1

Des

vio

Padr

ão -

FE

300

200

100

0

-100

Fator estaçãoFator estação

12061127106N =

Estação

invernooutonoverãoprimavera

FE600

500

400

300

200

100

0

-100

Fator espécieFator espécie

192222N =

Espécie

SUOS

Méd

ia +

- 1

Des

vio

Padr

ão -

FE

400

300

200

100

0

Fator espécieFator espécie

192222N =

Espécie

SUOS

FE600

500

400

300

200

100

0

-100

Fator estuárioFator estuário

147131126N =

Estuário

SMBUAR

Méd

ia +

- 1

Des

vio

Padr

ão -

FE

300

200

100

0

Fator estuárioFator estuário

147131126N =

Estuário

SMBUAR

FE600

500

400

300

200

100

0

-100

Exemplo 2: TartarugasExemplo 2: Tartarugas

Comparar o número de ninhos de tartarugas (variável quantitativa) em diferentes praias (variável qualitativa).

Foi realizada uma Análise de Variância para verificar se há diferença entre os Números de Ninhos nas diferentes praias.

Exemplo 2: TartarugasExemplo 2: Tartarugas

Estatísticas Descritivas

Ninho=CD

14 9,57 3,11 4 1514 5,14 2,51 2 1116 5,44 3,39 0 1116 11,50 6,03 1 2660 7,95 4,83 0 26

PNTUANTTTotal

N MédiaDesvioPadrão Mínimo Máximo

Exemplo 2: TartarugasExemplo 2: Tartarugas

16161414N =

Praias

TTANTUPN

Méd

ia +

- 1

Des

vio

Padr

ão20

10

0