Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

23
Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp

Transcript of Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Page 1: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Estatística Não Paramétrica

ANOVA de Kruskal-Wallis

Ivan Balducci FOSJC / Unesp

Page 2: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Os métodos não-paramétricos

são usados para situações que violam

as suposições dos procedimentos

paramétricos

Introdução: estatística não-paramétrica

Page 3: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Procedimentos não-paramétricos usam sinais

(indicadores de se um nº é positivo, negativo,

ou zero),

contagens, e postos (ranks) e

não usam médias e desvios padrão

Introdução: estatística não-paramétrica

Page 4: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

• Quando os dados não seguem a normal ou são

assimétricos

Quando usamos a estatística não paramétrica?

Negativa Normal Positiva

Assimetria Distribuição Assimetria

* dados na escala ordinal

* quando não há igualdade de variância (dp)

Page 5: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Suposição de Normalidade para os Testes Paramétricos

• Os testes não-paramétricos exigem poucas

suposições, por exemplo, não exigem distribuição

normal dos dados

Distribuição de QI

Page 6: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Teste de Kruskal-Wallis

• Uma alternativa não-paramétrica à ANOVA 1 fator

• Pode ser usada para analisar dados ordinais

• Não assume determinada forma da população

• Assume que os C grupos são independentes

• Assume seleção aleatória de amostras individuais

Page 7: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Exemplo: Nº de Pacientes por Dia, por Médico, em Três Categorias Organizacionais

G1

G2 G3

13 24 2615 16 2220 19 3118 22 2723 25 28

14 3317

Ho: As três populacões são idênticasHa: Pelo menos uma das três populações é diferente

Page 8: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Teste de Kruskal-Wallis

Alternativa ao teste one-way ANOVA

Ho: As k populações têm idêntica distribuições de probabilidade

Ha: pelo menos duas das populações diferem em localização

KW = ∑ - 3(n + 1)12

n(n + 1)

TTii22

nnii

kk

i = 1i = 1

Rejeita Ho se KW é “grande”

Page 9: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

KW (ou K ou H) é a estatística do teste

1- = df with ,

group ain items ofnumber =

group ain ranks of total

items ofnumber total=

groups ofnumber = :

131

12

2

j

j

1

2

T

CχK

n

n

Cwhere

nnn

KC

j j

j

nT

Page 10: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

G1 G2 G313 24 2615 16 2220 19 3118 22 2723 25 28

14 3317

Ho: As três populacões são idênticas

Ha: Pelo menos uma das três populações é diferente

0 05

1 3 1 2

5 991

599105 2

2

.

.

. ,. ,

df C

KIf reject H .o

Exemplo: Nº de Pacientes por Dia por Médico em Três Categorias Organizacionais

Page 11: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Dados: Pacientes por Dia

Cálculos Preliminares

n = n1 + n2 + n3 = 5 + 7 + 6 = 18

Two

Partners

Three or

More

Partners HMO

Patients Rank Patients Rank Patients Rank

13 1 24 12 26 14

15 3 16 4 22 9.5

20 8 19 7 31 17

18 6 22 9.5 27 15

23 11 25 13 28 16

14 2 33 18

17 5

T1 = 29 T2 = 52.5 T3 = 89.5

n1 = 5 n2 = 7 n3 = 6

Page 12: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Kn n

nj

jj

C Tn

12

13 1

12

18 18 1 5 7 63 18 1

12

18 18 11897 3 18 1

9 56

2

1

2 2 229 525 895. .

,

.

.Hreject ,991.556.9

991.5

o

2

2,05.

K

Dados: Pacientes por Dia Cálculos Preliminares

Page 13: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Exemplo do com dados

(ranks = postos) iguais

(empates)

Cálculo da estatística H do teste de

Kruskal-Wallis na presença de empates

ANOVA de Kruskal-Wallis

Page 14: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Teste de Kruskal-Wallis com tied ranks• Example 10.11 (Zar, 1999) – comparison of pH among 4 ponds

Pond 1 Pond 2 Pond 3 Pond 4pH pH pH pH

7.68 7.71 7.74 7.717.69 7.73 7.75 7.717.70 7.74 7.77 7.747.70 7.74 7.78 7.797.72 7.78 7.80 7.817.73 7.78 7.81 7.857.73 7.80 7.84 7.877.76 7.81 7.91

Ho: As quatro populacões são idênticasHa: Pelo menos uma das quatro populações é diferente

Page 15: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Teste de Kruskal-Wallis com tied ranks

Pond 1 Pond 2 Pond 3 Pond 4pH Rank pH Rank pH Rank pH Rank

7.68 1 7.71 6 7.74 13.5 7.71 67.69 2 7.73 10 7.75 16 7.71 67.70 3.5 7.74 13.5 7.77 18 7.74 13.57.70 3.5 7.74 13.5 7.78 20 7.79 227.72 8 7.78 20 7.80 23.5 7.81 267.73 10 7.78 20 7.81 26 7.85 297.73 10 7.80 23.5 7.84 28 7.87 307.76 17 7.81 26 7.91 31

Totaln 8 8 7 8 31

Sum R 55 132.5 145 163.5 496R^2/n 378.1 2194.5 3003.6 3341.5 8917.8

Ho: As quatro populacões são idênticasHa: Pelo menos uma das quatro populações é diferente

Page 16: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Teste de Kruskal-Wallis com tied ranks

N = 8 + 8 + 7 + 8 = 31

H = {12/[N(N + 1)]} (Ri2/ni) - 3(N + 1)

H = {12/[31(31 + 1)]} (8917.8) - 3(31 + 1) = 11.876

Número de grupos de tied ranks = m = 7

Pond 1 Pond 2 Pond 3 Pond 4pH Rank pH Rank pH Rank pH Rank

7.68 1 7.71 6 7.74 13.5 7.71 67.69 2 7.73 10 7.75 16 7.71 67.70 3.5 7.74 13.5 7.77 18 7.74 13.57.70 3.5 7.74 13.5 7.78 20 7.79 227.72 8 7.78 20 7.80 23.5 7.81 267.73 10 7.78 20 7.81 26 7.85 297.73 10 7.80 23.5 7.84 28 7.87 307.76 17 7.81 26 7.91 31

Totaln 8 8 7 8 31

Sum R 55 132.5 145 163.5 496R^2/n 378.1 2194.5 3003.6 3341.5 8917.8

Page 17: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Teste de Kruskal-Wallis com tied ranks

Number of groups of tied ranks = m = 7

T = (ti3 - ti) = (23 - 2) + (33 - 3) + (33 - 3) + (43 - 4) + (33 - 3) + (23 - 2)

+ (33 - 3) = 168

T = (ti3 - ti) = 168

C = 1 - T / (N3 - N) = 1 - (168/ (313 - 31)) = 0.9944

Hc = H / C = 11.876 / 0.9944 = 11.943

Fator de Correção = C = 1 - T / (N3 - N)

H corrigido = H calculado / C

Page 18: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Teste de Kruskal-Wallis com tied ranks

Number of groups of tied ranks = m = 7

T = (ti3 - ti) = (23 - 2) + (33 - 3) + (33 - 3) + (43 - 4) + (33 - 3) + (23 - 2)

+ (33 - 3) = 168

C = 1 - T / (N3 - N) = 1 - (168/ (313 - 31)) =0.9944

Hc = H/C = 11.876/ 0.9944 = 11.943

= k - 1 = 4 -1 = 3

2 0.05, 3 = 7.815 < 11.943 = 0.01

rejeita Ho (Tabela Qui-quadrado)

Fator de Correção = C = 1 - T / (N3 - N)

H corrigido = H calculado / C

Page 19: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Não preocupemo-nos com os empates.

Porque os programas de computador (Minitab, por exemplo) já calculam

E, também, porque há equivalência com o teste ANOVA paramétrica efetuada com os dados

transformados

Calculamos ANOVA on rank data daí obtemos o valor de F que designamos por Fr

H corrigido = Fr(N-1) / [Fr + (N-K) / (K – 1) ]

K = número de grupos ; N = tamanho total da amostra

Page 20: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Não preocupemo-nos com os empates

Há equivalência com o teste ANOVA paramétrica efetuada com os dados transformados

Calculamos ANOVA on rank data daí obtemos o valor de F que designamos por Fr

Fr = [H calculado / (K-1) ] / [(N – 1 – H) / (N – K)]

Ao obtermos Fr, se aplicarmos a fórmula acima, então, obtemos H corrigido

Page 21: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Há equivalência entre KRUSKAL-WALLIS com o teste ANOVA paramétrica efetuada com os

dados transformados

Calculamos ANOVA on rank data daí obtemos o valor de F que designamos por Fr

Fr = [H calculado / (K-1) ] / [(N – 1 – H) / (N – K)]

H corrigido = Fr(N-1) / [Fr + (N-K) / (K – 1) ]

ou

Page 22: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Vale a pena ler:

W.J. CONOVER and R. L. IMAN –

Rank Transformations as a Bridge Between Parametric

and

Nonparametric Statistics

The American Statistician. vol. 35, nº 3, p.124-129, 1981.

Conclusão: são equivalentes os testes:

de Kruskal-Wallis e o ANOVA on rank data

Page 23: Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.

Paramétrico

ANOVA on rankEquivalência entre

os testes

Termos que devem ser familiares

Não Paramétrico

Kruskal-Walliscorreção devido a empates