BIOESTATÍSTICA · X Sumário 3.3. COMPARAÇÃO DE DOIS GRUPOS DEPENDENTES, 43 3.3.1. Grupos...

24
X Y BIOESTATÍSTICA Testes não paramétricos, Testes diagnósticos, Medidas de Associação e Concordância. TÓPICOS AVANÇADOS SONIA VIEIRA 4ª EDIÇÃO

Transcript of BIOESTATÍSTICA · X Sumário 3.3. COMPARAÇÃO DE DOIS GRUPOS DEPENDENTES, 43 3.3.1. Grupos...

X

Y

BIOESTATÍSTICA

Testes não paramétricos, Testes diagnósticos, Medidas de Associação e Concordância.

TÓPICOS AVANÇADOS

SONIA VIEIRA

4 ª E D I Ç Ã O

4

4

Sonia VieiraDoutora em Estatística pela USP

Livre-docente em Bioestatística pela Unicamp

Pós-doutorado em Estatística na Universidade da Califórnia, Berkeley, Califórnia

Pós-doutorado em Estatística na Universidade Yale, New Haven, Connecticut

Pós-doutorado em Ética na Schloss Leopoldskron, Innsbruck, Áustria

© 2018 Elsevier Editora Ltda.Todos os direitos reservados e protegidos pela Lei 9.610 de 19/02/1998.Nenhuma parte deste livro, sem autorização prévia por escrito da editora, poderá ser reproduzida ou transmitida sejam quais forem os meios empregados: eletrônicos, mecânicos, fotográficos, gravação ou quaisquer outros.

ISBN: 978-85-352-8981-7ISBN versão eletrônica: 978-85-352-8982-4

Capa Monika Mayer e Luciana Mello

Editoração EletrônicaRosane Guedes

Elsevier Editora Ltda.Conhecimento sem Fronteiras Rua da Assembleia, nº 100 – 6º andar – Sala 601 20011-904 – Centro – Rio de Janeiro – RJ Rua Quintana, nº 753 – 8º andar04569-011 – Brooklin – São Paulo – SP Serviço de Atendimento ao Cliente0800 026 53 [email protected] Consulte nosso catálogo completo, os últimos lançamentos e os serviços exclusivos no site www.elsevier.com.br

NOTAEsta obra foi produzida por Elsevier Brasil Ltda. sob sua exclusiva responsabilidade. Médicos e pesquisadores devem sempre fundamentar-se em sua experiência e no próprio conhecimento para avaliar e empregar quaisquer informações, métodos, substâncias ou experimentos descritos nesta publicação. Devido ao rápido avanço nas ciências médicas, particularmente, os diagnósticos e a posologia de medicamentos precisam ser verificados de maneira independente. Para todos os efeitos legais, a Editora, os autores, os editores ou colaboradores relacionados a esta obra não assumem responsabilidade por qualquer dano/ou prejuízo causado a pessoas ou propriedades envolvendo responsabilidade pelo produto, negligência ou outros, ou advindos de qualquer uso ou aplicação de quaisquer métodos, produtos, instruções ou ideias contidos no conteúdo aqui publicado.

CIP-BRASIL. CATALOGAÇÃO NA PUBLICAÇÃO SINDICATO NACIONAL DOS EDITORES DE LIVROS, RJ

V718b 4. ed. Vieira, Sonia, 1942- Bioestatística : tópicos avançados / Sonia Vieira. - 4. ed. - Rio de Janeiro : Elsevier, 2018. : il. ; 24 cm. Inclui bibliografia ISBN 9788535289817 1. Bioestatística. I. Título. 18-50011 CDD: 570.15195 CDU: 57.087.1

Meri Gleice Rodrigues de Souza - Bibliotecária CRB-7/6439 24/05/2018 01/06/2018

Escribo como un loco para no volverme loco.Leonardo Padura

Prefácio

Com a popularização dos computadores, as estatísticas passaram a fa-zer parte do vocabulário da área da saúde. Quem lê artigos nessa área já ou-viu falar em testes não paramétricos, fator de risco, razão de chances e testes diagnósticos. Não basta, porém, que o profissional de saúde tenha “ouvido falar” de Bioestatística; é preciso que adquira visão adequada sobre o assun-to, entendendo, por exemplo, o que um programa de computador pode fazer por ele – sem expectativas excessivas.

Este livro é, basicamente, uma continuação do livro Introdução à Bio-estatística. Por essa razão, tanto pode ser útil para quem está estudando Es-tatística como pode ser útil para profissionais que atuem como consultores nas diferentes áreas de saúde. A falta de literatura em português sobre alguns dos temas tratados aqui também pode ser uma motivação para a leitura.

Mas escrever um livro não é tarefa fácil. Precisei da ajuda de pessoas di-ferentes, que me ajudaram de maneiras diferentes. Quero, portanto, agrade-cer à minha amiga Martha Maria Mischan, que muito sabe sobre Estatística. Ela leu os manuscritos e apontou erros, com maestria e cordialidade. Outras pessoas também me ajudaram: William Saad Hossne fez a apresentação da obra com a disposição de quem sempre esteve pronto a me ajudar, José Edu-ardo Corrente respondeu às minhas muitas perguntas e Gláucia Melo gentil-mente acertou as minhas referências. Também devo agradecimentos a meu filho, Márcio Vieira Hoffmann, que sempre me ajudou.

Mas meus maiores agradecimentos são para todo o pessoal da Elsevier Editora, pelo apoio constante ao meu trabalho. Agradeço, ainda, aos muitos professores e colegas que propiciaram o ambiente para que eu pudesse es-crever. No entanto, um professor e escritor não existe sem seus alunos e seus leitores. Devo, portanto, enorme agradecimento a quem me lê.

A autora

Sumário

Capítulo 1DADOS, VARIÁVEIS E OUTROS TERMOS, 1

INTRODUÇÃO, 31.1 DADOS E VARIÁVEIS, 31.2 CUIDADOS NO REGISTRO DOS DADOS, 5

1.2.1. Dados nominais e ordinais, 51.2.2. Dados discretos e dados contínuos, 7

1.3 DADOS DISCREPANTES, PERDIDOS E CENSURADOS, 71.4. DADOS UNIVARIADOS E DADOS BIVARIADOS, 10RESUMO E OBJETIVO DO CAPÍTULO, 101.5. EXERCÍCIOS, 11

Capítulo 2TESTES ESTATÍSTICOS, 13

2.1. DECIDINDO SOBRE AS HIPÓTESES, 162.2. MEDINDO A INCERTEZA, 18

2.2.1. Calculando o p-valor, 182.2.2. Apresentando o nível de significância, 192.2.3. Avaliando o poder do teste, 20

2.3. TESTES UNILATERAIS E BILATERAIS, 212.4. TESTES PARAMÉTRICOS E NÃO PARAMÉTRICOS, 22

2.4.1. Algumas indicações, 24RESUMO E OBJETIVO DO CAPÍTULO, 252.5. EXERCÍCIOS, 26

Capítulo 3TESTES NÃO PARAMÉTRICOS PARA COMPARAR DOIS GRUPOS, 29

3.1. POSTOS EM LUGAR DE DADOS, 313.2. COMPARAÇÃO DE DOIS GRUPOS INDEPENDENTES, 33

3.2.1. Grupos independentes, 333.2.2. Teste de Mann-Whitney, 343.2.3 Teste da mediana, 40

X Sumário

3.3. COMPARAÇÃO DE DOIS GRUPOS DEPENDENTES, 433.3.1. Grupos dependentes, 433.3.2. Teste dos postos assinalados de Wilcoxon, 443.3.3. Teste do sinal, 52

RESUMO E OBJETIVO DO CAPÍTULO, 553.4. EXERCÍCIOS, 56

Capítulo 4TESTES NÃO PARAMÉTRICOS PARA COMPARAR MAIS DE DOIS GRUPOS, 63

4.1. COMPARAÇÃO DE MAIS DE DOIS GRUPOS INDEPENDENTES, 654.1.1. Teste de Kruskal-Wallis, 65

4.1.1.1.Teste de Dunn para comparações múltiplas, 744.1.2.Teste das medianas, 76

4.2. COMPARAÇÃO DE MAIS DE DOIS GRUPOS DEPENDENTES, 784.2.1.Teste de Friedman, 78

4.2.1.1. Teste de Dunn para comparações múltiplas, 82RESUMO E OBJETIVO DO CAPÍTULO, 834.3. EXERCÍCIOS, 85

Capítulo 5TABELAS 2 × 2, 91

5.1. TESTE DE �2 DE PEARSON, 995.1.1. Correção de continuidade, 101

5.2. TESTE DE PROPORÇÕES POPULACIONAIS, 1025.2.1. Correção de continuidade, 104

5.3. TESTE EXATO DE FISHER, 1055.4. TESTE DE MCNEMAR, 111

5.4.1.Correção de continuidade, 113RESUMO E OBJETIVO DO CAPÍTULO, 1145.5. EXERCÍCIOS, 115

Capítulo 6TABELAS 2 × S, 119

6.1. TESTE DE �2 DE PEARSON, 1216.1.1. Exigências Teóricas para Aplicação do Teste de �2, 1236.1.2. Algumas questões teóricas, 1246.1.3. Graus de liberdade, 1246.1.4. Frequências esperadas, 125

6.2. PARTIÇÃO DAS TABELAS 2 × S, 1266.3. PROCEDIMENTO DE MARASCUILO, 1296.4. TESTE DE �2 DE MANTEL-HAENSZEL, 1316.5. TESTE DE �2 PARA TENDÊNCIA, 135RESUMO E OBJETIVO DO CAPÍTULO, 1386.6. EXERCÍCIOS, 139

Sumário XI

Capítulo 7MEDIDAS DE ASSOCIAÇÃO E CORRELAÇÃO DE SPEARMAN, 145

7.1. MEDIDAS DE ASSOCIAÇÃO EM TABELAS 2 × 2, 1477.1.1. Coeficiente FI, 1477.1.2. Coeficiente Gama, 1507.1.3. Razão de chances, 1527.1.4. Risco relativo, 159

7.2. MEDIDAS DE ASSOCIAÇÃO NAS TABELAS R × S, 1617.2.1. Coeficiente FI, 1617.2.2. Coeficiente de contingência de Pearson, 1627.2.3. Coeficiente de Cramér, 163

7.3. COEFICIENTE DE CORRELAÇÃO DE SPEARMAN, 163RESUMO E OBJETIVO DO CAPÍTULO, 1677.4. EXERCÍCIOS, 168

Capítulo 8OUTRAS ESTATÍSTICAS, 173

8.1. TESTES DIAGNÓSTICOS, 175Cuidados no levantamento de dados para o estudo de testes diagnósticos, 178Valores preditivos, 179Razão de verossimilhanças, 181

8.2. NÚMERO NECESSÁRIO TRATAR (NNT), 1828.3. CONCORDÂNCIA ENTRE EXAMINADORES, 1858.4. ALFA DE CRONBACH, 188RESUMO E OBJETIVO DO CAPÍTULO, 1928.5. EXERCÍCIOS, 193

APÊNDICE, 197

RESPOSTAS DOS EXERCÍCIOS, 211CAPÍTULO 1, 213CAPÍTULO 2, 213CAPÍTULO 3, 215CAPÍTULO 4, 218CAPÍTULO 5, 221CAPÍTULO 6, 224CAPÍTULO 7, 229CAPÍTULO 8, 230

GLOSSÁRIO, 233

ÍNDICE REMISSIVO, 245

Testes não Paramétricos para Comparar Dois Grupos

Capítulo 3 Testes não Paramétricos para Comparar Dois Grupos 31

Neste Capítulo são apresentados testes não paramétricos indicados para comparar dois grupos independentes ou dependentes, nos casos em que a variável em análise é ordinal ou é numérica.

3.1. POSTOS EM LUGAR DE DADOSOs estudos de estatística se iniciam com os cálculos de médias e desvios padrão de dados coletados. Alguns dos testes não paramétricos mais conhe-cidos são, porém, aplicados não aos dados coletados, mas aos postos dos dados. Embora muitas pessoas aprendam a fazer esses testes (ou, simples-mente, utilizem um programa de computador), ainda é difícil deixar de olhar para as médias dos dados originais. No entanto, alguns dos testes que vamos ver neste Capítulo, e no Capítulo 4, fazem inferência com base nos postos dos dados – e são os postos que devem ser comparados.

Vamos ver como se obtêm os postos. Comece colocando os n dados ob-servados em ordem crescente. Depois, atribua um número de ordem a cada dado observado. Esse número é o posto,1 indicado por R. O menor posto é 1 e o maior posto é n.

Exemplo 3.1

Logo após cirurgia para extração de um dente, oito pessoas deram notas de 0 a 10 à atenção que receberam do cirurgião-dentista. As notas foram: 7,5; 6; 5,5; 8; 9,5; 6,5; 4,5; 9. Para conferir postos, coloque as notas em ordem crescente. Depois atribua um número de ordem a cada nota. Esse número é o posto.

Posto, segundo a nota conferida em uma pesquisa de satisfação

Nota Posto

4,5 1

5,5 2

6 3

6,5 4

7,5 5

8 6

9 7

9,5 8

Podem ocorrer dados com o mesmo valor. Chamamos isso de empate.2 Valores empatados devem receber o mesmo posto, mas faça assim: escreva 1 Posto é a tradução para a palavra inglesa rank. Daí, o uso da letra R para indicar posto. Alguns estatísticos traduzem rank por ranque e usam a palavra ranquear para dizer conferir postos.2 Em inglês, tie.

32 Bioestatística – Tópicos Avançados

os dados em ordem crescente e atribua aos dados, mesmo que empatados, postos diferentes. Depois, calcule a média dos postos ocupados pelos valores empatados. Essa média será o posto dos valores empatados.

Exemplo 3.2

Logo após uma cirurgia para extração de dente, oito pessoas deram notas de 0 a 10 à atenção que receberam do cirurgião-dentista: 7,5; 6; 5,5; 8; 9,5; 6; 4,5; 9. Para conferir postos às notas, coloque as notas em ordem crescente e atribua um número de ordem a cada nota. As notas em negrito constituem empate. Elas receberam postos 3 e 4. A média desses números é 3,5. Este é o posto desses dois empates.

Posto, segundo a nota conferida em uma pesquisa de satisfação

Dado Posto

4,5 1

5,5 2

6,0 3,5

6,0 3,5

7,5 5

8,0 6

9,0 7

9,5 8

Se o número de empates for pequeno, a solução apresentada aqui para tratar os empates é satisfatória.3

Dica: se você estiver fazendo cálculos à mão, ou se a amostra for grande e os empates forem muitos, verifique as contas. É fácil: haja ou não empates, você terá sempre:

2

1+×=∑nnR (3.1)

Exemplo 3.3

Para o Exemplo 3.2, a soma dos postos é:

� �R = 1 + 2 + 3,5 + 3,5 + 4 + 5 + 6 + 7 + 8 = 36

3 Se mais de um terço dos dados estiver envolvido em tais empates, é preciso buscar outra solução. Veja LEHMANN, E.L. Nonparametrics: Statistical Methods Based on Ranks. San Francisco: Holden Day, 1975. CONOVER, W.J. Practical Nonparametric Statistics. 2nd ed. Nova York: Wiley, 1980. GIBBONS, J. D. Nonparametric statistics: an introduction. Newbury Park: Sage Publications, 1993.

Capítulo 3 Testes não Paramétricos para Comparar Dois Grupos 33

Como n = 8:

362

188

2

1 =+×=+× nn

Para os dados do Exemplo 3.2, a igualdade (3.1) está verificada.

3.2. COMPARAÇÃO DE DOIS GRUPOS INDEPENDENTES3.2.1. Grupos independentes

Dois grupos de dados são independentes se as unidades de um deles não têm relação com as unidades do outro.

Exemplo 3.4

Para testar a eficácia de uma nova droga para reduzir a pressão arterial, uma in-dústria farmacêutica fez o seguinte ensaio: recrutou voluntários que tinham pressão arterial alta e mediu a pressão arterial de cada um deles no início do ensaio. Depois os dividiu aleatoriamente em dois grupos. Um grupo, denominado tratado, recebeu a droga em teste e o outro grupo, denominado controle, recebeu o tratamento con-vencional. No final do ensaio, a pressão arterial de cada voluntário foi novamente medida. Calculou-se, então, a diferença entre a pressão no final do ensaio e a pressão no início, o que resultou em dois grupos independentes de dados.

Figura 3.1 – Dados independentes.

Amostra de pacientes voluntários com pressão arterial alta

Mede-se a pressão arterial de cada paciente que inicia o tratamento

Mede-se a pressão arterial de cada

Calcula-se a diferença entre pressão

Diminuição da pressão arterial

Diminuição da pressão arterial

Grupo tratado Grupo controle

Divide-se a amostra de pacientes ao acaso

em dois grupos

34 Bioestatística – Tópicos Avançados

3.2.2. Teste de Mann-Whitney

O teste de Mann-Whitney é também conhecido como teste U de Mann-Whitney, teste de Wilcoxon-Mann-Whitney, teste dos postos somados de Wilcoxon.

Indicação: O teste de Mann-Whitney é indicado para comparar dois grupos independentes, como homens e mulheres, tratado e controle, empregado e desempregado. Recomenda-se que as amostras tenham tamanhos n1 � 5 e n2 � 5. A variável em análise deve ser ordinal (como escala visual analógica ou itens de uma escala Likert) ou contínua (como peso, tempo, QI). As observa-ções devem ser independentes, isto é, as unidades de um grupo não devem estar relacionadas com as unidades do outro grupo nem devem estar relacio-nadas entre si. A hipótese em teste é a de que postos dos dois grupos têm a mesma distribuição.4 Portanto, o teste de Mann-Whitney não testa a hipótese de igualdade de médias da variável em estudo.

Para fazer o teste de Mann-Whitney e comparar dois grupos, 1 e 2, com n1 e n2 de dados, respectivamente:

Primeiro passo: Estabeleça as hipóteses e o nível de significância.H0: os postos dos dois grupos têm a mesma distribuição.H1: os postos dos dois grupos têm distribuições diferentes.

Segundo passo: Denomine Grupo 1 o grupo com o menor número de dados. Se n1 = n2, denomine Grupo 1 o grupo com a menor soma de postos. Faça n1 + n2 = n.

Terceiro passo: Junte os dois grupos em um só conjunto de dados, sem per-der a identificação dos grupos. Ordene os dados e atribua postos a eles. Se houver empates, atribua aos valores iguais a média de seus postos, como já foi visto.

Quarto passo: Calcule a soma dos postos atribuídos aos dados do Grupo 1, isto é, �R1; calcule a soma dos postos atribuídos aos dados do Grupo 2, isto é, �R2.Verifique:

2

121

+×=∑+∑nnRR (3.2)

Quinto passo: Calcule a estatística U de Mann-Whitney:

( )

⎥⎦⎤

⎢⎣⎡ +

−∑=2

1111

nnRU (3.3)

Sexto passo: Se a amostra for de tamanho n > 30 e houver poucos empates, calcule:

4 Em termos mais técnicos, o teste de Mann-Whitney é indicado para testar a hipótese de que as amostras provêm de populações tais que a probabilidade de uma observação, tomada ao acaso de uma popula-ção, ser maior do que outra observação tomada ao acaso da outra população é de 0,5.

Capítulo 3 Testes não Paramétricos para Comparar Dois Grupos 35

( )

12

12

2121

21

++

−=

nnnn

nnUz (3.4)

Sétimo passo: Compare o valor calculado de z com o valor crítico dado na tabela de distribuição normal padronizada (Tabela 1 do Apêndice), no nível estabelecido de significância.5 Rejeite a hipótese da nulidade toda vez que o valor calculado de z for igual ou maior do que o valor crítico. Se estiver usan-do um programa de computador, você obterá o p-valor associado ao menor valor da estatística U.

Oitavo passo: Compare as medianas (ou as médias) dos postos dos dois grupos.

Exemplo 3.5Foi conduzido um ensaio clínico para avaliar a eficácia de uma nova terapia antirre-troviral para pacientes com HIV.6 Trinta pacientes foram divididos aleatoriamente em dois grupos de mesmo tamanho: o controle, que recebeu terapia antirretroviral padrão, e o tratado, que recebeu a nova terapia antirretroviral. Os dois grupos foram monitorados por 3 meses. O resultado primário é a carga viral, relatada como núme-ro de cópias de HIV por mililitro de sangue. Os dados estão na Tabela 3.1.

Tabela 3.1 – Carga viral de pacientes com HIV segundo o grupo

Grupo

Terapia padrão Nova terapia

7.500 400

8.000 250

2.000 800

550 1.400

1.250 8.000

1.000 7.400

2.250 1.020

6.800 6.000

3.400 920

6.300 1.420

9.100 2.700

970 4.200

1.040 5.200

670 4.100

400 (1)Dado censurado: foi obtido, mas o valor estava abaixo do limite mínimo para as medições do aparelho.

5 Para estudar distribuição normal, veja: VIEIRA, S. Introdução à Bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016.6 Mann Whitney U Test (Wilcoxon Rank Sum Test) Disponível em: http://sphweb.bumc.bu.edu/otlt/mph-modules/bs/bs704_nonparametric/BS704_Nonparametric4.html. Acesso em 27 de outubro de 2017.

36 Bioestatística – Tópicos Avançados

Primeiro passoH0: os postos dos dois grupos têm a mesma distribuição.

H1: os postos dos dois grupos têm distribuições diferentes.

Nível de significância � = 0,05.

Segundo passo: Denomine como Grupo 1 o grupo que recebeu a nova terapia e como Grupo 2 o que recebeu a terapia padrão, porque n1 = 14 < n2 = 15.

Terceiro passo: Atribua postos aos dados.

Tabela 3.2 – Carga viral de pacientes com HIV segundo o grupo (Tabela auxiliar)

Grupo1 (Nova terapia) 2 (Terapia padrão)Dado Posto Dado Posto250 1 400 2,5 400 2,5

550 4 670 5

800 6920 7

970 8 1.000 9

1.020 10 1.040 11 1.250 12

1.400 131.420 14

2.000 15 2.250 16

2.700 17 3.400 18

4.100 194.200 205.200 216.000 22

6.300 23 6.800 24

7.400 25 7.500 26

8.000 27,5 8.000 27,5 9.100 29 205 230

Capítulo 3 Testes não Paramétricos para Comparar Dois Grupos 37

Quarto passo: Calcule a soma dos postos atribuídos aos dados dos dois grupos e verifique os cálculos usando a fórmula (3.2):

2=

205 + 230 = 29 ×29 + 1

2= 435

Quinto passo: Calcule a estatística U de Mann-Whitney; uma vez que n1 < n2 e R1 < R2. Use a fórmula (3.3):

14 14 + 1

2= 205 − 105 = 100

( )⎥⎦⎤

⎢⎣⎡ +

−∑=2

1111

nnRU

Sexto passo: A amostra tem tamanho 29, com poucos empates. Na verdade a amostra deveria ser maior do que 30. Estamos no limite. Mesmo assim, vamos usar a estatísti-ca z, com distribuição que se aproxima da normal padronizada. Então, calcule:

( )12

12

2121

21

++

−=

nnnn

nnUz

100 −14 × 15

2

14 × 15 × 14 + 15 + 112

= −5

√525= −0,218218

Sétimo passo: Na tabela de distribuição normal padronizada, no nível de significância de 5% para um teste bilateral, encontra-se o valor crítico 1,959964. O p-valor é 0,827259. Portanto, não se rejeita a hipótese de que não há diferença entre as duas terapias.

Empates – Fique atento aos empates. Considere:1. Se a amostra for grande, um número moderado de empates não muda

muito o resultado, principalmente se os empates ocorrerem no mes-mo grupo. Pode haver perda de poder estatístico se os empates ocor-rerem em grupos distintos.

2. Quando os empates são muitos, é preciso fazer uma correção na fór-mula7 que dá o valor de U. A fórmula com correção não é dada neste livro, mas os programas para computador fazem, automaticamente, a correção.

7 Veja:LEHMANN, E.L. Nonparametrics: Statistical Methods Based on Ranks. San Francisco: Holden Day, 1975.CONOVER, W.J. Practical Nonparametric Statistics. 2nd ed. Nova York: Wiley, 1980.GIBBONS, J. D. Nonparametric statistics: an introduction. Newbury Park: Sage Publications, 1993.HOLLANDER, M.; WOLFE, D.A. Nonparametric Statistics Methods. Nova York: Wiley, 1973.

38 Bioestatística – Tópicos Avançados

Amostras pequenas: Quando as amostras são pequenas, a dis-tribuição da variável z não se aproxima, satisfatoriamente, da distribuição normal padronizada. Se n1 15 e n2 15, não use, na sua pesquisa, a apro-ximação normal, ou seja, não calcule o valor de z como indicado na fór-mula (3.4) do sétimo passo. Use a Tabela 3 do Apêndice, que dá os valores críticos de �R1 para alguns níveis de significância. Veja como se usa essa tabela.

a) Se a hipótese alternativa (H1) for a de que a distribuição dos dados no grupo 1 é diferente da distribuição dos dados no Grupo 2, encontre, na Tabela 3 do Apêndice, o par de valores que está na coluna enca-beçada com nível de significância �/2. Por exemplo, se você adotou o nível de significância de 0,05, busque a coluna correspondente a 0,025. Rejeite a hipótese da nulidade se �R1 for igual ou menor do que o menor número ou igual ou maior do que o maior número do par.

b) Se a hipótese alternativa (H1) for a de que a soma dos postos do gru-po 1 é menor do que o Grupo 2, encontre, na Tabela 3 do Apêndice, o par de valores que está na coluna correspondente ao nível de sig-nificância �. Rejeite a hipótese da nulidade se �R1 for igual ou menor do que o menor número do par.

c) Se a hipótese alternativa (H1) for a de que a soma dos postos do Gru-po 1 é maior do que o Grupo 2, encontre, na Tabela 3 do Apêndice, o par de valores que está na coluna correspondente ao nível de sig-nificância �. Rejeite a hipótese da nulidade se �R1 for igual ou maior do que o maior número do par.

Exemplo 3.6

Para definir a temperatura ambiente nos laboratórios de uma instituição, foram entrevistados nove técnicos de um dos laboratórios: quatro homens e cinco mulhe-res. Pediu-se a essas pessoas que apontassem a temperatura mais confortável, mas alguém levantou a hipótese de que homens apreciam temperaturas mais baixas. Os dados foram, então, anotados separadamente para cada sexo. Pressupondo que as respostas sejam de uma amostra representativa da população de técnicos dessa instituição, você diria que a temperatura mais confortável para homens tem a mes-ma distribuição da temperatura mais confortável para mulheres? Para responder a essa pergunta, é preciso fazer um teste estatístico – e o teste indicado aqui é o de Mann-Whitney – porque os dois grupos são independentes e a amostra é muito pequena.

Capítulo 3 Testes não Paramétricos para Comparar Dois Grupos 39

Temperatura ambiente em graus centígrados, definida como mais confortável segundo o sexo

Sexo

Homem Mulher

20 24

18 26

23 21

19 22

25

Primeiro passoHipótese da nulidade: a variável tem igual distribuição nos dois grupos.

Hipótese alternativa: homens preferem temperaturas mais baixas.

Nível de significância � � ����

Segundo passo: Denomine como Grupo 1 o grupo de homens e Grupo 2 o grupo de mulheres, porque n1 = 4 < n2 = 5.

Terceiro passo: Atribua postos aos dados. Não há empates.

Temperatura ambiente em graus centígrados, definida como mais confortável segundo o sexo (Tabela auxiliar: postos)

Sexo

Homem Mulher

Temperatura Posto Temperatura Posto

20 3 24 7

18 1 26 9

23 6 21 4

19 2 22 5

25 8

Quarto passo: Calcule as somas dos postos do Grupo 1 e do Grupo 2.

� �R1 = 3 + 1 + 6 + 2 = 12� �R2 = 7 + 9 + 4 + + 5 + 8 = 33

Verifique os cálculos usando a fórmula (3.1):

452

1993312

2

121 =+×=+=+×=∑+∑

nnRR

Quinto passo: A amostra é muito pequena. A distribuição da estatística U não se aproxima da normal padronizada – embora o resultado com essa aproximação apa-reça nas saídas de programas de computador. Procure, então, na Tabela 3 do Apên-dice os valores críticos para �R1. Para um teste unilateral com � = 0,05, você deve

40 Bioestatística – Tópicos Avançados

olhar na coluna de 0,05. Lembre que n1 = 4 e n2 = 5. Os valores críticos são 12-28. O valor calculado de �R1 é 12. A diferença entre grupos é, portanto, significante no nível de 5%.

Sexto passo: A média dos postos para o Grupo 1 (homens) é 3; a média dos postos para o Grupo 2 (mulheres) é 8,25. A temperatura ambiente que homens consideram confortável é menor que a temperatura ambiente que mulheres consideram confor-tável. Essa diferença é significante no nível de 5%.

Se você usar o programa Statistica8 vai obter resultados que precisam ser bem examinados (toda saída de computador deve ser estudada antes de se chegar a uma conclusão). O valor de z (não ajustado para empates) é igual ao valor de z ajustado porque não houve empates. O p-valor é não significante para um teste bilateral. No entanto, a proposta é proceder a um teste unilateral. Então, p-valor é 0,031746, portanto significante. No entanto, o valor calculado de z não tem distribuição que possa ser considerada apro-ximadamente normal padronizada.

Mann-Whitney U Test

By variable SEXO

Group 1: H Group 2: M

Rank SumRank

SumZ Valid N Valid N 2*1sided

Group H Group M U Z p-level adjusted p-level Group H GroupM exact p

TEMPERAT 12 33 2 -1,96 0,05005 -1,9596 0,05005 4 5 0,06349

Você pode – e deve – usar um programa de computador para fazer os cálculos. No entanto, os pesquisadores precisam saber interpretar os resul-tados. Nas saídas dos programas podem aparecer diversas estatísticas – e é bom saber que nem todas devem ser usadas –, por isso é preciso fazer op-ções, mas com conhecimento de causa. Os programas em geral fornecem, no caso do teste de Mann-Whitney, as somas dos postos, as estatísticas de teste com e sem correção para empates com os respectivos p-valores e – às vezes – o p-valor obtido da normal padronizada, mesmo para amostras pequenas. Fique atento.

3.2.3. Teste da mediana

Indicação: O teste da mediana deve ser aplicado para testar a hipótese de que dois grupos independentes provieram de populações com a mesma mediana. É particularmente indicado quando existem dados censurados. Tem menor poder do que o teste de Mann-Whitney.

8 6 Statsoft, Inc. 2300 East 14 th Street, Tulsa, OK 74104, USA.

Capítulo 3 Testes não Paramétricos para Comparar Dois Grupos 41

Veja como se faz o teste:

Primeiro passo: Estabeleça as hipóteses e o nível de significância.

Segundo passo: Junte os grupos, com n1 e n2 dados, em um só conjunto de n1 + n2 = n dados. Calcule a mediana desse conjunto único de dados.

Terceiro passo: Conte o número de dados iguais ou menores do que a mediana e o número de dados maiores do que a mediana nos dois grupos. Arranje as contagens em tabela 2 × 2, como mostra o esquema.

DadosGrupo

1 2Menores ou iguais à mediana Maiores do que a mediana

Quarto passo: Sob a hipótese de que os dois grupos provêm de populações com a mesma mediana, metade dos dados de cada grupo deve ser igual ou menor do que a mediana e metade deve ser maior do que a mediana. Aplique o teste de 2 para testar essa hipótese.9

Exemplo 3.7

Para testar a hipótese de que desencorajar pessoas afeta o rendimento delas em um teste de inteligência, 40 estudantes foram divididos ao acaso em dois grupos, o con-trole e o tratado.10 Todos eles fizeram a primeira parte de um teste de inteligência. Duas semanas depois, os mesmos estudantes foram chamados para fazer a segunda parte do teste. O grupo controle fez essa parte do teste em condições normais, mas o grupo tratado foi desencorajado a fazer essa segunda parte porque – os pesquisa-dores informavam a eles – haviam obtido escores muito baixos na primeira parte. É preciso calcular as diferenças entre os escores obtidos na primeira e na segunda parte do teste para cada grupo de estudantes.

Diferenças entre os escores obtidos nas duas partes do teste de inteligência segundo o grupo

GrupoControle Tratado

–1 78 –53 413 –40 –5

9 Veja o teste de 2�no Capítulo 5 deste livro.10 GORDON; DUREA. The effect of discouragement on the revised Stanford-Binet scale. J Genetic Psychol 73: 201-7, 1948. Apud LEHMANN, EL. Nonparametrics: Statistical Methods Based on Ranks. San Francisco: Holden Day, 1975. p. 47. O exemplo é antigo, mas é interessante e é citado por Lehman, um clássico.