INFERÊNCIA ESTATÍSTICA ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p.
Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência...
Transcript of Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência...
Inferência Estatística: decidindo na presença de incerteza
Universidade Federal de Minas Gerais
Instituto de Ciências Exatas
Departamento de Estatística
Aula 11:
Teste Qui-Quadrado:
Comparação de Várias Proporções
Associação entre duas Variáveis Qualitativas
Introdução à Bioestatística – Turma Nutrição
Exemplo Inicial: Igualdade de Proporções
A administração de um hospital deseja verificar se luvas de três
marcas (A, B e C) são homogêneas quanto à permeabilidade a
vírus.
Para isto, realizou um experimento, no qual 240 luvas da marca A,
240 luvas da marca B e 300 luvas da marca C foram submetidas à
tensão.
Durante os testes, 151 luvas da marca A (62.9%), 134 luvas da
marca B (55.8%) e 177 luvas da marca C (59.0%) deixaram passar
vírus.
Os dados do experimento apresentam evidências estatísticas
suficientes contra a hipótese de que as três marcas possuem a
mesma permeabilidade?
H0: PA = PB = PC = P
H1: ao menos uma das permeabilidades é diferente das outras
Teste de Igualdade de Proporções
(mais de uma população)
Tabela de valores observados
Marca da
luva
Deixou passar vírus quando
submetida à tensão? Total
Sim Não
A 151 89 240
B 134 106 240
C 177 123 300
Total 462 318 780
Tabela de Classificação Cruzada:
Tabela 3 x 2:
3 linhas x 2 colunas
Marca da
luva
Deixou passar vírus quando submetida
à tensão? Total
Sim Não
A 151 89 240
B 134 106 240
C 177 123 300
Total 462 318 780
H0: PA = PB = PC = P
H1: ao menos uma das permeabilidades é diferente das outras
462ˆ780
P = 0.593 estimativa da permeabilidade comum sob H0
Marca da
luva
Deixou passar vírus quando submetida à tensão? Total
Sim Não
A 151 .................................... 89............................. 240
B 134..................................... 106............................... 240
C 177..................................... 123............................... 300
Total 462 318 780
Se H0 (PA = PB = PC = P) é verdadeira:
quantas luvas que deixam passar o vírus deveríamos esperar
dentre as luvas da marca A ?
E dentre as luvas da marca B ?
E da marca C ?
462ˆ780
P
(240x462/780=142.15)
(240x462/780=142.15)
(300x462/780=177.70)
(240-142.15=97.85)
(240-142.15=97.85)
(300-177.70=122.30)
Valores esperados sob H0= 0.593
Note que os valores esperados sob H0 são calculados como uma
função simples dos totais de linha, coluna e do total geral:
(240x462/780=142.15)
(240x462/780=142.15)
(300x462/780=177.70)
(240x318/780=97.85)
(240x318/780=97.85)
(300x318/780=122.30)
(total de linha) (total de coluna)Valor Esperado da casela
(total geral)
Marca da
luva
Deixou passar vírus quando submetida à tensão? Total
Sim Não
A 151 .................................... 89............................. 240
B 134..................................... 106............................... 240
C 177..................................... 123............................... 300
Total 462 318 780
Marca da
luva
Deixou passar vírus quando submetida à
tensão?
Total
Sim Não
A 151 (142.15) 89 (97.85) 240
B 134 (142.15) 106 (97.85) 240
C 177 (177.70) 123 (122.30) 300
Total 462 318 780
Tabela de Valores Observados
(esperados sob H0 entre parênteses)
Estatística de Teste = “Observado – Esperado sob H0”
Tabela de Valores Observados (esperados sob H0 entre parênteses)
Estatística de Teste = (151-142.15) (89-97.85)
(134-142.15) (106-97.85)
(177-177.70) (123-122.30)
2 2
22
2 2
Marca da
luva
Deixou passar vírus quando submetida à
tensão?
Total
Sim Não
A 151 (142.15) 89 (97.85) 240
B 134 (142.15) 106 (97.85) 240
C 177 (177.70) 123 (122.30) 300
Total 462 318 780
Tabela de Valores Observados (esperados sob H0 entre parênteses)
2 2 2
2 2 2
(151-142.15) (89-97.85) (134-142.15)Estatística de Teste =
142.15 97.85 142.15
(106-97.85) (177-177.70) (123-122.30)
97.85 177.70 122.30
+ +
+
+
+
2X 2.50
Marca da
luva
Deixou passar vírus quando submetida à
tensão?
Total
Sim Não
A 151 (142.15) 89 (97.85) 240
B 134 (142.15) 106 (97.85) 240
C 177 (177.70) 123 (122.30) 300
Total 462 318 780
Valores críticos para X2
O valor de X2 está perto ou longe do zero?
5 g.l.
10 g.l.
0
Valores de Referência para X2 Distribuição de Probabilidade de 2
Distribuição
Qui-quadrado
2
gl
gl: graus de liberdade
gl = (número de linhas -1) x (número de colunas -1)
Graus de Liberdade para o Teste Qui-Quadrado
No caso do teste Qui-quadrado, os graus de liberdade da
distribuição de referência equivalem ao
número de caselas livres na tabela
Tabela 2 x 2: 1 casela livre
Grupos Respostas Total
Sim Não
A 151 89 240
B 134 106 240
Total 285 195 480
G.L. = (número de linhas -1) x (número de colunas -1)
No exemplo das luvas: Tabela 3 x 2 G.l. = (3-1) x (2-1) = 2 x 1 = 2
No exemplo das luvas Valor P = P[χ22> 2.50]
2.50
Valor-p = P[χ22 > 2.50] > 0.25 (>0.05) Não se rejeita H0 para =0.05.
Conclusão: os dados do experimento não mostraram evidências estatísticas
suficientes (=0.05) para a rejeição da hipótese de que as permeabilidades
das luvas das três marcas são iguais.
Valor P = P(obter um valor de X2obs “mais extremo” do que
o valor observado quando H0 é verdadeira)
X2obs
Valor P
Valor P = P[χ2gl > X2
obs]
Teste Qui-Quadrado para Homogeneidade de Proporções
H0: As proporções de sucesso são homogêneas para todas as populações
Ha: Ao menos uma população tem proporção de sucesso diferente das demais
22
1
( )cN
i iobs
i i
O EX
E
L = número de linhas
C = número de colunas
Nc = LxC: número de caselas da tabela
i = 1, 2, 3, …, NC representa cada casela
Oi é o valor observado na casela i
Ei é o valor esperado na casela i
(total de linha) (total de coluna)
(total geral)iE
Valor P = P[χ2gl> X2
obs], onde g.l. = (l-1) x (c-1)
Rejeita-se H0 ao nivel de significância α se valor-p < α.
Teste Qui-Quadrado de Independência
Variável B
Variável A B1 B2 .... Bc Total
A1
A2
A3
AL
Total n
Os n indivíduos de uma amostra são classificados segundo duas
variáveis qualitativas (variável A e variável B):
Cor dos
cabelos
Cor dos olhosTotal
Verde Cinza Azul Castanho
Preto 5 15 20 68 108
Castanho 29 54 84 119 286
Ruivo 14 14 17 26 71
Loiro 16 10 94 7 127
Total 64 93 215 220 592
Exemplo: Distribuição de 592 estudantes de uma universidade
segundo as variáveis cor dos cabelos e cor de olhos.
Pergunta: Existe associação entre a cor de olhos e a cor dos
cabelos de uma pessoa?
Distribuição % das cores de olhos é igual em cada cor de cabelo (e vice-
versa)?
Tabela 4 x 4
4,63
10,14
19,72
12,60
13,89
18,88
19,72
7,87
18,52
29,37
23,94
74,02
62,96
41,61
36,62
5,51
0,00 10,00 20,00 30,00 40,00 50,00 60,00 70,00 80,00 90,00 100,00
Preto
Castanho
Ruivo
Loiro
Verde
Acinzentado
Azul
Castanho
Distribuição de frequências da cor de olhos
segundo cor dos cabelos
Distribuição de frequências da cor de cabelos
segundo cor de olhos
7,8116,13
9,30
30,91
45,31
58,06
39,07
54,09
21,88
15,05
7,91
11,8225,00
10,75
43,72
3,18
0,00
10,00
20,00
30,00
40,00
50,00
60,00
70,00
80,00
90,00
100,00
Verde Acinzentado Azul Castanho
Loiro
Ruivo
Castanho
Preto
Valores observados na amostra (valores esperados sob H0):
H0: não existe associação cor de olhos e a cor dos cabelos. (Use α=0.01)
Verde Cinza Azul Castanho TOTAL
Preto 5 15 20 68 108
11.68 16.97 39.22 40.14
Castanho 29 54 84 119 286
30.92 44.93 103.87 106.28
Ruivo 14 14 17 26 71
7.68 11.15 25.79 26.39
Loiro 16 10 94 7 127
13.73 19.95 46.12 47.20
TOTAl 64 93 215 220 592
X2 = 138.29 GL = 9 valor-p = 0.000
Valor-p < 0.01 rejeita-se H0
Conclusão: existe associação entre a cor de olhos e a cor dos cabelos.
H0: Variável A não está associada à Variável B (A e B são independentes)
HA: Variável A está associada à Variável B (A e B não são independentes)
22
1
( )cN
i iobs
i i
O EX
E
L = número de linhas
C = número de colunas
Nc = LxC: número de caselas da tabela
i = 1, 2, 3, …, NC representa cada casela
Oi é o valor observado na casela i
Ei é o valor esperado na casela i
(total de linha) (total de coluna)
(total geral)iE
Valor P = P[χ2gl> X2
obs], onde g.l. = (l-1) x (c-1)
Teste Qui-Quadrado para Independência
Rejeita-se H0 ao nivel de significância α se valor-p < α.