Intervalos de Confiança

28
TAD - PUC-Rio, 1999 Intervalos de Confiança

description

Intervalos de Confiança. Testes de significância. em vários casos que olhamos supusemos que a diferença entre tratamentos, se houvesse, seria positiva por exemplo, no caso de solados, supusemos que B poderia causar maior desgaste que A, mas nunca que A poderia causar maior desgaste que B. - PowerPoint PPT Presentation

Transcript of Intervalos de Confiança

Page 1: Intervalos de Confiança

TAD - PUC-Rio, 1999

Intervalos de Confiança

Page 2: Intervalos de Confiança

TAD - PUC-Rio, 1999

Testes de significância

• em vários casos que olhamos supusemos que a diferença entre tratamentos, se houvesse, seria positivapor exemplo, no caso de solados, supusemos que

B poderia causar maior desgaste que A, mas nunca que A poderia causar maior desgaste que B.

• para considerar diferenças positivas e negativas, usamos o fato que a distribuição t é simétrica.

Page 3: Intervalos de Confiança

TAD - PUC-Rio, 1999

Testes de dois lados

• hipótese nula: média das diferenças é 0• hipótese alternativa: média é diferente de 0

– Pr(t>3,4) com 9 graus de liberdade 0,004– Pr(|t|>3,4) com 9 graus de liberdade 0,008

Page 4: Intervalos de Confiança

TAD - PUC-Rio, 1999

hipóteses de interesse

• nem sempre a hipótese nula é o que nos interessa• podemos admitir alguma degradação no desgaste

considerando a economia proporcionada por B• nesse caso usamos a mesma quantidade

(d - m)/sd/(n)1/2 com o valor que admitirmos para a diferença de desgastes.– por ex: (0,41-0,1)/0,12 = 2,6– Pr(t>2,6) 0,008– Pr(|t|>2,6) 0,008

Page 5: Intervalos de Confiança

TAD - PUC-Rio, 1999

média da população

• poderíamos construir uma tabela com os níveis de significância para cada possível valor da média das diferenças

valor hipotético da média nível de significância

0,00 0,008 0,10 0,029

Page 6: Intervalos de Confiança

TAD - PUC-Rio, 1999

Intervalos de Confiança

• Um intervalo de confiança expressa a idéia de que temos um determinado nível de confiança em que a média se encontra naquele intervalo.

• A idéia é: se a média real estiver fora desse intervalo, as chances de observarmos as amostras que observamos de fato seriam muito pequenas...

Page 7: Intervalos de Confiança

TAD - PUC-Rio, 1999

intervalo de confiança é o limite de aceitação: médias que implicariam numa probabilidade menor que para a média amostral observada ficam fora do intervalo de

confiança. =5% => intervalo de confiança (1- ), ie, 95%

média amostral

Page 8: Intervalos de Confiança

TAD - PUC-Rio, 1999

tamanho do intervalo de confiança

• Quanto maior o valor de , maior o grau de exigência para um valor ficar dentro do intervalo de confiança.

• Quanto maior o valor de , menor o intervalo de confiança.

Page 9: Intervalos de Confiança

TAD - PUC-Rio, 1999

tamanho do intervalo de confiança

5%

Page 10: Intervalos de Confiança

TAD - PUC-Rio, 1999

Cálculo de intervalo de confiança

• no exemplo do solado:• Supondo que queremos um intervalo de 95%

procuramos na tabela da distribuição t um valor v tal que Pr(|t|>v)=0,05

v=2,262 |(0,41-m)/0,12|<2,262 -2,62*0,12 -0,41 < m < 2,26*0,12 -0,410,41-0,27 < m < 0,41+0,27

Page 11: Intervalos de Confiança

TAD - PUC-Rio, 1999

Cálculo de intervalo de confiança

• de forma geral, dada uma média amostral m, o intervalo de confiança (1-) é dado por:[m-t /2 sd/(n)1/2,m+ t /2 sd/(n)1/2 ]

onde t /2 é o valor para o qual temos uma tail-area /2

• podemos também calcular qual deve ser o tamanho da amostra para um determinado intervalo de confiança

Page 12: Intervalos de Confiança

TAD - PUC-Rio, 1999

cálculo do tamanho da amostra

• Supondo que consideramos aceitável uma margem de erro de r%:[m-mr/100,m+mr/100][m-t /2 sd/(n)1/2,m+ t /2 sd/(n)1/2 ]

t /2 sd/(n)1/2 =mr/100 (n)1/2 =100 t /2 sd /mr n = (100 t /2 sd /mr)2

não conhecemos sd, mas podemos usar um experimento preliminar para estimá-lo

Page 13: Intervalos de Confiança

TAD - PUC-Rio, 1999

intervalos de confiança x testes de significância

• O descarte ou não da hipótese nula está incluído na informação dada pelo ic.

• Uma vez descartada a hipótese nula, o ic fornece informação sobre a dimensão da diferença de médias.

Page 14: Intervalos de Confiança

TAD - PUC-Rio, 1999

intervalos de confiança em projetos sem pares

• podemos usar as mesmas quantidades que foram usadas para fazer o teste t

Page 15: Intervalos de Confiança

TAD - PUC-Rio, 1999

números diferentes de experimentos

• Jardineiro quer testar fertilizantes A e B para plantas de tomates…B é fertilizante novo

• Ele tem 11 lotes disponíveis, e resolve tratar 6 deles com B e 5 com A

Page 16: Intervalos de Confiança

TAD - PUC-Rio, 1999

Médias

posição 1 2 3 4 5 6 7 8 9 10 11

método Á A B B A B B B A A B

tempo 29,9 11,4 26,6 23,7 25,3 28,5 14,2 17,9 16,5 21,1 24,3

A B

29,9 26,6

11,4 23,7

25,3 28,5

16,5 14,2

21,1 17,9

24,3

20,84 22,53

Page 17: Intervalos de Confiança

TAD - PUC-Rio, 1999

teste t

• Com amostras aleatórias de uma população com distribuição normal, comparamos a quantidade

((yB-yA) - (B - A))/s1/nA + 1/nB)1/2

com a distribuição t com nA + nB - 2 graus de liberdade

• podemos usar a mesma quantidade para cálculo do intervalo de confiança

Page 18: Intervalos de Confiança

TAD - PUC-Rio, 1999

intervalo de confiança

• substituindo em– ((yB-yA) - (B - A))/s1/nA + 1/nB)1/2

(1,69 - (B - A))/3,82– para um intervalo de 95%, aceitamos as

diferenças tais queabs((1,69-)/3,82) < 2,262

[1,69-8,64, 1,69+8,64]

[d-t /2 sd/(1/na+1/nb)1/2,d+ t /2 sd/(1/na+1/nb )1/2 ]

Page 19: Intervalos de Confiança

TAD - PUC-Rio, 1999

Análise de variância

comparação de k métodos

Page 20: Intervalos de Confiança

TAD - PUC-Rio, 1999

comparação de 3 tratamentos

• com o experimento (randomizado) abaixo, queremos saber se alguma das dietas representa um diferença real...

dieta médiaA 610 635 580 701 640 632 633B 595 614 550 602 633 612 601C 527 621 564 598 601 593 584 média global 606tabela 1: ganhos de pesos com 3 dietas

• idéia é trabalhar com os diferenças para as médias, e estabelecer parcelas dessas diferenças devidas ao tratamento

Page 21: Intervalos de Confiança

TAD - PUC-Rio, 1999

somas de quadrados

• diferenças (desvios) da média global

dieta A 4 29 -26 95 34 26B -11 8 -56 -4 27 6C -79 15 -42 -8 -5 -13tabela 2: desvios da média global

soma total dos quadrados dos desvios das médias:

(soma dos quadrados) (4)2+ (29)2+(-26) 2 +... = 24980

Page 22: Intervalos de Confiança

TAD - PUC-Rio, 1999

entre tratamentos• imaginando que em cada tratamento todos os resultados foram iguais:

A 633 633 633 633 633 633B 601 601 601 501 601 601C 584 584 584 584 584 584 média global 606tabela 3: pesos sem discrepâncias intra dieta

A 27 27 27 27 27 27 B -5 -5 -5 -5 -5 -5C -22 -22 -22 -22 -22 -22tabela 4: desvios da média global sem discrepâncias

as diferenças para a média seriam:

soma dos quadrados entre tratamentos: 7428

Page 23: Intervalos de Confiança

TAD - PUC-Rio, 1999

intra tratamentos

• desvios da média de cada tratamento

A -23 2 -53 68 7 -1 B -6 13 -51 1 32 11C -57 37 -20 14 17 9tabela 5: desvios entre pesos reais epesos sem discrepâncias intra dieta

soma dos quadrados dos desvios: 17552soma de quadrados de desvios intra tratamentosoma de quadrados residualsoma de quadrados dos erros

17552+7428=24980!!!

Page 24: Intervalos de Confiança

TAD - PUC-Rio, 1999

graus de liberdade

• Para usar essas quantidades em testes de hipótese temos precisamos dos graus de liberdade.

• para N observações, consideramos, no cálculo da variância, que a média está fixa, e logo que temos N-1 graus de liberdade

– para a soma de quadrados entre tratamentos:• trabalhamos com 3 valores (tabelas 3 e 4), logo temos 2

graus de liberdade– para a soma de quadrados intra tratamento:

• para cada dieta, 5 graus de liberdade (tabela 5)

Page 25: Intervalos de Confiança

TAD - PUC-Rio, 1999

Média dos desvios quadrados

• Se dividirmos cada soma de quadrados pelos graus de liberdade correspondentes temos uma medida da variação correspondente.

• Se as médias das populações com dietas diferentes não diferem, a média dos desvios dentro de uma dieta deve ser parecida com a média dos desvios entre dietas!

• Quão diferentes as médias têm que ser para acreditarmos numa diferença entre as méidas das populações...

Page 26: Intervalos de Confiança

TAD - PUC-Rio, 1999

Razão de variâncias

• Para testar a hipótese nula, usamos:

média dos quad. dos desvios entre tratamentosmédia dos quad. dos desvios intra tratamentos

• É comum o uso de uma tabela de análise de variância (ANOVA)

Page 27: Intervalos de Confiança

TAD - PUC-Rio, 1999

Tabela ANOVA

• Uso de tabelas de distribuição t com combinações de graus de liberdade: – tabelas F – 1 tabela para cada nível de significância

somas de graus de médias de razão de quadrados liberdade quadrados variâncias

entre dietas 7428 2 3714 3,17intra-dietas 17552 15 1170,13total 24980 17

Page 28: Intervalos de Confiança

TAD - PUC-Rio, 1999

Nesse caso...

• Valor na tabela F para 5% de significância e 2/15 graus de liberdade é 3,68

• Concluímos que o experimento não nos dá elementos para negar a hipótese nula...