Ipaee capitulo5

44
U NIVERSIDADE F EDERAL DE S ÃO C ARLOS C ENTRO DE C IÊNCIAS E XATAS E DE T ECNOLOGIA D EPARTAMENTO DE E STATÍSTICA I NTRODUÇÃO AO P LANEJAMENTO E A NÁLISE E STATÍSTICA DE E XPERIMENTOS C APÍTULO # 5 E XPERIMENTOS COM UM Ú NICO F ATOR (O NEWAY ) P ROF . P EDRO F ERREIRA F ILHO P ROF a . E STELA M ARIS P. B ERETA 2 º S EMESTRE DE 2010

description

Material integrante do curso "Introdução ao Planejamento e Análise Estatística de Experimentos" - Prof. Pedro Ferreira Filho e Profa. Estela Maris P. Bereta - UFSCar

Transcript of Ipaee capitulo5

Page 1: Ipaee capitulo5

UU NN II VV EE RR SS II DD AA DD EE FFEE DD EE RR AA LL DD EE SS ÃÃ OO CC AA RR LL OO SS

CC EE NN TT RR OO DD EE CC II ÊÊ NN CC II AA SS EE XX AA TT AA SS EE DD EE TT EE CC NN OO LL OO GG II AA

DD EE PP AA RR TT AA MM EE NN TT OO DD EE EE SS TT AA TT ÍÍ SS TT II CC AA

II NN TT RR OO DD UU ÇÇ ÃÃ OO AA OO PP LL AA NN EE JJ AA MM EE NN TT OO EE AA NN ÁÁ LL II SS EE

EE SS TT AA TT ÍÍ SS TT II CC AA DD EE EE XX PP EE RR II MM EE NN TT OO SS

CC AA PP ÍÍ TT UU LL OO ## 55

EEXX PP EE RR II MM EE NN TT OO SS CC OO MM UU MM ÚÚNN II CC OO FFAA TT OO RR

((OONN EE WW AA YY ))

PP RR OO FF .. PP EE DD RR OO FF EE RR RR EE II RR AA FF II LL HH OO

PP RR OO FFaa .. EE SS TT EE LL AA MM AA RR II SS PP.. BB EE RR EE TT AA

22 ºº SS EE MM EE SS TT RR EE DD EE 22 00 11 00

Page 2: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 2

55 .. EE XX PP EE RR II MM EE NN TT OO SS CC OO MM ÚÚ NN II CC OO FF AA TT OO RR (( OO NN EE WW AA YY ))

55 .. 11 .. II NN TT RR OO DD UU ÇÇ ÃÃ OO ::

Experimentos com um único fator são aqueles onde existe uma única variável de interesse

no estudo . Os testes de hipótese para comparação de duas médias (ou dois tratamentos) vistos

no capítulo 3 são um caso particular desse tipo de situação. No entanto, os procedimentos vistos

anteriormente somente podem ser utilizados em situações onde o número de tratamentos em

estudos é no máximo igual a dois.

Usualmente os estudos experimentais tem por objetivo comparar três ou mais tratamentos,

ou ainda, nessa situação, estudar um fator de interesse que apresenta três ou mais possíveis

valores (tratamentos). Por exemplo, num exemplo anterior, havia interesse e, estudar o

rendimento de uma dada reação química considerando três diferentes tipos de catalisadores.

Nesse caso existe um único fator: Catalisadores e três tratamentos que são os três (ou mais) tipos

de catalisadores a serem investigados. Abordaremos os experimento com único fator nsa situação

onde não existe restrição a aleatorização (experimentos completamente aleatorizados) e na

presença de uma única fonte de restrição (experimentos aleatorizados em blocos).

55 .. 22 .. EE XX PP EE RR II MM EE NN TT OO SS CC OO MM PP LL EE TT AA MM EE NN TT EE AA LL EE AA TT OO RR II ZZ AA DD OO SS ::

55 .. 22 .. 11 .. II NN TT RR OO DD UU ÇÇ ÃÃ OO ::

Um experimento completamente aleatorizado com um único fator (ONEWAY) é um

planejamento experimental que envolve apenas um fator com “a” níveis onde os tratamentos são

atribuídos as unidades experimentais sem qualquer restrição, ou ainda, toda unidade experimental

tem a mesma probabilidade de receber qualquer um dos tratamentos (níveis do fator) em estudo.

A eficiência deste tipo de planejamento esta diretamente relacionada a homogeneidade das

unidades experimentais com respeito aos objetivos do estudo. Quanto maior for a

homogeneidade melhores serão os resultados obtidos nesse tipo de planejamento experimental.

Consideremos o seguinte exemplo:

Um experimento foi realizado para verificar a produtividade de 4 tipos de variedade de

milho. A produção em cada unidade experimental (lotes homogêneos) foi a seguinte:

Page 3: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 3

Varie- Repetições

dade 1 2 3 4 5

A 25 26 20 23 21

B 31 25 28 27 24

C 22 26 28 25 29

D 33 29 31 34 28

Problema:

Existe uma variedade que apresenta produtividade melhor que as demais?

Visualizando os dados observados:

Situação:

Experimento:

Completamente Aleatorizado

Um único fator – Variedades de milho

Efeitos Fixos (interesse em identificar qual das quatro variedades é a melhor).

Balanceado: todos os tratamentos foram aplicados ao mesmo número de unidades

experimentais;

Questão:

Page 4: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 4

Como definir um teste para verificação da hipótese de existência ou não de diferença entre

os tratamentos?

55 .. 22 .. 22 .. AA NN ÁÁ LL II SS EE EE SS TT AA TT ÍÍ SS TT II CC AA ::

55 .. 22 .. 22 .. 11 .. NN OO TT AA ÇÇ ÃÃ OO ::

Seja:

Yij = variável resposta observada no i-ésimo tratamento e j-ésima unidade experimental;

i = 1, 2, …, a (tratamentos)

j = 1, 2, ..., ni (número de unidades experimentais por tratamento)

N =

(número total de unidades experimentais)

No exemplo:

Yij = produtividade da i-ésima variedade na j-ésima unidade experimental.

i = A, B, C, D

j = 1,2, 3, 4, 5 (para todo i)

e n1 = n2 = ... = na = n n.a = N 5*4= 20

Neste caso temos um experimento balanceado, isto é, todos os tratamentos são

aplicados no mesmo número de unidades experimentais.

AA PP RR EE SS EE NN TT AA ÇÇ ÃÃ OO DD OO SS DD AA DD OO SS ::

Tratamentos Observações Totais Médias

1 y11 y12 ... y1n1 y1. 1.y

2 y21 y22 ... y2n2 y2. 2.y

a ya1 ya2 ... yan ya. a.y

y..

a

i

in

1

Page 5: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 5

i

n

1j

iji.yy (total do i-ésimo tratamento)

in

1j

.

ij

i

i.y

n

1y

i

i

n

y (média do i-ésimo tratamento)

a

i 1

n

1j

ij..

i

yy (total das observações)

No exemplo:

Varie- Repetições yi. i.

y dade 1 2 3 4 5

A 25 26 20 23 21 115 23

B 31 25 28 27 24 135 27

C 22 26 28 25 29 130 26

D 33 29 31 34 28 155 31

Totais y.. ..

y = 26.75

55 .. 22 .. 22 .. 22 .. MM OO DD EE LL OO EE SS TT AA TT ÍÍ SS TT II CC OO ::

A análise estatística para verificar o problema em estudo (igualdade ou não dos

tratamentos) passa pelo ajuste de um modelo linear estatístico definido da seguinte forma:

yij = + i + ij (chamado modelo de desvio médio) (5.1)

onde

Yij = variável resposta observada no i-ésimo tratamento e j-ésima unidade experimental;

µ = efeito comum a todos os tratamentos, parte da resposta que não depende dos tratamentos;

i = efeito específico do i-ésimo tratamento

i = erro aleatório (parte da resposta não representada pelo modelo)

Page 6: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 6

Interpretação:

A resposta yiz é devida a um “efeito comum” mais um efeito específico do i-ésimo

tratamento mais um efeito aleatório.

Do ponto de vista do modelo temos na forma matricial:

Situação a = 3; ni = 3, todo i;

Problemas:

Estimar os parâmetros

Teste de Hipótese

Verificar a adequabilidade do modelo

55 .. 22 .. 22 .. 33 .. EE SS TT II MM AA ÇÇ ÃÃ OO DD EE PP AA RR ÂÂ MM EE TT RR OO SS ::

Alternativas:

Estimadores de Máxima Verossimilhança

Estimadores de Mínimos Quadrados

Usando o métodos dos mínimos quadrados coma restrição de que a

1i

ii0τc , temos:

..yμ

i..i.i yyˆ i= 1,2,....a

Interpretação:

O efeito comum é estimado pela média geral dos dados observados;

O efeito específico é estimado pela diferença entre a média das observações do especifico

tratamento em relação a média geral.

Page 7: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 7

No Exemplo:

Estimativa dos Parâmetros:

26.75μ 75.3ˆ1

25.0ˆ2

75.0ˆ3

4.25ˆ4

Interpretação:

O tratamento 1 (adubo A) tem em média um rendimento médio 3.75 unidades a menos

que o efeito comum (efeito obtido independente dos tratamentos).

O tratamento 2 (adubo B) tem em média um rendimento médio 0.25 unidades a mais que

o efeito comum (efeito obtido independente dos tratamentos).

O tratamento 3 (adubo C) tem em média um rendimento médio 0.75 unidades a menos

que o efeito comum (efeito obtido independente dos tratamentos).

O tratamento 4 (adubo D) tem em média um rendimento médio 4.25 unidades a mais que

o efeito comum (efeito obtido independente dos tratamentos).

Observação:

Alguns autores preferem o modelo estatístico dado por:

Yij= i + ij

Onde

i = + i

definido anteriormente.

Alguns resultados apresentam diferenças em relação ao modelo apresentado, porém as

conclusões obtidas usando qualquer uma das alternativas são exatamente as mesmas.

55 .. 22 .. 22 .. 44 .. TT EE SS TT EE DD EE HH II PP ÓÓ TT EE SS EE SS ::

O interesse no estudo é o de comparar os tratamentos que estão sendo investigados.

Como agora, três ou mais tratamentos, a hipótese inicial a ser investigada é a de que se todos os

tratamentos são iguais, ou seja, se todos são igualmente “eficientes”. No caso de não rejeição

desta hipótese, concluí-se pela igualdade dos tratamentos envolvidos, ou ainda, que não existe um

Page 8: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 8

tratamento com maior efeito que os demais. No caso de rejeição de hipótese de igualdade,

conclui-se que pelo dois tratamentos são diferentes e, nesse caso, novos procedimentos devem

ser realizado para se identificar os tratamentos diferem, ou ainda, que tratamento ou tratamentos

são mais eficientes.

O teste de igualdade de tratamentos utilizando o modelo definido em (5.1) implica no teste

da seguinte hipótese.

Ho : i = 0 i = 1, ..., a

H1 : i 0 para pelo menos um i.

Interpretação:

Se a hipótese Ho não é rejeitada todos os parâmetros i são iguais a zero, ou seja, os

efeitos específicos de todos os tratamentos são iguais a zero (não existem), portanto o modelo

(5.1) fica:

yij = + ij

que não depende dos tratamentos, ou ainda, mudança nos níveis do fator não tem efeito sobre a

resposta.

Se a hipótese Ho é rejeitada todos os parâmetros, pelo menos um i diferente de zero,

ou seja, os existe pelo menos um dos tratamentos com um efeito específico que o torna melhor

(ou pior) que os demais tratamentos.

Vamos considerar alguns pressupostos sobre a componente aleatória ij do modelo 5.1.:

a) E[ ij] = 0 (os erros têm valor esperado igual a zero, ou a média dos erros é zero)

b) V[ ij] = 2 (a variância do erros éconstante e igual a uma dados valor 2)

c) ij são não correlacionados. (o que não é ajustado pelo modelo para uma unidade

experimental, não esta relacionado com o que não é explicado para uma

unidade de observação j)

Conseqüência:

E(Yi) = E ( + i + i) = + i + E( ij ) = + i

Page 9: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 9

V(Yi) = E ( + i + i) = V( ij ) = 2

Se considerarmos ainda que:

ij ~ N (0, 2)

isto é, erros aleatórios, distribuídos segundo um modelo normal com média zero e variância

constante.

Portanto temos que:

Yij ~ N ( + i , 2)

Desta forma, sob a suposição acima, podemos representar nossa hipótese da seguinte

forma:

Ou seja, o teste de hipóteses, considerando as suposições acima, significa que cada

tratamento segue um modelo normal com uma dada média específica ( + i) e uma

mesma variância constante 2. O teste de hipóteses tem por objetivo verificar se estas

diferentes médias especificas são iguais, ou ainda se todos efeitos específicos i são

iguais a zero.

Problema:

Como testar as hipóteses acima?

1) No caso de dois tratamentos: Teste t

2) Dois ou mais tratamentos: Teste F – ANOVA = Análise de Variância

Page 10: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 10

55 .. 22 .. 22 .. 55 .. AA NN OO VV AA –– AA NN ÁÁ LL II SS EE DD EE VV AA RR II ÂÂ NN CC II AA ::

O princípio da ANOVA é o de estudar a variabilidade dos dados de forma a identificar que

parcela desta variabilidade é devida ao efeitos dos diferentes tratamentos e que parcela dela é

devida aos erros aleatórios não controláveis.

Proposta:

Particionar a variabilidade total dos valores observados para a medida de comparação Yiz,

em duas componentes: uma devida ao modelo (parte não aleatória) e outra devida aos erros

aleatórios, isto é:

Variabilidade Total = Variabilidade Modelo + Variabilidade dos Erros

Vamos considerar como medida de variabilidade total, a soma de quadrados de desvios em

torno da média para cada uma das observações, ou seja:

a

1i

ni

1j

2

..ijy-ySQT Total adeVariabilid

A partir de alguns procedimentos algébricos temos:

SQESQTrSQT

yyn

yyyy

yy

i

i

ii

n

ii

n

i

a

i

n

j

iij

n

ii

a

i j

2

i.ij

2

..

a

i

a

i j

2

i.ij

a

i

n

j

2

..i.

...

a

i

n

j 1 1

.

a

i j

2

i.ij

2

..i.

a

i

n

j

2

..ii.ij

a

1i

ni

1j

2

....ij

a

1i

ni

1j

2

..ij

yy.

0 yyyy

2yyyy

yyyy

yy

y-ySQT

i

i

i

Page 11: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 11

onde:

SQTr = SQM = Soma de Quadrados Tratamentos (modelo) : quantifica a

variabilidade entre tratamentos;

SQE = Soma quadrados dos erros: quantifica a variabilidade dos erros;

Idéia Geométrica:

Interpretando:

SQE : soma dos quadrados dos desvios das observações em relação a média de

cada tratamentos;

SQTr : soma dos quadrados dos desvios da média de cada tratamento em relação a

média geral;

A medida que cresce a soma de quadrados de tratamentos temos uma maior

variabilidade entre os tratamentos, conseqüentemente temos que existe diferença

entre os tratamentos. Caso contrário, maior variabilidade dentro dos tratamentos e

menor variabilidade entre tratamentos, temos a não existência de diferença entre

tratamentos.

Problema:

Como quantificar o quanto “pequeno” é a soma de quadrados de tratamentos?

Page 12: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 12

Expressões:

a

1i

ni

1j

..2ij

a

1i

ni

1j

2..ij

n

yyy-ySQT

2

a

1i

...i

a

1i

...iin

yy

nyynSQTr

222 1

SQTrSQTSQE

Nota: n

y ..2

é usualmente chamado de fator de correção (FC)

Consideremos o seguinte quadro:

Tabela ANOVA

Fonte de

Variação

Graus de

Liberdade

Soma de

Quadrados

Quadrados

Médios

E(QM)* F

Modelo

(Tratamentos)

a-1 SQTr SQ Tr/a-1 2ii

2τn

1a1σ

QME

QMTr

Erro N-a SQE SQE/N-a 2σ

Total N-1 SQT - -

* Esta coluna não é usualmente apresentada.

A tabela acima nos mostra que se a hipótese H0 é verdadeira ( todos i = 0) em

média(E(QM)) o quadrado médio de tratamentos e o quadrado médio de erros são iguais a um

mesmo valor (2 no caso!). Portanto, se a hipótese H0 é verdadeira a razão entre QMTr/QME

deve ser próxima de 1.

Problema:

Como quantificar o quanto “próxima de 1” esta razão?

Page 13: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 13

Considerando que a suposição: ij ~ N (0, 2) é verdadeira podemos provar que

(ver Mongomery páginas 270 a 273) que:

aNacF

QME

QMTrF

,1~

Consequentemente:

Rejeitamos H0 com u m nível se significância (erro tipo I) se:

)(,1 aNatc

FFQME

QMTrF

Graficamente:

Gráfico 1 – Região Critica para o Teste F.

Page 14: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 14

Uma alternativa usando softwares estatísticos é:

Valor P = P[ Fa-1,N-a > Fc] = c

Isto é:

Gráfico 2 – Valor para estatística F calculada

Logo:

Se c > não se rejeita H0

Se c < rejeita-se H0

Retornando ao exemplo:

Source DF Sum of Squares Mean Square F Value Pr > F

Model 3 163.7500000 54.5833333 7.80 0.0020

Error 16 112.0000000 7.0000000

Corrected Total 19 275.7500000

Page 15: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 15

R-Square Coeff Var Root MSE Y Mean

0.593835 9.890659 2.645751 26.75000

Source DF Type I SS Mean Square F Value Pr > F

F 3 163.7500000 54.5833333 7.80 0.0020

Temos Fc = 7.80

Considerando = 5% temos F3,16(5%) = 3.24

Logo:

%)5(24.380.716,3

FFQME

QMTrF

tc

Portanto REJEITA-SE Ho, isto é, pelo menos dois tratamentos diferem, ou ainda existe

pelo menos um tratamento que é mais eficiente que outro (maior produtividade no caso!).

De outra forma:

Da tabela da Anova (obtida através de um software estatístico) temos que:

)%)5(05.00020.0Pr Fc

Portanto REJEITA-SE Ho.

Page 16: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 16

Complementação:

O ajuste do modelo :

yij = + i + ij

a partir dos dados do experimentos é dado pela estimativa dos parâmetros :

26.75μ 75.3ˆ1

25.0ˆ2

75.0ˆ3

4.25ˆ4

Consequentemente temos a seguinte decomposição dos valores observados:

0.30.30.30.2

0.30.10.00.0

0.00.275.10.3

0.20.00.20.3

0.20.40.40.2

25.475.025.075.3

25.475.025.075.3

25.475.025.075.3

25.475.025.075.3

25.475.025.075.3

75.2675.2675.2675.26

75.2675.2675.2675.26

75.2675.2675.2675.26

75.2675.2675.2675.26

75.2675.2675.2675.26

28292421

34252723

31282820

29262526

33223125

Ou ainda:

O Valor observado yij é decomposto em um efeito comum (não depende dos tratamento) +

efeito especifico i do tratamento aplicado a unidade experimental mais uma aquilo que não

pode ser incorporado pelo modelo, erro observado ij chamado de RESIDUOS do modelo e que

obtidos e denotados por:

iijˆ - ˆ -Y ˆ

ij

Por sua vez:

iijˆ ˆ Y

É chamado valor estimado ou valor PREDITO pelo modelo.

Consequentemente:

ijijY -Y ˆ

ij

Resíduos = Valor Observado – Valor Predito

Page 17: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 17

PROBLEMA:

Inferências foram realizadas a partir da hipótese de que i são iid N (0, 2)

ou seja:

a) E[ ij] = 0 (os erros têm valor esperado igual a zero, ou a média dos erros é zero)

b) V[ ij] = 2 (a variância do erros é constante e igual a uma dados valor 2)

c) ij são não correlacionados. (o que não é ajustado pelo modelo para uma unidade

experimental, não esta relacionado com o que não é explicado para uma

unidade de observação j)

d) ij seguem os padrão de um modelo de probabilidade Normal.

Como verificar se as suposições acima são verdadeiras para os dados

observados no experimento?

55 .. 22 .. 33 .. DD II AA GG NN ÓÓ SS TT II CC OO DD EE MM OO DD EE LL OO ::

Objetivo:

Verificar se as suposições estabelecidas para obtenção do ajuste e teste dos parâmetros,

são satisfeitas.

Suposição:

i são iid N (0, 2)

Questões:

Presença de Valores Extremos (Dados aberrantes-discrepantes)

Independência (Aleatoriedade)

Normalidade

Homocedasticidade (Variância Constante)

Instrumentos:

Histograma e Box-Plot dos resíduos

Gráfico normal probabilístico

Gráfico de resíduos em ordem temporal (para situações onde existe uma seqüência

temporal na coleta dos dados)

Gráfico de resíduos versus predito

Page 18: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 18

Gráfico de resíduos versus fatores

Testes de Igualdade de Variâncias

55 .. 22 .. 33 .. 11 .. II DD EE NN TT II FF II CC AA ÇÇ ÃÃ OO DD EE VV AA LL OO RR EE SS EE XX TT RR EE MM OO SS –– PP OO NN TT OO SS DD II SS CC RR EE PP AA NN TT EE SS

(( AA BB EE RR RR AA NN TT EE SS )) ::

A identificação de valores extremos (dados discrepantes ou aberrantes) faz parte da

análise descritiva e exploratória dos dados. No caso de planejamento de experimentos alguns

procedimentos específicos podem ser destacados na busca da verificação da existência de valores

extremos.

Procedimentos usuais que auxiliam na análise descritiva e exploratória destes dados são:

Ramos e Folhas, Diagrama de Pontos e Box Plot.

Consideremos os seguintes dados:

Tabela: Dados provenientes de um Experimento Completamente Aleatorizado – Oneway (Exemplo

Anterior)

Varie- Repetições

dade 1 2 3 4 5

A 25 26 20 23 21

B 31 25 28 27 24

C 22 26 28 25 29

D 33 29 31 34 28

Dados Originais:

Para se verificar a presença de valores extremos(ou dados discrepantes) podemos utilizar

procedimentos simples, como gráfico de dispersão e Box-Plots. Devemos verificar, neste caso,

valores que se destacam dos demais na apresentação dos valores observados. O Ramo e Folhas

pode ser uma outra alternativa para identificação destes valores. Nos dados abaixo, podemos

observar claramente a não presença de valores extremos.

Page 19: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 19

Resíduos:

Uma alternativa para identificação de valores extremos é a utilização dos resíduos do

modelo estimado, ou seja:

ijijijij yyeˆ

Os procedimentos acima descritos podem ser utilizados, agora não mais com os dados

originais mas sim com os resíduos estimados.

Observando as figuras abaixo podemos observar que, também neste caso, não existe

evidências da existência de algum valor extremo.

Nota:

Diversos autores propõem o uso dos chamados resíduos padronizados no lugar dos

resíduos ordinários acima definidos. Os resíduos padronizados são definidos por:

QME

ˆ

ˆVar

ˆij

ij

ij

Page 20: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 20

Figura – Identificando Valores Extremos a partir dos Resíduos Estimados

PROCEDIMENTO ALTERNATIVO;

Considerando que os erros têm distribuição N(0, 2), pode-se esperar que a média

contém aproximadamente 68% dos dados, a média 2 contém aproximadamente 95% dos

dados e a média 3 contém aproximadamente 99% dos dados. Desta forma, podem ser

considerados valores extremos aqueles que forem superiores a 3 .

CONCLUSÃO:

Identificado um valor extremo, usualmente ele é excluído da análise. Porém, na pratica, é

o pesquisador quem deve determinar se um valor extremo pode realmente ser assim considerado.

Pois os valores extremos podem fornecer informações importantes sobre o experimento e

estatisticamente podem demonstrar que uma outra distribuição deve melhor representar o

comportamento dos dados.

55 .. 22 .. 33 .. 22 .. VV EE RR II FF II CC AA NN DD OO AA II NN DD EE PP EE NN DD ÊÊ NN CC II AA :: (( EE RR RR OO SS NN ÃÃ OO CC OO RR RR EE LL AA CC II OO NN AA DD OO SS ))

A independência dos resíduos, é usualmente avaliada através de um gráfico dos resíduos

vs valores preditos. Na hipótese de ser satisfeita a suposição de independência não deverá existir

nenhum padrão neste gráfico, ou seja, nenhum comportamento não aleatório dos valores

observados.

No exemplo temos:

Figura – Independência

Page 21: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 21

Figura – Situações de Não Independência

NOTAS:

Existindo o registro da ordem de obtenção dos valores, recomenda-se o uso do gráfico dos

resíduos vs a ordem de coleta de forma a verificar algum padrão na resposta e,

conseqüentemente uma dependência entre as observações.

55 .. 22 .. 33 .. 33 VV EE RR II FF II CC AA NN DD OO AA NN OO RR MM AA LL II DD AA DD EE ::

A suposição de normalidade dos resíduos pode ser verificada graficamente ou através de

testes. Graficamente é usualmente utilizado o gráfico normal probabilístico e os testes mais

utilizados e implementados em softwares são: Teste de Shapiro-Wilk, Anderson-Darling,

Kolmogorov-Smirnov, Cramer-von Mises, Liliefors.

O gráfico de probabilidade e um método para determinar se os dados da amostra (erros

estimados, nessa situação) seguem uma distribuição hipotética, baseada no exame visual dos

dados. O procedimento geral e muito simples e pode ser feito rapidamente. Gráfico de

Page 22: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 22

probabilidade usa tipicamente um papel gráfico especial, conhecido como papel de probabilidade,

que tem sido projetado para a distribuição hipotética. A papel de probabilidade e largamente

disponível para as distribuições normal, lognormal, Weibull e varias distribuições quadrado e

gama. Softwares estatísticos atualmente substituem o uso destes papéis, necessários durante

longo tempo.

Para construir um gráfico de probabilidade, as observações na amostra são primeiro ordenadas

da menor para a maior. Ou seja, a amostra X1., X2, .. .'Xn e arrumada como x(1),x(2) ...,x(n) em

que x(I) é a menor observação, X(2) e a segunda menor observaçao e assim por diante, com x(n)

sendo a maior. As observações ordenadas Xa(U) sao então grafadas contra suas freqüências

cumulativas observadas (j - 0,5)/n em um papel apropriado de probabilidade. Se a distribuição

hipotética descrever adequadamente os dados, os pontos picotados cairão, aproximadamente, ao

longo de uma linha reta; se os pontos plotados desviarem significativamente de uma linha reta,

então o modelo hipotético não será apropriado. Geralmente, determinar se os dados plotados

seguem ou nao a linha reta e algo subjetivo. O procedimento e ilustrado no seguinte exemplo.

Um Exemplo:

Dez observações sobre o tempo (em minutos) efetivo de vida de serviço de baterias usadas

em um computador pessoal sao: 176,191,214,220,205, 192,201,190, 183,185. Imaginemos que

a vida da bateria seja modelada adequadamente por uma distribuição normal. Para usar o gráfico

de probabilidade de modo a investigar essa hipótese, arranje primeiro as observações em ordem

crescente e calcule suas freqüências cumulativas (j- 0,5)/10 conforme segue.

j X9i) (j - 0,5)/10

1 176 0,05

2 183 0,15 3 185 0,25 4 190 0,35 5 191 0,45 6 192 0,55 7 201 0,65 8 205 0,75 9 214 0,85 10 220 0,95

Page 23: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 23

Os pares de valores x(i) e (j - 0,5)/10 são agora plotados em um papel de probabilidade

normal. Esse gráfico é mostrado na figura abaixo. A maioria dos papeis de probabilidade normal

plotam 100(j - 0,5)/n na escala vertical da esquerda e 100[ 1 - (j - 0,5)/n] na escala vertical da

direita, com o valor da variável plotada na escala horizontal. Uma linha reta, escolhida

subjetivamente, foi desenhada através dos pontos plotados. Desenhando a linha reta, você deve

estar mais influenciado pelos pontos perto do meio do gráfico do que pelos pontos extremos. Uma

boa regra pratica e desenhar a linha aproximadamente entre 0 25.0 e 0 75.0 pontos percentis.

Essa é a maneira como a linha na foi determinada. Na estimação de quão perto os pontos estão

da linha reta, imagine um "lápis grosso" repousando ao longo da linha. Se todos os pontos forem

cobertos por esse lápis imaginário, então distribuição normal descreverá adequadamente os

dados. Uma vez que os pontos na Figura abaixo passaram no teste do "lápis gordo", conc1uimos

que a distribuição normal é um modelo apropriado.

Um gráfico de probabilidade normal pode também ser construído em um papel gráfico normal,

plotando os escores normais padrões Zj contra x(i), em que os escores normais padrões satisfazem:

)(][5.0

jzzZP

n

j

Por exemplo, se (j-0.5)/n = 0.05 então (zj) = -1.64. Para ilustrar, consideremos os dados

do exemplo acima.

Page 24: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 24

j X9i) (j - 0,5)/10 Zj

1 176 0,05 -1.64

2 183 0,15 -1.04 3 185 0,25 -0.67 4 190 0,35 -0.39 5 191 0,45 -0.13 6 192 0,55 0.13 7 201 0,65 0.39 8 205 0,75 0.67 9 214 0,85 1.04 10 220 0,95 1.64

O gráfico normal probabilístico é então dado pela seguinte figura:

Retornando ao exemplo das variedades de milho temos:

Page 25: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 25

Gráfico Normal Probabilístico:

Figura – Gráfico Normal Probabilístico dos Resíduos

Neste gráfico, se os valores observados formarem uma reta, portanto os erros seguem

uma distribuição normal. A maioria dos dados deve também estar concentrada no meio da reta

para satisfazerem a suposição de normalidade. Os valores das caudas da distribuição não devem

ser considerados com tanto rigor, mas sim analisados para se verificar se são valores extremos ou

não.

55 .. 22 .. 33 .. 44 .. VV EE RR II FF II CC AA NN DD OO AA HH OO MM OO CC EE DD AA SS TT II CC II DD AA DD EE ::

A suposição de homocedasticidade significa que a variabilidade entre repetições de um

mesmo tratamento deve ser semelhante a dos demais tratamentos. A verificação desta suposição

pode ser feita através do uso de testes ou por meio de análise gráfica.

Testes para Verificação de Homocedasticidade:

Hipóteses:

Ho : 12 = 2

2 = ... = a2

H1 : i2 = i

2 para pelo menos i j,

Diferentes testes são propostos na literatura para teste da hipótese acima. Os testes mais

conhecidos são:

a) Teste de Hartley: Exige um mesmo número de repetições entre os tratamentos.

Page 26: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 26

b) Teste de Bartlett: Pode ser utilizado para qualquer número de repetições nos tratamentos.

c) Teste de Cochran: Pode ser utilizado para qualquer número de repetições nos tratamentos.

d) Teste de Levene: Anova para resíduos .

TESTE DE HARTLEY : F máximo

O teste de Hartley também é conhecido como teste do F máximo. A estatística do teste é

dada por:

2

2

min

maxmax

S

SF

onde:

2maxS = maior variância dentre os “a” tratamentos;

2minS = menor variância dentre os “a” tratamentos;

Fmax é comparado com o valor tabelado para H(g,r-1) da tabela de Pearson e Hartley, onde

g=número de tratamentos e r= número de repetições (mesmo para todos os tratamentos).

Se Fmax > H(g,r-1) rejeita-se H0 e conclui-se que não existe homogeneidade de variância

entre os tratamentos. Caso contrário H0 não é rejeitada.

Análise Gráfica para Verificação da Homocedasticidade:

Box-Plot dos Tratamentos vs Resíduos:

Se existe homocedasticidade, espera-se que os Box-plots seja semelhantes, ou seja,

apresentem um variabilidade muito próxima nas “caixas” dos diferentes tratamentos. Se existe

heterocedasticidade, a variabilidade é diferente entre as caixas. As vezes, a heterocedasticidade

pode ser também um indicio da falta de normalidade.

Page 27: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 27

Figura – Box Plot para Residuos

Problema: Pequenas Amostras.

Gráfico de Dispersão de Resíduos vs Predito:

O gráfico de resíduos vs predito é, no caso de experimentos com um fator (ONEWAY),

semelhante ao gráfico de resíduos vs tratamento. Este não será o caso quando dois ou mais

fatores estiverem envolvidos na análise.

Se existe homocedasticidade, espera-se que os desvios se distribuam de forma homogênea

dentre de um mesmo intervalo. Se os desvios apresentarem variação com diferentes amplitudes,

temos a situação de heterocedasticidade.

Page 28: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 28

Figura – Variância Constante

Situação ideal: A variabilidade é constante, isto é, aproximadamente a mesma nos

diferentes tratamentos.

Figura – Variância não Constante

Situação de não homocedasticidade: A variabilidade cresce a medida que cresce o

valor predito.

Page 29: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 29

Figura – Variância não Constante

Situação de não homocedasticidade: A variabilidade decresce a medida que cresce

o valor predito.

Figura – Variância não Constante

Situação de não homocedasticidade: A variabilidade cresce para valores próximos a

média o valor predito.

Page 30: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 30

Figura – Variância não Constante

Situação de não homocedasticidade: A variabilidade decresce para valores

próximos a média o valor predito.

QUESTÃO:

O que fazer quando alguma das suposições ( normalidade e/ou homocedasticidade)

não são satisfeitas?

O procedimento usualmente nestes casos é o uso de transformações na variável resposta.

O uso de transformações é um artifício matemático com bons resultados quando existe uma

relação entre média e variância (heterocedasticidade regular). Nos demais casos, as

transformações dificilmente apresentam resultados satisfatórios.

Atualmente, novos procedimentos estatísticos são propostos como alternativa ao uso de

transformação dos dados. Além dos já tradicionais procedimentos de métodos não

paramétricos, hoje estão disponíveis, inclusive em todos os softwares mais conhecidos, os

métodos de Modelos Lineares Generalizados, que levam em conta a natureza da distribuição

da variável em estudo.

Page 31: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 31

55 .. 22 .. 44 .. COMPARAÇÕES MULTIPLAS:

55 .. 22 .. 44 .. 11 .. IINNTTRROODDUUÇÇÃÃOO::

A análise estatística de um problema de comparação de “a” médias nem sempre chega ao

seu final com os resultados da tabela da Análise de Variância. Se não rejeitamos H0 não existe

mais nada a ser investigado, porém se rejeitamos Ho estamos concluindo pela evidencia de que

pelo menos dois dos tratamentos em estudo, diferem significativamente. Desta forma é de

interesse prosseguir a análise a fim de se identificar as diferenças entre as médias dos diferentes

tratamentos. Esta continuação da análise é feita através de técnicas estatísticas denominadas

“Comparações Múltiplas”.

Objetivo:

Identificar, quando rejeitamos Ho numa ANOVA, que tratamentos diferem

significativamente.

Proposta:

Estabelecer uma “diferença mínima significativa(d.m.s)” entre duas médias. Toda vez

que o valor absoluto da diferença entre duas médias for maior ou igual d.m.s., as médias são

consideradas estatisticamente diferentes, ao nível de significância estabelecido.

Foram propostas diversas maneiras de estabelecer uma d.m.s. Cada proposta é na

realidade, um teste que, em geral, leva o nome do seu autor. Não existe um procedimento para a

comparação de médias que seja definitivamente o “melhor”. Vários trabalhos são encontrados na

literatura fazendo estudos comparativos dos diferentes métodos que, incluindo-se novas propostas

que freqüentemente são apresentadas. Em geral é possível mostrar a existência de procedimentos

mais eficientes para situações especificas, porém não se mostrou, até hoje, um método que seja

mais eficaz para um caso geral.

Procedimentos gráficos também são propostos, mais como uma forma descritiva de

investigar as diferenças entre tratamentos (ou grupos de tratamentos).

55 .. 22 .. 44 .. 22 .. TT EE SS TT EE TT -- TT EE SS TT EE LL SS DD (( LL EE AA SS TT SS II GG NN II FF II CC AA NN TT DD II FF FF EE RR EE NN CC EE )) ::

Page 32: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 32

Teste proposto por Fisher que também propos a expressão diferença mínima

significativa (least significant difference). É provavelmente, o teste menos usado.

Características:

A d.m.s. é definida por:

n

QMEtLSD

aN,2

2

(dados balanceados)

jiaN, nn

QMEtLSD11

2

(dados não balanceados)

Rejeita-se a igualdade entre dois tratamentos se:

LSDyy .j.i

55 .. 22 .. 44 .. 33 .. TT EE SS TT EE DD EE TT UU KK EE YY ::

O teste proposto por Tukey (1953) permite testar qualquer contraste, sempre, entre duas

médias de tratamentos, ou seja, não permite comparar grupos entre si. A d.m.s. é neste caso

definido por:

n

QME)f,a(q (dados balanceados)

ji nnQME

)f,a(q 11

2 (dados não balanceados)

onde q é chamada de amplitude total studentizada que depende do número de tratamentos (a) e

do número de graus de liberdade dos erros (f). (tabela encontrada em Montogomery ). O teste

preserva o nivel de significância para todos os contrastes.

Rejeita-se a igualdade entre dois tratamentos se:

.j.i yy

Nota:

O teste de Tukey foi proposto depois do teste t. O autor denominou a diferença mínima

significativa que obteve pelo teste de diferença honestamente significante. Deste fato resulta

que alguns softwares denominam este teste de HSD (honestly significant difference).

55 .. 22 .. 44 .. 44 .. AA PP RR EE SS EE NN TT AA ÇÇ ÃÃ OO DD OO SS RR EE SS UU LL TT AA DD OO SS ::

Page 33: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 33

Os resultados de um teste de comparações múltiplas, qualquer que seja o método

utilizado, é usualmente apresentado através de um método de letras, da seguinte forma:

Inicialmente ordena-se as médias de tratamentos em ordem crescente (ou decrescente).

Coloca-se uma letra do alfabeto na primeira média e em seguida compara-se com as médias

seguintes. Se a diferença for superior ao valor da d.m.s. a diferença é considerada significativa e

portanto é atribuída uma outra letra a média que foi comparada.

Ao final temos que médias de tratamentos que não diferem significativamente tem em

comum uma letra enquanto que médias que diferem não tem nenhuma letra em comum.

Consideremos as seguintes situações onde as médias estão ordenadas em ordem

decrescente ( A > C > D > B):

Tratamentos Situações

Caso 1 Caso 2 Caso 3 Caso 4 Caso 5

A a a a a a

C a b b b a b

D a c c b c b c

B a d c c c

Interpretando:

Caso 1: Situação onde não foi rejeitado H0 na tabela de ANOVA, ou seja, não

existem diferenças entre quaisquer dois tratamentos.

Caso 2: Outra situação extrema, todos os tratamentos diferem entre si.

Caso 3: Temos que A C diferem de todos os tratamentos e D e B são

estatisticamente iguais entre si.

Caso 4: A difere de todos os demais tratamentos, C e D são estatisticamente iguais

mas C difere de todos os demais enquanto que D é também estatisticamente igual

a B.

Caso 5: A é estatisticamente igual a C mas difere dos demais, enquanto que C é

estatisticamente também igual a D e diferente de B. Por sua vez D é

estatisticamente igual a B.

Exemplo das Variedades de Milho:

Page 34: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 34

Diferenças Mínimas Significativas:

547.35

7*2*119.22

,2 n

QMEtLSD

aN

787.45

7*04.4),(

n

QMEfaqTukey

Variedades i.y Fisher Tukey

A 23 A A

C 26 A B A B

B 27 B A B

D 31 C B

Por exemplo:

C – A = 26 – 23 = 3 < 3.54 = LSD C e A não diferem significativamente

D – A = 31 – 23 = 8 > 3.54 = LSD D e A diferem significativamente e D é superior a A

D – A = 31 – 23 = 8 > 4.78= Tukey D e A diferem significativamente e D é superior a A

..........

Conclusão:

Pelo método de Fisher temos que a Variedades que apresenta maior rendimento são é a D

que é estatisticamente superior as demais. B e C e também A e C São também estatisticamente

iguais.

Pelo método de Tukey D, B e C , B, C e A são estatisticamente iguais. D, B e C apresentam

os melhores rendimentos porém B e C também são iguais a D, logo apenas D e A são

estatisticamente iguais conseqüentemente D seria a variedade recomendada para uso.

Portanto ambos os métodos apontam para uma mesma variedade a ser utilizada.

Page 35: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 35

55 .. 33 .. EE XX PP EE RR II MM EE NN TT OO SS EE MM BB LL OO CC OO SS AA LL EE AA TT OO RR II ZZ AA DD OO SS ::

55 .. 33 .. 11 .. II NN TT RR OO DD UU ÇÇ ÃÃ OO ::

Existem situações experimentais onde as unidades experimentais são heterogêneas devido

a presença de uma (ou mais) fonte(s) de variação(ões) conhecida(s) e que pode(m) ser

controlada(s) quando da realização do experimento. Nestes casos o processo de aleatorização

deve ser realizado após o agrupamento das unidades experimentais em subconjuntos

homogêneos. Portanto temos uma restrição no processo de aleatorização, ou seja, a atribuição

dos tratamentos às unidades experimentais deve ser realizada somente após a identificação dos

subconjuntos homogêneos, usualmente chamado de “blocos”. Desta forma, espera-se que exista

uma variabilidade entre unidades experimentais de diferentes blocos, explicada pela fonte de

variação conhecida, e uma homogeneidade (baixa variabilidade) entre as unidades experimentais

de um mesmo “bloco”.

O uso de “blocos” pode também facilitar a condução do experimento. Pode-se por

exemplo, existir uma limitação de tempo para realização do experimento (intervalo de tempo,

dia, semana...) não sendo possível, necessariamente, garantir as mesmas condições experimentais

a cada período. Nestes casos cada período pode ser considerado como um bloco de forma a isolar

a eventuais fontes de variabilidade derivadas do fato de todos experimentos não serem realizados

ao mesmo tempo. .

De acordo com o número de fontes de variabilidade conhecidas que tornam as unidades

homogêneas, temos diferentes tipos de planejamento com restrições na aleatorização.

Uma fonte de Variação Conhecida: Planejamento Aleatorizado em Blocos

Duas Fontes de Variação Conhecidas: Planejamento em Quadrado Latino

Três Fontes de Variação Conhecidas: Planejamento em Quadrado Greco-Latino

55 .. 33 .. 22 .. PLANEJAMENTO ALEATORIZADO EM BLOCOS:

Problema:

As unidades experimentais são heterogêneas devido a presença de uma fonte de

variabilidade conhecida e que pode ser controlada na realização do experimento de forma a se

obter subgrupos homogêneos.

Objetivo:

Page 36: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 36

Agrupar as unidades experimentais em subgrupos homogêneos de forma a manter sob

controle a fonte de variabilidade conhecida garantindo desta forma que os resultados a serem

obtidos serão devidos somente aos efeitos dos tratamentos em estudo.

Exemplo:

Um professor conduziu um experimento cujo objetivo era o de com comparar

quatro diferentes fontes de informação ( A – Jornal; B – Televisão; C – Revistas; D – Rádio). Para

verificar este objetivo, foi escolhido aleatoriamente um conjunto de 24 alunos dentre os quais 12

cursavam a 1a série do ensino médio (Grupo II) e 12 a 6a série do ensino fundamental (Grupo I).

Os alunos foram então divididos em 2 grupos, segundo a série que cursavam e para cada um foi

atribuído aleatoriamente uma fonte de informação. Os alunos tomaram então conhecimento de

certa noticia através da sua fonte de informação sendo então submetidos a um teste de

conhecimento sobre o assunto, cujos resultados são apresentados abaixo:

Fonte de Informação

A B C D

Grupo I 65 56 58 38

69 49 65 30

73 54 57 34

Grupo II 72 73 76 71

79 77 69 65

80 69 71 62

Representação Gráfica:

N o tas p o r G ru p o s d e A lu n o s

G ru po s d e Alu n os

No

tas

2 5

3 5

4 5

5 5

6 5

7 5

8 5

0 1 2 3

N o tas p o r F o n tes d e In fo rm ação

F o n tes d e In fo rm ação

No

tas

2 5

35

45

55

65

75

85

0 1 2 3 4 5

Page 37: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 37

Definições:

Blocos: sub-grupos de unidades experimentais homogêneas

Blocos Completos: em cada bloco podemos ter pelo menos uma unidade experimental

submetida a cada tratamento.

Blocos Incompletos: o número de unidades experimentais é inferior, em um ou mais blocos, ao

número de tratamentos, logo nem todos os tratamentos são aplicados em todos os blocos.

Aleatorização: Processo de atribuição aleatória dos tratamentos às unidades experimentais

dentro de cada bloco.

Importante:

Um bloco deve ser entendido como uma restrição a aleatorização. Se não

for considerado este principio, ele provavelmente deve ser um outro fator e

deve ser tratado como tal, ou seja, como um experimento fatorial (próximo

capítulo).

N o ta s p o r F o n te s d e In fo rm a ç õ e s e G ru p o s d e A lu n o s

F o n tes d e In fo rm ação

No

tas

1

1

1

1

1

1

1

1

1

1

1

1

2

22

2

2

2

2

22 2

2

2

25

35

45

55

65

75

85

0 .5 1 .0 1.5 2 .0 2 .5 3 .0 3 .5 4 .0 4 .5

Page 38: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 38

55 .. 33 .. 22 .. 11 .. AA NN ÁÁ LL II SS EE EE SS TT AA TT ÍÍ SS TT II CC AA ::

Consideremos um experimento onde se deseja comparar “a” tratamentos sujeito à

unidades experimentais heterogêneas segundo uma fonte de variação com “b” possíveis situações.

“a” tratamentos e “b” blocos.

Tratamentos Blocos

1 2 … B

1 y111 y112 y121 y122 ... y1b1 y1b2

y113 y114 y123 y124 y1b3 y1b4

…. …… …… …… …..

a ya11 ya12 ya21 ya22 ... yab1 yab2

ya13 ya1n ya23 ya2n yab3 yabn

Onde:

yijk : i = 1, 2, ..., a tratamentos

j = 1, 2, ..., b blocos

k = 1, 2, ...,nij unidades experimentais por tratamentos em cada bloco.

Observação: Se nij é o mesmo ( =n ) para todo i e j temos experimento balanceado.

Neste caso

na : número total de unidades experimentais por blocos

nab : número total de unidades experimentais no experimento

nb : número de unidades experimentais que receberam cada tratamento.

Simplificação (Caso Usual):

Consideremos a situação em que existe somente uma unidade experimental submetida a

cada tratamento em todos os blocos, isto é, n = 1 N = ab.

Page 39: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 39

Modelo:

yij = + i + j + ij

: efeito comum que independe de blocos ou tratamentos

i : efeito de tratamentos; i = 1, ..., a

j: efeito de blocos; j = 1, ..., b

ij : Erros aleatórios

Estimadores :

..yˆ

...ii yyˆ

..j.j yyβ

..j..i

..j..i..

Jiij

yyy

yy..yyy

ˆ ˆ ˆy

Teste de Hipóteses:

Modelo:

yij = + i + j + ij

Problema:

Verificar a igualdade de tratamentos.

Hipótese de interesse: i um menos pelo para 0 :H

i 0 :H

i1

io

Partição da Soma de Quadrados (n=1):

2

22

1

2

1

2

1 11

2

a

1i

a

1i

b

1j

..j..iij

b

1j

..j....i

a

1i

b

j

..j..ij....i

a

i

a

i

b

j

....j.j..i.i

b

j

..ij

yyyy yya yyb

.............

yyyy..yyyy

yyyyyyyyyy

ij

..ij

Page 40: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 40

ou seja:

SQT = SQModelo + SQE

= SQTr + SQBloco + SQE

Graus de liberdade: (n=1)

Total: N – 1 ( N = nab = ab) tratamentos: a – 1

blocos: b – 1

erro: (a – 1) (b – 1)

Esperança dos Quadrados Médios

E (QME) = 2

E (QMT) = 2 +1

1

2

a

b

a

i

i

E (QMB) = 2 +1b

a

a

1i

2i

Sob Ho E (QME) = E (QMT) = E(QMB) = 2

Tabela de ANOVA:

ANOVA GL SQ QM

Modelo a + b – 2 SQM -

. Blocos b – 1 SQB SQB/b-1

. Tratam. a – 1 SQTr SQTr/a-1

Erro (a – 1) (b – 1) SQE SQE/(a-1)(b-1)

Total N - 1

Estatística de Teste:

QME

QMTFc

Sob a hipótese ij ~ N (0, 2)

Page 41: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 41

Fc ~ Fa-1,(a-1)(b-1)

E, rejeita-se H0 se Fc > Ft

Verificar a igualdade de blocos.

Quando os blocos controlam uma causa de variação conhecida, o teste de efeitos de blocos

é totalmente desnecessário. A definição do experimento com uma estrutura de blocos é devido ao

fato de que é conhecida a variabilidade existente nas unidades experimentais em função das

características que definem os blocos

Entretanto, o pesquisador, às vezes, organiza blocos para controlar uma fonte de variação

sobre a qual tem duvidas sobre a sua significância. Nestes casos depois de realizado o

experimento, deseja-se verificar a diferença entre blocos, pois assim conclusões poderão ser

tomadas de forma a contribuir no planejamento de experimentos futuros.

Neste caso, a hipótese a ser testada é dada por:

Ho : j= 0 j

H1 : j 0 para pelo menos um j

Temos que sob Ho

E (QME) = E (QMB) = 2

Logo:

)b)(a(,b*c F~

QME

QMBF 111

e rejeita-se H0 se: )b)(a(,b*c FF 111

Se os pressupostos que levaram a fixar a estrutura de blocos estão corretos, o teste F*

deve ser sempre significativo, ou seja, deve verificar a informação de diferença entre as unidades

experimentais (olhar direto para o teste F para tratamentos e na para blocos).

Importante:

Os experimentos em blocos ao acaso são feitos essencialmente para comparar

tratamentos. Alguns autores aconselham até a não calcular o valor de F para blocos porque, como

os tratamentos são aleatorizados dentro dos blocos e os blocos são definidos de forma não

aleatória. O teste F para blocos é, portanto, inadequado.

Page 42: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 42

Adequabilidade do Modelo:

Devem ser utilizados os mesmos procedimentos vistos para o caso de um único fator,

devendo no entanto o gráfico de resíduos ser utilizado nas seguintes alternativas:

- Gráfico de resíduos x predito

- Gráfico de resíduos x tratamentos

- Gráfico de resíduos x blocos

Continuação do Exemplo:

Duas Situações Ajuste do Modelo sem e com Blocos:

Modelo sem Bloco:

Source DF Sum of Squares Mean Square F Value Pr > F

Model 3 1668.000000 556.000000 4.10 0.0203

Error 20 2714.000000 135.700000

Corrected Total 23 4382.000000

Page 43: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 43

R-Square Coeff Var Root MSE Nota Mean

0.380648 18.49053 11.64903 63.00000

Source DF Type I SS Mean Square F Value Pr > F

Fonte 3 1668.000000 556.000000 4.10 0.0203

Modelo com Blocos:

Source DF Sum of Squares Mean Square F Value Pr > F

Model 4 3612.000000 903.000000 22.28 <.0001

Error 19 770.000000 40.526316

Corrected Total 23 4382.000000

R-Square Coeff Var Root MSE Nota Mean

0.824281 10.10481 6.366028 63.00000

Source DF Type I SS Mean Square F Value Pr > F

Bloco 1 1944.000000 1944.000000 47.97 <.0001

Fonte 3 1668.000000 556.000000 13.72 <.0001

Page 44: Ipaee capitulo5

Capítulo 5 – Experimentos com um Único Fator(Oneway)

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 44

Tukey's Studentized Range (HSD) Test for Nota

NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than

REGWQ.

Alpha 0.05

Error Degrees of Freedom 19

Error Mean Square 40.52632

Critical Value of Studentized Range 3.97655

Minimum Significant Difference 10.335

Means with the same letter are

not significantly different.

Tukey Grouping Mean N Fonte

A 73.000 6 Jornal

A 66.000 6 Revistas

A 63.000 6 Televisão

B 50.000 6 Rádio