Parte 3 Estatística aplicada a métodos analíticos e controle de equipamentos Cássio Luís...

Parte 3Estatística aplicada a métodos

analíticos e controle de equipamentos

Cássio Luís Fernandes de Oliveira

Quimiometria

Comparando da média com teste t• O teste t é usado para comparar grupos de medidas

para se determinar se são ou não diferentes entre si.• Para se verificar se uma média é igual a outra faz se

o teste da “HIPÓTESE NULA”: As médias são iguais e só existem erros aleatórios.

• A estatística nos ajuda a obter a probabilidade que a diferença entre médias sejam devido somente a erros aleatórios.

• Geralmente, a hipótese nula é rejeitada se existe uma probabilidade menor que 5% do erro ser aleatório – ou seja, existe 95% de chance da conclusão estar correta.

Comparando da média com teste tExistem vários casos de comparação de médias:

1) Medidas repetidas de um analito e comparação com um valor de referência (a média obtida é

igual ao valor de referência?).

2) Medidas repetidas de um analito em uma amostra, usando dois métodos diferentes fornecem duas

médias diferentes (serão as médias iguais?).

3) Duas amostras distintas são medidas por dois métodos diferentes. Os métodos produzem

resultados iguais?)

Comparando resultados medidos com um valor “referência”

Imagine um problema como o formulado abaixo:

Uma amostra de um reagente foi adquirida como sendo um material padrão de referência certificado pelo NIST e

contendo 3,19 g/L de enxofre.

Quatro medidas para quantificar enxofre neste padrão foram feitas no laboratório e resultou nos valores: 3,29 g/L,

3,22 g/L, 3,30 g/L e 3,23 g/L.

ESTAS VALORES CONCORDAM COM O VALOR FORNECIDO PELO NIST??

Relembrando o cálculo da média e do desvio padrão:

n

xx

n

ii

1 Lgx /26,34

23,330,322,329,3

1

)(1

2

n

xxs

n

ii

Lgs /041,014

)26,323,3()26,330,3()26,322,3()26,329,3( 2222

Observações dos resultados

• O resultado mais baixo (3,22 g/L) é somente 0,9% maior que o certificado pelo NIST.

• O valor maior (3,30 g/L) é somente 3,4% maior que o certificado pelo NIST.

• A média dos resultados (3,26 g/L) é somente 2,2% superior ao certificado pelo NIST.

• O valor certificado pelo NIST está a menos de duas vezes do desvio padrão da média.

O resultado ideal da determinação da média

O valor ideal das medidas de enxofre seria que a média fosse o próprio valor de referência (3,19 g/L).

Supondo que somente erros aleatórios produziram diferenças no valor ideal e o obtido, pergunta-se: a média

obtida, levando-se em conta o intervalo de confiança, é igual ou diferente do valor de

referência?

n

stxconfiançadeIntervalo n 1

Como o intervalo de confiança leva em conta o t de Student, é através dele que deve se concluir se os valores correspondem ao referência.

n

ts ideal.referênciavalor confiança de intervalo

Tomando que na situação ideal a média deveria ser o referência e a média obtida está dentro do intervalo de

confiança, tem-se que:

Fazendo algumas passagens matemáticas....

ns

xtideal

referênciavalor


Pela equação anterior pode-se, mediante a escolha de um nível de confiança para o t de Student (ex. 95%), da média, do desvio padrão e do valor de referência calcular o t ideal.

Este t ideal (calculado) deve ter um valor tal que seja, pelo menos, menor que aquele t previsto (tabelado) para o nível

de confiança desejado e com n-1 graus de confiança.

Se tcalculado > ttabelado , então a DIFERENÇA É SIGNIFICANTEMENTE DIFERENTE

Se tcalculado < ttabelado , então a DIFERENÇA NÃO É SIGNIFICANTEMENTE DIFERENTE


41,34041,0

19,326,3

referênciavalor

calculado

calculado

t

ns

xt

Se consideramos o nível de confiança de 95% e 3 graus de liberdade (n-1; 4-1) o ttabelado é de 3,182.

Neste caso tcalculado

> ttabelado

(3,41 > 3,182), o

resultado obtido é diferente daquele do valor de referência.

tabela

A chance que se tenha acertado ao se concluir que eles são diferentes é > 95%.

Comparando resultados medidos com um valor “referência” - Conclusão

Testes estatísticos não nos desobrigam a aceitar ou rejeitar um resultado.

Os testes nos orientam na forma de PROBABILIDADES.

Concluiu-se que a média é diferente do valor de referência seguindo um padrão de confiança estabelecido

como 95% (seria diferente se fosse 98% ?).

Esta conclusão foi obtida somente com quatro medidas. Para um maior nível de confiança seria necessário

aumentar o número de repetições.


ATENÇÃO!!!!

Comparando medidas repetidasObserve os resultados na determinação da massa de ar atmosférico

contido em um certo volume obtido por dois métodos diferentes.

Método 1 – gramas Método 2 – gramas

2,31017 2,30143

2,30986 2,29890

2,31010 2,29816

2,31001 2,30182

2,31024 2,29869

2,31010 2,29940

2,31028 2,29949

- 2,29889

Média = 2,31011 e s = 0,000143 Média = 2,29947 e s = 0,00138

Estes dois grupos de medidas repetidas fornecem resultados “IDÊNTICOS” ou “DIFERENTES” dentro de um

intervalo de confiança??

Comparando medidas repetidas

Para se responder a esta pergunta, mais uma deve ser feita:

Os desvios-padrão dos dois conjuntos de dados são ou não significantemente diferentes entre si?

Para responder esta última pergunta usa-se o teste F

padrão desviomaior o possui que aquele é 1 conjunto o Obs.

2 conjunto do padrão desvio do quadrado o é

1 conjunto do padrão desvio do quadrado o é 22

21

12

21

s

s

s

sFcalculado


O valor de F calculado deve ser comparado com um valor de F tabelado para um dado

nível de confiança.

-Se o Fcalculado

> Ftabelado

então os desvios-padrão

são significantemente diferentes entre si.

-Se o Fcalculado

< Ftabelado

então os desvios-padrão

não são significantemente diferentes entre si.

Comparando medidas repetidasO desvio padrão do método 1 é 0,000143

O desvio padrão do método 2 é 0,00138

1,93)000143,0(

)00138,0(2

2

calculadoF

Comparando medidas repetidasPela tabela F, levando-se em conta que o método de maior desvio

(método 2) tem 8 medidas (7 graus de liberdade) e o método de menor desvio (método 1) tem 7 medidas (6 graus de liberdade), e assumindo

nível de confiança 95%, chega-se 21,4tabeladoF


outro. do um diferentes

ivamentesignificat são padrões desvios os que se-Conclui

Como

1,93

21,4

tabeladocalculado

calculado

tabelado

FF

F

F

Uma vez que determina-se que os desvios padrão são significativamente diferentes, para se chegar à conclusão

se os resultados obtidos pelo método 1 é igual ou diferente do método 2, usa-se o valor calculado de t de

Student e o compara com o tabelado usando-se as seguintes equações:

Equações para desvios-padrão diferentes

722,72

1)/(

1)/(

7,21

2

22

22

1

21

21

2

2

22

1

21

2

22

1

21

22

21

nns

nns

ns

ns

liberdadedeGraus

ns

ns

xxtcalculado

Pela tabela de t de Student verifica-se que para 7 graus de liberdade e para 95% de confiança o t

tabelado= 2,365

Ou seja: tcalculado

> ttabelado

Então conclui-se que os resultados são significativamente diferentes.

tabela

tcalculado

= 21,7

E como seria se os desvios-padrão fossem iguais?

Nos casos dos desvios-padrão iguais as equações seriam diferentes e, como exemplo de aplicação, supondo que os desvios-padrão obtidos nas duas técnicas fossem iguais:

132

2,20

00102,02

)1()1(

21

21

2121

21

2221

21

nnliberdadedeGraus

nn

nn

s

xxt

nn

nsnss

agrupadocalculado

agrupado

tcalculado

= 20,2

Pela tabela, usando 13 graus de liberdade:

ttabelado = 2,228 > 2,131 tcalculado > ttabelado

Mesmo assim os resultados seriam diferentes.

Comparando diferenças individuaisObserve a problemática abaixo:

Tem-se 6 amostras com diferentes quantidades de lipídeos e que foram analisadas por dois métodos diferentes (A e B).

Os resultados estão em g/kg.

O método B é diferente do método A ?

Amostra Método A Método B diferença

1 1,46 1,42 0,04

2 2,22 2,38 -0,16

3 2,84 2,67 0,17

4 1,97 1,80 0,17

5 1,13 1,09 0,04

6 2,35 2,25 0,10

Média da diferença = + 0,060

Comparando diferenças individuais

Para se responder a esta pergunta realiza-se o teste t nas diferenças individuais entre os

resultados de cada amostra:

1

)(

B eA métodos os entre média diferença a é

2

n

dds

d

ns

dt

id

dcalculado

Comparando diferenças individuais

Para o exemplo temos então:

20,16122,0

06,0

122,01

)( 2

ns

dt

n

dds

dcalculado

id

tcalculado

= 1,20 e graus de liberdade = 6-1=5

ttabelado

= 2,571 para 5 graus de liberdade e 95% de confiança

Como tcalculado

< ttabelado

então o método A pode ser

comparado ao B, ou seja, há mais que 5% de chance que os dois métodos sejam iguais

Tabela F

Distribuição t de Student e o Intervalo de confiança3,182

Parte 3 Estatística aplicada a métodos analíticos e controle de equipamentos Cássio Luís...

Documents

Transcript of Parte 3 Estatística aplicada a métodos analíticos e controle de equipamentos Cássio Luís...