Parte 3 Estatística aplicada a métodos analíticos e controle de equipamentos Cássio Luís...
Transcript of Parte 3 Estatística aplicada a métodos analíticos e controle de equipamentos Cássio Luís...
Parte 3Estatística aplicada a métodos
analíticos e controle de equipamentos
Cássio Luís Fernandes de Oliveira
Quimiometria
Comparando da média com teste t• O teste t é usado para comparar grupos de medidas
para se determinar se são ou não diferentes entre si.• Para se verificar se uma média é igual a outra faz se
o teste da “HIPÓTESE NULA”: As médias são iguais e só existem erros aleatórios.
• A estatística nos ajuda a obter a probabilidade que a diferença entre médias sejam devido somente a erros aleatórios.
• Geralmente, a hipótese nula é rejeitada se existe uma probabilidade menor que 5% do erro ser aleatório – ou seja, existe 95% de chance da conclusão estar correta.
Comparando da média com teste tExistem vários casos de comparação de médias:
1) Medidas repetidas de um analito e comparação com um valor de referência (a média obtida é
igual ao valor de referência?).
2) Medidas repetidas de um analito em uma amostra, usando dois métodos diferentes fornecem duas
médias diferentes (serão as médias iguais?).
3) Duas amostras distintas são medidas por dois métodos diferentes. Os métodos produzem
resultados iguais?)
Comparando resultados medidos com um valor “referência”
Imagine um problema como o formulado abaixo:
Uma amostra de um reagente foi adquirida como sendo um material padrão de referência certificado pelo NIST e
contendo 3,19 g/L de enxofre.
Quatro medidas para quantificar enxofre neste padrão foram feitas no laboratório e resultou nos valores: 3,29 g/L,
3,22 g/L, 3,30 g/L e 3,23 g/L.
ESTAS VALORES CONCORDAM COM O VALOR FORNECIDO PELO NIST??
Relembrando o cálculo da média e do desvio padrão:
n
xx
n
ii
1 Lgx /26,34
23,330,322,329,3
1
)(1
2
n
xxs
n
ii
Lgs /041,014
)26,323,3()26,330,3()26,322,3()26,329,3( 2222
Observações dos resultados
• O resultado mais baixo (3,22 g/L) é somente 0,9% maior que o certificado pelo NIST.
• O valor maior (3,30 g/L) é somente 3,4% maior que o certificado pelo NIST.
• A média dos resultados (3,26 g/L) é somente 2,2% superior ao certificado pelo NIST.
• O valor certificado pelo NIST está a menos de duas vezes do desvio padrão da média.
O resultado ideal da determinação da média
O valor ideal das medidas de enxofre seria que a média fosse o próprio valor de referência (3,19 g/L).
Supondo que somente erros aleatórios produziram diferenças no valor ideal e o obtido, pergunta-se: a média
obtida, levando-se em conta o intervalo de confiança, é igual ou diferente do valor de
referência?
n
stxconfiançadeIntervalo n 1
Como o intervalo de confiança leva em conta o t de Student, é através dele que deve se concluir se os valores correspondem ao referência.
n
ts ideal.referênciavalor confiança de intervalo
Tomando que na situação ideal a média deveria ser o referência e a média obtida está dentro do intervalo de
confiança, tem-se que:
Fazendo algumas passagens matemáticas....
ns
xtideal
referênciavalor
Comparando resultados medidos com um valor “referência”
Pela equação anterior pode-se, mediante a escolha de um nível de confiança para o t de Student (ex. 95%), da média, do desvio padrão e do valor de referência calcular o t ideal.
Este t ideal (calculado) deve ter um valor tal que seja, pelo menos, menor que aquele t previsto (tabelado) para o nível
de confiança desejado e com n-1 graus de confiança.
Se tcalculado > ttabelado , então a DIFERENÇA É SIGNIFICANTEMENTE DIFERENTE
Se tcalculado < ttabelado , então a DIFERENÇA NÃO É SIGNIFICANTEMENTE DIFERENTE
Comparando resultados medidos com um valor “referência”
41,34041,0
19,326,3
referênciavalor
calculado
calculado
t
ns
xt
Se consideramos o nível de confiança de 95% e 3 graus de liberdade (n-1; 4-1) o ttabelado é de 3,182.
Neste caso tcalculado
> ttabelado
(3,41 > 3,182), o
resultado obtido é diferente daquele do valor de referência.
tabela
A chance que se tenha acertado ao se concluir que eles são diferentes é > 95%.
Comparando resultados medidos com um valor “referência” - Conclusão
Testes estatísticos não nos desobrigam a aceitar ou rejeitar um resultado.
Os testes nos orientam na forma de PROBABILIDADES.
Concluiu-se que a média é diferente do valor de referência seguindo um padrão de confiança estabelecido
como 95% (seria diferente se fosse 98% ?).
Esta conclusão foi obtida somente com quatro medidas. Para um maior nível de confiança seria necessário
aumentar o número de repetições.
Comparando resultados medidos com um valor “referência”
ATENÇÃO!!!!
Comparando medidas repetidasObserve os resultados na determinação da massa de ar atmosférico
contido em um certo volume obtido por dois métodos diferentes.
Método 1 – gramas Método 2 – gramas
2,31017 2,30143
2,30986 2,29890
2,31010 2,29816
2,31001 2,30182
2,31024 2,29869
2,31010 2,29940
2,31028 2,29949
- 2,29889
Média = 2,31011 e s = 0,000143 Média = 2,29947 e s = 0,00138
Estes dois grupos de medidas repetidas fornecem resultados “IDÊNTICOS” ou “DIFERENTES” dentro de um
intervalo de confiança??
Comparando medidas repetidas
Para se responder a esta pergunta, mais uma deve ser feita:
Os desvios-padrão dos dois conjuntos de dados são ou não significantemente diferentes entre si?
Para responder esta última pergunta usa-se o teste F
padrão desviomaior o possui que aquele é 1 conjunto o Obs.
2 conjunto do padrão desvio do quadrado o é
1 conjunto do padrão desvio do quadrado o é 22
21
12
21
s
s
s
sFcalculado
Comparando medidas repetidas
O valor de F calculado deve ser comparado com um valor de F tabelado para um dado
nível de confiança.
-Se o Fcalculado
> Ftabelado
então os desvios-padrão
são significantemente diferentes entre si.
-Se o Fcalculado
< Ftabelado
então os desvios-padrão
não são significantemente diferentes entre si.
Comparando medidas repetidasO desvio padrão do método 1 é 0,000143
O desvio padrão do método 2 é 0,00138
1,93)000143,0(
)00138,0(2
2
calculadoF
Comparando medidas repetidasPela tabela F, levando-se em conta que o método de maior desvio
(método 2) tem 8 medidas (7 graus de liberdade) e o método de menor desvio (método 1) tem 7 medidas (6 graus de liberdade), e assumindo
nível de confiança 95%, chega-se 21,4tabeladoF
Comparando medidas repetidas
outro. do um diferentes
ivamentesignificat são padrões desvios os que se-Conclui
Como
1,93
21,4
tabeladocalculado
calculado
tabelado
FF
F
F
Uma vez que determina-se que os desvios padrão são significativamente diferentes, para se chegar à conclusão
se os resultados obtidos pelo método 1 é igual ou diferente do método 2, usa-se o valor calculado de t de
Student e o compara com o tabelado usando-se as seguintes equações:
Equações para desvios-padrão diferentes
722,72
1)/(
1)/(
7,21
2
22
22
1
21
21
2
2
22
1
21
2
22
1
21
22
21
nns
nns
ns
ns
liberdadedeGraus
ns
ns
xxtcalculado
Pela tabela de t de Student verifica-se que para 7 graus de liberdade e para 95% de confiança o t
tabelado= 2,365
Ou seja: tcalculado
> ttabelado
Então conclui-se que os resultados são significativamente diferentes.
tabela
tcalculado
= 21,7
E como seria se os desvios-padrão fossem iguais?
Nos casos dos desvios-padrão iguais as equações seriam diferentes e, como exemplo de aplicação, supondo que os desvios-padrão obtidos nas duas técnicas fossem iguais:
132
2,20
00102,02
)1()1(
21
21
2121
21
2221
21
nnliberdadedeGraus
nn
nn
s
xxt
nn
nsnss
agrupadocalculado
agrupado
tcalculado
= 20,2
Pela tabela, usando 13 graus de liberdade:
ttabelado = 2,228 > 2,131 tcalculado > ttabelado
Mesmo assim os resultados seriam diferentes.
Comparando diferenças individuaisObserve a problemática abaixo:
Tem-se 6 amostras com diferentes quantidades de lipídeos e que foram analisadas por dois métodos diferentes (A e B).
Os resultados estão em g/kg.
O método B é diferente do método A ?
Amostra Método A Método B diferença
1 1,46 1,42 0,04
2 2,22 2,38 -0,16
3 2,84 2,67 0,17
4 1,97 1,80 0,17
5 1,13 1,09 0,04
6 2,35 2,25 0,10
Média da diferença = + 0,060
Comparando diferenças individuais
Para se responder a esta pergunta realiza-se o teste t nas diferenças individuais entre os
resultados de cada amostra:
1
)(
B eA métodos os entre média diferença a é
2
n
dds
d
ns
dt
id
dcalculado
Comparando diferenças individuais
Para o exemplo temos então:
20,16122,0
06,0
122,01
)( 2
ns
dt
n
dds
dcalculado
id
tcalculado
= 1,20 e graus de liberdade = 6-1=5
ttabelado
= 2,571 para 5 graus de liberdade e 95% de confiança
Como tcalculado
< ttabelado
então o método A pode ser
comparado ao B, ou seja, há mais que 5% de chance que os dois métodos sejam iguais
FIM
Tabela F
Distribuição t de Student e o Intervalo de confiança3,182