Parte 2 Estatística aplicada a métodos analíticos e controle de equipamentos Cássio Luís...
Transcript of Parte 2 Estatística aplicada a métodos analíticos e controle de equipamentos Cássio Luís...
Parte 2Estatística aplicada a métodos
analíticos e controle de equipamentos
Cássio Luís Fernandes de Oliveira
Quimiometria
Introdução
Estatística
Ciência da obtenção, tratamento e interpretação dos dados
Ferramenta necessária para transformação dos dados em informação frente à variação inerente aos
dados
A ESTATÍSTICA NÃO PODE SUBSTITUIR O CONHECIMENTO TÉCNICO E O BOM SENSO
Coloque isso na cabeça
• Todas as medidas possuem um erro experimental.
• Nunca é possível ter certeza absoluta de um resultado.
• A estatística fornece ferramentas que possibilitam conclusões com uma grande probabilidade de
estarem corretas e de rejeitar conclusões que sejam improváveis.
Distribuição Gaussiana• Se um experimento é repetido várias vezes e o
erro é puramente aleatório, então os resultados tendem a se agrupar em torno de
um valor médio.
• Quanto mais se repete um experimento, mais os resultados se aproximam de uma curva
idealmente suave.
Distribuição Gaussiana
Distribuição Gaussiana
Intervalo dos valores medidos
Fre
quên
cia
com
qu
e as
m
edid
as a
pare
cem
no
inte
rval
o
Exemplo de um resultado “caseiro”
Conceitos básicos• População: qualquer conjunto de n indivíduos ou valores, finitos
ou infinitos.
• Amostra: conjunto de n elementos extraídos de uma população para se fazer inferência sobre a população.
• Parâmetro: qualquer característica da população.• Estatística: qualquer característica da amostra. Representa uma
estimativa do parâmetro com um grau de probabilidade ou incerteza associado.
• Estatística descritiva: conjunto de características ou estatística que permitem descrever numericamente um conjunto de dados através de medidas da tendência central e de dispersão dos dados.
• Grau de liberdade: número de termos independentes utilizados no cálculo de uma estatística.
Exemplo
Inferência ?
Valor Médio• O valor médio de um conjunto
de medidas é obtido pela média aritmética – também é chamado de média ou valor verdadeiro. n
xx
n
ii
1
médiaou médio valor - x
n
n
ii xxxx
..... - (soma) somatória - 211
medidas de número - n
dado um de individual valor - ix
Valor Médio - Exemplo
• Foram feitas 5 medidas que resultaram em: 0,50; 0,51; 0,48; 0,54; 0,40.
• Qual o valor médio?
49,0486,05
43,2
5
40,054,048,051,050,0
5
5
1
i
ixx
Desvio-padrão, s
• Mede como os dados estão agrupados em torno da média.
• Quanto menor for o desvio padrão mais próximos da média estarão agrupados os dados
1
)(1
2
n
xxs
n
ii
• Um experimento que produz um pequeno desvio padrão é mais preciso do que aquele que com grande desvio padrão.
medidas de número -
médio valor -
medida da individual valor -
n
x
xi
Desvio-padrão - Exemplo• Foram feitas 5 medidas que resultaram em: 0,50; 0,51; 0,48; 0,54; 0,40.
• Qual o desvio padrão?
xi
0,50 0,0140 0,000196
0,51 0,0240 0,000576
0,48 -0,0060 0,000036
0,54 0,0540 0,002916
0,40 -0,0860 0,007396
0,011120
xxi 2)( xxi
O valor médio já foi calculado anteriormente = 0,486
n
ii xx
1
2)(
Desvio-padrão – Exemplo (continuação)
05,0052726,000278,01
)(
00278,04
01112,0
1
)(
41 então 5
:medidas cinco são Como
1
2
1
2
n
xxs
n
xx
nn
n
ii
n
ii
Variância
1
)( 2
12
n
xxsVariância
i
n
i
A variância é o quadrado do desvio padrão:
No exemplo anterior a variância seria de:
00278,04
01112,0
1
)(variância 1
2
n
xxn
ii
Desvio Padrão Relativo
x
sDSR 100
O desvio padrão relativo (também chamado de coeficiente de variação) é expresso em
porcentagem do valor médio:
%11%848971,10486,0
052726,0100
486,0
052726,0
:anterior exemplo No
DSR
x
s
Distribuição normal e desvio padrãoQuanto menor o desvio padrão maior é o agrupamento das medidas
em torno da média = maior precisão.
Quanto maior o desvio padrão menor é o agrupamento das medidas em torno da média = menor precisão
Exemplo: Supor que foram feitas “n” pesagens, usando-se três balanças diferentes, cujas médias foram de 10 g.
Embora a média para as três balanças sejam iguais, a precisão delas podem ser diferentes: supor que em uma
balança tenha se obtido desvio padrão de 1, outra de 2 e na outra de 5.
Qual as formas da distribuição normal de cada balança???
Distribuição normal e desvio padrão
0
0,1
0,2
0,3
0,4
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Valor Medido
Fre
qu
ênci
a d
os
resu
ltad
os
s=1
s=2
s=5
Gauss
Distribuição normal e desvio padrão
Conclusão: O DESVIO PADRÃO MEDE A LARGURA DA CURVA GAUSSIANA
Em qualquer curva Gaussiana 68,3% da área se situa entre: sxsx 1 e 1
sxsx 2 e 2
sxsx 3 e 3
Em qualquer curva Gaussiana 95,5% da área se situa entre:
Em qualquer curva Gaussiana 99,7% da área se situa entre:
Distribuição t de Student e o Intervalo de confiança
• A distribuição de Student considera uma situação ideal de uma distribuição normal, onde as medidas experimentais seriam, no máximo, os resultados expressos por ela.
É uma ferramenta estatística utilizada com muita frequência para expressar
INTERVALOS DE CONFIANÇA e para comparação de resultados de experimentos
diferentes.
Distribuição t de Student e o Intervalo de confiança
• Os valores do teste t de Student dependem do nível de confiança desejado nas medidas (50%, 90%, 95%, 99%, etc.) e do grau de
liberdade da medida (número de repetições).
Os valores de t de Student aumenta quando se faz pouca repetições e aumenta quando se
aumenta o nível de confiança exigido.
Distribuição t de Student e o Intervalo de confiança
Cálculo do Intervalo de confiança
x
A partir de um número limitado de medidas não se pode determinar a média “real”, µ, de uma população.
O que se pode determinar é a média e o desvio padrão das amostras.
O intervalo de confiança é uma expressão condicionante de que a média “real” provavelmente esteja em uma posição
dentro de uma certa distância da média medida, .
anterior. tabelapela obtidoStudent de testedo valor o é
sobservaçõe de número o é padrão, desvio o é onde
1
11
n
nn
t
nsn
stx
n
stconfiançadeIntervalo
Exemplo de aplicação
• O teor de carboidratos de uma amostra foi determinado como: 12,6, 11,9, 13,0, 12,7 e 12,5 g por 100g de amostra através de análises repetidas.
• Calcular o intervalo de confiança de 50% e 90% para o teor de carboidratos.
Exemplo de aplicação• Passo 1- Calcular a média das amostras.
54,125
5,127,120,139,116,12
x
40,015
)54,125,12()54,127,12()54,120,13()54,129,11()54,126,12( 22222
s
s
Passo 3 – Calcular t de Student para 50% e 90%.
Passo 2 – Calcular o desvio padrão das amostras.
O t de Student para 4 (n-1=5-1=4) graus de liberdade para 50% é igual a 0,741 e o de 90% é de 2,132
?
Exemplo de aplicação• Passo 4- Aplicar na equação do intervalo de
confiança.
)(4,05,12
38,054,125
40,0132,254,12
)(1,05,12
13,054,125
40,0741,054,12
1%90
1%50
doarredondangn
stx
doarredondangn
stx
n
n
FIM DA PARTE I
Ajudas
• Inferência: ato de inferir;• Inferir - in.fe.rir-(lat inferre) vtd. Deduzir por meio
de raciocínio, tirar por conclusão ou conseqüência.
Exemplo
• Chegou ao laboratório 1 litro de água do Rio Batalha para análise de Cl-.
• Quem é a população?
• O que é a amostra?
• Qual é o parâmetro?
População: O Rio Batalha todo ou parte dele.
Amostra: 1 litro de água do Rio Batalha (considera-se que este volume é representativo de todo o rio ou parte dele)
Parâmetro: a concentração de Cl-.