Introdução à Análise de Dados nas medidas de grandezas...
Transcript of Introdução à Análise de Dados nas medidas de grandezas...
Introdução à Análise de Dados nas medidas de
grandezas físicas
• www.chem.wits.ac.za/chem201/
• http://uregina.ca/~peresnep/
• www.ph.ed.ac.uk/~td/P3lab/Analysis/
• Notas baseadas nos apontamentos ‘Análise de Dados’ do Prof. Dr. Nuno Ayres de Campos
PRECISÃO e EXACTIDÃOPRECISÃOPRECISÃO – Reprodutibilidade dos resultados
EXACTIDÃOEXACTIDÃO – Proximidade do valor médio relativamente ao «verdadeiro» valor
grande precisãogrande exactidão
grande precisãopequena exactidão
pequena precisãopequena exactidão
ERROS DE OBSERVAÇÃO ERROS DE OBSERVAÇÃO SISTEMÁTICOSSISTEMÁTICOS
• Reprodutíveis, quando se realiza a mesma experiência nas mesmas condições• Se detectados, podem ser corrigidos• Têm sempre o mesmo sinal algébrico
ExemplosExemplos• equipamento defeituoso (e.g., mola permanentemente deformada)• sistema de medida mal calibrado (e.g., o factor de conversão de uma tensão numa medida está errado)• esquecimento da correcção da tara de uma balança
ERROS DE OBSERVAÇÃO ERROS DE OBSERVAÇÃO ALEATÓRIOS OU ACIDENTAISALEATÓRIOS OU ACIDENTAIS
• São diferentes (independentes) em cada realização da experiência• Tanto podem ser positivos como negativos• Não são susceptíveis de correcção• Podem ser sujeitos a um tratamento estatístico
ExemplosExemplos• flutuações aleatórias no equipamento electrónico• erros na estimativa da divisão da escala mais próxima do valor a medir• atrasos ou antecipações na utilização de um cronómetro
Estatística de baseDada uma série de N medições (amostra) da
grandeza física x, podemos definir :
• Média da amostra:
• Desvio da leitura i:
• Desvio padrão da amostra:
• Variância da amostra:
∑=
=N
iix
Nx
1
1
xxd ii −=
( )
11
2
−
−=
∑=
N
xxs
N
ii
( )
11
2
2
−
−=
∑=
N
xxs
N
ii
Com frequência, e devido aos erros aleatórios inerentes, Com frequência, e devido aos erros aleatórios inerentes, um conjunto de N leituras da variável x numa dada um conjunto de N leituras da variável x numa dada experiência apresenta uma distribuição Gaussiana: experiência apresenta uma distribuição Gaussiana:
• Calcule-se o valor médio do conjunto das N leituras
• Verifique-se se os desvios das várias leituras relativamente à média seguem uma distribuição de probabilidades Gaussiana (curva em forma de sino centrada no valor médio
Em muitos casos de experiências, os resultados Em muitos casos de experiências, os resultados distribuemdistribuem--se de acordo com uma curva suave ideal se de acordo com uma curva suave ideal chamada GAUSSIANA ou CURVA DE DISTRIBUIÇÃO chamada GAUSSIANA ou CURVA DE DISTRIBUIÇÃO NORMALNORMAL
Caracterizada por:
Valor médio Valor médio –– xx
corresponde ao centro da distribuição
Desvio padrão Desvio padrão –– ss
mede o ‘espalhamento’ da distribuição
População de dados
Para um conjunto infinito (hipotético) de dados,
N N →→ ∞∞ x x →→ µµ e s s →→ σσ
média da população desvio padrão da população
O resultado é tanto mais preciso quanto menor o desvio padrão.
No entanto… uma grande precisão não implica uma grande exactidão…
Os resultados experimentais exprimem-se normalmente na forma:
média ± desvio padrão sx_
±
A incerteza associada à determinação da média decresce com N1/
22 /2)(xe21y σμ
πσ−−=
Equação da curva Gaussiana:
πσ 21
= factor de normalização
Fica garantido que a área abaixo da curva é igual a 1
Probabilidade de medir um valor num certo intervalo de variação [x1, x2] = área situada entre a curva e o segmento x1x2 .
Intervalo Percentagem de observações
µ ± 1σ 68.3
µ ± 2σ 95.5
µ ± 3σ 99.7
O desvio padrão mede a largura da curva Gaussiana.
(quanto maior σ, mais larga a curva)
No caso de uma só medição experimental
No caso da medição directa de uma grandeza física numa montagemexperimental simples, como a medição do comprimento de um objecto comuma régua, da temperatura de um gás com um termómetro, da massa de umcorpo com uma balança, um só valor experimental será suficiente. Basta paraisso que os erros sistemáticos tenham sido eliminados e a leitura da escala doinstrumento tenha sido feita com cuidado.
Nesse caso, o erro associado será o erro devido à precisão (finita) doinstrumento. No caso da régua ou do termómetro de mercúrio, essaprecisão é limitada pelo espaçamento entre as marcas mais próximas daescala. No caso de um termómetro digital ou de uma balança, essaprecisão é fornecida com as características do instrumento.
Tipicamente, o erro da medição de um valor numa escala como a darégua ou do termómetro de mercúrio é igual a ½ da subdivisão maispequena da escala. É esse valor que se utiliza como desvio padrãoassociado ao valor medido. Como exemplo, se se mediu um comprimentode 1,003 m com uma régua que tem como subdivisão mais pequena ointervalo de 1 mm, o resultado a apresentar é 1,003 ± 0,0005 m.
Propagação de errosSuponhamos que se pretende determinar uma quantidadeZ, a partir da medida directa das grandezas A, B, C,…,com as quais se relaciona através de Z = f(A,B,C,…).
Se os erros associados a A, B, C, ... forem independentes(não houver correlação entre eles) então:• melhor estimativa para Z é :
• melhor estimativa para o erro em Z é :,...),,( CBAfZ =
( ) ( ) ( ) ( ) ...2222 +
∂∂
+
∂∂
+
∂∂
= CA
BA
AA
Z sCZs
BZs
AZs
iii
2 2 2
Ajuste de uma recta a dados experimentais (regressão linear)
Ajuste de um modelo linear aos dados: ordenada
na origemdeclive resíduo
iii bxay ε++=
εi = yi - ŷi
y
xxi
yi
ŷi
bxay ii +=ˆ
valor previsto
Pressupostos de uma regressão linear
1. A relação funcional entre as variáveis x e y é linear.
2. Os erros associados à medição de x são desprezáveis.
3. Se fizermos várias observações de y para cada valor de x, obtemos uma distribuição normal dos desvios.
y
xxi
2σi
barra de erro
A probabilidade do verdadeiro valor da grandeza y para o correspondente valor xi da grandeza x estar dentro do intervalo definido pela barra de erro é de 68%.
= ŷ, valor previsto
ε
ε = erro residual= y i , valor observado
valor previsto
bxay ii +=ˆ• Os «melhores» valores para os coeficientes a e b são tais que
• Método dos Mínimos Quadrados: o critério para definir «a melhor» recta é que seja mínima a soma dos quadrados dos desvios entre os dados yi e os correspondentes pontos da recta, i,.e., ŷi
( )[ ]2
1∑
=
+−=N
iii baxyD
0
0
=∂∂
=∂∂
bDaD
Caso mais simples: Os desvios padrão σi(yi) são todos iguais
Seja
Após alguma álgebra chegamos a
yNNiiii yyy e yx σσσσσσ ====<< )()()()()( 2211 K
( )
( )
( )
( )( )22
2222
22
222
22
2
22
21 ∑
∑ ∑
∑ ∑∑
∑ ∑∑ ∑ ∑ ∑
∑ ∑∑ ∑ ∑
−−−
=
−=
−=
−
−=
−
−=
baxyN
xxNN
xxN
x
xxN
yxxyxb
xxN
yxyxNa
iiy
iiya
ii
iyb
ii
iiiii
ii
iiii
σ
σσ
σσ
Teste diagnóstico para a regressão linearDistribuição dos resíduos no caso do modelo linear ser o mais adequado para traduzir a dependência funcional y=f(x)
x
ε
0
Distribuição dos resíduos no caso de um modelo não linear traduzir melhor a dependência funcional y=f(x) (exemplos)
x
ε
0
x
ε
0
Algarismos significativos e arredondamentos
Um observador deve apresentar o seu resultado com o número dealgarismos significativos apropriados à incerteza no valor obtido. Nãofaz sentido apresentar algarismos significativos para lá do algarismoem que se espera que ocorra o erro, como por exemplo no casox = 2,36 ± 0,1. O resultado deve antes apresentar-se x = 2,4 ± 0,1.
É prática corrente trabalhar-se com mais algarismossignificativos nos cálculos intermédios e fazer os arredondamentosnecessários apenas no resultado final.