Introdução à Análise de Dados nas medidas de grandezas...

Introdução à Análise de Dados nas medidas de

grandezas físicas

• www.chem.wits.ac.za/chem201/

• http://uregina.ca/~peresnep/

• www.ph.ed.ac.uk/~td/P3lab/Analysis/

• Notas baseadas nos apontamentos ‘Análise de Dados’ do Prof. Dr. Nuno Ayres de Campos

PRECISÃO e EXACTIDÃOPRECISÃOPRECISÃO – Reprodutibilidade dos resultados

EXACTIDÃOEXACTIDÃO – Proximidade do valor médio relativamente ao «verdadeiro» valor

grande precisãogrande exactidão

grande precisãopequena exactidão

pequena precisãopequena exactidão

ERROS DE OBSERVAÇÃO ERROS DE OBSERVAÇÃO SISTEMÁTICOSSISTEMÁTICOS

• Reprodutíveis, quando se realiza a mesma experiência nas mesmas condições• Se detectados, podem ser corrigidos• Têm sempre o mesmo sinal algébrico

ExemplosExemplos• equipamento defeituoso (e.g., mola permanentemente deformada)• sistema de medida mal calibrado (e.g., o factor de conversão de uma tensão numa medida está errado)• esquecimento da correcção da tara de uma balança

ERROS DE OBSERVAÇÃO ERROS DE OBSERVAÇÃO ALEATÓRIOS OU ACIDENTAISALEATÓRIOS OU ACIDENTAIS

• São diferentes (independentes) em cada realização da experiência• Tanto podem ser positivos como negativos• Não são susceptíveis de correcção• Podem ser sujeitos a um tratamento estatístico

ExemplosExemplos• flutuações aleatórias no equipamento electrónico• erros na estimativa da divisão da escala mais próxima do valor a medir• atrasos ou antecipações na utilização de um cronómetro

Estatística de baseDada uma série de N medições (amostra) da

grandeza física x, podemos definir :

• Média da amostra:

• Desvio da leitura i:

• Desvio padrão da amostra:

• Variância da amostra:

∑=

=N

iix

Nx

1

1

xxd ii −=

( )

11

2

−

−=

∑=

N

xxs

N

ii

( )

11

2

2

−

−=

∑=

N

xxs

N

ii

Com frequência, e devido aos erros aleatórios inerentes, Com frequência, e devido aos erros aleatórios inerentes, um conjunto de N leituras da variável x numa dada um conjunto de N leituras da variável x numa dada experiência apresenta uma distribuição Gaussiana: experiência apresenta uma distribuição Gaussiana:

• Calcule-se o valor médio do conjunto das N leituras

• Verifique-se se os desvios das várias leituras relativamente à média seguem uma distribuição de probabilidades Gaussiana (curva em forma de sino centrada no valor médio

Em muitos casos de experiências, os resultados Em muitos casos de experiências, os resultados distribuemdistribuem--se de acordo com uma curva suave ideal se de acordo com uma curva suave ideal chamada GAUSSIANA ou CURVA DE DISTRIBUIÇÃO chamada GAUSSIANA ou CURVA DE DISTRIBUIÇÃO NORMALNORMAL

Caracterizada por:

Valor médio Valor médio –– xx

corresponde ao centro da distribuição

Desvio padrão Desvio padrão –– ss

mede o ‘espalhamento’ da distribuição

População de dados

Para um conjunto infinito (hipotético) de dados,

N N →→ ∞∞ x x →→ µµ e s s →→ σσ

média da população desvio padrão da população

O resultado é tanto mais preciso quanto menor o desvio padrão.

No entanto… uma grande precisão não implica uma grande exactidão…

Os resultados experimentais exprimem-se normalmente na forma:

média ± desvio padrão sx_

±

A incerteza associada à determinação da média decresce com N1/

22 /2)(xe21y σμ

πσ−−=

Equação da curva Gaussiana:

πσ 21

= factor de normalização

Fica garantido que a área abaixo da curva é igual a 1

Probabilidade de medir um valor num certo intervalo de variação [x1, x2] = área situada entre a curva e o segmento x1x2 .

Intervalo Percentagem de observações

µ ± 1σ 68.3

µ ± 2σ 95.5

µ ± 3σ 99.7

O desvio padrão mede a largura da curva Gaussiana.

(quanto maior σ, mais larga a curva)

No caso de uma só medição experimental

No caso da medição directa de uma grandeza física numa montagemexperimental simples, como a medição do comprimento de um objecto comuma régua, da temperatura de um gás com um termómetro, da massa de umcorpo com uma balança, um só valor experimental será suficiente. Basta paraisso que os erros sistemáticos tenham sido eliminados e a leitura da escala doinstrumento tenha sido feita com cuidado.

Nesse caso, o erro associado será o erro devido à precisão (finita) doinstrumento. No caso da régua ou do termómetro de mercúrio, essaprecisão é limitada pelo espaçamento entre as marcas mais próximas daescala. No caso de um termómetro digital ou de uma balança, essaprecisão é fornecida com as características do instrumento.

Tipicamente, o erro da medição de um valor numa escala como a darégua ou do termómetro de mercúrio é igual a ½ da subdivisão maispequena da escala. É esse valor que se utiliza como desvio padrãoassociado ao valor medido. Como exemplo, se se mediu um comprimentode 1,003 m com uma régua que tem como subdivisão mais pequena ointervalo de 1 mm, o resultado a apresentar é 1,003 ± 0,0005 m.

Propagação de errosSuponhamos que se pretende determinar uma quantidadeZ, a partir da medida directa das grandezas A, B, C,…,com as quais se relaciona através de Z = f(A,B,C,…).

Se os erros associados a A, B, C, ... forem independentes(não houver correlação entre eles) então:• melhor estimativa para Z é :

• melhor estimativa para o erro em Z é :,...),,( CBAfZ =

( ) ( ) ( ) ( ) ...2222 +

∂∂

+

∂∂

+

∂∂

= CA

BA

AA

Z sCZs

BZs

AZs

iii

2 2 2

Ajuste de uma recta a dados experimentais (regressão linear)

Ajuste de um modelo linear aos dados: ordenada

na origemdeclive resíduo

iii bxay ε++=

εi = yi - ŷi

y

xxi

yi

ŷi

bxay ii +=ˆ

valor previsto

Pressupostos de uma regressão linear

1. A relação funcional entre as variáveis x e y é linear.

2. Os erros associados à medição de x são desprezáveis.

3. Se fizermos várias observações de y para cada valor de x, obtemos uma distribuição normal dos desvios.

y

xxi

2σi

barra de erro

A probabilidade do verdadeiro valor da grandeza y para o correspondente valor xi da grandeza x estar dentro do intervalo definido pela barra de erro é de 68%.

= ŷ, valor previsto

ε

ε = erro residual= y i , valor observado

valor previsto

bxay ii +=ˆ• Os «melhores» valores para os coeficientes a e b são tais que

• Método dos Mínimos Quadrados: o critério para definir «a melhor» recta é que seja mínima a soma dos quadrados dos desvios entre os dados yi e os correspondentes pontos da recta, i,.e., ŷi

( )[ ]2

1∑

=

+−=N

iii baxyD

0

0

=∂∂

=∂∂

bDaD

Caso mais simples: Os desvios padrão σi(yi) são todos iguais

Seja

Após alguma álgebra chegamos a

yNNiiii yyy e yx σσσσσσ ====<< )()()()()( 2211 K

( )

( )

( )

( )( )22

2222

22

222

22

2

22

21 ∑

∑ ∑

∑ ∑∑

∑ ∑∑ ∑ ∑ ∑

∑ ∑∑ ∑ ∑

−−−

=

−=

−=

−

−=

−

−=

baxyN

xxNN

xxN

x

xxN

yxxyxb

xxN

yxyxNa

iiy

iiya

ii

iyb

ii

iiiii

ii

iiii

σ

σσ

σσ

Teste diagnóstico para a regressão linearDistribuição dos resíduos no caso do modelo linear ser o mais adequado para traduzir a dependência funcional y=f(x)

x

ε

0

Distribuição dos resíduos no caso de um modelo não linear traduzir melhor a dependência funcional y=f(x) (exemplos)

x

ε

0

x

ε

0

Algarismos significativos e arredondamentos

Um observador deve apresentar o seu resultado com o número dealgarismos significativos apropriados à incerteza no valor obtido. Nãofaz sentido apresentar algarismos significativos para lá do algarismoem que se espera que ocorra o erro, como por exemplo no casox = 2,36 ± 0,1. O resultado deve antes apresentar-se x = 2,4 ± 0,1.

É prática corrente trabalhar-se com mais algarismossignificativos nos cálculos intermédios e fazer os arredondamentosnecessários apenas no resultado final.

Introdução à Análise de Dados nas medidas de grandezas...

Documents

Transcript of Introdução à Análise de Dados nas medidas de grandezas...