Analise Incerteza

154
1 Análise da Incerteza Uma Introdução ao Estudo das Incertezas nas Medições de Engenharia Marco Antônio Ribeiro

description

Uma Introdução ao Estudo das Incertezas nas Medições de Engenharia.

Transcript of Analise Incerteza

Page 1: Analise Incerteza

1

Análise da Incerteza

Uma Introdução ao Estudo das Incertezas nas Medições de Engenharia

Marco Antônio Ribeiro

Page 2: Analise Incerteza

2

Page 3: Analise Incerteza

3

Análise da Incerteza

Uma Introdução ao Estudo das Incertezas nas Medições de Engenharia

Marco Antônio Ribeiro

Quem pensa claramente e domina a fundo aquilo de que fala, exprime-se claramente e de modo compreensível. Quem se exprime de modo obscuro e pretensioso mostra logo que não entende muito bem o assunto em questão ou então, que tem razão para evitar falar claramente (Rosa Luxemburg)

© 2002, Tek Treinamento & Consultoria Ltda Salvador, Verão 2002

Page 4: Analise Incerteza

4

Page 5: Analise Incerteza

5

Prefácio

O presente trabalho foi escrito como suporte de um curso ministrado a engenheiros e técnicos ligados, de algum modo, à medição de alguma grandeza física. Ele é uma continuação natural do curso de Metrologia Industrial, que enfoca os aspectos técnicos, físicos e matemáticos da incerteza da medição de uma grandeza física. Ele apresenta métodos e aplicações para cálculo da incerteza na medição.

Na primeira parte, há cinco capítulos tratando dos seguintes assuntos: 1. Descrição Preliminar da Análise da Incerteza 2. Como Reportar e Usar Incertezas 3. Propagação das Incertezas 4. Análise Estatística das Incertezas Aleatórias 5. Distribuição Normal ou de Gauss Na segunda parte do trabalho, quando se tem um maior aprofundamento teórico e uma maior

exigência de matemática, são apresentados sete capítulos: 6. Rejeição de Dados 7. Médias Ponderadas 8. Método dos Mínimos Quadrados 9. Covariância e Correlação 10. Distribuição Binomial 11. Distribuição de Poisson 12. Teste do Qui Quadrado para uma Distribuição Há ainda quatro apêndices, apresentando tabelas de probabilidades,

1. Apêndice A: Integral do Erro Normal, I 2. Apêndice B: Integral do Erro Normal, II 3. Apêndice C: Probabilidades para Coeficientes de Correlação 4. Apêndice D: Probabilidades para Qui Quadrado Há, em separado, um outro trabalho com problemas propostos sobre cada capítulo, com três

diferentes graus de dificuldade e trabalho. O trabalho deverá ser revisto logo, quando serão melhorados os desenhos, editadas figuras

melhores e eliminados os inúmeros e pequenos erros aleatórios de datilografia e alguns eventuais erros sistemáticos.

Sugestões e críticas destrutivas são benvindas ao endereço do autor: Rua Carmen Miranda 52, A 903, CEP 41810-670, Fone 55 71 3452-4286 e Celular 55 71 9979 9955, Skype Marcotek27 ou e-mail: [email protected]

Marco Antônio Ribeiro Salvador, BA, verão 2002

Page 6: Analise Incerteza

6

Autor

Marco Antônio Ribeiro nasceu em Araxá, MG, no dia 27 de maio de 1943, às 7:00 horas A.M.. Formou-se pelo Instituto Tecnológico de Aeronáutica (ITA), em Engenharia Eletrônica, em 1969.

Foi professor de Matemática, no Instituto de Matemática da Universidade Federal da Bahia (UFBA) (1974-1975), professor de Eletrônica na Escola Politécnica da UFBA (1976-1977), professor de Instrumentação e Controle de Processo no Centro de Educação Tecnológica da Bahia (CENTEC) (1978-1985) e professor convidado de Instrumentação e Controle de Processo nos cursos da Petrobrás (desde 1978).

Foi gerente regional Norte Nordeste da Foxboro (1973-1986). Já fez vários cursos de especialização em instrumentação e controle na Foxboro Co., em Foxboro, MA, Houston (TX) e na Foxboro Argentina, Buenos Aires.

Possui dezenas de artigos publicados em revistas nacionais e anais de congressos e seminários; ganhador do 2o prêmio Bristol-Babcock, no Congresso do IBP, Salvador, BA, 1979.

Desde agosto de 1987 é diretor da Tek Treinamento & Consultoria Ltda, firma dedicada à instrumentação, controle de processo, medição de vazão, aplicação de instrumentos elétricos em áreas classificadas, Implantação de normas ISO 9000 e integração de sistemas digitais.

Suas características metrológicas são: altura: (1,70 ± 01) m; peso correspondente à massa de (76 ± 2) kg; cor dos olhos: castanhos (cor subjetiva, não do arco íris)., cor dos cabelos (sobreviventes):

originalmente negros, se tornando brancos; tamanho do pé: 40 (aplicável no Brasil, adimensional). Gosta de xadrez, corrida, fotografia, música de Beethoven, leitura, trabalho, curtir os filhos e a vida.

Corre, todos os dias, cerca de (10 ± 2) km e joga xadrez relâmpago (5 min para cada jogador) todos os fins de semana. É provavelmente o melhor jogador de xadrez entre os corredores e o melhor corredor entre os jogadores de xadrez, o que não é nenhuma vantagem.

Page 7: Analise Incerteza

7

Conteúdo

Parte 1 11

1. Introdução 1 1.1. Introdução 1 1.2. Erro ou incerteza 1 1.3. Inevitabilidade da incerteza 1 1.4. Importância de se conhecer as incertezas 2 1.5. Estimativa da incerteza e escalas 3 1.6. Incerteza em medições repetidas 4

2. Expressão da Incerteza 6 2.1. Introdução 6 2.2. Melhor estimativa ± incerteza 6 2.3. Algarismos significativos 7 2.4. Discrepância 8 2.5. Comparação dos valores medido e aceito 9 2.6. Comparação de dois números medidos10 2.7. Verificando relações com gráficos 12 2.8. Incertezas relativas 15 2.9. Algarismo significativo e incerteza relativa 16 2.10. Multiplicação de duas medições 16

Definições e Equações do Cap. 2 18 Formas para expressar incertezas 18 Discrepância 18 Incerteza Relativa 18

3. Propagação da Incerteza 19 3.1. Introdução 19 3.2. Incertezas nas medições diretas 19 3.3. Regra da raiz quadrada para uma contagem 20 3.4. Somas e diferenças; produtos e quocientes 21 3.5. Dois casos especiais importantes 23 3.6. Incertezas independentes na soma 25 3.7. Mais acerca de incertezas independentes 27 3.8. Funções arbitrárias de uma variável 28 3.9. Propagação passo a passo 30 3.10. Exemplos 31 3.11. Fórmula geral para propagação da incerteza 34

Definições e Equações do Capítulo 3 38 Regra da raiz quadrada para contagem 38 Regras para propagação da incerteza 38 Somas e diferenças 38 Produtos e quocientes 38 Quantidade medida vezes número exato 38 Incerteza na potência 38 Incerteza em uma função de uma variável38 Fórmula geral para propagação da incerteza 38

Page 8: Analise Incerteza

8

4. Incertezas Aleatórias 39 4.1. Introdução 39 4.2. Incertezas aleatórias e sistemáticas 39 4.3. Média e desvio padrão 41 4.4. Desvio padrão como incerteza em uma medição isolada 44 4.5. Desvio padrão da média 45 4.6. Incertezas sistemáticas 47

Principais Definições e Equações do Capítulo 4 50 Média 50 Desvio padrão 50

Desvio padrão da média 50

5. Distribuição de Gauss 51 5.1. Introdução 51 5.2. Histogramas e distribuições 51 5.3. Distribuições limites 54 5.4. Distribuição normal 56 5.5. Desvio padrão como limite de confiança de 68% 59 5.6. Justificativa da média como melhor estimativa 60 5.7. Justificativa da soma quadrática 62 5.8. Desvio padrão da média 65 5.9. Aceitação de um resultado medido 67

Principais Definições e Equações do Capítulo 5 70 Distribuições limites 70 Distribuição normal ou de Gauss 70 Estimando X e σ de N valores medidos 70 Aceitação de um resultado medido 71

Parte 2 72

6. Rejeição de Dados 73 6.1. Introdução 73 6.2. Problema da rejeição de dados 73 6.3. Critério de Chauvenet 74 6.4. Discussão 75

Principais definições e equações do Capítulo 6 76

7. Médias Ponderadas 77 7.1. Introdução 77 7.2. Problema de combinar medições 77 7.3. Média Ponderada 77 7.4. Um exemplo 79

Principais definições e equações do Capítulo 7 80

Page 9: Analise Incerteza

9

8. Mínimos Quadrados 81 8.1. Introdução 81 8.2. Dados que devem se adequar à reta 81 8.3. Cálculo das constantes A e B 82 8.4. Incertezas nas medições de y 84 8.5. Incertezas nas constantes A e B 85 8.6. Exemplo: Medição do zero absoluto com um termômetro de gás a volume constante 86 8.7. Encaixe dos mínimos quadrados em outras curvas 88

Principais Definições e Equações do Capítulo 8 91 Linha reta através da origem (y = Bx); pesos iguais 91 Encaixe ponderado para uma linha reta, y = A + Bx 91 Outras curvas 92

9. Covariância e Correlação 93 9.1. Introdução 93 9.2. Revisão de propagação da incerteza 93 9.3. Covariância na propagação da incerteza 94 9.4. Coeficiente de correlação linear 97 9.5. Significado quantitativo de r 99 9.6. Exemplos 101

Principais Definições e Equações do Capítulo 9 102 Covariância 102 Coeficiente de correlação 102

10. Distribuição Binomial 103 10.1. Introdução 103 10.2. Distribuições 103 10.3. Probabilidade no lançamento de dados 103 10.4. Definição da distribuição binomial104 10.5. Propriedades da distribuição binomial 106 10.6. Distribuição de Gauss para incertezas aleatórias 107 10.7. Aplicações e teste de hipótese 108

Principais Definições e Equações do Capítulo 10 112 Distribuição Binomial 112 Aproximação gaussiana para a distribuição binomial 112

11. Distribuição de Poisson 113 11.1. Introdução 113 11.2. Definição da distribuição de Poisson113 11.3. Propriedades da distribuição de Poisson 115 11.4. Aplicações 117 11.5. Subtraindo um background 118

Definições e Equações do Capítulo 11 120 Distribuição de Poisson 120 Aproximação gaussiana para a distribuição de Poisson 120 Subtraindo o ruído 120

Page 10: Analise Incerteza

10

12. Teste do Qui-Quadrado 121 12.1. Introdução 121 12.2. Introdução ao Qui Quadrado 121 12.3. Definição geral do Qui Quadrado 123 12.4. Graus de liberdade e χ2 reduzido 126 12.5. Probabilidades para qui quadrado 127 12.6. Exemplos 130

Principais Definições e Equações do Capítulo 12. 133 Definição de qui quadrado 133 Graus de liberdade e qui quadrado reduzido 133 Probabilidades para qui quadrado. 133

Apêndice A 134

Integral do Erro Normal I 134

Apêndice B 136

Integral do Erro Normal, II 136

Apêndice C 138

Probabilidades para Coeficientes de Correlação 138

Apêndice D 140

Probabilidades para Qui Quadrado (χ2) 140

Page 11: Analise Incerteza

11

Parte 1

1. Descrição Preliminar da Análise da Incerteza 2. Como Reportar e Usar Incertezas 3. Propagação das Incertezas 4. Análise Estatística das Incertezas Aleatórias 5. Distribuição Normal A Parte 1 introduz as idéias básicas da análise da

incerteza como elas são necessárias em um curso típico de Cálculo de Incerteza na indústria. Os primeiros dois capítulos descrevem

1. o que é análise da incerteza 2. porque ela é importante 3. como ela pode ser usada nos relatórios de uma oficina

de instrumentação O Capítulo 3 descreve a propagação da incerteza, desde

que as incertezas nas medições originais se propagam através de cálculos para causar incertezas nos resultados finais reportados. Capítulos 4 e 5 introduzem os métodos estatísticos através dos quais as incertezas aleatórias podem ser calculadas.

Page 12: Analise Incerteza

1

1. Introdução

1.1. Introdução A análise da incerteza é o estudo e cálculo

da incerteza na medição. A experiência mostra que nenhuma medição, mesmo aquela feita com o maior cuidado possível ou com o melhor instrumento possível, pode ser completamente livre de incertezas. Como a estrutura e aplicação da ciência dependem das medições, a habilidade de avaliar estas incertezas e mantê-las em um valor mínimo é muito importante.

Este primeiro capítulo descreve algumas medições simples que ilustram a ocorrência inevitável de incertezas experimentais e mostra a importância de se conhecer os valores destas incertezas. O capítulo descreve como o tamanho das incertezas experimentais pode ser estimado de modo realista, às vezes por meio de métodos simples.

1.2. Erro ou incerteza Na instrumentação, a palavra erro tem

vários significados, que geralmente não tem a conotação usual de engano ou desacerto. Erro na teoria de controle é a diferença entre a medição e o ponto de ajuste. Erro na teoria da medição significa a incerteza inevitável que está presente em todas as medições. Em metrologia, erro não é engano. O erro na medição não pode ser eliminado, mesmo sendo cuidadoso e atencioso. O melhor que se pode esperar na medição é garantir que os erros associados sejam razoavelmente pequenos e estimar com confiança que eles estejam dentro de determinados intervalos. Normas e textos especializados apresentam definições complexas de erro. Por enquanto, erro é usado exclusivamente no sentido de incerteza e as duas palavras, erro e incerteza, são usadas indistintamente e podem ser intercambiáveis.

1.3. Inevitabilidade da incerteza Para ilustrar como a incerteza da medição

é inevitável e pode assumir diferentes valores, seja, por exemplo, um carpinteiro que quer saber a altura de uma buraco para instalar uma porta. Como uma primeira estimativa, sem usar nenhum instrumento de medição e baseado em sua experiência ele poderia simplesmente olhar o buraco e estimar que sua altura é de 210 cm.

Esta medição grosseira tem certamente uma grande incerteza. Se pressionado, o carpinteiro poderia expressar a incerteza admitindo que a altura poderia estar entre 200 e 220 cm. Se fosse exigida uma medição mais exata, o carpinteiro usaria uma fita métrica e poderia achar a altura de 211,6 cm. Esta medição é certamente mais exata e confiável que a primeira estimada, mas mesmo assim ela possui ainda uma incerteza, pois é impossível para o carpinteiro saber se a altura é exatamente 211,600 ou 211,601 cm, por exemplo.

Esta incerteza residual pode ter várias fontes, algumas das quais serão discutidas neste trabalho. Algumas causas podem ser facilmente eliminadas, se o carpinteiro tomar alguns cuidados normais e especiais. Por exemplo, alguns cuidados que eliminariam as incertezas seriam:

1. usar uma fita métrica de boa qualidade 2. fazer a medição em local de boa

iluminação para que não haja engano 3. fazer a medição com cuidado, sem

enrolar a fita, colocando as extremidades nos pontos corretos

Há porém outras fontes de incertezas que são inerentes ao processo de medição e nunca podem ser eliminadas inteiramente. Por exemplo, se o carpinteiro usar uma fita métrica graduada de um em um centímetro, provavelmente os pontos extremos da medição não coincidirão exatamente com a marcação da fita e o carpinteiro deve estimar onde a extremidade cai entre duas marcações. Mesmo se a extremidade do comprimento medido cair em cima da marcação, a marcação possui uma determinada espessura de alguns milímetros. Em qualquer caso, o carpinteiro deve estimar onde a extremidade da porta cai em relação às marcações da fita e isto causa alguma incerteza na medição.

Usando-se uma fita com melhor qualidade e com maior número de marcações, por exemplo de um em um milímetro, o problema se repete. Em vez de ter uma incerteza de fração de centímetro, tem-se agora uma incerteza de fração de milímetro. Se o carpinteiro tiver uma obsessão em determinar a altura da porta com a maior precisão tecnicamente possível, ele poderia usar um interferômetro a laser (que poderia custar o preço do apartamento onde se quer colocar a porta). Mas mesmo com esta sofisticada

Page 13: Analise Incerteza

Introdução

2

parafernália de medição, o resultado final ainda teria incerteza, agora da ordem de 10-6 m. Mesmo que o carpinteiro consiga agora medir a altura da porta com uma precisão fantástica, ele ainda não sabe a altura exata da porta.

Quando o carpinteiro se esforça para conseguir precisão maior, ele ainda encontra um importante problema de medição. Ele logo saberá que a altura da porta é diferente em pontos diferentes. Mesmo se ele considera apenas um ponto, a altura irá variar com a temperatura e umidade relativa do ambiente. A altura depende da sujeira e poeira depositada no ponto de medição. Resumindo, o carpinteiro conclui que não existe a coisa chamada de altura da porta. Este tipo de problema é chamado de problema de definição: a altura da porta não é uma quantidade bem definida.

A experiência do carpinteiro ilustra um ponto verdadeiro: nenhuma quantidade física (comprimento, tempo, massa, temperatura, pressão, corrente elétrica, por exemplo) pode ser medida com certeza completa. Com cuidado, pode-se diminuir algumas incertezas e eliminar outras incertezas, de modo que a incerteza resultante final seja extremamente pequena porém, eliminar todas as incertezas é impossível. Neste trabalho, serão vistas as incertezas que podem ser eliminadas ou diminuídas e as que são inevitáveis e intrínsecas à medição.

Felizmente, nem toda incerteza é importante ou de interesse prático. Por exemplo, quando se diz que a distância entre a casa e a escola é de aproximadamente 2 quilômetros, se esta distância significa algo entre 1,5 e 2,5 km ou algo entre 1,99 ou 2,01 km geralmente não tem nenhuma importância prática. Outras vezes, as incertezas são importantes, porém, mesmo nestes casos ela pode ter valores aceitáveis. Quando o carpinteiro instala a porta, ele deve conhecer sua altura com uma incerteza de alguns milímetros. Esta pequena incerteza pode ser administrada e a porta instalada sem problema. Se a incerteza for muito grande, o trabalho para instalar a porta será muito maior, quebrando tijolos e cimento para aumentar o espaço ou colocando tijolos e cimento para diminuir o espaço. E assim que o carpinteiro instala corretamente a porta, seu interesse pela incerteza da altura da porta acaba totalmente.

1.4. Importância de se conhecer as incertezas

O exemplo do carpinteiro medindo a altura da porta ilustra como as incertezas estão sempre presentes nas medições. Agora será visto como é importante conhecer o tamanho real das incertezas.

Seja o problema que Arquimedes defrontou há muito tempo atrás. O rei mandou o ourives fazer uma coroa de ouro e entregou-lhe uma determinada quantidade de ouro. Quando a coroa estava pronta o rei queria garantir que todo o ouro entregue foi usado para fazer a coroa ou se o ourives substituiu o ouro por cobre ou outro metal mais barato. Arquimedes percebeu que o caminho do experimento era através das densidades do ouro e da liga da coroa. Sabendo que a densidade do ouro puro é de

ρouro = 15,5 g/cm3

e medindo-se a densidade da liga da coroa, é possível decidir se a coroa é realmente de ouro, comparando-se as duas densidades. Supondo que a densidade da coroa seja de

ρcoroa = 13,8 g/cm3 Sejam duas medições da densidade da

coroa. A primeira medição obtida é de ρcoroa = 15 ± 2 g/cm3

Esta medição garante que a densidade está no intervalo de 13 a 17 g/cm3

A segunda medição obtida é de

ρcoroa = 13,9 ± 0,2 g/cm3

Esta medição garante que a densidade está no intervalo de 13,7 a 14,1 g/cm3

Os dois resultados são mostrados graficamente na Fig. 1.1.

O primeiro ponto a notar nestes resultados é que, embora a segunda medição seja mais precisa, a primeira medição provavelmente é também correta. Cada medição possui uma faixa de valores dentro da qual se espera que a densidade caia e estes valores se sobrepõem, de modo que é perfeitamente possível e mesmo provável que ambos os resultados sejam corretos.

Os resultados da primeira medição possuem incerteza tão grande que ela não é útil para resolver o problema da falsificação. As densidades do ouro e da liga da coroa, ambas caem dentro da faixa medida, de 13 a 17 g/cm3 , de modo que nenhuma conclusão pode-se tirar destas medições.

Por outro lado, a segunda medição indica claramente que a coroa não é de ouro puro, pois a densidade da liga suspeita, 13,8 g/cm3 cai confortavelmente dentro da faixa estimada de 13,7 a 14,1 g/cm3 e a densidade do ouro,

Page 14: Analise Incerteza

Introdução

3

15,5 g/cm3 está longe desta faixa. Como as medições são feitas para se permitir uma conclusão, as incertezas experimentais não podem ser muito grandes. Porém, as incertezas não precisam ser extremamente pequenas. Neste aspecto, este exemplo é típico de muitas medições científicas, para os quais as incertezas devem ser razoavelmente pequenas mas não precisam ser extremamente pequenas.

Fig. 1.1. Duas medições da densidade de uma coroa

suposta de ouro. Os dois pontos mostram as melhores estimativas das duas medições. As duas barras verticais mostram suas margens de incerteza ou intervalos dentro dos quais se acredita que as densidades provavelmente caem. A incerteza da primeira medição é tão grande que as densidades da coroa suspeita e ouro caem dentro de suas margens de incerteza, de modo que esta medição não determina qual material é usado. A incerteza da segunda medição é dez vezes menor e sua medição mostra que a coroa não é feita de ouro.

Como a decisão se baseia na segunda

medição, 13,9 ± 0,2 g/cm3, este resultado deve ter suporte suficiente para garantir sua validade. Em outras palavras, quem fez esta medição deve justificar a faixa de valores obtidos. Este ponto é muitas vezes esquecido pelo instrumentista que simplesmente apresenta suas incertezas mas omite qualquer justificativa. Sem uma breve explicação de como a incerteza foi estimada, o resultado é quase inútil.

O ponto mais importante com relação às duas medições acima: 15 ± 2 g/cm3 e 13,7 ± 0,2 g/cm3 é este: como a maioria das medições industriais, elas devem ser inúteis se elas não incluírem afirmações confiáveis de suas incertezas. De fato, se as duas medições forem simplesmente 15 e 13,7 g/cm3, sem nenhuma incerteza associada, 1. não se pode tirar nenhuma conclusão

válida das duas medições 2. pode-se realmente cometer um engano,

achando que a primeira medição parece sugerir que a coroa é genuína.

1.5. Estimativa da incerteza e escalas Toda medição possui incertezas e é

importante quantificá-las. Porém, ainda não foi visto como isto pode ser feito. Tal cálculo pode ser complicado e é o principal objetivo deste trabalho. Felizmente, a estimativa razoável da incerteza de algumas medições simples pode ser fácil, às vezes usando apenas o bom senso.

O entendimento do exemplo simples permite começar o entendimento da análise da incerteza nas medições industriais e de laboratório e forma a base para discussões posteriores.

Seja a medição do comprimento de uma barra, através de duas réguas diferentes. As duas réguas tem o mesmo comprimento, porém, a segunda escala possui maior número de divisões.

Fig. 1.2. Medição com régua com divisões de 1 cm

Para medir o comprimento de uma barra, inicialmente deve se colocar uma extremidade no zero da régua e depois decidir onde a outra extremidade da barra cai na escala da régua. Assumindo que a régua é confiável (todas as divisões são iguais e estão uniformemente distribuídas), a medição consiste em decidir onde um certo ponto cai em relação às divisões da régua. Se a régua não é confiável, deve-se considerar esta incerteza. A confiabilidade da régua é obtida calibrando-a contra outra régua garantidamente confiável.

13

14

15

17

16

Ouro

Liga

Densidade ρ (g/cm3)

1a medição

2a medição

Page 15: Analise Incerteza

Introdução

4

As divisões da régua na Fig. 1.2 são distantes 1 cm. Pode-se razoavelmente decidir que o comprimento mostrado está, sem dúvida, mais próximo de 6 cm do que de 7 cm e um resultado razoável é 6,2 cm. Nenhuma leitura mais precisa é possível. Neste caso, o resultado pode ser expresso como:

melhor estimativa da medição = 6,2 cm

faixa provável = 6,15 a 6,25 cm

Fig. 1.3. Medição com régua com divisões de 1 mm

Quando se mede o comprimento da mesma

barra, usando uma régua do mesmo tamanho porém com divisões de 1 mm, o resultado estará entre 62 e 63 mm e portanto é razoável atribuir o resultado da medição como 62,0 pois a leitura cai entre as divisões 2 e 3, porém muito mais próximo de 2 do que de 3. Também poderia ser lido 6,21 ou 6,22, que seria igualmente aceitável.

Assim, o resultado é expresso como:

melhor estimativa dda medição = 6,20 cm faixa provável = 6,195 a 6,205 cm

e pode-se dizer que o comprimento foi medido até o milímetro mais próximo.

Este tipo de conclusão - que a medição está mais próxima de uma marca do que de outra marca vizinha – é muito comum. Por esta razão, o metrologista introduz a convenção que a afirmação L = 62 mm, sem qualquer outra qualificação, presume significar que L está mais próximo de 62 do que de 61 ou 63. Assim,

L = 62 mm

significa

61,5 mm < L < 62,5 mm Do mesmo modo, um resultado de x = 62,1 cm

sem qualquer incerteza associada, presume significar que x cai entre 62,05 e 62,15 cm.

Neste trabalho, esta convenção não é usada, pois a incerteza sempre será indicada explicitamente. De qualquer modo, deve-se conhecer e entender esta convenção e saber que ela é aplicada a qualquer resultado sem uma incerteza associada, especialmente quando se usa máquina de calcular ou computador, que fornecem a quantidade de algarismos significativos que se quiser. Quando se escreve o resultado obtido de uma calculadora usada para computar as medições de um instrumento, como 139,357 sem qualquer qualificação, o leitor deste resultado irá pensar que a medição resultou em 6 algarismos significativos, o que é muito improvável.

O processo de estimar posições entre divisões da escala é chamado de interpolação, técnica que pode ser melhorada com a prática.

Pode-se discordar das estimativas dadas pelos resultados anteriores. Há quem ache que o melhor resultado da medição da régua graduada em mm seria 62 mm e que é exagerado escrever 62,0 mm.

De qualquer modo, estes resultados são estimativas razoáveis de comprimentos medidos e de suas incertezas prováveis associadas. A estimativa aproximada das incertezas é relativamente fácil quando o único problema é fazer a leitura de um instrumento analógico, que consiste em localizar o ponteiro na escala graduada.

1.6. Incerteza em medições repetidas Muitas medições incluem incertezas que

são mais difíceis de estimar do que aquelas associadas com a localização de pontos em uma escala graduada. Por exemplo, quando se mede intervalo de tempo com um cronômetro, a principal fonte de incerteza não é a dificuldade da leitura do dial mas a própria reação desconhecida em partir e parar o cronômetro. Esta incerteza pode variar de 0,2 a 0,5 segundo. Às vezes, estes tipos de incertezas podem ser estimados com confiança, quando se repetem as medições várias vezes. Por exemplo, seja a medição de um intervalo, cujo primeiro resultado é de 2,3 s. De uma única medição não se pode dizer nada acerca da incerteza experimental da medição. Mas, se a medição do mesmo intervalo de tempo é de 2,4 s é razoável assumir que a incerteza é de 0,1 s. Se uma seqüência de 4 medições dá os resultados:

2,3 s 2,4 s 2,5 s 2,4 s

Page 16: Analise Incerteza

Introdução

5

pode-se então começar a ter uma estimativa mais realista.

1. A hipótese natural é que a melhor

estimativa do tempo seja o valor médio, 2,4 s.

2. Outra hipótese segura é que o tempo correto fique entre o valor menor, 2,3 e o maior, 2,5. Assim, pode-se razoavelmente concluir que: melhor estimativa = média = 2,4 s faixa provável = 2,3 a 2,5 s Sempre que se puder repetir a mesma

medição várias vezes, o espalhamento dos valores medidos dá uma indicação valiosa da incerteza das medições. Serão vistos métodos estatísticos para tratar tais medições repetidas. Sob condições corretas, estes métodos estatísticos dão uma estimativa mais exata da incerteza do que apenas o bom senso. Um tratamento estatístico também tem a vantagem de dar um valor objetivo para a incerteza, independente do julgamento individual do observador.

O tratamento estatístico também fornece uma incerteza menor do que simplesmente a faixa de valores entre a menor e a maior medição. Assim, olhando as quatro medições anteriores, julga-se que o tempo está provavelmente em algum ponto entre 2,3 e 2,4 s. O método estatístico correto mostra que, com uma confiança de 70% o tempo fica entre 2,36 e 2,44 s.

Medições repetidas, como as mostradas no exemplo anterior, nem sempre revelam as incertezas, de modo confiável.

Deve-se garantir que a quantidade medida é sempre a mesma em todas as medições. Por exemplo, quando se mede o ponto de ruptura de dois fios supostamente iguais, através de um teste e se obtém dois resultados diferentes, esta diferença pode indicar que as medições estão incorretas ou que os dois fios não eram realmente iguais. Por si, a diferença entre os dois resultados não diz nada acerca da confiabilidade das medições.

Mesmo quando se tem a garantia que a quantidade medida seja igual para cada medição, as medições repetidas nem sempre revelam as incertezas. Por exemplo, se o instrumento de medição tiver uma incerteza sistemática, as medições repetidas não irão revelar esta deficiência. As incertezas sistemáticas afetam todas as medições do mesmo modo e é difícil detectá-las. Neste caso, a solução é calibrar o instrumento contra

um padrão confiável, para detectar a incerteza sistemática.

Os exemplos discutidos mostram que algumas incertezas experimentais podem ser facilmente estimadas. Porém, há muitas medições com incertezas que não são facilmente calculadas. Também, às vezes, se quer valores mais precisos para as incertezas do que as simples estimativas discutidas.

Page 17: Analise Incerteza

6

2. Expressão da Incerteza

2.1. Introdução Após a leitura do Capítulo 1, tem-se alguma

idéia da importância das incertezas experimentais e como elas aparecem. Deve-se também entender como as incertezas podem ser estimadas em algumas poucas situações simples. Neste capítulo, vai-se aprender algumas regras e notações básicas da análise da incerteza e estudar exemplos de seu uso em medições típicas da indústria e laboratório. O objetivo é familiarizar-se com o vocabulário básico da análise da incerteza e seu uso no laboratório e na oficina de instrumentação.

2.2. Melhor estimativa ± incerteza Já foi visto que o modo correto de

apresentar o resultado da medição é dar a melhor estimativa da medição e a faixa dentro da qual se tem a confiança que a quantidade fica. Por exemplo, o resultado dos intervalos de tempo discutidos em 1.6 foram reportados como

melhor estimativa de tempo = 2,4 s

faixa provável: 2,3 a 2,5 s (2.1)

Aqui, a melhor estimativa 2,4 s cai na

metade da faixa estimada de valores prováveis, 2,3 a 2,5 s e isto acontece em todos os exemplos. Esta relação é natural e acontece na maioria das medições. Ela permite que o resultado da medição seja expresso em forma compacta. Por exemplo, a medição do intervalo de tempo é usualmente estabelecido como:

valor medido do tempo = 2,4 ± 0,1 s (2.2)

Esta única expressão (2.2) é equivalente às

duas afirmações anteriores da (2.1). Em geral o resultado de qualquer medição

de uma quantidade x é estabelecido como

valor medido de x = xestimado ± δx (2.3) Esta expressão significa:

1. a melhor estimativa do observador para a quantidade medida é o número xestimado.

2. o observador está confiante que a quantidade medida caia em algum ponto entre xestimado - δx e xestimado + δx

O número δx é chamado de incerteza, erro, margem de erro, tolerância, desvio da medição de x. Por conveniência, o número δx é sempre positivo, de modo que xestimado - δx é sempre o menor valor provável da quantidade medida e xestimado + δx é sempre o maior.

O significado da faixa xestimado - δx a xestimado + δx foi deixado vago de propósito, mas ele pode ser tornado mais preciso. Em uma medição simples, como a da altura da porta, pode se dizer com absoluta certeza que uma faixa xestimado- δx a xestimado + δx inclui a quantidade medida. Porém em muitas medições industriais e científicas esta afirmação é difícil de ser feita e garantida. Em particular, para estar absolutamente certo que a quantidade medida cai entre xestimado - δx e xestimado + δx, deve-se escolher um valor tão grande para δx que ele se torna inútil. Para evitar esta situação, pode-se às vezes escolher um valor para δx que se possa estabelecer com uma certa percentagem de confiança que a quantidade real caia dentro da faixa xestimado ± δx. Por exemplo, as pesquisas de votos próximas às eleições geralmente estabelecem que determinado candidato A tem 60% dos votos do eleitorado, com uma margem de ± 3%, com limites de confiança de 95%. Isto significa que o Instituto de Pesquisa está 95% confiante que a percentagem de votos para o candidato A está entre 57 e 63%. Depois das eleições, pode-se esperar a resposta correta para estar dentro das margens estabelecidas de erro 95% do tempo e fora destas margens somente 5% do tempo.

Não se pode estabelecer uma percentagem de confiança nas margens de erro até que se entenda as leis estatísticas que governam o processo da medição. Este assunto será tratado adiante. Por enquanto, basta definir a incerteza δx de modo que se esteja razoavelmente certo que a quantidade medida caia dentro do intervalo xestimado - δx e xestimado + δx.

Page 18: Analise Incerteza

Expressão da Incerteza

7

Probleminha rápido 2.1. (a) Um instrumentista mede o comprimento

de uma barra e reporta sua melhor estimativa como 110 mm e a faixa em que o comprimento provavelmente cai como 108 e 112 mm . Reescrever este resultado na forma padrão.

(b) Se outro instrumentista reporta sua medição de corrente elétrica como sendo de 4,00 ± 0,02 A; qual é a faixa dentro da qual a corrente provavelmente cai?

Resposta:

(a) 110 ± 2 mm (b) Entre 3,98 a 4,02 A

2.3. Algarismos significativos Devem ser estabelecidas algumas regras

para determinar as incertezas para que todas informações contidas na expressão sejam entendidas universalmente e de modo consistente entre quem escreve e quem lê.

Como a quantidade δx é uma estimativa de uma incerteza, obviamente ela não deve ser estabelecida com precisão excessiva. Por exemplo, é estupidez expressar o resultado da medição da aceleração da gravidade g como

gmedida = 9,82 ± 0,0312 956 m/s2 (2.4)

A expressão correta seria gmedida = 9,82 ± 0,03 m/s2 (2.5)

Regra para expressar incertezas Incertezas industriais devem ser quase

sempre arredondadas para um único algarismo significativo

(2.6) Uma conseqüência prática desta regra é

que muitos cálculos de erros podem ser feitos mentalmente, sem uso de calculadora ou mesmo de lápis e papel.

Esta regra tem somente uma exceção importante. Se o primeiro algarismo na incerteza δx é 1, então é recomendável se manter dois algarismos significativos em δx. Por exemplo, se um cálculo resulta em uma incerteza final de δx = 0,14, um arredondamento para δx = 0,1 é uma redução

proporcional muito grande de modo que é razoável reter dois algarismos significativos para expressar δx = 0,14. O mesmo argumento poderia ser usado se o primeiro número for 2, porém a redução não é tão grande (metade da redução se o algarismo fosse 1).

Assim que a incerteza na medição é estimada, os algarismos significativos do valor medido devem ser considerados.

Uma expressão como velocidade = 6 051,78 ± 30 m/s (2.7) é certamente bem ridícula. A incerteza de 30 significa que o dígito 5 pode ser realmente tão pequeno quanto 2 ou tão grande quanto 8. Claramente, os dígitos 1, 7 e 8 que vem depois do 5 não tem nenhum significado prático. Assim, a expressão correta seria

velocidade medida = 6050± 30 m/s (2.8)

A regra geral é esta

Regra para expressar resultados O último algarismo significativo em

qualquer expressão de resultado deve ser usualmente da mesma ordem de grandeza (mesma posição decimal) que a incerteza.

(2.9) Por exemplo, para uma expressão de

resultado 78,43 com uma incerteza de 0,04 seria arredondada para

78,43 ± 0,04 Se a incerteza fosse de 0,4 então ficaria 78,4 ± 0,4 Se a incerteza fosse de 4, a expressão

ficaria 78 ± 4 Finalmente, se a incerteza fosse de 40,

seria 80 ± 40 Para reduzir incertezas causadas pelo

arredondamento, quaisquer números usados nos cálculos intermediários devem normalmente reter, no mínimo, um algarismo a mais do que o finalmente justificado. No final dos cálculos, faz o último arredondamento para eliminar o algarismo extra insignificante.

Page 19: Analise Incerteza

Expressão da Incerteza

8

A incerteza em qualquer quantidade medida tem a mesma dimensão que a quantidade medida em si. Assim, escrevendo as unidades (m/s2, g/cm3, A, V, oC ) após o resultado e a incerteza é mais claro e mais econômico.

Exemplo

densidade medida = 8,23 ± 0,05 g/cm3 ou densidade medida = (8,23 ± 0,05) g/cm3

Quando se usa a notação científica, com

números associados a potências de 10, é também mais simples e claro colocar o resultado e a incerteza na mesma forma.

Por exemplo:

corrente medida = (2,54 ± 0,02) x 10-6 A

é mais fácil de ler e interpretar do que na forma:

corrente medida = 2,54 x 10-6 ± 2 x 10-8 A

Probleminha rápido 2.2. Reescrever cada uma das seguintes

medições em sua forma mais apropriada: (a) 8,123 456 ± 0,031 2 m/s (b) 3,123 4 x 104 ± 2 m

(c) 5,678 9 x 10-7 ± 3 x 10-9 kg

Respostas:

(a) 8,12 ± 0,03 m/s (b) (3,123 4 ± 0,000 2) x 104 m ou 31 234 ± 2 m

(c) (5,68 ± 0,03) x 10-7 kg

2.4. Discrepância Quando se fazem duas medições da

mesma quantidade, sempre há uma diferença entre elas. Esta diferença é chamada também de discrepância das duas medições. Numericamente, a discrepância entre duas medições é definida como a sua diferença:

discrepância = diferença entre dois valores medidos da mesma quantidade

(2.10) Mais especificamente, cada uma das duas

medições consiste da melhor estimativa e uma incerteza e a discrepância é definida como a diferença entre as duas estimativas. Por exemplo, se dois instrumentistas medem a mesma resistência como:

Instrumentista A: 15 ± 2 Ω Instrumentista B: 25 ± 4 Ω

A discrepância entre as duas medições é discrepância = 25 – 15 = 10 Ω A discrepância pode ser significativa ou não

significativa (desprezível).

Por exemplo, a discrepância de 10 Ω entre as medições de 15 ± 2 Ω e 25 ± 4 Ω é significativa porque nenhum valor da resistência é compatível com as duas medições. Obviamente, no mínimo uma das duas medições é incorreta e deve se pesquisar o que está de errado com ela.

Em outro exemplo, com as duas medições iguais a

Instrumentista C: 16 ± 8 Ω Instrumentista D: 26 ± 9 Ω Neste caso, a discrepância contínua sendo

de 10 Ω, porém é insignificante, pois as margens de erro das duas medições se sobrepõem confortavelmente e as duas medições podem ser ambas consideradas corretas.

Como conclusão, a discrepância entre duas medições da mesma quantidade é classificada não apenas por seu valor absoluto mas pelo seu valor comparado com as incertezas nas medições.

Em laboratório de Metrologia é necessário medir quantidades que tem sido medidas cuidadosamente muitas vezes antes e que possuem um determinado valor aceito que é conhecido e publicado, como a constante universal dos gases (R), tensão da célula de Weston, carga do elétron. Este valor aceito não é exato, pois é resultado de medições e como toda medição, ele também possui incerteza associada. Geralmente este valor aceito é muito mais preciso do que o conseguido nas medições industriais. Por exemplo, o valor aceito para a constante universal dos gases, R, é

R aceito = 8,314 51 ± 0,000 07 J/(mol.K)

(2.11)

Page 20: Analise Incerteza

Expressão da Incerteza

9

Como esperado, este valor é incerto, porém

sua incerteza é extremamente pequena, comparada com os padrões da maioria dos laboratórios de Metrologia. Assim, quando se compara o valor medido desta constante com o valor aceito, pode-se considerar o valor aceito como exato.

Há exceções, principalmente em laboratórios químicos, quando se tem valores publicados de índices de refração de vidros, coeficientes isentrópicos de gases, onde os valores publicados são pouco precisos, com dois ou três algarismos significativos.

Embora muitas experiências exijam medição de uma quantidade cujo valor aceito é conhecido, poucas requerem medição de uma quantidade cujo valor verdadeiro é conhecido. Por exemplo, quando se mede a relação da circunferência do círculo com seu diâmetro, o resultado verdadeiro é exatamente π. De fato o valor verdadeiro de uma quantidade medida pode quase nunca ser conhecido exatamente e por isso é difícil de definir tal valor verdadeiro. O que existe é o valor verdadeiro convencional, fornecido por um padrão rastreado.

Fig. 2.1. (a) Duas medições da mesma quantidade.

Cada medição inclui uma melhor estimativa, mostrada por um ponto e uma faixa de valores prováveis, mostrada por uma barra vertical de incerteza. A discrepância, diferença entre as duas melhores estimativas é de 10 � e é significativa porque é muito maior do que a incerteza combinada das duas medições. Com certeza, uma das duas medições está incorreta.

(b) Duas medições diferentes da mesma resistência. A discrepância ainda é de 10 �� mas neste caso, é insignificante porque as margens do erro se sobrepõem.

Não há nenhuma razão para duvidar que ambas as medições são corretas, embora tenham incertezas muito grandes.

2.5. Comparação dos valores medido e aceito

Fazer uma experiência sem tirar algum tipo de conclusão tem pouca utilidade. Algumas poucas experiências podem ter resultados qualitativos, porém a maioria absoluta levam a conclusões quantitativas, que são expressas como resultados numéricos. O resultado de uma única medição geralmente não tem interesse. Afirmações de que a densidade de algum metal foi medida e vale 9,3 ± 0,2 g/cm3 ou que a temperatura medida é de 25 ± 3 oC não têm interesse prático. O que se quer, na realidade, é comparar dois ou mais números: uma medição e um valor aceito, uma medição com um valor teoricamente esperado ou várias medições para mostrar que elas estão relacionadas com outra de acordo com alguma lei física ou curva de calibração teórica. Quando de comparam dois números, a análise da incerteza é importante.

Talvez a experiência mais simples consista na medição de uma quantidade cujo valor aceito é conhecido. O procedimento envolve:

1. medição da quantidade 2. estimativa da incerteza experimental 3. comparação destes valores com o valor

aceito Por exemplo, seja a medição da velocidade

do som no ar, nas condições normais de pressão e temperatura. O metrologista A pode obter:

velocidade medida = 329 ± 5 m/s (2.12)

comparada com o

valor aceito = 331 m/s (2.13) Esta medição do metrologista A parece

satisfatória, pois o valor aceito cai dentro dos limites estabelecidos pelas margens de incerteza da medição feita.

O significado da incerteza δx é que o valor correto de x provavelmente cai entre xestimado – δx e xestimado + δx e é certamente possível que o valor correto cai levemente fora desta faixa. Deste modo, uma medição pode ser considerada satisfatória mesmo se o valor aceito caia levemente fora da faixa estimada do valor medido.

Se no mesmo exemplo, o metrologista B encontra o valor:

Resistência (Ω)

10

20

40

30

0

(a)

B = 25 ± 4 Ω

A = 15 ± 2 Ω

discrepância = 10 Ω

10

20

40

30

0

(b)

D = 26 ± 9 Ω

A = 16 ± 8 Ω

discrepância = 10 Ω

Page 21: Analise Incerteza

Expressão da Incerteza

10

velocidade medida = 325 ± 5 m/s

ele poderia considerar que sua medição é consistente com o valor aceito de 331 m/s.

Porém, se o valor aceito está muito fora das margens de erro (a discrepância é maior que o dobro das incertezas, por exemplo), há razão para supor que há algo errado. Por exemplo, se o metrologista C encontra

velocidade medida = 345 ± 2 m/s (2.14) comparada com a

velocidade aceita = 331 m/s (2.15)

A discrepância do metrologista C é 14 m/s,

que é 7 vezes maior que a incerteza da medição, 2 m/s. Ele precisa verificar sua medição e cálculos para descobrir o que está errado.

Infelizmente, a pesquisa do erro do metrologista C pode ser complexa e demorada porque há várias causas e possibilidades:

1. o erro pode estar na medição 2. o erro pode estar nos cálculos 3. a incerteza pode estar mal estimada 4. o valor aceito pode estar errado 5. as condições de temperatura e pressão

da medição podem ser diferentes das condições na qual o valor aceito é expresso

6. os instrumentos de medição podem estar descalibrados e com erros sistemáticos

7. os procedimentos de medição podem estar incorretos

2.6. Comparação de dois números medidos

Muitas experiências envolvem a medição de dois números que são teoricamente iguais. Por exemplo, a lei da conservação do momento estabelece que o momento total de um sistema isolado é constante. Para comprovar esta lei, pode-se fazer experiências com dois corpos que colidem quando se movem ao longo de uma pista sem atrito. Medem-se os momentos totais dos dois corpos antes (p) e depois (q) da colisão e verifica se p = q dentro das incertezas da experiência. Para um simples par de medições, os resultados podem ser:

momento inicial p = 1,49 ± 0,03 kg.m/s momento final q = 1,56 ± 0,06 kg.m/s Aqui a faixa em que p provavelmente cai

(1,46 a 1,52) sobrepõe a faixa em que q

provavelmente cai (1,50 a 1,62) e por isso, estes momentos são consistentes com a conservação dos momento. Se, ao contrário, as duas faixas prováveis não forem suficientemente próximas para haver superposição, as medições são inconsistentes com a lei da conservação do momento e deve se procurar os erros nas medições ou cálculos ou erros sistemáticos do método usado (por exemplo, gravidade ou atrito) que fazem as medições se afastarem entre si.

É conveniente repetir os pares de medições (antes e depois) várias vezes e fazer uma tabela para a comparação direta dos resultados. As incertezas geralmente diferem um pouco de uma medição para outra e por isso pode-se padronizar uma única incerteza para a medição anterior (p) e posterior (q) como δp = 0,03 e δq = 0,06 kg.m/s.

Tab. 2.1. Momentos medidos (kg.m/s)

Medição Momento inicial p (p ± 0,03)

Momento final q (q ± 0,03)

1 1,49 1,56 2 3,10 3,12 3 2,16 2,05

Para cada par de medições, a faixa

provável de valores para p sobrepõe (ou quase sobrepõe) a faixa de valores prováveis para q. Se esta superposição acontece para todas as medições, os resultados podem ser considerados consistentes com a conservação do momento. A recomendação é fazer o maior número possível de medições com as incertezas cada vez menores e verificar que os resultados continuam consistentes com a teoria.

Para uma grande quantidade de medições, a comparação entre as duas medições, inicial e final, pode se tornar tediosa e por isso é também conveniente acrescentar uma quarta coluna à tabela, colocando a diferença (p – q). Se o momento é conservado, estas diferenças devem ser consistentes com zero. Não se deve esquecer de computar a incerteza da diferença (p – q).

A computação para o cálculo da incerteza da diferença de duas medições é feita do seguinte modo. Sejam duas medições:

p medido = pestimado ± δp e

q medido = qestimado ± δq

Page 22: Analise Incerteza

Expressão da Incerteza

11

Os números pestimado e qestimado são as melhores estimativas para p e q (por exemplo, a média de várias medições). Assim, a melhor estimativa para a diferença (p – q) é (pestimado - qestimado). Para encontrar a incerteza desta diferença, deve-se tomar os maiores e menores valores prováveis de (p – q). O maior valor provável para (p – q) resulta de maior valor de p (pestimado + δp) menos o menor valor de q (qestimado - δq). Do mesmo modo, o menor valor provável para (p – q) resulta do menor valor de p (pestimado - δp) menos o maior valor de q.( qestimado + δq). Assim, o maior valor provável da diferença vale:

maior valor = (pestimado - qestimado) + (δp + δq)

(2.16) Do mesmo modo,

menor valor = (pestimado - qestimado) - (δp + δq)

(2.17) Combinando as duas equações, vê-se que

a incerteza na diferença (p – q) é a soma das incertezas de cada medição (δp + δq). Por exemplo, se

p = 1,49 ± 0,03 kg.m/s q = 1,56 ± 0,06 kg.m/s

então p – q = -0,07 ± 0,09 kg.m/s Agora, pode se ver rapidamente se os

resultados são consistentes com a conservação do momento, verificando se os números na coluna final são consistentes com zero (são iguais a zero dentro da incerteza de 0,09). Outro método mais eficiente é plotar os resultados em um gráfico e verificar visualmente os afastamentos e superposições das medições.

Ainda outro método alternativo, em vez de fazer a diferença entre p e q, com valor esperado (p – q = 0), é fazer a divisão entre p e q, com o valor esperado p/q = 1. No caso da divisão de duas medições, a incerteza final é diferente da subtração de duas medições e isso será visto posteriormente.

Tab. 2.2. Momentos medidos (kg.m/s)

# Momento p (p ± 0,03)

Momento q (q ± 0,03)

Diferença [(p - q) ± 0,09]

1 1,49 1,56 -0,07 2 3,10 3,12 -0,02 3 2,16 2,05 0,11

Fig. 2.4. Três diferenças de medições em um teste

de conservação do momento. O metrologista mediu o momento total de dois corpos antes e depois de sua colisão (p e q, respectivamente). Se o momento é conservado, as diferenças (p – q) devem ser todas iguais a zero. O gráfico mostra o valor de (p – q) com sua barra de erro para cada diferença. O valor esperado zero está dentro das margens de erro das diferenças 1 e 2 e está um pouco fora da diferença 3. Pode-se concluir que estes resultados são consistentes com a lei da conservação do momento.

A discussão sobre a incerteza em (p – q)

se aplica à diferença de quaisquer dois resultados de medições. Quando se tem quaisquer dois resultados de medições, x e y e se usam estes dois números para computar a diferença (x – y), a incerteza resultante na diferença é a soma das incertezas separadas de x e y. Tem-se assim a seguinte regra provisória (provisória porque será visto, na frente, que a incerteza mais provável é menor que esta soma).

Incerteza na Diferença (Regra provisória)

Se duas quantidades x e y são medidas

com incertezas de δx e δy e se os valores medidos x e y são usados para se calcular a diferença q = x – y, a incerteza em q é a soma das incertezas em x e y:

δx ≈ δx + δy

(2.18)

-0,20

2

-0,10

0

-0,10

-0,20

valor esperado (zero)

3

1

p – q (kg.m/s)

Page 23: Analise Incerteza

Expressão da Incerteza

12

Esta regra provisória (pessimista) será substituída posteriormente por outra regra melhorada (otimista) onde a incerteza da soma será dada pela raiz quadrada da soma dos quadrados das incertezas.

Também se pode considerar que há mais de um modo de tratar a composição de incertezas, quando se faz a soma ou subtração de várias incertezas individuais. Os dois mais usados são:

1. A incerteza da soma ou subtração de duas ou mais incertezas é igual à soma aritmética das incertezas individuais.

2. A incerteza da soma ou subtração de duas ou mais incertezas é igual à raiz quadrada da soma dos quadrados das incertezas individuais.

Quando se usa a regra da soma aritmética: 1. é mais fácil de entender 2. na maioria dos casos, ela é mais

conservativa (maior) que a outra 3. em alguns casos a diferença entre as

duas é pequena. A regra provisória sobre a incerteza da

diferença entre duas medições é a primeira de uma série de regras para a propagação da incerteza. Para calcular a diferença entre duas medições em termos das quantidades individuais, é necessário conhecer como as incertezas individuais se propagam para causar a incerteza na diferença.

Probleminha rápido 2.3. Quando se mede o calor latente do gelo,

um metrologista adiciona gelo à água e observa a variação da temperatura quando o gelo se derrete. Para determinar a massa de gelo adicionado, o metrologista pesa o vasilhame de gelo antes e depois de adicionar o gelo e depois toma a diferença, obtendo os seguintes resultados:

massa vaso + água = m1 = 203 ± 2 g massa vaso + água + gelo = m2 = 246 ± 3 g Encontrar a massa de gelo, m2 – m1 , com sua incerteza, usando a regra provisória.

Resposta: 43 ± 5 g

2.7. Verificando relações com gráficos Muitas leis físicas implicam que uma

quantidade é linearmente proporcional à outra. Exemplos clássicos:

1. Lei de Ohm: V = R i (tensão é igual ao produto da resistência pela corrente elétrica)

2. Lei de Hooke: F = kx (força é igual à extensão da mola vezes uma constante)

3. Lei de Newton: F = ma (força aplicada a um corpo é igual ao produto da massa por sua aceleração)

Quando uma quantidade y é proporcional a outra quantidade x, uma gráfico de y contra x é uma linha reta passando pela origem. Assim, para testar se uma quantidade y é proporcional a outra x, pode-se plotar os valores medidos de y contra os de x e notar se os pontos resultantes formam uma linha reta passando pela origem. Como a linha reta é facilmente reconhecível, este método é um modo simples e efetivo para verificar a proporcionalidade.

Para ilustrar este uso de gráficos, seja uma experiência para testar a lei de Hooke: F = kx. Um método simples consiste em

1. dependurar verticalmente uma mola 2. colocar várias massas m na mola 3. medir os deslocamentos x Assim, a força F é o peso mg da carga e a

extensão x é dada por:

m kg

kmgx ⎟

⎞⎜⎝

⎛== (2.19)

A extensão da mola, x, deve ser

proporcional à carga m e um gráfico de x contra m deve ser uma linha reta passando pela origem.

Quando se medem os vários valores de x para uma variedade de cargas e colocam-se os pontos no gráfico, na prática, todos os pontos não formam uma reta perfeita e cada ponto medido possui uma determinada incerteza.

A questão colocada é: os resultados da experiência se afastam da reta por causa das incertezas experimentais, de erros de método ou da possibilidade de x não ser proporcional a m. A resposta desta questão depende basicamente da análise das incertezas envolvidas.

Tab. 2.3. Carga e extensão da mola

Carga m, g m (exata)

Extensão x, cm x ± 0,3

200 1,1 300 1,5 400 1,9 500 2,8 600 3,4 700 3,5 800 4,6

Page 24: Analise Incerteza

Expressão da Incerteza

13

900 5,4 Como sempre, as quantidades medidas,

extensão x e massa m, são sujeitas à incertezas. Como foi usada uma balança muito precisa para medir as massas, a incerteza da massa pode ser considerada desprezível em relação à incerteza da medição do comprimento, onde se usou uma régua. Para a medição do comprimento tem-se uma incerteza de 0,3 cm. Para uma carga de 300 g, por exemplo, tem-se a extensão de 1,5 ± 0,3 cm. Para este ponto, a extensão está na faixa de 1,3 a 1,8 cm. Esta faixa é indicada, no gráfico, por uma barra de incerteza através de cada ponto para indicar a faixa em que ele provavelmente cai. Teoricamente, se espera uma linha reta passando pela origem e por todos os pontos medidos. Na prática, a linha reta passa através ou próxima de todos os pontos. O problema consiste em concluir se a extensão x é linearmente proporcional à carga m e, caso afirmativo, qual é este fator de proporcionalidade (constante da mola).

Pela equação teórica, a inclinação da curva é g/k. Medindo-se esta inclinação pode-se determinar a constante da mola.

Se a maioria das faixas de pontos (valor estimado e sua incerteza) está sobre a reta, os dados podem ser considerados consistentes e a lei de Hooke é comprovada experimentalmente.

Quando a maioria dos pontos cai fora da linha reta, os dados são inconsistentes e x não pode ser considerado proporcional a m. Neste casos, as medições, cálculos, métodos e teoria devem ser reconsiderados para se verificar por que x não pode ser considerado linearmente proporcional a m. Também pode acontecer que um determinado conjunto de pontos caia dentro da linha reta e outros pontos são inconsistentes e neste caso a lei de Hooke vale somente para determinados valores de m, por exemplo, até 600 gramas. Além deste ponto a mola já não segue a lei de Hooke. Nesta experiência, foi considerada significativa apenas a incerteza do comprimento da extensão da mola e foi considerada desprezível (em relação à do comprimento) a incerteza da massa e por isso foram usadas barras verticais (com o valor mais provável no meio e com a incerteza associada). Caso as duas incertezas sejam significativas, usam-se quadrados ou duas barras, uma vertical e outra horizontal, mostrando as respectivas incertezas associadas.

Um pouco mais complicado é quando uma quantidade é proporcional ao quadrado de outra. Por exemplo, a pressão diferencial

gerada pela placa de orifício é proporcional ao quadrado da vazão volumétrica. Assim, no caso genérico tem-se

y = A x2 (2.20)

onde A é uma constante e o gráfico de y contra x dá uma parábola, com a forma geral da Fig. 2.7 (a). Quando se faz uma série de medições de valores de y e x e colocam-se os pontos em um gráfico, obtém-se uma curva parecida com a mostrada na Fig. 2.7 (b). Infelizmente, julgar se os pontos pertencem à parábola não é tão fácil como a decisão com relação à linha reta. Porém, para verificar se y é proporcional a x2 pode-se plotar y contra x ao quadrado, obtendo-se uma reta, que é mais facilmente verificável.

Do mesmo modo, se y = Axn (onde n é qualquer potência), um gráfico de y contra xn deve dar uma linha reta e plotando os valores medidos de y contra xn, pode-se verificar facilmente se os pontos pertencem à curva. Existem ainda outras várias situações em que uma relação não linear pode ser convertida em linear, simplesmente pela escolha adequada das variáveis a plotar. Posteriormente serão mostrados outros meios de linearização.

Muitas vezes, a variável y depende exponencialmente de outra variável x:

BxAey = onde A e B são constantes e e é a base dos logaritmos naturais (associados à fenômenos da Natureza) ou de Euler. Por exemplo, a atividade da radioatividade depende exponencialmente do tempo e a carga de um capacitor depende exponencialmente da corrente. Para a relação exponencial, o logaritmo natural de x é linear com y, de modo que um gráfico de ln(y) contra x dá uma linha reta para uma relação exponencial.

Page 25: Analise Incerteza

Expressão da Incerteza

14

Fig. 2.5. Gráficos da extensão x da mola contra carga m. (a) Os dados da Tab. 2.3 sem barras de incertezas. (b) Os mesmos dados com barras de incertezas com

as incertezas em x. As incertezas em m são assumidas desprezíveis em relação às incertezas em x. Estes dados são considerados consistentes com a proporcionalidade esperada de x e m.

(c) Um diferente conjunto de dados, que são inconsistentes com x sendo proporcional a m.

Fig. 2.6. Medições com incertezas nas duas variáveis, mostradas com cruzes formadas com as incertezas de cada variável.

Fig. 2.7. (a) Se y é proporcional a x2, um gráfico de y contra x dá uma parábola com esta forma geral.

(b) Um gráfico de y contra x para um conjunto de valores medidos é difícil de verificar visualmente se os pontos se ajustam à parábola.

(c) Um gráfico de y contra x2 dá uma linha reta passando pela origem, que é fácil de verificar.

Há muitos outros métodos não gráficos

para verificar a proporcionalidade de duas quantidades. Por exemplo, se y é linearmente proporcional a x, a relação y/x deve ser uma constante. Assim, tendo-se tabulado os valores medidos de y e x, pode-se adicionar uma coluna com as relações y/x e verificar se estas relações são constantes dentro das incertezas experimentais. Há métodos envolvendo o coeficiente de correlação para mostrar se um conjunto de medições está conforme uma linha reta. Mesmo havendo tantos métodos, o gráfico é o modo mais simples e evidente de verificar a adequação dos pontos à diferentes curvas e principalmente à linha reta.

0

x

y

(a)

y

x

(b)

y

x2

(c)

5

0 500 1000

m (g)

x (cm)

(c)

5

0 500 1000 m (g)

x (cm)

(a)

5

0 500 1000

m (g)

x (cm)

(b)

Page 26: Analise Incerteza

Expressão da Incerteza

15

2.8. Incertezas relativas A incerteza δx em uma medição xmedido = xestimado ± δx

indica a confiabilidade ou precisão da medição. Porém, a incerteza δx em si não conta toda a história. Uma incerteza de 1 metro em uma distância de 1 quilômetro indica uma medição muito precisa, porém, uma incerteza de 1 metro em uma distância de 3 metros indica uma estimativa grosseira. Assim, a qualidade de uma medição é indicado não apenas pela incerteza δx mas pela relação entre δx e xestimado. Esta relação entre a incerteza e o valor da medição é chamado de incerteza relativa. A incerteza δx é chamada de incerteza absoluta, para evitar confusão com a relativa.

incerteza relativa = estimadox

(2.21)

Nesta definição, o símbolo |xestimado| denota

o valor absoluto de xestimado. Na maioria das medições sérias, a

incerteza δx é muito menor que o valor medido xestimado. Como a relação δx/xestimado é muito pequena, é comum expressar a incerteza em percentagem, multiplicando a incerteza relativa por 100%. Assim, a medição

comprimento L = 50 ± 1 cm (2.22)

tem uma incerteza relativa de

02,0cm 50

cm 1L

Lestimado

==δ

e a incerteza em percentagem vale 2% do valor medido. Por isso, o resultado da medição poderia ser dado também como:

comprimento L = 50 cm ± 2% Embora a incerteza absoluta tenha a

mesma unidade da quantidade medida, a incerteza relativa é dimensional, sem unidades. Este é um critério para ser usado para evitar o erro comum de confundir incerteza absoluta com incerteza relativa.

A incerteza relativa é uma ferramenta simples para indicar aproximadamente a

qualidade de uma medição, qualquer que seja o tamanho da quantidade medida. Ela é também chamada de precisão da medição.

Incertezas relativas de 10% são usualmente características de medições grosseiras. Esta incerteza ocorre quando se mede um comprimento de 10 cm e há uma incerteza de 1 cm ou quando se mede uma distância de 10 km com incerteza de 1 km. Incertezas relativas da ordem de 1 a 2% são características de medições razoavelmente cuidadosas e são a melhor esperança de um instrumentista em medições industriais ou de um metrologista em seu laboratório. Incertezas relativas da ordem de 0,1 a 0,2% são muito difíceis de serem conseguidas e são raras em medições industriais.

Obviamente esta classificação é superficial. Algumas medições simples podem ser feitas com incertezas de aproximadamente 0,1%. Um bom paquímetro pode medir distâncias com aproximadamente 0,1%, um bom cronômetro pode medir o período de uma hora com uma incerteza aproximada de um segundo ou 0,03%. Porém, a maioria das medições das variáveis de processo (temperatura, vazão, nível, pressão e análise) possuem medições com incertezas típicas de 1 a 10%. Grande incerteza relativa não significa necessariamente que a medição seja inútil. Mesmo na história da Física e Química, muitas incertezas experimentais são da ordem de 10%.

Outro aspecto relacionado com o valor da incerteza é o custo para obter pequenas incertezas. Quanto menor a incerteza, maior é o custo do instrumento de medição e maiores são os cuidados requeridos para fazer as medições.

Probleminha rápido 2.4. Converter as incertezas absolutas nas

seguintes medições em relativas ou percentuais.

(a) 55 ± 2 oC (b) –20 ± 2 oC (c) Uma massa vale m = 4,58 kg ± 2%.

Reescrever a expressão com incerteza absoluta.

(Como as incertezas devem ser dadas com um algarismo significativo, fazer os cálculos de cabeça, sem usar calculadora ou lápis e papel).

Resposta: (a) 55 oC ± 4% (b) –20 oC ± 10% (c) (4,58 ± 0,09) kg

Page 27: Analise Incerteza

Expressão da Incerteza

16

2.9. Algarismo significativo e incerteza relativa

O conceito de incerteza relativa está muito associado com a noção familiar de algarismos significativos. De fato, o número de algarismos significativos em uma quantidade é uma indicação aproximada da incerteza relativa desta quantidade.

Para um matemático, a expressão x = 21 tem dois algarismos significativos e isto significa que x está mais próximo de 21 do que de 20 ou 22, de modo que o número 21 com dois algarismos significativos significa 21 ± 0,5. Para o metrologista, os números são conseguidos de leituras de instrumentos diretamente ou através de algum cálculo. Se um indicador digital apresenta dois algarismos significativos e indica 21, isto pode significar 21 ± 0,5, mas pode também significar 21 ± 1 ou até 21 ± 5. (Para eliminar esta ambigüidade, deve-se consultar o catálogo do instrumento fornecido pelo fabricante). Nestas circunstâncias, a afirmação que um número medido tenha dois algarismos significativos é somente uma indicação grosseira de sua incerteza. Pode-se adotar o critério de definir que 21, com dois algarismos significativos significa 21 ± 1 e mais genericamente que um número com n algarismos significativos tem uma incerteza de 1 no enésimo dígito.

Sejam dois números: x = 21 y = 0,21

ambos com as precisões certificadas de dois algarismos significativos. De acordo com a convenção recém adotada, estes valores significam

x = 21 ± 1 y = 0,21 ± 0,01 Embora os dois números tenham ambos

dois algarismos significativos, eles tem incertezas absolutas muito diferentes, porém com mesma incerteza relativa de 5%:

%505,021,01,0

211

yy

xx

====δ

Evidentemente, a afirmação que os

números 21 e 0,21 (ou 210 ou 2,1 ou 0,0021) tem dois algarismos equivalentes é equivalente a dizer que eles tem incerteza de 5%. Do mesmo modo, 21,0 (com três algarismos significativos) tem incerteza aproximada de 0,5%.

Infelizmente, esta correlação é somente aproximada. Por exemplo, a afirmação x = 10, com dois algarismos significativos, significa

v = 10 ± 1 ou 10 ± 10% No outro extremo, w = 99 (também com

dois algarismos significativos) significa: w = 99 ± 1 ou 99 ± 1% Portanto, a incerteza relativa associada

com dois algarismos significativos pode variar de 1 a 10%, dependendo do primeiro dígito do número considerado.

A correspondência aproximada entre algarismos significativos e incertezas relativas pode ser resumida como mostrado na Tab. 2.4.

Tab. 2.4. Correspondência aproximada entre algarismos significativos e incertezas relativas

Incerteza relativa correspondente está Número de

algarismos significativos entre aproximadamente

1 10 e 100% 50% 2 1 e 10% 5% 3 0,1 e 1% 0,5% 4 0,01 e 0,1% 0,05%

2.10. Multiplicação de duas medições Talvez a maior importância da incerteza

relativa esteja na multiplicação de números conseguidos de medições. Por exemplo, para achar a tensão de um circuito, pode-se medir a corrente i e sua resistência R e então multiplicá-las para se obter v = Ri. Tanto a medição de R e i estão sujeitas a incertezas, que devem ser estimadas. O problema, então, é determinar a incerteza na tensão v que resulta das incertezas conhecidas em R e i.

A forma padrão é valor medido de x = xestimado ± δx

em termos da incerteza relativa tem-se

⎟⎟⎠

⎞⎜⎜⎝

⎛ δ±=

estimadoestimado x

x1x x de medido valor (2.23)

Por exemplo, se a incerteza relativa é de

3%

⎟⎠

⎞⎜⎝

⎛ ±=100

31x x de medido valor estimado

ou seja, incerteza de 3% significa que x cai provavelmente entre 0,97 e 1,03 vezes xestimado,

Page 28: Analise Incerteza

Expressão da Incerteza

17

0,97 xestimado < x <1,03 xestimado Este é um modo útil de pensar acerca de

um número medido que deve ser multiplicado. Voltando ao problema de calcular a

incerteza de v = Ri, quando R e i tem sido medidos:

⎟⎟⎠

⎞⎜⎜⎝

⎛ δ±=

estimadoestimado R

R1R medido R (2.24)

e

⎟⎟⎠

⎞⎜⎜⎝

⎛ δ±=

estimadoestimado i

i1i medido i (2.25)

Como Restimado e iestimado são a melhor

estimativa para R e i, respectivamente, a melhor estimativa para v = Ri é

melhor estimativa de v = vestimado vestimado = Restimado iestimado Os valores prováveis maiores de R e i

fornecem o maior valor provável de v = Ri. Com alguma computação, chega-se a

⎟⎟

⎜⎜

⎥⎥⎦

⎢⎢⎣

⎡ δ+

δ±=

estimadoestimadoestimadoestimado i

iR

R1iR v de valor

(2.26) Comparando com a forma geral

⎟⎟⎠

⎞⎜⎜⎝

⎛ δ±=

estimadoestimado v

v1v v de valor

chega-se à incerteza relativa de v, em função das incertezas de R e de i:

estimadoestimadoestimado ii

RR

vv δ

Se, por exemplo, as medições de R e i

forem R = 0,53 ± 0,01 Ω

e i = 9,1 ± 0,3 A

a melhor estimativa para v = Ri é vestimado = 0,53 Ω x 9,1 A = 4,82 V Para calcular a incerteza de v, calculam-se

as incertezas relativas de R e de i:

%202,053,001,0

RR

estimado

===δ

e

%303,01,93,0

ii

estimado

===δ

A incerteza relativa em v é então a soma:

%5%3%2v

vestimado

=+=δ

Para se ter a incerteza absoluta em v,

241,082,405,0vv

vv estimadoestimado

=×=×δ

Depois dos arredondamentos devidos e

usando-se o número correto de algarismos significativos, chega-se a

valor de v = 4,8 ± 0,2 V ou 4,8 V ± 5%. O procedimento anterior se aplica a

qualquer produto de duas quantidades medidas. Tem-se assim a segunda regra geral provisória para a propagação de erros. Quando se medem duas quantidades x e y e forma-se seu produto xy, as incertezas nas duas quantidades originais se propagam para causar uma incerteza em seu produto. Esta incerteza é dada pela seguinte regra provisória:

Incerteza no Produto

(Regra provisória)

Se duas quantidades x e y são medidas com pequenas incertezas de δx e δy e se os valores medidos x e y são usados para se calcular a produto q = xy, então a incerteza relativa em q é a soma das incertezas relativas em x e y:

estimadoestimadoestimado yy

xx

qq δ

≈δ

(2.28)

Como a regra da incerteza na soma, esta regra é também provisória, pois posteriormente ela será substituída por uma regra mais precisa.

Duas outras características devem ser realçadas nesta regra:

1. as incertezas relativas em x e y devem ser pequenas, de modo que o seu produto seja desprezível. Esta exigência é geralmente verdade na maioria das aplicações práticas. Quando as incertezas forem grandes, a regra não se aplica.

2. mesmo quando x e y tiverem dimensões diferentes, a regra se aplica

Page 29: Analise Incerteza

Expressão da Incerteza

18

pois as incertezas relativas são adimensionais.

Em instrumentação, é freqüente a multiplicação de dois números obtidos de medições e a regra proposta para achar a incerteza no produto será uma ferramenta importante na análise da incerteza. Para o momento, o principal objetivo é enfatizar que a incerteza em qualquer produto q = xy é expressa mais facilmente em termos da soma das incertezas relativas.

Probleminha rápido 2.5. Encontrar a área de uma superfície

retangular, cujos lados medidos são 9,1 ± 0,1 cm e 3,3 ± 0,1 cm. Expressar estas incertezas como incertezas percentuais e depois achar o melhor resultado para a área com sua incerteza (Primeiro achar a incerteza percentual e depois convertê-la para incerteza absoluta. Fazer todos os cálculos de cabeça, sem usar calculadora, lápis e papel).

Respostas: Lados 9,1 ± 1% e 3,3 ± 3% Área aproximada = 30 ± 4% ou 30 ± 1 cm2

Definições e Equações do Cap. 2

Formas para expressar incertezas A forma padrão para expressar uma

medição de uma quantidade física x é: valor medido de x = xestimado ± δx

onde xestimado = melhor estimativa de x

e δx = incerteza ou erro na medição Este resultado expressa a confiança de que

o valor correto de x provavelmente caia (ou fique próximo) da faixa determinada por

xestimado – δx e xestimado + δx.

Discrepância A discrepância entre dois valores medidos

da mesma quantidade física é:

discrepância = diferença entre dois valores medidos da mesma quantidade

Incerteza Relativa Se x é medido na forma padrão

xestimado ± δx, a incerteza relativa é

estimadoxx relativa incerteza δ

=

A incerteza percentual é a incerteza relativa

expressa como percentagem, ou seja, multiplicada por 100%.

Foram determinadas duas regras provisórias para a propagação da incerteza: 1. a incerteza absoluta na diferença de duas

quantidades medidas é igual à soma das duas incertezas absolutas individuais.

2. a incerteza relativa no produto de duas quantidades medidas é igual à soma das duas incertezas relativas individuais. Posteriormente, estas duas regras

provisórias serão substituídas por outras mais refinadas.

Page 30: Analise Incerteza

19

3. Propagação da Incerteza

3.1. Introdução Muitas quantidades físicas não podem ser

medidas diretamente, em um única medição, mas são encontradas em dois passos:

1. são medidas uma ou mais quantidades que podem ser encontradas diretamente

2. os valores medidos destas quantidades são usados para calcular a quantidade de interesse.

Por exemplo, para achar a área de um retângulo:

1. medem-se o comprimento L e a altura H

2. calcula-se a área A = LH Outro exemplo, para achar a vazão

volumétrica de um fluido passando por uma tubulação:

1. medem-se o volume acumulado em um intervalo de tempo, V, e o intervalo de tempo.

2. calcula-se a vazão volumétrica F = V/t. Muitos outros exemplos poderiam ser

apresentados para mostrar que a maioria das medições práticas envolve estes dois passos distintos de medições diretas seguidas por cálculos.

Quando a medição envolve estes dois passos, a estimativa das incertezas também envolve dois passos:

1. são estimadas as incertezas individuais das quantidades medidas diretamente

2. determina-se como as incertezas se propagam através dos cálculos para produzir uma incerteza no resultado final.

Esta propagação das incertezas é o principal objetivo deste capítulo.

Já foram vistos exemplos e apresentadas regras provisórias relacionados com a propagação da incerteza, quando são feitas as medidas e depois elas são combinadas em uma subtração ou em um produto.

Antes de se tratar da propagação das incertezas, será discutida rapidamente a estimativa de incertezas em quantidades medidas diretamente. Alguns métodos já vistos serão revistos, melhorados e outros novos métodos serão apresentados para estimar a incerteza nas medições diretas.

Finalmente será vista a propagação das incertezas. Será visto que quase todos os

problemas na propagação da incerteza podem ser resolvidos usando-se apenas três regras simples. Uma única regra, mais completa e complicada, também será apresentada para cobrir todos os casos e da qual as três regras simples são derivadas.

Este capítulo é longo, porém seu comprimento simplesmente reflete sua grande importância. A propagação da incerteza é uma técnica que será usada repetidamente na Instrumentação, Laboratório de Metrologia e Laboratório Químico.

3.2. Incertezas nas medições diretas A maioria das medições diretas envolve a

leitura de uma escala (em uma régua, relógio, voltímetro, velocímetro, termômetro, manômetro) ou de um display digital. Às vezes, as principais fontes de incerteza estão na leitura da escala e na necessidade de interpolar a leitura entre duas marcações da escala. Nestes casos, a determinação da incerteza é fácil: é razoável estimar a incerteza da leitura como a metade da menor divisão. Assim, se a menor divisão da escala é 1 mm, a incerteza da indicação é de 0,5 mm; se a menor divisão é 2 oC, a incerteza é de ±1 oC. Quando o display é digital e nenhuma outra informação adicional é fornecida, é razoável supor que a incerteza é, no mínimo, igual a ± 1 dígito (o menos significativo).

Infelizmente, há outras fontes de incertezas presentes e mais importantes que as dificuldades em ler a escala. Na medição de distância, por exemplo, o principal problema é decidir onde as duas extremidades realmente estão. Como a incerteza aparece porque os dois pontos que determinam o comprimento não são claramente definidos, este tipo de dificuldade é chamado de problema de definição.

Este exemplo ilustra um sério perigo na avaliação da incerteza. Quando se considera apenas a escala e se esquece de outras fontes de incerteza, a incerteza está sendo subestimada. Quando não se consideram todas as fontes de incerteza, a incerteza pode ser subestimada por fatores de 10 ou mais. O caso oposto é considerar incertezas em excesso, superestimando a incerteza final. O ideal é considerar todas as fontes possíveis de incertezas e estimar seus efeitos exatamente, o que geralmente é difícil e trabalhoso.

Page 31: Analise Incerteza

Propagação da Incerteza

20

Superficialmente, fazer a leitura de um medidor digital é muito mais fácil do que fazer a interpolação da leitura em escala analógica. A não ser que o medidor esteja com defeito, o display digital apresenta somente algarismos significativos. Por isso, é comum se afirmar que o número de algarismos significativos em um display digital é exatamente o número de dígitos apresentados. Porém, nem sempre o significado exato de algarismos significativos é claro. Assim, o display de um voltímetro digital igual a 93 mV significa 93 ± 1 mV, no mínimo. Há catálogos de instrumentos que definem exatamente qual a incerteza do display. É possível se ter incertezas de ±5 ou ±10 dígitos.

A incerteza da medição envolve outras fontes, como método, operador, condições ambientais, além do sistema de medição em si. Por exemplo, se um metrologista usa um cronômetro digital para medir um intervalo de tempo e obtém um resultado de 8,01 segundos, é razoável supor que o tempo vale

t = 8,01 ± 0,01 s (3.1) Outro metrologista medindo o mesmo

intervalo de tempo, aparentemente nas mesmas condições, pode conseguir 8,41, ou seja

t = 8,41 ± 0,01 (3.2) Há uma grande discrepância entre as duas

medições (0,40 s), muito maior que a incerteza considerada (0,01 s). Tomando-se os dois resultados, é muito mais realista apresentar o resultado como

t = 8,2 ± 0,2 s Esta incerteza (0,2 s) é 20 vezes maior que

a sugerida inicialmente (0,01 s). Sempre que uma medição puder ser

repetida, ela deve ser feitas várias vezes. O espalhamento das várias medições repetidas é uma boa indicação das incertezas e a média dos valores medidos quase sempre tem mais confiabilidade do que uma única medição. Posteriormente serão vistos os tratamentos estatísticos das medições múltiplas. Agora, o que deve ser enfatizado é que se uma medição é repetitível, ela deve ser repetida, para

1. se obter um resultado mais confiável 2. se ter uma estimativa das incertezas. Porém, nem sempre a repetição da

medição revela incertezas. Se um cronômetro estiver com um erro sistemático, de modo que todos seus resultados possuem um atraso sistemático, o espalhamento das medições repetidas não revela esta incerteza sistemática.

3.3. Regra da raiz quadrada para uma contagem

Outro tipo diferente de medição direta tem uma incerteza que pode ser facilmente estimada. Algumas experiências requerem uma contagem de eventos que ocorrem aleatoriamente, mas têm uma taxa média definida. Por exemplo, os instrumentos defeituosos em uma oficina de instrumentação chegam de um modo aleatório, porém, ao longo de um mês ou ano, há uma média definida de instrumentos defeituosos. Se um instrumentista quiser saber esta taxa, ele pode contar 32 instrumentos defeituosos em um mês, na oficina. A não ser que tenha havido um engano, o número 32 é exato, pois é a contagem dos instrumentos defeituosos que chegaram à oficina. Como os instrumentos aparecem de modo aleatório, porém, 32 pode não ser igual ao número médio real de instrumentos em todos os meses. Talvez este número possa ser 31, 29 ou mesmo um número fracionado, como 29,8 ou 32,6.

Evidentemente, a incerteza neste tipo de experiência não está no número contado (32 por exemplo). Em vez disso, a incerteza está em como este número observado se aproxima do número médio verdadeiro. O problema é estimar qual é o valor desta incerteza. A teoria será vista na frente, porém já se pode dizer que a incerteza em qualquer número contado de eventos aleatórios, como uma estimativa do número médio verdadeiro, é a raiz quadrada do número contado. No exemplo, o instrumentista contou 32 instrumentos defeituosos em um período de um mês. Assim, a incerteza é de 32 ≈ 6 e o resultado final pode ser expresso como:

número de instrumentos com defeito, no

período de um mês = 32 ± 6. Para tornar esta afirmação mais geral,

suponha que se tenha contado o número de ocorrências aleatoriamente, mas com uma média definida. Suponha que se conte para um determinado intervalo de tempo escolhido T (como um mês) e se tenha obtido o número de eventos observado ν (letra grega correspondente ao n latino, n de número). Baseado nesta experiência, a melhor estimativa para o número médio de eventos no tempo T é o número observado ν e a incerteza nesta estimativa é a raiz quadrada de ν, ν . Assim, a melhor expressão para o número médio de eventos aleatórios no tempo T é

número médio de eventos em T = ν ± ν

Page 32: Analise Incerteza

Propagação da Incerteza

21

(3.2) Este resultado pode ser chamado de Regra

da Raiz Quadrada para a Contagem. Experimentos envolvendo contagem são

freqüentes em laboratórios químicos. Por exemplo, o estudo do decaimento radioativo, onde cada núcleo decai em um tempo aleatório, mas o decaimento em uma grande amostra ocorre em uma taxa média definida. Para encontrar esta taxa, simplesmente se conta o número ν de decaimentos em determinado intervalo de tempo.

Probleminha rápido 3.1. (a) Para verificar a atividade de uma

amostra radioativa, coloca se a amostra em um contador de cintilação líquida para contar o decaimento em um intervalo de dois minutos e se obtém 34 contagens. Como este resultado é apresentado como o número de decaimentos produzidos pela amostra em dois minutos?

(b) Agora, suponha que se tenha monitorado a mesma amostra durante 50 minutos e obtido uma contagem de 907. Como pode ser apresentado este resultado de decaimentos em 50 minutos?

(c) Achar a incerteza percentual destas duas medições e comentar a utilidade de uma contagem para um período maior, como em (b).

Resposta:

(a) 33 ± 6 contagens ou 33 contagens ± 18% (b) 907 ± 30 contagens ou 907 contagens ± 3% (c) 33 ± 18% e 907 ± 3%. Em grandes contagens a incerteza percentual fica muito menor, compensando a desvantagem de demorar a contagem.

3.4. Somas e diferenças; produtos e quocientes

Seja a medição de uma ou mais quantidades, x, y, ... com incertezas correspondentes de δx, δy, ... e que se queira usar os valores medidos de x, y, ... para calcular a quantidade q = f(x, y, ...). O cálculo de q é direto. O problema é como as incertezas δx, δy, ... se propagam através dos cálculos e resultam em uma incerteza δq no valor final de q.

Somas e diferenças No Capítulo 2 foi discutido o que acontece

quando se medem duas quantidades x e y e se calcula sua soma, x + y ou sua diferença x - y. Para estimar a incerteza na soma ou diferença, devia-se apenas decidir acerca do maior e

menor valor provável. O maior e menor valores prováveis de x são xestimado ± δx e os de y são yestimado ± δy. Assim, o maior valor provável da soma x + y é

xestimado + yestimado + (δx + δy)

e o menor valor provável é xestimado + yestimado - (δx + δy)

Então, a melhor estimativa para q = x + y é qestimado = xestimado + yestimado

e a sua incerteza δq ≈ δx + δy (3.3) De modo similar, pode-se mostrar que a

incerteza na diferença x – y é dada pela mesma fórmula (3.3). Ou seja, a incerteza na soma x + y ou na diferença x – y é a soma das incertezas δx + δy de x e y. Genericamente, com várias variáveis x, y, ..., z, tem-se a regra provisória:

Incerteza nas Somas e Diferenças (Regra provisória)

Se as quantidades, x, y, ...w, são

medidas com incertezas �x, �y, ...�w e os valores medidos são usados para computar q = x + y + ...+ z – (u + v + ... + w), então, a incerteza no valor computado de q é a soma de todas as incertezas originais: δq = δx + δy + ...+ δz + δu + δv + ... + δw

Em outras palavras, quando se soma ou

subtrai qualquer número de quantidades, as incertezas absolutas destas quantidades sempre se somam. Esta regra é provisória e será substituída por uma mais realista, na frente.

Exemplo: adição e subtração de massas Misturam-se várias massas de líquidos em

dois frascos, tendo se medido suas massas separadas , com frascos cheios e vazios, obtendo-se

M1 = massa 1o frasco e conteúdo = 540 ± 10 g m1 = massa 1o frasco vazio = 72 + 1 g M2 = massa 2o frasco e conteúdo = 940 ± 20 g m2 = massa 2o frasco vazio = 97 + 1 g

Page 33: Analise Incerteza

Propagação da Incerteza

22

Para calcular a massa total do líquido tem-se

M = M1 – m1 + M2 – m2 = (540 – 72 + 940 – 97) g = 1 311 g Aplicando a regra provisória, a incerteza

deste resultado é a soma de todas as quatro incertezas:

δM ≈ δM1 + δm1 + δM2 + δm2 = 10 + 1 + 20 + 1 g = 32 g Assim, o resultado final, arredondado é massa total do líquido = 1 310 + 30 g Deve se notar que as incertezas muito

pequenas das massas nos frascos vazios praticamente não contribuem com a incerteza final e por isso elas poderiam ser desprezadas. Este efeito é importante e será discutido mais tarde. Com experiência e bom senso, pode-se identificar, a priori, as incertezas dominantes e desprezíveis e deve-se separá-las, eliminando as desprezíveis, para simplificar os cálculos.

Produtos e Quocientes Já foi discutido como a incerteza se

propaga no produto q = xy de duas quantidades medidas. Foi visto que, desde que as incertezas relativas individuais fossem pequenas, a incerteza relativa no produto é a soma das incertezas relativas individuais. Além de rever esta regra, aqui será discutido o caso do quociente q = x/y. Será visto que a incerteza relativa no quociente também será igual à soma das incertezas relativas individuais, exatamente como no produto.

Como as incertezas nos produtos e quocientes são melhor expressas em termos de incertezas relativas, uma notação simplificada para a incerteza relativa é útil.

De novo, a medição de uma quantidade x é:

valor medido de x = xestimado ± δx

e a incerteza relativa em x é definida como

incerteza relativa em x = estimadox

O valor absoluto no denominador garante

que a incerteza relativa é sempre positiva, mesmo quando xestimado for negativo. Como o símbolo δx/xestimado é complicado para escrever

e ler, a partir de agora será abreviado e simplificado, escrevendo-se simplesmente

incerteza relativa em x = xxδ

O resultado de medir qualquer quantidade x pode ser expresso em termos de sua incerteza relativa

xxδ como

valor de x = xestimado ± (1 + δx/ x ) O valor de q = x/y pode ser escrito:

valor de q = y/y1x/x1

yx

estimado

estimado

δ±δ± (3.5)

Agora, pensando em termos de valores

máximo e mínimo e considerando que o último fator na expressão anterior tem a forma de

)b1()a1(

−+

e considerando que os números a e b são normalmente pequenos, ou seja, muito menores que 1, e simplificando

b1b1

1+≈

− (3.6)

tem-se

abba1)b1)(a1()b1()a1(

+++=++≈−+

Desprezando o termo ab, em relação a a e b, tem-se

≈ 1 + a + b Chega-se, finalmente a:

estimado

estimadoestimado y

xq =

e a incerteza relativa

yy

xx

qq δ

≈δ (3.7)

Como conclusão: na multiplicação ou

divisão de duas quantidades medidas x e y, a incerteza relativa no resultado é a soma das incertezas relativas individuais em x e y. Tem-se então:

Page 34: Analise Incerteza

Propagação da Incerteza

23

Incerteza nos Produtos e Quocientes

(Regra provisória)

Se várias quantidades, x, y, ...w, são medidas com pequenas incertezas δx, δy, ...δw e os valores medidos são usados para computar

w...vuz...yxq

××××××

=

então, a incerteza relativa no valor

computado de q é a soma de todas as incertezas relativas originais:

ww...

uu

zz...

yy

xx

qq δ

++δ

≈δ

De modo resumido: quando as quantidades

são multiplicadas ou divididas, as incertezas relativas se somam.

Exemplo Em topografia, às vezes um comprimento

inacessível (altura de um edifício) é determinado pela medição de outros três comprimentos acessíveis. Tem-se

3

21

LLLL =

Foram obtidas as seguintes medições: L1 = 200 ± 2 m L2 = 5,5 ± 0,1 m L3 = 10,0 ± 0,4 m A melhor estimativa de L é

m 110m 0,10

5,5200Lestimado =×

=

As incertezas relativas são: δL1/L1 = 2/200 = 1% δL2/L2 = 0,1/5,5 = 2% δL3/L3 = 0,4/10 = 4%

de modo que a incerteza final de �L/L vale 7% e o resultado final é expresso como

L = 110 m ± 7% ou (110 ± 8) m

Probleminha rápido 3.2. Seja a medição de três quantidades x, y e z:

x = 8,0 ± 0,2 y = 5,0 ± 0,1 z = 4,0 ± 0,1 Expressar as incertezas dadas como

percentagens e depois calcular q = xy/z com sua incerteza δq, como dado pela regra provisória.

Resposta: δx/x = 2,5% δy/y = 2% δz/z = 2,5% q = 10 ± 7% ou 10 ± 0,7 (também 10 ± 1)

3.5. Dois casos especiais importantes Hás dois casos que merecem estudo

isolado: 1. produto de dois números, sendo um

deles exato (sem incerteza) 2. potência (como x2) de um número

medido.

Quantidade medida vezes constante Seja uma quantidade x cujo valor medido é

multiplicado por uma constante: q = Bx

onde B é constante, ou seja, não tem incerteza. Por exemplo, pode se medir o diâmetro d de um circulo e multiplicá-lo por π para se obter sua circunferência c:

c = π x d.

Outro exemplo: mede-se a espessura T de

500 folhas idênticas e se quer calcular a incerteza da espessura de uma folha individual, t, onde

t = T/500 De acordo com a regra provisória, a

incerteza relativa em q = Bx é a soma das incertezas relativas em B e em x. Como δB = 0, tem-se

xx

qq δ

≈δ

A incerteza relativa em q = Bx, com B

constante, é a mesma que a incerteza relativa

Page 35: Analise Incerteza

Propagação da Incerteza

24

de x. Multiplicando-se ambos os termos por q , chega-se a

xBq δ=δ

Quantidade Medida Vezes Número Exato (Regra provisória)

Se uma quantidade x é medida com

incerteza δx e usada para computar o produto

q = Bx

onde B não tem incerteza, então a incerteza absoluta em q é B vezes a incerteza absoluta em x,

xBq δ=δ

(3.9)

Esta regra é muito útil quando se tem algo muito pequeno para se medir mas é possível fazer a medição de um conjunto, tal como a espessura de uma folha fina. Quando se mede a espessura de 500 folhas:

espessura 500 folhas = T = 13,0 ± 0,1 cm

segue-se imediatamente que a espessura de uma única folha, t, é:

espessura de uma folha = t = 1/500 x T

= 0,026 0 ± 0,000 2 cm

Probleminha rápido 3.3. Seja a medição do diâmetro de um circulo: d = 5,0 ± 0,1 cm Através deste valor, calcular a

circunferência c = πd, com sua incerteza associada.

Resposta: 15,7 ± 0,3 cm

Potências O outro caso especial se refere ao cálculo

da potência de alguma quantidade medida. Por exemplo, pode-se medir a velocidade v de um corpo de massa m e então achar a sua energia cinética, ½ mv2 , através de v2. Como v2 é o produto de v por v, segue que a incerteza relativa em v2 é duas vezes a incerteza relativa de v.

Incerteza na Potência Se uma quantidade x é medida com

incerteza δx e o valor medido é usada para computar a potência

q = xn

então a incerteza relativa em q é n vezes a

incerteza relativa em x,

nxn

qq δ

=δ (3.10)

Probleminha rápido 3.4. Achar o volume de um dado cubo, cuja

medição do lado é 2,00 ± 0,02 cm. Expressar esta incerteza em percentagem

e em valor absoluto. Resposta:

x = 2,00 cm ± 1% q = 8,0 cm3 ± 3% ou (8,0 ± 0,2) cm3

Exemplo: Medição da gravidade Seja a medição da gravidade do local, pela

medição do tempo t em que uma pedra cai de uma altura h. Depois de várias medições chega-se a

t = 1,6 ± 0,1 s h = 13,9 ± 0,1 m

Como 2gt

21h = tem-se

2th2g =

Aplicando os valores, tem-se

2

2 s/m 9,10s 6,16,1m 9,132g =

××

=

A incerteza deste resultado é dada por:

tt2

hh

gg δ

%7,09,131,0

hh

==δ

%3,66,11,0

tt

==δ

incerteza final = 0,7% + 2 x 6,3% = 13,3%

O resultado pode ser expresso como:

Page 36: Analise Incerteza

Propagação da Incerteza

25

g = 10,9 m/s2 ± 13%

ou

g = (10,9 ± 1,5) m/s2 ≈ 11 ± 2 m/s2 Este exemplo ilustra como, às vezes, é

simples estimar as incertezas de um resultado. Ele também ilustra como a análise da incerteza pode determinar o tamanho das incertezas e também reduzi-lo. O exemplo também mostra que a incerteza dominante é a devida à medição do tempo e a incerteza da medição da distância é desprezível. Se se quiser melhorar a incerteza da medição da aceleração da gravidade, deve-se melhorar a medição do tempo. Qualquer tentativa de melhoria da medição da distância é perda de tempo e esforço. Finalmente, o valor aceito arredondado para g é de 10 m/s2 e o resultado acima está consistente com este valor esperado, embora não seja muito preciso (±13%).

3.6. Incertezas independentes na soma As regras apresentadas até agora podem

ser facilmente resumidas como: 1. Quando as quantidades medidas são

somadas ou subtraídas, as incertezas absolutas se somam.

2. Quando as quantidades medidas são multiplicadas ou divididas, as incertezas relativas se somam.

Será visto, agora e aqui, como as incertezas calculadas, sob certas condições e usando-se estas regras, podem ficar desnecessariamente muito grandes. Especificamente, será visto que, quando se tem incertezas aleatórias e independentes, o modo mais realista e melhor de estimar a incerteza resultante final é pela raiz quadrada da soma dos quadrados das incertezas individuais.

Seja a soma de dois números x e y, q = x + y, que foram medidos e expressos na forma padrão:

valor medido de x = xestimado ± δx e

valor medido de y = yestimado ± δy O argumento usado anteriormente era: 1. A melhor estimativa de q era

claramente qestimado = xestimado + yestimado

2. Como os maiores valores prováveis

para x e y eram xestimado + δx e yestimado + δy, o maior valor provável para q era xestimado + yestimado+ δx + δy

3. Do mesmo, o menor valor provável para q era xestimado + yestimado - δx - δy (3.12)

4. Concluiu-se que o valor de q provavelmente caia entre estes dois números e a incerteza em q era δq ≈ δx + δy

Para verificar que esta fórmula

provavelmente superestima δq, considere-se como o valor real de q poderia ser igual ao maior valor provável. Obviamente, isto ocorre se x foi subestimado pelo valor total de δx e y foi subestimado pelo valor total de δy, que é um evento pouco provável. Se x e y são medidos independentemente e as suas incertezas são naturalmente aleatórias, tem-se uma chance de 50% de subestimar x acompanhado de superestimar y ou vice versa. Claramente, a probabilidade de se subestimar tanto x como y pelos valores totais de δx e δy é relativamente pequena. Deste modo, o valor δq ≈ δx + δy ultrapassa a incerteza provável.

Qual é a melhor estimativa de δq? A resposta depende precisamente o que significam as incertezas (isto é, o que significa a afirmação que q está provavelmente em algum ponto entre qestimado + δq e qestimado – δq). A resposta também depende das leis estatísticas que governam as incertezas na medição. Posteriormente, será vista a distribuição normal ou de Gauss, que descreve o comportamento das medições sujeitas às incertezas aleatórias. As leis mostram que se as medições de x e y são feitas independentemente e ambas são governadas pela distribuição normal, então a incerteza em q = x + y é dada por

22 )y()x(q δ+δ=δ (3.13)

Quando se combinam dois números,

tirando-se a raiz quadrada da soma de seus quadrados, os números são somados em quadratura. Assim, a regra atrás da equação anterior pode ser dita como: se as medições de x e y são independentes e ambas são sujeitas apenas a incertezas aleatórias, então a incerteza δq no valor calculado da soma q = x + y é a soma em quadratura ou a raiz quadrada da soma dos quadrados das incertezas δx e δy.

Page 37: Analise Incerteza

Propagação da Incerteza

26

Fig. 3.1. Como qualquer lado de um triângulo é

sempre menor que a soma dos outros dois, a desigualdade 22 ba + < a + b é sempre verdadeira.

Comparando-se a eq. (3.13) para a

incerteza em q = x + y com a expressão antiga :

δq ≈ δx + δy (3.14)

percebe-se que: 1. A expressão da raiz quadrada é

sempre menor que a expressão da soma aritmética (isto pode ser facilmente visto considerando um triângulo retângulo com os catetos iguais a x e y e onde cada lado é sempre menor que a soma dos outros dois, tem-se 22 yx + < x + y.

2. A expressão da raiz quadrada reflete a possibilidade que uma superestimativa de x ser cancelada por uma subestimativa de y ou vice versa. Porém, há medições onde este cancelamento não é possível.

Seja por exemplo, a soma de dois comprimentos x e y medidos com uma mesma régua metálica, q = x + y. Suponha-se que a principal fonte de incerteza seja o medo que a régua tenha sido projetada para uso em temperatura diferente que a real. Se a temperatura da medição não é conhecida ou se não se tem um padrão de comprimento para calibração da régua, então a medição possui uma incerteza sistemática, para menos ou para mais. Esta incerteza pode ser facilmente determinada (desde que se conheça o coeficiente de expansão termal da régua metálica e as temperaturas de referência e real). O ponto, porém, é que a medição estará sempre superestimando ambos x e y ou sempre subestimando x e y e nunca haverá um cancelamento, que justifique a soma em quadratura de x e y para computar a incerteza na soma q = x + y. Em outras palavras, as medições de x e y tem uma componente de

incerteza sistemática e portanto não são independentes.

Posteriormente, será mostrado que a incerteza na soma q = x + y, com medições aleatórias ou não aleatórias, é certamente não maior que a soma δx + δy:

yxq δ+δ≤δ (3.15)

Ou seja, a expressão antiga que expressa

a incerteza na soma igual à soma das incertezas, é realmente um limite superior que ocorre em todos os casos. Quando se tem razões para suspeitar que x e y não são independentes e aleatórias, não se justifica usar a raiz quadrada da soma dos quadrados. Por outro lado, o limite garante que δq é certamente não pior que δx + δy e deve-se usar a velha regra da soma aritmética

yxq δ+δ≈δ

Muitas vezes, as incertezas calculadas com

a soma aritmética ou com a raiz quadrada da soma dos quadrados são muito parecidas. Por exemplo, sejam x e y comprimentos medidos com incertezas δx = δy = 2 mm. Se as incertezas forem independentes e aleatórias, a incerteza na soma será a raiz quadrada da soma dos quadrados:

22 )y()x( δ+δ = mm 3 mm 2,8 mm 44 ≈=+

Porém, se há suspeita que x e y sejam

dependentes ou haja incertezas sistemáticas, deve-se usar a soma aritmética:

δx + δy ≈ (2 + 2) mm = 4 mm Em algumas situações, a estimativa das

incertezas é tão grosseira que a diferença entre os dois resultados não é importante. Em outras situações, a raiz quadrada da soma dos quadrados é significativamente menor que a soma aritmética. Também, a soma em quadratura é geralmente mais fácil de ser computada que a soma aritmética.

b

a

22 ba +

Page 38: Analise Incerteza

Propagação da Incerteza

27

Probleminha rápido 3.5. Sejam dois volumes medidos em dois

frascos como V1 = 130 ± 6 mL V2 = 65 ± 4 mL

e o conteúdo do segundo frasco é colocado cuidadosamente no primeiro. Qual é a previsão para o volume total V = V1 + V2 e a incerteza δV,

(a) assumindo que as incertezas sejam independentes e aleatórias

(b) suspeitando que as incertezas sejam dependentes ou haja causa sistemática.

Resposta:

(a) V = 195 ± 7 mL ou 195 mL ± 4% (b) V = 195 ± 10 mL ou 195 mL ± 5%

3.7. Mais acerca de incertezas independentes

Na seção anterior, foi discutido como incertezas aleatórias independentes em duas quantidades x e y se propagam para causar uma incerteza na soma x + y. Para este tipo de incerteza, as duas incertezas individuais podiam ser combinadas na raiz quadrada da soma dos quadrados. Estas considerações podem ser estendidas para diferenças, produtos e quocientes. Como será visto na frente, em todos os casos, as regras provisórias anteriores podem ser modificadas, substituindo se as somas aritméticas por raízes quadradas da soma dos quadrados. As expressões com as somas aritméticas provaram ser os limites superiores que sempre ocorrem, qualquer que seja o tipo das incertezas, aleatório ou sistemático, dependente ou independente. Assim, as versões finais das duas regras provisórias são as seguintes:

Incerteza nas Somas e Diferenças

Se várias quantidades, x, y, ...w, são medidas com incertezas δx, δy, ...δw e os valores medidos são usados para computar

q = x + y + ...+ z – (u + v + ... + w),

Se as incertezas em x, y, ... z, u, ...w, são

conhecidamente independentes e aleatórias, então, a incerteza no valor computado de q é a raiz quadrada da soma dos quadrados das incertezas individuais:

2222 )w...()u()z(...)x(q δ+δ+δ++δ=δ

(3.16) Em qualquer caso, δq nunca é maior que a soma aritmética,

δq ≤ δx + δy + ...+ δz + δu + δv + ... + δw

(3.17)

Incerteza nos Produtos e Quocientes

Se várias quantidades, x, y, ...w, são medidas com pequenas incertezas δx, δy, ...δw e os valores medidos são usados para computar

w...vuz...yxq

××××××

=

Se as incertezas em x, y, ... z, u, ...w, são

conhecidamente independentes e aleatórias, então, a incerteza relativa no valor computado de q é a raiz quadrada da soma dos quadrados das incertezas relativas individuais:

2222 )

ww(...)

uu()

zz...()

xx(

qq δ

++δ

(3.18) Em qualquer caso, a incerteza relativa

nunca é maior que a soma aritmética,

ww...

uu

zz...

yy

xx

qq δ

++δ

≤δ

(3.19) Note se que ainda não foi justificado o uso

da raiz quadrada da soma dos quadrados para incertezas aleatórias e independentes. Foi apenas sugerido que, quando as várias incertezas forem independentes e aleatórias, há uma grande probabilidade de haver cancelamentos de incertezas e que a incerteza resultante é sempre menor que a obtida com a soma aritmética das incertezas originais. A raiz quadrada da soma dos quadrados tem esta propriedade. A justificativa será feita no Cap. 5. Os limites serão provados no Cap. 9.

Page 39: Analise Incerteza

Propagação da Incerteza

28

Exemplo: Soma aritmética vs soma em quadratura

Às vezes, não há diferença significativa entre as incertezas computadas pela soma em quadratura e as computadas pela soma aritmetica. Na maioria das aplicações, porém, há uma grande diferença e, surpreendentemente, a soma em quadratura é geralmente mais simples para computar. Para comprovar como esta situação ocorre, seja o seguinte exemplo:

Quer se achar a eficiência de um motor cc usando-o para levantar uma massa m através de uma altura h. O trabalho realizado é mh e a energia elétrica entregue pelo motor é Vit, onde V é a tensão aplicada, i é a corrente e t é o tempo em que o motor funciona. A eficiência é então:

motor ao entregue energiamotor pelo feito trabalho eficiencia =

ou

Vitmghe =

As medições de m, h, V e i são feitas com

incerteza de ±1%. A medição do tempo tem incerteza de ±5%. A medição de g tem incerteza desprezível (ou g é considerada constante conhecida).

Usando-se a regra antiga de considerar a incerteza relativa no resultado final igual à soma aritmética das incertezas relativas individuais, tem-se:

tt

ii

VV

hh

mm

ee δ

= (1 + 1 + 1 + 1 + 5)% = 9%

Se há confiança que todas as incertezas

sejam independentes e aleatórias, pode-se computar a incerteza resultante como a raiz quadrada da soma dos quadrados:

22222 )

tt()

ii()

VV()

hh()

mm(

ee δ

22222 %)5(%)1(%)1(%)1(%)1( ++++=

%5%29 ≈=

Claramente, a raiz quadrada da soma dos

quadrados é uma estimativa muito menor para δe. Para um algarismo significativo, as incertezas em m, h, V e i praticamente não contribuem para a incerteza em e (são

desprezíveis) e a incerteza em t é significativa (é predominante). Tem-se:

tt

ee δ

≈δ

Esta grande simplificação é facilmente

entendida. Quando os números são somados em quadratura, eles são elevados ao quadrado e depois somados. O processo de elevar ao quadrado aumenta exageradamente a importância dos números grandes. Assim, se um número é 5 vezes maior que outro, seu quadrado é 25 vezes maior que o quadrado do outro.

Este exemplo ilustra como combinar incertezas em quadratura é usualmente melhor e geralmente mais fácil do que combiná-las em soma aritmética. O exemplo também ilustra o tipo de problema em que os erros são independentes e aleatórias, quando se justifica usar a raiz quadrada da soma dos quadrados. As cinco unidades (massa, comprimento, tensão, corrente e tempo) são quantidades físicas totalmente diferentes, com diferentes unidades e são medidas por processos inteiramente independentes. Por isso é inconcebível que uma fonte cause incerteza em duas quantidades simultaneamente.

Probleminha rápido 3.6 Sejam os resultados de três medidas x = 200 ± 2 (200 ± 1%) y = 50 ± 2 ( 50 ± 4%) z = 20 + 1 ( 20 ± 5%)

onde as três incertezas são independentes e aleatórias.

(a) Qual o valor e incerteza para q = x + y – z

(b) Qual o valor e incerteza para r = xy/z Resposta: (a) 230 ± 3 ou 230 ± 9%

(b) 500 ± 30 ou 500 ± 6,5%

3.8. Funções arbitrárias de uma variável Já foi visto como as incertezas,

dependentes ou independentes, sistemáticas ou aleatórias, insignificantes ou predominantes, se propagam através de somas, diferenças, produtos e quocientes. Porém, há aplicações que envolvem operações mais complicadas,

Page 40: Analise Incerteza

Propagação da Incerteza

29

como cálculos trigonométricos ou raiz quadrada e por isso é necessário saber como as incertezas se propagam nestes casos.

Como exemplo, seja a medição de vazão com placa de orifício, onde a pressão diferencial gerada pela placa e medida pelo transmissor é proporcional ao quadrado da vazão. Para se calcular a vazão, deve-se extrair a raiz quadrada desta pressão diferencial medida.

Um modo simples de visualizar o cálculo é desenhar um gráfico de q(x), como na Fig. 3.2. A melhor estimativa de q(x) é qestimado = q(xestimado) e os valores xestimado e qestimado são mostrados ligados por linha cheia.

Para decidir qual a incerteza δq, é empregado o argumento usual. O valor mais provável de x é xestimado ± δx. Usando o gráfico, pode-se encontrar imediatamente o maior valor provável de q, que é mostrado como qmax. Do mesmo modo, procede-se com o menor valor provável, como mostrado. Se a incerteza δx é pequena (o que geralmente acontece), então o trecho da curva envolvido nesta construção é aproximadamente linear e qmax e qmin estão igualmente espaçados em torno de qestimado . A incerteza δq pode deduzida do gráfico e pode-se expressar o valor de q na forma padrão qestimado ± δq.

Fig. 3.2. Gráfico de q(x) versus x. Se x é medido

como xestimado ± δx, então a melhor estimativa para q(x) é qestimado = q(xestimado). Os valores máximo e mínimo de q(x) correspondem aos valores xestimado ± δx de x.

Da Fig. 3.2. pode-se ver que δq = q(xestimado + δx) – q(xestimado) Agora, uma aproximação básica de cálculo

garante que, para qualquer função q(x) e qualquer pequeno incremento u,

q(x + u) – q(x) = udxdq

Assim, desde que a incerteza δx é

pequena, como quase sempre acontece, tem-se

xdxdqq δ=δ (3.21)

Assim, para se achar a incerteza δq,

calcula-se a derivada dq/δx e a multiplica pela incerteza δx.

A regra (3.21) ainda não está na sua forma final. Ela foi derivada para uma função, como a mostrada na Fig. 3.2, onde a inclinação é sempre positiva. Curva com inclinação negativa fornece derivada negativa. Aqui, o máximo valor provável qmax obviamente corresponde ao valor mínimo de x, de modo que

xdxdqq δ−=δ (3.22)

Como dq/dx é negativa, pode se escrever –

dq/dx como |dq/dx| e tem-se a seguinte regra geral.

Incerteza em Qualquer Função

de Uma Variável

Se a quantidades x é medida com incerteza δx e é usada para calcular a função q(x), então a incerteza δq é dada por

xdxdqq δ=δ (3.23)

Esta regra geralmente permite encontrar δq

fácil e rapidamente. Ocasionalmente, quando q(x) for muito complexa, calcular sua derivada pode ser difícil e é recomendável e mais fácil usar (3.20). Quando se usa uma calculadora programável ou um programa de computador para achar q(x), então achar q(xestimado + δx) e q(xestimado) e sua diferença pode ser mais fácil que derivar q(x) explicitamente.

Exemplo: Incerteza em um cosseno Como aplicação simples da regra geral,

seja o angulo θ medido como:

qestimado

q(x)

x

q

xestimado + δx

qmax

qmin

xestimado - δx

xestimado

δq δq

Page 41: Analise Incerteza

Propagação da Incerteza

30

θ = 20 ± 3o

e se quer encontrar cos θ. A melhor estimativa de cosθ é cos 20o = 0,94 e de acordo com a regra, a incerteza é

δ(cosθ) = δθθ

θdcosd

= |sen θ| δθ (radiano) (3.24)

É indicado expressar δx em radiano, porque a derivada de cos θ é –sen θ somente se θ for expresso em radiano. Como δθ = 3o e δθ = 0,05 rad, tem-se

δ(cos θ) = (sen 20o) x 0,05 = 0,34 x 0,05 = 0,02 Assim, o resultado final é cos θ = 0,94 + 0,02

Probleminha rápido 3.7 Seja o resultado de uma medida x igual a

3,0 ± 0,1. Calcular q = ex, com sua incerteza. (A derivada de ex é ex).

Resposta: q = e3 ± e3 x 0,1 = 20 ± 2

Como outro exemplo da regra, pode-se

rederivar e generalizar um resultado encontrado em (3.5). Seja a medição da quantidade x e se queira calcular q = xn, onde n é um número conhecido, exato, positivo ou negativo. De acordo com a regra, a incerteza resultante em q é:

xnxxdxdqq 1n δ=δ=δ −

Se ambos os lados forem divididos por

nxq = , tem-se:

xxn

qq δ

isto é, a incerteza relativa em q = xn é |n| vezes a incerteza relativa de x. Para o caso particular da raiz quadrada, xq = onde n = ½ ,

xx

21

qq δ

isto é, a incerteza relativa em x é a metade da incerteza relativa de x. De modo análogo, a incerteza relativa de 1/x = x-1 é a mesma que a incerteza relativa em x.

A regra da incerteza da potência é um caso especial da regra da incerteza da multiplicação (potenciação é uma multiplicação de vários fatores iguais entre si). Porém, por sua importância, pode-se enunciar uma regra separada para a potência, como:

Incerteza na Potência Se a quantidades x é medida com incerteza

δx e é usada para calcular a potência q(x) = xn, onde n é um número fixo e conhecido) então a incerteza relativa em q é |n| vezes a incerteza relativa em x, ou seja

xxn

qq δ

=δ (3.26)

Probleminha rápido 3.8 Seja o resultado de uma medida x igual a

100 ± 6. Calcular q = x , com sua incerteza. Resp.: Como a medição é 100 ± 6%, q = 10,0 ± 3% ou 10,0 ± 0,3

3.9. Propagação passo a passo Tem-se agora ferramentas suficientes para

resolver quase qualquer problema com propagação de incertezas. Qualquer cálculo pode ser dividido em uma seqüência de passos, cada passo envolvendo um dos seguintes tipos de operação:

1. somas e subtrações 2. produtos e quocientes 3. potenciação e índices 4. função transcendental, como xn, senx,

ex.

Por exemplo, o cálculo de

Page 42: Analise Incerteza

Propagação da Incerteza

31

q = x(y – z sen u)

a partir das quantidades medidas x, y, z e u, pode ser feito através dos seguintes passos:

1. computar a função sen u 2. fazer o produto z sen u 3. fazer a diferença y – z sen u 4. fazer o produto x com (y – z sen u) Sabem-se como as incertezas se

propagam através de cada operação separada. Assim, como as várias quantidades envolvidas são independentes entre si, pode-se calcular a incerteza no resultado final fazendo-se o mesmo roteiro do cálculo da quantidade. Por exemplo, se as quantidades medidas x, y, z e u foram medidas com incertezas correspondentes de δx, δy, δz e δu, calcula-se a incerteza em q assim:

1. calcular a incerteza em sen u 2. achar a incerteza no produto

z sen u 3. achar a incerteza na diferença

y – z sen u 4. finalmente, calcular a incerteza no

produto completo x(y – z sen u)

Probleminha rápido 3.9 Sejam os resultado de três medidas x = 200 ± 2 (200 ± 1%) y = 50 ± 2 (50 ± 4%) z = 40 ± 2 (40 ± 5%)

onde as três incertezas são independentes e aleatórias. Usar a propagação passo-a-passo para achar a quantidade q = x/(y-z) com sua incerteza. [Primeiro achar a incerteza na diferença (y – z) e depois no quociente x/(y-z)].

Resposta: 1. (y – z) = 10 ± 3 = 10 ± 30% (Usado o

algoritmo da soma em quadratura) 2. x/(y-z) = 20 ± (1% + 30%) = 20 ± 6 Devem ser enfatizados três pontos gerais

na propagação das incertezas: 1. Como as somas e subtrações

envolvem incertezas absolutas (como δx) e os produtos e quocientes envolvem incertezas relativas (como [δx/|x|]), os cálculos exigem a passagem de incertezas relativas para absolutas e vice-versa.

2. Uma característica importante e simplificadora de todos os cálculos nestas incertezas é que se deve

trabalhar quase sempre com apenas um algarismo significativo, de modo que os cálculos possam ser feitos mentalmente e muitas incertezas muito pequenas possam ser desprezadas completamente.

3. Existem aplicações envolvendo funções q(x) cuja incerteza não pode ser encontrada com confiabilidade aplicando-se o método do passo-a-passo mostrado. Estas funções sempre envolvem, no mínimo, uma variável que aparece mais de uma vez.

Exemplo de função que não pode ter incerteza calculada pelo método anterior é

q = y – x (sen y) Esta função é a diferença de dois termos: y

e (x sen y), porém estes dois termos não são independentes, pois y aparece em ambos. Assim, para achar a incerteza no resultado, deve-se somar aritmeticamente as incertezas e não usar a raiz quadrada da soma dos quadrados. Em algumas aplicações, este tratamento pode resultar em incertezas maiores que as verdadeiras. Para evitar esta superestimativa da incerteza será desenvolvido outro método

3.10. Exemplos Serão apresentados, agora e aqui, três

exemplos do tipo de cálculo encontrado em laboratório. Nenhum dos exemplos é complicado; de fato, poucos problemas reais são mais complicados que estes exemplos.

Exemplo 1: Medição de g com pêndulo Seja a medição da aceleração da

gravidade, g, usando um pêndulo simples, de comprimento L. O período T do pêndulo vale:

gL2T π=

Assim, a partir das medições de T e L,

pode-se determinar g, como:

2

2

TL4g π

=

Esta expressão envolve o produto e

quociente de três fatores: 4π2, L e T2. Se todas as incertezas são aleatórias e independentes, a incerteza relativa do resultado é a raiz quadrada da soma dos quadrados das incertezas de cada fator. O fator 4π2 não tem incerteza e a incerteza relativa de T2 é o dobro da incerteza relativa de T.

Page 43: Analise Incerteza

Propagação da Incerteza

32

Assim, a incerteza relativa de g é dada como:

22

TT2

LL

gg

⎟⎠

⎞⎜⎝

⎛ δ+⎟

⎞⎜⎝

⎛ δ=

δ

Foram feitas medições de 25 oscilações,

com um cronômetro com incerteza de 0,1 s e obtidos os seguintes resultados:

L = 92,95 + 0,01 cm T = 1,936 ± 0,004 s A melhor estimativa para g é dada por:

22

2

estimado cm/s 979s) 936,1(

)cm 95,92(4g =×π

=

As incertezas relativas de cada fator são:

%1,0LL

%2,0TT

resulta em

%4,0%)2,0()1,0(gg 22 =+=

δ

δg = 0,004 x 979 cm/s2 = 4 cm/s2 O resultado final é: g = 979 ± 4 cm/s2 (Comparando-se este resultado com o

valor usual de 981 cm/s2, verifica-se que o resultado é inteiramente satisfatório).

Exemplo 2: Índice de refração Se um raio de luz passa do ar para o vidro,

o angulo de incidência i e de refração r são definidos como na Fig. 3.5 e estão relacionados pela lei de Snell:

sen i = n sen r

onde n é o índice de refração do vidro. Assim, medindo-se os ângulos i e r, pode-se determinar o índice de refração n, como

rsenisenn =

A incerteza do ângulo de refração é

calculada pelos passos: 1. incerteza do seno dos ângulos

2. incerteza do quociente dos senos ou seja,

22

r senr sen

i seni sen

nn

⎟⎠

⎞⎜⎝

⎛ δ+⎟

⎞⎜⎝

⎛ δ=

δ

Fig. 3.5. Os ângulos de incidência i e refração r quando um raio de

luz passa do ar para o vidro Para achar a incerteza relativa no seno de

qualquer ângulo θ, tem-se

δθθ

θ=θδ

d send sen

ou seja

δθθ=θδ cos sen (em radianos) A incerteza relativa

δθθ=θθδ cot

sensen (rad)

Sejam os resultados das medições dos

ângulos i e r, como mostrados nas primeiras duas colunas da Tab. 3.1, com incertezas de ±1o ou 0,02 rad. O cálculo de n = sen i/sen r é facilmente feito, como mostrado nas três próximas colunas da Tab. 3.1. A incerteza em n pode ser encontrada como nas últimas três colunas. As incertezas relativas em sen i e em sen r são calculadas usando cot θ e finalmente a incerteza em n é obtida.

Antes de fazer uma série de medições como as duas mostradas na Tab. 3.1, pode-se pensar cuidadosamente como melhor registrar os dados e os cálculos. A apresentação através de uma tabela

1. torna mais fácil a visualização dos dados

2. reduz o perigo de enganos nos cálculos 3. possibilita o seguimento e verificação

dos cálculos.

Ar

r

i

Vidro

Page 44: Analise Incerteza

Propagação da Incerteza

33

Tab. 3.1. Caminho para determinar índice de refração

i (grau) ±1o

r (grau) ±1o

sen i sen r n |isen|isenδ

|rsen|rsenδ

nnδ

20 13 0,342 0,225 1,52 5% 8% 9% 40 23,5 0,643 0,399 1,61 2% 4% 5%

Exemplo 3: Aceleração de um corpo no plano inclinado

Seja um corpo descendo um plano inclinado com ângulo θ. A aceleração esperada é de g senθ. Medindo-se θ, pode-se facilmente determinar a aceleração esperada e sua incerteza. Pode-se medir a aceleração real a cronometrando o tempo em que o corpo passa através de duas fotocélulas, como mostrado, com cada fotocélula ligada a um cronômetro. Se o corpo em comprimento L e leva um tempo t1 para passar a primeira fotocélula, sua velocidade lá é v1 = L/t1. Do mesmo modo, v2 = L/t2. Se a distância entre as fotocélulas é s, então tem-se:

s2vva

21

22 −

=

ou

⎟⎟⎠

⎞⎜⎜⎝

⎛−⎟⎟

⎞⎜⎜⎝

⎛= 2

122

2

t1

t1

s2La

Usando-se esta fórmula e medindo-se os

valores de L, s, t1 e t2, pode-se determinar a aceleração e sua incerteza.

Foram obtidos os seguintes resultados: L = 5,00 ± 0,05 cm (1%) s = 100,00 ± 0,2 cm (0,2%) t1 = 0,054 ± 0,001 s (2%)

3.34) t2 = 0,031 ± 0,001 s (3%)

Destes valores, pode-se calcular

cm 125,0s2

L2

=

A incerteza relativa neste fator é:

22

ss

LL2 ⎟

⎞⎜⎝

⎛ δ+⎟

⎞⎜⎝

⎛ δ

e aplicando-se os valores numéricos, tem-se

%202,0)02,0()01,02( 22 ==+×

Fig. 3.6. Um carro desce um plano inclinado de

ângulo q. Cada fotocélula é ligada a um cronômetro para medir o tempo quando o carro passa por ela.

Como a incerteza percentual de s é muito

pequena em relação às outras incertezas, ela é desprezada. Assim, tem-se:

2% cm 125,0s2

L2

±=

(3.35) Para calcular o segundo fator e sua

incerteza, procede-se passo a passo. Como a incerteza relativa em t1 é 2%, a incerteza em 1/t12 é de 4%. Como t1 = 0,054 s,

1/t12 = 343 s-2± 4% = 343 ± 14 s-2

Do mesmo modo, a incerteza de 1/t22 é de 6% e

1/t22 = 1041 s-2± 6% = 1041 ± 62 s-2

θ

L

s

fotocélula 1

L fotocélula 2

Page 45: Analise Incerteza

Propagação da Incerteza

34

Fazendo a subtração e combinando as incertezas em raiz quadrada da soma dos quadrados, tem-se

9% s 698 s 64 698t1

t1 2-2-

21

22

±=±=−

(3.36) Finalmente, a aceleração a é obtida pelo

produto destes dois fatores e a sua incerteza é obtida pela raiz quadrada da soma dos quadrados das respectivas incertezas relativas. Tem-se

a = (0,125 cm ± 2%) (698 s-2 ± 9%) a = 87,3 cm/s2 ± 9%

ou a = 87 ± 8 cm/s2 (3.37) Este resultado pode ser comparado com o

obtido através de gsenθ, se disponível. Várias características interessantes podem

ser observadas neste exemplo: 1. A incerteza de 2% no fator (L2/2s) é

desprezível em relação à incerteza de 9% no fator (1/t12) – (1/t22). Se forem necessários outros cálculos para novas medições, as incertezas de L e s podem ser ignoradas, pois são insignificantes.

2. As incertezas de ±2% e ±3% em t1 e t2 crescem para ±9%, quando se calculam 1/t12 e 1/t22 e a diferença (1/t12) – (1/t22). Este crescimento resulta parcialmente de elevar ao quadrado os tempos e fazer a diferença entre dois números grandes. Se alguém pensar em alterar a experiência, aumentando a velocidade do corpo (dando-lhe um empurrão inicial), os tempos diminuem e os efeitos nas incertezas pioram muito.

3.11. Fórmula geral para propagação da incerteza

Até agora foram estabelecidas três regras para a propagação das incertezas:

1. para a soma ou subtração 2. para o produto ou quociente 3. para funções arbitrárias de uma

variável. Foi visto também, como a computação de

uma função complexa pode ser quebrada em passos e a incerteza na função computada por passos, usando as três regras simples.

Aqui e agora, será dada uma única forma para uma regra geral, da qual podem ser derivadas as três regras anteriores e através da qual se pode resolver qualquer problema de propagação de incerteza. Embora esta fórmula

pareça complicada de usar, à primeira vista, ela é teoricamente útil. Ela também resolve o problema já mostrado, quando se tem uma quantidade que é função de uma variável mais de uma vez e portanto as incertezas são dependentes.

Para ilustrar este tipo de problema, seja a quantidade q função de três variáveis medidas x, y e z:

zxyxq

++

= (3.38)

onde a variável x aparece duas vezes. Quando se calcula a incerteza δq em etapas, tem-se:

1. computação da incerteza de x + y 2. computação da incerteza de x + z 3. computação da divisão (x+y)/(x+z) Procedendo deste modo, perde-se

completamente a chance de que as incertezas do numerador devidas a x possam, de algum modo, cancelar as incertezas do denominador devidas também a x.

Para entender como pode haver este cancelamento, sejam os números x, y e z, todos positivos e veja-se o que ocorre na medição de x sujeita à incerteza. Quando a incerteza de x é superestimada, as duas somas (x+y) e (x+z) são igualmente superestimadas de modo que estas superestimativas serão canceladas. O mesmo ocorre quando a incerteza em x é subestimada. Deste modo, qualquer incerteza em x é cancelada quando se faz a divisão (x+y)/(x+z) e este cancelamento não é considerado quando se procede por passos.

Sempre que uma função envolve a mesma quantidade mais de uma vez, algumas incertezas podem ser canceladas. Quando ocorre este cancelamento, o cálculo feito por etapas tem incerteza do resultado superestimada. O único modo de considerar o cancelamento e evitar a superestimativa da incerteza é calcular a incerteza em uma única etapa, como será visto agora.

Às vezes, uma função que envolve uma variável mais de uma vez pode ser reescrita de forma diferente, usando a variável uma única vez. Por exemplo,

q = xy - xz

pode ser reescrita como q = x(y – z) Neste caso, a primeira expressão não pode

ter a incerteza calculada por etapas, porém, a segunda expressão pode ter a incerteza calculada por etapas, sem problema nenhum.

Page 46: Analise Incerteza

Propagação da Incerteza

35

Sejam duas quantidades x e y, que são medidas para calcular a função q(x, y). Esta função pode ser tão simples como q = x + y ou tão complicada como q = (xy3 – senxy)

Para uma função q(x) de uma única variável x, argumentou que a melhor estimativa para x é o número xestimado e por isso a melhor estimativa para q(x) é q(xestimado). Depois, argumentou-se que os valores prováveis extremos (ou seja, o maior e o menor) de x são xestimado ± δx e que os valores extremos correspondentes de q são portanto

q(xestimado ± δx) (3.39) Finalmente, foi usada a aproximação

udxdq)x(q)ux(q +=+ (3.40)

(para qualquer incremento pequeno u) para reescrever os valores prováveis extremos (3.39):

xdxdq)x(q estimado δ± (3.41)

onde o valor absoluto é para permitir a possibilidade de dq/dx ser negativa. O

resultado (3.41) significa que xdxdqq δ≈δ .

Quando q é função de duas variáveis, q(x, y), o argumento é similar. Se xestimado e yestimado são as melhores estimativas para x e y, espera-se que a melhor estimativa para q seja

qestimado = q(xestimado, yestimado)

como usual. Para estimar a incerteza neste resultado, é necessário generalizar a aproximação (3.40) para uma função de duas variáveis. A generalização a ser feita é

vyqu

xq)y,x(q)vy,ux(q

∂∂

+∂∂

+≈++ (3.42)

onde u e v são pequenos incrementos em x e y e ∂q/∂x e ∂q/∂y são as derivadas parciais de q em relação a x e a y. Ou seja, ∂q/∂x é o resultado da derivada de q em relação a x, mantendo-se y constante e ∂q/∂y é o resultado da derivada de q em relação a y, mantendo x constante.

Os valores prováveis extremos para x e y são xestimado ± δx e yestimado ± δy. Se estes valores forem inseridos em (3.42) e lembrando que ∂q/∂x e ∂q/∂y podem ser positivas ou negativas, para os valores extremos de q,

⎟⎟⎠

⎞⎜⎜⎝

⎛δ

δδ

+δδδ

± yyqx

xq)y,x(q estimadoestimado

Isto significa que a incerteza em q(x, y) vale

yyqx

xqq δ

∂∂

+δ∂∂

≈δ (3.43)

Aplicando-se esta regra a uma função

simples já conhecida da soma x + y, q(x, y) = x + y

Tem-se 1yq

xq

=∂∂

=∂∂

e portanto δq = δx + δy (3.46) Aplicando-se esta regra à função também

conhecida q(x,y) = xy

Tem-se

yxq

=∂∂

e

xyq

=∂∂

Então

δq= yδx + xδy Dividindo ambos os termos por xy e sendo

q = xy, tem-se

yy

xx

qq δ

A regra (3.43) pode ser generalizando de

vários modos. Não se deve ficar surpreso se descobrir que, quando as incertezas dx e dy são independentes e aleatórias, a soma (3.43) pode ser substituída pela soma em quadratura. Se a função q depende de mais de duas variáveis, então simplesmente se adiciona termos extras para cada variável extra. Deste modo, chega-se a seguinte regra geral, irrestrita e completa (cuja justificativa será apresentada nos Capitulos 5 e 9).

Page 47: Analise Incerteza

Propagação da Incerteza

36

Incerteza em função de muitas variáveis

Sejam as quantidades x, y, ..., z medidas com incerteza δx, δy, ..., δz, e usadas para calcular a função q(x,y,...,z). Se as incertezas são aleatórias e independentes, então a incerteza δq é dada por

22

zzq...x

xqq ⎟

⎞⎜⎝

⎛ δ∂∂

++⎟⎠

⎞⎜⎝

⎛ δ∂∂

=δ (3.47)

Em qualquer caso, ela nunca é maior que a

soma aritmética:

zzq...x

xqq δ

∂∂

++δ∂∂

≤δ (3.48)

Embora tenha-se o preconceito de achar as

eq. (3.47) e (3.48) muito complicadas, elas podem ser facilmente entendidas, quando se pensa em cada termo por vez. Por exemplo, seja a quantidade q função das variáveis x, y, ... z. Em determinado momento, suponha-se que todas as variáveis, exceto x, sejam constantes. Neste momento, somente a variável x está sujeita à incerteza e todas as outras incertezas, δy, ... δz são zero. Como a função q contem somente uma variável, sua incerteza vale:

xxqq δ

∂∂

=δ (se δy = ...= δz = 0) (3.49)

O termo |∂q/∂x|δx é a incerteza parcial em q

causada apenas pela incerteza em x. Do mesmo modo, o termo |∂q/∂y|δy é a incerteza parcial em q causada apenas pela incerteza em y. Considerando todas as incertezas independentes e aleatórias, a incerteza total de q é a raiz quadrada da soma dos quadrados das incertezas devidas δx, δy, ..., δz.

Assim, quando se tiver uma quantidade função de muitas variáveis, q(x,y,...,z) e se quiser calcular a incerteza em q:

1. Calcular as incertezas parciais em q devidas a δx, δy, ..., δz separadamente.

2. Achar as derivadas parciais de q em relação a cada variável

3. Multiplicar cada incerteza pela derivada parcial correspondente

4. Elevar ao quadrado cada fator 5. Somar todos os fatores 6. Extrair a raiz quadrada da soma.

Exemplo para uso da eq. (3.47) Determinar a quantidade q = x2y – xy2

e sua incerteza, a partir das seguintes medições:

x = 3,0 ± 0,1 y = 2,0 ± 0,1

A melhor estimativa de q é q = 2,02 x 3,0 – 2,0 x 3,02 = 6,0

Para determinar δq 1. Acha-se a incerteza δqx , incerteza em q

devida apenas a x

xxqqx δ

∂∂

=δ (3.50)

δqx = |2xy – y2| δx = |12 – 4| x 0,1 = 0,8 2. De modo análogo, acha-se

δqy = (incerteza em q devida apenas a y)

yyqqy δ

∂∂

=δ (3.51)

δqy = |x2 – 2xy| δy = |9 – 12| x 0,1 = 0,3

3 Acha-se a raiz quadrada da soma dos quadrados das duas incertezas:

2y

2x )q()q(q δ+δ=δ (3.52)

9,03,08,0q 22 =+=δ

Assim, o resultado final é: q = 6,0 ±0,9 O uso de (3.47) ou (3.48) para calcular

incertezas é razoavelmente direto, quando se segue o procedimento usado neste exemplo:

1. calcular cada contribuição para δx 2. combinar as incertezas para dar a final O procedimento divide o problema em

pequenos cálculos que são mais fáceis e onde dificilmente se comete engano. Também se percebe quais as variáveis que contribuem com incertezas desprezíveis e dominantes. No exemplo anterior, a incerteza de 0,3 é quase

Page 48: Analise Incerteza

Propagação da Incerteza

37

desprezível quando comparada com 0,8 e quando ambas são somadas em quadratura.

Resumindo: 1. Quando é possível aplicar o processo

de etapas, ele é usualmente mais simples que a regra (3.47) ou (3.48). Ele se aplica quando as incertezas forem aleatórias e independentes.

2. Se a função q(x, y, ..., z) envolve uma variável mais de uma vez, pode haver cancelamento de incertezas e o processo por etapas pode dar resultado muito maior que o razoavelmente esperado e neste caso recomenda-se usar a regra (3.47) ou (3.48) em uma única etapa.

Page 49: Analise Incerteza

Propagação da Incerteza

38

Definições e Equações do Capítulo 3

Regra da raiz quadrada para contagem Se são observadas ocorrências de um

evento que acontece aleatoriamente mas com uma taxa definida média e é contado um número ν de ocorrências durante um tempo T, a estimativa para o número médio verdadeiro é

número médio de eventos no tempo T = ν ± ν

[Ver (3.2)]

Regras para propagação da incerteza As regras de propagação da incerteza se

referem a uma situação em que se tem várias quantidades x, y, ..., w com incertezas δx, δy, ..., δw e então são usados estes valores para se calcular a quantidade q. As incertezas em x, y, ..., w se propagam através do cálculo para causar uma incerteza em q como segue:

Somas e diferenças Se

q = x + y + ... + z – (u + v + ... + w)

então 2222 )w...()u()z(...)x(q δ+δ+δ++δ=δ

[Ver (3.16)] desde que todas as incertezas sejam independentes e aleatórias e sempre

δq ≤ δx + δy + ...+ δz + δu + δv + ... + δw

[Ver (3.17)]

Produtos e quocientes Se

w...vuz...yxq

××××××

= , então

2222 )

ww(...)

uu()

zz...()

xx(

qq δ

++δ

[Ver (3.18)] desde que todas as incertezas sejam independentes e aleatórias. E sempre

ww...

uu

zz...

yy

xx

qq δ

++δ

≤δ

[Ver (3.19)]

Quantidade medida vezes número exato Se B é considerado uma constante e q = Bx, então

δx = |B| x

ou de modo equivalente,

xx

qq δ

≈δ [Ver (3.9)]

Incerteza na potência Se n é um número exato e q = xn , então

xxn

qq δ

=δ [Ver (3.26)]

Incerteza em uma função de uma variável Se q = q(x) é qualquer função de x, então

xdxdqq δ=δ [Ver (3.23)]

Às vezes, se q(x) for complicada e se foi

escrito um programa para calcular q(x), então, em vez de derivar q(x) em relação a x, pode ser mais fácil usar o equivalente:

δq = q(xestimado + δx) – q(xestimado)

Fórmula geral para propagação da incerteza

Se q = q(x, y, ..., z) é qualquer função de x, y, ..., z, então

22

zzq...x

xqq ⎟

⎞⎜⎝

⎛ δ∂∂

++⎟⎠

⎞⎜⎝

⎛ δ∂∂

=δ [Ver (3.47)]

desde que todas as incertezas sejam independentes e aleatórias.

Sempre tem-se

zzq...x

xqq δ

∂∂

++δ∂∂

≤δ [Ver (3.48)]

Apostilas\Incerteza JRTaylor2.doc 25 SET 98 (Substitui 29 JAN 98)

Page 50: Analise Incerteza

Análise Estatística das Incertezas Aleatórias

39

4. Incertezas Aleatórias

4.1. Introdução O melhor modo para aumentar a confiabilidade de

uma medição é repeti-la várias vezes e analisar os diferentes valores obtidos. Neste capítulo, serão vistos os métodos para analisar as medições feitas deste modo.

Nem todos os tipos de incertezas experimentais podem ser tratados por análise estatística baseada em medições repetidas. Por este motivo, as incertezas são classificadas em dois tipos:

1. incertezas aleatórias, que podem ser tratadas estatisticamente

2. incertezas sistemáticas, que não podem.

Esta diferença é descrita na seção 4.1. O resto do capítulo trata principalmente das incertezas aleatórias. A seção 4.2 introduz, sem justificativa formal, duas definições importantes relacionadas com séries de valores medidos x1, x2, ..., xN, todos de alguma única quantidade x. É definida a média de x1, x2, ..., xN. Sob condições convenientes, a média é a melhor estimativa de x baseada nos valores medidos x1, x2, ..., xN. Depois é definido o desvio padrão de x1, x2, ..., xN. A seção 4.4 introduz a noção importante do desvio padrão da média. Este parâmetro caracteriza a incerteza na média como a melhor estimativa de x. Finalmente na seção 4.6 trata-se de novo do problema complicado das incertezas sistemáticas.

Neste capítulo, tenta-se justificar os métodos usados, baseando-se na idéia importante da distribuição normal.

A relação da análise estatística com a propagação da incerteza merece menção. Do ponto de vista prático estes dois assuntos podem ser vistos separadamente, embora sejam relacionados. Eles devem ser planejados, porque a maioria das experiências requerem o uso dos dois. Em algumas aplicações, as regras da propagação da incerteza e análise estatística são complementares. Ou seja, uma experiência pode ser analisada usando-se a propagação da incerteza ou a análise estatística. Por exemplo, seja o cálculo da aceleração da gravidade, g, através da medição do período T e do comprimento L de um pêndulo simples. Pode-se calcular a aceleração através da fórmula matemática (g = 4π2L/T2). Pode-se repetir a experiência

fazendo várias medições diferentes de L e medindo o período correspondente de cada um. Neste modo, chega-se a vários valores de g. Para achar a incerteza nestes valores de g, pode se proceder de dois modos:

1. pode-se estimar realisticamente as incertezas nas medições de L e T e ver como as incertezas se propagam para achar a incerteza em g.

2. obtidos vários valores de g, pode-se analisá-los estatisticamente, em particular seu desvio padrão será uma boa medição de sua incerteza.

Infelizmente, na realidade não se tem uma escolha de como achar a incerteza. Se a incerteza pode ser encontrada por estes dois modos, na realidade se usam os dois modos para verificar se os dois resultados são consistentes, entre si, dando a mesma resposta.

4.2. Incertezas aleatórias e sistemáticas As incertezas experimentais que podem ser

reveladas pela repetição das medições são chamadas de aleatórias. As incertezas que não são reveladas deste modo são as sistemáticas. Para ilustrar esta diferença, sejam alguns exemplos.

Seja o tempo de revolução de um toca-discos que gira em regime permanente. Uma fonte de incerteza na medição do tempo de revolução será a reação do operador para acionar o cronômetro na partida e na parada. Se o tempo de reação do operador fosse exatamente o mesmo, eles se cancelariam na partida e parada. Na prática, porém, o tempo de reação varia de operador para operador e até para o mesmo operador. Pode-se ter maior tempo de reação na partida e por isso superestimar o tempo medido ou pode-se ter maior tempo de reação na parada, subestimando o tempo medido. Como qualquer possibilidade é igualmente provável, o sinal do efeito é aleatório. Se as medições são repetidas várias vezes, em alguns casos pode-se superestimar e em outros,, subestimar seus valores. Assim, a variável tempo de reação depende das respostas encontradas. Analisando o espalhamento em resultados estatísticos, pode-se ter uma estimativa confiável do tipo desta incerteza.

Page 51: Analise Incerteza

Análise Estatística das Incertezas Aleatórias

40

Por outro, se o cronômetro estiver funcionando consistentemente mais devagar, então todas as medições serão subestimadas e nenhum número de repetições, com o mesmo cronômetro, irá revelar este tipo de incerteza. Este tipo de incerteza é chamado de sistemático, porque ela atua no resultado sempre do mesmo modo. Se o cronômetro anda mais lentamente, há sempre uma subestimativa; se ele anda mais rapidamente, uma superestimativa. Incertezas sistemáticas não podem ser descobertas por qualquer tipo de análise estatística disponível.

Como segundo exemplo de incertezas aleatórias versus sistemáticas, seja a experiência de medir um comprimento com uma régua. Uma fonte de incerteza será a necessidade de interpolar a leitura entre duas marcações da escala e esta incerteza é provavelmente aleatória. Quando se faz a interpolação, a probabilidade de fazer subestimativa e superestimativa é a mesma. Mas há também a possibilidade que a régua esteja distorcida e esta fonte de incerteza será provavelmente sistemática. Se a régua estiver esticada, sempre haverá uma superestimativa, se estiver encolhida, sempre haverá uma subestimativa.

Como nestes dois exemplos, quase todas as medições estão sujeitas às duas incertezas aleatórias e sistemáticas. Geralmente é fácil distinguir os dois tipos de incertezas. As fontes de incerteza aleatória são:

1. pequenos erros de julgamento do operador, como quando faz interpolação

2. pequenos distúrbios do sistema de medição, como vibração mecânica

3. problemas de definição da quantidade medida

A fonte de incerteza sistemática mais clara é a descalibração do instrumento de medição, como ocorre com o cronômetro que atrasa ou adianta sistematicamente, a régua de medição esticada ou encolhida, o instrumento de medição com erro de zero. Para dar um entendimento ainda melhor da diferença entre incerteza aleatória e sistemática, seja a analogia mostrada na Fig. 4.1, mostrado o alvo com tiros. Aqui a experiência é uma serie de tiros em um alvo. Medições exatas são os tiros que estão no centro ou próximos do centro do alvo. As incertezas aleatórias são causadas por qualquer coisa que faça os tiros chegarem aleatoriamente em pontos diferentes. Por exemplo, o tremido da mão do atirador, flutuações das condições atmosféricas entre o atirador e o alvo. Incertezas sistemáticas aparecem se algo faz os tiros chegarem no alvo fora do centro em uma direção

sistemática, por exemplo sempre para cima e para a esquerda. Isto acontece se a arma estiver com a mira fora da posição correta ou se estiver havendo um vento forte e constante durante todos os tiros.

Embora a Fig. 4.1 seja uma ilustração excelente dos efeitos das incertezas aleatórias e sistemáticas, ele possui uma falha importante. Como cada figura mostra a posição do alvo, pode-se dizer rapidamente se um determinado tiro é exato ou não. Em particular, a diferença entre as duas figuras de cima é imediatamente evidente. Os tiros na figura esquerda se agrupam em torno do centro do algo, enquanto os tiros da figura à direita se agrupam em torno de um ponto que está nitidamente fora do centro. O grau de dispersão é aproximadamente o mesmo nos dois alvos, porem, no alvo esquerda não há erro sistemático e no alvo direito há um grande erro sistemático. Conhecer a posição do alvo na Fig. 4.1 corresponde, em um laboratório de medição conhecer o valor verdadeiro da quantidade medida e na grande maioria das medições reais, não se conhece este valor verdadeiro. Se o valor verdadeiro fosse conhecido, ninguém iria perder tempo fazendo sua medição.

Fig. 4.1. Incertezas aleatórias e sistemáticas no alvo. (a) Como todos os tiros estão agrupados, as

incertezas aleatórias são pequenas. Como a distribuição dos tiros está centrada no centro do alvo, as incertezas sistemáticas são também pequenas.

(b) As incertezas aleatórias ainda são pequenas, pois os tiros continuam agrupados. Porém a distribuição dos

(a) Aleatória: pequena Sistemática: pequena

(b) Aleatória: pequena Sistemática: grande

(c) Aleatória: grande Sistemática: pequena

(d) Aleatória: grande Sistemática: grande

Page 52: Analise Incerteza

Análise Estatística das Incertezas Aleatórias

41

tiros está centrada fora do centro do alvo e por isso as incertezas sistemáticas são grandes.

(c) Aqui, as incertezas aleatórias são grandes pois os tiros estão muito espalhados. Como a distribuição dos tiros espalhados contínua centrada no centro do alvo, as incertezas sistemáticas são pequenas.

(d) Aqui ambas as incertezas aleatórias e sistemáticas são grandes: há uma grande dispersão dos tiros e eles estão sistematicamente fora do centro, sempre para cima e para a direita.

Fig. 4.2. O mesmo experimento da Fig. 4.1, redesenhado sem mostrar a posição do alvo. Esta situação corresponde à maioria das aplicações reais em que não se conhece o valor verdadeiro da quantidade sendo medida. Aqui, só se pode analisar e determinar as incertezas aleatórias mas nada pode ser dito acerca das incertezas sistemáticas.

Para melhorar a analogia da Fig. 4.1 com

mais experiências reais, pode-se redesenhar os tiros, sem os anéis que mostram a posição do alvo, como na Fig. 4.2. Nestes desenhos, identificar os erros aleatórios continua fácil. Os dois desenhos (a) e (b) continuam tendo pequenas incertezas aleatórias e (c) e (d) continuam tendo grandes incertezas aleatórias. Porem, neste caso, baseando-se apenas na Fig. 4.2, é impossível determinar a incerteza sistemática. Esta situação é a que geralmente ocorre na prática. Pela observação da distribuição dos valores medidos, pode-se facilmente identificar as incertezas aleatórias mas não há nenhuma ajuda para determinar as incertezas sistemáticas.

A diferença entre incertezas aleatórias e sistemáticas nem sempre é clara e definida e um problema que causa incertezas aleatórias em uma experiência pode produzir incertezas

sistemáticas em outra. Por exemplo, quando o observador se posiciona à esquerda ou à direita do ponteiro para fazer uma leitura na escala, ele obtém resultados diferentes do mesmo valor da medição. Este erro, chamado de paralaxe, significa que um medidor pode ser lido corretamente, somente se o observador se posiciona corretamente em sua frente. Porém, independente da posição de seu corpo, nem sempre ele posiciona corretamente seus olhos em frente do medidor, de modo que as medições possuem uma pequena incerteza devida ao paralaxe e esta incerteza será provavelmente aleatória. Por outro lado, um observador que se posiciona incorretamente para fazer estas mesmas medições, introduz uma incerteza sistemática nas suas medições, além das incertezas aleatórias comuns ao outro observador. Assim, o mesmo efeito, paralaxe, pode produzir incertezas aleatórias em um caso e sistemas em outro.

O tratamento das incertezas aleatórias é diferente do tratamento das sistemáticas. Os métodos estatísticos a serem descritos nas seções seguintes dão uma estimativa confiável das incertezas aleatórias e, como será visto, fornecem um procedimento bem definido para tratá-las. As incertezas sistemáticas são mais difíceis de tratar e mesmo de detectar. O metrologista experiente deve aprender a antecipar as possíveis fontes de incertezas sistemáticas e garantir que todas as incertezas sistemáticas são muito menores que a precisão requerida. Esta tarefa pode incluir, por exemplo

1. calibrar os medidores contra padrões rastreados,

2. corrigir as incertezas sistemáticas devidas a má calibração,

3. comprar melhores instrumentos, se possível.

Na seção 4.6 serão vistas as incertezas sistemáticas. Agora, serão discutidas as experiências em que todas as incertezas sistemáticas foram identificadas e tornadas muito menores que a precisão requerida.

4.3. Média e desvio padrão Seja o caso onde se quer medir alguma

quantidade x e onde já foram identificadas todas as fontes de incerteza sistemática e todas foram reduzidas a níveis desprezíveis. Como todas as fontes remanescentes de incerteza são aleatórias, pode-se detectá-las repetindo se as medições várias vezes. Pode-se, por exemplo, fazer cinco medições e obter os seguintes resultados:

71 72 72 73 71 (4.1)

(a) Aleatória: pequena Sistemática: ?

(b) Aleatória: pequena Sistemática: ?

(c) Aleatória: grande Sistemática: ?

(d) Aleatória: grande Sistemática: ?

Page 53: Analise Incerteza

Análise Estatística das Incertezas Aleatórias

42

(Por conveniência e simplicidade, foram omitidas as unidades e por isso podem ser aplicadas a qualquer grandeza)

A primeira questão a resolver é: dadas as seis medições mostradas, qual é a melhor estimativa para a quantidade x? Razoavelmente, a melhor estimativa parece ser a média x das cinco medições encontradas e no capitulo 5 será provado que esta escolha é normalmente a melhor.

xestimado = x x =

+ + + +=

71 72 72 73 715

718, (4.2)

(Para fazer mentalmente esta conta, sem

usar calculadora, e considerando que todos os números começam de 70, basta somar os números 1, 2, 2, 3 e 1 = 9/5 = 1,8 e soma 1,8 a 70, obtendo 71,8).

A segunda expressão é simplesmente a definição de média aritmética ou simplesmente a média dos cinco números considerados.

De um modo geral, quando se tem N medições da quantidade x, todas obtidas do mesmo instrumento, mesmo procedimento, mesmo operador, mesmas condições ambientais, e se encontram os N valores

x1, x2, ..., xN, (4.3)

a melhor estimativa para x é usualmente a média de x1, x2, ..., xN, ou seja,

xestimado = x (4.4)

onde

xx x x

NN=

+ + +1 2 ...

xx

Ni= ∑ (4.5)

Nesta última linha, é introduzida a notação

nova e útil, usando a letra grega sigma (Σ), que significa:

x x x x x xii

N

ii

i N=∑ ∑ ∑= = = + + +

11 2 ...

A segunda e terceira expressões são mais

abreviadas e serão usadas neste trabalho quando não houver risco de confusão.

O conceito de média é quase certamente familiar à maioria dos leituras. O próximo conceito, de desvio padrão, é provavelmente menos conhecido. O desvio padrão de várias medições x1, x2, ..., xN, é uma estimativa da

incerteza média das medições x1, x2, ..., xN, e é determinada do seguinte modo.

Dado que a média x é a melhor estimativa da quantidade x, é natural considerar a diferença xi - x = di. Esta diferença, chamada de desvio ou resíduo de xi de x , mostra de quanto a iésima (ia) medição xi difere da média x . Se os desvios di = (xi - x ) são muito pequenos, as medições ficam todas juntas, há pouca dispersão e o instrumento de medição é presumidamente muito preciso. Se alguns dos desvios são muito grandes, as medições se espalham, há grande dispersão e o instrumento de medição é presumidamente pouco preciso.

Tab. 4.1. Cálculo dos desvios

Medições i

Valor medido xi

Desvio di = xi - x

1 71 -0,8 2 72 0,2 3 72 0,2 4 73 1,2 5 71 -0,8 xi =∑ 359 di =∑ 0 0,

média, x = 1 3595

718N

xi∑ = = ,

Para fixar a idéia de desvio padrão, sejam

as cinco medições anteriores e seja o cálculo de seu desvio padrão. Pode ser observado que

1. Os desvios não são todos do mesmo tamanho, di é pequeno se a ia medição ficar próxima de x e dj é grande se a ja medição ficar longe de x .

2. Há desvios positivos (quando xi > x ), negativos (quando xi < x ) e também zero (xi = x ).

Para estimar a confiabilidade média das medições x1, x2, ..., xN, pode-se pensar em tirar a média dos desvios di. Infelizmente, isto não funciona pois a média dos desvios é zero. (Na prática, o desvio é próximo de zero, por causa das incertezas devidas aos arredondamentos).

O melhor meio de evitar este inconveniente é elevar ao quadrado todos os desvios, de modo que se cria um conjunto de números todos positivos e depois se tira a raiz quadrada da sua média. Este número obtido

1. possui a mesma unidade que x, 2. chama-se desvio padrão de x1, x2,..., xN 3. é simbolizado como σx 4. é calculado pela fórmula:

Page 54: Analise Incerteza

Análise Estatística das Incertezas Aleatórias

43

σ x ii

N

ii

N

Nd

Nx x= = −

= =∑ ∑1 12

1

2

1( ) ( ) (4.6)

Com esta definição, o desvio padrão pode

ser descrito como a raiz quadrada da média dos quadrados (RMS = Root Mean Square) dos desvios das medições x1, x2,..., xN. O desvio padrão prova ser um modo útil de caracterizar a confiabilidade e qualidade das medições.

Outra possibilidade para verificar a confiabilidade das medições, seria tomar os valores absolutos de di, |di| mas a média de di

2 se mostra mais útil. A média de |di| é geralmente chamada de desvio da média (nome infeliz!).

Para calcular o desvio padrão σx, de N medições, de modo manual, como definido na eq. 4.6, deve-se

1. computar os desvios di das N medições 2. elevar os desvios ao quadrado 3. tirar sua média (dividir por N) 4. tirar a raiz quadrada deste resultado Tab. 4.2. Cálculo do desvio padrão

Medições i

Valor medido xi

Desvio di = xi - x

Quadrado do desvio, di2

1 71 -0,8 0,64 2 72 0,2 0,04 3 72 0,2 0,04 4 73 1,2 1,44 5 71 -0,8 0,4 xi =∑ 359 di =∑ 0 0, di

2 2 80=∑ ,

x = =359 5 718/ , Para os dados anteriores, parte destes

cálculos foi começada na Tab. 4.1. Na Tab. 4.2 foi acrescentada a 4a coluna, com os quadrados dos desvios. Somando-se os números di

2 e dividindo por 5, obtém a quantidade σx

2 (chamada de variância das medições).

∑ ===σ 56,0580,2d

N1 2

i2i (4.7)

Tirando a raiz quadrada, tem-se o desvio padrão

σx ≈ 0,7 (4.8)

Assim, a incerteza média das cinco

medições 71 72 72 73 71

é de aproximadamente 0,7.

Infelizmente, o desvio padrão tem uma outra definição alternativa. Há argumentos teóricos para substituir a fator N da eq. 4.6 por (N – 1)e definir o desvio padrão σx de x1, x2,..., xN como

∑∑==

−−

=−

=σN

1i

2i

N

1i

2ix )xx(

1N1)d(

1N1

(4.9) Sem querer provar que a definição com N-1

seja melhor que a definição com N, pode-se dizer que esta nova definição melhorada do desvio padrão, calculada com N-1, é obviamente um pouco maior do que a obtida com N e também corrige a tendência da fórmula com N superestimar as incertezas nas medições x1, x2,..., xN, principalmente se o número de medições é pequeno. Esta tendência pode ser percebida, considerando se o caso extremo e absurdo de N = 1 (caso de se fazer uma única medição). Aqui, a média x é igual à única medição e o desvio padrão é automaticamente zero. Assim, a definição envolvendo N dá o resultado absurdo de σx igual a zero. Por outro lado, a definição com N - 1 dá 0/0, que é uma indeterminação, o que reflete realmente a total ignorância da incerteza após uma única medição. A definição com N é geralmente chamada de desvio padrão da população, simbolizado como σx e a definição com N-1, de desvio padrão da amostra, simbolizado como sx.

A diferença entre as duas definições, com N e com N - 1 é quase sempre numericamente insignificante, principalmente quando N é grande (acima de 20, por exemplo). Deve-se sempre repetir uma medição muitas vezes (no mínimo cinco e preferivelmente mais). Mesmo se forem feitas somente cinco medições, (N = 5), a diferença entre 5 2 2= , e 4 2 0= , é, para muitas aplicações, insignificante. Por exemplo, recalculando o desvio padrão das medições anteriores, usando a fórmula com N -1, obtém σx = 0,8, em vez de σx = 0,7, que é uma diferença relativamente pequena. De qualquer modo, deve-se estar ciente das duas definições. No laboratório de Metrologia, é recomendável usar a definição mais conservativa (com desvio maior, usando-se N-1) e reportar claramente que esta é definição usada, para que todos os envolvidos possam verificar os cálculos, usando sempre a mesma fórmula.

Page 55: Analise Incerteza

Análise Estatística das Incertezas Aleatórias

44

Probleminha rápido 4.1.

Foi medido o mesmo intervalo de tempo, obtendo-se 4 resultados, em segundos:

21 24 25 22 Encontrar o tempo médio e o desvio

padrão, usando a fórmula com N - 1.

Resp.: Média ou valor mais provável = 23 s Desvio padrão = 1,8 (ou 2) s

Para entender a noção de desvio padrão,

deve-se ser capaz de calculá-lo para casos simples como o do probleminha rápido 4.1. A maioria das calculadoras científicas possui uma função embutida para fazer automaticamente os cálculos (da média, desvio padrão). Por exemplo, na calculadora HP 20S, a operação é muito simples:

1. Limpar os dados da memória de Estatística acionando a tecla CLS, amarelo (canto inferior direito, 1a tecla)

2. Entrar com dados, teclando o valor da medição e apertando a tecla Σ+ (canto direito, superior, 1a tecla à direita)

3. Assim que a tecla Σ+ é acionada, aparece no visor da primeira o número de ordem do dado, 1o, 2o, , no

4. Depois de entrados todos os dados, a. teclar Amarelo, ex (para a média,

x ) b. teclar Amarelo LN (para o desvio

padrão, sx) 5. Quando for entrar com outro conjunto

de dados, deve-se resetar os dados, mesmo que a máquina tenha sido desligada (teclar Amarelo CLΣ)

A calculadora HP 20S usa a fórmula com N-1 para calcular o desvio padrão.

4.4. Desvio padrão como incerteza em uma medição isolada

O desvio padrão σx caracteriza a incerteza média das medições x1, x2,..., xN , das quais ela é calculada e no capítulo 5 isto será justificado. Quando se mede a mesma quantidade x várias vezes (N), sempre usando o mesmo método e mantendo-se todos os outros parâmetros constantes e se todas fontes de incerteza são pequenas e aleatórias, então os resultados serão distribuídos em torno do valor verdadeiro xestimado de acordo com a tão falada curva em forma de sino, característica da distribuição normal. Em particular, 68% dos resultados irão cair dentro de uma distância σx de cada lado do

valor xestimado , ou seja, 68% das medições irão cair na faixa xestimado ± σx.

Se é feita uma única medição (usando o mesmo método), há uma probabilidade de 68% que o resultado caia dentro σx do valor correto (já conhecido e calculado de outras medições repetidas). Assim, pode-se adotar σx para significar exatamente o que tem-se chamado de incerteza. Quando se faz uma medição de x, a incerteza associada com esta medição pode ser tomada como sendo:

δx = σx Com esta escolha, pode-se estar 68%

confiante que a medição esteja dentro δx do resultado correto.

Para ilustrar a aplicação destas idéias, seja uma caixa de molas (teoricamente) iguais, das quais se quer medir a sua constante de mola, k. Pode-se medir as constantes de mola colocando um peso em cada mola e observando a extensão resultante. Talvez melhor seja suspender uma massa de cada mola e medir suas oscilações. Qualquer que seja o método escolhido, é necessário conhecer k e sua incerteza δk para cada mola, porém seria muito desgastante, demorado e tedioso repetir as medições muitas vezes para cada mola. Em vez de fazer isso, é recomendável proceder assim:

1. Se k é medido para a primeira mola várias vezes (por exemplo, 5 ou 10), então a média destas várias medições é uma boa estimativa de k para a primeira mola.

2. Mais importante, por enquanto, é que o desvio padrão σx para estas várias medições fornece uma estimativa da incerteza no método de medição de k.

3. Como é esperado que as molas sejam iguais, usa-se o mesmo método para medir cada uma e se espera a mesma incerteza em cada medição. Porém, faz-se somente uma medição para cada mola subsequente

4. Pode-se estabelecer imediatamente que a incerteza δk é o desvio padrão σk medido para a primeira mola, com uma confiança de 68% que o resultado esteja dentro de σk do valor correto.

Para ilustrar numericamente estas idéias, sejam 10 medições da primeira mola, obtendo-se os seguintes resultados de k (em newton/metro, N/m):

86, 85, 84, 89, 85, 89, 87, 85, 82, 85

(4.10)

Page 56: Analise Incerteza

Análise Estatística das Incertezas Aleatórias

45

Destes valores, pode-se calcular imediatamente a média, que é a melhor estimativa

k = 85,7 N/m (4.11) Usando a definição com N-1, obtém o desvio padrão:

σx = 2,16 N/m = 2 N/m (4.12)

Assim, a incerteza em qualquer medição de

k é aproximadamente de 2 N/m. Se depois se medir uma segunda mola, uma única vez, e obter a resposta de k = 71 N/m, pode-se, sem mais cerimônias,

1. Considerar o mesmo desvio padrão δx = σk = 2 N/m e

2. Reportar o segundo resultado, com um grau de confiança de 68%:

k (para a segunda mola) = 71 ± 2 N/m (4.13)

4.5. Desvio padrão da média Se x1, x2,..., xN são os resultados de N

medições da mesma quantidade x, então, a melhor estimativa para a quantidade x é sua média x . O desvio padrão σx caracteriza a incerteza média das medições separadas, x1, x2,...e xN. O resultado qestimado = x , porém, representa uma combinação criteriosa de todas as N medições e é razoável supor que a média é mais confiável que qualquer uma das N medições tomada isoladamente. No capítulo 5 será mostrado que a incerteza final do resultado é dada pelo desvio padrão σx dividido por N . Esta quantidade é chamada de desvio padrão da média e é simbolizada por xσ , onde

Nx

x

σ=σ (4.14)

Outros nomes comuns são erro padrão, incerteza padrão, erro padrão da média. Assim, baseado em N valores medidos, x1, x2,..., xN , pode-se estabelecer que o resultado final para o valor de x como

valor de x = xestimado ± δx onde

xestimado = x

δx = Nx

x

σ=σ (4.15)

Como exemplo, sejam novamente as 10

medições da constante da mola: 86, 85, 84, 89, 85, 89, 87, 85, 82, 85

com média destes valores igual a

k = 85,7 N/m e desvio padrão de

σk = 2,16 N/m = 2 N/m

Nesta aplicação, o desvio padrão da média é

N/m 7,032

10k

k ==σ

=σ (4.16)

e o resultado final, baseado nestas 10 medições,

k = 85,7 ± 0,7 N/m (4.17) Quando se dá um resultado como este,

deve-se estabelecer claramente o que os números significam, ou seja,

85,7 é a média de 10 medições 0,7 é o desvio padrão da média das medições de modo que os usuários deste resultado possam julgar seus significados.

Uma característica importante do desvio padrão da média, xσ , é o fator N no denominador. O desvio padrão σx representa a incerteza média nas medições individuais x1, x2,...e xN . Assim, quando se fazem algumas medições adicionais, usando a mesma técnica, o desvio padrão σx não deve se alterar apreciavelmente. Por outro lado, o desvio padrão da média, xσ , diminui lentamente quando N aumenta. Esta diminuição é justamente o que se espera. Se são feitas mais medições antes de tirar a média, naturalmente se espera que o resultado final seja mais confiável e esta melhora de confiabilidade é exatamente o que o denominador N em (4.15) garante. Esta conclusão fornece um modo óbvio para melhorar a precisão das medições.

Infelizmente, o fator N aumenta lentamente quando N aumenta. Por exemplo, quando se quer melhorar a precisão por um fator de 10, deve-se aumentar o número de

Page 57: Analise Incerteza

Análise Estatística das Incertezas Aleatórias

46

medições por um fator de 100, o que não é muito exeqüível, na prática. Mais ainda, até agora as incertezas sistemáticas estão estão sendo desprezadas e elas não são diminuídas pelo aumento do número de medições. Assim, na prática, quando se quiser aumentar muito a precisão, deve-se cuidar de melhorar o procedimento, trocar o instrumento e não simplesmente aumentar o número de medições.

Probleminha rápido 4.2.

Foi medido o mesmo intervalo de tempo, obtendo-se 5 resultados, em segundos:

15 17 18 14 16 Encontrar a melhor estimativa para o tempo

e o desvio padrão da média.

Resp.: Média ou valor mais provável = 16 s σx = 1,6 e portanto

xσ = 0,7 (1) s

Exemplo: Área de um retângulo Para a aplicação do desvio padrão da

média, seja a medição precisa da área de um retângulo, com lados aproximados de 2,5 cm e 5,0 cm. As medições são feitas com um paquímetro com vernier e são feitas 10 medições de cada dimensão, comprimento e altura. Para levar em conta as irregularidades do lado, fazem-se medições em diferentes posições e para considerar os pequenos defeitos no instrumento, usam-se diferentes paquímetros (cuidado nos procedimentos!). Os resultados obtidos são os mostrados na Tab. 4.3.

Tab. 4.3. Comprimento e altura (mm)

Valores medidos Média σx xσ L 24, 25, 24, 26, 24,

22, 24, 28, 24, 24, 24, 25, 24, 22, 24, 26, 24, 23, 24, 24

24,2

0,02

0,006

B

50,36; 50,35; 50,41; 50,37; 50,36; 50,32; 50,39; 50,38; 50,36; 50,38

50,368

0,024

0,008

Usando-se os 10 valores observados de L,

pode-se facilmente calcular sua média, o desvio padrão de cada medição e o desvio padrão da média das 10 medições. Do mesmo modo, calculam-se a média, desvios padrões da largura b do retângulo. Antes de fazer qualquer conta, examinam-se os dados para verificar se parecem razoáveis (É possível

detectar algum engano ou alguma medição com erro grosseiro). Por exemplo, os dois desvios padrão σL e σb, que expressam a incerteza média das medições de L e b, devem ser quase iguais, pois foram medidos com o mesmo instrumento e usando-se o mesmo procedimento de medição.

Tendo-se convencido de que os dados são razoáveis, pode-se acabar de fazer os cálculos. A melhor estimativa de cada dimensão é sua média e as incertezas médias são expressas pelo desvio padrão. Finalmente acha-se o desvio padrão das médias. Os resultados finais podem ser expressos como:

L = 24,245 ± 0,006 mm (ou 0,025%) b = 50,368 ± 0,008 mm (ou 0,016%) A melhor estimativa da área, (A = Lb):

A = (24,245 ± 0,025%) x (50,368 ± 0,016%) =

= 1221,17 mm2 ± 0,03%

= 1221,2 ± 0,4 mm2 (4.18) Para se chegar ao resultado final de A, 1. foram calculadas as médias de L e b,

cada uma com uma incerteza igual ao desvio padrão de sua média

2. foi calculada a área A como o produto de L e b

3. foi achada a incerteza pela propagação no produto.

Poderia ser feito de outro modo, ou seja: 1. multiplicar o primeiro valor medido de L

pelo primeiro valor de b para dar o primeiro resultado de A

2. continuar o processo, calculando-se 10 resultados para A

3. aplicar análise estatística aos estes 10 resultados, calculando-se a média de A, o desvio padrão para cada área e finalmente o desvio padrão da média.

Se as incertezas em L e b forem aleatórias e independentes e tendo-se um número suficiente de medições, os dois métodos devem dar os mesmos resultados finais.

Exemplo: outra mola Seja o caso onde não se pode aplicar

análise estatística diretamente às medições, mas apenas aos resultados finais. Novamente se quer medir a constante de mola k, pela medição dos tempos de oscilação de uma massa m fixada à sua extremidade. Sabe-se da mecânica que o período para tais oscilações é

Page 58: Analise Incerteza

Análise Estatística das Incertezas Aleatórias

47

km2T π=

Assim, pela medição de T e m, pode-se

achar k pela fórmula:

2

2

Tm4k π

= (4.19)

O modo mais simples para determinar k é

tomar uma única e exatamente conhecida massa m e fazer várias medições cuidadosas de T. Por várias razões, porém, medir T para várias massas diferentes pode ser mais interessante. (Por exemplo, deste modo, pode-se verificar que mTα , bem como medir k). Obtém-se um conjunto de medições mostrado na Tab. 4.4.

Tab. 4.4. Medição da constante k da mola

m (kg) 0,513 0,581 0,634 0,691 0,752 0,834 0,901 0,950 T (s) 1,24 1,33 1,36 1,44 1,50 1,59 1,65 1,69 k 13,17 12,97 etc.

Obviamente, não faz sentido tirar a média

das várias massas diferentes ou dos períodos de tempo medidos, porque não são medições diferentes da mesma quantidade. Nada pode ser aprendido acerca da incerteza das medições, comparando os diferentes valores de m. Porém, pode-se combinar cada valor de m com seu correspondente período T e calcular k. Todos resultados de k são medições da mesma quantidade e portanto podem ser submetidos à análise estatística. Em particular, a melhor estimativa para k é a média k = 13,16 N/m e a incerteza é o desvio padrão da média σk = 0,06 N/m. Assim, o resultado final baseado nos dados da Tab. 4.4 é

constante de mola k = 13,16 ± 0,06 N/m

(4.20) Se houvesse estimativa razoável das

incertezas nas medições originais de m e T, podia-se também estimar a incerteza em k usando propagação da incerteza, começando com as estimativas das incertezas de m (δm) e T (δT). Neste caso, os resultados dos dois métodos poderiam ser comparados.

4.6. Incertezas sistemáticas Até agora, em todas as aplicações e

exemplos, foi assumido que todas as incertezas sistemáticas são reduzidas a um nível desprezível, antes do início das medições sérias. Agora serão vistas as incertezas

sistemáticas. Quando se medem a massa e o período de tempo de oscilação do pêndulo, a balança poderia estar medindo a massa consistentemente a mais ou a menos e o cronômetro poderia estar funcionando consistentemente mais devagar ou mais rápido. Nenhuma destas incertezas sistemáticas foi considerada quando se fez a análise de seus resultados e incertezas associadas. Assim, o desvio padrão da média de cada medição pode ser considerada como a componente aleatória da incerteza e nem sempre é a incerteza total. O problema agora é como estimar a incerteza sistemática e então combiná-la com a aleatória, para dar a incerteza total ou completa.

Nenhuma teoria simples diz o que fazer com as incertezas sistemáticas. De fato, a única teoria das incertezas sistemáticas é que elas devem ser identificadas e reduzidas até que sejam muito menores que a precisão requerida. Em um laboratório de Metrologia, nem sempre isto é conseguido. Os metrologistas, às vezes, não podem calibrar o instrumento contra um padrão melhor rastreado ou então não podem comprar um novo medidor para substituir o inadequado. Por esta razão, alguns laboratórios e oficinas estabelecem uma regra que, na ausência de informações mais específicas, os medidores devem ser considerados com uma incerteza sistemática definida. Por exemplo, a decisão pode atribuir uma incerteza sistemática de ±0,5% para todos os cronômetros, ±1% para todas as balanças e ±3% para multímetros (voltímetro, amperímetro e ohmímetro).

Estabelecidas regras deste tipo, há vários modos de proceder. Nenhum deles pode ser rigorosamente justificado e será mostrado aqui um enfoque. No último exemplo, a constante de mola k foi encontrada através das medições de uma série de valores de m e T. Uma análise estatística de vários resultados para k deu uma componente aleatória de δk como :

N/m 06,0k kalea =σ=δ (4.21)

Seja agora o caso de a balança que mede

a massa m ter uma incerteza sistemática de ±1% e o cronômetro que mede o período de oscilação, uma incerteza sistemática de ±0,5%. Agora deve-se achar a componente sistemática de δx pela propagação das incertezas. A única questão é se deve combinar as incertezas em quadratura ou diretamente. Como as incertezas em m e T são independentes e algum cancelamento é possível, é mais razoável usar a soma quadrática.

Como

Page 59: Analise Incerteza

Análise Estatística das Incertezas Aleatórias

48

2

2

Tm4k π

=

A incerteza relativa sistemática total em k é:

2sist

2sistsist

TT2

mm

kk

⎟⎠

⎞⎜⎝

⎛ δ+⎟

⎞⎜⎝

⎛ δ=

δ (4.22)

%4,1%)5,02(%)1( 22 =×+ (4.23)

Portanto, δksist = kestimado x 1,4% (4.24) = (13,16 N/m) x 0,014 = 0,18 N/m Agora, têm-se as duas incertezas em k,

sistemática e aleatória e deve-se novamente decidir como combiná-las para se obter a incerteza total na constante k da mola. Como o método de combinar a incerteza sistemática com a aleatória não é totalmente claro, muitos metrologistas deixam as duas componentes separadas e dá o resultado final como:

valor medido de k = kestimado ± δkalea ± δksist

(4.25) No exemplo anterior, o resultado é k = 13,16 ± 0,06 ± 0,18 N/m Há outros metrologistas que sugerem

combinar a incerteza aleatória com a sistemática através da soma quadrática, onde se tem:

2

sist2

alea )k()k(k δ+δ=δ (4.26)

Novamente no caso da constante k, k = 22 18,006,0 +

Finalmente

k = 13,16 ± 0,19 N/m (ou 13,2 ± 0,2 N/m)

A combinação da incerteza aleatória com a sistemática através da soma quadrática não pode ser rigorosamente justificada. Nem o significado do resultado é claro; por exemplo, não se pode dizer com 68% de confiança que o resultado final cai dentro da faixa kestimado ± δk. [A afirmativa de que o resultado final de x caia dentro da faixa xestimado ± δx, com 68% de confiança, é válido somente para incertezas aleatórias, que se distribuem conforme a

distribuição normal). De qualquer modo, a expressão fornece, no mínimo, uma estimativa razoável da incerteza total da medição, desde que o instrumento possua incertezas sistemáticas que não possam ser eliminadas.

Em particular, há algo interessante em reportar o relatório final combinando a incerteza sistemática com a aleatória em soma quadrática. Foi visto em 4.5 que o desvio padrão da média se aproxima de zero quando o número de medições aumenta. Este resultado sugere que, quando se tem a paciência e condições de se fazer um grande número de medições, pode-se reduzir as incertezas indefinidamente sem ter que melhorar o equipamento ou a técnica. Agora se percebe que esta afirmação é incorreta. Aumentar o número de medições pode apenas reduzir a componente aleatória da incerteza total. Quando algum instrumento tiver uma determinada incerteza sistemática, esta incerteza se repete sempre e não é reduzida quando se aumenta o número de medições. Da expressão da incerteza total igual à soma quadrática das incertezas aleatória e sistemática, vê-se claramente que há pouco ganho em se reduzir mais ainda a componente aleatória, quando esta componente for menor que a componente sistemática. Em particular, a incerteza final nunca pode ser menor que a componente sistemática. Este fato simplesmente reforça o que já foi dito: na prática, uma grande redução da incerteza requer melhoria de técnica ou de equipamento, para melhorar tanto a incerteza sistemática como a aleatória, em cada medição.

Como visto no Capítulo 2, é comum se ter a necessidade de medir quantidades, como aceleração da gravidade, para as quais já existe um valor aceito e conhecido com precisão. Nestas aplicações, a lógica da análise da incerteza é um pouco confusa. Provavelmente, o procedimento mais correto é ignorar o valor aceito conhecido até depois de feitos todos os cálculos do valor medido, qestimado e sua incerteza δq. Depois, pode-se verificar se o valor aceito conhecido cai dentro (ou está próximo) da faixa qestimado ± δq. Se o valor conhecido cair muito fora deste faixa, deve-se examinar as causas possíveis da grande discrepância. Por exemplo, se o resultado da aceleração da gravidade foi encontrado igual a

gestimado = 9,97 m/s2 (4.27)

com incertezas

Page 60: Analise Incerteza

Análise Estatística das Incertezas Aleatórias

49

δgalea = 0,02 e δgsist = 0,03

A incerteza total, pela soma quadrática dá δg = 0,04

e o resultado final vale: g = 9,97 ± 0,04 m/s2

que está muito distante do valor aceito g = 9,80 m/s2 A discrepância é de 0,17, que é 4 x 0,04.

Assim, o resultado 9,97 ± 0,04 m/s2 não é satisfatório e deve haver análise adicional.

A primeira coisa a verificar é a possibilidade de ter havido um erro grosseiro no cálculo de gestimado ou nas incertezas δgalea e δgsist. Se há convicção de que as medições e cálculos estão corretos, a próxima possibilidade é que o valor aceito esteja incorreto. No caso de g = 9,80 m/s2 isto é improvável, mas pode ser possível em muitas outras aplicações. Por exemplo, a densidade do ar depende muito da pressão e temperatura consideradas e por isso é possível e provável haver confusão com estes parâmetros.

Uma vez tenham sido eliminadas todas as suspeitas, resta somente uma possibilidade: deve ter sido omitida alguma incerteza sistemática, de modo que a incerteza total calculada está muito pequena. Idealmente, deve-se tentar achar o culpado, mas esta procura pode ser difícil, pelos seguintes motivos:

1. Talvez um dos instrumentos tenha uma incerteza sistemática maior do que a calculada. Pode-se investigar esta possibilidade determinando qual o tamanho da incerteza sistemática no instrumento necessário para provocar a grande discrepância encontrada. Se a incerteza necessária é razoavelmente pequena, tem-se uma explicação possível do problema.

2. Outra possível causa de incerteza sistemática é o uso de um valor errado para algum parâmetro necessário no cálculo. Este tipo de engano geralmente acontece em laboratório quando o metrologista usa um valor com muito poucos algarismos significativos (ou seja, com grande erro de arredondamento). Por exemplo, em uma experiência que se quer uma precisão de ±1% e se usa a constante 1,7 x 10-27 kg, em vez de 1,67 x 10-27 kg, há um erro de

arredondamento de ±2%, maior que a incerteza esperada na experiência.

3. Mais difícil para analisar é a possibilidade de uma falha no projeto da experiência. Por exemplo, se a aceleração da gravidade é medida, deixando-se cair um objeto de uma grande altura, a resistência do ar pode introduzir uma grande incerteza sistemática. Outro exemplo, na medição da meia-vida de um material radioativo, se a amostra estiver contaminada com outro material com meia-vida menor, o resultado sempre será menor.

Obviamente, rastrear as fontes de incertezas sistemáticas é uma tarefa difícil, que desafia os melhores esforços dos metrologistas. Em todas as aplicações, porém, os resultados não serão confiáveis, se esta pesquisa não for feita.

Page 61: Analise Incerteza

Análise Estatística das Incertezas Aleatórias

50

Principais Definições e Equações do Capítulo 4

Quando se têm N medições x1, x2, ..., xN, da mesma quantidade x, todas usando o mesmo método. Desde que as incertezas sejam independentes e aleatórias, têm-se os seguintes resultados

Média A melhor estimativa para x, baseado nestas

medições, é sua média

xx

Ni= ∑ [Ver (4.5)]

Desvio padrão A incerteza média das medições individuais

x1, x2, ..., xN, é dada pela desvio padrão:

∑=

−−

=σN

1i

2ix )xx(

1N1 [Ver (4.9)]

Esta definição de desvio padrão,

geralmente chamada de desvio padrão da amostra, é a mais apropriada para os objetivos práticos. O desvio padrão da população é obtido, substituindo-se o fator (N – 1) por N, no denominador. Mesmo quando se calcula o desvio padrão através de calculadora científica, deve-se estar seguro de qual definição está sendo usada.

O significado detalhado do desvio padrão σx é que aproximadamente 68% das medições de x (usando o mesmo método) devem cair dentro de uma distância σx do valor verdadeiro. Este resultado é o que permite que σx seja identificado como a incerteza na medição x.

δx = σx

e com esta escolha, pode se estar 68% confiante que qualquer uma medição de x irá cair dentro σx do resultado correto.

Desvio padrão da média Desde que as incertezas sistemáticas

sejam desprezíveis, a incerteza na melhor estimativa de x (normalmente a média) é a incerteza padrão da média, dada por:

Nx

x

σ=σ [Ver (4.14]

Quando se tem modo de estimar a

componente sistemática da incerteza, δxsist, é razoável (mas não rigorosamente justificado) expressar a incerteza total como a soma quadrática de δxalea e δxsist:

2

sist2

aleatot )x()x(x δ+δ=δ [Ver (4.26)]

Apostilas\Incerteza JRTaylor2.doc 25 SET 98 (Substitui 19 DEZ 97)

Page 62: Analise Incerteza

51

5. Distribuição de Gauss

5.1. Introdução Este capítulo continua com a discussão da

análise estatística de medições repetidas. O capítulo 4 introduziu as idéias importantes de média, desvio padrão e desvio padrão da média e foram vistos seus significados e alguns de seus usos.

O primeiro problema que aparece, ao se discutir as medições repetidas, é achar o modo de manipular e apresentar os valores obtidos. Um modo conveniente é usar uma distribuição ou histograma, como descrito em 5.2. A seção 5.3 introduz a noção de distribuição limite, a distribuição de resultados que seriam obtidos se o número de medições se tornasse infinitamente grande. Na seção 5.4, é definida a distribuição normal ou distribuição de Gauss, que é a distribuição limite de resultados para qualquer medição sujeita a muitas pequenas incertezas aleatórias.

Assim que as propriedades matemáticas da distribuição normal sejam entendidas, pode-se provar facilmente vários resultados importantes. A seção 5.5 fornece a prova que, com antecipado no Capítulo 4, cerca de 68% de todas as medições (todas de uma mesma quantidade e usando o mesmo procedimento) devem cair dentro de um desvio padrão do valor verdadeiro. A seção 5.6 prova o resultado, usado no Capítulo 1, que se são feitas N medições x1, x2, ..., xN da mesma quantidade x, então a melhor estimativa xestimado baseado nestes valores é a média ∑= N/xx i . A seção 5.7 justifica o uso da soma quadrática quando as incertezas que se propagam são aleatórias e independentes. Na seção 5.8 prova-se que a incerteza da média, quando usada como a melhor estimativa do resultado de x, é dada pelo desvio padrão da média,

N/xx σ=σ , como estabelecido no Capítulo 4. Finalmente a seção 5.9 discute como atribuir uma confiança numérica a resultados experimentais.

A matemática usada neste capítulo é mais avançada do que a usada até agora. Em particular, devem ser conhecidos os conceitos de integração – a integral como a área sob uma curva, alterações de variáveis e ocasionalmente, integração por partes. Porém, uma vez que se tenha trabalho até a seção 5.4

sobre a distribuição normal (fazendo cálculos com lápis e papel, se necessário), é possível seguir o resto do capítulo sem dificuldade.

5.2. Histogramas e distribuições A análise estatística séria de um

experimento requer que o experimentador faça muitas medições. Assim, primeiro é necessário estabelecer métodos para registrar e indicar grande quantidade dos valores medidos. Seja, por exemplo, 10 medições do mesmo comprimento x, com resultados (em cm):

26, 24, 26, 28, 23, 24, 25, 24, 26, 25

(5.1) Escritos deste modo, estes 10 números

fornecem muito pouca informação e se a quantidade de medições é maior, os resultados podem virar uma grande confusão de números. Por isso é necessário e conveniente um melhor sistema de apresentação destes resultados.

Como um primeiro passo, os mesmos números podem ser ordenados, por exemplo, em ordem crescente (do menor para o maior):

23, 24, 24, 24, 25, 25, 26, 26, 26, 28

(5.2) Agora já se tem mais informação, pois é

prontamente conhecido o menor resultado (23), o maior (28), a diferença entre ambos (5), o mais repetido (24 e 26), o valor do meio (25).

Melhorando mais ainda, em vez de escrever os números 24 e 26 três vezes cada, pode-se registrar que estes valores foram obtidos três vezes. Agora, pode-se registrar os diferentes resultados de x, junto com o número de vezes que cada valor foi encontrado, como na Tab. 5.1.

Tab. 5.1. Comprimentos medidos x e ocorrências

xi 23 24 25 26 27 28 ni 1 3 2 3 0 1

Page 63: Analise Incerteza

Distribuição Norma ou de Gauss

52

A notação xi (i = 1, 2, ...) mostra os vários valores de x encontrados: x1 = 23, x2 = 24, x3 = 25, ... e ni mostra o número de vezes que cada valor foi encontrado; n1 = 1, n2 = 3, ... A média destes valores, já definida, vale:

2510

28...2524242423x =++++++

=

(5.3) Também pode-se fazer assim:

2510

28)326()225()324(23x =+×+×+×+

=

ou de um modo genérico:

N

nxx i

ii∑= (5.4)

Na forma original (5.3), somam-se todas as

medições feitas; na nova forma (5.4) somam-se todos os diferentes valores obtidos, multiplicados pelo número de vezes que eles ocorrem. As duas somas dão o mesmo resultado, obviamente, mas a eq. (5.4) fornece mais informação útil, principalmente quando se fazem muitas medições repetidas. A eq. (5.4) é chamada também de média ponderada, onde cada valor medido é pesado pelo número de vezes que ele ocorre. Isto faz sentido: o valor medido que aparece repetido mais vezes tem maior peso. Finalmente, a soma de todos os números ni dá o número total de medições, N, ou seja

Nni

i =∑ (5.5)

(Por exemplo, para a Tab. 5.1, esta

equação garante que a soma dos números na última linha vale 10.)

Probleminha rápido 5.1. Na escola, José fez 20 disciplinas, todas

com o mesmo número de créditos e tirou 7 L (louvor), 4 MB (muito bom), 7 B (bom), 2 R (regular) e nenhum I (insuficiente). Para computar uma nota, atribui-se a cada nota-letra um valor numérico:

Nota-letra I R B MB L Escore 0 1 2 3 4

Fazer uma tabela mostrando os escores

diferentes possíveis e o número de vezes que foram obtidos, para computar a nota de José.

Resposta

Escore 0 1 2 3 4 Número 0 2 7 4 7

s = 2,7

As idéias anteriores podem ser escritas de um modo mais conveniente. Em vez de dizer que o resultado 24 foi obtido 3 vezes, pode-se dizer que x = 24 foi obtido em 3/10 de todas as medições. Em vez de usar ni, o número de vezes que o resultado acontece, introduz-se a fração

NnF i

i = (5.6)

que é a fração das N medições que deram o resultado xi. Diz-se que as frações Fi são a distribuição dos resultados, porque elas descrevem como as medições foram distribuídas entre os diferentes possíveis valores.

Em termos das frações Fi, pode-se reescrever a eq. (5.4) para a média em forma compacta:

∑=i

iiFxx (5.7)

A média das medições é justamente a

soma ponderada de todos os diferentes valores xi obtidas com cada xi pesado pela fração de vezes que ele ocorreu, Fi.

O resultado da eq. (5.5) implica que

∑ =i

i 1F (5.8)

Quando se somam todas as frações para

todos os resultados possíveis xi, obtém-se 1. Qualquer conjunto de números cuja soma é 1 é chamado normalizado e a eq. (5.8) é chamada de condição de normalização.

A distribuição das medições pode ser mostrada graficamente em um histograma, como na Fig. 5.1. Esta figura é o gráfico de Fi contra xi, em que os valores medidos diferentes xi são plotados no eixo horizontal e a fração de

Page 64: Analise Incerteza

Distribuição Norma ou de Gauss

53

vezes que cada valor aparece é indicada pela altura da barra vertical desenhada acima de xi. (Poderia também se fazer um gráfico de ni contra xi, porém este modo é menos conveniente). Os dados mostrados em histogramas como o da Fig. 5.1 pode ser compreendido fácil e rapidamente.

Fig. 5.1. Histograma com 10 medições de um

comprimento x. O eixo vertical mostra a fração de vezes Fi que cada valor xi foi observado.

O histograma como o mostrado na Fig. 5.1

pode ser chamado de histograma de barras, porque a distribuição dos resultados é indicada pelas alturas das barras verticais colocadas acima do eixo xi. Este tipo de histograma é apropriado quando os valores xi forem nitidamente espaçados, com valores inteiros. (Por exemplo, notas de alunos, número de eventos). A maioria das medições das variáveis de processo, porém, é analógica. Os valores das quantidades de processo variam continuamente, assumindo uma infinidade de valores possíveis entre o início e o fim da faixa de medição. Assim, quando se fazem 10 medições de temperatura, podem-se obter resultados como

26,4 23,9 25,2 24,6 22,7

23,8 25,1 23,9 23,5 25,4 (5.9) Como não há nenhum valor absolutamente

igual a outro, se fosse construir um histograma de barras, haveria 10 barras, cada uma com um valor e isso seria inútil. Dadas medições de quantidades analógicas, como as anteriores, o melhor método é dividir a faixa de valores em número conveniente de intervalos e contar quantos valores caem em cada intervalo. Por exemplo, os números de medições poderiam ser divididos em intervalos entre 22 e 23, entre 24 e 25 e assim por diante. Os resultados de contagem neste modo são mostrados na Fig. 5.2. (Se uma medição cair exatamente no limite entre dois intervalos, deve-se decidir onde colocá-la).

Tab. 5.2. Dez medições agrupadas em intervalos

Δx 22-

23 23-24

24-25

25-26

26-27

27-28

n 1 3 1 4 1 0 Os resultados na Tab. 5.2 podem ser

plotados em uma forma chamada de histograma de intervalos. Neste gráfico, a fração de medições que caem em cada intervalo pode ser indicada pela área do retângulo desenhado acima do intervalo. Assim, o retângulo acima do intervalo 23-24 tem uma área 0,3 x 1 = 0,3 indicando que 3/10 de todas as medições caem neste intervalo. Em geral, denota-se o intervalo do io intervalo por Δi. (Os intervalos geralmente tem a mesma largura, porém, isto não é obrigatório). A altura fi do retângulo desenhado acima deste intervalo é escolhido de modo que a área fiΔi seja

fiΔi = fração das medições no io intervalo

Fig. 5.2. Histograma de intervalos mostrando a

fração de 10 medições de x que caem nos intervalos 22-23, 23-24, .... A área do retângulo acima de cada intervalo dá a fração das medições que caem neste intervalo. Assim, a área do retângulo hachuriado é 0,3, indicando que 3/10 de todas as medições caem entre 23 e 24.

Assim, em um histograma de intervalos a

área do retângulo fiΔi tem o mesmo significado que a altura Fi da ia barra em um histograma de barra.

Deve-se ter cuidado na escolha da largura Δi dos intervalos para um histograma. Se os intervalos tiverem grande largura, então todas as leituras (ou quase todas) caem em um intervalo e o histograma terá apenas um retângulo. Se os intervalos tiverem pequena largura, então poucos intervalos contem mais de uma medição e o histograma será constituído de vários retângulos estreitos, quase todos da mesma altura. Então, a largura do intervalo deve ser escolhida de modo que várias medições caiam em cada intervalo. Assim, quando o número total de medições N é pequeno, deve-se escolher larguras de intervalos relativamente grandes e se o número N é aumentado, pode-se escolher intervalos mais estreitos.

28 27 26 25 24 23 22 0

0,1 0,2

0,3

Fi

xi

Page 65: Analise Incerteza

Distribuição Norma ou de Gauss

54

Probleminha rápido 5.2 Uma classe de 20 estudantes faz um

exame, que é graduado em 50 pontos e obtém-se os seguintes resultados:

26, 33, 38, 41, 49, 28, 36, 38, 47, 41 32, 37, 48, 44, 27, 32, 34, 44, 37, 30 (Estes resultados foram obtidos da ordem

alfabética dos alunos). Fazer um histograma de intervalos, usando intervalos com limites de largura em 25, 30, 35, 40, 45 e 50.

Resposta

5.3. Distribuições limites Na maioria das aplicações, quando o

número de medições aumenta, o histograma começa a tomar uma forma definida simples. Esta curva envolvente é claramente visível nas Fig. 5.3 e 5.4, que mostram 100 e 1000 medições da mesma quantidade, como na Fig. 5.2. Após 100 medições, o histograma forma um único pico, que é aproximadamente simétrico. Após 1000 medições, pode-se dividir os intervalos pela metade e o histograma se forma mais suave e regular. Estes três gráficos ilustram uma propriedade importante da maioria das medições. Quando o número de medições tende para infinito, sua distribuição tende para alguma curva contínua definida. Quando isto acontece, a curva contínua é chamada de distribuição limite. Assim, para medições da Fig. 5.2 até 5.4, a distribuição limite parece próxima de uma curva simétrica em forma de sino.

Fig. 5.3. Histograma para 100 medições da mesma

quantidade que a ilustrada na Fig. 5.2.

Fig. 5.4. Histograma para 1000 medições da mesma

quantidade que a ilustrada na Fig. 5.2. Há uma curva limite superposta ao histograma.

A distribuição limite é uma construção

teórica que pode nunca ser medida exatamente. Quanto maior o número de medições feitas, mais o histograma se aproxima da distribuição limite. Porém, somente quando se faz um número infinito de medições e se usam intervalos com larguras infinitesimais pode-se realmente se obter a distribuição limite. De qualquer modo, há uma boa razão para se acreditar que cada medição tem uma distribuição limite para a qual o histograma se aproxima cada vez mais, quando se aumenta o número de medições.

Uma distribuição limite, como a curva contínua na Fig. 5.4 define uma função, chamada f(x). O significado desta função é mostrado na Fig. 5.5. Quando se aumenta o número de medições cada vez mais da quantidade x, o histograma se aproxima da curva limite f(x). Assim, a fração das medições que caem em qualquer pequeno intervalo x a x + dx igual à área f(x) dx da lista hachuriada na Fig. 5.5 (a):

f(x)dx = fração da medição que cai

entre x e x + dx (5.10) Geralmente, a fração das medições que

caem entre quais dois valores a e b é a área total sob o gráfico entre x = a e x = b, como mostrado na Fig. 5.5 (b)

(a) (b) Fig. 5.5. Uma distribuição limite f(x). (a) Após muitas medições, a fração que cai entre x

e x + dx é a área f(x)dx da faixa estreita. (b) A fração que cai entre x = a e x = b é a área

hachuriada.

Fi

28 27 26 25 24 23 22 0

0,1 0,2

0,3

xi

0,4

N=100

28 27 26 25 24 23 22 0

0,1 0,2

0,3

xi

0,4

N=1000

Page 66: Analise Incerteza

Distribuição Norma ou de Gauss

55

Esta área é definida como a integral limitada de f(x). Assim, tem-se o resultado importante que

∫ =b

a

b e a entre caem que medições das fração dx)x(f

(5.11) É importante entender o significado das

duas expressões eq (5.10) e eq. (5.11). Ambas dizem qual a fração de medições é esperada cair em algum intervalo após um grande número de medições. Outro modo muito útil dizer é que f(x)dx é a probabilidade que uma única medição de x dê um resultado entre x e x + dx.

f(x)dx = probabilidade que qualquer uma única medição de x dê um resultado entre x e x + dx. (5.12)

Do mesmo modo, a integral ∫b

a

dx)x(f diz a

probabilidade que qualquer uma medição de x caia entre x = a e x = b. Chega-se à seguinte conclusão importante: se é conhecida a distribuição limite f(x) para a medição de uma dada quantidade x com um dado instrumento, então se pode saber a probabilidade de se obter um resultado em qualquer intervalo a ≤ x ≤ b.

Como a probabilidade total de se obter um resultado em qualquer ponto entre -∞ e + ∞ deve ser um, a distribuição limite f(x) deve satisfazer

∫∞

∞−

= 1dx)x(f (5.13)

Esta identidade é a analogia natural da soma normalizada ΣkFk = 1 e uma função satisfazendo (5.13) é chamada normalizada.

Os limites ±∞ na integral (5.13) podem parecer exóticos. Os limites não significam que realmente se espera obter resultados variando de -∞ a +∞. Pelo contrário, na prática, todas as medições irão cair em algum intervalo finito razoavelmente estreito. Por exemplo, as medições da Fig. 5.4 todas caem entre x = 21 e x = 29. Mesmo após um número infinito de medições, a fração caindo entre fora dos limites de x = 21 e x = 29 é desprezível. Em outras palavras, f(x) é essencialmente zero fora desta faixa e não faz diferença se a integral (5.13) vai de -∞ a +∞ ou de 21 a 29. Como geralmente não se conhecem estes limites

finitos, por conveniência os limites são considerados ±∞.

Se as medições consideradas são muito precisas, todos os valores obtidos estão muito próximos do valor verdadeiro de x, de modo que o histograma dos resultados e portanto a distribuição limite, terá um pico estreito. Se as medições forem pouco precisas, então os valores encontrados se espalham e distribuição será larga e o pico pequeno. (Fig. 5.6)

Fig. 5.6. Duas distribuições limites, uma para uma medição muito precisa (linha contínua) e outra para medição pouco precisa (linha pontilhada)

A distribuição limite f(x) para a medição de

uma dada quantidade x usando um dado instrumento descreve como os resultados seriam distribuídos após um grande número de medições. Assim, se f(x) é conhecida, pode-se calcular o valor médio de x de pois de muitas medições. Foi visto (5.7) que a média de qualquer número de medições é a soma de todos os valores de xi , cada um com um peso, que é a fração de vezes que ele é obtido:

∑=i

iiFxx (5.14)

No presente caso, tem-se um grande

número de medições com distribuição f(x). Se a faixa total de valores é dividida em pequenos intervalos xi a xi + dxi , a fração de valores em cada intervalo é Fi = f(xi) dxi e no limite que todos os intervalos tendem para zero, (5.14) fica

∫∞

∞−

= dx)x(xfx (5.15)

Esta fórmula dá a média esperada de x

depois de um número infinito de medições. Do mesmo modo, pode-se calcular o desvio

padrão σx obtido após muitas medições. Como estamos ligados ao limite N ∞, não faz diferença qual definição de σx é usada, com N ou com (N – 1). Em qualquer caso, quando N

1

3

1

4

1

00

1

2

3

4

5

22 23 24 25 26 27

Page 67: Analise Incerteza

Distribuição Norma ou de Gauss

56

∞, σx2 é a média do quadrado dos desvios (x

- x )2 . Assim, após algumas medições,

∫∞

∞−

−=σ dx)x(f)xx( 22x (5.16)

5.4. Distribuição normal Diferentes tipos de medições tem diferentes

distribuições limites. Nem todas as distribuições possuem a forma de sino mostrada na seção 5.2 (por exemplo, a distribuição de Poisson geralmente é assimétrica). Mesmo assim, a maioria das medições tem distribuição limite com uma curva simétrica com formato do sino. No capítulo 10 será provado que se uma medição é sujeita a muitas pequenas fontes de incerteza aleatória e com incerteza sistemática desprezível, os valores medidos serão distribuídos de acordo com uma curva com forma de sino e esta curva será centrada no valor verdadeiro de x, como na Fig. 5.7.

Se as medições tiverem incertezas sistemáticas significativas, a curva da distribuição não será centrada no valor verdadeiro. Incertezas aleatórias são igualmente prováveis de puxar as leituras acima e abaixo do valor verdadeiro. Se todas as incertezas forem aleatórias, após muitas medições o número de observações acima do valor verdadeiro será igual ao número de observações abaixo, e a distribuição dos resultados será centrada no valor verdadeiro. Mas uma incerteza sistemática (como causada pela fita esticada ou pelo cronômetro que atrasa) empurra todos os valores em uma direção e portanto empurra a distribuição dos valores observados fora do centro do valor verdadeiro. Neste capítulo, será assumido que a distribuição é centrada no valor verdadeiro. Isto é equivalente a assumir que todos as incertezas sistemáticas são reduzidas a um nível desprezível.

Fig. 5.7. A distribuição limite para uma medição

sujeita a muitas pequenas incertezas aleatórias . A distribuição tem forma de sino e é centrada no valor verdadeiro da quantidade medida x.

Agora, se volta a uma questão que foi

propositadamente evitada: o que é o valor verdadeiro de uma quantidade física? Esta

questão é complicada e não tem uma resposta simples e satisfatória. Como nenhuma medição pode determinar exatamente o valor verdadeiro de qualquer variável contínua (comprimento, tempo, massa, temperatura, corrente elétrica, pressão, analise), se o valor verdadeiro de tal quantidade existe não é mesmo claro. De qualquer modo, sempre se faz a hipótese conveniente de que cada quantidade física tenha um valor verdadeiro.

Pode-se pensar que o valor verdadeiro de uma quantidade é o valor para o qual o resultado se aproxima cada vez mais quando se aumenta o número de medições feitas com cuidado. Como tal, o valor verdadeiro é uma idealização similar às da matemática, como ponto sem tamanho, linha sem espessura. O valor verdadeiro, como o ponto ou linha, é uma idealização útil. Aqui, os valores verdadeiros das quantidades medidas x, y,..., z são expressas pelas suas letras maiúsculas correspondentes X, Y, ..., Z. Se as medições de x são sujeitas a muitas pequenas incertezas aleatórias, mas a incertezas sistemáticas desprezíveis, sua distribuição será uma curva simétrica, em forma de sino, centrada no valor verdadeiro X.

Fig. 5.8. A função de Gauss (5.17) tem forma de sino

e é centrada em x = 0. A curva do sino é larga se σ é grande e estreita se σ é pequeno. Embora por enquanto σ é visto como um parâmetro que caracteriza a largura da curva do sino, σ pode ser mostrado como a distância do centro da curva para o ponto onde a curvatura muda de direção. Esta distância é mostrada em dois pontos.

A função matemática que descreve a curva

forma de sino é chamada de função de Gauss ou distribuição normal. O seu protótipo é:

22 2/xe σ− (5.17)

onde σ é um parâmetro fixo, chamado de parâmetro largura. É importante ficar familiarizado com as propriedades desta função.

1. Quando x = 0, a função de Gauss é igual a 1.

2. A função é simétrica em relação a x = 0, porque tem o mesmo valor para x e –x

valor verdadeiro de x

σ grande σ pequeno

Page 68: Analise Incerteza

Distribuição Norma ou de Gauss

57

3. Quando x se afasta de zero em qualquer direção, x2/2σ2 aumenta, rapidamente se σ é pequeno, mais lentamente se σ é grande. Assim, quando x se afasta da origem, a função de Gauss decresce, tendendo para zero.

A aparência geral da função de Gauss (5.17) é como a mostrada na Fig. 5.8. O gráfico ilustra o nome parâmetro largura para σ porque a forma de sino é larga se σ for grande e estreita se σ é pequeno.

Fig. 5.9. A função de Gauss (5.18) tem forma de sino

e é centrada em x = X. A função de Gauss (5.17) é uma curva em

forma de sino, centrada em x = 0. Para obter uma curva em forma de sino centrada em x = X, simplesmente substitui x por (x – X), na eq. (5.17). Assim, a função

22 2/)Xx(e σ−− (5.18)

tem o mínimo em x = X e se desloca simetricamente para o lado x = X, como mostrado na Fig. 5.9.

A função (5.18) ainda não está em sua forma final para descrever uma distribuição limite porque qualquer distribuição deve ser normalizada, ou seja, deve satisfazer:

∫∞

∞−

= 1dx)x(f (5.19)

Para arranjar esta normalização, faz-se

22 2/)Xx(Ne)x(f σ−−= (5.20) (A multiplicação pelo fator N não muda o

formato da curva nem desloca o ponto de máximo de x = X). Deve-se escolher o fator de normalização N de modo que f(x) seja normalizado como em (5.19). Isto envolve alguma manipulação elementar de integrais (que será mostrada aqui e agora):

∫ ∫∞

∞−

σ−−∞

∞−

= dxeNdx)x(f22 2/)Xx( (5.21)

Resolvendo este tipo de integral, mudando

variáveis para simplificar (fazendo x – X = y e dx = dy), tem-se

∫∞

∞−

σ−= dyeN22 2/y (5.22)

Fazendo agora y/σ = z (em que dy = σdz),

∫∞

∞−

−= dzeN 2/z2 (5.23)

A ultima integral é uma das integrais

padrão da física matemática e cujo resultado encontra-se em qualquer bom livro de cálculo matemático,

π=∫∞

∞−

− 2dze 2/z2 (5.24)

Retornando a (5.21) e (5.23), tem-se

∫∞

∞−

πσ= 2Ndx)x(f

Como esta integral deve ser igual a 1, o

fator de normalização N fica

πσ=

21N

Com esta escolha para o fator de

normalização, chega-se à forma final para a função distribuição normal ou de Gauss, que é denotada pela GX,σ(x):

Distribuição normal ou de Gauss 22 2/)Xx(

,X e2

1)x(G σ−σ

πσ=

(5.25) A fórmula contém os índices X e σ para

indicar o centro e a largura da distribuição. A função GX,σ (x) descreve a distribuição limite de resultados em uma medição de uma quantidade x cujo valor verdadeiro é X, se a medição for sujeita apenas a incertezas aleatórias (com certezas sistemáticas desprezíveis). Medições cuja distribuição limite

Page 69: Analise Incerteza

Distribuição Norma ou de Gauss

58

é dada pela função de Gauss (5.25) são normalmente distribuídas.

Fig. 5.10. Duas distribuições de Gauss O significado do parâmetro largura σ será

explicado rapidamente. Já foi visto que um pequeno valor de σ dá uma distribuição com um pico estreito e alto, correspondendo a uma medição precisa, enquanto um grande valor de σ dá uma distribuição com pico largo e baixo, correspondendo a uma medição pouco precisa. A Fig. 5.10 mostra dois exemplos de distribuições de Gauss com diferentes pontos centrais X e larguras σ. O fator σ no denominador garante que uma distribuição mais estreita (σx menor) é automaticamente maior em seu centro, como deve ser para que a área total sob a curva seja igual a 1.

Probleminha rápido 5.3 Esquematizar a função de Gauss GX,σ(x)

para X = 10 e σx = 1. Usando uma calculadora, encontrar os valores em 10; 10,5; 11; 11,5; 12 e 12,5. Não é necessário calcular os valores para x < 10 porque sabe-se que a função é simétrica em relação a X = 10.

Resposta

Foi visto na seção 5.2 que o conhecimento da distribuição limite para uma medição permite o cálculo do valor médio esperado após várias medições. De acordo com (5.15), este valor esperado para a distribuição gaussiana f(x) = GX,σ(x) é

∫∞

∞−σ= dx)x(xGx ,X (5.26)

Antes de resolver esta equação, sabe-se que a sua resposta deve ser X, porque a simetria da função de Gauss em torno de X implica que alguns resultados cairão a igual distância, acima e abaixo, de x. Assim, a média deve ser X.

∫∞

∞−σ= dx)x(xGx ,X

∫∞

∞−

σ−−

πσ= dxxe

21 22 2/)Xx( (5.27)

Fazendo a mudança das variáveis y = x –

X, dx = dy e x = y + X, tem-se:

⎟⎟⎠

⎞⎜⎜⎝

⎛+

πσ= ∫ ∫

∞−

∞−

σ−σ− dyeXdyye2

1x2222 2/y2/y

(5.28) A primeira integral é exatamente zero,

porque a contribuição de qualquer ponto y é exatamente cancelada pela do ponto –y. A segunda integral é a normalizada, encontrada em (5.22) e tem o valor de πσ 2 . Esta integral

cancela com o πσ 2 do denominador e deixa apenas o X

Xx = (5.29)

após muitas medições. Em outras palavras: se as medições são distribuídas de acordo com a distribuição de Gauss GX,σ(x), então, após várias medições, o valor médio é o valor verdadeiro, onde a função de Gauss está centrada.

O resultado (5.29) é exatamente verdade somente se puder fazer infinitas medições. Na prática, quando se fazem muitas medições (número grande, porém finito), a média fica próxima de X.

Outra quantidade interessante para calcular é o desvio padrão σ, após uma grande quantidade de medições. De acordo com (5.16), esta quantidade vale:

∫∞

∞−σ−=σ dx)x(G)xx( ,X

22x (5.30)

Esta integral é resolvida facilmente.

Substitui-se x por X, fazem se as substituições x – X = y, y/σ = z e finalmente integra-se por partes para obter o resultado:

Page 70: Analise Incerteza

Distribuição Norma ou de Gauss

59

σx2 = σ2 (5.31)

O parâmetro largura σ da função de Gauss GX,σ(s) é o desvio padrão obtido após muitas medições. Isto acontece porque a letra σx é usada para o parâmetro largura e explica por que σ é geralmente chamado o desvio padrão da distribuição de Gauss GX,σ(s). Rigorosamente falando, porém, σ é o desvio padrão esperado somente após infinitas medições. Se são feitas medições de x em número finito (10 ou 20, por exemplo), o desvio padrão observado deve ser alguma aproximação de σx, mas não se tem razão em pensar que é exatamente igual a σx. A seção 5.5 mostrará o que significa e qual é o desvio padrão depois de um número finito de medições.

5.5. Desvio padrão como limite de confiança de 68%

A função distribuição limite f(x) de alguma quantidade x diz qual a probabilidade de se obter qualquer valor de x. Especificamente, a integral

∫b

a

dx)x(f

é a probabilidade que qualquer uma medição dê um resultado na faixa de a < x <b. Se a distribuição limite é a função de Gauss GX,σ(x), esta integral pode ser resolvida. Em particular, pode-se calcular a probabilidade que uma medição caia dentro de um desvio padrão σ do valor verdadeiro X. Esta probabilidade é:

Prob (dentro σ) = ∫σ+

σ−σ

X

X,X dx)x(G (5.32)

= ∫σ+

σ−

σ−−

πσ

X

X

2/)Xx( dxe2

1 22 (5.33)

Esta integral é ilustrada na Fig. 5.11. Ela

pode ser simplificada no modo familiar substituindo (x-X)/σ = z. Com esta substituição, dx = σdz e os limites de integração se tornam z = ±1. Assim,

Fig. 5.11. A área hachuriada entre X ± σ é a probabilidade de uma medição cair dentro de um desvio padrão de X.

Prob (dentro σ) = dze21 1

1

2/z2

∫−

π (5.34)

Igualmente, se poderia achar a

probabilidade de um resultado cair dentro de 2σ ou 1,5 σ de X. Mais geralmente, se poderia calcular Prov (dentro tσ) que significa a probabilidade para um resultado dentro tσ de X onde t é qualquer número positivo. Esta probabilidade é dada pela área na Fig. 5.12 e um cálculo idêntico a este levando a eq. (5.34) dá:

Prob (dentro tσ) = dze21 t

t

2/z2

∫−

π (5.35)

Fig. 5.12. A área hachuriada entre X ± tσ é a

probabilidade de uma medição cair dentro de t desvio padrão de X.

A integral da eq. (5.35) é uma integral

padrão da matemática e é geralmente chamada de função erro ou função incerteza ou integral do erro normal. Ela não pode ser resolvida analiticamente, mas pode ser calculada em um computador ou mesmo numa calculadora científica. A Fig. 5.13 mostra esta integral plotada como uma função de t e tabula alguns valores. Uma tabulação mais completa pode ser encontrada na literatura especializada ou no Apêndice A.

Page 71: Analise Incerteza

Distribuição Norma ou de Gauss

60

t 0 0,25 0,5 0,75 1,0 1,25 1,50 2,0

P(%) 0 20 38 55 68 79 87 95,4

Fig. 5.13. A probabilidade Prob(dentro tσ) que é uma

medição de x caia dentro t desvios padrão do valor verdadeiro x = X.

Nota-se da Fig. 5.13 que a probabilidade de

uma medição cair dentro de um desvio padrão do valor verdadeiro é 68%, como antecipado no capítulo 4. Se o desvio padrão das medições é reportado como a incerteza, ou seja, xestimado ± δx e se toma δx = σ , então pode se estar 68% confiante que se está dentro σ do resultado correto.

Pode-se ver na Fig. 5.11 que a probabilidade Prob(dentro tσ) se aproxima rapidamente (exponencialmente) de 100%, quando t aumenta. A probabilidade que uma medição caia dentro 2σ é 95,4% e para 3σ é 99,7%. Colocando estes resultados de outro modo: a probabilidade que uma medição caia fora de um desvio padrão é grande (32%), que a medição caia fora de 2σ é pequena (4,6%) e que caia fora de 3σ é muito pequena (0,3%).

Obviamente, nada é sagrado com relação ao número 68%, apenas acontece ser a confiança associada com o desvio padrão σ. Uma alternativa ao desvio padrão é o erro provável (EP) e definido como a distância para a qual há uma probabilidade de 50% de uma medição cair entre X ± EP. A Fig. 5.13 mostra que, para uma medição normalmente distribuída, o erro provável é

EP ≅ 0,67 σ Alguns metrologistas cotam o erro provável

como a incerteza em suas medições. Porém, o desvio padrão σx é a escolha mais popular por causa da simplicidade de suas propriedades.

Probleminha rápido 5.4. As medições de uma dada distância x são

distribuídas normalmente com X = 10 e σx = 2. (a) Qual é a probabilidade que uma medição isolada caia dentro x = 7 e x = 13. (b) Qual é a probabilidade que ela caia fora da faixa de x = 7 e x = 13?

Resp.:

(a) entre 7 e 13: 87% (corresponde a 1,5 σ) (b) menor que 7 e maior que 13: 13%

5.6. Justificativa da média como melhor estimativa

As três ultimas seções discutiram a distribuição limite f(x), a distribuição obtida de um número infinito de medições de uma quantidade x. Se f(x) fosse conhecida, se calcularia a média x e o desvio padrão σ obtido após um número muito grande de medições e, no mínimo para a distribuição normal, poderia se conhecer o valor verdadeiro X. Infelizmente, nunca se conhece a distribuição limite. Na prática, tem-se um número finito N de valores medidos (5, 10 ou talvez 50),

x1, x2, ..., xN

e o problema é chegar à melhor estimativa de X e σ baseado nestes N valores medidos.

Se as medições seguem uma distribuição normal GX,σ(x) e já se conhecem os parâmetros X e σ, pode-se calcular a probabilidade de se obter os valores x1, x2, ..., xN que foram realmente obtidos. Assim, a probabilidade de se ter uma indicação próxima de x1, em um pequeno intervalo dx1 é:

Prob(x entre x1 e x1 + dx1) =

= 12/)Xx( dxe

21 22

1 σ−−

πσ

Na prática, se está interessado no tamanho

do intervalo dx1 (ou o fator π2 ), de modo que a equação pode ser abreviada para:

Prob(x1) = 22

1 2/)Xx(e1 σ−−

σ (5.36)

A eq. (5.36) se refere à probabilidade de se

obter o valor x1, embora rigorosamente seja a

Page 72: Analise Incerteza

Distribuição Norma ou de Gauss

61

probabilidade de se obter um valor no intervalo próximo de x1.

A probabilidade de se obter a segunda indicação x2 é

Prob(x2) = 22

2 2/)Xx(e1 σ−−

σ (5.37)

e do mesmo modo,

Prob(xN) = 22

N 2/)Xx(e1 σ−−

σ (5.38)

As eq. (5.36) até (5.38) dão as

probabilidades de se obter cada uma das medições x1, x2, ..., xN calculadas em termos da distribuição limite assumida GX,σ(x) . A probabilidade que se observe o conjunto inteiro de N medições é o produto destas probabilidades separadas.

ProbX,σ(x1,...,xN) α 22

i 2/)Xx(N e1 σ−−∑

σ (5.39)

Entender o significado das várias

quantidades em (5.39) é muito importante. 1. Os números x1, x2, ..., xN são

conhecidos e fixos. 2. A quantidade ProbX,σ(x1,...,xN) é a

probabilidade de se obter os N resultados x1, x2, ..., xN, calculados em termos de X e σ, (o valor verdadeiro de x e o parâmetro largura desta distribuição).

3. Os números X e σ não são conhecidos e se quer achar as melhores estimativas para X e σ baseando-se nas medições feitas x1, x2, ..., xN.

4. Os índices X e σ são colocados na probabilidade (5.39) para enfatizar que ela depende dos valores desconhecidos X e σ.

Como os valores reais de X e σ são desconhecidos, pode-se imaginar os valores X’ e σ‘ e usar estes valores imaginados para computar a probabilidade ProbX’,σ’(x1,...,xN). Se são imaginados outros números novos, X” e σ“ e encontrado que a probabilidade correspondente ProbX”,σ”(x1,..., xN) é maior, deve-se tomar os novos valores X” e σ“ como melhores estimativas para X e σ. Continuando deste modo, pode-se imaginar a procura de valores de X e σ que façam ProbX,σ(x1,...,xN) tão grande quanto possível e estes valores são considerados como as melhores estimativas para X e σ.

Este procedimento plausível para achar as melhores estimativas para X e σx é chamado de princípio da máxima probabilidade. Ele pode ser resumido do seguinte modo:

Dadas N medições feitas x1, x2, ..., xN, as melhores estimativas para X e σ são os valores para os quais os valores observados x1, x2, ..., xN são mais prováveis. As melhores estimativas para X e σ são aqueles valores para os quais ProbX,σ(x1,...,xN) é máxima, dado que aqui

ProbX,σ(x1,...,xN) α 22

i 2/)Xx(N e1 σ−−∑

σ (5.40)

Usando este princípio, pode-se encontrar

facilmente a melhor estimativa para o valor verdadeiro X. Obviamente, (5.40) é máxima se a soma no expoente é mínima. Assim, a melhor estimativa para X é o valor de X para que

∑=

σ−N

1i

22i /)Xx(

seja mínima. Para localizar este mínimo, deriva-se a expressão com relação a X e iguala a derivada a zero, dando:

∑=

=−N

1ii 0)Xx(

ou

melhor estimativa para X = N

xi∑ (5.42)

Ou seja, a melhor estimativa para o valor verdadeiro X é a média aritmética das N medições, x = Σxi/N, um resultado que já tinha sido assumido sem prova, desde o Capítulo 1.

Achar a melhor estimativa para σ, largura da distribuição limite, é um pouco mais difícil, porque a probabilidade (5.40) é uma função mais complicada de σ. Deve-se diferenciar (5.40) com relação a σ e fazer a derivada igual a zero. Este valor dá o valor de σ que maximiza (5.40) e que é a melhor estimativa para σ, como:

melhor estimativa de σ = ∑=

−N

1i

2i )Xx(

N1

(5.43) O valor verdadeiro X é desconhecido.

Assim, na prática, substitui-se X na (5.43) pela melhor estimativa de X, que é a média. Esta substituição fornece a estimativa:

Page 73: Analise Incerteza

Distribuição Norma ou de Gauss

62

σ = ∑=

−N

1i

2i )xx(

N1 (5.44)

A melhor estimativa para a largura σ de

uma distribuição limite é o desvio padrão de N medições observadas x1, x2, ..., xN, como originalmente definido em (4.6)

Pode-se ficar surpreso que a estimativa (5.44) seja a mesma que a definição original (4.6), usando N, do desvio padrão, em vez da definição melhorada, usando (N-1). A melhor estimativa (5.43) envolve o valor verdadeiro X, enquanto em (5.44) X foi substituído por x (melhor estimativa de X). Agora, estes números geralmente não são iguais e pode ver facilmente que (5.44) é sempre menor ou igual a (5.43). [Considerando-se (5.43) como uma função de X e como esta função é mínima em X = x , (5.44) sempre será menor ou igual a (5.43)]. Assim, passando de (5.43) para (5.44), está se subestimando de modo consistente a largura σ. O Apêndice E mostra que esta subestimativa é corrigida, substituindo o denominador N em (5.44) por (N – 1). Ou seja, a melhor estimativa para a largura σ é precisamente o desvio padrão melhorado ou da amostra dos valores medidos x1, x2, ..., xN, com (N – 1) no denominador.

melhor estimativa de σ = ∑=

−−

N

1i

2i )Xx(

1N1

(5.45) Agora é hora de se fazer algumas revisões: Se as medições de x são sujeitas somente

a incertezas aleatórias, sua distribuição limite é a função de Gauss, GX,σ(x) centrada no valor verdadeiro X e com largura σ. A largura σ é o limite de confiança de 68%, em que há uma probabilidade que qualquer medição irá cair dentro uma distância σ do valor verdadeiro X. Na prática, nem X e nem σ é conhecido. Em vez disso, conhecem-se os N valores medidos x1, x2, ..., xN, onde N é tão grande quanto a paciência e o tempo o permitirem. Baseando-se nestes N valores medidos, a melhor estimativa do valor verdadeiro X tem sido mostrado ser a média x = Σxi/N e a melhor estimativa para a largura σ é o desvio padrão de x1, x2, ..., xN, como definido em (5.45).

Duas questões adicionais aparecem: 1. Qual é a incerteza em x como uma

estimativa do valor verdadeiro de X? Esta questão será discutida na seção 5.7, onde a incerteza em x será mostrada ser o desvio padrão da média, como definido no capítulo 4.

2. Qual é a incerteza em σx como uma estimativa da largura verdadeira σ. A fórmula para esta incerteza na incerteza ou desvio padrão do desvio padrão é derivada no Apêndice E. O resultado prova que há uma incerteza relativa em σx

)1N(21

x

x

−=

σδσ

(5.46)

Este resultado mostra claramente a

necessidade de medições numerosas, antes que a incerteza seja conhecida com confiança. Por exemplo, com apenas 3 medições de uma quantidade (N = 3), o resultado (5.46) implica que o desvio padrão é 50% incerto.

Probleminha rápido 5.5. Para testar a confiabilidade de um

galvanômetro balístico, descarrega se um capacitor (carregado em uma tensão fixa) através do galvanômetro, três vezes e mede se a carga resultante, q, em μC. Destas três medições, calcula se o desvio padrão, que vale σq = 6 μC. Usando (5.46),

(a) achar a incerteza δσq neste parâmetro. (b) O valor verdadeiro do desvio padrão

poderia facilmente ser tão pequeno quanto σq - δσq ou tão grande quanto σq + δσq . Quais são estes dois valores para esta experiência? (Notar bem que a confiabilidade é σq somente após três medições).

Resp.:

(a) σq = 6 ± 3 μC e δσx = ½ (b) σq – dq = 3 μC e σq + dq = 9 μC

5.7. Justificativa da soma quadrática Voltando-se ao assunto do Capítulo 3,

propagação das incertezas, lá foi estabelecido, sem prova formal, que quando as incertezas são aleatórias e independentes, elas podem ser combinadas em soma quadrática, de acordo com regras padrão, ou com regras simples em (3.16) e (3.18) ou a regra geral em (3.47), que inclui as regras simples como casos especiais. O uso da soma quadrática pode agora ser justificado.

O problema da propagação das incertezas aparece quando se medem uma ou mais quantidades, x, y, ..., z, todas com incertezas e então se usam os valores medidos para calcular alguma quantidade q(x, y, ..., z). A principal questão é, obviamente, decidir qual a

Page 74: Analise Incerteza

Distribuição Norma ou de Gauss

63

incerteza no resultado de q. Se as quantidades x, y, ..., z são sujeitas apenas a incertezas aleatórias, elas serão normalmente distribuídas com parâmetros de largura σx, σy, ..., σz , que são tomados como as incertezas associadas com qualquer medição isolada das quantidades correspondentes. A questão a ser decidida agora é esta: conhecendo se as distribuições das medições de x, y, ..., z, o que pode se dizer acerca da distribuição dos valores para q? Em particular, qual será a largura da distribuição de valores de q? Esta questão é respondida em quatro etapas, numeradas de I a IV.

I. Quantidade medida mais número fixo Primeiro, sejam dois casos especiais

simples. Seja uma quantidade medida x e usada para calcular a quantidade

q = x + A (5.47)

onde A é um número fixo sem incerteza (tal como A = 2 ou A = π). Sejam também as medições de x distribuídas normalmente em torno do valor verdadeiro X, com largura σx, como na Fig. 5.14 (a). Assim, a probabilidade de se obter qualquer valor x (em um pequeno intervalo dx) é Gx,σ(x)dx ou probabilidade de obter valor x α

2x

2 2/)Xx(e σ−− (5.48)

Fig. 5.14. Se os valores medidos de x são

normalmente distribuídos com centro em x = X e largura σx , os valores calculados de q = x + A (com A fixo e conhecido) serão normalmente distribuídos com centro em q = x + A e com a mesma largura σx.

O problema é deduzir a probabilidade de se

obter qualquer valor q da quantidade definida por (5.47). Agora, de (5.47) se vê que x = q – A e assim que

probabilidade de obter valor q = probabilidade de obter x = q – A

A segunda probabilidade é dada por (5.48)

e a probabilidade de obter valor q α 2x

2 2/)X)Aq[(e σ−−− α

2x

2 2/)]AX(q[e σ+−− (5.49)

O resultado (5.49) mostra que os valores calculados de q são normalmente distribuídos e centrados no valor X + A, com largura σx, como mostrado na Fig. 5.14 (b). Em particular, a incerteza em q é a mesma (ou seja, σx) da incerteza em x, justo como a regra (3.16) havia previsto.

II. Quantidade medida vezes número fixo Como um segundo exemplo simples, seja a

medição x e o cálculo da quantidade q = Bx

onde B é um número fixo (como B = 2 ou B = π). Se as medições de x são normalmente distribuídas, então, raciocinando como antes, conclui-se que:

probabilidade de obter valor q = probabilidade de obter x = q/B

α ⎥⎥⎦

⎢⎢⎣

⎡σ⎟

⎠⎞

⎜⎝⎛ −− 2

x

2

2/XBqexp

= ]B2/)BXq(exp[ 2

x22 σ−− (5.50)

Em outras palavras, os valores de

q = Bx serão normalmente distribuídos, com centro em q = BX e largura Bσx , com mostrado na Fig. 5.15. em particular a incerteza em q = Bx é B vezes a incerteza em x, justo como a regra (3.18) já previa.

Fig. 5.15. Se os valores medidos de x são

normalmente distribuídos com centro em x = X e largura �x , os valores calculados de q = Bx (com B fixo e conhecido)

(a)

(b)

largura σx

largura σx

medida

calculada

(a)

(b)

largura σx

largura σx

medida

calculada

Page 75: Analise Incerteza

Distribuição Norma ou de Gauss

64

serão normalmente distribuídos com centro em q = Bx e com a largura B�x.

III. Soma de duas quantidades medidas Como um primeiro exemplo não trivial de

propagação de incerteza, seja a medição de duas quantidades independentes x e y e o cálculo de sua soma x + y. Por hipótese, as medições de x e y são normalmente distribuídas em torno de seus valores verdadeiros X e Y, com larguras σx e σy , como na Fig. 5.16 (a). e se tenta achar a distribuição dos valores calculados de x + y. Será encontrado que os valores de x + y são normalmente distribuídos, que eu centro é o valor verdadeiro X + Y e que a largura de sua distribuição é

2y

2x σ+σ

como na Fig. 5.16 (c). Em particular, este resultado justifica a regra do capítulo 3 que diz se x e y são sujeitas apenas a incertezas aleatórias e independentes, então e a incerteza em x + y é a raiz quadrada da soma dos quadrados das incertezas separadas em x e y. Fig. 5.16. Se as medições de x e y são independentes e normalmente distribuídas com centros X e Y e larguras σx e σx, então os valores calculados de x + y são normalmente distribuídos com centro em X + Y e com largura 2

y2x σ+σ

Para simplificar a álgebra, assume-se a priori que os valores verdadeiros X e Y são ambos iguais a zero. Neste caso, a probabilidade de ter qualquer valor particular de x é

Prob(x) α ⎟⎟⎠

⎞⎜⎜⎝

⎛σ

−2x

2

2xexp (5.51)

e a de y é

Prob(y) α ⎟⎟⎠

⎞⎜⎜⎝

σ−

2y

2

2yexp (5.52)

O problema é calcular a probabilidade de

se obter qualquer valor particular de x + y. Primeiro se observa que, como x e y medidos independentemente, a probabilidade de obter qualquer valor x e qualquer valor y é justo o produto de (5.51) e (5.52), ou seja:

Prob(x,y) α ⎥⎥⎦

⎢⎢⎣

⎡⎟⎟⎠

⎞⎜⎜⎝

σ+

σ− 2

y

2

2x

2 yx21exp (5.53)

Conhecendo se a probabilidade de se obter

qualquer x e qualquer y, pode se então calcular a probabilidade para qualquer valor de x + y. O primeiro passo é reescrever o expoente em (5.53) tem termos da variável de interesse, x + y. Este passo pode ser feito usando a identidade que pode ser facilmente verificada:

)BA(AB)AyBx(

BA)yx(

By

Ax 2222

++

++

+=+ (5.54)

= 22

zBA)yx(

++

+ (5.55)

Na eq. (5.55) foi introduzida a abreviação z2

para o segundo termo da eq. (5.54) porque seu valor não interessa.

Se substituirmos (5.55) em (5.53), trocando A por σx

2 e B por σy2, tem-se

Prob(x,y) α ⎥⎥⎦

⎢⎢⎣

⎡−

σ+σ+

−2z

)(2)yx(exp

2

2y

2x

2

(5.56)

Esta probabilidade para obter determinados

valores de x e y pode ser vista a probabilidade de obter determinados valores de x + y e z. Assim, pode-se reescrever (5.56) como

Prob(x,y) α ⎥⎦

⎤⎢⎣

⎡ −

⎥⎥⎦

⎢⎢⎣

σ+σ+

−2zexp

)(2)yx(exp

2

2y

2x

2

(5.57) Finalmente, o que se quer é a

probabilidade de obter um determinado valor de x + y, independente do valor de z. Esta probabilidade é obtida, somando ou melhor, integrando (5.57) sobre todos os valores possíveis de z, ou seja:

Prob (x + y) = ∫∞

∞−

+ dz)z,yx(obPr (5.58)

σx σx

(a) (b)

(c)

Page 76: Analise Incerteza

Distribuição Norma ou de Gauss

65

Quando se integra (5.57) com relação a z,

a integral do fator exp(-z2/2) vale π2 e se tem

Prob(x + y) α ⎥⎥⎦

⎢⎢⎣

σ+σ+

−)(2

)yx(exp 2y

2x

2

(5.59)

Este resultado mostra que os valores de (x

+ y) são normalmente distribuídos com largura 2y

2x σ+σ , como antecipado. A prova é completa para o caso quando os

valores verdadeiros de x e y são ambos zero, ou seja, X = 0 e Y = 0. Se X e Y são ambos não-zero, pode-se fazer o seguinte. Primeiro escreve

x + y = (x – X) + (y – Y) + (X + Y) (5.60)

Em (5.60), os dois primeiros termos são

centrados em zero, com larguras σx e σy, pelo resultado do passo I. Pela eq. (5.59), a soma dos dois primeiros termos é normalmente distribuída com largura 2

y2x σ+σ . O terceiro

termo em (5.60) é um número fixo, portanto, pelo resultado ainda do passo I, ele simplesmente desloca o centro da distribuição para (X + Y) mas deixa a mesma largura. Em outras palavras, os valores de (x + y) como dado por (5.60) são normalmente distribuídos em torno de (X + Y) com largura 2

y2x σ+σ .

Este é o resultado que se queria.

IV. Caso geral Tendo justificado a fórmula da propagação

da incerteza para o caso especial de uma soma (x + y), pode-se justificar a fórmula geral para a propagação da incerteza de modo surpreendentemente simples. Sejam duas quantidades independentes x e y, cujos valores medidos são normalmente distribuídos e agora se quer calcular a quantidade q(x,y) em termos de x e y. A distribuição dos valores de q(x,y) é facilmente encontrada, usando-se os resultados dos passos I, II e III, como segue.

Inicialmente, as larguras σx e σy (incertezas em x e y) devem ser, como sempre, pequenas. Esta exigência significa que está se tratando apenas com valores de x próximos de X e de y próximos de Y e se pode usar a aproximação (3.42) para escrever:

)Yy(yq)Xx(

xq)Y,X(q)y,x(q −

∂∂

+−∂∂

+≈ (5.61)

Esta aproximação é boa porque os únicos

valores de x e y que ocorrem significativamente

estão próximos de X e Y. As duas derivadas parciais são resolvidas em X e Y e são, portanto, números fixos.

A aproximação (5.61) expressa a quantidade desejada q(x,y) como a soma de três termos:

1. q(X,Y) é um número fixo, que simplesmente desloca a distribuição dos resultados

2. ∂q/∂x(x – X) cuja distribuição tem largura σx, com valores centrados em zero e largura (∂q/∂x)σx

3. ∂q/∂y(y – Y) cuja distribuição tem largura σy, com valores centrados em zero e largura (∂q/∂y)σy

Combinando os três termos em (5.61) e invocando os resultados já obtidos, conclui-se que os valores de q(x,y) são normalmente distribuídos em volta do valor verdadeiro (X,Y) com largura

2

y

2

xq yq

xq

⎟⎟⎠

⎞⎜⎜⎝

⎛σ

∂∂

+⎟⎠⎞

⎜⎝⎛ σ

∂∂

=σ (5.62)

Se os desvios padrão σx e σx são

identificados como as incertezas em x e y, o resultado (5.62) é precisamente a regra (3.47) para a propagação de incertezas aleatórias, para o caso quando q é uma função de apenas duas variáveis, q(x,y). Quando q depende de muitas variáveis, q(x,y,...,z), o argumento anterior pode ser estendido imediatamente para estabelecer a regra geral (3.47) para funções de muitas variáveis. Como as regras do Capítulo 3 relacionadas com a propagação de incertezas aleatórias podem ser derivadas de (3.47), todas elas são agora justificadas.

5.8. Desvio padrão da média Mais um resultado importante mostrado no

Capítulo 4 precisa ser provada. Este resultado se relaciona com o desvio padrão da média

xσ . Foi provado na seção (5.5) que se são feitas N medições x1, x2, ..., xN de uma quantidade x, normalmente distribuída, a melhor estimativa do valor verdadeiro X é a média x de x1, x2, ..., xN. No capítulo 4, foi estabelecido que a incerteza nesta estimativa é o desvio padrão da média,

Nx

x

σ=σ (5.63)

Sejam as medições de x normalmente

distribuídas em torno do valor verdadeiro X com parâmetro largura σx. Agora se quer conhecer a confiabilidade da média das N

Page 77: Analise Incerteza

Distribuição Norma ou de Gauss

66

medições. Para responder isto, o que se faz naturalmente é repetir as N medições muitas vezes. Ou seja, faz-se uma seqüência de experimentos, em cada um se fazem N medições e calcula se a média. Deve-se agora achar a distribuição destas muitas determinações da média das N medições.

Em cada experimento se medem as N quantidades x1, x2, ..., xN, e então se calcula x :

Nx...xxx N21 +++

= (5.64)

Como a quantidade calculada x é uma

função simples das quantidades medidas x1, x2, ..., xN, pode-se achar a distribuição dos resultados de x , usando a fórmula da propagação da incerteza. A única característica incomum da função (5.64) é que todas as medições x1, x2, ..., xN são medições da mesma quantidade, com o mesmo valor verdadeiro X e com a mesma largura σx.

Há várias observações interessantes: 1. Como cada quantidade medida x1, x2,

..., xN é normalmente distribuída, a função x dada por (5.64) é também normalmente distribuída.

2. O valor verdadeiro para cada x1, x2, ..., xN é X, de modo que o valor verdadeiro x como dado por (5.64) é

XN

X...XX=

+++

Assim, depois de fazer muitas

determinações da média x das N medições, os muitos resultados para x serão normalmente distribuídos em torno do valor verdadeiro X. A única questão que fica, muito importante, é encontrar a largura da distribuição dos resultados. De acordo com a fórmula de propagação da incerteza (5.62), reescrita para N variáveis, esta largura é

2

xNN

2

2x2

2

1x1

x xx...

xx

xx

⎟⎟⎠

⎞⎜⎜⎝

⎛σ

∂∂

++⎟⎟⎠

⎞⎜⎜⎝

⎛σ

∂∂

+⎟⎟⎠

⎞⎜⎜⎝

⎛σ

∂∂

(5.65) Como x1, x2, ..., xN, são todas medições da

mesma quantidade x, suas larguras são iguais entre si e a σx,

σx1 = σx2 = ... = σxN = σx Vê-se também de (5.64) que todas as

derivadas parciais em (5.65) são iguais:

N1

xx...

xx

xx

N21

=∂∂

==∂∂

=∂∂

Assim, (5.65) se reduz a

2

x

2

xx N1...

N1

⎟⎠⎞

⎜⎝⎛ σ++⎟

⎠⎞

⎜⎝⎛ σ=σ

NNN x

2

2x σ

=σ (5.66)

como se queria demonstrar.

Chegou-se ao resultado desejado (5.66) tão rapidamente que provavelmente é conveniente rever seu significado. Se imaginou um grande número de experimentos, em cada um se fazendo N medições de x e então calculou-se a média x destas N medições. Foi mostrado que, após repetir este experimento muitas vezes,

1. os muitos resultados para x serão normalmente distribuídos,

2. eles serão centrados no valor verdadeiro X

3. a largura de sua distribuição é N/xx σ=σ

4. esta largura xσ é o limite de confiança de 68% para o experimento

5. se foi achada a média de N medições uma vez, pode-se ficar 68% de confiança que o resultado cai dentro de uma distância xσ do valor verdadeiro X

6. este resultado é exatamente o que deveria significar a incerteza na média.

7. ele também explica claramente por que esta incerteza é chamada de desvio padrão da média.

Com esta prova simples e elegante, todos os resultados apresentados nos capítulos anteriores referentes a incertezas aleatórias foram justificados.

Page 78: Analise Incerteza

Distribuição Norma ou de Gauss

67

Fig. 5.17. As medições individuais de x são

normalmente distribuídas em torno de X com largura σx (curva pontilhada). Se é usado o mesmo instrumento para fazer muitas determinações da média de 10 medições, o resultado x será normalmente distribuído em torno de X com largura 10/xx σ=σ .

5.9. Aceitação de um resultado medido Voltando a duas questões já levantadas

mas não completamente respondidas no Capítulo 2:

1. qual é o significado da afirmação que se está razoavelmente confiante que uma quantidade medida caia na faixa xestimado ± δx ?

2. quando se compara o valor xestimado com um valor esperado xesperado (baseado em uma teoria ou em valor nominal ou em alguma outra medição), como se pode decidir se a diferença entre ambos é aceitável ou não?

Para a primeira questão, a resposta agora é clara: se uma medida x é feita várias vezes, como geralmente acontece, a média x é a melhor estimativa para x e o desvio padrão da média é uma boa medição de sua incerteza. O resultado final

valor de x = x ± xσ

significa que, baseando se nas medições, se espera com 68% de confiança, que qualquer medição de x, feita do mesmo modo, caia na faixa x ± xσ .

Poderia se escolher outro modo para caracterizar a incerteza; por exemplo, escrevendo o resultado como

valor de x = x ± 2 xσ

Agora, se espera com 95% de confiança

que qualquer medição de x caia nesta faixa maior. Claramente, o ponto essencial em reportar qualquer valor medido é estabelecer uma faixa (ou incerteza) e o nível de confiança

correspondente a esta faixa. A escolha mais comum é dar um desvio padrão do resultado, com o limite de confiança de 68%. Menos comum, porém também usado, é dar o resultado com dois desvios padrão, correspondendo a um limite de confiança de 95%. Também é possível encontrar resultados com três desvios padrão, correspondendo a um limite de confiança de 99,7%. De qualquer modo, sempre deve-se informar claramente a incerteza e o limite de confiança correspondente.

Como enfatizado no Capítulo 2, quase todas as conclusões experimentais envolvem a comparação de dois ou mais números. Com a teoria estatística, pode-se dar agora um significado quantitativo a muitas tais comparações. Aqui será considerado apenas um tipo de experiência, em que se chega a um número e se compara este resultado com algum resultado conhecido esperado. Por exemplo, na experiência de verificar a conservação de momento, pode-se medir os momentos inicial e final, p e p’, verificar que p = p’ (dentro de incertezas), mas pode-se igualmente considerar a experiência de achar um valor para (p – p’) e comparar esta diferença com o valor esperado zero. Geralmente, quando se quer comparar duas medições que são supostas iguais, pode-se formar sua diferença e comparar a diferença com o valor esperado zero. Qualquer experiência que envolva uma quantidade medida (como a aceleração da gravidade, g) para a qual se conhece o valor aceito com precisão, é também deste tipo e o resultado esperado é o valor conhecido aceito.

Seja o metrologista que mede alguma quantidade x (como a diferença de dois momentos que devem ser supostamente iguais) na forma:

valor de x = xestimado ± σ

onde σ denota o desvio padrão de seu resultado (que poderia ser o desvio padrão da média, se xestimado fosse a média de várias medições). Agora se quer comparar este resultado com o resultado esperado xesperado.

No Capítulo 2 foi dito que se a discrepância |xestimado – xesperado| fosse menor ou apenas pouco maior que σ, então o resultado era considerado satisfatório, mas se |xestimado – xesperado| fosse muito maior que σ, o resultado era insatisfatório. Estes critérios são corretos até certo ponto, mas eles não dão uma medida quantitativa de quão boa ou má é a discrepância. Os critérios também não dizem onde estabelecer os limites de aceitação. Qual a discrepância satisfatória: 1,5 σ ou 2 σ ?

largura

largura

Page 79: Analise Incerteza

Distribuição Norma ou de Gauss

68

Pode se responder a estas questões, agora, desde que as medições do metrologistas sejam governadas pela distribuição normal, como é certamente razoável supor. Pode-se começar fazendo duas hipóteses acerca desta distribuição:

1. a distribuição é centrada no resultado esperado xesperado

2. o parâmetro largura da distribuição é igual à estimativa σ do metrologista.

A hipótese (1) é o que o metrologista espera ser a verdade. Ele assume que todas as incertezas sistemáticas sejam reduzidas a um nível desprezível, para que a distribuição seja centrada no valor verdadeiro e que o valor esperado seja realmente xesperado, de modo que há razão para esperar que o xesperado seja correto.

A hipótese (2) é uma aproximação porque σ deve ter sido uma estimativa do desvio padrão, mas é uma aproximação razoável, se o número de medições em que σ se baseia é grande. Tomadas juntas, as duas hipóteses são iguais, assumindo que os procedimentos e cálculos estejam corretos.

Está se julgando se é razoável ou não o resultado da medição, xestimado, comparando a diferença |xestimado – xestimado| com σ (estimativa da largura da distribuição normal correspondente). Se o número de medições em que σ foi baseado é pequeno, esta estimativa pode ser pouco confiável e o nível de confiança correspondente é impreciso (embora ainda seja um guia superficial útil). Com um pequeno número de medições, o cálculo preciso dos limites de confiança requer o uso da chamada distribuição de Student, t.

Deve-se decidir agora se xestimado é um valor razoável de se obter e se as hipóteses foram corretas. Se a resposta for sim, não há razão para duvidar da hipótese e tudo está bem. Se a resposta for não, a hipótese deve ser questionada e o metrologista deve examinar a possibilidade de

1. engano nas medições 2. engano nos cálculos 3. existência de erros sistemáticos 4. resultado esperado xesperado incorreto Primeiro se determina a discrepância,

|xestimado – xesperado| e então

σ

−= esperadoestimado xx

t (5.67)

número de desvios padrão pelo qual xestimado difere de xesperado . (Aqui, σ denota o desvio padrão apropriado para xestimado. Se xestimado é a média de várias medições, então σ é o desvio padrão da média). Depois, da tabela da integral

do erro normal no Apêndice A, pode-se achar a probabilidade de se obter um resultado que difira de xesperado por t ou mais desvios padrão, satisfeitas as hipóteses. Esta probabilidade vale

Prob (fora tσ) = 1 – Prob (dentro tσ) (5.68)

Se esta probabilidade é grande, a

discrepância |xestimado – xesperado | é perfeitamente razoável e o resultado xestimado é aceitável. Se a probabilidade em (5.68) é pequena, a discrepância é julgada significativa, ou seja inaceitável. E o nosso infeliz metrologista deve pesquisar o que deu errado.

Seja, por exemplo, a discrepância |xestimado – xesperado | igual a um desvio padrão. A probabilidade de uma discrepância igual ou maior que um desvio padrão é igual ao familiar 32% (100 – 68%). Claramente, uma discrepância de um desvio padrão é muito provável de ocorrer e é, portanto, insignificante. No extremo oposto, a probabilidade Prob(fora 3σ) é justo 0,3% e, se as hipóteses estiverem corretas, uma discrepância de 3σ é muito pouco provável. Em outras palavras, se a discrepância é 3σ, as hipóteses são pouco provavelmente corretas.

Os limites entre aceitação e não aceitação dependem do nível abaixo do qual se julga uma discrepância de ser razoavelmente improvável. Este nível é uma questão de opinião, a ser decidida pelo experimentador. Muitos metrologistas consideram 5% como um limite correto para improbabilidade não razoável. Se é aceita desta escolha, então uma discrepância de 2σ seria inaceitável, porque Prob(fora 2σ) = 4,6% (100 – 95,4%). De fato, da tabela do Apêndice A, vê-se que qualquer discrepância maior do que 1,96σ é inaceitável ao nível de 5% e discrepâncias de tal ordem são chamadas de significativas. Analogamente, ao nível de 1%, qualquer discrepância maior que 2,58σ seria inaceitável e discrepâncias desta ordem são consideradas altamente significativas.

Probleminha rápido 5.6 Mede se a carga do elétron e e nota se que

o melhor resultado é 2,4 desvios padrão afastado do valor esperado. Esta discrepância é significativa a 5%? E a 2? E a 1%?

Resp.: Prob (fora 2,4 σ) = 1,64%. Assim, discrepância de 2,4 σ é

significativa ao nível de 5% e 2% mas não o é para 1%.

Page 80: Analise Incerteza

Distribuição Norma ou de Gauss

69

Ainda não se tem uma resposta definitiva que um certo valor medido xestimado seja aceitável ou não. A teoria da distribuição normal, porém, fornece uma medida clara e quantitativa se um determinado resultado é razoável ou não, que é o melhor que se pode esperar.

Muitos metrologistas não gastam tempo debatendo precisamente onde está o limite de aceitação. Se a discrepância é menor que 2σ (por exemplo 1,8 σ), então, para quase qualquer padrão, o resultado é julgado razoável. Se a discrepância é apreciavelmente muito maior que 2,5σ, então por qualquer padrão, ela é inaceitável. Se a discrepância cai em uma região cinza, entre 1,9 σ e 2,6 σ, a experiência é simplesmente inconclusiva. Se a experiência é suficientemente importante, como o teste de uma nova teoria, é necessário repeti-la, preferivelmente com melhores técnicas, até que seja obtido um resultado conclusivo.

Page 81: Analise Incerteza

Distribuição Norma ou de Gauss

70

Principais Definições e Equações do Capítulo 5

Distribuições limites Se f(x) é uma distribuição limite para a

medição de uma variável contínua x, então

f(x)dx = fração da medição que cai entre x e x + dx

e

∫b

a

dx)x(f = probabilidade que qualquer uma

medição dê um resultado entre x = a e x = b. [Ver (5.12)]

A condição de normalização é

∫∞

∞−

= 1dx)x(f [Ver (5.13)]

O valor médio de x esperado após muitas medições é

∫∞

∞−

= dx)x(xfx [Ver (5.15)]

Distribuição normal ou de Gauss Se medições de x são sujeitas a muitas

pequenas incertezas aleatórias mas a incertezas sistemáticas desprezíveis, sua distribuição limite será a distribuição normal ou de Gauss:

22 2/)Xx(

,X e2

1)x(G σ−σ

πσ= [Ver (5.25)]

onde

X = valor verdadeiro de x = centro da distribuição = valor médio após muitas medições

e σ = parâmetro largura da distribuição = desvio padrão após muitas medições A probabilidade uma medição isolada cair

dentro de t desvios padrão de X é

Prob (dentro tσ) = dze21 t

t

2/z2

∫−

π (5.35)

Esta integral é, muitas vezes, chamada de

função erro ou integral do erro normal. Seu valor como uma função de t está tabulado no Apêndice A. Em particular,

Prob (dentro σ) = 68,27%

Estimando X e σ de N valores medidos Após N medições de uma quantidade

normalmente distribuída x, x1, x2, ..., xN,

a melhor estimativa para o valor verdadeiro X é a média das medições

melhor estimativa para X = N

xi∑

e a melhor estimativa para a largura σ é o desvio padrão das medições,

melhor estimativa de σ = ∑=

−−

N

1i

2i )Xx(

1N1

As incertezas nestas estimativas são as

seguintes: A incerteza em x como uma estimativa de

X

incerteza em x = Nxσ

[Ver (5.66)]

e a incerteza σx como a estimativa do valor verdadeiro de σ é dada por

incerteza relativa em σx = )1N(2

1−

Ver [(5.46)]

Page 82: Analise Incerteza

Distribuição Norma ou de Gauss

71

Aceitação de um resultado medido Seja a medição de uma quantidade x na

forma padrão valor de x = xestimado ± σ

onde σ é o desvio padrão apropriado. Suponha-se também que, baseado em alguma teoria ou em alguma outra medição, se obtenha o valor xesperado. Diz-se que xestimado difere de xesperado por t desvios padrão, onde

σ

−= esperadoestimado xx

t

Assumindo se x normalmente distribuído

em torno de xesperado, com largura σ, pode-se achar do Apêndice A, a probabilidade Prob (fora σ) de uma discrepância tão grande ou maior que a encontrada. Se esta probabilidade é menor que algum nível escolhido, por exemplo 1%, julga-se o acordo ser inaceitável a este nível. Por exemplo, se Prob (fora tσ) é menor que 1%, o acordo é inaceitável ao nível de 1%.

Apostilas\Incerteza JRTaylor2.doc 30 JAN 98 (Substitui 26 DEZ 97)

Page 83: Analise Incerteza

72

Parte 2 6. Rejeição de Dados 7. Médias Ponderadas 8. Ajustando aos Mínimos Quadrados 9. Covariância e Correlação 10. Distribuição Binomial 11. Distribuição de Poisson 12. Teste do Chi-Quadrado para uma Distribuição Depois de lido e entendido o Capítulo 5, está se preparado

para, com surpreendentemente pouca dificuldade, estudar vários tópicos mais complicados. Os capítulos da Parte 2 apresentam sete destes tópicos, alguns dos quais são aplicações da teoria estatística já desenvolvida e outros são extensões adicionais desta teoria. Todos são importantes e devem ser vistos agora ou no futuro. Eles foram arranjados de modo independente de modo que podem ser estudados de uma única vez ou parceladamente.

Page 84: Analise Incerteza

73

6. Rejeição de Dados

6.1. Introdução Este capítulo discute a questão

desconfortável de descartar ou não uma medição que parece duvidosa ou que aparenta ser um engano. Este tópico é controverso; alguns metrologistas argumentam que descartar uma medição, justamente porque ela parece não razoável nunca é justificado. De qualquer modo, há um teste simples que, no mínimo, pode ser aplicado, quando se defronta com esta situação. O teste é chamado de teste de Chauvenet e é uma bonita aplicação das idéias estatísticas desenvolvidas nos capítulos 4 e 5.

6.2. Problema da rejeição de dados Às vezes, uma medição em um conjunto de

medições parece discordar visivelmente das outras. Quando isto acontece, o experimentador deve decidir se a medição anômala resultou de algum engano e deve ser rejeitada ou é uma medição bona fide que deve ser usada com todas as outras. Por exemplo, sejam seis medições do período de um pêndulo, cujos resultados são os seguintes, em segundos:

3,8 3,5 3,9 3,4 3,9 1,8 (6.1)

Neste exemplo, o valor 1,8 é visivelmente diferente de todas as outras e deve-se decidir o que fazer com ela.

Foi visto no Capítulo 5 que uma medição legítima pode se desviar significativamente de outras medições da mesma quantidade. Porém, uma discrepância legítima tão grande quanto a ultima medição em (6.1) é muito improvável, de modo que se fica inclinado a suspeitar que o tempo de 1,8 resultou de algum engano não detectado ou outra causa externa. Talvez, por exemplo, a última leitura tenha sido mal feita ou o cronômetro deu algum problema na última leitura por causa de falha momentânea na bateria.

Quando se toma muito cuidado nos registros, pode-se geralmente ser capaz de estabelecer a causa definida para a medição anômala. Por exemplo, os registros poderiam

mostrar que um cronômetro diferente foi usado na última medição em (6.1) e uma calibração posterior dele poderia mostrar que este cronômetro está com atraso sistemático. Neste caso, a medição anômala deve ser definitivamente rejeitada.

Infelizmente, estabelecer uma causa externa para um resultado anormal é geralmente impossível. Deve-se então decidir rejeitar ou não a anormalidade simplesmente examinando os resultados e aqui o conhecimento da distribuição de Gauss se torna útil.

A rejeição de dados é controversa, pois há especialistas que a desaprovam. É também uma questão importante. No exemplo anterior, a melhor estimativa para o período do pêndulo é muito afetada se a medição 1,8 é rejeitada ou não. A média das seis medições é 3,4 s (incluindo a medição suspeita 1,8 s) porém fica 3,7 s quando se rejeita 1,8 s; havendo portanto uma diferença de 10%.

Além disso, a decisão de rejeitar ou não é, no fundo, uma questão subjetiva e o técnico que toma esta decisão pode ser razoavelmente acusado por outros técnicos de estar dando um jeitinho nos dados. A situação piora pela possibilidade da medição anômala poder refletir algum efeito importante. Realmente, muitas descobertas científicas importantes primeiro apareceram como medições anômalas que pareciam enganos. Jogando fora o tempo de 1,8 s, no exemplo (6.1), poderia se estar jogando fora exatamente o dado mais interessante.

De fato, quando se têm dados como em (6.1), o único procedimento realmente correto é repetir as medições muitas e muitas vezes mais. Se a anomalia contínua, deve-se ser capaz de rastrear sua causa, ou como um engano ou como um efeito físico real. Quando isto não ocorre, então quando se fazem muitas medições (por exemplo, 100), não haverá nenhuma diferença significativa no resultado final se a anomalia é incluída ou não.

Porém, repetir uma medição 100 vezes, cada vez que um resultado parecer suspeito é geralmente impraticável e por isso é necessário algum critério para rejeitar um resultado suspeito. Há vários critérios para fazer isso, alguns mais complicados que outros. O critério de Chauvenet fornece uma aplicação simples e instrutiva da distribuição de Gauss.

Page 85: Analise Incerteza

Rejeição de Dados

74

6.3. Critério de Chauvenet Sejam novamente as seis medições

3,8 3,5 3,9 3,4 3,9 1,8 Se é assumido, por um momento, que

estas seis medições de uma quantidade x sejam legítimas, pode-se calcular a média x e o desvio padrão σx,

x = 3,4 s (6.2)

e σx = 0,8 s (6.3) Pode-se agora quantificar a extensão em

que a medição suspeita, 1,8, é anômala. Ela difere da média 3,4 por 1,6 vezes ou quase duas vezes o desvio padrão. Se foi assumido que as medições eram governadas pela distribuição de Gauss, com centro em x e largura σx, pode-se calcular a probabilidade de se obter medições que difiram por um mínimo da média. De acordo com as probabilidades mostradas no Apêndice A, esta probabilidade é

Prob (fora 2σ) = 1 – Prob (dentro 2σ) = 1 – 0,95 = 0,05 Em outras palavras, assumindo que os

valores x = 0,34 s e σx = 0,8 σx sejam legítimos, pode-se esperar que uma em cada 20 medições difira da média tanto quanto 1,8 diferiu. Quando se fazem 20 medições ou mais, pode-se realmente esperar que haja uma ou duas medições como 1,8 s e não há nenhuma razão para rejeitá-la. Porém, como foram feitas apenas seis medições, o número esperado de medições que tenham desvio como o de 1,8 s é realmente

número esperado para desviar como 1,8 = número de medições x Prob (fora 2σx), então = 6 x 0,05 = 0,3

Ou seja, em seis medições, se espera, em média, somente 30% das medições se desviem como a medição suspeita 1,8 s.

Este resultado fornece a medição quantitativa necessária do que seja razoável para a medição suspeita. Se é escolhido 33% das medições como ridiculamente improvável, então se conclui que o valor 1,8 s não é uma medição legítima e deve ser rejeitada.

A decisão de onde estabelecer o limite de ridiculamente improvável depende do experimentador. O critério de Chauvenet, como normalmente dado, estabelece que se o

número esperado de medições que se desviam como medição suspeita é menor que ½, então a medição suspeita deve ser rejeitada. Obviamente a escolha de metade é arbitrária, mas é também razoável e pode ser defendida.

A aplicação do critério de Chauvenet a um problema genérico pode agora ser descrito facilmente. Sejam N medições feitas

x1, x2, ..., xN

de uma quantidade x. De todas as medições, calculam-se x e σx. Se uma das medições (chamada agora de xsusp) difere de x de modo que pareça suspeita, então se tem:

x

susp

susp

xxt

σ

−= (6.4)

como o número de desvios padrão pelo qual xsusp difere de x . Depois, do Apêndice A, pode-se achar a probabilidade

Prob (fora tsusp σ)

que uma medição legítima difira de x por tsusp ou mais desvios padrão. Finalmente, multiplicando por N, o número total de medições, dá:

n = número esperado de desvio como xsusp n = N x Prob (fora tsusp σ ) Se n < ½ ,então, pelo critério de

Chauvenet, pode-se rejeitar xsusp. Quando se decide rejeitar a medição

suspeita, deve-se recalcular novamente a média e o desvio padrão das medições sem a suspeita.

Exemplo Sejam 10 medições de um comprimento x,

cujos resultados, em mm, são os seguintes 46, 48, 44, 38, 45, 47, 58, 44, 45, 43

A medição 58 parece anormalmente grande. Foi verificado seu registro e não se achou nenhuma evidência que o resultado seja causado por um engano. Aplicando-se o critério de Chauvenet, qual é a conclusão?

Aceitando provisoriamente as 10 medições, calculam-se:

x = 45,8 e

Page 86: Analise Incerteza

Rejeição de Dados

75

σx = 5,1 A diferença entre o valor suspeito xsusp = 58

e a média x = 45,8 é 12,2 que corresponde a 2,4 desvios padrão, isto é:

4,21,5

8,4558xxt

x

suspsusp =

−=

σ

−=

Referindo à tabela no Apêndice A, vê-se que a probabilidade que uma medição difira da média x por 2,4 σx ou mais, é 98,4%. Então,

Prob (fora 2,4 σx) = 1 – Prob (dentro 2,4 σx)

= 1 – 0,984 = 0,016 Em 10 medições, deve-se esperar achar

0,16 de uma medição como desviando como suspeito. Como 0,16 é menor que o 0,5 estabelecido pelo critério de Chauvenet , deve-se rejeitar a medição 58 mm. Rejeitando esta medição, deve-se recalcular x e σx como

x = 44,4 σx = 2,9 Como esperado, a média mudou um pouco,

de 45,8 para 44 [variação de (3%) e o desvio padrão variou muito, de 5,1 para 2,9 (variação de 76%)].

Probleminha rápido 6.1 São feitas 20 medições de uma certa

tensão V e calculados a média e o desvio padrão como:

V = 51 V

e σV = 2 V Na hora de escrever o relatório, entre as 20

medições foi encontrado o valor suspeito de 56 V.

(a) Qual é a probabilidade desta medição se desviar de V ?

(b) Se é decidido usar o critério de Chauvenet , o valor deve ser rejeitado?

(c) Resp.: 98,76% então Prob = 0,0124 x 20 = 0,25 e por isso deve

ser rejeitado.

6.4. Discussão Há cientistas que acreditam que os dados

nunca devem ser rejeitados sem evidência externa que a medição em questão seja incorreta. Um compromisso razoável é usar o critério de Chauvenet para identificar dados que possam ser considerados sujeitos à rejeição. tendo feito esta identificação, pode-se fazer todo o cálculo subsequente duas vezes, uma vez, incluindo os dados suspeitos e outra, excluindo-os, para ver de quanto os valores questionáveis afetam a conclusão final.

Uma razão para que muitos cientistas discordem do critério de Chauvenet é que a escolha de 0,5 como limite de rejeição (na condição que n < ½) é arbitrária. Talvez mesmo mais importante, a não ser que se tenha feito um grande número de medições (N = 50), o valor de σx é extremamente incerto como uma estimativa do desvio padrão verdadeiro das medições. Isto significa, por sua vez, que o número tsusp em (6.4) é muito incerto. Como a probabilidade de uma medição fora t desvios padrão é muito sensível a t, uma grande incerteza em tsusp causa uma incerteza muito grande nesta probabilidade e deixa séria dúvida em todo o procedimento. Para os dois raciocínios, o critério de Chauvenet deve ser somente usado como um último recurso, quando não se pode verificar as medições através de sua repetição.

Foi assumido que somente uma medição é suspeita. O que ocorre quando se tem duas ou mais medições suspeitas? Dado que o uso do critério de Chauvenet para rejeitar uma medição é aberto à dúvida, claramente seu uso para rejeitar várias medições é ainda mais problemático. Principalmente, se não é possível de jeito nenhum repetir as medições, porque todo o equipamento foi desmontado.

Sejam duas medições suspeitas que se desviam da média por um grande valor. Neste caso, se calcula o número esperado de medições que se desviam e se este número é menor que 1 (isto, duas vezes ½), então ambas as medições devem ser consideradas candidatas para rejeição. Se há duas medições suspeitas, x1 e x2 com x2 se desviando mais da média que x1 , primeiro se aplica o critério de Chauvenet para x1. Se o número esperado deste desvio é menor que 1, deve-se rejeitar os dois valores. Se este número esperado é maior que 1, certamente não de deve rejeitar as duas medições, mas reaplicar o critério de Chauvenet usando x2 e se o número esperado for menor que ½, deve-se rejeitar apenas x2.

Tendo se rejeitado alguma medição que não tenha passado pelo critério de Chauvenet , deve-se naturalmente recalcular x e σx

Page 87: Analise Incerteza

Rejeição de Dados

76

usando se os dados remanescentes. O valor resultante de σx será muito menor que o valor original e com o novo σx, algumas medições podem também cair fora pelo critério de Chauvenet .Porém, há consenso que o critério de Chauvenet não deve ser aplicado uma segunda vez usando os valores recalculados de x e σx.

Principais definições e equações do Capítulo 6

Critério de Chauvenet Se são feitas N medições x1, x2, ..., xN

de uma única quantidade x e se uma das medições (xsusp, por exemplo) é suspeitamente diferente de todas as outras, o critério de Chauvenet é um teste simples para decidir rejeitar ou não este valor suspeito.

Para aplicar este teste, deve-se 1. Computar a média e o desvio padrão

das N medições 2. Achar o número de desvios padrão que

xsusp difere da média x

x

susp

susp

xxt

σ

−=

3. Achar a probabilidade (assumindo as

medições normalmente distribuídas em torno de x e com largura σx) de se obter um resultado que dentro de X ± tσx [Entra com t e acha Prob(dentro tσx, no Apêndice A)

4. Achar a probabilidade de estar fora destes limites, ou seja, fazer 1 – probabilidade (normalizada)

5. Multiplicar este resultado pelo número da quantidade de medições, obtendo-se n.

6. Se n < ½, então de acordo com o critério de Chauvenet , deve-se rejeitar o valor xsusp.

7. Se n >> que o ½ , a medição suspeita é válida e não deve ser rejeitada.

Como há várias objeções ao critério de Chauvenet , especialmente se N não é muito grande, este teste deve ser usado apenas como um último recurso, quando as medições de x não puderem ser repetidas e verificadas. As objeções ao critério de Chauvenet podem ser estendidas como descrito na seção 6.3.

Page 88: Analise Incerteza

77

7. Médias Ponderadas

7.1. Introdução Este capítulo trata do problema de

combinar duas ou mais medições separadas e independentes de uma única quantidade física. Será visto que a melhor estimativa desta quantidade, baseando-se em várias medições, é uma média ponderada destas medições.

7.2. Problema de combinar medições Muitas vezes, uma quantidade física é

medida várias vezes, talvez em locais separados, por experimentadores diferentes ou em condições diversas e aparece a questão de como estas medições podem ser combinadas para dar uma única melhor estimativa. Por exemplo, sejam dois instrumentistas A e B medindo uma quantidade x cuidadosamente e obtendo os seguintes resultados:

Instrumentista A : x = xA ± σA (7.1) Instrumentista B : x = xB ± σB (7.2) Cada resultado será provavelmente o

resultado de várias medições, em que caso xA será a média de todas as medições de A e σx o desvio padrão desta média e do mesmo modo, para xB e σB . A questão é como melhor combinar xA e xB para uma única melhor estimativa de x.

Antes de examinar esta questão, note que se a discrepância |xA – xB| entre as duas medições é muito maior que as duas incertezas σA e σB , deve-se suspeitar que alguma coisa está errada, no mínimo, com uma das duas medições. Nesta situação, diz-se que as duas medições são inconsistentes e deve-se examinar ambas as medições cuidadosamente para ver se uma delas ou ambas estão sujeitas a incertezas sistemáticas não detectadas.

Porém, por hipótese, as duas medições (7.1) e (7.2) são consistentes, ou seja, a discrepância |xA – xB| não é significativamente maior que σA ou σB. Será que a melhor estimativa xestimado é o valor verdadeiro X, baseando-se nas duas medições? O primeiro impulso seria usar a média aritmética (xA –

xB)/2 das duas medições, dando igual importância às duas medições. Alguma reflexão, porém, sugere que esta média não é a mais conveniente se as duas incertezas σA e σB forem diferentes, pois o bom senso parece dizer que a medição mais precisa deve ter uma maior importância.

Em todo este capítulo será assumido que todas as incertezas sistemáticas foram identificadas e reduzidas a um nível desprezível. Assim, todas as incertezas remanescentes são aleatórias e as medições de x são distribuídas normalmente em torno do valor verdadeiro X.

7.3. Média Ponderada Pode-se resolver o problema facilmente

usando o princípio da máxima probabilidade, como foi feito na seção 5.5. Assume-se que ambas as medições são governadas pela distribuição de Gauss e que o valor verdadeiro desconhecido de x é X. Assim, a probabilidade de A obter seu valor particular xA é:

ProbX(xA) α 2A

2A 2/)Xx(

A

e1 σ−−

σ (7.3)

e de B obter seu xB observado é

ProbX(xB) α 2B

2B 2/)Xx(

B

e1 σ−−

σ (7.4)

O índice X indica explicitamente que

estas probabilidades dependem do valor real desconhecido.

A probabilidade que A ache o valor xA e B o valor xB é justo o produto das duas probabilidades (7.3) e (7.4). Em um modo que agora seria familiar, este produto envolve uma função exponencial cujo expoente é a soma de dois expoentes em (7.3) e (7.4). Pode se escrever:

ProbX(xA,xB) = ProbX(xA) ProbX(xB)

α 2/

BA

2e1 χ−

σσ (7.5)

onde se introduziu o símbolo χ2 (qui quadrado) para o expoente:

Page 89: Analise Incerteza

78

2

B

B2

A

A2 XxXx⎟⎟⎠

⎞⎜⎜⎝

⎛σ−

+⎟⎟⎠

⎞⎜⎜⎝

⎛σ

−=χ (7.6)

Esta quantidade importante é a soma dos quadrados dos desvios de X das duas medições, cada um dividido por sua correspondente incerteza.

O princípio da máxima probabilidade estabelece, justo como antes, que a melhor estimativa para o valor verdadeiro desconhecido X é o valor para o qual as observações reais xA e xB são mais prováveis. Isto é, a melhor estimativa para X é o valor para o qual a probabilidade (7.5) é máxima ou, de modo equivalente, o expoente χ2 é mínimo. (Como maximizar a probabilidade implica em minimizar a soma dos quadrados χ2, este método para estimar X é geralmente chamado de método dos mínimos quadrados). Assim, para se achar a melhor estimativa, simplesmente se deriva (7.6) com relação a X e faz se a derivada igual a zero,

0Xx2Xx2 2B

B2A

A =σ−

A solução desta equação para X é a

melhor estimativa e é facilmente resolvida como:

⎟⎟⎠

⎞⎜⎜⎝

⎛σ

+σ⎟⎟

⎞⎜⎜⎝

⎛σ

+σ 2

B2A

2B

B2A

A 11xx (7.7)

Este resultado aparentemente feio fica

mais bem arrumado se forem definidos os pesos:

2A

A1w

σ= e 2

BB

1wσ

= (7.8)

Com esta notação, pode-se reescrever

(7.7), como a média ponderada (denotada xpond )

melhor estimativa X = xpond =

BA

BBAA

wwxwxw

++

(7.9) Se as duas medições originais são

igualmente incertezas (σA + σB) e assim wA = wB , então este resultado se reduz à média aritmética (xA + xB)/2. Em geral,

quando wA ≠ wB, a média ponderada (7.9) é diferente da média aritmética. Esta fórmula é similar à para o centro de gravidade de dois corpos, onde wA e wB são os pesos reais de dois corpos e xA e xB suas posições. Em (7.9), os pesos são os inversos dos quadrados das incertezas nas medições originais, como em (7.8). Se a medição de A é mais precisa que a de B, então σA < σB e assim wA > wB de modo que a melhor estimativa xestimado está mais próxima de xA do que de xB, como realmente acontece.

Probleminha rápido 7.1 Tem-se os seguintes resultados dos

tempos de vida de determinada partícula: 10,0 ± 0,5 ns 12 ± 1 ns Combinando-se os resultados,

determinar: (a) os respectivos pesos? (b) média ponderada obtida e sua

incerteza? Resposta: (a) 4 e 1 (b) 10,4 ± 0,4 A análise das duas medições pode ser

generalizada para cobrir qualquer número de medições. Sejam N medições separadas de uma quantidade x,

x1 ± σ1, x2 ± σ2, ..., xN ± σN ,

com as respectivas incertezas σ1, σ2, ..., σN. Pensando como antes, pode-se achar que a melhor estimativa baseando-se nestas medições é a média ponderada

∑∑=

i

iipond w

xwx (7.10)

onde as somas são sobre todas as N medições, i = 1, 2, ..., N e os pesos wi de cada medição é o inverso do quadrado de cada incerteza correspondente.

2i

i1w

σ= (7.11)

para i = 1, 2, ..., N.

Page 90: Analise Incerteza

79

Como os pesos wi = 1/σi2 associados com

cada medição envolvem o quadrado da incerteza correspondente σi , qualquer medição que seja muito menos precisa que as outras contribui muito menos para o resultado final (7.10). Por exemplo, se uma medição é 4 vezes menos precisa que o restante, seu peso é 16 vezes menor que os outros pesos e, na prática, esta medição pode simplesmente ser ignorada.

Como a média ponderada xpond é uma função dos valores medidos originais x1, x2, ..., xN, a incerteza em xpond pode ser calculada usando a propagação da incerteza. Como pode ser visto facilmente, a incerteza em xpond é

∑=σ

i

pondw

1 (7.12)

Este resultado feio é talvez um pouco

mais fácil de lembrar se reescrito como

∑=σ

i

iw

1 (7.13)

Explicando a eq. (7.13), pode-se dizer

que a incerteza em cada medição é o inverso da raiz quadrada de seu peso. Retornando a (7.12), pode-se ver que a incerteza no resultado final xpond é o inverso da raiz quadrada da soma de todos os pesos individuais. Ou seja, o peso total do resultado final é a soma dos pesos individuais wi.

7.4. Um exemplo Foram feitas três medições da mesma

resistência, obtendo-se os seguintes resultados:

1: 11 ± 1 2: 12 ± 1 3: 10 ± 3 Qual é a melhor estimativa de R e sua

incerteza? As três incertezas σ1, σ2 e σ3 são 1, 1 e 3. Os pesos correspondentes são wi = 1/σi

2 são: w1 = 1 w2 = 1 w3 = 1/9

A melhor estimativa para R segundo (7.10) é

91

91

11)10()121()111(

R++

×+×+×= = 11,42 Ω

A incerteza neste resultado é dada por

(7.12):

9111

1pond

++

=σ = 0,69

O resultado final é dado como R = 11,4 ± 0,7 Ω Para comparação, o resultado com a

terceira medição desprezada, cuja incerteza é três vezes maior que as duas primeiras e por isso é pouco importante é, com um algarismo a mais

Restimado = 11,50 ± 0,71 Ω

O resultado é muito próximo do obtido com as três medições, 11,42 ± 0,69 Ω, também com um algarismo a mais e mostra que realmente a terceira medição tem um pequeno efeito.

Page 91: Analise Incerteza

80

Principais definições e equações do Capítulo 7

Se x1, x2, ..., xN, são medições de uma única quantidade x, com incertezas conhecidas σ1, σ2, ..., σN, então a melhor estimativa para o valor verdadeiro de x é a média ponderada:

∑∑=

i

iipond w

xwx [Ver (7.10)]

onde as somas são de todas N medições, i = 1, 2, ..., N e os pesos são os inversos dos quadrados das incertezas correspondentes:

2i

i1w

σ=

A incerteza em xpond é

∑=σ

i

pondw

1 [Ver (7.12)]

onde ainda a soma é de todas as medições i = 1, 2, ..., N.

Apostilas\Incerteza JRTaylor1.doc 25 SET 98 (Substitui 30 JAN 98)

Page 92: Analise Incerteza

81

8. Mínimos Quadrados

8.1. Introdução A discussão da análise estatística dos

dados até agora foi focalizada exclusivamente na medição repetida de uma única quantidade, não porque a análise de muitas medições de uma quantidade seja um problema mais interessante, mas porque este problema simples deve ser bem entendido antes de qualquer discussão adicional. Agora, há base para se discutir o primeiro problema, mais importante e geral.

8.2. Dados que devem se adequar à reta Um dos mais comuns e interessantes tipos

de experimento envolve a medição de vários valores de duas variáveis físicas diferentes para investigar a relação matemática entre as duas medições. Por exemplo, um experimentador pode deixar cair uma pedra de várias alturas diferentes h1, h2, ..., hN e medir os tempos correspondentes de queda, t1, t2, ..., tN para ver se as alturas e tempos estão ligados pela relação esperada teórica h = ½ gt2.

Provavelmente, aplicações mais importantes são aquelas que envolvem a relação linear. Por exemplo, se é esperado que um corpo caindo com aceleração constante g, tenha sua velocidade v com relação linear com o tempo t, v = vo + gt

Mais geralmente, se duas variáveis físicas x e y sejam ligadas pela relação linear da forma

y = A + Bx (8.1)

onde A e B são constantes. Infelizmente, há muitas notações diferentes usadas para uma relação linear, como y = ax + b.

Se duas variáveis x e y são linearmente relacionadas como em (8.1), então um gráfico de y contra x dá uma linha reta que tem inclinação B e corta o eixo y em y = A. Se são medidos N diferentes valores x1, x2, ..., xN e os correspondentes valores y1, y2, ..., yN e se as medições são sujeitas a nenhuma incerteza, então cada ponto (xi, yi) cai exatamente na linha reta y = A + Bx, como na Fig. 8.1(a). Na prática, sempre há incertezas e o que se pode esperar é que a distância de cada ponto (xi, yi) da linha seja razoável comparada com as incertezas, como na Fig. 8.1 (b).

Quando se faz uma série de medições do tipo descrito, pode-se fazer duas perguntas:

(a) (b) Fig. 8.1. (a) Se duas variáveis x e y são linearmente

relacionadas como na eq. (8.1) e se não há incertezas experimentais, então os pontos medidos (xi e yi) devem cair exatamente na linha y a A + Bx.

(b) Na prática, sempre há incertezas nas medições, que podem ser mostradas como barras de erro e os pontos (xi, yi) podem ser esperados cair razoavelmente próximos da reta. Aqui, somente a variável y é sujeita a incertezas (x tem incertezas desprezíveis em relação às de y)

Se estiver seguro de que y e x são

linearmente relacionados, então o problema é achar a linha reta y = A + Bx que melhor se adequa às medições ou seja, achar as melhores estimativas para as constantes A e B baseadas nos dados (x1, y1),..., (xN, yN). Este problema pode ser enfocado graficamente, como discutido rapidamente na seção 2.6. Ele também pode ser tratado analiticamente, por meio do princípio da máxima probabilidade. Este método analítico de achar a melhor linha reta para compor uma série de pontos experimentais é chamado de regressão linear, ou dos mínimos quadrados para a linha e é o principal assunto deste capítulo.

Os valores medidos para (x1, y1),..,(xN, yN) realmente garantem a expectativa de que y seja linear com x? Para responder esta questão, primeiro deve-se achar a linha que melhor agrupa os dados, mas deve-se então estabelecer algum critério para saber como esta linha está adequada para os dados. Se já são conhecidas as incertezas nas medições, pode-se desenhar um gráfico como o da Fig. 8.1(b), que mostra a melhor linha reta com os

Page 93: Analise Incerteza

Mínimos Quadrados

82

dados e os dados experimentais com suas barras de incerteza. Então, julga-se visualmente se a linha passa suficientemente próxima de todas as barras de incerteza. Se as incertezas não são conhecidas com confiança, deve-se julgar como os pontos de adequam à linha reta, examinando a distribuição dos pontos em si. Esta questão será tratada no Capítulo 9.

8.3. Cálculo das constantes A e B Voltando à questão de achar a melhor linha

reta y = A + Bx para colocar um conjunto de pontos medidos (x1, y1), ..., (xN, yN) e para simplificar a discussão, suponha-se que todas as medições de y tem incertezas apreciáveis e as incertezas nas medições de x sejam desprezíveis. Esta hipótese é geralmente razoável, porque as incertezas em uma variável geralmente são muito maiores que as incertezas em outras, que podem-se desprezar. Também se assume que as incertezas em y tenham todas o mesmo tamanho. (Esta hipótese é também razoável em muitas aplicações, mas se as incertezas forem diferentes, então a análise pode ser generalizada para pesar as medições apropriadamente. Mais especificamente, assume-se que as medições de cada yi sejam governadas pela distribuição de Gauss com o mesmo parâmetro largura σx para todas as medições.

Se as constantes A e B forem conhecidas, então, para qualquer valor dados xi (que são assumidos sem incerteza), pode-se computar o valor verdadeiro do correspondente yi,

(valor verdadeiro para yi) = A + B xi (8.2) A medição de yi é governada pela

distribuição normal centrada em seu valor verdadeiro, com parâmetro largura σy. Portanto, a probabilidade de o valor observado yi seja

ProbA,B(yi) α 2y

2ii 2/)BxAy(

y

e1 σ−−−

σ (8.3)

onde os índices A e B indicam que esta probabilidade depende dos valores desconhecidos de A e B. A probabilidade de se obter um conjunto completo de medições y1, y2, ..., yN, é o produto

ProbA,B(yi,...,yN) = ProbA,B(y1) ... ProbA,B(yN)

α 2/XNy

2e1 −

σ (8.4)

onde o expoente é dado por:

∑= σ

−−=χ

N

1i2y

2ii2 )BxAy( (8.5)

No agora modo familiar, será assumido que

as melhores estimativas para as constantes desconhecidas A e B, baseadas nas medições dadas, são os valores de A e B para os quais a probabilidade ProbA,B(yi,...,yN) é máxima, ou para os quais a soma dos quadrados χ2 em (8.5) é um mínimo. Por isso, o método é conhecido como adequação (ou encaixe) aos mínimos quadrados). Para achar estes valores, diferencia-se χ2 com relação a A e B e fazem-se as derivadas iguais a zero:

∑=

=−−σ−

=∂χ∂ N

1iii2

y

2

0)BxAy(2A

(8.6)

e

∑=

=−−σ−

=∂χ∂ N

1iiii2

y

2

0)BxAy(x2B

(8.7)

Estas duas equações podem ser reescritas

como equações simultâneas para A e B:

∑ ∑=+ ii yxBAN (8.8) e

∑ ∑ ∑=+ ii2ii yxxBxA (8.9)

Nestas equações foram omitidos os índices

i = 1 até N dos símbolos de somatória Σ, pois não há perigo de confusão. Também será usado a forma simplificada Σxy em lugar de Σxiyi

As duas eq. (8.8) e (8.9), às vezes chamadas de equações normais, são facilmente resolvidas para as estimativas de mínimos quadrados para as constantes A e B,

Δ

−= ∑ ∑∑∑ xyxyx

A2

(8.10)

e

Δ

−= ∑ ∑∑ yxxyN

B (8.11)

onde se tem a forma conveniente no denominador Δ:

Page 94: Analise Incerteza

Mínimos Quadrados

83

( )∑ ∑−=Δ22 xxN (8.12)

Os resultados (8.10) e (8.11) dão as

melhores estimativas para as constantes A e B da linha reta y = A + Bx, baseados nos N pontos medidos (x1, y1), ..., (xN, yN). A linha resultante é chamada de linha de regressão de y em x e ela agrupa os dados em mínimos quadrados.

Exemplo Tem-se uma balança de mola para medir

massas. Suspende-se a balança pelo seu topo, coloca-se um prato na parte inferior e coloca-se uma régua graduada atrás da mola para ler o comprimento da mola. Antes de qualquer medição, deve-se calibrar a balança, ou seja, deve-se achar a relação entre a massa no prato e o comprimento da mola. Para fazer esta calibração, tomam-se cinco massas exatas de 2-kg, que são colocadas no prato, uma a uma, registrando os correspondentes comprimentos Li, como mostrado na Tab. 8.1. Assumindo que a mola obedece a lei de Hooke, deve-se ter a relação linear entre L e m,

L = A + Bm (8.13)

(Aqui, a constante A é o comprimento sem

carga da mola e B é g/k, onde k é a constante da mola). A equação de calibração (8.13) permite achar qualquer massa desconhecida m a partir do comprimento correspondente L, assim que sejam conhecidas as constantes A e B. Para achar estas constantes, usa-se o método dos mínimos quadrados. Quais são os resultados de A e B? Plotar os dados de calibração e a curva dada pela melhor adequação de (8.13). Se é colocada uma massa m no prato e se observa o comprimento de onda L = 53,2 cm, qual é a massa m?

Tab. 8.1. Massas mi (kg) e comprimentos Li (cm)

para a balança com mola. O “x” e “y” nas cotas indicam que variáveis fazem os papéis de x e y. Medição

i “x”

carga, mi “y”

comprimento, Li mi

2 miLi

1 2 42,0 4 84 2 4 48,4 16 194 3 6 51,3 36 308 4 8 56,3 64 450 5 10 58,6 100 586 N = 5 Σmi=30 ΣLi=30 Σmi

2=220 ΣmiLi=1,622

Como geralmente acontece neste tipo de problemas, as duas variáveis não são chamadas x e y e deve-se ter cuidado para identificar quem é quem. Comparando (8.13) com a forma padrão y = A + Bx, pode-se ver

que o comprimento L faz o papel da variável dependente y, enquanto a massa faz o papel da variável independente x. As constantes A e B são dadas por (8.10) a (8.12), com as substituições

xi mi e yi Li (Esta correspondência é indicada pelas

colunas “x” e “y” na Tab. 8.1). Para achar A e B, precisa-se achar as somas Σmi, ΣLi, Σmi

2 e ΣmiLi.

Calcular as constantes A e B agora é direto. De acordo com (8.12), o denominador Δ é

D = N Σm2 – (Σm)2 = 5 x 220 – 302 = 200 Depois, de (8.10), acha-se a constante A:

A = Δ

−∑ ∑∑∑ mLmLm2

A = 200

1622306,256220 ×−× = 39,0 cm

Finalmente, de (8.11), acha-se B:

Δ

−= ∑ ∑∑ LmmLN

B

B = 200

6,2563016225 ×−× = 2,06 cm/kg

Um gráfico dos dados e a curva (8.13)

usando estes valores A e B é mostrado na Fig. 8.2. Se a massa m estende a mola em 53,2 cm, então de acordo com (8.13), a massa vale:

kg 9,6cm/kg 06,2

cm)0,392,53(B

ALm =−

=−

=

Page 95: Analise Incerteza

Mínimos Quadrados

84

Fig. 8.2. Um gráfico dos pontos da Tab. 8.1 e a reta de melhor ajuste (8.13)

Probleminha rápido 8.1 Achar a curva y = A + Bx através dos

mínimos quadrados, conhecidos três pontos (x, y) = (-1,0), (0, 6) e (1, 6). Usando papel quadriculado, plotar os pontos e a curva. [Notar que, como os três valores de x (-1, 0 e 1) são simétricos em relação ao zero, Σx = 0, que simplifica o cálculo de A e B. Em alguns experimentos, os valores de x podem ser arranjados para serem simetricamente colocados deste modo, o que evita alguns problemas]. Resp.: O melhor encaixe é y = 7,75 – 1,25 x.

Agora que já é sabido como achar as

melhores estimativas para as constantes A e B, naturalmente se quer achar as incertezas nestas estimativas. Antes de achar estas incertezas, porém, deve se discutir a incerteza σy nas medições originais de y1, y2, ..., yN.

8.4. Incertezas nas medições de y No procedimento de medir os valores y1, y2,

..., yN, pode-se formar alguma idéia de suas incertezas. De qualquer modo, saber como calcular a incerteza pela análise dos dados em si é importante. Os números y1, y2, ..., yN, não são medições da mesma quantidade, mas são medições de diferentes valores da quantidade, como, por exemplo, os tempos de queda de

uma pedra para diferentes alturas. Assim, não se tem uma idéia de sua confiabilidade examinando o espalhamento de seus valores.

Mesmo assim, pode-se estimar facilmente a incerteza σy nos números y1, y2, ..., yN. A medição de cada yi . Por hipótese, as medições de cada yi são normalmente distribuídas em torno do valor verdadeiro A + Bxi com parâmetro largura σy. Assim, os desvios (yi – A – Bxi) são normalmente distribuídos, todos com o mesmo valor central zero e com a mesma largura σy . Esta situação imediatamente sugere que uma boa estimativa para σy, seria dada pela soma dos quadrados com a forma familiar:

∑ −−=σ 2iiy )BxAy(

N1 (8.14)

De fato, este resultado pode ser

confirmado por meio do princípio da máxima probabilidade. Como sempre, a melhor estimativa para σy é o valor para o qual a probabilidade (8.4) de obter os valores observados y1, y2, ..., yN, é máxima. Pode-se mostrar facilmente que derivando (8.4) com relação a σy e fazendo a derivada igual a zero, esta melhor estimativa é precisamente o resultado (8.14).

Infelizmente, como se pode suspeitar, a estimativa (8.14) para σy não é o fim da história. Os números A e B em (8.14) são os valores verdadeiros desconhecidos para as constantes A e B. Na prática, estes números devem ser substituídos pelas melhores estimativas para A e B, através de (8.10) e (8.11) e esta substituição reduz ligeiramente o valor de (8.14). Pode ser mostrado que esta redução é compensada se o fator N for substituído por (N–2) no denominador. Assim, o resultado final para a incerteza nas medições y1, y2, ..., yN é

∑ −−−

=σ 2iiy )BxAy(

2N1 (8.15)

Sem pretender justificar o fator (N – 2), mas

apenas alguns comentários: 1. Sempre que N for grande, a diferença

entre N e (N – 2) é desprezível 2. O fator (N – 2) torna-se razoavelmente

claro se consideram-se apenas dois pares de dados (x1, y1) e (x2, y2). Com somente dois pontos, sempre se determina uma reta que passa exatamente através dos dois pontos e o método dos mínimos quadrados dá esta curva. Ou seja, com apenas dois pares de dados, não se pode possivelmente deduzir nada acerca da

40

50

60

massa (kg) 2 4 6 8 10

comprimento (cm)

x

y

1 2 3 4 5

2

4

6

8

Page 96: Analise Incerteza

Mínimos Quadrados

85

confiabilidade das medições. Agora, como ambos os pontos caem exatamente na melhor curva, os dois termos da soma em (8.14) e (8.15) são zero. Assim, a fórmula (8.14) com N = 2 no denominador daria a resposta absurda de σy = 0 enquanto que (8.15) com (N – 2) no denominador dá σy = 0/0, indicando corretamente que σy é indeterminado após somente duas medições. A presença do fator (N – 2) em (8.15) é

reminiscência do (N – 1) que apareceu na estimativa do desvio padrão de N medições de uma quantidade x, na eq. (5.45). Lá, tinha-se N medições de x1, x2, ..., xN de uma quantidade x. Antes de calcular σx, usavam-se os N dados para achar a média x . Em um certo sentido, esta computação deixava somente (N – 1) valores medidos independentes, de modo que se dizia que, tendo computado x , tem-se apenas (N – 1) graus de liberdade. Aqui, tem-se N medições mas antes de calcular σy, deve-se computar as duas quantidades A e B. Tendo feito isto, tem-se apenas (N – 2) graus de liberdade restados. Em geral, define-se o número de graus de liberdade em qualquer estagio em um cálculo estatístico como o número de medições independentes menos o número de parâmetros calculados destas medições. Agora pode-se mostrar que o número de graus de liberdade, não o número de medições, é o que deve aparecer no denominados de fórmulas com (8.15) e (5.45). Este fato explica por que (8.15) contem o fator (N – 2) e (5.45) o fator (N – 1).

8.5. Incertezas nas constantes A e B Tendo se encontrado a incerteza σy nos

números medidos y1, y2, ..., yN, pode-se facilmente retornar às estimativas para as constantes A e B e calcular suas incertezas. O ponto é que as estimativas (8.10) e (8.11) para A e B são funções bem definidas dos números medidos y1, y2, ..., yN. Assim, as incertezas em A e B são dadas pela propagação da incerteza em termos das incertezas em y1, y2, ..., yN. Facilmente se chega a

Δσ=σ ∑ 2

yA

x (8.16)

e

Δσ=σ ∑N

yB (8.17)

onde Δ é dado por (8.12), como usual.

( )∑ ∑−=Δ22 xxN (8.12)

Os resultados desta seção e das duas

anteriores foram baseados nas hipóteses de que as medições de y são igualmente incertas e que qualquer incerteza em x é desprezível. Embora estas hipóteses sejam geralmente justificadas, deve-se discutir brevemente o que acontece quando as hipóteses não são satisfeitas.

1. Se as incertezas em y não são iguais, pode se usar o método dos mínimos quadrados ponderados

2. Se há incertezas em x mas não em y, pode-se simplesmente mudar as regras de x e y na análise feita

3. O método de fixar os mínimos quadrados de uma curva geral, no caso de x e y terem incertezas, é mais complicado e mesmo controverso. No caso especial importante de uma linha reta, as incertezas em x e y fazem pouca diferença, o que é surpreendente.

Suponha-se que as medições de x são sujeitas a incerteza, mas que as medições de y não tenham incerteza e seja o ponto medido particular (x, y). Este ponto e a linha verdadeira y = A + Bx são mostrados na Fig. 8.3. O ponto (x, y) não cai na linha por causa da incerteza (chamada de Δx) na medição de x. Agora, pode se ver da Fig. 8.3 que a incerteza Δx em x, sem incerteza em y, produz exatamente o mesmo efeito como se não houvesse erro em x mas um erro em y. dado por

xdxdy)equiv(y Δ=Δ (8.18)

(onde equiv significa equivalente). O desvio padrão σx é a raiz quadrada da média dos quadrados de Δx que iria resultar das várias repetições desta medição. Assim, de acordo com (8.18), o problema com incertezas σx em x pode ser substituído por um problema equivalente com incertezas em y, dadas por:

xy dxdy)equiv( σ=σ (8.19)

O resultado (8.19) é verdadeiro, qualquer

que seja a curva de y vs x, mas (8.19) é especialmente simples se a curva é uma linha

Page 97: Analise Incerteza

Mínimos Quadrados

86

reta, porque a inclinação dy/dx é a constante B. Assim para uma linha reta

σy (equiv) = B σx (8.20)

Fig. 8.3. Um ponto medido (x, y) e a reta y = A + Bx em que o ponto é suposto cair. O erro Δx em x, com y exato, produz o mesmo efeito que um erro Δy(equiv) = (dy/dx) Δx em y, com x exato. (Aqui, dy/dx denota a inclinação da reta esperada.)

Em particular, se todas as incertezas σx são

iguais, o mesmo é verdade das incertezas equivalentes σy (equiv). Assim, o problema de fixar uma linha a pontos (xi, yi) com iguais incertezas em x mas sem incertezas em y é equivalente ao problema de iguais incertezas em y mas sem incertezas em x. Esta equivalência significa que se pode seguramente usar o método recém descrito para qualquer problema. [Na prática, os pontos não caem exatamente na curva e os dois problemas “equivalentes” não dão exatamente a mesma curva. Mesmo assim, as duas curvas são iguais dentro das incertezas dadas por (8.16) e (8.17).] Pode-se agora estender este argumento para o caso onde x e y ambos tem incertezas. A incerteza em x é equivalente à incerteza em y, como dado por (8.20). Além disso, y já é sujeita à sua própria incerteza, σy. Estas duas incertezas são independentes e devem ser combinadas em quadratura. Assim, o problema original, com incertezas tanto em x como em y, pode ser substituído por um problema equivalente em que somente y tem incerteza, dada por

2x

2yy )B( (equiv) σ+σ=σ (8.21)

Desde que todas as incertezas σx são

iguais, e igualmente todas as incertezas σy, as incertezas equivalentes (8.21) são todas iguais

e se pode seguramente usar as fórmulas (8.10) até (8.17).

Se as incertezas em x (ou em y) não são as mesmas, pode-se ainda usar (8.21), mas as incertezas resultantes não serão todas a mesma, e é preciso usar o método dos mínimos quadrados ponderados. Se a curva na qual se quer fixar os pontos não é uma linha reta, aparece uma complicação adicional porque a inclinação dy/dx não é uma constante e não se pode substituir (8.19) por (8.20). De qualquer modo, pode ainda usar (8.21), com dy/dx no lugar de B, para substituir o problema original (com incertezas em y e em x) por um problema equivalente em que somente y tem incertezas, como dado por (8.21).

8.6. Exemplo: Medição do zero absoluto com um termômetro de gás a volume constante

Se o volume de uma amostra de um gás ideal é mantido constante, sua temperatura T é uma função linear desta pressão P,

T = A + BP (8.22)

ou T – A = BP

onde T – A é a temperatura absoluta. Tem-se que a temperatura absoluta é proporcional à pressão, com o volume constante.

Aqui, a constante A é a temperatura em que a pressão P cairia para zero (se antes o gás não condensar em um líquido). Esta temperatura é chamada de zero absoluto da temperatura e tem o valor aceito de

A = -273,15 oC

A constante B depende da natureza do gás, sua massa e seu volume. Pela medição de uma série de valores para T e P, pode-se achar as melhores estimativas para as constantes A e B. Em particular, o valor de A dá o zero absoluto de temperatura.

Um conjunto de cinco medições de P e T é obtido, como mostrado nas primeiras três colunas da Tab. 8.2. A medição de P é considerada sem incerteza e a de T tem incerteza constante, de cerca de alguns graus. Assumindo que os pontos formem uma linha reta do tipo (8.22), deve-se calcular a melhor estimativa para a constante A (o zero absoluto) e sua incerteza. Que conclusões se pode tirar?

Tudo que tem que fazer aqui é usar as fórmulas (8.10) e (8.16), com xi substituído por Pi e yi por Ti, para calcular todas as quantidades de interesse. É preciso calcular as somas ΣP, ΣP2, ΣT e ΣPT. Muitas calculadoras

Δy = dx/dy Δx

erro equivalente em y

erro Δx em x

(x, y)

x

y

Page 98: Analise Incerteza

Mínimos Quadrados

87

podem calcular automaticamente estas contas, mas mesmo sem tais máquinas, pode-se facilmente manipular estes cálculos, se os dados forem organizados de modo conveniente. Da Tab. 8.2, pode-se calcular

ΣP = 425

ΣP2 = 37,125

ΣT = 260

ΣPT = 25 810

Tab. 8.2. Pressão (mm Hg) e temperatura (oC) de um gás

a volume constante

Medição

i

“x”

Pressão

Pi

“y”

Temperatura

Ti

A + BPi

1 65 -20 -22,2

2 75 17 14,9

3 85 42 52,0

4 95 94 89,1

5 105 127 126,2

Neste tipo de cálculo é importante manter

um grande número de algarismos significativos porque vão ser feitas subtrações entre grandes números. Armado com estas somas, pode-se calcular imediatamente as melhores estimativas das constantes A e B:

A = Δ

−∑ ∑∑∑ PTPTP2

= -263,35

e

Δ

−= ∑ ∑∑ TPPTN

B = 3,71

Este cálculo fornece a melhor estimativa

para o zero absoluto, A = - 263 oC. Conhecendo-se as constantes A e B, pode-

se calcular os números A + BPi, a temperatura esperada na base da melhor fixação à relação T = A + BP. Estes números são mostrados na quarta coluna da Tab. 8.2 e se espera que todos estejam conformes com as temperaturas observadas. Pode-se agora tomar a diferença entre os dois números das duas ultimas colunas e calcular:

∑ −−−

=σ 2iiT )BPAT(

2N1 = 6,7

Este resultado está de acordo

razoavelmente com a estimativa da temperatura ter uma incerteza de alguns graus.

Finalmente, pode-se calcular a incerteza em A, usando (8.16):

Δσ=σ ∑ 2

TA

P = 18

Assim, o resultado final, com

arredondamento adequado, deve ser:

zero absoluto, A = - 260 ± 20 oC

que combina satisfatoriamente com o valor aceito de –273 oC.

Como acontece geralmente, este resultado se torna mais claro se os dados forem colocados em um gráfico, como na Fig. 8.4. Os cinco pontos, com suas incertezas de ± 7 oC, são mostrado no canto direito. A melhor reta passa através de quatro barras de incertezas e próximo da quinta.

Para achar um valor para o zero absoluto, a linha foi estendida além de todos os dados, até sua interseção com o eixo T. Este processo de extrapolação (estender uma curva além dos pontos de dados que a determinam) pode introduzir grandes incertezas, como é claro da figura. Uma muito pequena variação na inclinação da reta irá causar uma grande alteração no ponto de interseção no eixo T distante. Assim, qualquer incerteza nos dados é grandemente amplificada se é preciso extrapolar qualquer distância. Esta amplificação explica por que a incerteza no valor de zero absoluto (±18 oC) é tão maior que a incerteza nas medições originais da temperatura (±7 oC).

0

100

-100

-200

-300

20 40 60 80 100

T (oC)

P (mm Hg)

Page 99: Analise Incerteza

Mínimos Quadrados

88

Fig. 8.4. Gráfico da temperatura T vs pressão para um gás, a volume constante. As barras de incerteza estendem um desvio padrão, σx, em cada lado das cinco pontos experimentais e a reta é o encaixe dos mínimos quadrados. O zero absoluto de temperatura foi encontrado através da extrapolação da reta até seu ponto de interseção no eixo de T.

8.7. Encaixe dos mínimos quadrados em outras curvas

Até agora neste capítulo, foram consideradas as observações de duas variáveis satisfazendo uma relação linear y = A + Bx e foi discutido o cálculo das constantes A e B. Este problema importante é um caso especial de uma maior classe de problemas de adequação ou encaixe de curvas, muitos dos quais podem ser resolvidos do mesmo modo.

Encaixe de um polinômio Muitas vezes, uma variável y é esperada

ser expressa como um polinômio de uma segunda variável x, y = A + Bx + Cx2 + Dx3 + ... + Hxn (8.23)

Por exemplo, a altura y de um corpo caindo é esperada ser proporcional ao quadrado de t,

y = y0 + v0t – ½ gt2

onde y0 e v0 são a altura e a velocidade iniciais e g é a aceleração da gravidade. Dado um conjunto de observações das duas variáveis, pode se achar a melhor estimativas para as constantes A, B, ..., H em (8.23), por um raciocínio exatamente paralelo ao da seção 8.2.

Para simplificar as coisas, seja um polinômio quadrático,

y = A + Bx + Cx2 (8.24)

(Pode-se estender a análise para o caso geral, se desejável). Suponha-se, como antes, que se tenha uma série de medições (xi, yi), i = 1, 2, ..., N, com todas yi com incertezas iguais e todos xi sem incertezas (exatos). Para cada xi, o correspondente valor verdadeiro de yi é dado por (8.24), com A, B e C como já desconhecidos. Assume-se que as medições de yi são governadas pelas distribuições normais, cada uma centrada no valor verdadeiro apropriado e todas com a mesma

largura σy. Esta hipótese permite calcular a probabilidade de se obter os valores observados y1, y2, ..., yN na forma familiar

Prob(yi,...,yN) α 2/X2

e− (8.25)

onde agora

∑= σ

−−−=χ

N

1i2y

22iii2 )CxBxAy( (8.26)

[Esta equação corresponde a eq. (8.5) para

o caso linear.] As melhores estimativas para A, B e C são os valores para os quais Prob (y1, y2,..., yN) é máxima ou χ2 é mínimo. Derivando χ2 com relação a A, B e C e igualando estas derivadas a zero, obtém-se as três equações:

AN + BΣx + CΣx2 = Σy AΣx + BΣx2 + CΣx3 = Σxy (8.27) AΣx2 + BΣx3 + CΣc4 = Σx2y Para qualquer conjunto de medições (xi, yi),

estas equações simultâneas para A, B e C (conhecidas como equações normais) podem ser resolvidas para se achar as melhores estimativas para A, B e C. Com A, B e C calculadas deste modo, as equações y = A + Bx + Cx2 são chamadas de encaixe polinomial dos mínimos quadrados ou regressão polinomial para as dadas medições.

O método de regressão polinomial generaliza se facilmente para um polinômio de qualquer grau, embora as equações normais resultantes se tornem mais complicadas para polinômios de maior grau. Em princípio, um método semelhante pode ser aplicado a qualquer função f(x) que dependa de vários parâmetros desconhecidos A, B, ... Infelizmente, as equações normais resultantes que determinam as melhores estimativas para A, B, ... podem ser difíceis ou impossíveis de se resolver. Porém, um grande número de problemas pode ser resolvido sempre, principalmente os problemas em que a função y = f(x) depende linearmente dos parâmetros A, B, ... Estes incluem todos polinômios mas também incluem muitas outras funções. Por exemplo, em alguns problemas y pode ser a soma de funções trigonométricas, tais como

y = A sen x + B cos x (8.28)

Page 100: Analise Incerteza

Mínimos Quadrados

89

Para esta função e, de fato, para qualquer função que seja linear nos parâmetros A, B, ..., as equações normais que determinam as melhores estimativas para A, B, ... são simultaneamente equações lineares, que podem sempre ser resolvidas.

Funções exponenciais Uma das funções mais importantes na

engenharia é a função exponencial

y = A eBx (8.29) onde A e B são constantes. A intensidade I de radiação, após passar uma distância x através de uma blindagem, cai exponencialmente:

I = I0e-μx onde I0 é a intensidade original e μ caracteriza a absorção pela blindagem.

A carga elétrica em um capacitor em curto circuito drena exponencialmente:

Q = Q0e-λt

onde Q0 é a carga original e λ = 1/RC, onde R e C são a resistência e a capacitância.

Se as constantes A e B em (8.29) são desconhecidas, naturalmente procura-se estimá-las, baseando-se nas medições de x e y. Infelizmente, a aplicação direta dos argumentos anteriores conduz a equações para A e B que não podem ser convenientemente resolvidas. Pode-se, porém, transformar a relação não linear (8.29) entre y e x em uma relação linear, para a qual se pode aplicar o método dos mínimos quadrados.

Para fazer esta linearização desejada, simplesmente se toma o logaritmo natural de (8.29) para dar

ln y = ln A + Bx (8.30)

Vê-se, portanto, que embora y não seja função linear de x, ln y o é. Esta conversão de (8.29) não linear em uma linear (8.30) é útil em muitos contextos, ao lado do método dos mínimos quadrados. Se se quer verificar a relação (8.29) graficamente, então um gráfico de y vs x produz uma curva que é difícil de identificar visualmente. Por outro lado, um gráfico de ln y vs x (ou log y vs x) deve dar uma linha reta, que pode ser facilmente identificada. (Tal gráfico é especialmente fácil quando se usa um papel semi-log, em que as graduações

em um eixo são espaçadas logaritmicamente. Tal papel permite plotar log y diretamente, sem mesmo calculá-lo).

A utilidade da equação linear (8.30) no encaixe dos mínimos quadrados é aparente. Se é garantido que y e x satisfazem a relação y = AeBx, então as variáveis z = ln y e x devem satisfazer (8.30), ou

z = ln A + Bx (8.31) Se são feitas muitas medições (xi, yi), então

para cada yi pode-se calcular zi = ln yi . Assim, os pares (xi, zi) devem cair na curva (8.31). Esta curva pode ser encaixada pela método dos mínimos quadrados para dar as melhores estimativas para as constantes ln A (da qual se determina A) e B.

Exemplo: População de bactérias Muitas populações (de gente, animais, núcleos radioativos, bactérias, fungos, micróbios) tendem a variar exponencialmente com o tempo. Se uma população N está diminuindo exponencialmente, se escreve:

N = N0e-t/τ

onde τ é chamada a vida média da população [muito relacionado com meia-vida, t½, de fato, t½ = (ln 2) τ]. Um biólogo suspeita que uma população de bactérias está diminuindo exponencialmente como em (8.32) e mede a população em três dias consecutivos, obtendo os resultados mostrados nas duas primeiras colunas da Tab. 8.3. Com estes dados, qual é a melhor estimativa para a vida média τ? Tab. 8.3. População de bactérias

Tempo ti (dia) População Ni zi = ln Ni

0 153 000 11,94

1 137 000 11,83

2 128 11,76

Se N varia como em (8.32), então a variável z = ln N deve ser linear em t:

z = ln N = ln N0 – t/τ (8.33)

Podem-se calcular os três números zi = ln Ni (i = 0, 1, 2), mostrados na terceira

Page 101: Analise Incerteza

Mínimos Quadrados

90

coluna de Tab. 8.3. Usando estes números, faz-se o encaixe dos mínimos quadrados para a linha reta (8.33) e acham-se as melhores estimativas para os coeficientes ln N0 e (-1/τ):

ln N0 = 11,93

(-1/τ) = -0,089 dia-1

O segundo dos coeficientes implica na

melhor estimativa para a vida média

τ = 11,2 dias

O método descrito é atrativamente simples,

especialmente quando se dispõe de uma calculadora com a função de regressão linear e é freqüentemente usado. Mesmo assim, o método não parece muito lógico. A derivação do encaixe dos mínimos quadrados para uma linha reta y = A + Bx foi baseada na hipótese que os valores medidos y1, y2, ..., yN tinham incertezas iguais. Aqui, está se fazendo o encaixe dos mínimos quadrados usando a variável z = ln y. Agora, se os valores medidos yi são igualmente incertos, então os valores zi = ln yi não o são. De fato, da propagação de incerteza se sabe que:

yx dydz

σ=σ (8.34)

Assim, se σy é o mesmo para todas as

medições, então σz varia (com σz maior quando y for menor). Evidentemente, a variável z = ln y não satisfaz a hipótese de iguais incertezas para todas as medições, se y em si satisfaz.

A solução deste problema é direta. O procedimento dos mínimos quadrados pode ser modificado para permitir diferentes incertezas nas medições, desde que as várias incertezas sejam conhecidas. Se as medições y1, y2, ..., yN tem incertezas iguais, então a eq. (8.34) diz como as incertezas em z1, z2, ..., zN variam e pode-se aplicar o método dos mínimos quadrados ponderados à equação z = ln A + Bx.

Na prática, normalmente não se pode garantir que as incertezas em y1, y2, ..., yN realmente sejam constantes, de modo que se possa talvez assumir que as incertezas sejam constantes e usar o simples mínimo quadrado não ponderado. Às vezes, as variações nas incertezas são pequenas e o método usado faz pouca diferença. De qualquer modo, quando as

incertezas forem desconhecidas, a aplicação direta do método de encaixe dos mínimos quadrados simples (não ponderado) é um meio simples e direto para conseguir razoáveis (se não melhores) estimativas para as constantes A e B na equação y = AeBx, de modo que é frequentemente usado.

Regressão múltipla Finalmente, até agora só foram discutidas

as aplicações de duas variáveis, y e x e sua relação. Muitos problemas reais, porém, têm mais de duas variáveis a se considerar. Por exemplo, o estudo da pressão de um gás, a pressão depende do volume e da temperatura e deve-se analisar a pressão como função de V e T. O exemplo mais simples de tal problema é quando uma variável, z, depende linearmente de outras duas, x e y:

z = A + Bx + Cy (8.35) Este problema pode ser analisado por uma

generalização direta do método das duas variáveis. Quando se tem uma série de medições (xi, yi, zi), i = 1, 2, ..., N (com todos os zi igualmente incertos e com xi e yi exatos), então se pode usar o princípio da máxima probabilidade exatamente como na seção 8.2 para mostrar que as melhores estimativas para as constantes A, B e C são determinadas pelas equações normais na forma:

AN + BΣx + CΣy = Σz AΣx + BΣx2 + CΣxy = Σxy (8.36) AΣy + BΣxy + CΣy2 = Σyz

As equações podem ser resolvidas para A,

B e C para dar o melhor encaixe para a relação (8.35). Este método é chamado de regressão múltipla, múltipla porque há mais de duas variáveis.

Page 102: Analise Incerteza

Mínimos Quadrados

91

Principais Definições e Equações do Capítulo 8

Neste capítulo, foram considerados N pares de medições (x1, y1), ..., (xN, yN) de duas variáveis x e y. O problema colocado é achar os melhores valores dos parâmetros da curva que um gráfico de y vs x é esperado encaixar. Assume-se que somente as medições de y possuem incertezas, enquanto que as incertezas em x são desprezíveis. [Para o caso em que ambas x e y possuem incertezas, ver a discussão depois da eq. (8.17).] Várias curvas possíveis podem ser analisadas e há duas diferentes hipóteses acerca das incertezas em y. Os casos mais importantes são os seguintes:

Seja uma linha reta, y = A + Bx, com pesos iguais e se y é esperado cair sobre uma linha reta, então y = A + Bx e se as medições de y todas tem a mesma incerteza, então as melhores estimativas para as constantes A e B são:

Δ

−= ∑ ∑∑∑ xyxyx

A2

[Ver (8.10)]

e

Δ

−= ∑ ∑∑ yxxyN

B [Ver (8.11)]

onde o denominador Δ é:

( )∑ ∑−=Δ

22 xxN [Ver (8.12)] Baseando nos pontos observados, a

melhor estimativa para a incerteza nas medições de y é:

∑ −−−

=σ 2iiy )BxAy(

2N1 [Ver (8.15)]

As incertezas em A e B são:

Δσ=σ ∑ 2

yA

x [Ver (8.16)]

Δσ=σ ∑N

yB [Ver (8.17)]

Linha reta através da origem (y = Bx); pesos iguais

Se y é esperado cair sobre uma linha reta passando pela origem, y = Bx, e se as medições de y possuem todas a mesma incerteza, então a melhor estimativas para a constante B é:

B = ∑∑

2xxy

Baseado nos pontos medidos a melhor

estimativa para a incerteza nas medições de y é:

∑ −−

=σ 2iiy )Bxy(

1N1

e a incerteza em B é

∑σ

=σ2

yB

x

Encaixe ponderado para uma linha reta, y = A + Bx

Se y é esperado cair em uma linha reta y = A + Bx e se os valores medidos de yi possuem diferentes incertezas desconhecidas σi , então se introduzem os pesos wi = 1/σx

2, e as melhores estimativas para as constantes A e B são

Δ

−= ∑∑∑∑ wxywxwywx

A2

Δ

−= ∑∑∑∑ wywxwxyw

B

onde

∑∑∑ −=Δ 22 )wx(wxw

Page 103: Analise Incerteza

Mínimos Quadrados

92

As incertezas em A e B são:

Δ=σ ∑ 2

A

wx

e

Δ=σ ∑w

B

Outras curvas Se y é esperado ser um polinômio em x,

como

y = A + Bx + Cx2 + ... + Hxn

então um método exatamente analogo ao encaixe dos mínimos quadrados pode ser usado, embora as equações sejam muito complexas se n é grande. Curvas da forma

y = Af(x) + Bg(x) + ... + Hk(x)

onde f(x), g(x), ..., k(x) são funções conhecidas, podem também ser manipuladas do mesmo modo.

Se y é esperado ser dado pela função exponencial, y = AeBx então se pode linearizar o problema, usando a variável auxiliar z = ln(y), que satisfaz a seguinte relação linear:

z = ln (y) = ln (A) + Bx [Ver (8.31)]

Pode-se então aplicar o encaixe dos

mínimos quadrados em z como função de x. Note-se, porém, que se as incertezas nos valores medidos de y são todas iguais, o mesmo certamente não é verdade para os valores de z. Então, rigorosamente falando, o método de mínimos quadrados ponderados deve ser usado.

Apostilas\Incerteza JRTaylor7.doc 25 SET 98 (Substitui 30 JAN 98)

Page 104: Analise Incerteza

93

9. Covariância e Correlação

9.1. Introdução Este capítulo introduz o importante

conceito de covariância. Como este conceito aparece naturalmente na propagação de incerteza, a seção 9.1 começa com uma rápida revisão de propagação da incerteza. Esta revisão estabelece o estagio da seção 9.2, que define a covariância e discute sua função na propagação da incerteza. Depois, a seção 9.3 usa a covariância para definir os coeficientes de correlação linear para um conjunto de pontos medidos (x1, y1), ..., (xN, yN). Este coeficiente, chamado de r, fornece uma medida de como os pontos encaixam em uma linha reta da forma y = A + Bx; seu uso é descrito nas seções 9.4 e 9.5.

9.2. Revisão de propagação da incerteza

Esta e a próxima seção fornecem uma visão final na importante questão de propagação da incerteza. Primeiro, foi discutida a propagação da incerteza no Capítulo 3, onde foram tiradas várias conclusões. Foi imaginada a medição de duas quantidades x e y para calcular alguma função q(x,y), tal como q = x + y ou q = xy ou ainda q = x2 sen y. [De fato, foi discutida a função q(x,y,...,z) de um número arbitrário de variáveis x, y, ..., z. Por simplicidade, agora serão consideradas apenas duas variáveis.] Um argumento simples sugeriu que a incerteza no resultado de q é dada por

yyqx

xqq δ

∂∂

+δ∂∂

≈δ (9.1)

Segundo, foi obtida esta aproximação

para os casos especiais de somas, diferenças, produtos e quocientes. Por exemplo, se q é a soma q = x + y, (9.1) se reduz à familiar δq = δx + δy. O resultado geral (9.1) foi derivado da eq. (3.43).

Depois se verificou que (9.1) é provavelmente uma superestimativa de δq, porque pode haver cancelamento das incertezas em x e y. Foi dito, sem prova, que quando as incertezas em x e y são independentes e aleatórias, um melhor valor

para a incerteza no valor calculado de q(x, y) é a soma quadrática.

22

yyqx

xqq ⎟⎟

⎞⎜⎜⎝

⎛δ

∂∂

+⎟⎠⎞

⎜⎝⎛ δ

∂∂

=δ (9.2)

Foi também estabelecido, sem prova, que

se as incertezas forem ou não forem independentes e aleatórias, a fórmula mais simples (9.1) sempre dá um limite superior em δq, isto é, a incerteza δq nunca é pior que a dada pela (9.1).

O Capítulo 5 deu uma definição apropriada e provou (9.2). Primeiro, foi visto que uma boa medida da incerteza δx em uma medição é dada pelo desvio padrão σx. Em particular, foi visto que, se as medições de x são normalmente distribuídas, pode se estar 68% confiante que o valor medido caia dentro de σx do valor verdadeiro. Depois, foi visto que se as medições de x e y são governadas pelas distribuições normais independentes, com desvios padrão de σx e σy, os valores de q(x, y) são também normalmente distribuídos com desvio padrão

2

y

2

xq yq

xq

⎟⎟⎠

⎞⎜⎜⎝

⎛σ

∂∂

+⎟⎠⎞

⎜⎝⎛ σ

∂∂

=σ (9.3)

Este resultado justifica a equação (9.2).

Na seção 9.2, será obtida uma fórmula precisa para a incerteza em q, que se aplica se as incertezas em x e y forem independentes e normalmente distribuídas ou não. Em particular, será provada que (9.1) sempre fornece um limite superior da incerteza em q.

Antes de se obter estes resultados, será revisto o conceito de desvio padrão. O desvio padrão σx de N medições x1, x2, ..., xN foi originalmente definido pela equação

∑=

−=σN

1i

2i

2x )xx(

N1 (9.4)

Se as medições de x são normalmente

distribuídas, então no limite em que N é grande, a definição (9.4) é equivalente a

Page 105: Analise Incerteza

Covariância e Correlação

94

definição σx como o parâmetro largura que aparece na função de Gauss

2x

2 2/)Xx(

x

e2

1 σ−−

πσ

que governa as medições de x. Como agora se considera a possibilidade que as incertezas em x possam ser não normalmente distribuídas, esta segunda definição não é mais válida. Pode-se e será ainda definido σx por (9.4). Se a distribuição de incertezas é normal ou não, esta definição de σx dá uma medida razoável das incertezas aleatórias na medição de x. (Como no Capítulo, foi suposto que todas as incertezas sistemáticas foram identificadas e reduzidas a um nível desprezível, de modo que todas as incertezas residuais são aleatórias).

A ambigüidade permanece tanto quando se usa a definição (9.4) de σx ou a definição melhorada com o fator N no denominador substituído por (N – 1). Felizmente, a discussão que se segue se aplica a qualquer definição, desde que se continue consistente na aplicação com uma ou outra. Por conveniência, será usada a definição (9.4), com N no denominador, neste capítulo.

9.3. Covariância na propagação da incerteza

Suponha que se tenha achado um valor para a função q(x, y), se tenha medido as duas quantidades x e y várias vezes e obtidos N pares de dados (x1, y1), ..., (xN, yN). Das N medições x1, x2, ..., xN, pode-se calcular a média x e o desvio padrão σx do modo usual. Do mesmo modo, das medições y1, y2, ..., yN, pode-se computar y e σy. Depois, usando se os N pares de medições, pode-se computar N valores da quantidade de interesse:

qi = q(xi, yi), (i = 1, 2, ..., N)

Dados q1, q2, ..., qN, pode-se agora

calcular sua média q , que é a medida da incerteza aleatórias nos valores qi.

Será assumido, como usual, que todas as incertezas sejam pequenas e assim que todos os números x1, x2, ..., xN, estejam próximos de x e que todos y1, y2, ..., yN estejam próximos de y . Pode-se então fazer a aproximação:

qi = q(xi, yi)

)yy(yq)xx(

xq )y,xq( ii −

∂∂

+−∂∂

+≈ (9.5)

Nesta expressão, as derivadas parciais

∂q/∂x e ∂q/∂y são tomadas no ponto x = x , y = y e são portanto as mesmas para todos i = 1, 2, ..., N. Com esta aproximação, a média fica

∑=

=N

1iiq

N1q

∑=

⎥⎦

⎤⎢⎣

⎡−

∂∂

+−∂∂

+=N

1iii )yy(

yq)xx(

xq )y,xq(

N1

Esta equação dá q como a soma de três

termos. O primeiro termo é q( x, y ) e os outros dois são exatamente iguais a zero. [Por exemplo, segue-se da definição x que Σ(xi - x) = 0]. Assim, tem-se o resultado tremendamente simples

)y,xq( q = (9.6)

Ou seja, para achar a média q , deve-se apenas calcular a função q(x, y) no ponto x = x, e y = y .

O desvio padrão nos N valores q1, q2,..., qN é dado por

∑ −=σ 2i

2q )qq(

N1

Substituindo (9.5) e (9.6), acha-se que:

2

ii2q )yy(

yq)xx(

xq

N1 ∑ ⎥

⎤⎢⎣

⎡−

∂∂

+−∂∂

= ∑∑ +−⎟⎟⎠

⎞⎜⎜⎝

⎛∂∂

+−⎟⎠⎞

⎜⎝⎛

∂∂ 2

i

22

i

2

)yy(N1

yq)xx(

N1

xq

∑ −−∂∂

∂∂

+ )yy)(xx(N1

yq

xq2 ii

Page 106: Analise Incerteza

Covariância e Correlação

95

Os dois primeiros termos de (9.7) são

aqueles que aparecem na definição dos desvios padrão σx e σy. A soma final é uma novidade. É chamada a covariância de x e y e é denotada como

∑=

−−=σN

1iiixy )yy)(xx(

N1 (9.8)

Com esta definição, a eq. (9.7) para o

desvio padrão σq se torna

xy2y

22x

22q y

qxq2

yq

xq

σ∂∂

∂∂

+σ⎟⎟⎠

⎞⎜⎜⎝

⎛∂∂

+σ⎟⎠⎞

⎜⎝⎛

∂∂

=σ (9.9)

Esta equação dá o desvio padrão σq,

quer as medições de x e y sejam independentes e normalmente distribuídas ou não.

O nome covariância para σxy (para duas variáveis x e y) corresponde ao nome variância para σx

2 (para uma variável x). Para enfatizar esta correspondência, a covariância (9.8) é geralmente denotada por σxy

2, que não é uma notação muito adequada,

porque a covariância pode ser negativa. Uma característica conveniente da definição (9.8) é que σxy tem a dimensão de xy, assim como σx tem a dimensão de x.

Se as medições de x e y são independentes, pode se ver facilmente que, após muitas medições, a covariância σxy deve tender para zero, pois qualquer que seja o valor de yi, a quantidade xi - x tem a mesma probabilidade de ser negativa ou positiva. Assim, após muitas medições, os termos negativos e positivos em (9.8) provavelmente se cancelam. No limite de infinitas medições, o fator 1/N em (9.8) garante que σxy é zero. (Após um número finito de medições, σxy não será exatamente igual a zero, mas deve ser pequeno, se as incertezas em x e y realmente são independentes e aleatórias.) Com σxy zero, a eq. (9.9) para σq se reduz a

2y

22x

22q y

qxq

σ⎟⎟⎠

⎞⎜⎜⎝

⎛∂∂

+σ⎟⎠⎞

⎜⎝⎛

∂∂

=σ (9.10)

resultado conhecido para incertezas independentes e aleatórias. Se as medições

de x e y são dependentes, a covariância �xy não é necessariamente zero. Por exemplo, é fácil imaginar a situação em que uma superestimativa de x será sempre acompanhada por uma superestimativa de y e vice versa. Os números (xi - x ) e (yi - y ) sempre terão o mesmo sinal (ambos positivos ou ambos negativos) e seu produto será sempre positivo. Como todos os termos na soma (9.8) são positivos, σxy será positivo (e não zero), mesmo no limite com infinitas medições. Do modo contrário, pode-se ter situações em que uma superestimativa de x é sempre acompanhada de uma subestimativa de y e vice versa e neste caso, os números (xi - x ) e (yi - y ) sempre terão sinal opostos (um positivo e outro negativo) e �xy será sempre negativo. Este caso é ilustrado no exemplo abaixo.

Quando a covariância σxy é não zero (mesmo no limite de infinitas medições), diz se que as incertezas em x e y estão correlacionadas. Neste caso, a incerteza σq em q(x, y) como dada em (9.9) não é a mesma quando se usa a fórmula (9.10) para incertezas independentes e aleatórias.

Exemplo: Dois ângulos com uma covariância negativa

Foram feitas cinco medições dos mesmos dois ângulos α e β e encontrados os resultados nas três primeiras colunas da Tab. 9.1.

Tab. 9.1. Cinco medições de dois ângulos α e β

Medida α β α – α β – β (α− α )( β - β )

A 35 50 2 -2 -4

B 31 55 -2 3 -6

C 33 51 0 -1 0

D 32 53 -1 1 -1

E 34 51 1 -1 -1 Achar a média e o desvio padrão de cada

um dos dois ângulos e então achar a covariância σαβ como definida por (9.8), ou seja.

1. Calcular a soma q = α + β. 2. Achar a melhor estimativa de q como

dado por (9.6) 3. Achar o desvio padrão σq por (9.9) 4. Comparar o desvio padrão com o que

seria obtido se fosse assumido

Page 107: Analise Incerteza

Covariância e Correlação

96

(incorretamente) que as incertezas em α e β sejam independentes e que σq foi dado por (9.10).

As médias são achadas facilmente:

α = 33 β = 52

Com estes valores, acham-se as

diferenças (α - α ) e (β - β ), como mostrado na Tab. 9.1 e destes desvios se acham facilmente:

σα2 = 2,0

σβ2 = 3,2

[Foi usada (9.4), com N no denominador.] Pode-se ver da Tab. 9.1 que altos valores

de α parecem estar correlacionados com baixos valores de β e vice versa, por que (α − α ) e (β − β ) sempre tem sinais opostos. Esta correlação significa que os produtos (α − α ) (β − β ), mostrados na última coluna de Tab. 9.1 são todos negativos ou zero. Assim, a covariância σαβ com definida por (9.8) é negativa,

4,2)12(51))((

N1

−=−×=β−βα−α=σ ∑αβ

A melhor estimativa para a soma q = α + β é dada por (9.6) como

qestimado = β+α=q = 33 + 52 = 85

Para achar o desvio padrão usando (9.9),

usam-se as duas derivadas parciais, que são facilmente encontradas como ∂q/∂α = ∂q/∂β = 1. Deste modo, de acordo com (9.9),

αβα σ+σ+σ=σ 22y

2q

= 4,222,30,2 ×−+ = 0,6 Se for omitida a correlação entre as

medições de α e β e elas forem consideradas

independentes entre si, então de acordo com (9.10), se obteria a resposta incorreta

2y

2q σ+σ=σ α

= 2,30,2 + = 2,3 Pode se ver, deste exemplo, que uma

correlação do sinal correto pode causar uma grande diferença em uma incerteza propagada. Neste caso, pode se ver por que há esta diferença. As incertezas em cada ângulo α e β são aproximadamente um grau, sugerindo que q = α + β deveria ter uma incerteza de alguns graus. Mas, como foi visto, as incertezas positivas em α são acompanhadas por incertezas negativas em β e vice versa. Assim, quando se somam α e β, as incertezas tendem a se cancelar, deixando uma incerteza apenas de fração de um grau.

Probleminha rápido 9.1 São feitas três medições de dois lados x

e y de um retângulo e obtidos os resultados da Tab. 9.2. Achar as médias x e y e depois fazer uma tabela como a Tab. 9.1 para achar as covariância σxy. Se for calculada q = x + y, achar o desvio padrão σq usando a fórmula correta (9.9) e compará-la com o valor obtido quando se ignora a covariância e usando (9.10). (Note que neste exemplo, altos valores de x parecem se correlacionar com altos valores de y e vice versa. Especificamente, parece que a medição C está superestimada e a medição A, subestimada. Lembre-se também que com apenas três medições os resultados de qualquer cálculo estatístico é apenas um guia grosseiro das incertezas relacionadas.)

Tab. 9.2. Três medições de x e y (mm) Medição x y

A 25 33

B 27 34

C 29 38

Resp.: σq = 3,7 inclui a covariância e σq = 2,7 ignora a covariância.

Page 108: Analise Incerteza

Covariância e Correlação

97

Usando a fórmula (9.9), pode-se derivar um limite superior de σq que é sempre válido. É fácil provar que a covariância σxy satisfaz a chamada desigualdade de Schwarz

yxxy σσ≤σ (9.11) Substituindo-se (9.11) em (9.9) para a

incerteza σq, acha-se que

yx2y

22x

22q y

qxq2

yq

xq

σσ∂∂

∂∂

+σ⎟⎟⎠

⎞⎜⎜⎝

⎛∂∂

+σ⎟⎠⎞

⎜⎝⎛

∂∂

≤σ

= 2

yx yq

xq

⎥⎦

⎤⎢⎣

⎡σ

∂∂

+σ∂∂

ou seja,

yxq yq

xq

σ∂∂

+σ∂∂

≤σ (9.12)

Com este resultado, tem-se estabelecido

finalmente o significado preciso da expressão original

yx yq

xqq σ

∂∂

+σ∂∂

≈δ (9.13)

para a incerteza δq. Se é adotado o desvio padrão σq como medida da incerteza de q, então (9.12) mostra que a antiga expressão (9.13) é realmente o limite superior da incerteza. Se as incertezas em x e y são independentes e normalmente distribuídas ou não, a incerteza em q nunca excederá o lado direito de (9.13). Se as medições de x e y são correlacionadas de modo que |σxy| = σx σy, seu maior valor possível de acordo com (9.11), então a incerteza em q pode realmente ser tão grande quanto mas nunca maior que o dado por (9.13).

Em Metrologia, geralmente não se consideram as covariâncias das medições. Assim, geralmente não se usa o resultado (9.9) explicitamente. Se, porém, suspeita-se que duas variáveis x e y podem estar correlacionadas, deve-se usar o limite (9.12), em vez da soma quadrática (9.10).

9.4. Coeficiente de correlação linear A noção de covariância σxy introduzida na

seção 9.2 permite responder a questão levantada no Capítulo 8 de como um conjunto de medições (x1, y1), ..., (xN, yN) de

duas variáveis suporta a hipótese que x e y sejam linearmente relacionados.

Suponha que sejam medidos N pares de valores (x1, y1), ...., (xN, yN) de duas variáveis que se suspeita satisfazerem uma relação linear da forma

y = A + Bx Note se que x1, x2, ..., xN não são mais

medições de um único número, como era considerado nas duas seções anteriores, mas são medições de N diferentes valores de alguma variável (por exemplo, N diferentes correntes na saída de um transmissor para diferentes valores de temperatura). O mesmo se aplica a y1, y2, ..., yN.

Usando se o método dos mínimos quadrados, pode-se achar os valores de A e B para a curva que melhor encaixa os pontos (x1, y1), ..., (xN, yN). Se já se tem uma estimativa confiável das incertezas nas medições, pode se ver que os pontos medidos caem razoavelmente próximos da curva (comparados com as incertezas conhecidas). Se eles caem, as medições sustentam a suspeita que x e y sejam linearmente relacionados.

Infelizmente, em muitas experiências, obter uma estimativa confiável das incertezas a priori é difícil e devem se usar os dados em si para decidir se as duas variáveis parecem ser linearmente relacionadas. Em particular, há um tipo de experiência para a qual é impossível conhecer a tamanho das incertezas no início. Este tipo de experiência, que é mais comum em ciências sociais do que em metrologia, é melhor explicada por um exemplo.

Seja um professor ansioso em convencer seus alunos que fazer o dever de casa irá ajudá-los a ir bem nos exames. Ele registra os resultados dos deveres de casa e dos exames e coloca estes resultados em um gráfico, como na Fig. 9.1 (notas de exames vs notas de deveres de casa). Cada ponto (xi, yi) mostra uma nota do estudante do dever de casa (xi) e do exame (yi). O professor espera mostrar que alta nota do exame tende a se relacionar com alta nota no dever de casa e vice versa (e o espalhamento dos pontos sugere que isto aproximadamente acontece). Este tipo de experiência não tem incertezas nos pontos, pois as notas dos estudantes são conhecidas exatamente. A incerteza está, porém, na extensão em que as notas sejam correlacionadas e isto deve ser decidido a partir dos dados.

As duas variáveis x e y podem estar relacionadas por uma função mais

Page 109: Analise Incerteza

Covariância e Correlação

98

complicada do que uma simples reta y = A + Bx. Por exemplo, há muitas leis físicas que levam a relações da forma y = A + Bx + Cx2. Mesmo assim, nesta seção a discussão será restrita ao problema mais simples de decidir se um dado conjunto de pontos suporta a hipótese de uma relação linear y = A + Bx.

A extensão em que um conjunto de pontos (x1, y1), ...., (xN, yN) sustenta uma relação linear entre x e y é medida por um coeficiente de correlação linear ou simplesmente coeficiente de correlação,

yx

xyrσσ

σ= (9.14)

onde a covariância σxy e os desvios padrão σx e σy são definidos exatamente como antes, nas eq. (9.8) e (9.4). [Note-se porém que seus significados são diferentes. Por exemplo, na seção 9.2, x1, x2, ..., xN eram medições de um número e se estas medições eram precisas, σ seria pequeno. No presente caso x1, x2, ..., xN são medições de diferentes valores de uma variável e mesmo que as medições sejam precisas, não há razão para pensar que σx seja pequeno. Note-se também que alguns autores usam o número r2, chamado de coeficiente de determinação. Substituindo as definições (9.8) e (9.4) em (9.14), pode-se reescrever o coeficiente de correlação como:

∑ ∑∑

−−

−−=

2i

2i

ii

)yy()xx(

)yy)(xx(r (9.15)

Como será mostrado diretamente, o

número r é um indicador de quão bem os pontos (xi, yi) se encaixam em uma linha reta. É um número entre –1 e 1. Se r é próximo a ±1, os pontos caem próximos a uma linha reta, se r é próximo de zero, os pontos não tem correlação e tem pouca ou nenhuma tendência de cair em uma linha reta.

Para provar estas afirmações, primeiro se vê que a desigualdade de Schwarz (9.11), |σxy| ≤ σx σy implica imediatamente que |r| ≤ 1 ou

-1 ≤ r ≤ 1

como se queria demonstrar. Agora, suponha que os pontos (xi, yi) todos caiam exatamente na linha y = A + Bx. Neste caso, yi = A + Bxi para todos i e assim xBAy += . Subtraindo estas duas equações, se vê que

)xx(Byy ii −=−

para cada i. Inserindo este resultado em (9.15), acha-se que

1B

B

)xx(B)xx(

)xx(Br

2i

22i

2i ±=

±=

−−

−=

∑ ∑∑

(9.16) Ou seja, se os pontos (x1, y1), ..., (xN, yN)

caem perfeitamente em uma linha, então r = ±1 e seu sinal é determinado pela inclinação da reta: r = 1 para B positivo e r = -1 para B negativo. Se a linha for horizontal B = 0 e (9.16) dá 0/0, que é uma indeterminação. Felizmente, este caso especial não é importante, na prática, porque ele corresponde a y ser um constante, independente de x. Mesmo quando as variáveis x e y realmente são linearmente correlacionados, não se espera que os pontos experimentais caiam todos exatamente em uma linha. Assim, não se espera que r seja exatamente ±1. Na pratica, espera-se um valor de r que seja próximo de ±1, quando se acredita que x e y sejam linearmente correlacionados.

Suponha-se, por outro lado, que não há relação entre as variáveis x e y. Qualquer que seja o valor de yi, cada xi teria a mesma probabilidade de estar acima ou abaixo de x . Assim, os termos na soma

∑ −− )yy)(xx( ii

no numerador de r em (9.15) tem a mesma probabilidade de ser positivos ou negativos. Porém, os termos no denominador de r são todos positivos. Assim, no limite de N (número de medições) tendendo para infinito, o coeficiente de correlação r será zero. Com um número finito de pontos de dados, não se espera que r seja exatamente zero, mas, na prática se espera que ele seja muito pequeno, quando as duas variáveis forem realmente não correlacionadas.

Se duas variáveis x e y são tais que, no limite de N tendendo para infinito, sua covariância σxy seja zero (e assim r = 0), diz se que as variáveis são incorrelacionadas ou incorrelatas. Se após um número finito de medições o coeficiente de correlação é pequeno, a hipótese que x e y sejam incorrelatas é sustentada.

Como exemplo, sejam as notas de exame e de dever de casa mostradas na Tab. 9.3. Um simples cálculo mostra que o coeficiente

Page 110: Analise Incerteza

Covariância e Correlação

99

de correlação para estes 10 pares de notas é r = 0,8. O professor conclui que este valor é razoavelmente próximo de 1 e então pode anunciar aos alunos que, por causa das notas do dever de casa e dos exame mostrarem boa correlação, é importante fazer o dever de casa.

Tab. 9.3. Notas dos estudantes

Estudante i

Nota casa xi

Nota exame yi

1 90 90 2 60 71 3 45 65 4 100 100 5 15 45 6 23 60 7 52 75 8 30 85 9 71 100 10 88 80

Se o professor tivesse obtido um coeficiente de correlação próximo de zero, ele ficaria numa posição embaraçosa de ter que mostrar que nas notas dos deveres de casa não tem nenhuma correlação com as notas dos exames. Se r tivesse dado próximo de –1, então a descoberta seria ainda mais desconcertante, pois mostraria que os deveres de casa atrapalham as notas dos exames, ou seja, quem tivesse tirado nota alta no dever de casa tenderia a tirar uma nota baixa no exame.

Probleminha rápido 9.2. Achar o coeficiente de correlação para os

dados do Probleminha rápido 9.1. Note-se que estas medições mostram uma correlação positiva, ou seja, alto valor de x corresponde a alto valor de y e vice versa.

Resp.: r = 0,94

9.5. Significado quantitativo de r O exemplo das notas de dever de casa e

do exame mostra claramente que ainda não se tem uma resposta completa para a questão acerca de como os dados sustentam uma relação linear entre x e y. O professor achou um coeficiente de correlação r = 0,8 e julgou este valor razoavelmente próximo a 1. Porém, como se pode decidir objetivamente o que é razoavelmente próximo a 1? Será que 0,6 é razoavelmente próximo? Ou 0,4? Estas

questões são respondidas pelo seguinte argumento. Sejam duas variáveis x e y realmente não correlatas, ou seja, no limite de infinitamente muitas medições, o coeficiente de correlação r é zero. Após um número finito de medições, r é muito provavelmente não igual a zero. Pode-se, de fato, calcular a probabilidade que r exceda qualquer valor específico. Esta probabilidade é escrita como

Prob(|r| ≥ ro)

e representa a probabilidade que N medições de duas variáveis não correlatas x e y dêem um coeficiente r maior que qualquer particular ro. Como a correlação é indicada por r próximo de +1 ou de –1, considera-se a probabilidade de dar o valor absoluto |r| ≥ ro. Por exemplo, pode-se calcular a probabilidade

Prob(|r| ≥ 0,8)

que, após N medições de duas variáveis não correlatas x e y, o coeficiente de correlação r seja, no mínimo, tão grande quanto 0,8. O cálculo destas probabilidades é muito complicado e não será visto aqui. Os resultados para alguns valores significativos dos parâmetros são mostrados na Tab. 9.4. Tab. 9.4. A probabilidade Prob(|r| ≥ ro) que N medições de duas variáveis não correlatas x e y produzam um coeficiente de correlação com |r| ≥ ro Valores dados em percentagem de probabilidades e espaços em branco significam valores menores que 0,05%.

Page 111: Analise Incerteza

Covariância e Correlação

100

ro\N 3 6 10 20 50

0 100 100 100 100 100

0,1 94 85 78 67 49

0,2 87 70 58 40 16

0,3 81 56 40 20 3

0,4 74 43 25 8 0.4

0,5 67 31 14 2

0,6 59 21 7 0,5

0,7 51 12 2 0,1

0,8 41 6 0,5

0,9 29 1

1 0 0 0 0 0

Embora não se tenha mostrado como as

probabilidades na Tab. 9.4 sejam calculadas, pode-se entender seu comportamento geral e colocá-las em uso. A primeira coluna mostra o número de pontos de dados N. (No exemplo, o professor registrou 10 notas, de modo que N = 10). Os números em cada linha mostram a probabilidade em percentagem que N medições de duas variáveis não correlatas forneçam um coeficiente r, no mínimo, tão grande quando o número no início da linha. Por exemplo, se vê que a probabilidade que 10 dados não correlatos dêem |r| ≥ 0,8 é apenas 0,5% (não uma grande probabilidade). O professor pode então dizer que é muito pouco provável (0,5%) que notas não correlatas tenham produzido um coeficiente |r| ≥ 0,8 que ele obteve. Em outras palavras, é muito provável (99,5%) que as notas em trabalho de casa e exames realmente sejam correlatas.

Várias características da Tab. 9.4 requerem comentários.

1. Todas as entradas na primeira linha são 100%, porque |r| é sempre maior ou igual a zero; assim a probabilidade de encontrar |r| ≥ 0 é sempre 100%.

2. Todas as entradas na última linha são 0%, porque a probabilidade de encontrar |r| ≥ 1 é sempre 0%.

3. Os números intermediários variam de acordo com o número de dados N. Esta variação é também facilmente entendida. Se são feitas apenas três medições, a chance delas terem um coeficiente de correlação com |r| ≥

0,5, por exemplo, é obviamente muito alta (67%, de fato), mas se são feitas 20 medições e as duas variáveis realmente são não correlatas, a chance de encontrar |r| ≥ 0,5 é muito pequena (2%).

Armado com as probabilidades na Tab. 9.4 (ou em uma tabela mais completa, disponível na literatura técnica de Estatística), pode se agora ter a resposta mais completa possível para a questão de quão bem N pares de valores (xi, yi) sustentem uma relação linear entre x e y. Dos pontos medidos, pode-se primeiro calcular o coeficiente de correlação observado ro (o índice o significa observado). Depois, usando a Tab. 9.4, pode-se achar a probabilidade Prob(|r| ≥ ro) que N pontos não correlatos tenham dado um coeficiente, no mínimo, tão grande quanto o coeficiente observado ro. Se esta probabilidade é suficientemente pequena, conclui-se que é pouco provável que x e y sejam não correlatos e assim, é muito provável que x e y sejam correlatos. Tem-se ainda de escolher o valor da probabilidade considerada como suficientemente pequena. Uma escolha razoável é considerar uma correlação observada ro como significativa se a probabilidade de obter um coeficiente r com |r| ≥ |ro| de variáveis não correlatas é menor que 5%. Uma correlação é, às vezes, chamada altamente significativa se a probabilidade correspondente é menor que 1%. Qualquer que seja a escolha feita, não de tem uma resposta definitiva que os dados sejam ou não sejam correlatos; em vez disso, tem-se uma medida quantitativa de quão improvável é que eles sejam não correlatos.

Probleminha rápido 9.3 O professor da seção 9.3 ensina o

mesmo curso no ano seguinte e agora tem 20 alunos. De novo, ele registra as notas do deveres de casa e dos exames e encontra um coeficiente de correlação r = 0,6. Esta correlação é significativa ou altamente significativa. Resp.: Como Prob20(|r| ≥ 0,6) = 0,5%, a correlação é significativa e altamente significativa.

Page 112: Analise Incerteza

Covariância e Correlação

101

9.6. Exemplos Sejam três pares de valores (xi, yi)

medidos e encontrado um coeficiente de correlação de 0,7 (ou – 0,7). Este valor sustenta a hipótese que x e y são linearmente relacionados?

Referindo-se à Tab. 9.4, vê se que se as variáveis x e y são completamente não correlatas, a probabilidade é 51% de obter |r| ≥ 0,7, quando N = 3. Em outras palavras, é inteiramente possível que x e y sejam não correlatos, de modo que não se tem evidencia confiável de correlação. De fato, com apenas três medições, obter evidencia de uma correlação seria muito difícil. Mesmo um coeficiente observado tão grande quanto 0,9 é insuficiente, pois a probabilidade é de 29% de obter |r| ≥ 0,9, de três medições de variáveis não correlatas.

Se é achada uma correlação de 0,7 de seis medições, a situação é um pouco melhor, mas ainda não suficientemente boa. Com N = 6, a probabilidade de achar |r| ≥ 0,7 de variáveis não correlatas é 12%. Esta probabilidade não é suficientemente pequeno para excluir a possibilidade que x e y sejam não correlatos.

Por outro lado, se é achada uma correlação de r = 0,7 com 20 medições, tem-se uma forte evidência de uma correlação, porque quando N = 20 a probabilidade de se ter |r| ≥ 0,7 de duas variáveis não correlatas é de somente 0,1%. Por qualquer padrão, isto é muito pouco provável e pode-se com confiança dizer que uma correlação é indicada. Em particular, a correlação pode ser chamada altamente significativa porque a probabilidade associada é menor que 1%.

Page 113: Analise Incerteza

Covariância e Correlação

102

Principais Definições e Equações do Capítulo 9

Covariância Dados N pares de medições

(x1, y1),..., (xN, yN) de duas quantidades x e y, define-se sua covariância como:

∑=

−−=σN

1iiixy )yy)(xx(

N1 [Ver (9.8)]

Se agora estes valores medidos são

usados para calcular uma função q(x, y), o desvio padrão de q é dado por:

xy2y

22x

22q y

qxq2

yq

xq

σ∂∂

∂∂

+σ⎟⎟⎠

⎞⎜⎜⎝

⎛∂∂

+σ⎟⎠⎞

⎜⎝⎛

∂∂

[Ver (9.9)]

Se as incertezas em x e y são

independentes, então σxy = 0 e esta equação se reduz à fórmula usual para a propagação da incerteza. Se as incertezas são independentes ou não, a desigualdade de Schwarz (9.11) estabelece o limite superior:

yxq yq

xq

σ∂∂

+σ∂∂

≤σ [Ver (9.12)]

Coeficiente de correlação Dadas N medições (x1, y1), ..., (xN, yN) de

duas variáveis x e y, define-se o coeficiente de correlação r como

∑ ∑∑

−−

−−=

σσ

σ=

2i

2i

ii

yx

xy

)yy()xx(

)yy)(xx(r

[Ver (9.15)]

Uma forma equivalente, que é normalmente mais conveniente, é

∑ ∑∑

−−

−=

)yNy)(xNx(

yxNyxr

22i

22i

ii

Valores de r próximos de 1 ou –1 indicam

forte correlação linear; valores próximos de 0 indicam pequena ou nenhuma correlação. A probabilidade ProbN(|r| ≥ ro) que N medições de duas variáveis não correlatas dêem um valor de r maior que qualquer valor observado ro é tabulada na Tab. 9.4. Quanto menor a probabilidade, melhor é a evidência que as variáveis x e y realmente sejam correlatas. Se a probabilidade é menor que 5%, diz se que a correlação é significativa; se for menor que 1% diz se que a correlação é altamente significativa.

Apostilas\Incerteza JRTaylor8.doc 30 JAN 98 (Substitui 01 JAN 98)

Page 114: Analise Incerteza

Distribuição Binomial

103

10. Distribuição Binomial

10.1. Introdução A distribuição de Gauss ou normal é o

único exemplo de uma distribuição estudada até agora. Neste capítulo será vista a distribuição binomial e no próximo, a distribuição de Poisson

10.2. Distribuições O Capítulo 5 introduziu a idéia de

distribuição, função que descreve a proporção de vezes que uma medição repetida fornece cada um de seus vários possíveis resultados. Por exemplo, pode-se fazer N medições do período T de um pêndulo e achar a distribuição dos vários valores medidos de T ou se pode medir as alturas h de N baianos e achar a distribuição das várias alturas medidas.

Depois se introduziu a noção de distribuição limite, a distribuição que seria obtida no limite em que o número de medições N se tornasse muito grande. A distribuição limite pode ser vista como mostrando a probabilidade que uma medição assuma qualquer um dos valores possíveis: a probabilidade que uma medição do período forneça qualquer valor particular T; a probabilidade que um baiano (escolhido aleatoriamente) tenha uma particular altura de 1,70 m. Por isso, a distribuição limite é também chamada de distribuição probabilidade.

Uma das muito possíveis distribuições limites, a única que já foi discutida, é a distribuição normal ou de Gauss, que descreve a distribuição de resultados para qualquer medição sujeita a muitas fontes de incertezas que são todas aleatórias e pequenas. Como tal, a distribuição de Gauss é a mais importante de todas as distribuições limites para o metrologista. Mesmo assim, várias outras distribuições tem grande importância prática ou teórica e serão apresentadas duas agora.

Este capítulo descreve a distribuição binomial, que é de grande importância prática para o metrologista. Sua simplicidade a torna uma introdução excelente para muitas propriedades de distribuições e ela é teoricamente importante, porque se pode derivar dela a de Gauss.

10.3. Probabilidade no lançamento de dados

A distribuição binomial pode ser melhor descrita por um exemplo. Seja a experiência de lançar três dados e registrar o número de azes saídos. Os resultados possíveis da experiência são os resultados 0, 1, 2 ou 3 dados. Se a experiência é repetida um número muito grande de vezes, acha-se a distribuição limite, que irá dizer a probabilidade que em qualquer um lançamento dos três dados, se obtenha ν azes, onde ν = 0, 1, 2 ou 3.

Esta experiência é suficientemente simples que se pode facilmente calcular a probabilidade de quatro possíveis saídas. Observa-se, primeiro, que assumindo os dados honestos, a probabilidade de sair um ás quando lançando um dado é 1/6. Seja agora jogar três dados e achar a probabilidade de se obter três azes (ν = 3). Como cada dado separada tem probabilidade de dar um ás igual a 1/6, e como os três lançamentos são independentes, a probabilidade para três azes é

Prob (3 azes em 3 dados) = 216

161 3

=⎟⎠

⎞⎜⎝

= 0,005 = 0,5%

O cálculo da probabilidade para dois dados (ν = 2) é um pouco mais difícil porque se pode obter dois azes em três dados de vários modos:

1. A, A e não A (1o e 2o lançamentos) 2. A, não A e A (1o e 3o lançamentos) 3. não A, A e A (2o e 3o lançamentos)

Seja a probabilidade de obter dois azes em

qualquer ordem definida, por exemplo, (A, A e não ). A probabilidade para o primeiro dado dar ás é 1/6 e para o segundo dar ás é também 1/6 mas a probabilidade para o terceiro não dar ás é de 5/6. Assim, a probabilidade para dois azes nesta ordem determinada é de

Prob (A, A, não A) = ⎟⎠

⎞⎜⎝

⎛×⎟⎠

⎞⎜⎝

⎛65

61 2

Page 115: Analise Incerteza

Distribuição Binomial

104

= 0,069 = 2,3%

A probabilidade para dois azes em

qualquer outra ordem definida é a mesma. Finalmente, há três ordens diferentes para se obter dois azes.

Prob (2 azes em 3 lançamentos) =

= ⎟⎠

⎞⎜⎝

⎛×⎟⎠

⎞⎜⎝

⎛×65

613

2

= (10.1)

= 0,069 = 6,9%

Do mesmo modo, obtém-se as

probabilidades para se obter um ás em três lançamentos

Prob (1 ás em 3 lançamentos) =

2

65

613 ⎟

⎞⎜⎝

⎛×⎟⎠

⎞⎜⎝

⎛× =

= 0,347 = 34,7%

e para sair nenhum ás em 3 lançamentos:

Prob (0 ás em 3 lançamentos) = 3

65

⎟⎠

⎞⎜⎝

⎛ =

= 0,579 = 57,9% As conclusões numéricas podem ser

resumidas desenhando a distribuição probabilidade para o número de azes obtido quando jogando três dados, como na Fig. 10.1. Esta distribuição é um exemplo da distribuição binomial.

Fig. 10.1. Probabilidade de obter � azes lançando três dados. Esta função é a distribuição binomial Bn,p(ν), com n=3 e p=1/6.

10.4. Definição da distribuição binomial Para descrever a distribuição binomial

geral, é preciso introduzir alguma terminologia. Seja fazer n testes independentes, tais como jogar n dados, lançar n moedas ou testar n produtos finais. Cada teste pode ter várias saídas: o dado pode mostrar qualquer um lado de 1 a 6, a moeda pode mostrar cara ou coroa, um produto final pode estar bom ou mau. A saída de interesse é chamada de sucesso. Assim, sucesso pode ser obter um ás em um dado ou uma coroa numa moeda ou ter um produto rejeitado. Denota-se por p a probabilidade de sucesso em qualquer teste e por q = 1 – p a de falha (ou seja, obter uma saída diferente da de interesse). Assim, p = 1/6 para se obter um ás em um dado, p = ½ para coroa em uma moeda e p poderia ser de 5% para se obter um produto rejeitado na linha de inspeção.

Armado com estas definições , pode-se agora calcular a probabilidade de obter ν sucessos em n testes. Um cálculo mostra que esta probabilidade é dada pela chamada distribuição binomial:

Prob (ν sucessos em n testes) = Bn,p(ν)

= ν−ν

ν×××+ν−− nqp

...21)1n)...(1n(n (10.2)

Aqui, a letra B significa binomial; os índices

n e p em Bn,p(ν) indicam que a distribuição depende de n, número de testes feitos e p, probabilidade de sucesso em cada teste.

A distribuição (10.2) é chamada de distribuição binomial por causa de sua ligação com a bem chamada expansão binomial. Especificamente, a fração em (10.2) é o coeficiente binomial, geralmente denotado

ν×××+−ν−−

=⎟⎟⎠

⎞⎜⎜⎝

⎛ν ...21

)1n)...(1n(nn= (10.3)

= )!n(!

!nν−ν

(10.4)

onde foi introduzida a útil notação fatorial: n! = 1 x 2 x ... x n 0 2 1 3

0%

50% 57,9%

34,7%

6,9% 0,5%

Page 116: Analise Incerteza

Distribuição Binomial

105

[Por convenção, 0! = 1 e ⎟⎟⎠

⎞⎜⎜⎝

⎛0n =1.]

O coeficiente binomial aparece na expansão binomial

(p + q)n = pn + npn-1q + ... + qn

∑=ν

ν−ν⎟⎟⎠

⎞⎜⎜⎝

⎛ν

n

0

nqpn

(10.5)

que vale para quaisquer dois números p e q e qualquer inteiro positivo n.

Com a notação (10.3), pode-se reescrever a distribuição binomial em forma mais compacta

Distribuição binomial Prob (n sucessos em n testes) = Bn,p(ν)

= ν−ν⎟⎟⎠

⎞⎜⎜⎝

⎛ν

nqpn

(10.6)

onde, como usual, p denota a probabilidade de sucesso em uma tentativa e q = 1 – p, a probabilidade de falha.

A obtenção do resultado (10.6) é semelhante ao exemplo do lançamento de dados em (10.1),

Prob (2 azes em 3 testes) =

⎟⎠⎞

⎜⎝⎛×⎟

⎠⎞

⎜⎝⎛×

65

613

2

(10.7)

De fato, se foi estabelecido n = 2, n = 3 e p

= 1/6, obtém-se precisamente (10.7), como pode ser demonstrado. Além do mais, o significado de cada fator em (10.6) é o mesmo que do correspondente fator em (10.7). O fator p ν é a probabilidade de obter todos sucessos em qualquer teste definido ν e qn- ν é a probabilidade de falhar nos restantes n – ν testes. O coeficiente binomial

⎟⎟⎠

⎞⎜⎜⎝

⎛0n é facilmente

mostrado ser o número de ordens diferentes em que pode haver ν sucessos em n testes. Isto estabelece que a distribuição binomial (10.6) é realmente a probabilidade reclamada.

Exemplo: lançamento de quatro moedas Suponha o lançamento de quatro moedas

(n = 4) e a contagem de vezes em que cara é obtida, ν. Qual a probabilidade de se obter os vários valores possíveis: ν = 0, 1, 2, 3, 4?

Como a probabilidade de sair cara em um lançamento é de ½ , a probabilidade requerida é simplesmente a distribuição binomial Bn,p(ν ), com n = 4, p = q = ½ .

Prob (ν caras em 4 jogadas) = 4

21

n4

⎟⎠⎞

⎜⎝⎛

⎟⎟⎠

⎞⎜⎜⎝

Estas probabilidades são facilmente calculadas. Por exemplo,

Prob (0 caras em 4 jogadas) = 4

211 ⎟

⎠⎞

⎜⎝⎛× =

= 0,0625 = 6,25%

Fig. 10.2. A distribuição binomial Bn,p(ν) com n = 4, p = ½. Ela dá a probabilidade de se obter ν caras quando se lançam quatro moedas.

Todas as cinco probabilidades estão

mostradas na Fig. 10.2. Vê-se que o número mais provável de caras é ν = 2, como era esperado. Aqui, as probabilidades são simétricas em relação ao valor mais provável. Ou seja, a probabilidade para três caras é a mesma para uma cara e a probabilidade para quatro é a mesma para nenhuma cara. Como será visto, esta simetria só ocorre quando p = ½.

2 3 4 10

50%

0%

37,5%

25,0%

6,25%

25,0%

6,25%

Page 117: Analise Incerteza

Distribuição Binomial

106

Probleminha rápido 10.1. Se for retirada uma carta aleatoriamente de

um baralho com 52 cartas, a probabilidade de se obter qualquer um dos quatro naipes é ¼. Se é retirada uma carta, substituindo esta carta em cada tirada, qual é a probabilidade de

(a) tirar três cartas de copas (♥)? Resp. 1,6% (b) tirar exatamente duas de copas? Resp.

14,1% (c) tirar duas ou mais cartas de copas?.

15,6%

10.5. Propriedades da distribuição binomial

A distribuição binomial Bn,p(ν ) dá a probabilidade de se obter n sucessos em ν vezes, quando p é a probabilidade de sucesso em uma única vez. Se a experiência completa é repetida, consistindo de n testes, muitas vezes, então é natural perguntar qual o número médio possível de sucessos. Para encontrar esta média, somam-se todos os valores possíveis de n, cada um multiplicado por sua probabilidade:

∑=ν

νν=νn

0p,n )(B (10.8)

e é facilmente calculada como:

ν = np (10.9) Ou seja, se as séries de n tentativas é

repetida várias vezes, o número médio de sucesso será a probabilidade de sucesso em uma tentativa (p) vezes n, como seria esperado.

Do mesmo modo, pode-se calcular o desvio padrão σν no número de sucessos, dando:

)p1(np −=σν (10.10)

Quando p = ½ (como no lançamento de

moeda), o número médio de sucessos é n/2. Mais ainda, é fácil provar para p = ½ que

Bn,½ (ν ) = Bn,½ (n - ν ) (10.11) Ou seja, a distribuição binomial com p = ½

é simétrica em relação à média n/2, como visto na Fig. 10.2.

Em geral, quando p ≠ ½ , a distribuição binomial é não simétrica. Por exemplo, a Fig. 10.1 é claramente não simétrica e o

número mais provável de sucessos é ν = 0 e a probabilidade diminui continuamente para ν = 1, 2 e 3. Também, o número médio de sucessos ( ν = 0,5) aqui não é o mesmo que o número mais provável de sucessos (ν = 0).

É interessante comparar a distribuição binomial Bn,p(ν ) com a distribuição mais familiar, a de Gauss, GX,σ(x). Talvez a maior diferença é que a experiência descrita pela distribuição binomial tem saídas dadas por valores discretos, ν = 1, 2, ..., n, enquanto as saídas da distribuição de Gauss são dadas por valores contínuos da quantidade medida x. A distribuição de Gauss é simétrica, com o pico centrado no valor médio x = X, que significa que o valor médio X é também o mais provável [para o qual a GX,σ(x) é máxima]. Como visto, a distribuição binomial é simétrica somente quando p = ½ e, em geral, o valor médio não coincide com o valor mais provável.

Aproximação gaussiana para a distribuição binomial

Mesmo com suas diferenças, as distribuições binomial e de Gauss têm uma importante ligação. Se é considerada a distribuição binomial Bn,p(ν ) para qualquer valor fixo de p, então quando n é grande, Bn,p(ν ) se aproxima muito da distribuição de Gauss GX,σ(x) com a mesma média e mesmo desvio padrão, ou seja, Bn,p(ν ) ≈ GX,σ(x) (n grande) (10.12) com

X = np e )p1(np −=σ

A eq. (10.12) é considerada a aproximação

da gaussiana para a distribuição binomial Não será provado aqui, mas sua verdade é

claramente ilustrada na Fig. 10.3, que mostra como a distribuição binomial para p = ¼ e para três valores sucessivamente grandes de n (n = 3, 12 e 48). Superposta em cada distribuição binomial está a distribuição gaussiana com a mesma média e mesmo desvio padrão. Com apenas três testes, a distribuição binomial é muito diferente da correspondente distribuição gaussiana. Em particular, a distribuição binomial é nitidamente assimétrica, enquanto a distribuição gaussiana é perfeitamente simétrica em relação a sua média. Porém, para n = 12, a assimetria da distribuição binomial é muito menos pronunciada e as duas distribuições estão muito próximas entre si. Com n = 48, a diferença entre a binomial e a correspondente distribuição gaussiana é

Page 118: Analise Incerteza

Distribuição Binomial

107

mínima e na prática as duas podem ser consideradas iguais.

Fig. 10.3. As distribuições binomiais para p = ¼ e n = 3, 12 e 48. A curva contínua superposta em cada desenho é a função de Gauss com a mesma média e o mesmo desvio padrão.

A distribuição binomial poder ser

aproximada pela distribuição gaussiana, quando n for muito grande, é muito útil, na prática. Cálculo da função binomial com n maior que 20 é muito trabalhoso, enquanto que o cálculo da função de Gauss é sempre muito simples, quaisquer que sejam os valores de X e σ. Para ilustrar isto, seja a probabilidade de se conseguir 23 caras em 36 lançamentos de uma moeda. Esta probabilidade é dada pela distribuição binomial B36,½ (ν). Assim,

Prob(23 caras em 36 jogadas) = B36,½ (23).

(10.14)

= 36

21

!13!23!36

⎟⎠⎞

⎜⎝⎛ (10.15)

que, com um cálculo complicado dá

Prob (23 caras) = 3,36% Por outro lado, como a média da

distribuição é np = 18 e o desvio padrão é σ = )p1(np − = 3, pode-se aproximar (10.14) pela função de Gauss G18,3(23) e um simples cálculo dá

Prob (23 caras) ≈ G18,3(23) = 3,32%

Para quase todas as aplicações, esta aproximação é excelente.

A utilidade da aproximação gaussiana é até mais obvia quando se quer a probabilidade de várias saídas. Por exemplo, a probabilidade de obter 23 ou mais caras em 36 lançamentos é

Prob (23 ou mais caras) =

Prob (23 caras) + Prob (24 caras) + ... + Prob (36 caras)

uma soma tediosa para se calcular diretamente. Se a distribuição binomial é aproximada por uma gaussiana, porém, então a probabilidade é facilmente achada. Como o cálculo das probabilidades gaussianas trata ν como uma variável contínua, a probabilidade para ν = 23, 24, ..., 36 é mais bem calculada como ProbGauss(ν≥22,5), a probabilidade para qualquer ν≥22,5. Agora, ν = 22,5 é 1,5 desvios padrão acima do valor médio, 18. (Lembrar, σ = 3, então 4,5 = 1,5 σ). A probabilidade de um resultado mais que 1,5σ acima da média iguala a área sob a função de Gauss mostrada na Fig. 10.4. Ela é facilmente calculada com a ajuda da tabela no Apêndice B e se acha Prob (23 ou mais caras) ≈ ProbGauss (ν ≥ X + 1,5�)

= 6,7%

(Este valor é próximo do valor exato de 6,6%).

Fig. 10.4. A probabilidade de um resultado ser maior que 1,5 σ acima da média é a área hachuriada sob a curva de Gauss.

10.6. Distribuição de Gauss para incertezas aleatórias

No capítulo 5, foi dito que uma medição sujeita a muitas pequenas incertezas aleatórias era distribuída normalmente. Agora, há condição de se provar esta afirmação, usando um modelo simples para o tipo de medição considerado.

Seja a medição de uma quantidade x cujo valor verdadeiro é X. Assume-se que as medições são sujeitas a incertezas sistemáticas desprezíveis mas há n fontes

Page 119: Analise Incerteza

Distribuição Binomial

108

independentes de incerteza aleatória (efeitos de paralaxe, tempos de reação, condições ambientais, operador). Para simplificar a discussão, admite-se que todas estas fontes produzam incertezas aleatórias do mesmo tamanho fixo ε. Isto é, cada fonte de incerteza empurra o resultado para cima ou para baixo por ε e estas duas probabilidades ocorrem com igual probabilidade p = ½ .Por exemplo, se o valor verdadeiro é X e se há apenas uma fonte de incerteza, os resultados possíveis são

x = X – ε x = X + ε

ambos com a mesma probabilidade.

Se houver duas fontes de incerteza, uma medição poderia fornecer

x = X – 2ε (se as duas fontes forem negativas)

x = X (duas fontes de incertezas se cancelam)

x = X + 2ε (se as duas fontes forem positivas)

Estas possibilidades são mostradas nas Fig. 10.5 (a), (b) e (c).

Em geral, se houver n fontes de incerteza, os resultados cairão na faixa de

x = X – nε a x = X + nε Em uma da medição, se ν fontes

acontecerem de dar incertezas positivas e (n - ν) incertezas negativas, o resultado será:

x = X + νε − (n - ν) ε (10.16) = X + (2ν - n) ε A probabilidade de este resultado ocorrer é

exatamente a probabilidade binomial

Prob(ν incertezas positivas) = Bn,½ (ν) (10.17)

Assim, os resultados possíveis da medição

são simetricamente distribuídos em torno do valor verdadeiro X e as probabilidades são dadas pela função binomial (10.17).

(a) (b) (c) Fig. 10.5. Distribuição de medições sujeitas a n incertezas

aleatórias de tamanho e, para n = 1, 2 e 32. As curvas continuas superpostas sobre (b) e (c) são as

funções de Gauss com o mesmo centro e largura (As escalas verticais são diferentes nos três gráficos.)

Esta distribuição é ilustrada na Fig. 10.5

para n = 1, 2 e 32. Agora pode-se afirmar que, se o número de

fontes de incerteza, n, é grande e o tamanho das incertezas individuais, ε, é pequeno, então as medições são normalmente distribuídas. Sendo mais preciso, nota-se que o desvio padrão da distribuição binomial é σx =

)p1(np − = 4/n . Assim, de acordo com (10.16), o desvio padrão das medições de x é σx = 2εσν = nε . Por conseguinte, faz-se n ∞ e ε 0, de modo que σx = nε permanece fixo. Duas coisas acontecem com o resultado:

1. a distribuição binomial se aproxima da distribuição gaussiana com centro em X e largura σx.

2. Quando ε 0, os resultados possíveis da medição se tornam mais próximos, de modo que a distribuição discreta se aproxima de uma contínua, que é precisamente a esperada distribuição gaussiana.

10.7. Aplicações e teste de hipótese Assim que se sabe como os resultados de

uma experiência são distribuídos, pode-se questionar se os resultados reais da experiência foram distribuídos como esperado. Este tipo de teste de uma distribuição é uma técnica importante na metrologia e mesmo em outras ciências exatas, biológicas e sociais. Um teste importante, do χ2 (qui quadrado), é assunto do Capítulo 12. Aqui, serão dados dois exemplos de um teste mais simples que pode ser aplicado a certos problemas envolvendo a distribuição binomial.

Teste de uma graxa de ski Seja um fabricante de graxa de ski, que diz

ter desenvolvido uma nova graxa que reduz grandemente o atrito entre o ski e a neve. Para testar esta afirmação pode-se tomar 10 pares de skis e passar graxa neles. Então, mantém-se corridas entre os skis tratados e os não tratados, deixando-os deslizar abaixo de uma rampa coberta de neve.

Se os skis tratados ganharem todas as 10 corridas, tem-se obviamente um resultado claro, mas mesmo quando se faz isso, deve-se ter uma medida quantitativa da força desta evidência. Assim, devem ser levantadas duas questões:

1. como se pode quantificar a evidencia que a graxa funciona (ou não funciona)?

Page 120: Analise Incerteza

Distribuição Binomial

109

2. onde se coloca a linha divisória? Se os skis tratados ganharam 9 das 10 corridas, este resultado é conclusivo? Se fossem 8 corridas? Ou 7?

Precisamente estas questões aparecem em vários testes estatísticos similares. Se se quer testar a eficácia de um fertilizante, se poderia organizar corridas entre plantas tratadas e não tratadas. Para prever que candidato vai ganhar a eleição, pode-se escolher uma amostra aleatória de eleitores e provocar corridas entre os candidatos com os participantes da amostra. Também, pode-se testar a ação de remédio entre vários pacientes.

Para responder as questões, deve se decidir mais precisamente o que se espera dos testes. Na terminologia aceita, deve-se formular uma hipótese estatística. No exemplo da graxa do ski, a hipótese mais simples é a hipótese nula, que a nova graxa realmente não faz diferença. Fazendo esta hipótese, pode-se calcular a probabilidade dos vários resultados possíveis do teste e então julgar a significância de um resultado particular.

Suponha-se que a hipótese tomada é que a graxa do ski não faz diferença. Em qualquer uma corrida, os skis tratados e não tratados devem ter a mesma probabilidade de ganhar, ou seja, a probabilidade para um ski tratado ganhar é p = ½. A probabilidade que os skis tratados ganham ν das 10 corridas é então a probabilidade binomial:

Prob(ν vitórias em 10 corridas) = B10,½ (ν)

10

21

)!10(!!10

⎟⎠⎞

⎜⎝⎛

ν−ν (10.18)

De acordo com (10.18), a probabilidade

que os skis tratados ganhem todas as 10 corridas é Prob (10 vitórias em 10 corridas) = (½)10 = 0,1%

(10.19) Isto é, se a hipótese de nulo é correta, os

skis tratados teriam muito pequena probabilidade de ganhar todas as 10 corridas. Pensado de modo contrario, se os skis tratados ganharam todas as 10 corridas, a hipótese de nulo é pouco provável de ser correta. De fato, a probabilidade (10.19) é tão pequena, que se pode dizer a evidência em favor da graxa é altamente significativa.

Suponha-se agora que os skis tratados tenham ganho 8 de 10 corridas. Aqui, pode-se

calcular a probabilidade de oito ou mais vitórias:

Prob (8 ou mais vitórias em 10 corridas) =

= Prob (8 vitórias) + Prob (9 vitórias) + Prob

(10 vitórias) = 5,5% 10.20) Para os skis tratados ganharem oito ou

mais corridas é ainda pouco provável (5,5%), mas a probabilidade não é tão pequena como era de ter 10 vitórias em 10 corridas (0,1%).

Para decidir que conclusão tirar das oito vitórias, deve-se reconhecer que há duas alternativas, na realidade:

1. a hipótese de nulo é correta (a graxa não faz diferença) mas, pela probabilidade, aconteceu um evento pouco provável (os skis tratados ganharam 8 corridas em 10).

2. a hipótese de nulo é falsa e a graxa faz diferença.

Em teste estatístico, por tradição, toma-se uma probabilidade definida (por exemplo, 5%) para definir o limite, abaixo do qual um evento é considerado inaceitavelmente improvável. Se a probabilidade da saída real (oito ou mais vitórias, no exemplo) estiver abaixo deste limite, escolhe se a alternativa (2), rejeita a hipótese e diz que o resultado da experiência foi significativo.

Por consenso, diz que um resultado é significativo se sua probabilidade é menor que 5% e é considerada altamente significativa se sua probabilidade é menor que 1%. Como a probabilidade (10.20) é 5,5%, vê se que oito vitórias entre dez para os skis engraxados não são suficientes para dar uma evidência significativa que a graxa funciona. Por outro lado, se foi visto que a probabilidade de dez vitórias em dez corridas é de 0,1% e como este valor é menor que 1%, pode-se dizer que dez vitórias constitui uma evidência altamente significativa que a graxa ajuda.

Procedimento geral Os métodos do exemplo anterior podem ser

aplicados a qualquer conjunto de n testes (chamados de corridas) semelhantes mas independentes, cada um deles com as mesmas duas saídas possíveis, sucesso ou falha.

Uma hipótese é formulada, aqui simplesmente um valor assumido para a probabilidade p de sucesso em qualquer um teste. Este valor assumido de p determina o número médio esperado de sucessos, ν = np, em n testes. (Como usual, ν = np é o número medido de sucessos esperados se os n testes forem repetidos muitas vezes). Se o número real de sucessos, ν, nos n testes é próximo de

Page 121: Analise Incerteza

Distribuição Binomial

110

np, não há evidência contra a hipótese. (Se os skis engraxados ganham cinco de dez corridas, não há evidência que a graxa faça qualquer diferença). Se ν é apreciavelmente maior que np, calcula-se a probabilidade (dada uma hipótese) de obter ν ou mais sucessos. Se esta probabilidade é menor que o nível de significância escolhido (por exemplo, 5% ou 1%), argumenta-se que o número observado é inaceitavelmente improvável (se a hipótese é correta) e assim a hipótese deve ser rejeitada. Do mesmo modo, se o número de sucessos ν é apreciavelmente menor que np, pode-se argumentar similarmente, exceto que se pode calcular a probabilidade de obter ν ou menos sucessos.

Como esperado, este procedimento não fornece uma simples resposta que a hipótese é certamente verdade ou certamente falsa. Mas, ele dá uma medida quantitativa de quão razoável é o resultado, sob o ponto de vista da hipótese, de modo que se pode escolher um objetivo, porém arbitrário, critério para rejeição da hipótese. Quando um técnico estabelece conclusões baseadas em seu modo de pensar, ele deve estabelecer claramente o critério usado e a probabilidade calculada, de modo que os leitores possam julgar, por eles, se as conclusões são razoáveis ou não.

Pesquisa eleitoral Como um segundo exemplo, seja uma

eleição entre dois candidatos, A e B. Suponha que o candidato A reivindica que uma pesquisa extensiva estabeleceu que ele é favorito por 60% do eleitorado e suponha que o candidato B queira verificar este resultado (na esperança de mostrar que o candidato A tem muito menos votos que 60%).

Aqui, a hipótese estatística seria que 60% dos eleitores são favoráveis a A, de modo que a probabilidade que um eleitor aleatoriamente selecionado seja a favor de A seria p = 0,6. Reconhecendo que não se pode contar cada voto individual, seleciona-se uma amostra aleatória de 600 e pergunta-se sua preferência. Se 60% realmente são a favor de A, o número esperado na amostra em favor de A é np = 600 x 0,6 = 360. Se, na realidade, houve 330 votos para A, pode-se duvidar significativamente da hipótese que 60% são a favor de A?

Para responder esta questão, nota-se que, de acordo com a hipótese, a probabilidade que ν eleitores sejam a favor de A é a probabilidade binomial

Prob (ν eleitores de A) = Bn,p(ν) (10.21)

com n = 600 e p = 0,6. Como n é tão grande, é uma excelente aproximação para substituir a

função binomial pela função de Gauss apropriada, com centro em np = 360 e desvio padrão

)p1(np −=σν =

4,06,0600 ×× = 12. Prob (ν eleitores de A) = G360,12(ν)

O número médio esperado em favor de A é

360. Assim, o número que realmente escolheu A na amostra (330) é 30 menos que o esperado. Como o desvio padrão é 12, o resultado é 2,5 desvios padrão abaixo da média esperada. A probabilidade de um resultado baixo assim ou menor (de acordo com a tabela no Apêndice B) é 0,6%. Assim, o resultado é altamente significativo e ao nível de 1%, pode se rejeitar com confiança a hipótese que A é favorecido por 60%.

Este exemplo ilustra duas características gerais deste tipo de teste:

Tendo achado que 330 eleitores são favoráveis a A (isto é, 30 a menos que o esperado), calculou-se a probabilidade que o número favorecendo A seria 330 ou menos. Inicialmente se pensa que se poderia considerar a probabilidade que o número favorecendo A é precisamente ν = 330. Esta probabilidade é muito pequena (0,15%, de fato) e mesmo o resultado mais provável (ν = 360) tem uma pequena probabilidade (3,3%). Para ter uma medida apropriada de como é inesperado o resultado ν = 330, deve-se incluir ν = 330 e qualquer resultado que esteja abaixo da média.

O resultado ν = 330 era 30 menos que o resultado esperado, 360. A probabilidade de um resultado 30 ou mais abaixo da média é geralmente chamado uma probabilidade de uma ponta (one-tail), porque é a área sob uma ponta da curva distribuição, como na Fig. 10.6 (a). Em alguns testes, a probabilidade relevante é a probabilidade com as duas pontas de obter um resultado que difira da média esperada por 30 ou mais em qualquer direção, isto é, a probabilidade de obter ν < 330 ou ν ≥ 390, como na Fig. 10.6 (b). Se é usada uma probabilidade com uma ou duas extremidades em um teste estatístico depende do que se considera a alternativa interessante para a hipótese original. Aqui, devia-se mostrar que o candidato A era favorecido por menos do que o proclamado 60%, de modo que a probabilidade com uma extremidade era apropriada. Se devesse mostrar que o número favorecendo A era diferente de 60% (em

Page 122: Analise Incerteza

Distribuição Binomial

111

qualquer direção, a mais ou a menos), deve-se usar a probabilidade de duas extremidades. Na prática, a escolha de qual probabilidade usar é usualmente fácil. Em qualquer caso, o técnico sempre precisa estabelecer claramente a probabilidade e nível de significância escolhido e o valor calculado da probabilidade. Com esta informação, os leitores podem julgar a significância dos resultados por eles mesmos.

(a) (b) Fig. 10.6. (a) A probabilidade de uma extremidade de dar

um resultado de 30 ou mais abaixo da média. (b) A probabilidade de duas extremidades de dar um

resultado que difira da média de 30 ou mias em qualquer direção. (Não em escala)

Probleminha rápido 10.2 Se em 12 lançamentos de moeda deu 11

caras, pode-se ter evidência que a moeda está viciada em favor da cara? Assumindo que a moeda seja honesta, a probabilidade de obter cara em um único lançamento é p = ½. Fazendo esta hipótese, encontrar a probabilidade de haver obtido 11 ou mais caras em 12 lançamentos.

Resp.: Prob (11 ou 12 caras) = 0,32% e há uma

evidência significativa (até mesmo altamente significativa) que a moeda seja viciada em cara.

Page 123: Analise Incerteza

Distribuição Binomial

112

Principais Definições e Equações do Capítulo 10

Distribuição Binomial Considerando um experimento com várias

possíveis saídas e designando a saída particular em que se está interessado de sucesso, se a probabilidade de sucesso em qualquer teste é p, então a probabilidade de ν sucessos em n testes é dada pela distribuição binomial:

Prob (n sucessos em n testes) = Bn,p(ν)

= ν−ν⎟⎟⎠

⎞⎜⎜⎝

⎛ν

nqpn

[Ver (10.6)]

onde

⎟⎟⎠

⎞⎜⎜⎝

⎛0n denota o coeficiente binomial

)!n(!!nn

ν−ν=⎟⎟

⎞⎜⎜⎝

⎛ν

Se o conjunto todo de testes é repetido

muitas vezes, o número médio esperado de sucessos é

ν = np [Ver (10.9)]

e o desvio padrão de ν é

)p1(np −=σν ]Ver (10.10)]

Aproximação gaussiana para a distribuição binomial

Com n muito grande, a distribuição binomial Bn,p(ν ) é bem aproximada pela função de Gauss com a mesma média e mesmo desvio padrão, ou seja:

Bn,p(ν ) ≈ GX,σ(x) [Ver (10.12)]

onde

X = np

e

)p1(np −=σ [Ver (10.13)]

Page 124: Analise Incerteza

Distribuição de Poisson

113

11. Distribuição de Poisson

11.1. Introdução Este capítulo apresenta um terceiro

exemplo de uma distribuição limite, a distribuição de Poisson, que descreve os resultados de experimentos em que se contam eventos que ocorrem de modo aleatório mas com uma taxa média definida. Exemplos deste tipo de contagem aparecem em cada área da ciência, por exemplo, um sociólogo que conta o número de crianças nascidas em um hospital no período de uma semana. Um exemplo importante na física, é a contagem de decaimentos de uma amostra radioativa, como o físico nuclear que conta o número de partículas alfa desintegradas pela amostra de Rádio em intervalos de 10 s.

Este tipo de experimento com contagem foi discutido na seção 3.2, onde foi estabelecida, mas não provada, a regra da raiz quadrada. Se é contado o número de ocorrências de um evento deste tipo em um intervalo de tempo escolhido T e obtido ν contagens, então a melhor estimativa para o número médio verdadeiro no tempo T é ν e a incerteza nesta estimativa é ν .

Nas seções 11.1 e 11.2, será introduzida a distribuição de Poisson e mostradas algumas de suas propriedades. Em particular, será provado na seção 11.2 que o desvio padrão da distribuição de Poisson é a raiz quadrada do número esperado de eventos. Este resultado justifica a regra da raiz quadrada da seção 3.2. As seções 11.3 e 11.4 descrevem algumas aplicações da distribuição de Poisson.

11.2. Definição da distribuição de Poisson

Como um exemplo da distribuição de Poisson, suponha uma dada amostra de material radioativo e um detector conveniente para encontrar o número ν de partículas ejetadas em intervalos de dois minutos. Se o contador é confiável, o valor de ν não terá incerteza. Porém, se a experiência é repetida, se obterá certamente um valor diferente para ν. Esta variação no número ν não reflete a incerteza nas contagens (que podem ser isentas de erro), mas reflete o

caracter intrinsecamente aleatório do processo de desintegração radioativa.

Cada núcleo radioativo tem uma probabilidade definida para decair em qualquer intervalo de dois minutos. Se são conhecidos esta probabilidade e o número de núcleos, pode-se calcular o número médio esperado de decaimentos em dois minutos. Porém, cada núcleo decai em um tempo aleatório e em qualquer intervalo de dois minutos dado, o número de decaimentos pode ser diferente do número médio esperado.

Obviamente, a questão que aparece é: se a experiência é repetida muitas vezes, que distribuição será esperada para o número de decaimentos ν observados em intervalos de dois minutos? Foi estudada no Capítulo 10 e apresentada a distribuição binomial. Se há n núcleos e a probabilidade que qualquer um núcleo decaia é p, então a probabilidade de ν decaimentos é justo a probabilidade de ν sucessos em n testes ou Bn,p(ν). Neste tipo de experimento discutido, porém, há uma simplificação importante. O número de testes (isto é, núcleos) é enorme (n circa 1020). Sob estas condições (n grande e p pequeno), a distribuição binomial pode se tornar igual a uma distribuição chamada de distribuição de Poisson. Especificamente, pode ser mostrado que:

Prob (ν contagens em dado intervalo) = Pμ(ν) (11.1) onde a distribuição de Poisson, Pμ(ν), é dada por

Distribuição de Poisson

!e)(P

νμ

=νν

μ−μ (11.2)

Nesta definição, μ é um parâmetro

positivo (μ > 0) que, como será mostrado diretamente, é justo o número médio esperado de contagens em um intervalo de tempo considerado e ν! denota a função fatorial (com 0! = 1).

Page 125: Analise Incerteza

Distribuição de Poisson

114

Significância de μ como contagem média esperada

A distribuição de Poisson (11.2) não será derivada aqui, mas simplesmente será afirmado que ela é a distribuição apropriada para o tipo de experimento com contagem envolvida. Para estabelecer a significância do parâmetro μ em (11.2), tem-se somente de calcular o número médio de contagens, ν , esperado se o experimento de contagem é repetido várias vezes. Esta média é encontrada somando-se todos os valores possíveis de ν, cada um multiplicado por sua probabilidade:

∑∑∞

νμ−

=νμ ν

μν=νν=ν

00 !e)(P (11.3)

O primeiro termo desta soma pode ser

desprezado (porque é zero) e ν/ν! pode ser substituído por 1/(ν-1)!. Se é removido o fator comum de μe-μ, tem-se

∑∞

−νμ−

−νμ

μ=ν1

1

)!1(e (11.4)

A soma infinita que permanece é

μ=+μ

+μ+ e...!3!2

132

(11.5)

que é justo a função exponencial eμ (como indicada). Assim, a exponencial e-μ em (11.4) é exatamente cancelada pela soma que vale eμ e fica apenas

μ=ν (11.6)

Ou seja, o parâmetro μ que caracteriza a

distribuição de Poisson Pμ(ν) é simplesmente o número médio de contagens esperado se a contagem for repetida muitas vezes.

Às vezes, pode-se conhecer a priori a taxa média R em que os eventos são contados quando ocorrem. Neste caso, o número médio esperado de eventos em um tempo T é

μ = taxa x tempo = RT Por outro lado, se a taxa R é

desconhecida, então pela contagem do número de eventos no tempo T, pode-se ter uma estimativa para μ e assim para a taxa R, como

Restimado = μestimado/T

Exemplo: Contagem de desintegração radioativa

Foram desenvolvidos métodos precisos para a contagem das emissões das partículas alfa de uma amostra de tório radioativo à uma taxa de 1,5 por minuto. Se é contado o número de partículas alfa emitidas em dois minutos, qual é o resultado médio esperado? Qual é a probabilidade que se obtenha realmente este número? Qual é a probabilidade para observar ν partículas para ν = 0, 1, 2, 3 ou para v ≥ 5?

A contagem média esperada é justo a taxa média de emissões (R = 1,5 por minuto) multiplicada pelo tempo durante as observações (T = 2 minutos):

número médio esperado = μ = 1,5 x 2 = 3

Este resultado não significa, obviamente,

que é esperado observar exatamente três partículas em qualquer observação isolada. Pelo contrario, as probabilidades para observar qualquer número (ν) de partículas são dadas pela distribuição de Poisson

Prob (ν partículas) = P3(ν) = !

3e 3

ν

ν−

Em particular, a probabilidade de se

observar exatamente três partículas é de

Prob (3 partículas) = P3(3) = !3

3e3

3− = 0,22 = 22%

Note-se que, embora o resultado médio

esperado seja de ν = 3, espera-se obter este número somente em 22%, ou seja, cerca de uma vez em cada 5 testes.

As probabilidades para qualquer número ν podem ser calculadas do mesmo modo e obtém-se

Número ν 0 1 2 3 4

Probabilidade, % 5 15 22 22 17 Estas probabilidades (até ν = 9) são

plotadas na Fig. 11.1. O modo mais simples para achar a probabilidade de obter 5 ou mais contagens é somar as probabilidades para 0, 1, 2, 3 e 4 e depois subtrair a soma de 100% para dar

Prob (ν > 5) = 100% - (5 + 15 + 22 + 22 + 17)%

= 19%

Page 126: Analise Incerteza

Distribuição de Poisson

115

Fig. 11.1. A distribuição de Poisson P3(ν) dá as probabilidades de observar ν eventos em uma contagem onde a contagem média esperada é de 3.

Probleminha rápido 11.1. Em média, cada uma 18 galinhas de uma

granja botam 1 ovo por dia. Se é verificado a cada hora o número de ovos (para sua eventual retirada), qual é o número médio, μ, de ovos achados em cada visita horária? Usar a distribuição de Poisson Pμ(ν) para calcular as probabilidades de encontrar ν ovos, ν = 0, 1, 2, 3 e ν = 4 ou mais ovos. Qual é a probabilidade de achar exatamente μ ovos? Verificar as probabilidades mostradas na Fig. 11.2.

Fig. 11.2. A distribuição de Poisson P0,75(ν) dá a

probabilidade de se obter � eventos em uma experiência com contagem para a qual é esperada a média de 0,75.

11.3. Propriedades da distribuição de Poisson

Desvio padrão A distribuição de Poisson Pμ(ν) dá a

probabilidade de se obter o resultado ν em um experimento em que os eventos são contados aleatoriamente mas há uma taxa média definida. Foi visto que o parâmetro μ é precisamente a contagem média esperada ν , A próxima questão que aparece naturalmente é: qual o desvio padrão das contagens ν quando o experimento é repetido muitas vezes? O desvio padrão de qualquer distribuição (após um número grande de testes) é justo a raiz quadrada do desvio da média. Isto dá

22 )( ν−ν=σν

ou

222 )(ν−ν=σν (11.7) Para a distribuição de Poisson, já foi

encontrado que ν = μ e um cálculo similar dá

μ+μ=ν 22 Assim, a eq. (11.7) implica que

μ=σν (11.8)

Ou seja, a distribuição de Poisson com contagem média μ tem desvio padrão μ .

O resultado (11.8) justifica a regra da raiz quadrada da seção 3.2. Se é feito um experimento uma vez e é obtido o resultado ν, pode-se facilmente ver, usando o princípio da máxima probabilidade, que a melhor estimativa para a contagem média esperada é μestimado = ν. De (11.8), segue-se imediatamente que a melhor estimativa para o desvio padrão é justo ν . Em outras palavras, se é feita uma medição do número de eventos em um intervalo de tempo T e obtido o resultado ν, o resultado para a contagem média esperada no tempo T é

ν ± ν

(11.9) Este resultado é precisamente a regra da

raiz quadrada apresentada sem prova na eq. (3.2).

50%

1 2 3 5 4 0%

0

μ=0,75

20%

1 2 4 7 5

10%

0

μ=3

0 3 6 8 9 ν

P3(ν)

Page 127: Analise Incerteza

Distribuição de Poisson

116

Exemplo: Mais decaimento radioativo Uma amostra de tório é monitorada por

30 minutos e são contadas 49 partículas alfa. Qual é o resultado para o número de partículas emitidas em 30 minutos? Qual é o resultado para a taxa de emissão, R, em partículas por minuto?

De acordo com (11.9), o resultado para o número de partículas emitidas em 30 minutos é

(número emitido em 30 minutos) = 49 ± 49 =

= 49 ± 7 Para achar a taxa em partículas por

minuto, deve-se dividir por 30 minutos. Assumindo estes 30 minutos sem incerteza, acha-se

30749R ±

= = 1,6 ± 0,2 part/min (11.10)

Note-se que a regra da raiz quadrada dá

a incerteza no número contado real (σν = ν = 7, neste caso). Um erro comum é

calcular a taxa de decaimento R = ν/T e então tomar a incerteza em R como sendo de

R . Uma vista em (11.10) dá para perceber que este procedimento é simplesmente incorreto. A regra da raiz quadrada se aplica somente ao número contado real ν, e a incerteza em R = ν/T deve ser encontrada das incertezas em ν e em T usando a propagação da incerteza, como em (11.10).

Probleminha rápido 11.2 O granjeiro do Probleminha rápido 11.1

observa que em um certo período de 10 horas, foram colhidos 9 ovos. Baseado nesta observação,

(a) Qual seria a cota para o número de ovos esperado em 10 horas?

(b) Como seria dado a taxa R de produção de ovos, em ovos por hora?

(Dê as incertezas nas duas respostas).

Resposta: (a) (ovos colhidos em 10 horas) = 9 ± 3 ovos (b) R = 0,9 ± 0,3 ovos/hora

Aproximação gaussiana para a distribuição de Poisson

No Capítulo 10, a distribuição gaussiana foi comparada com a distribuição binomial.

Foi visto que em muitos casos, as duas distribuições são muito diferentes, embora, sob condições corretas, a distribuição gaussiana dê uma excelente e extremamente útil aproximação para a distribuição binomial. Como será visto agora, quase exatamente o mesmo pode ser dito acerca das distribuições de Gauss e de Poisson.

A distribuição gaussiana GX,σ(x) dá a probabilidade de vários valores de uma variável contínua x, enquanto a distribuição de Poisson Pμ(ν), como a binomial Bn,p(ν), dá a probabilidade para uma variável discreta ν = 0, 1, 2, 3, ... . Outra diferença importante é que a distribuição de Gauss GX,σ(x) é especificada para dois parâmetros, a média X e o desvio padrão σ, enquanto a distribuição de Poisson Pμ(ν) é especificada para um único parâmetro, a média μ, porque a largura da distribuição de Poisson é automaticamente determinada e vale σν =

μ ). Finalmente, a distribuição de Gauss é sempre em forma de sino e simétrica em relação ao seu valor médio, enquanto a distribuição de Poisson não tem nenhuma destas duas propriedades, em geral. Este último ponto é especialmente claro na Fig. 11.2 que mostra a distribuição de Poisson para μ = 0,75; esta curva certamente não tem formato de sino nem mesmo é aproximadamente simétrica em relação a sua média de 0,75.

Fig. 11.3. A distribuição de Poisson para μ = 9. A curva pontilhada é a distribuição de Gauss com a mesma média e desvio padrão (X = 9 e σx = 3). Quando μ ∞, as duas distribuições tornam-se iguais, mesmo com μ = 9 elas já se parecem

A Fig. 11.1 mostrou a distribuição de

Poisson para μ = 3. Embora esta curva não tenha obviamente a forma de sino, ela é inegavelmente mais próxima desta curva para μ = 0,75 na Fig. 11.2. A Fig. 11.3 mostra a distribuição de Poisson para μ = 9; esta curva tem um formato parecido com sino e é quase simétrica em torno de sua média (μ = 9). De

Page 128: Analise Incerteza

Distribuição de Poisson

117

fato, pode-se provar que, quando μ ∞, a distribuição de Poisson se torna progressivamente mais parecida com o sino e se aproxima da distribuição de Gauss com a mesma média e desvio padrão. Ou seja,

)(G)(P ,X ν≈ν σμ (quando μ grande)

(11.11) onde

X = μ e σ = μ Na Fig. 11.3, a curva pontilhada é a

função de Gauss com X = 9 e σ = 3. Pode se ver claramente como, mesmo quando μ é somente 9, a distribuição de Poisson é marcadamente próxima da função de Gauss apropriada. A pequena discrepância reflete a assimetria remanescente na função de Poisson.

A aproximação (11.11) é chamada de aproximação gaussiana para a distribuição de Poisson. É análoga à aproximação correspondente para a distribuição binomial (discutida na seção 10.4) e é útil sob as mesmas condições, ou seja, quando os parâmetros envolvidos são muito grandes.

Exemplo: Aproximação gaussiana para a distribuição de Poisson

Para ilustrar a aproximação gaussiana para a distribuição de Poisson, seja a distribuição de Poisson com μ = 64. A probabilidade de 72 contagens, por exemplo, é de

Prob(72 contagens) = P64(72) =

!72)64(e

7264− (11.12)

cujo cálculo complexo dá

Prob(72 contagens) = 2,9% De acordo com (11.11), porém, a

probabilidade (11.12) é bem aproximada pela função de Gauss:

Prob(72 contagens) = G64,8(72)

que é facilmente calculada para dar

Prob(72 contagens) = 3,0% Quando se quer calcular diretamente a

probabilidade de 72 ou mais contagens no mesmo experimento, um cálculo muito tedioso daria:

Prob(ν≥ 72) = P64(72) + P64(73) + ... = 17,3% Se é usada a aproximação (11.11), então

deve se apenas calcular a probabilidade de Gauss para obter ν≥ 71,5 (pois a distribuição de Gauss trata ν como uma variável contínua). Como 71,5 é 7,5 ou 0,94σ acima da média, a probabilidade requerida pode ser encontrada rapidamente da tabela no Apêndice B como

Prob(ν≥ 72) = PG(ν≥71,5) = PG(ν≥ X + 0,94σ)

=17,4%

que é uma boa aproximação, para quase qualquer padrão.

11.4. Aplicações Como já foi enfatizado, a distribuição de

Poisson descreve a distribuição de resultados em uma experiência com contagem, em que eventos aleatórios são contados, porém há uma taxa média definida. Os dois exemplos clássicos incluem a desintegração de núcleos radioativos e a contagem de chegada de raios cósmicos.

Outro exemplo muito importante é um experimento para estudar uma distribuição limite esperada, como as distribuições de Gauss, Poisson e binomial. Uma distribuição limite diz como muito eventos de um tipo particular são esperados quando um experimento é repetido muitas vezes. (Por exemplo, a distribuição de Gauss GX,σ(x) diz como muitas medições de x são esperadas cair em qualquer intervalo de x = a até x = b.) Na prática, o número observado é raramente igual ao número esperado. Em vez disso, ele flutua de acordo com a distribuição de Poisson. Em particular, se o número esperado de eventos de algum tipo é n, o número observado pode ser esperado diferir de n por um número da ordem de n .

Em muitas situações, é razoável esperar que os números sejam distribuídos de acordo com a distribuição de Poisson. O número de ovos postos em uma hora na granja e o número de nascimentos em um dia em um

Page 129: Analise Incerteza

Distribuição de Poisson

118

hospital ambos devem seguir a distribuição de Poisson, no mínimo, aproximadamente. Para testar esta hipótese, deve-se registrar o número considerado várias vezes. Após colocar no gráfico a distribuição resultante, pode-se compará-la com a distribuição de Poisson para ver como elas se aproximam. Para um teste quantitativo, pode-se usar o teste do χ2 (qui quadrado), mostrado no Capítulo 12.

Exemplo: Contagem de raios cósmicos Como outro exemplo da distribuição de

Poisson, seja um experimento com raios cósmicos. Estes raios são criados como partículas carregadas, como prótons ou partículas alfa, que entram na atmosfera da Terra do espaço. Muitas destas partículas primárias colidem com átomos na atmosfera e criam partículas secundárias, com mesons e positrons. Algumas destas partículas (tanto primárias como secundárias) viajam de algum modo para o nível do chão e podem ser detectadas (com um contador Geiger, por exemplo) em laboratório. No problema seguinte, explora-se o fato que o número de raios cósmicos incidindo em uma dada área em um dado tempo deve seguir a distribuição de Poisson.

Mede-se o número de raios cósmicos incidindo no contador Geiger em um minuto, várias vezes, e cuidadosamente obtém-se, em média, 9 partículas por minuto, com incerteza desprezível. Para verificar esta afirmação, conta-se novamente quantas partículas chegam em um minuto e obtém-se o resultado 12. Os dois resultados, 9 e 12, são consistentes? Faz-se uma terceira contagem do número de partículas que chegam em dez minutos. Da primeira medição, seria esperado obter 90, mas na realidade se obteve 120. Este valores são também consistentes?

Seja a segunda contagem. Se a primeira medição estiver correta, a contagem média esperada é 9. Como a distribuição das contagens deve seguir a distribuição de Poisson, o desvio padrão é 9 = 3. O segundo resultado é 12, somente um desvio padrão afastado da média 9. Este valor é certamente não suficientemente distante para contradizer a primeira contagem. Mais especificamente, sabendo-se que a probabilidade de qualquer resultado ν é suposta ser P9(ν), pode-se calcular a probabilidade total para se obter um resultado que difira de 9 por 3 ou mais. Esta probabilidade vale 40%. Obviamente, a segunda contagem não é tão surpreendente

e a primeira não tem razão de ser questionada.

A terceira contagem é muito diferente. Se a primeira estiver correta, a terceira deveria dar 90 contagens em 10 minutos. Como a distribuição deve ser a de Poisson, o desvio padrão deve ser 90 = 9,5. Assim, o terceiro resultado de 120 é maior três desvios padrão que a primeira medição de 90. Com estes números grandes, a distribuição de Poisson pode ser aproximada da distribuição gaussiana e pode achar imediatamente da tabela no Apêndice A que a probabilidade de uma contagem maior do que três desvios padrão da média é 0,3%. Ou seja, se a primeira contagem é correta, é muito improvável que a terceira seja de 120 contagens. Pode-se ver quase certamente que algo está errado por alguma das seguintes causas:

1. A primeira contagem não foi cuidadosa, como devia.

2. O contador funcionou mal para a primeira e terceira, introduzindo incertezas sistemáticas em um dos resultados.

3. A primeira contagem tenha sido feita em um tempo em que o fluxo de raios cósmicos tenha sido verdadeiramente menor que o normal.

11.5. Subtraindo um background Para concluir este capítulo, será discutido

o problema que complica muitos experimentos com contagem. Às vezes, os eventos a estudar são acompanhados com outros eventos ruídos ou panos de fundo que não podem ser distinguidos dos eventos de interesse. Por exemplo, no estudo de desintegrações de uma fonte radioativa, não se pode evitar que o detector registre partículas de outros materiais radioativos na vizinhança ou dos raios cósmicos. Isto significa que o número contado inclui os eventos de interesse mais os eventos espúrios e deve-se, de algum modo, subtrair os eventos não desejados. Em princípio, no mínimo, a solução é direta: tendo achado o número total (soma da fonte e do pano de fundo), deve-se remover a fonte e achar a taxa de eventos devidos ao pano de fundo apenas; a taxa de eventos da fonte é então a diferença entre duas taxas medidas.

Na prática, é surpreendentemente fácil cometer um erro neste procedimento, especialmente na análise da incerteza. É usualmente conveniente medir as contagens total e de pano de fundo usando diferentes intervalos de tempo. Suponha que se conte

Page 130: Analise Incerteza

Distribuição de Poisson

119

um total de νtot eventos (fonte mais ruído) no tempo Ttot e então νruído eventos de pano de fundo em um tempo Truido. Obviamente, não basta simplesmente subtrair νruído do νtot, porque eles se referem a intervalos de tempo diferentes. Ao invés, deve se primeiro calcular as taxas,

tot

tottot T

R ν=

e

ruído

ruídoruído T

R ν=

e então calcular a taxa da fonte como a diferença

Rfonte = Rtot – Rruído

Na estimativa das incertezas nas

quantidades envolvidas, deve-se lembrar que a regra da raiz quadrada dá as incertezas nos números contados νtot e νruído. As incertezas nas correspondentes taxas devem ser encontradas pela propagação da incerteza, como no exemplo seguinte.

Exemplo: Decaimento radioativo com ruído

Decide-se monitorar a atividade de uma fonte radioativa, colocando-a em um detector de cintilação. Depois de 10 minutos, o detector conta 2540 contagens. Para verificar a possibilidade da contagem indesejada de ruídos, a fonte e removida e depois de 3 minutos, o detector registra 95 contagens. Para achar a atividade da fonte, deve-se calcular as duas taxas de contagem, Rtot e Rruído (em contagens por minuto) e sua diferença Rfonte = Rtot - Rruído.

Qual é o resultado e sua incerteza? (Assumir que os dois tempos tem incertezas desprezíveis.)

De acordo com a regra da raiz quadrada, os dois números contados com suas incertezas são:

50254025402540total ±=±=ν

10959595total ±=±=ν

Dividindo estes números totais pelo

correspondente período de tempo, acham-se

525410

502540T

Rtotal

totaltotal ±=

±=

ν= cont/min

e

3323

1095T

Rruído

ruídoruído ±=

±=

ν= cont/min

Finalmente, a taxa devida apenas à fonte

é

Rfonte = Ttotal – Rruído = (254 ± 5) – (32 ± 3)

= 222 ± 6 cont/min Note-se que na última subtração as

incertezas foram combinadas em quadratura ( 22 356 += ), pois elas são certamente independentes e aleatórias.

Page 131: Analise Incerteza

Distribuição de Poisson

120

Definições e Equações do Capítulo 11

Distribuição de Poisson A distribuição de Poisson descreve

experimentos em que se contam eventos que ocorrem de modo aleatório mas em uma taxa média definida. Quando se tem uma contagem para um tempo escolhido T, a probabilidade de observar ν eventos é dada por :

!e)(P

νμ

=νν

μ−μ [Ver (11.2)]

onde o parâmetro μ é o número médio esperado de eventos no tempo T, ou seja:

ν = μ (após muitos testes) [Ver (11.6)]

O desvio padrão do número observado ν

é

μ=σν [Ver 11.8)]

Aproximação gaussiana para a distribuição de Poisson

Quando μ é grande, a distribuição de Poisson Pμ(ν) é bem aproximada pela função de Gauss com a mesma média e mesmo desvio padrão:

)(G)(P ,X ν≈ν σμ [Ver (11.11)]

onde

X = μ e σ = μ

Subtraindo o ruído Os eventos produzidos por uma fonte

sujeita a interferências indesejáveis de ruídos podem ser contados em três etapas de um procedimento:

1. Conta-se o número total νtotal (fonte mais ruído), em um tempo Ttotal e calcula se a taxa total Rtotal = νtotal/Ttotal

2. Remove-se a fonte e conta-se o número de eventos devidos ao ruído em um tempo Truido e calcula se a taxa do ruído Rruido = νruido/Truído.

3. Calcula-se a taxa de eventos da fonte com o a diferença Rfonte = Rtotal – Rruido.

4. Calculam-se as incertezas nos números νtotal e νruído através da regra

da raiz quadrada e destes valores, as incertezas nas três taxas.

Apostilas\Incerteza JRTaylor8.doc 25 SET 98 (Substitui 31 JAN 98)

Page 132: Analise Incerteza

Teste do Qui-Quadrado

121

12. Teste do Qui-Quadrado

12.1. Introdução Os capítulos anteriores apresentaram a

noção de distribuições limites, funções que descrevem a distribuição esperada de resultados se um experimento é repetido muitas vezes. Há muitas distribuições limites, correspondendo a muitos diferentes tipos de experimentos possíveis. Talvez as três mais importantes distribuições limites sejam as já discutidas: de Gauss (ou normal), binomial e Poisson.

Este capítulo final trata de como decidir se os resultados de uma experiência real são governados pela distribuição limite esperada. Especificamente, supõe-se que alguns experimentos são feitos e se acredita conhecer a distribuição esperado dos resultados. Supõe-se ainda que o experimento é repetido várias vezes e seus resultados são registrados. A questão colocada agora é esta: como pode se decidir se a distribuição observada é consistente com a distribuição teórica esperada? Esta questão pode ser respondida usando um procedimento simples chamado de teste χ2 ou qui quadrado (χ é a terceira letra grega, correspondente ao c e pronunciada como qui).

12.2. Introdução ao Qui Quadrado Suponha-se que foram feitas 40 medições

x1, x2, ..., x40 de uma faixa x de um projétil atirado de uma arma e os resultados são os mostrados na Tab. 12.1. Seja ainda que há razão para acreditar que estas medições são governadas pela distribuição de Gauss GX,σ(x), o que é certamente muito natural. Neste tipo de experimento, usualmente se conhece a priori ou o ponto central X ou a largura σx da distribuição esperada. O primeiro passo, portanto, é usar as 40 medições para calcular a melhor estimativa destas quantidades, que é a média.

No caso,

1,73040

xx i == ∑ cm (12.1)

e a melhor estimativa do desvio padrão é

σ = 39

)xx( 2i∑ −

= 46,8 cm

(12.2)

Tab. 12.1 Valores medidos de x (em cm)

731 772 771 681 722 688 653 757 733 742

739 780 709 676 760 748 672 687 766 645

678 748 689 810 805 778 764 753 709 675

698 770 754 830 725 710 738 638 787 712

Agora se pode questionar se a distribuição

real dos resultados x1, x2, ..., x40. é consistente com a hipótese que as medições são governadas pela distribuição de Gauss GX,σ(x) com X e σ como estimados. Para responder a esta pergunta deve-se computar como seria esperado que os 40 resultados se distribuíssem se a hipótese é verdadeira e comparar esta distribuição esperada com a distribuição real observada. A primeira dificuldade é que x é uma variável contínua, de modo que não se pode falar de número esperado de medições igual a um valor qualquer de x. Depois, deve-se discutir o número esperado em algum intervalo a < x <b. Isto é, deve-se dividir a faixa de valores possíveis em intervalos. Com 40 medições, pode-se escolher a largura do intervalo em X – σ e X + σ , dando 4 intervalos como na Tab. 12.2.

Tab. 12.2. Uma possível escolha de intervalos para os dados da Tab. 12.1. A coluna final mostra o número de observações que caem em cada intervalo

Intervalo

k Valores de x nos intervalos Observações

Ok

1 x < X – σ (ou x 683,3 8

2 X – σx <x < X (ou 683,3 < x < 730,1 10

3 X < x < x + σ (ou 730,1 < x < 776,9 16

4 X + σ < x (ou 776,9 < x) 6

Page 133: Analise Incerteza

Teste do Qui-Quadrado

122

Serão discutidos, mais tarde, os critérios para escolher os intervalos. Em particular, eles devem ser escolhidos de modo que todos os intervalos contenham vários valores medidos de x. Em geral, o número de intervalos é denotado por n; neste exemplo n = 4.

Tendo dividido a faixa de possíveis valores medidos em intervalos, pode-se agora formular a questão mais precisamente. Primeiro, pode-se contar o número de medições que caem em cada intervalo k. (Se uma medição cai exatamente no limite entre dois intervalos, pode-se atribuir a metade de uma medição para cada intervalo.) Este número é denotado por Ok (onde O significa número observado). Para os dados do exemplo dado, O1 , O2, O3 e O4 são mostrados na última coluna da Tab. 12.2. Depois, assumindo as medições distribuídas normalmente, com X e σ como estimado, calcula-se o número esperado Ek de medições em cada intervalo k. Deve-se decidir quão bem os números observados Ok se comparam com os números esperados Ek.

Fig. 12.1. As probabilidades Probk de uma medição cair em cada intervalo, k = 1, 2, 3 e 4 da Tab. 12.2 são as quatro áreas mostradas sob a função de Gauss.

O cálculo dos números esperados Ek é

muito direto. A probabilidade que qualquer uma medição caia em um intervalo a < x < b é justo a área sob a função de Gauss entre x = a e x = b. Neste exemplo, as probabilidades Prob1, Prob2, Prob3 e Prob4 para uma medição cair em cada um dos quatro intervalos são as quatro áreas indicadas na Fig. 12.1. As duas áreas iguais, Prob2 e Prob3 juntas representam a bem conhecida 68%, de modo que a probabilidade de cair em uma das duas áreas centrais é de 34%, ou seja Prob2 = Prob3 = 0,34. As duas áreas externas compreendem os restantes 32% e assim, Prob1 = Prob4 = 0,16. Para achar os números esperados Ek, simplesmente se multiplicam estas probabilidades pelo número total de medições, N = 40. Assim, os números esperados são os mostrados na terceira coluna da Tab. 12.3. Que os números Ek não são inteiros serve para lembrar que o número esperado não é o que realmente se espera em uma experiência mas sim, o número médio esperado depois que se repete a série inteira de medições muitas vezes.

O problema agora é decidir quão bem os números esperados Ek representam os correspondentes números observados Ok (na última coluna da Tab. 12.3). Obviamente não se espera uma perfeita concordância entre Ek e Ok, após qualquer número finito de medições. Por outro lado, se a hipótese que as medições são normalmente distribuídas é correta, espera se que, em algum sentido, os desvios

Ok – Ek (12.3)

sejam pequenos. De modo inverso, se os desvios Ok – Ek forem grandes, suspeita-se que a hipótese é incorreta.

Tab. 12.3. Os números esperados Ek e os números observados Ok para as 40 medições da Tab. 12.1, com os intervalos escolhidos como na Tab. 12.2.

Intervalo k

Probabilidade Probk

Número esperado, Ek

Número observado, Ok

1 16% 6,4 8 2 34% 13,6 10 3 34% 13,6 16 4 16% 6,4 6 Para tornar preciso a afirmação que o

desvio Ok – Ek seja pequeno ou grande, deve-se decidir quão grande se espera Ok – Ek ser se as medições são realmente distribuídas normalmente. Felizmente, esta decisão é fácil. Imaginando que as séries de 40 medições são repetidas muitas vezes, então o número Ok de medições em qualquer um dos intervalos k pode ser considerada como o resultado de uma experiência de contagem, do tipo descrito no capítulo 11. Os muitos diferentes resultados para Ok devem ter um valor médio de Ek e seria esperado flutuar em torno de Ek com um desvio padrão da ordem de kE . Os dois números a serem comparados são o desvio Ok – Ek e o tamanho esperado de sua flutuação kE .

Estas considerações levam a se considerar a relação

k

kk

EEO − (12.4)

Para alguns intervalos k, esta relação será

positiva e para alguns, negativa. Para uns poucos k, ela pode ser muito maior que um, mas para a maioria dos casos, ela deve ser da ordem de um ou menor que um. Para testar a hipótese de que as medições sejam

Page 134: Analise Incerteza

Teste do Qui-Quadrado

123

normalmente distribuídas, é natural elevar ao quadrado o número (12.4) para cada k e então somar todos os intervalos k = 1, 2, .., n (aqui, n = 4). Este procedimento define um número chamado χ2 (qui quadrado)

∑=

−=χ

n

1k k

2kk2

E)EO( (12.5)

Este número χ2 é claramente um indicador

razoável da concordância entre as distribuições observada e esperada. Se χ2 = 0, a concordância é perfeita, ou seja, Ok = Ek para todos os intervalos k, uma situação muito pouco provável de acontecer. Em geral, os termos individuais na soma (12.5) são esperados ser da ordem de 1, e há n termos na soma. Assim, se

n2 ≅χ

(χ2 da ordem de n ou menos), as

distribuições observadas e esperadas concordam entre si, tão bem quanto seria esperado. Em outras palavras, se χ2 é da ordem de n, não se tem razão para duvidar que as medições são distribuídas como esperado. Por outro lado, se

χ2 >> n (χ2 muito maior do o número de intervalos),

os números observados e esperados são muito diferentes entre si e há boa razão para suspeitar que as medições não são governadas pela distribuição esperada.

No exemplo, os números observados e esperados nos quatro intervalos e suas diferenças são mostrados na Tab. 12.4 e um simples cálculo com eles dá

∑=

−=χ

4

1k k

2kk2

E)EO(

= 4,6

)4,0(6,13)4,2(

6,13)6,3(

4,6)6,1( 2222 −

++−

+

= 1,80 (12.6)

Tab. 12.4. Dados da Tab. 12.1, mostrados aqui com as diferenças Ok - Ek

Intervalo k

Número observado, Ok

Número esperado, Ek

Diferença Ok - Ek

1 8 6,4 1,6 2 10 13,6 -3,6

3 16 13,6 2,4 4 6 6,4 -0,4 Como o valor de 1,80 para χ2 é menor que

o número de termos na soma (ou seja, 4), não há razão para duvidar da hipótese que as medições sejam normalmente distribuídas.

Probleminha rápido 12.1 São feitas 100 medições do tempo de

queda de uma bola e calculado tempo médio, t e o desvio padrão, σt. As medições são agrupadas em 4 intervalos, escolhidos como o exemplo estudado. Seus resultados são:

menos que ( t - σt): 19 entre ( t - σt) e t : 30 entre t e ( t + σt): 37 mais que ( t + σt): 14 Assumindo que estas medições sejam

normalmente distribuídas, quais são os números esperados de medições em cada um dos quatro intervalos. Qual é o χ2 e há razão para duvidar que as medições sejam normalmente distribuídas?

Resp.: Números esperados: 16, 34, 34, 16. χ2 = 10,0. Como χ2 >> n, as medições são provavelmente não normalmente distribuídas.

12.3. Definição geral do Qui Quadrado A discussão focalizou um exemplo

particular, 100 medições de uma variável contínua x, que denotou a faixa de um projetil disparado de uma certa arma. Foi definido o número χ2 e visto que ele é, no mínimo, uma medição superficial da concordância entre a distribuição observada de medições e a distribuição de Gauss que é esperado que as medições sigam. Pode-se agora definir e usar χ2 do mesmo modo para muitas experiências diferentes.

Seja uma experiência em que se mede um número x e para o qual há razão para esperar uma certa distribuição de resultados. A medição é repetida várias vezes (N) e sendo a faixa dos resultados possíveis dividida em n intervalos, k = 1, 2, ..., n, contam-se o número Ok de observações que realmente caíram em cada intervalo k. Assumindo que as medições sejam realmente governadas pela distribuição esperada, calcula-se o número esperado Ek de

Page 135: Analise Incerteza

Teste do Qui-Quadrado

124

medições no ko intervalo. Finalmente, calcula-se o χ2 exatamente como em 12.5:

∑=

−=χ

n

1k k

2kk2

E)EO( (12.7)

O significado aproximado de χ2 é sempre a

mesmo, como no exemplo anterior: 1. se χ2 < n, a concordância entre as

distribuições observada e esperada é aceitável.

2. Se χ2 >> n, há um desacordo significativo.

O procedimento para escolher os intervalos em termos do qual χ2 é comparado depende da natureza da experiência. Especificamente, depende de a quantidade medida ser contínua ou discreta.

Medições de uma variável contínua O exemplo discutido na Seção 12.1

envolvia uma variável contínua x e pouco mais precisa ser dito. A única distribuição limite já vista para uma variável contínua é a distribuição de Gauss mas há, obviamente, muitas outras distribuições que podem ocorrer. Por exemplo, em muitas experiências nucleares e atômicas, a distribuição esperada da variável medida x (energia) é a distribuição de Lorentz:

22)Xx(1)x(f

γ+−α

onde X e γ são certas constantes. Outro exemplo de uma distribuição contínua relacionada com a desintegração radioativa de átomos é a distribuição exponencial

τ−

τα /te1)x(f

onde a vida média esperada é τ.

Qualquer que seja a distribuição esperada f(x), a área total sob a curva f(x) é 1 e a probabilidade de uma medição entre x = a e x = b é justo a área entre a e b

Prob (a < x < b) = ∫b

adx)x(f

Assim, se o ko intervalo vai de x = ak até x = ak+1, o número esperado de medições no ko intervalo, após N medições em todos, é

Ek = N x Prob (ak < x < ak+1)

= ∫+1k

k

a

adx)x(fN (12.8)

Quando se discute o uso quantitativo do teste χ2 na Seção 12.4, se vê que os números esperados Ek não devem ser muito pequenos. Embora não haja um limite inferior definitivo, Ek deve ser aproximadamente igual a 5 ou mais,

Ek ≥ 5 (12.9)

Deve-se portanto escolher os intervalos de

modo que Ek, como dado por (12.8) satisfaça esta condição. Vê-se, também, que o número de intervalos não deve ser muito pequeno. Por exemplo, na aplicação da Seção 2.1, onde a distribuição esperada era a de Gauss com centro em X e largura �x não era conhecida a priori, o teste do �2 não funciona com menos que quatro intervalos. Ou seja, neste exemplo é preciso se ter

n ≥ 4 (12.10)

Combinando (12.9) e (12.10), vê-se que não se pode aplicar o teste do χ2 a este tipo de experimento se o número total de observações for menor que 20.

Medição de uma variável discreta Seja a medição de uma variável discreta,

como o agora familiar número de azes quando se jogam vários dados. Na prática, a variável discreta mais comum é um inteiro (como o número de azes) e se denota a variável discreta por ν, em vez de x (que é usada para variável contínua). Se são jogados cinco dados, os valores possíveis de ν são ν = 0, 1, 2, ..., 5, e não é necessário realmente agrupar os resultados possíveis em intervalos. Pode-se simplesmente contar quantas vezes se obtém cada um dos seis possíveis resultados. Em outras palavras, pode-se escolher seis intervalos, cada um contendo exatamente um resultado.

Apesar disso, é geralmente desejável agrupar vários resultados diferentes em um intervalo. Por exemplo, se são lançados os cinco dados 200 vezes, assim a distribuição esperada de resultados é como mostrado nas duas primeiras colunas da Tab. 12.5. Vê-se que aqui os números esperados de lançamentos dando 4 ou 5 azes são 0,6 e 0,03, respectivamente, ambos muito menos do que

Page 136: Analise Incerteza

Teste do Qui-Quadrado

125

cinco ocorrências requeridas em cada intervalo, se se quer usar o teste do qui quadrado. Esta dificuldade é facilmente remediada agrupando os resultados ν = 3, 4 e 5 em um único intervalo. Este agrupamento resulta em quatro intervalos, k = 1, 2, 3, 4, que são mostrado com seus correspondentes números esperados Ek, nas ultimas duas colunas da Tab. 12.5.

Tab. 12.5. Ocorrência esperada de ν azes (ν = 0, 1, 2, ...,

5) após se lançar cinco dados 200 vezes

Resultado Ocorrências esperadas

Intervalo número k

Número esperado Ek

Zero 80,4 1 80,4

Um 80,4 2 80,4

Dois 32,2 3 32,2

Três 6,4

Quatro 0,6

Cinco 0,03

4

7

Tendo escolhido intervalos como descrito,

pode se contar as ocorrências observadas Ok em cada intervalo. Pode se então computar χ2

e ver se as distribuições observadas e esperadas pareçam concordar. Neste experimento, sabe se que a distribuição esperada é certamente a distribuição binomial B5,1/6(ν) desde que os dados sejam honestos (de modo que p seja realmente igual a 1/6). Assim, o teste da distribuição é, neste caso, um teste de os dados serem honestos ou viciados.

Em qualquer experimento envolvendo uma variável discreta, os intervalos podem ser escolhidos para conter justo um resultado cada, desde que o número esperado de ocorrências para cada intervalo seja, no mínimo, o necessário cinco ou aproximado. Caso contrário, vários resultados diferentes devem ser agrupados juntos em um único intervalo maior que inclua suficientes ocorrências esperadas.

Outras formas do χ2 A notação χ2 tem sido usada antes, em

(7.6) e (8.5) e ela poderia também ter sido usada para a soma dos quadrados em (5.41). Em todos estes casos, χ2 é uma soma de quadrados com a forma geral:

∑ ⎟⎟⎠

⎞⎜⎜⎝

⎛=χ

n

1

22

padrão desvioesperado valor - observado valor

(12.11) Em todos os casos, χ2 é um indicador da

concordância entre os valores observados e esperados de alguma variável. Se a concordância é boa, χ2 é da ordem de n; se é pobre, χ2 será muito maior que n.

Infelizmente, pode se usar χ2 para testar esta concordância se são conhecidos os valores esperados e o desvio padrão e portanto se pode calcular (12.11). Talvez a situação mais comum em que estes valores são conhecimentos com precisão suficiente é o tipo de teste discutido neste capítulo, chamado, o teste de uma distribuição, em que Ek é dado pela distribuição e o desvio padrão é kE . De qualquer modo, o teste do qui quadrado é de larga aplicação Seja, por exemplo, o problema discutido no capítulo 8, a medição de duas variáveis x e y, onde y é esperado ser uma função definida de x,

y = f(x)

(tal como y = A + Bx). Suponha que se tenham N pares medidos (xi, yi), onde xi tem incerteza desprezível e yi tem incertezas conhecidas σi. Aqui, o valor esperado de yi é f(xi) e pode se testar quão bem y encaixa a função f(x) calculando

∑ ⎟⎟⎠

⎞⎜⎜⎝

⎛σ

−=χ

N

1

2

i

ii2 )x(fy

Todas as observações anteriores acerca do

valor esperado de χ2 se aplicam a este número e os testes quantitativas descritos nas seções seguintes podem ser usados. Esta aplicação importante não será vista aqui, porque somente raramente na Metrologia se encontram incertezas σi conhecidas com suficiente confiança (porém Ver Prob. 12.14).

Page 137: Analise Incerteza

Teste do Qui-Quadrado

126

12.4. Graus de liberdade e χ2 reduzido Tem se argumentado que se pode testar a

concordância entre uma distribuição observada e uma esperada pela computação de χ2 e comparando-o com o número de intervalos usados na coleta dos dados. Um procedimento pouco melhor, porém, é comparar χ2 , não com o número n de intervalos, mas com o número de graus de liberdade, denotado d. O noção de graus de liberdade foi mencionada rapidamente na seção 8.3 e deve se agora discuti-la com mais detalhes.

Em geral, o número de graus de liberdade d em um cálculo estatístico é definido como o número de dados observados menos o número de parâmetros computados dos dados e usados no cálculo. Para os problemas considerados neste capítulo, os dados observados são os números de observações Ok nos n intervalos, k = 1, 2, ..., n. Assim, o número de dados observados é justo n, o número de intervalos. Portanto, nestes problemas considerados aqui

d = n – c onde n é o número de intervalos e c, o número de parâmetros que são necessários para se calcular os números esperados Ek, a partir dos dados. O número c é geralmente chamado de números de restrições (constraint), como será explicado rapidamente.

O número de restrições c varia de acordo com o problema considerado. Seja primeiro o experimento de lançamento de dados da Seção 12.2. Se são lançados cinco dados e é testada a hipótese de os dados serem honestos, a distribuição esperada de números de azes é a distribuição binomial B5,1/6(ν), onde ν = 0, 1, ..., 5. é o número de azes em qualquer um lançamento. Ambos os parâmetros nesta função – o número de dados (5) e a probabilidade de sair um ás (1/6) – são conhecidas a priori e não precisam ser calculadas dos dados. Quando se calcula o número esperado de ocorrências de qualquer ν particular, deve-se multiplicar a probabilidade binomial pelo número total de lançamentos N (no exemplo, N = 200). Este parâmetro depende dos dados. Especificamente, N é justo a soma dos números Ok,

∑=

=n

1kkON (12.12)

Assim, calculando os resultados esperados

do experimento do lançamento de dados, deve

se calcular um parâmetro (N) dos dados. O número de restrições é portanto de

c = 1

e o número de graus de liberdade é d = n - 1 Na Tab. 12.5, os resultados do lançamento

de dados foram agrupados em quatro intervalos (ou seja, n = 4), de modo que o experimento tem três graus de liberdade.

A eq. (12.12) ilustra bem a curiosa terminologia de restrições e graus de liberdade. Uma vez o número N tenha sido determinado, pode-se considerar (12.12) como uma equação que restringe os valores de O1, O2, ..., On. Mais especificamente, pode se dizer que, por causa da restrição (12.12), somente n – 1 dos números O1, O2, ..., On são independentes Por exemplo, os primeiros (n – 1) números O1, O2, ..., On podem assumir quaisquer valores (dentro de certas faixas), mas o último número On é completamente determinado por (12.12). Neste caso, somente (n – 1) dos dados são livres de assumir valores independentes, de modo que se diz que há apenas (n – 1) graus independentes de liberdade. Por analogia, quando se joga memória, o último par a ser virado é determinístico e não aleatório.

No primeiro exemplo deste capítulo, a faixa x de projetis era medida 40 vezes (N = 40). Os resultados foram coletados em quatro intervalos (n = 4) e comparados com o que era esperado para uma distribuição de Gauss GX,σ(x). Aqui, havia três restrições e assim, apenas um grau de liberdade

d = n – c = 4 – 3 = 1 A primeira restrição era a mesma de

(12.12): o número total de observações N é a soma das observações Ok em todos os intervalos. Mas aqui, há mais duas restrições, porque (como usual neste tipo de experimento), não se conhecem a priori os parâmetros X e σ da esperada distribuição de Gauss GX,σ(x). Assim, antes de se calcular os números esperados Ek, devem se estimar X e σ usando os dados. Deste modo, há três restrições ao todo, de modo que neste exemplo

d = n – 3 (12.13) A propósito, este resultado explica por que

deve se usar, no mínimo, quatro intervalos neste experimento. Será visto que o número de graus de liberdade deve sempre ser um ou mais, de modo, que de (12.13) deve ser

Page 138: Analise Incerteza

Teste do Qui-Quadrado

127

escolhido n ≥ 4.

Os exemplos considerados aqui sempre terão, no mínimo, uma restrição (a saber, a restrição N = ΣOk, envolvendo o número total de medições) e pode haver uma ou duas a mais. Assim, o número de graus de liberdade, d, varia de n – 1 a n – 3 (nos exemplos mostrados). Quando n é grande, a diferença entre n e d é pouco importante, mas quando n é pequeno (como geralmente é, infelizmente), há uma grande diferença.

Armado com esta noção de grau de liberdade, pode se agora fazer um teste de qui quadrado mais preciso. Pode ser mostrado (embora não seja feito aqui), que o valor esperado de χ2 é precisamente d, o número de graus de liberdade,

(valor médio esperado de χ2) = d

(12.14) Esta equação importante não signfica que

realmente se espera encontrar χ2 = d após qualquer série de medições. Ao invés, ele significa que se é possível repetir o experimento um número infinito de vezes e computar χ2 cada vez, a média destes valores de χ2 será d. Mesmo assim, mesmo após apenas um conjunto de medições, uma comparação de χ2 com d é um indicador da concordância. Em particular, se a distribuição esperada era a distribuição correta, χ2 seria pouco provavelmente muito maior que d. Em outras palavras, se é encontrado χ2 >> d, pode se garantir que a distribuição esperada é muito pouco provável de ser correta.

Não se provou o resultado (12.14), mas pode se ver que alguns aspectos do resultado são razoáveis. Por exemplo, como d = n – c, pode se reescrever (12.14) como

(valor médio esperado de χ2) = n – c (12.15)

Ou seja, para qualquer dado n, o valor

esperado de χ2 será tanto menor quanto maior for c (isto é, se são calculados mais parâmetros dos dados). Este resultado é esperado. No exemplo da seção (12.1), os dados foram usados para calcular o centro X e a largura σ da distribuição esperada. GX,σ(x). Naturalmente, como X e σ são escolhidos para encaixar os dados, seria esperado achar uma concordância algo melhor entre as distribuições observada e esperada, pois, estas duas restrições extras devem reduzir o valor de χ2.

Esta redução é justamente o que implica (12.15).

O resultado (12.14) sugere um modo pouco mais conveniente para pensar acerca do teste do χ2. É introduzido o conceito do qui quadrado reduzido ou qui quadrado por grau de liberdade, que é denotado por

2

χ = χ2/d (12.16)

Como o valor esperado de χ2 é d, vê-se que

(valor médio esperado de 2

χ ) = 1 (12.17)

Assim, qualquer que seja o número de graus de liberdade, o teste pode ser enunciado

assim: se é obtido um valor de 2

χ da ordem de 1 ou menos, então não se tem razão para duvidar da distribuição esperada; se for obtido

um valor de 2

χ muito maior que 1, a distribuição esperada é pouco provável de ser correta.

Probleminha rápido 12.2. Para o experimento do Probleminha rápido

12.1, qual é o número de graus de liberdade, e

qual é o valor do qui quadrado reduzido, 2

χ ?

Resp.: d = 1 e 2

χ = 1,6.

12.5. Probabilidades para qui quadrado O teste para verificar a concordância entre

dados observados e sua distribuição esperada é ainda muito grosseiro. Agora se quer uma medida quantitativa da concordância. Em particular, se quer alguma recomendação em onde estabelecer um limite entre concordância e discordância. Por exemplo, no experimento da Seção 12.1, foram feitas 40 medições de uma certa faixa x cuja distribuição seria, acreditava-se, gaussiana. Os dados coletados são separados em quatro intervalos e achou se χ2 igual a 1,80. Com três restrições, havia somente um grau de liberdade (d = 1), de modo que o qui quadrado reduzido é também igual a 1,80.

A questão agora é: o valor de 2

χ = 1,80 é suficientemente maior que 1 para aceitar ou rejeitar a distribuição de Gauss?

Page 139: Analise Incerteza

Teste do Qui-Quadrado

128

Para responder esta questão, começa-se supondo que as medições eram governadas pela distribuição esperada (de Gauss, neste exemplo). Com esta hipótese, calcula-se a

probabilidade de se obter uma valor de 2

χ tão grande quanto ou maior que o valor de 1,80. Aqui, esta probabilidade vale

Prob (2

χ ≥ 1,80) = 18%

como será visto logo. Ou seja, se os resultados forem governados pela distribuição esperada, haveria uma probabilidade de 18% de se obter

um valor de 2

χ igual ou maior que 1,80. Em outras palavras, neste experimento, um valor

de 2

χ da ordem de 1,80 não é de todo improvável e não se teria razão para rejeitar a distribuição admitida.

O procedimento geral agora seria razoavelmente claro. Após completar qualquer série de medições, calcula-se o qui quadrado

reduzido, que será denotado por 2oχ (onde o

índice o significa observado, por que 2oχ é o

valor realmente observado). Depois, assumindo que as medições sigam a distribuição esperada, calcula-se a probabilidade

Prob (2

χ ≥ 2oχ ) (12.18)

de achar o valor de 2

χ maior ou igual ao valor

observado 2oχ . Se esta probabilidade é

grande, o valor 2oχ é perfeitamente aceitável e

não há razão para rejeitar a distribuição esperada. Se esta probabilidade é pequena,

um valor de 2

χ da ordem de grandeza do

observado 2oχ é muito pouco provável (se as

medições forem distribuídas como esperado) e a distribuição esperada é correspondentemente improvável de ser correta.

Como sempre, com testes estatísticos, deve se decidir o limite entre o que é razoavelmente provável e o que não é. Duas escolhas comuns são as já mencionadas ligadas à correlação. Com o limite em 5%,

pode se dizer que o valor observado 2oχ indica

discordância significativa se

Prob (2

χ ≥2

χ o) < 5%

e deve se rejeitar a distribuição esperada a um nível de 5% de significância. Se o limite é estabelecido em 1%, então se pode dizer que a discordância é altamente significativa se

Prob (2

χ ≥ 2oχ ) < 1%

e rejeitar a distribuição esperada em um nível de significância de 1%.

Qualquer que seja a escolha do limite para rejeição, o nível escolhido deve ser estabelecido. Talvez mesmo mais importante, deve-se estabelecer a probabilidade Prob

(2

χ ≥ 2oχ ), de modo que os leitores possam

julgar se o resultado é razoável, por eles mesmos.

O cálculo das probabilidades Prob

(2

χ ≥ 2oχ ) é muito complicado para ser descrito

aqui. Porém, os resultados podem ser tabulados facilmente, como na Tab. 12.6 ou no Apêndice D. A probabilidade de obter qualquer

valor particular de 2

χ depende do número de graus de liberdade. Assim, pode se escrever a probabilidade de interesse como

Probd(2

χ ≥ 2oχ ) para enfatizar sua dependência

com d. O cálculo usual das probabilidades

Probd(2

χ ≥ 2oχ ) trata os números observados

Ok como variáveis continuas distribuídas em torno de seus valores esperados Ek, de acordo com a distribuição de Gauss. Nos problemas considerados aqui, Ok é uma variável discreta distribuída de acordo com a distribuição de Poisson. Desde que todos os números envolvidos sejam razoavelmente grandes, o caracter discreto de Ok é pouco importante e a distribuição de Poisson é bem aproximada da distribuição de Gauss. Nestas condições, as

probabilidades tabuladas Probd(2

χ ≥ 2oχ )

podem ser usadas com segurança. Por este motivo, diz se que os intervalos devem ser escolhidos de modo que a contagem esperada Ek em cada intervalo seja razoavelmente grande (no mínimo, da ordem de 5). Pelo mesmo motivo, o número de intervalos não deve ser muito pequeno.

Com estas advertências, pode se dar agora

as probabilidades calculadas Probd(2

χ ≥ 2oχ )

para alguns valores representativos de d e 2oχ

na Tab. 12.6. Os números nas colunas esquerdas dão seis escolhas de d, o número de graus de liberdade (d = 1, 2, 3, 5, 10, 15). Os de outra coluna dá os valores possíveis do

Page 140: Analise Incerteza

Teste do Qui-Quadrado

129

2oχ observado. Cada célula na tabela mostra a

probabilidade percentual Probd(2

χ ≥ 2oχ ) como

uma função de d e 2oχ . Por exemplo, com 10

graus de liberdade (d = 10), vê-se que a

probabilidade de obter 2

χ ≥ 2 é de 3%,

Prob10(2

χ ≥ 2) = 3% Assim, se é obtido um qui quadrado

reduzido de 2 em um experimento com 10 graus de liberdade, pode-se concluir que as observações diferem significativamente da distribuição esperada e deve se rejeitar a distribuição esperada em um nível de significância de 5% (embora não em 1%).

As probabilidades na segunda coluna da

Tab. 12.6 são todas 100%, por que 2

χ são

sempre maiores ou iguais a 0. Quando 2oχ

aumenta, a probabilidade de obter 2

χ ≥ 2oχ

diminui, mas em uma taxa que depende de d. Assim, para dois graus de liberdade (d = 2),

Prob2(2

χ ≥ 1) é 37%, enquanto que para d =

15, Prob15(2

χ ≥ 1) é 45%. Note se que

Probd(2

χ ≥ 1) é sempre apreciável (no mínimo,

32%), de modo que um valor para 2

χ o de 1 ou menos é perfeitamente razoável e nunca requer rejeição da distribuição esperada.

Page 141: Analise Incerteza

Teste do Qui-Quadrado

130

Tab. 12.6. A probabilidade percentagem Probd(2

χ ≥ 2oχ ) de obter um valor de

2χ maior ou igual a qualquer valor particular

2oχ , assumindo que as medições correspondentes são governadas pela distribuição esperada. Espaços em branco

indicam probabilidades menores que 0,05%. Para uma tabela mais completa, ver Apêndice D.

2oχ

d 0 0,25 0,5 0,75 1,0 1,25 1,5 1,75 2 3 4 5 6

1 100 62 48 39 32 26 22 19 16 8 5 3 1

2 100 78 61 47 37 29 22 17 14 5 2 0,7 0,2

3 100 86 68 52 39 29 21 15 11 3 0,7 0,2 -

100

5 100 94 78 59 42 28 19 12 8 1 0,1 - -

10 100 99 89 68 44 25 13 6 3 0,1 - - -

15 100 100 94 73 45 23 10 4 1 - - - -

O mínimo valor de 2oχ que não requer

questionamento da distribuição esperada depende de d. Para 1 grau de liberdade, vê se

que 2oχ pode ser tão grande quanto 4 antes

que a discordância se torne significativa (nível 5%). Com 2 graus de liberdade, o limite correspondente é

2oχ = 3; para d = 5, é mais perto de 2

( 2oχ = 2,2, de fato).

Armado com as probabilidades da Tab. 12.6 (e Apêndice D), pode se agora atribuir uma

significância quantitativa para o valor de 2oχ

obtido em qualquer experimento particular.

12.6. Exemplos

Outro exemplo com distribuição de Gauss O exemplo da seção 12.1 envolveu uma medição para a qual os resultados foram esperados ser normalmente distribuídos. A distribuição de Gauss ou normal é tão comum que será considerado outro exemplo com ela. Seja um antropólogo interessado na altura dos nativos de uma ilha. Ele suspeita que as alturas dos homens sejam normalmente distribuídas e mede as alturas de uma amostra de 200 homens. Usando estas medições, ele calcula a média e o desvio padrão e usa estes números como melhores estimativas para o centro X e a largura σx da distribuição normal esperada GX,σ(x). Ele agora escolhe oito intervalos, como mostrado na Tab. 12.7 e agrupa suas observações, com os resultados mostrados na terceira coluna.

Page 142: Analise Incerteza

Teste do Qui-Quadrado

131

Tab. 12.7. Medições das alturas de 200 homens adultos Intervalo

k Alturas nos intervalos Número

observado Número esperado

1 menor que X – 1,5 σ 14 13,4

2 entre X-1,5σ e X – σ 29 18,3

3 entre X - σ e X – 0,5σ 30 30,0

4 entre X - 0,5σ e X 27 38,3

5 entre X e X + 0,5σ 28 38,3

6 entre X + 0,5σ e X + σ 31 30,0

7 entre X + σ e X + 1,5σ 28 18,3

8 maior que X + 1,5 σ 13 13,4

O antropólogo agora quer verificar se estes

resultados são consistentes com a distribuição normal esperada GX,σ(x). Para esta finalidade, ele primeiro calcula a probabilidade Probk que qualquer um homem tenha altura em qualquer intervalo particular k (assumindo uma distribuição normal). Esta probabilidade é a integral de GX,σ(x) entre os limites dos intervalos e é facilmente encontrada da tabela das integrais do Apêndice B. O número esperado Ek em cada intervalo é então a Probk vezes o número total de homens amostrados (200). Estes números são mostrados na Tab. 12.7.

Para calcular os números esperados Ek, o antropólogo deve usar três parâmetros calculados destes dados (número total da amostra N, média X e largura σ). Assim, embora haja 8 intervalos, há 3 restrições de modo que o número de liberdade é 5 (8 – 3). Um cálculo simples usando os dados da Tab. 12.7 dá o qui quadrado reduzido:

∑=

−=χ

8

1i k

2kk2

E)EO(

d1 = 3,5

Como este número é muito maior que 1,

imediatamente se suspeita que as alturas dos nativos não sigam a distribuição normal. Mais especificamente, vê-se da Tab. 12.6 que, se as alturas dos nativos fossem distribuídas como

esperado, então a probabilidade Prob5(2

χ ≥

3,5) de obter 2

χ ≥ 3,5 é aproximadamente 0,5%. Por qualquer padrão, este valor é muito pouco provável e se conclui que as alturas dos nativos são muito pouco prováveis de ser normalmente distribuídas. Em particular, a 1% (altamente significante), pode se rejeitar a

hipótese de ter uma distribuição normal das alturas.

Exemplo: Mais dados Na seção 12.2 foi discutido um experimento

em que cinco dados eram lançados muitas vezes e o número de azes em cada lançamento era registrado. Foram feitos 200 lançamentos e divididos os resultados em 4 intervalos. Assumindo os dados honestos, pode-se calcular os números esperados como antes. Estes números estão mostrados na Tab. 12.8 (3a coluna).

Tab. 12.8. Distribuição de números de vezes em 200 lançamentos de 5 dados

Intervalo

k Resultados nos

intervalos Número

esperado, Ek Número

observado, Ok 1 Zero ás 80,4 60 2 1 ás 80,4 88 3 2 azes 32,2 39 4 3, 4 ou 5

azes 7,0 13

No teste real, cinco dados foram jogados

200 vezes e os números da última coluna foram registrados. Para testar a concordância entre as distribuições observadas e esperadas, simplesmente se nota que há três graus de liberdade (4 intervalos menos 1 restrição) e se calcula

∑=

−=χ

4

1k k

2kk2

E)EO(

31 = 4,16

Voltando à Tab. 12.6, vê se que com estes

três graus de liberdade, a probabilidade de se

obter (2

χ ≥ 4,16) é aproximadamente 0,7%, se os dados forem honestos. Conclui-se que os dados são quase certamente viciados. A comparação dos números Ek com Ok na Tab. 12.8 sugere que, no mínimo, um dado está viciado para dar ás.

Exemplo: Distribuição de Poisson Como último exemplo do uso do teste do

qui quadrado, seja um experimento em que a distribuição esperada é a distribuição de Poisson. Seja um contador Geiger para contar a chegada de raios cósmicos em um certo local. Suponha se que é contado o número de partículas que chegam em 100 intervalos separados de 1 minuto e os resultados são registrados como na Tab. 12.9.

Page 143: Analise Incerteza

Teste do Qui-Quadrado

132

Tab. 12.9. Números de raios cósmicos observados em 100 intervalos separados de 1 minuto.

Contagens, ν por min.

Ocorrências Intervalo k

Observações, Ok

Esperado, Ek

Zero 7 1 7 7,5 Um 17 2 17 19,4 Duas 29 3 29 25,2 Três 20 4 20 21,7 Quatro 16 5 16 14,1 Cinco Seis Sete Oito ou +

8 1 2 0

Total 100

6

11

12,1

Verificando-se os números na coluna 2,

imediatamente se percebe que todas as contagens ν ≥ 5 foram agrupadas em um único intervalo. Esta escolha de seis intervalos (k = 1, 2, ..., 6) é mostrada na terceira coluna e os correspondentes números Ok na quarta coluna.

A hipótese que se quer testar é que o número ν é governado pela distribuição de Poisson Pμ(ν). Como a contagem média esperada μ é desconhecida, deve-se primeiro calcular a média das 100 contagens. Este valor é facilmente achado e é igual a ν = 2,59, que dá a melhor estimativa para μ. Usando este valor μ = 2,59, pode se calcular a probabilidade Pμ(ν) de qualquer contagem ν e assim calcular os números esperados Ek, como mostrado na última coluna de Tab. 12.9.

Para calcular os números Ek, são usados dois parâmetros baseados nos dados, o número total de observações (N = 100) e a estimativa (μ = 2,59). Note se que, como a distribuição de Poisson é completamente determinada por μ, não se precisa estimar o desvio padrão σ.) Há, portanto, duas restrições, que reduzem os seis intervalos para quatro graus de liberdade, d = 4.

Um cálculo simples, usando os números das duas últimas colunas da Tab. 12.9, dá o qui quadrado reduzido.

∑=

−=χ

6

1i k

2kk2

E)EO(

d1 = 0,35

Como este valor é menor que 1, pode se

concluir imediatamente que a concordância entre as observações e a distribuição de Poisson esperada é satisfatória. Mais especificamente, vê se da tabela do Apêndice

D que um valor de 2

χ da ordem de 0,35 é muito provável; de fato

Prob4(2

χ ≥ 0,35) = 85%

De modo que o experimento não dá

nenhuma razão para duvidar da distribuição de Poisson esperada.

O valor de 2

χ = 0,35 encontrado neste experimento é realmente muito menor que 1, indicando que as observações se encaixam na distribuição de Poisson muito bem. Este pequeno valor não dá, porém, uma maior evidencia que as medições sejam governadas pela distribuição esperada do que um valor

próximo de 2

χ = 1, Se os resultados são realmente governados pela distribuição esperada e se as séries de medições são repetidas muitas vezes, deve se esperar muitos

valores diferentes de 2

χ , flutuando em torno de um valor médio. Assim, se as medições são governadas pela distribuição esperada, um

valor de 2

χ = 0,35 é justo um resultado de uma provável grande flutuação longe do valor médio esperado. De nenhum modo isto dá um peso extra à conclusão que as medições parecem seguir a distribuição esperada.

Page 144: Analise Incerteza

Teste do Qui-Quadrado

133

Principais Definições e Equações do Capítulo 12.

Definição de qui quadrado Se são feitas n medições das quais se

conhece ou se pode calcular o valor médio esperado e o desvio padrão, então se define

∑ ⎟⎟⎠

⎞⎜⎜⎝

⎛=χ

n

1

22

padrão desvioesperado valor - observado valor

[Ver (12.11)] Nos experimentos considerados neste

capítulo, as n medições eram os números O1, O2, ... On de vezes que o valor de alguma quantidade x era observada em cada um dos n intervalos. Neste caso, o número esperado Ek é determinado pela distribuição assumida de x e o desvio padrão é justo kE e portanto

∑=

−=χ

n

1k k

2kk2

E)EO( [Ver (12.7)]

Se a distribuição assumida de x é correta,

então χ2 deve ser da ordem de n. Se χ2 >> n, a distribuição assumida é provavelmente incorreta.

Graus de liberdade e qui quadrado reduzido

Se o experimento completo é repetido várias vezes, o valor médio de χ2 deve ser igual a d, o número de graus de liberdade definido como

d = n – c

onde c é o número de restrições, o número de parâmetros que devem ser cálculos dos dados para computar χ2.

O qui quadrado reduzido é definido como

2χ = χ2/d [Ver (12.16)]

Se a distribuição assumida é correta,

2χ deve ser da ordem de 1. Se

2χ for muito

maior que 1, os dados não encaixam na distribuição assumida de modo satisfatório.

Probabilidades para qui quadrado.

Suponha-se que é obtido o valor 2oχ para o

qui quadrado reduzido em um experimento. Se

2oχ é muito maior que 1, tem-se razão para

duvidar da distribuição em que se esperava basear os valores esperados Ek. Da tabela do Apêndice D, pode-se achar a probabilidade

Probd(2

χ ≥ 2oχ )

de se obter um valor 2

χ tão grande quanto 2oχ

assumindo que a distribuição esperada seja correta. Se esta probabilidade é pequena, tem se razão para rejeitar a distribuição esperada. Se ela é menor que 5%, deve se rejeitar a distribuição assumida a um nível de 5% de significância. Se a probabilidade é menor que 1%, deve se rejeitar a distribuição a um nível de 1%, altamente significante.

Apostilas\Incerteza JRTaylor8.doc 31 JAN 98 (Substitui 01 JAN 98)

Page 145: Analise Incerteza

Apêndice A: Integral do Erro Normal

134

Apêndice A

Integral do Erro Normal I

Se a medição de uma variável contínua x é sujeita a muitas pequenas incertezas,

todas elas aleatórias, a distribuição esperada de resultados é dada pela distribuição normal ou de Gauss,

22 2/)Xx(

,X e2

1)x(G σ−σ

πσ=

onde

X é o valor verdadeiro de X σ é o desvio padrão A integral da função distribuição normal, ∫ σ

b

a ,X dx)x(G é chamada de integral do erro normal e é a probabilidade que uma medição caia entre x = a e x = b,

dx)x(G)bxa(obPr

b

a ,X∫ σ=≤≤ A Tab. A mostra esta integral para a = X – tσ e b = X + tσ. Ela dá a probabilidade

de uma medição dentro t desvios padrão de cada lado de X, Prob(dentro tσ) = Prob(X – tσ ≤ x ≤ X + tσ)

∫∫ −

−σ+

σ− σπ

=t

t2/2ztX

tX ,X dze21dx)x(G

A probabilidade de uma medição fora do mesmo intervalo pode ser achada pela

subtração Prob(fora tσ) = 100% - Prob(dentro tσ)

Page 146: Analise Incerteza

Apêndice A: Integral do Erro Normal

135

Tab. A. Probabilidade em percentagem,

Prob(dentro tσ) = ∫σ+

σ− σ

tX

tX ,X dx)x(G , como uma função de t.

Page 147: Analise Incerteza

Apêndice B: Integral do Erro Normal, II

136

Apêndice B

Integral do Erro Normal, II Em certos cálculos, uma forma conveniente da integral do erro normal é ∫

σ+

σ=tX

X ,X dx)x(G)t(Q

∫ −

π

t

02/2z dze

21

Esta integral é, obviamente, igual à metade da integral tabulada no Apêndice A. A

probabilidade )bxa(obPr ≤≤ de uma medição em qualquer intervalo )bxa( ≤≤ pode ser encontrada de Q(t) por uma simples subtração ou soma. Por exemplo,

)2XxX(obPr σ+≤≤σ+ = Q(2) – Q(1).

Do mesmo modo,

)Xx2X(obPr σ+≤≤σ− = (Q2) + Q(1). A probabilidade de uma medição maior que qualquer X + tσ é justo 0,5 – Q(t).

Por exemplo. Prob(x ≥ X + σ) = 50% - Q(1).

Page 148: Analise Incerteza

Apêndice B: Integral do Erro Normal, II

137

Tab. A. Probabilidade em percentagem, Prob(dentro tσ) = ∫

σ+

σ

tX

X ,X dx)x(G , como uma função de t.

Page 149: Analise Incerteza

Apêndice D: Probabilidades para Coeficientes de Correlação

138

Apêndice C

Probabilidades para Coeficientes de Correlação A extensão em que N pontos (x1, y1), ..., (xN, yN) encaixam em uma linha reta é

indicado pelo coeficiente de correlação linear

∑ ∑∑

−−

−−=

σσ

σ=

2i

2i

ii

yx

xy

)yy()xx(

)yy)(xx(r

que sempre cai no intervalo –1 ≤ r ≤ 1. Valores de r próximos de ±1 indicam uma boa correlação linear; valores próximos de 0 indicam pouca ou nenhuma correlação.

Uma medição mais quantitativa do encaixe pode ser encontrada usando a Tab. C. Para qualquer valor observado ro, ProbN(|r| ≥ |ro|) é a probabilidade que N medições de duas variáveis não correlacionadas dêem um coeficiente r tão grande quanto ro. Assim, quando se tem um coeficiente ro para que ProbN(|r| ≥ |ro|) é pequena, é pouco provável que as variáveis não sejam correlacionadas, ou seja, uma correlação é indicada. Em particular, se ProbN(|r| ≥ |ro|) < 5%, a correlação é considerada significativa. Se ProbN(|r| ≥ |ro|) , 1% a correlação é considerada altamente significativa.

Por exemplo, a probabilidade que 20 medições (N = 20) de duas variáveis não correlacionadas seja |r| ≥ 0,5 é dada na tabela como 2,5%. Assim, se 20 medições dão r = 0,5, tem-se uma evidência significativa de uma correlação linear entre as duas variáveis. Para mais detalhes, ver Seções 9.3 a 9.5.

Os valores na Tab. C foram calculados da integral

∫ −−−Γπ

−Γ=≥

1

or2/)4N(2

oN dr)r1(]2/)2N[(

]2/)1N[(2)rr(obPr

Page 150: Analise Incerteza

Apêndice D: Probabilidades para Coeficientes de Correlação

139

Tab. C. A probabilidade em percentual ProbN(|r| ≥ |ro|) que N medições de duas variáveis não correlatas dêem um coeficiente de correlação com |r| ≥ ro como uma função de N e ro. (Espaços em branco significam probabilidades menores que 0,05%.)

Page 151: Analise Incerteza

Apêndice D: Probabilidades para Coeficientes de Correlação

140

Apêndice D

Probabilidades para Qui Quadrado (χ2)

Se uma série de medições é agrupada em intervalos k =1, 2, ..., n, chama-se de Ok, o número

de medições observadas no intervalo k. O número esperado (na base de alguma distribuição assumida ou esperada) no intervalo k é chamado de Ek. A extensão em que as observações se encaixam na distribuição assumida é indicada pelo qui quadrado reduzido,

∑=

−=χ

8

1i k

2kk2

E)EO(

d1

onde d é o número de graus de liberdade, d = n – c, e c é o número de restrições (ver Seção 12.3).

O valor médio esperado de 2χ é 1. Se

2χ >> 1, os resultados observados não se encaixam

na distribuição assumida; se 2χ < 1, a concordância é satisfatória.

O teste é feito quantitativa com as probabilidades mostradas na Tab. D. Seja 2oχ denotando o

valor de 2χ realmente obtido no experimento com d graus de liberdade. O número Probd(

2χ ≥

2oχ ) é a probabilidade de se obter um valor de

2χ tão grande quanto o 2oχ observado, se as

medições realmente seguem a distribuição assumida. Assim, se Probd(2χ ≥

2oχ ) é grande, as

distribuições observada e esperada são consistentes; se é pequena, elas provavelmente estão em

desacordo. Em particular, se Probd(2χ ≥

2oχ ) é < 5%, diz se que o desacordo é significativo e

se rejeita a distribuição ao nível de 5%. Se Probd(2χ ≥

2oχ ) < 1%, o desacordo é chamado de

altamente significativo e se rejeita a distribuição assumida ao nível de 1%.

Por exemplo, obteve-se um qui quadrado reduzido, de 2,6 (2oχ = 2,6) no experimento com

seis graus de liberdade (d = 6). De acordo com a Tab. D, a probabilidade de se obter 2oχ ≥ 2,6 é

1,6%, se as medições forem governadas pela distribuição assumida. Assim, ao nível de 5% (mas não ao nível de 1%), pode rejeitar a distribuição assumidade.

Page 152: Analise Incerteza

Apêndice D: Probabilidades para Coeficientes de Correlação

141

Tab. D. A probabilidade em percentual Probd( 2χ ≥ 2oχ ) de se obter um valor de 2χ ≥ 2

em um experimento com d graus de liberdade, como função de d e 2oχ . (Espaços em branco

significam probabilidades menores que 0,05%.) Os valores na Tab. D foram calculados da integral

∫∞

χ

−−

Γ=χ≥χ

o

2/2x1d2/d

2o

2d dxex

)2/d(22)(obPr

Page 153: Analise Incerteza

142

Referências Bibliográficas 01. Almeida, G. Sistema Internacional de Unidades (SI), Lisboa, Platano, 1988. 02. Arnold, K.L., Guia Gerencial para a ISO 9000, Rio de Janeiro, Editora Campus, 1995. 03. Anthony, D.M., Engineering Metrology, Oxford, Pergamon, 1986. 04. AT & T Technologies, Statistical Quality Control Handbook, Charlotte, Delmar, 1984. 05. Banks, J., Principles of Quality Control, New York, John Wiley, 1989. 06. Barney, G.C., Intelligent Instrumentation, 2a. ed., Longon, Prentice Hall, 1988. 07. Benedict, R.P., Fundamentals of Temperature, Pressure and Flow Measurements, 2a. ed.,

New York, John Wiley, 1977. 08. Bentley, J.P., Principles of Measurement Systems, 2a. ed., Singapore, Longman, 1983. 09. Berkov, V., Metrologie Industrielle, Moscow, MIR, 1983. 10. Besterfield, D.H., Quality Controle, 4a. ed., Englewood Cliffs, Prentice-Hall, 1994. 11. Cheremisinoff, N.P. & Cheremisinoff, P.N., Unit Conversions and Formulas, Ann Arbor,

Butterworth, 1980. 12. Connell, B., Process Instrumentation Applications Manual, New York, McGraw-Hill, 1996. 13.Coyne, G.S., Laboratory Handbook of Materials, Equipment, & Technique, Englewood Cliffs,

Prentice-Hall, 1992. 14. Cox, D.R., Planning of Experiments, Singapore, John Wiley, 1958. 15. Dally, J.W., Riley, W.F. & McConnell, K.G., Instrumentation for Engineering Measurements,

2a. ed., Singapore, John Wiley, 1993. 16. Dieck, R.H., Measurement Uncertainty - Methods and Applications, Research Triangle Park,

ISA, 1992. 17. Dieter, G.E., Engineering Design, 2a. ed., Singapore, McGraw-Hill, 1991. 18. Doebelin, E.0., Engineering Experimentation, Singapore, McGraw-Hill, 1995. 19. Doebelin, E.0., Measurement systems, 4a. ed., Singapore, McGraw-Hill, 1990. 20. Figliola, R.S. & Beasley, D.E., Theory and Design for Mechanical Measurements, 2a. ed.,

Singapore, John Wiley, 1995. 21. Fleming, M.C. & Nellis, J.G., Essence of Statistics for Business, Hertfordshire, Prentice Hall,

1991. 22. Fluke, Calibration: Philosophy in Pratice, Everett, Fluke, 1994 23. Friesth, E.R., Metrication for Manufacturing, New York, Industrial Press, 1978. 24. Gibbings, J.C., Systematic Experiment, Cambridge, Cambridge University Press, 1986. 25. Grant, E.L. & Leavenworth, R.S., Statistical Quality Control, 6a. ed., Singapore, McGraw-Hill,

1977. 26. Halpern S., Assurance Sciences - Introduction to Quality Control & Reliability, Englewood

Cliffs, Prentice-Hall, 1978. 27. Hamburg, M. & Young, P., Statistical Analysis for Decision Making, 6a. ed., Orlando, Dryden,

1994. 28. Hicks, C.R., Fundamental Concepts in Design of Experiments, 3a. ed., New York, Holt,

Rinehart and Winston, 1982. 29. Hoel, P.G., Elementary Statistics, 4a. ed., Singapore, John Wiley, 1976. 30. Holman, J.P., Experimental Methods for Engineers, 6a. ed., Singapore, McGraw-Hill, 1994. 31 Hutchins, G.B., Introduction to Quality - Control, Assurance and Management, New York,

Macmilan, 1991. 32. Hutchins, G.B., ISO 9000 - Um Guia Completo, São Paulo, Makron, 1994. 33. Jones, B.E., Instrumentation, Measurement, and Feedback, London, McGraw-Hill, 1977. 34. Jones, L.D. & Chin, A.F., Electronic Instruments and Measurements, 2a. ed., Englewood Cliffs,

Prentice-Hall, 1991. 35. Juran, J.M. & Gryna, F.M., Quality Planning and Analysis, 3a. ed., Singapore, McGraw-Hill,

1993. 36. Kalvelagen, E. & Tijms, H.C., Exploring Operations Research & Statistcs , Englewood Cliffs,

Prentice-Hall, 1990. 37. Karim, G.A. & Hamilton, A.B., Metrication, Boston, IHRDC, 1981. 38. Kateman, G.A. & Pijpers, F. W., Quality Control in Analytical Chemistry, New York, John

Wiley, 1981. 39. Kume, H., Metodos Estatisticos para Melhoria da Qualidade, São Paulo, Editora Gente, 1993.

Page 154: Analise Incerteza

143

40. MacLean, G.E., Documenting Quality for ISO 9000 and Other Industry Standards, Milwaukee, ASQC Press, 1993.

41. Mayne, R. & Margolis, S., Introduction to Engineering, New York, McGraw-Hill, 1982. 42. Meloun, M., et alt., Chemometrics for Analytical Chemistry, Chichester, Ellis Horwood, 1992. 43. Mitra, A., Fundamentals of Quality Control and Improvement, New York, Macmilan, 1993. 44. Montgomery, D.C. & Runger, G.C., Applied Statistics and Probability for Engineers, New York,

John Wiley, 1994. 45. Morris, A. S., Principles of Measurement and Instrumentation, Wiltshire, Prentice Hall, 1993. 46. Nachtigal, C.L., Instrumentation & Control, New York, John Wiley, 1990 47. Nakra, B.C. & Chaudhry, K.K., Instrumentation Measurement and Analysis, New Delhi, Tata

McGraw-Hill, 1985. 48. Noltingk, B.E. (editor), Instrumentation - Reference Book, 2a. ed., Surrey, Butterworths-

Heinemann, 1995. 49. Ott, E.R. & Schilling, E.G., Process Quality Control, 2a. ed., New York, Mc-Graw-Hill, 1990. 50. Phadke, M.S., Quality Engineering Using Robust Design, Englewood Cliffs, Prentice-Hall,

1989. 51. Pedde, L.D., Foote, W.E. et alt., Metric Manual, Denver, US Government Printing Office, 1978. 52. Pennella, C.R., Managing the Metrology System, Milwaukee, ASQC Quality Press, 1992. 53. Pyzdek, T. & Berger, R.W., Quality Engineering Handbook, New York, Marcel Dekker, 1992. 54. Ray, M.S., Engineering Experimentation, Cambridge, McGraw-Hill, 1992. 55. Rothery, B., ISO 9000, São Paulo, Makron, 1993. 56. Rowbotham, G.E., Engineering and Industrial Graphics Handbook, New York, McGraw-Hill

Book, 1982. 57. Santos Jr., M.J. & Irigoyen, E.R.C., Metrologia Dimensional, Porto Alegre, EUFRGS, 1985. 58. Souto, F.C.R., Visão da Normalização, Rio de Janeiro, Qualitymark, 1991. 59. Sydenham, P.H., Measuring Instruments: Tools of Knowledge and Control, London, Peter

Peregrinus, 1979. 60. Taylor, J.R., Quality Control Systems, Singapore, McGraw-Hill, 1989. 61. Taylor, J.R., Error Analysis, 2a ed., Sausalito, University Science Books, 1997. 62. Waeny, J.C., Controle Total da Qualidade Metrológica, São Paulo, Makron, 1992.