Aplicac¸oes da Lei de Gauss e˜ Outros Progressos no S´ec....

1
Aplicac ¸ ˜ oes da Lei de Gauss e Outros Progressos no S ´ ec. XIX Rui Santos [email protected], Escola Superior de Tecnologia e Gest˜ ao do Instituto Polit´ ecnico de Leiria, CEAUL — Centro de Estat´ ıstica e Aplica¸ oes da Universidade de Lisboa Trabalho financiado por Fundos Nacionais atrav´ es da Funda¸ ao para a Ciˆ encia e a Tecnologia, no ˆ ambito do projeto PEst-OE/MAT/UI0006/2011. No s´ eculo XIX come¸cam a despontar muitas aplica¸c˜ oes da Estat´ ıstica, quer pela generaliza¸ ao da aplica¸c˜ ao da Lei de Gauss, quer pelo recurso ` a Estat´ ıstica, bem como ao C´ alculo de Probabilidades, nas mais diversas ´ areas do conhecimento. Qu ´ etelet O estat´ ıstico belga Lambert Qu ´ etelet (1796-1874) estu- dou probabilidades em Paris sob orienta¸ ao de Joseph Fourier (1768-1830) e Pierre Laplace (1749-1827) e, provavelmente influen- ciado pelos seus orientadores, generalizou o uso da distribui¸ ao gaussiana. Deste modo, Qu ´ etelet ao se restringiu ` a an´ alise de erros e aplicou a distribui¸ ao gaussiana ao estudo de caracter´ ısticas humanas, tais como a altura e o peso, sendo famosa a sua conce¸c˜ ao de homem m´ edio definido atrav´ es do valor m´ edio das caracter´ ısticas humanas que s˜ao agrupadas de acordo com uma curva gaussiana. Estaconce¸c˜ ao, publicada em 1835 na sua obra mais famosa — Sur l’homme et le devel- oppement de ses facult´ es, essai d’une physique sociale, n˜ ao foi pac´ ıfica e, por exemplo, Joseph Bertrand (1822-1900) em 1888 ´ e muito severo com a constru¸c˜ ao de Qu ´ etelet, questionando: l’homme dont la taille est ´ egale ` a la taille moyenne, le poids au poids moyen, etc., peut-il exister? N’est-il pas un monstre? ... [Bertrand, 1888] Todavia, salientemos que foi, provavelmente, a primeira vez que a distribui¸ ao gaussiana foi aplicada para modelar caracter´ ısticas de um qualquer fen´omeno, neste caso o corpo humano, como ilustra o ´ Indice de Massa Corporal que Qu ´ etelet criou como medida de obesidade, sendo inter- nacionalmente utilizado na atualidade. Desta forma, Qu ´ etelet generalizou o uso da distribui¸ ao gaussiana, n˜ ao se restringindo ` a an´ alise de erros (notemos que ainda no in´ ıcio do s´ eculo XX esta dis- tribui¸ ao ´ e denominada, em muitas obras, por lei dos desvios), tendo compilado e analisado grandes quantidades de dados referentes a diversas ´ areas, tais como o crime, a mortalidade, a meteorologia e a astronomia. Deu, desta forma, uma contribui¸ ao vital para o desenvolvimento da Estat´ ıstica. Sim ´ eon Denis Poisson (1781-1840) considera, em 1837, que o C´ alculo das Probabilidades pode ser utilizado na tomada de decis˜ oes que envolvem o julgamento humano, sujeito ` as varia¸ oes dos interesses individuais, nomeadamente no que respeita ` a veracidade de testemunhos em julgamentos. Na mesma obra deduz a distribui¸ ao (atualmente de- nominada por distribui¸ ao de Poisson) obtida quando na distribui¸ ao binomial a probabilidade de sucesso ´ e muito pequena e o n´ umero de provas ´ e grande, e generaliza a Lei dos Grande N´ umeros para probabilidades de sucesso distintas em cada prova. Poisson Cournot Antoine Cournot (1801-1877), em 1843, destaca a existˆ encia de duas vis˜ oes distintas de probabilidade, uma objetiva e um subjetiva, e salienta a importˆ ancia da Teoria da Probabilidade na an´ alise Estat´ ıstica, considerando que acontecimentos com pequena probabilidade geralmente ao ocorrem, sendo este facto a ´ unica base para a aplica¸ ao da Teoria da Probabilidade ` a realidade (princ´ ıpio da impossibilidade de Cournot). Deste modo, com base na obra de Jacob Bernoulli, de 1713, Cournot considera a certeza moral como os acontecimentos que tˆ em probabilidade de pelo menos 999 1000 (acontecimentos moral- mente certos) e, do mesmo modo, a impossibilidade moral como os acontecimentos com probabi- lidade inferior a 1 1000 (acontecimentos moralmente imposs´ ıveis). Estas defini¸ oes foram igualmente vitais para o desenvolvimento da Estat´ ıstica, uma vez que considerava-se que a importˆ ancia da aplica¸ ao do C´ alculo da Probabilidade centrava-se em encontrar acontecimentos moralmente cer- tos (que, quase certamente, iriam ocorrer). Notemos que estas defini¸ oes foram substitu´ ıdas por “certeza pr´ atica” (practically certain ) no s´ eculo XX onde os 99.9% de certeza de J. Bernoulli s˜aosubstitu´ ıdos pelos 95% de certeza pr´ atica de Fisher em Statistical Methods for Research Workers publicado em 1925, que correspondem ao valor atualmente mais utilizado nas aplica¸ oes da Estat´ ıstica (nomeadamente em intervalos de confian¸ca ou credibilidade e em testes de hip´ oteses). Francis Galton (1822-1911), primo de Charles Darwin (1809-1882), introduz a regress˜ ao em 1885, onde conclui que os filhos de pais mais altos que a edia tendem a ser mais altos que a m´ edia, mas mais baixos que os pais, e filhos de pais mais baixos que a m´ edia ten- dem a ser mais baixos que a m´ edia, mas mais altos que os pais. Verifica-se, desta forma, uma regress˜ ao para a m´ edia (raz˜ ao pela qual denominamos por regress˜ ao linear). y i = β 0 + β 1 x i y x Galton Galton ´ e considerado um dos fundadores da Biometria, uma vez que procurou descrever e quantificar o comportamento humano e a sua evolu¸ ao, nomeadamente recorrendo ` a Lei de Gauss. Criou igual- mente um aparelho engenhoso para ilustrar como poderia ser visualizada a Lei de Gauss, que denominou por Quincunx. Em cada obst´ aculo do Quincunx a bola tem uma probabilidade igual a 1 2 de ir para cada lado. Consequentemente, na nesima fila de obst´ aculos h´ a n + 1 passagens, sendo a probabilidade de a bola passar na iesima passagem dada por P (“Bola passar na iesima passagem da nesima fila”) = n i 1 2 2 . Estas probabilidades s˜ ao proporcionais ` as combina¸ oes ( n i ) = n! i!(n-i)! que aparecem na nesima linha do Triˆ angulo de Pascal. Desta forma, se o Quincunx tiver n filas de obst´ aculos, as bolas no final ser˜ ao (aproxi- madamente) proporcionais ao valores da n- esima linha do Triˆangulo de Pascal. 1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1 1 6 15 20 15 6 1 1 7 21 35 35 21 7 1 1 8 28 56 70 56 28 8 1 1 9 36 84 126 126 84 36 9 1 1 10 45 120 210 252 210 120 45 10 1 1 11 55 165 330 462 462 330 165 55 11 1 Por outro lado, se o n´ umero de linhas for razo´ avel, a curva produzida pelas bolas ter´ a a forma aproximada da curva de Gauss, ilustrando, desta forma, o Teorema Limite Central. Paftnutii Lvovich Chebyshev (1821-1894), famoso pela sua desigualdade, ´ e o fundador da escola de S˜ ao Petersburgo, que muitos contributos deu no desenvolvimento da Teoria da Probabilidade, nomeadamente no que respeita a estudo rigoroso das vers˜ oes gerais do Teorema Limite Central, com a colabora¸ ao dos seus disc´ ıpulos An- drei Markov (1856–1922), Aleksandr Lyapounov (1857-1918) e Sergei Bernstein (1880-1968) cujos avan¸ cos levam Guido Castel- nuovo (1865-1952) a afirmar: Chebyshev La grande opera di Tchebychef e della sua scola ··· ( Markoff, Liapounoff,...) si accorger`a che essa costituisce il maggior contributo portato al calcolo delle probabilit` a dopo Laplace.[Castelnuovo, 1919] Muitas outras personalidades contribu´ ıram significativamente para o desenvolvimento da Es- tat´ ıstica durante o s´ eculo XIX, tais como Iren ´ ee Jules Bienaym ´ e (1796-1878),pela dedu¸c˜ ao da desigualdade de Bienaym´ e-Chebyshev que permite demonstrar facilmente a Lei dos Grandes umeros, tendo igualmente contributos no desenvolvimento do c´ alculo actuarial e do m´ etodo dos ınimos quadrados; o alem˜ao Wilhelm Lexis (1837-1914), pela sua an´ alise da dispers˜ ao que nos conduziu `a an´ alise da variˆancia; o dinamarquˆ es Thorvald Thiele (1838-1910) a quem devemos, por exemplo, a ideia de cumulantes, entre muitos outros. Edgeworth Francis Edgeworth (1845-1926) publica em 1885 Methods of Statistics, uma obra que j´ a cont´ em alguns resultados de inferˆ encia es- tat´ ıstica, incluindo, por exemplo, um teste ` a qualidade do ajustamento semelhante ao que Karl Pearson (1857-1936) viria a propor uns anos mais tarde. Contudo as base s´ olidas s´ o come¸ caram a ser definitivamente constru´ ıdas no final do s´ eculo XIX, sobretudo com os trabalhos de K. Pearson, Gosset, Fisher, Neyman e E. Pearson. 6/13

Transcript of Aplicac¸oes da Lei de Gauss e˜ Outros Progressos no S´ec....

Page 1: Aplicac¸oes da Lei de Gauss e˜ Outros Progressos no S´ec. XIXceaul.org/wp-content/uploads/2019/09/Poster6_sec_XIX.pdf · Aplicac¸oes da Lei de Gauss e˜ ... atrav´es do valor

Aplicacoes da Lei de Gauss eOutros Progressos no Sec. XIX

Rui Santos [email protected], Escola Superior de Tecnologia e Gestao do Instituto Politecnico de Leiria, CEAUL — Centro de Estatıstica e Aplicacoes da Universidade de Lisboa

Trabalho financiado por Fundos Nacionais atraves da Fundacao para a Ciencia e a Tecnologia, no ambito do projeto PEst-OE/MAT/UI0006/2011.

No seculo XIX comecam a despontar muitas aplicacoes da Estatıstica, quer pela generalizacao da aplicacao da Lei de Gauss, quer pelo recurso a Estatıstica, bem

como ao Calculo de Probabilidades, nas mais diversas areas do conhecimento.

Quetelet

O estatıstico belga Lambert Quetelet (1796−1874) estu-

dou probabilidades em Paris sob orientacao de Joseph Fourier

(1768−1830) ePierre Laplace (1749−1827) e, provavelmente influen-

ciado pelos seus orientadores, generalizou o uso da distribuicao gaussiana.

Deste modo, Quetelet nao se restringiu a analise de erros e aplicou a

distribuicao gaussiana ao estudo de caracterısticas humanas, tais como a

altura e o peso, sendo famosa a sua concecao de homem medio definido

atraves do valor medio das caracterısticas humanas que sao agrupadas de

acordo com uma curva gaussiana.

Esta concecao, publicada em 1835 na sua obra mais famosa — Sur l’homme et le devel-

oppement de ses facultes, essai d’une physique sociale, nao foi pacıfica e, por exemplo, Joseph

Bertrand (1822−1900) em 1888 e muito severo com a construcao de Quetelet, questionando:

“l’homme dont la taille est egale a la taille moyenne, le poids au poids moyen, etc., peut-il

exister? N’est-il pas un monstre? . . . ” [Bertrand, 1888]

Todavia, salientemos que foi, provavelmente, a primeira vez que a distribuicao gaussiana foi

aplicada para modelar caracterısticas de um qualquer fenomeno, neste caso o corpo humano, como

ilustra o Indice de Massa Corporal que Quetelet criou como medida de obesidade, sendo inter-

nacionalmente utilizado na atualidade. Desta forma, Quetelet generalizou o uso da distribuicao

gaussiana, nao se restringindo a analise de erros (notemos que ainda no inıcio do seculo XX esta dis-

tribuicao e denominada, em muitas obras, por lei dos desvios), tendo compilado e analisado grandes

quantidades de dados referentes a diversas areas, tais como o crime, a mortalidade, a meteorologia

e a astronomia. Deu, desta forma, uma contribuicao vital para o desenvolvimento da Estatıstica.

Simeon Denis Poisson (1781−1840) considera, em 1837, que

o Calculo das Probabilidades pode ser utilizado na tomada de decisoes

que envolvem o julgamento humano, sujeito as variacoes dos interesses

individuais, nomeadamente no que respeita a veracidade de testemunhos

em julgamentos. Na mesma obra deduz a distribuicao (atualmente de-

nominada por distribuicao de Poisson) obtida quando na distribuicao

binomial a probabilidade de sucesso e muito pequena e o numero de provas

e grande, e generaliza a Lei dos Grande Numeros para probabilidades de

sucesso distintas em cada prova. Poisson

Cournot

Antoine Cournot (1801−1877), em 1843, destaca a existencia

de duas visoes distintas de probabilidade, uma objetiva e um subjetiva, e

salienta a importancia da Teoria da Probabilidade na analise Estatıstica,

considerando que acontecimentos com pequena probabilidade geralmente

nao ocorrem, sendo este facto a unica base para a aplicacao da Teoria da

Probabilidade a realidade (princıpio da impossibilidade de Cournot).

Deste modo, com base na obra de Jacob Bernoulli, de 1713, Cournot considera a certeza

moral como os acontecimentos que tem probabilidade de pelo menos 9991000 (acontecimentos moral-

mente certos) e, do mesmo modo, a impossibilidade moral como os acontecimentos com probabi-

lidade inferior a 11000 (acontecimentos moralmente impossıveis). Estas definicoes foram igualmente

vitais para o desenvolvimento da Estatıstica, uma vez que considerava-se que a importancia da

aplicacao do Calculo da Probabilidade centrava-se em encontrar acontecimentos moralmente cer-

tos (que, quase certamente, iriam ocorrer). Notemos que estas definicoes foram substituıdas por

“certeza pratica” (practically certain) no seculo XX onde os 99.9% de certeza de J. Bernoulli

sao substituıdos pelos 95% de certeza pratica de Fisher em Statistical Methods for Research

Workers publicado em 1925, que correspondem ao valor atualmente mais utilizado nas aplicacoes

da Estatıstica (nomeadamente em intervalos de confianca ou credibilidade e em testes de hipoteses).

Francis Galton (1822−1911), primo de

Charles Darwin (1809−1882), introduz a regressao em

1885, onde conclui que os filhos de pais mais altos que a

media tendem a ser mais altos que a media, mas mais baixos

que os pais, e filhos de pais mais baixos que a media ten-

dem a ser mais baixos que a media, mas mais altos que os

pais. Verifica-se, desta forma, uma regressao para a media

(razao pela qual denominamos por regressao linear).

b

b

bb

b

b

b

b

b

b

b

b

bb

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

bb

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

byi = β0+ β1xi

y

x

Galton

Galton e considerado um dos fundadores da Biometria, uma

vez que procurou descrever e quantificar o comportamento humano e a

sua evolucao, nomeadamente recorrendo a Lei de Gauss. Criou igual-

mente um aparelho engenhoso para ilustrar como poderia ser visualizada

a Lei de Gauss, que denominou por Quincunx. Em cada obstaculo do

Quincunx a bola tem uma probabilidade igual a 12 de ir para cada lado.

Consequentemente, na n-esima fila de obstaculos ha n + 1 passagens,

sendo a probabilidade de a bola passar na i-esima passagem dada por

P (“Bola passar na i-esima passagem da n-esima fila”) =

(n

i

)(1

2

)2

.

Estas probabilidades sao proporcionais as

combinacoes(n

i

)= n!

i!(n−i)! que aparecem na

n-esima linha do Triangulo de Pascal.

Desta forma, se o Quincunx tiver n filas de

obstaculos, as bolas no final serao (aproxi-

madamente) proporcionais ao valores da n-

-esima linha do Triangulo de Pascal.

1

1 1

1 2 1

1 3 3 1

1 4 6 4 1

1 5 10 10 5 1

1 6 15 20 15 6 1

1 7 21 35 35 21 7 1

1 8 28 56 70 56 28 8 1

1 9 36 84 126 126 84 36 9 1

1 10 45 120 210 252 210 120 45 10 1

1 11 55 165 330 462 462 330 165 55 11 1

Por outro lado, se o numero de linhas for razoavel, a curva produzida pelas bolas tera a forma

aproximada da curva de Gauss, ilustrando, desta forma, o Teorema Limite Central.

Paftnutii Lvovich Chebyshev (1821−1894), famoso pela

sua desigualdade, e o fundador da escola de Sao Petersburgo, que

muitos contributos deu no desenvolvimento da Teoria da Probabilidade,

nomeadamente no que respeita a estudo rigoroso das versoes gerais do

Teorema Limite Central, com a colaboracao dos seus discıpulos An-

drei Markov (1856–1922),Aleksandr Lyapounov (1857−1918) e

Sergei Bernstein (1880-1968) cujos avancos levamGuido Castel-

nuovo (1865−1952) a afirmar: Chebyshev

“La grande opera di Tchebychef e della sua scola · · · (Markoff, Liapounoff,...)

si accorgera che essa costituisce il maggior contributo portato al calcolo delle probabilita

dopo Laplace.” [Castelnuovo, 1919]

Muitas outras personalidades contribuıram significativamente para o desenvolvimento da Es-

tatıstica durante o seculo XIX, tais como Irenee Jules Bienayme (1796−1878), pela deducao

da desigualdade de Bienayme-Chebyshev que permite demonstrar facilmente a Lei dos Grandes

Numeros, tendo igualmente contributos no desenvolvimento do calculo actuarial e do metodo dos

mınimos quadrados; o alemao Wilhelm Lexis (1837−1914), pela sua analise da dispersao que

nos conduziu a analise da variancia; o dinamarques Thorvald Thiele (1838−1910) a quem

devemos, por exemplo, a ideia de cumulantes, entre muitos outros.

Edgeworth

Francis Edgeworth (1845−1926) publica em 1885 Methods of

Statistics, uma obra que ja contem alguns resultados de inferencia es-

tatıstica, incluindo, por exemplo, um teste a qualidade do ajustamento

semelhante ao queKarl Pearson (1857−1936) viria a propor uns anos

mais tarde. Contudo as base solidas so comecaram a ser definitivamente

construıdas no final do seculo XIX, sobretudo com os trabalhos de K.

Pearson, Gosset, Fisher, Neyman e E. Pearson. 6/13