Fundamentos de Estatística - Apostila

10
A Condução da Análise 2014/2 © Thierry R. Gasnier/ Universidade Federal do Aa!onas 2" # Con$iança na edida e inde%end&n'ia Neste capítulo abordaremos a confiança que podemos ter em medidas. Quanto de confiança ou incerteza podemos ter em um valor? Come- çaremos vendo que há tipos diferentes de valo- res que chamaremos de escalas de medidas. Abordaremos a atribuiço de valores cate!"ri- cos e as incertezas li!adas a esta atribuiço. #ara falar nas incertezas de valores quantitati- vos introduziremos os conceitos de e$atido% preciso e de acurácia e a import&ncia de e$a- minarmos distribuiç'es de frequ(ncias. )stu- damos populaç'es% mas !eralmente por amos- tras% por isto precisamos entrender o que so par&metros populacionais% como so estimados e a import&ncia de intervalos de confiança. *i- nalmente% veremos que há dois conceitos dife- rentes quando estamos falando em indepen- d(ncia estatística. +., Níveis e escalas de medida izer que uma pessoa /alta0 ou que mede ,%12m so duas formas válidas de falar sobre altura% mas com poder informativo diferente. Nas duas formas% estamos falando de variáveis% pois so propriedades que vari- am entre unidades amostrais. 3e voc( divide as pessoas em dois !rupos% altas e bai$as% terá dois níveis de medidas4 se voc( dividir em + !rupos% altas% mdias e bai$as% terá tr(s níveis. 3e medir com uma fita mtrica% terá vários níveis de medida 5como ,%6+ m% ,%17 m% etc.8. 9s tratamentos estatísticos dependem tanto do n:mero de níveis efetivos como do tipo de medida. N;<)=3 )*)>=<93 ) )=A so os diferentes valores de uma variável efetivamente incluídos em uma análise. 3e comparamos a efici(ncia de !oiabada% sardi- nha e carne como iscas para pe!ar formi!as% temos tr(s níveis efetivos na variável /tipo de isca0. 3e em cada armadilha cairem 2% 2% 2% 2% ,% ,% 7% @ e 1 formi!as% ter emos níveis efetiv os de medida% pois foram valores diferentes. Na fi!ura +.,% a variável /(s0 tem B níveis efetivos e a variável />amanho da Aranha0 tem , níveis efetivos. Cuidado% no so todos os 7 do ei$o D% pois a menor medida% apenas aqueles que tem valores. A preciso da medida foi de ,mm 5como pode se ver no !ráfico8% se a preciso fosse de 2%mm% teríamos apro$imadamente o dobro de níveis efetivos. )m funço do tipo de valor utilizado% as variá- veis dividem-se em /)3CAEA3 ) )=A0 da se!uinte formaF G=NHI=A3F #ossuem apenas dois níveis efeti- vos. #or e$emploF sim ou no4 presença ou aus(ncia4 macho ou f(mea4 macrofauna ou mesofauna4 /controle0 ou /tratamento0. >ambm so binárias as variáveis quantitativas que as- sumem apenas dois valores em uma analise 5por e$emplo% na comparaç o entre tratamentos com , m! ou 7 m! de um medicamento8. CA>)JKI=CA3F >ipicamente assumem valores /qualitativos0 5no quantitativos8 sem uma or- dem intrínseca natural entre os níveis% ou pos- suem uma ordem% mas esta pode ser i!norada  Phoneutria reidyi Ag o Out Jan  Ab r  Ag o 0 5 10  15  20  25     T    a    m    n    h    o    d    a    a    r    a    n    h    a    (    m    m    ) Jun  Mês da coleta 2001/2002 v ? Figura 3.1- Neste gráfico EPR há seis níveis na variável “Mês da coleta! 1" níveis na variável “#a$anho da aranha e três níveis na variável “%e&o.  

Transcript of Fundamentos de Estatística - Apostila

8/16/2019 Fundamentos de Estatística - Apostila

http://slidepdf.com/reader/full/fundamentos-de-estatistica-apostila 1/10

A Condução da Análise 2014/2

© Thierry R. Gasnier/ Universidade Federal do Aa!onas

2"

#  Con$iança na

edida e inde%end&n'ia

Neste capítulo abordaremos a confiança quepodemos ter em medidas. Quanto de confiançaou incerteza podemos ter em um valor? Come-çaremos vendo que há tipos diferentes de valo-res que chamaremos de escalas de medidas.Abordaremos a atribuiço de valores cate!"ri-cos e as incertezas li!adas a esta atribuiço.#ara falar nas incertezas de valores quantitati-vos introduziremos os conceitos de e$atido%preciso e de acurácia e a import&ncia de e$a-minarmos distribuiç'es de frequ(ncias. )stu-damos populaç'es% mas !eralmente por amos-tras% por isto precisamos entrender o que sopar&metros populacionais% como so estimadose a import&ncia de intervalos de confiança. *i-nalmente% veremos que há dois conceitos dife-rentes quando estamos falando em indepen-d(ncia estatística.

+.,  Níveis e escalas de medida

izer que uma pessoa /alta0 ou que mede,%12m so duas formas válidas de falar sobrealtura% mas com poder informativo diferente.Nas duas formas% estamos falando de variáveis%pois so propriedades que vari-am entre unidades amostrais. 3evoc( divide as pessoas em dois!rupos% altas e bai$as% terá doisníveis de medidas4 se voc( dividirem + !rupos% altas% mdias ebai$as% terá tr(s níveis. 3e medir

com uma fita mtrica% terá váriosníveis de medida 5como ,%6+ m%,%17 m% etc.8. 9s tratamentosestatísticos dependem tanto don:mero de níveis efetivos comodo tipo de medida.

N;<)=3 )*)>=<93 ) )=Aso os diferentes valores de umavariável efetivamente incluídosem uma análise. 3e comparamos

a efici(ncia de !oiabada% sardi-

nha e carne como iscas para pe!ar formi!as%temos tr(s níveis efetivos na variável /tipo deisca0. 3e em cada armadilha cairem 2% 2% 2% 2% ,%,% 7% @ e 1 formi!as% teremos níveis efetivosde medida% pois foram valores diferentes. Na

fi!ura +.,% a variável /(s0 tem B níveis efetivose a variável />amanho da Aranha0 tem , níveisefetivos. Cuidado% no so todos os 7 do ei$oD% pois a menor medida% apenas aqueles quetem valores. A preciso da medida foi de ,mm5como pode se ver no !ráfico8% se a precisofosse de 2%mm% teríamos apro$imadamente odobro de níveis efetivos.

)m funço do tipo de valor utilizado% as variá-veis dividem-se em /)3CAEA3 ) )=A0 da

se!uinte formaF

G=NHI=A3F #ossuem apenas dois níveis efeti-vos. #or e$emploF sim ou no4 presença ouaus(ncia4 macho ou f(mea4 macrofauna oumesofauna4 /controle0 ou /tratamento0. >ambmso binárias as variáveis quantitativas que as-sumem apenas dois valores em uma analise5por e$emplo% na comparaço entre tratamentoscom , m! ou 7 m! de um medicamento8.

CA>)JKI=CA3F >ipicamente assumem valores/qualitativos0 5no quantitativos8 sem uma or-dem intrínseca natural entre os níveis% ou pos-suem uma ordem% mas esta pode ser i!norada

 Phoneutria reidyi  

Ago  Out  Jan  Abr   Ago 0 

5 10 

15 

20 

25 

   T   a   m   n   h   o   d   a

   a   r   a   n   h   a   (   m   m   )

Jun Mês da coleta 2001/2002

v ♂

?

Figura 3.1- Neste gráfico EPR há seis níveis na variável “Mês da coleta! 1"níveis na variável “#a$anho da aranha e três níveis na variável “%e&o.  

8/16/2019 Fundamentos de Estatística - Apostila

http://slidepdf.com/reader/full/fundamentos-de-estatistica-apostila 2/10

8/16/2019 Fundamentos de Estatística - Apostila

http://slidepdf.com/reader/full/fundamentos-de-estatistica-apostila 3/10

A Condução da Análise 2014/2

© Thierry R. Gasnier/ Universidade Federal do Aa!onas

#1

+.7  Atribuiço de níveis nominais eordinais

)m >ipicamente% em escalas nominais 5bináriasou cate!"ricas8 e ordinais no há uma quantifi-

caço instrumental. 9s níveis podem ser atribu-ídos pelo pesquisador com um CI=>SI=9 )A>I=GP=TU9 ) CA>)J9I=A que deve serto obetivo quanto possível% mas comum quehaa certo !rau de interpretaço na determina-ço de qual a cate!oria a que pertence umaunidade amostral ou qual a sua posiço emuma escala ordinal. uitas vezes isto simples%como no re!istro se um pei$e está vivo ou mor-to ao final de um e$perimento% mas pode sercomple$o% como ao se determinar qual a doen-ça de um paciente. )m muitos estudos% os ní-veis so definidos pelo pesquisador% mas atribu-ídos por outra pessoa% como ocorre em entre-vistas. #or estes motivos% frequentemente aatribuiço de níveis nominais ou ordinais umadas partes mais sensíveis de um estudo.

=ma!ine que voc( quer saber se a proporço demeninos que sabe nadar diferente da propor-ço de meninas que sabem nadar% baseado ementrevistas. )ntretanto% o si!nificado de um/sim0 de um menino realmente comparável aosi!nificado de um /sim0 de uma menina? #ossi-velmente os meninos tenham mais ver!onhaem admitir que no sabem nadar e vários res-pondam /sim0 mesmo sem saber% enquanto asmeninas apenas respondem /sim0 se nadambem. 3e voc( lembrar do capítulo anterior% per-ceberá que o problema que pode no haverrepresentatividade conceitual entre a variáveloperacional /resposta O per!unta se sabe na-

dar0 e a variável te"rica /sabe nadar?0. )stee$emplo ilustra o tipo de problema que podeacontecer em entrevistas% mas o problema nose restrin!e a entrevistas.

#or serem interpretaç'es% as atribuiç'es nomi-nais e ordinais sempre esto sueitas a erros%como na identificaço de uma espcie% na de-terminaço de qual doença um paciente teve%ou no sentido de um /sim0 dado por um entre-vistado. S importante definir cuidadosamente os

Critrios de Atribuiço de Cate!orias 5CAC8%

principalmente quando a subetividade pode terum papel importante na atribuiço de um valor.)m muitos estudos de comportamento% impor-tante se detalhar o si!nificado de cate!orias decomportamento utilizadas para permitir compa-

raç'es 5eto!rama8. 3e voc( chamar de /com-portamento a!ressivo0 apenas quando animaisefetivamente lutam% vai considerar o comporta-mento mais raro do que outra pessoa que con-sidere qualquer demonstraço de a!ressivida-de. 9utros e$emplos de CAC so chaves deidentificaço de espcies% tabelas de sintomasde doenças e tabelas de cores de tipos de so-los.

Quando trabalhamos com níveis ordinais% os

resultados so muito mais confiáveis se sempreforem definidos pela mesma pessoa suficiente-mente treinada% ou se houver uma tabela derefer(ncia bem definida 5como na tabela decores de solo8. ais difícil interpretar níveisordinais que variam entre pessoas ou circuns-t&ncias envolvidas na coleta dos dados. 3e B2Vdas pessoas entrevistadas de uma cidade !os-tam da qualidade de vida e apenas +2V daspessoas entrevistadas de outra cidade !ostamda qualidade de vida% no podemos saber se a

qualidade de vida melhor na primeira cidadeou se as pessoas so mais e$i!entes na se-!unda. Pma pessoa pode achar que há /pou-cas0 aves em um local quando estiver come-çando a observar aves% e perceber que há /mui-tas0 depois de adquirir mais e$peri(ncia.

Abordamos aqui as incertezas na atribuiço devalores nominais e abordaremos na pr"$imaseço incertezas em preciso e acurácia devalores quantitativos. >erminamos esta seço

destacando que tambm os valores quantitati-vos podem ter incertezas de representatividadeconceitual. #or e$emplo% o /n:mero de aç'esa!ressivas re!istrados por dia0 pode no serrepresentativo do /n:mero de aç'es a!ressivasocorridos por dia0 se os observadores no coin-cidirem sobre o que re!istrar como um compor-tamento a!ressivo. #ortanto% sempre impor-tante refletir bem sobre a possibilidade de errosde atribuiço comprometendo a interpretaçono seu estudo.

8/16/2019 Fundamentos de Estatística - Apostila

http://slidepdf.com/reader/full/fundamentos-de-estatistica-apostila 4/10

A Condução da Análise 2014/2

© Thierry R. Gasnier/ Universidade Federal do Aa!onas

#2

+.+  )$atido% preciso e acurácia.

Pma

Pma medida um valor de uma propriedade de

uma entidade obtido com o uso de instrumen-tos% protocolos e procedimentos que podem serbons ou ruins em diferentes !raus e aspectosque sero tratados aqui. =ma!ine que voc(comprou um medidor de presso arterial di!italbaratinho na farmácia. Che!ando em casa% aprimeira coisa que voc( faz medir a tua pres-so com o novo brinquedo. 9 resultado te as-sustaF presso alta% de ,@2F2 5mmW! sist"licaFdiast"lica8% acima do /ideal0 de apro$imadamen-te ,72F12. 3erá que voc( terá que ir ao mdico?

...ou será que a medida que está errada?

A )XA>=U9 de uma medida% na teoria% apro$imidade entre o valor obtido e o valor real.Na prática% uma medida considerada mais oumenos e$ata conforme o procedimento 5instru-mento% protocolo% etc.8 para obt(-la for conside-rado mais ou menos e$ato. Wá dois aspectosdiferentes de incerteza que determinam a e$ati-do instrumentalF sua preciso e sua acurácia.

A #I)C=3U9 de um instrumentoYprocedimento o !rau em que conse!uimos com ele medidasquantitativamente pr"$imas entre si em condi-ç'es estáveis e homo!(neas. A primeira coisaque faríamos com nosso medidor de pressoseria repetir a medida várias vezes. #ara isto%precisamos primeiro assumir que a tua pressovaria muito pouco nos poucos minutos do e$pe-rimento% de forma que podemos desprezar avariaço natural da presso% e o esperado seriavárias medidas i!uais ou muito pr"$imas se o

aparelho for muito bom.

A ACPIHC=A de um instrumentoYprocedimento o seu !rau de austamento mdio em relaçoao valor /real0. Pma balança pode ter alta preci-so% porque sempre dá o mesmo resultado% maspode estar descalibrada e dar um resultado ,!ramas superior ao real em todas as medidas.Pm rel"!io de alta preciso atrasado ,2 minutosvai apresentar este erro por anos se no foraustado para o horário correto. Al!uns equipa-

mentos de medida% como uma trena% no preci-sam de calibra!em% outros% como balanças epWmetros% precisam de verificaç'es peri"dicas%por isto% so vendidos unto com padr'es paracalibraço% como metais com pesos conhecidos.as como faríamos no caso do nosso aparelhode medir presso? 9 ideal seria comparar al-!umas medidas deste aparelho com al!umasmedidas com outro aparelho reconhecidamentepreciso e calibrado realizadas de forma alterna-da em curto espaço de tempo. A mdia da dife-rença entre os dois aparelhos% di!amos,2mmW! a mais no teu aparelho novo% a des-calibra!em% e deveria ser subtraída das suasmedidas.

Pma forma didática de representar a preciso ea acurácia atravs da analo!ia com tiros a um

alvo 5*i!. +.+8. Quanto maior a preciso menora disperso dos valores. A preciso nos tiros aoalvo com o instrumento /espin!arda0 5alvossuperiores8 costuma ser alta comparada com abai$a preciso com o instrumento /revolver05alvos inferiores8 para o mesmo atirador Omesma dist&ncia. 9 resultado que os tiros daespin!arda ficam mais concentrados que os dorevolver. )ntretanto% a espin!arda pode estardesaustada 5alvos O direita8% o que si!nifica quea mira precisa ser austada para obter maior

acurácia.

Figura 3.3- /lustra0+o sore dois conceitos de incerte2ainstru$ental )ela analogia co$ tiros de u$a es)ingardaaci$a e de u$ revolver aai&o. 

8/16/2019 Fundamentos de Estatística - Apostila

http://slidepdf.com/reader/full/fundamentos-de-estatistica-apostila 5/10

A Condução da Análise 2014/2

© Thierry R. Gasnier/ Universidade Federal do Aa!onas

##

#reciso e a acurácia podem ser medidas 5fi!.+.@8. Note que no podemos distin!uir se a faltade e$atido de um :nico tiro 5se!mento ,8 foipor falta de preciso ou por falta de acurácia% ouambos% se no tivermos um conunto de tiros.

<oc( pode dizer que a espin!arda da fi!uraanterior tem mais preciso que o revolver por-que o tamanho do se!mento entre os tiros maisdistantes 5se!mento 78 menor na espin!ardaque no revolver. <oc( pode dizer que a acuráciada espin!arda do álvo esquerdo da fi!ura ante-rior maior quanto devido O menor dist&nciaentre o centro do alvo e o centro dos tiros 5se!-mento +8.

A medida da acurácia :til para corri!ir distor-

ç'es pela calibra!em de armas e de equipa-mentos. )m equipamentos% como vimos acima% comum haver padr'es para a calibra!em% masocasionalmente precisamos calibrar procedi-mentos de outras formas. =ma!ine que voc(tivesse que estimar visualmente tamanhos de

 acars O dist&ncia. Neste caso% voc( pode cali-brar esta capacidade estimando tamanhos deobetos semelhantes a acars 5como troncos8 Odist&ncia e depois verificar como está se saindomedindo os obetos com uma trena. 3e tiver

tend(ncia a superestimar o tamanho% reduzasuas estimativas e se tiver tend(ncia a superes-timar% aumente as estimativas. 3e puder captu-rar acars% conveniente repetir a avaliaçopara melhorar a sua capacidade de estimar.Nin!um conse!ue acertar precisamente todasas medidas% mas voc( pode se considerar /cali-brado0 quando a quantidade de subestimativas semelhante O quantidade de superestimativas.

A medida da preciso importante para fabri-

cantes de instrumentos% mas a maioria dos ins-trumentos tem uma preciso fi$a% de forma quen"s% os usuários% no temos que nos preocuparcom ela no dia a dia% como ocorre com a cali-bra!em. )ntretanto% entender a medida de pre-ciso importante porque nos auda a entendera medida da variaço 5*i!. +.@-78% que funda-mental em estatística.

A preciso costuma ser medida pelo seu inver-so% a disperso dos valores. Quanto menor a

preciso% mais dispersos sero os dados aoredor do valor central. A medida mais simplesde disperso a A#E=>P) >9>AE% isto % adiferença entre o maior e o menor valor 5*i!.+.8. )ntretanto% uma medida que s" servepara comparar um n:mero fi$o de valores. <oc(no pode comparar a amplitude de 1 tiros deum rifle com a amplitude de 12 tiros de outro%

pois a amplitude s" tende a aumentar com on:mero de tiros.

Pma medida de disperso melhor o=N>)I<AE9 =N>)IQPAI>=E% que a amplitu-de dos dados depois de e$cluir 7V dos valoresmais altos e 7V dos valores mais bai$os. )sta

Figura 3.- Re)resenta0+o de $edidas relacionadas 4 e&atid+o51 desvio de u$ tiro ou ine&atid+o )ontual6 ' i$)recis+o deu$a es)ingarda dis)ers+o de valores ou i$)recis+o instru$en-tal6 3 descalirage$ ou tendenciosidade instru$ental inacurá-cia instru$ental. 7 i$)recis+o e a inacurácia s+o os dois as)ec-

tos da ine&atid+o instru$ental. 

Figura 3.8- Medi0+o da )recis+o de u$ a)arelho de $edir )ress+o arterial )or $9lti)las $edidas de )ress+o e$ con-di0:es estáveis. 7 7$)litude do /ntervalo /nter;uartil!otido )ela e&clus+o de '8< dos valores inferiores e '8<dos valores su)eriores = u$a $edida $elhor ;ue a 7$)li-tude #otal )or;ue n+o tende a au$entar co$ o n9$ero de

$edidas. 

8/16/2019 Fundamentos de Estatística - Apostila

http://slidepdf.com/reader/full/fundamentos-de-estatistica-apostila 6/10

A Condução da Análise 2014/2

© Thierry R. Gasnier/ Universidade Federal do Aa!onas

#4

medida no se altera de forma tendenciosa emfunço do tamanho amostral. )sta forma demedir a disperso relativamente pouco utiliza-da% na realidade% ela subutilizada% como vere-mos posterioremente.

9utra boa medida de disperso o )3<=9AG39EP>9 S=9% que a mdia das dist&n-cias entre cada valor e a mdia dos valores.Iepare que quanto maior a disperso dosdados% maior a dist&ncia mdia de cada pontodo centro. )ntretanto% a medida mais /popular0de disperso o )3<=9 #AIU9% em queas dist&ncias entre os valores e a mdia soelavadas ao quadrado% somadas% divididaspelo tamanho amostral menos um e o resulta-

do submetido O raiz quadrada. o ponto devista conceitual% o desvio padro semelhan-te ao desvio mdio absolutoR

9 desvio padro realmente uma e$celentemedida de disperso em muitas situaç'es%especialmente na medida da preciso de ins-trumentos e de procedimentos% mas neces-sário al!um cuidado. #rimeiro quanto ao n:-mero de valores usados em seu cálculo. Gas-tam dois valores para um cálculo de desvio

padro% mas cálculos com menos que dezvalores so pouco precisos como medida dedisperso e com menos que cinco so muito!rosseiros. Alm disto% o desvio padro podeno ser uma medida de disperso válida de-pendendo da distribuiço de frequ(ncias davariável em questo% como veremos na pr"$imaseço.

)m resumo% na prática% precisamos estar aten-tos para a acurácia de nossos procedimentos%

mas no to comum precisarmos avaliar apreciso das medidas que utilizamos. )m al!u-mas situaç'es% como no e$emplo das estimati-vas de tamanhos dos acars% a impreciso damedida pode ser muito importante e mereceatenço especial. )ntretanto% em muitos estu-dos% os procedimentos e instrumentos so ple-namente satisfat"rios% isto % sua impreciso irrelevante em comparaço O variaç'es naturaisem estudo. 3e sua planta cresce ,2cm entrecada medida% a preciso de , mm mais que

suficiente para as tuas análises. )m outros ca-sos% a preciso no to boa% mas ela pode sercompensada por um tamanho amostral maior.)mbora o conhecimento sobre preciso seaimportante% ainda mais importante o conceito

de disperso de valores.

>uadro 3.1- 7 $=dia arit$=tica 1 = u $ )ar?$etro )o)ulaci-onal utili2ado e$ cálculos de $uitas $edidas )ara$=tricas.>uando esti$ada co$ ase e$ u$a a$ostra! ela = geral$entesi$oli2ada co$ u$ @ ou u$ A co$ u$a arra enci$a. B(esvio 7soluto M=dio ' = u$a $edida si$)les e intuitivade dis)ers+o. B (esvio Padr+o 3 = u$a $edida e$ $aisutili2ada! co$ a $es$a essência do (7M. 7 f*r$ula de (Pa)resentada = utili2ada ;uando o deter$ina$os co$ ase e$u$a a$ostra! ;ue = a situa0+o $ais co$u$. NC #a$anhoa$ostral6 &iC cada valor registrado na a$ostra6 DC sí$olo$ate$ático de so$at*rio ;ue significa ;ue deve se so$ar oster$os a seguir na f*r$ula. uriosidade $ate$ática5 a estatís-tica )ara$=trica utili2a esti$ativas inicial$ente tendenciosas;ue necessita$ austes. G o caso do desvio )adr+o da a$ostraco$ seu deno$inador N-1. Por ;ue n+o calcula$os a $=diados desvios elevados ao ;uadrado co$ o deno$inador NH (efato! no cálculo de u$ desvio )adr+o de u$ conunto co$)letode dados o deno$inador = N. B )role$a = ;ue )ara deter$i-nar o desvio )adr+o )o)ulacional co$ ase e$ u$a a$ostraestare$os suesti$ando a dis)ers+o co$ o deno$inador N! )or;ue nossa $=dia n+o = a $=dia real! $as u$a esti$ativa;ue necessaria$ente = $ais central ao conunto de dados e$;uest+o. 7o dividir )or N-1 te$os u$ valor $ais a)ro&i$a-do do (P da )o)ula0+o. 

8/16/2019 Fundamentos de Estatística - Apostila

http://slidepdf.com/reader/full/fundamentos-de-estatistica-apostila 7/10

A Condução da Análise 2014/2

© Thierry R. Gasnier/ Universidade Federal do Aa!onas

#(

+.@  istribuiç'es de frequ(ncias

Quando temos diversos valores de uma variávelquantitativa% uma forma muito eficiente de apre-sentar os dados um W=3>9JIAA. )m um

histo!rama o ei$o $ corresponde aos valores davariável quantitativa divididos em intervalos e oei$o Z corresponde O frequencia de unidadesamostrais em cada um destes intervalos. )stafrequencia em Z pode ser a conta!em dos ca-sos% tambm chamada frequencia absoluta% ouuma proporço do total de valores% tambmchamada de frequencia relativa.

As =3>I=GP=T[)3 A3 *I)QP\NC=A3 emhisto!ramas podem mostrar informaç'es muito

importantes. A forma da curva uma das infor-maç'es mais importantes. Pma das formasmais comuns a =3>I=GP=TU9 N9IAE 5oudistribuiço Jaussiana8% que tem o formato deum sino. Quando a distribuiço tem este forma-to% podemos resumir o conunto de dados com

apenas dois n:meros% a mdia e o desvio pa-dro. Nesta curva% apro$imadamente B1V dosdados esto a um desvio padro da mdia% Va dois desvios e V a tr(s desvios padr'es.

Quando a forma da curva lembra dois sinosapro$imadamente sobrepostos% temos umadistribuiço bimodal% pois há duas modas% isto dois valores com frequencias mais altas. Pme$emplo de distribuiço bimodal a altura deadultos% pois há duas curvas sobrepostas% umapara homens e uma para mulhes com modasdiferentes% pois as mdias variam com o se$o.Iepare que neste caso a mdia e o desvio pa-dro á no descrevem bem a populaço. )mcasos como este% pode ser melhor apresentar a

pr"pria distribuiço de frequencia% ao invs dosdois valores. =nfelizmente% muito comum queas pessoas calculem mdias e desvios padr'espara caracterizar um conunto de dados emdistrubuiç'es que no correspondem a curvasnormais.

Figura 3.I- (uas distriui0:es de fre;uência co$ for$atosdiferentes. Na figura 7! a distriui0+o te$ o for$ato a)ro-&i$ado de u$ sino. Na figura , a distriui0+o = forte$enteassi$=trica. 7s a$)litudes co$ "8< dos dados fora$deter$inadas co$ cálculo )ara$=trico e$ 1 e )or e&clu-s+o de e&tre$os e$ '.

Figura 3.J- E&e$)los gráficos ;ue ilustra$ $odelos dedistriui0:es de )roailidades te*ricas. Estes $odelosserve$ co$o ases )ara utili2a0+o de ferra$entas estatís-ticas se )ode$os assu$ir ;ue eles real$ente s+o co$)a-tíveis co$ a d istriui0+o na )o)ula0+o.

8/16/2019 Fundamentos de Estatística - Apostila

http://slidepdf.com/reader/full/fundamentos-de-estatistica-apostila 8/10

A Condução da Análise 2014/2

© Thierry R. Gasnier/ Universidade Federal do Aa!onas

#)

Wá outras formas comuns de distribuiço querecebem nomes e que possuem modelos ma-temáticos associados% como a curva #oison%Eo! Normal e Pniforme. )ntretanto% o formatoda curva tambm pode ser irre!ular e assim

mesmo muito informativo. =ma!ine que voc(apresentasse um histo!rama do tamanho de acars machos em uma la!oa. Ao analisar opadro de distribuiço dos dados% voc( poderiaperceber uma curva apro$imadamente bimodalcom muitos ovens pequenos e raros ovens detamanhos intermediários e vários adultos !ran-des. Pm especialista poderia interpretar estaforma dizendo que a falta de tamanhos interme-diários nesta la!oa pode ser um indício que aios adultos matam os ovens. )ste apenas um

e$emplo hipottico para ilustrar que a distribui-ço de frequencias pode ser informativa tam-bm de fen]menos biol"!icos% se voc( souber/ler0 a forma da distribuiço dos dados.

<amos voltar O nossa curva normal. )ste forma-to de curva muito importante em todas asáreas% e isto no diferente na Giolo!ia. Na)n!enharia% ela muito utilizada para medirpreciso de instumentos% como discutimos naseço anterior. >alvez em funço disto% esta

variaço sea confundida frequentemente com aidia de erro. S importante ressaltar que naGiolo!ia esta variaço raramente indica erro%!eralmente indica principalmente uma<AI=ATU9 NA>PIAE. 3e voc( medir a alturade várias pessoas% certamente haverá um pe-queno erro de medida% entretanto% a maior parteda variaço que vai encontrar variaço natu-ral% uma característica biol"!ica relevante emuma populaço.

S muito comum que a variaço natural tenhadistribuiço normal. #or e$emplo% o tamanho deanimais adultos 5inclusive humanos8 de ummesmo se$o em uma localidade tipicamentepossuem distribuiço normal. #or causa disto%foi criada toda uma srie de mtodos estatísti-cos 5chamados mtodos paramtricos8 paralidar com valores com variáveis que possuemdistribuiço normal. 9 problema% que tambm muito comum que a variaço natural no si!auma distribuiço normal. 3e o desvio da norma-

lidade for pequeno% os resultados dos mtodosestatísticos ainda so confiáveis% mas tudo temlimite. #or e$emplo% se voc( estiver estudandosalários de pessoas em um pais 5*i!. +.B8% adistribuiço dos dados no terá a forma de umacurva normal% á que muitas pessoas recebemsalários bai$os% poucas recebem salários altos%e al!umas podem receber valores centenas devezes superiores O mdia. 9 usuário de estatís-tica precisa saber o limite de se!urança dastcnicas que está utilizando.

)m resumo. As distribuiç'es de frequ(ncia t(mimport&ncia direta e indireta em estudos biol"!i-cos. A import&ncia direta está na interpretaçode causas e consequ(ncias do formato da dis-tribuiço. #or e$emploF a8 uma distribuiço bi-modal 5fi!. +.68 pode indicar uma seleço natu-ral disruptiva em um caráter biol"!ico4 b8 pir&-mides etárias so uma forma especial de histo-!rama que revelam importantes característicasde populaç'es% como o !rau de desenvolvimen-to social de um pais. A import&ncia indireta estáem permitir a verificaço de premissas para autilizaço de determinadas ferramentas de aná-lise estatística% como a validade de se utilizar amdia e o desvio padro para caracterizar umconunto de dados ou para verificar premissaspara a utilizaço de certos testes estatísticos%como veremos em outros capítulos.

Figura 3.K- >uando te$os u$a distriui0+o nor$al! )ode-$os deter$inar co$ ase na $=dia e no desvio )adr+o(P! co$o os dados se distriue$ e a )ro)or0+o a cadaintervalo entre u$! dois e três desvios )adr:es aci$a e

aai&o da $=dia.

8/16/2019 Fundamentos de Estatística - Apostila

http://slidepdf.com/reader/full/fundamentos-de-estatistica-apostila 9/10

A Condução da Análise 2014/2

© Thierry R. Gasnier/ Universidade Federal do Aa!onas

#*

+.  #ar&metros populacionais

Na Giolo!ia% !eralmente estamos mais interes-sados em características de populaç'es ou de

conuntos de observaç'es ou eventos do queem indivíduos ou em eventos sin!ulares. Al!u-mas destas características so valores quantita-tivos denominados par&metros.

Quando temos um conunto de valores 5popula-ço estatística8 com distribuiço de frequ(nciaestatisticamente estável% podemos estimarapropriadamente al!uns par&metros a partir desubconuntos representativos 5amostras8. =sto muito :til% á que raramente temos acesso atoda a populaço estatística em que estamosinteressados em um estudo. Nesta seço seroapresentados os par&metros populacionais maisimportantes. 9s par&metros podem ser univari-ados 5de conta!em% de proporço% de variáveisordinais% de variáveis quantitativas8 ou multiva-riados 5de relaço8.

9s par&metros de conta!em so totais paratoda a populaço% como n:mero total de indiví-duos da populaço estatística 5no confunda on:mero de indivíduos da populaço com tama-nho de uma amostra desta populaço8.

9s par&metros de proporço so conta!ens deunidades amostrais de uma cate!oria divididospor um total de unidades amostrais% como arazo se$ual de adultos e a ta$a de sucessosem um estudo sobre aprendizado 5sucessosYtentativas8. )m variáveis binárias s" se apre-senta um par&metro de proporço relevante 5e.!. razo se$ualL machosY total8% pois o par&me-tro da outra cate!oria 5f(measY total8 seria re-dundante% de forma que voc( pode escolherqualquer um. Quando há mais de duas cate!o-rias em uma variável% pode haver mais de umpar&metro relevante 5e. !. /azulYtotal0% /ver-deYtotal0% /amareloYtotal08. )mbora isto possa seraplicado para cate!orias ordinais% normalmente preferível se usar outro par&metro que seráapresentado adiante para esta escala.

9s par&metros de variáveis quantitativas envol-vem conta!ens% como o n:mero mdio de clu-las brancas por campo em uma l&mina de san-!ue% ou medidas /contínuas0% como o desviopadro no tamanho 5em ^m8 de indivíduos de

uma populaço de Artemia salina. Note que asconta!ens neste tipo de par&metro no so deunidades amostrais% mas de al!o que está emcada unidade amostral. No e$emplo da l&minade san!ue% a unidade amostral era campo e apopulaço eram os campos daquela l&mina.

9s par&metros de variáveis ordinais e de variá-veis quantitativas mais importantes so de tr(stiposF de tend(ncia central% de disperso e e$-tremos. As tr(s medidas de tend(ncia central

principais so a mdia% a mediana e a moda. Amdia comum 5tambm chamada de mdiaaritmtica8 a soma dos valores dividida pelon:mero de observaç'es 5a princípio no deveriaser aplicado para variáveis ordinais8. A medianadivide os valores ordenados pela metade. #ore$emplo% se colocarmos 7 valores em ordemcrescente% a mediana será o ,+_ valor. A moda o valor mais frequente quando os dados quan-titativos esto a!rupados em intervalos. A me-diana !eralmente considerada uma medida

mais apropriada de /centralidade0 quando notemos uma distribuiço normal ou apro$imada-mente normal% entretanto% a mdia sempreuma medida si!nificativa para medidas quantita-tivas% mesmo na aus(ncia de normalidade% poisreflete um aspecto de centralidade que a medi-ana no reflete.

Nas seç'es anteriores vimos medidas de dis-perso como o esvio #adro e a Amplitude do=ntervalo =nterquartil. 3e a impreciso da medida

for pouco relevante em relaço O variaço natu-ral% estas medidas tambm so par&metrospopulacionais 5quando toda a populaço foiamostrada8% ou estimativas de par&metros po-pulacionais 5quando o cálculo foi feito por umaamostra8% pois a variaço uma característicade uma populaço.

#ar&metros quantitativos e$tremos so o má$i-mo e o mínimo populacional para uma variável.No nos referimos a mdias de mínimos ou de

8/16/2019 Fundamentos de Estatística - Apostila

http://slidepdf.com/reader/full/fundamentos-de-estatistica-apostila 10/10

A Condução da Análise 2014/2

© Thierry R. Gasnier/ Universidade Federal do Aa!onas

#+

má$imos% mas a estimativas de mínimos e má-$imos absolutos a partir de amostras. 3ua de-terminaço bem mais incerta e comple$a doque para medidas de centralidade e de disper-so. #or este motivo% raramente so tratados

em cursos básicos% entretanto% so par&metrose$tremamente importantes. #or e$emplo% preci-samos ter estimativas do valor má$imo da en-chente de um rio para construirmos uma barra-!em se!ura.

#ar&metros multivariados envolvem mais deuma variável ao mesmo tempo. #or e$emplo% adiferença nos tamanhos mdios de machos ef(meas de ratos silvestres em uma populaço5par&metro de !rau de dimorfismo se$ual em

tamanho8 ou a inclinaço 5coeficiente an!ular8da reta que descreve a relaço entre o peso deindivíduos uma populaço de ratos silvestres ea quantidade de recursos alimentares em suaárea de vida 5par&metro em um modelo mate-mático8. 3o par&metros% pois so característi-cas quantitativas relacionadas a estas popula-ç'es% e so importantes nos estudos de rela-ç'es. Wá análises em que diversos par&metrosso determinados ao mesmo tempo% como emequaç'es que descrevem a relaço entre uma

variável resposta e diversas variáveis preditoras5re!resso m:ltipla8.8.