Métodos Quantitativos Métodos - qualittert.com.br · Métodos Quantitativos Estatísticos...

of 142 /142
Métodos Quantitativos Estatísticos Denise Maria Martins Este material é parte integrante do acervo do IESDE BRASIL S.A., mais informações www.iesde.com.br

Embed Size (px)

Transcript of Métodos Quantitativos Métodos - qualittert.com.br · Métodos Quantitativos Estatísticos...

  • Mt

    odos

    Qua

    ntita

    tivos

    Est

    ats

    ticos

    MtodosQuantitativos

    Estatsticos

    MtodosQuantitativosEstatsticos

    Denise Maria Martins

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Denise Maria Martins

    Mtodos Quantitativos Estatsticos

    IESDE Brasil S.A.Curitiba

    2012

    Edio revisada

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 2008 IESDE Brasil S.A. proibida a reproduo, mesmo parcial, por qualquer processo, sem autorizao por escrito dos autores e do detentor dos direitos autorais.

    CIP-BRASIL. CATALOGAO-NA-FONTESINDICATO NACIONAL DOS EDITORES DE LIVROS, RJ __________________________________________________________________________________M341m Martins, Denise Maria Mtodos quantitativos estatsticos / Denise Maria Martins. - 1.ed., rev. - Curitiba, PR : IESDE Brasil, 2012. 138p. : 24 cm Inclui bibliografia ISBN 978-85-387-2986-0 1. Estatstica matemtica. 2. Probabilidades. I. Ttulo. 12-5023. CDD: 519.5 CDU: 519.2 16.07.12 31.07.12 037526 __________________________________________________________________________________

    Capa: IESDE Brasil S.A.

    Imagem da capa: Shutterstock

    IESDE Brasil S.A.Al. Dr. Carlos de Carvalho, 1.482. CEP: 80730-200 Batel Curitiba PR 0800 708 88 88 www.iesde.com.br

    Todos os direitos reservados.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Denise Maria MartinsMestre em Administrao Estratgica pela Universidade Cidade de So Paulo (Unicid). Especialista em Engenharia da Qualidade pela Universidade Catlica de Minas Gerais (PUC-Minas). Graduada em Estatstica pelo Centro Universitrio Capital (Unicapital). Atua como gestora de processos.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • sum

    rio

    sum

    rio

    sum

    rio

    sum

    rio Estatstica com aplicaes e anlise exploratria 1111 | Estatstica: definio e aplicaes13 | Conceitos e regras20 | Anlise exploratria de dados: o problema

    Medidas de tendncia central e posio 35

    35 | Definio

    47 | Quartis, Decis e Percentis

    Medidas de variabilidade 55

    55 | Definio

    60 | O problema

    Introduo probabilidade e distribuio de probabilidade discretas

    75

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Distribuio de probabilidade contnua

    113

    113 | Definio

    132 | Apndice n. 1 Tabela 1: reas sob a curva normal

    Referncias 137

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Apresentao Mtodos Q

    uantitativos Estatsticos

    O assunto da estatstica pode ser apresentado em diversos nveis de dificuldades matemticas e orientado para aplicaes em vrios campos de pesquisa. A consequncia apresentao de textos sobre estatstica mdia, estatstica para administrao, estatstica educacional, estatsti-ca psicolgica e at mesmo estatstica para his-toriadores. Embora os problemas que surgem nessas diversas reas por vezes exijam tcnicas estatsticas especiais, nenhum dos mtodos bsicos apresentados neste livro est restrito a qualquer campo particular de aplicao.Os objetivos gerais da Estatstica aplicados Ad-ministrao so os seguintes:

    Desenvolver a confiana dos alunos ao lidar com dados numricos;

    Expor o leitor a uma ampla variedade de tcnicas estatsticas introdutrias para uso na interpretao e anlise de dados empre-sariais.

    No livro, temos a descrio das principais ferra-mentas e mtodos, apresentando a estatstica e a anlise exploratria, em que so indicados conceitos bsicos e ferramentas para anlise gr-fica. A aplicao da estatstica envolve medidas de tendncia central e de posio, evidenciando mtodos e ferramentas para indicar valores que representam a maioria dos dados de forma resu-mida. O desenvolvimento e o entendimento de medidas de variabilidade que permitem ao leitor

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • acrescentar a sua interpretao e anlise de ferramen-tas para medir as disperses de amostras analisadas. Temos a Introduo probabilidade e distribuies de probabilidade discretas demonstrando mtodos para tratamento de dados discretos e indicando clculos de probabilidade. Como encerramento apresentada a distribuio de probabilidade contnua, representada pela distribuio normal como meio para a realizao de previses em determinados contextos onde temos varivel contnua como dados.

    Mtodos Q

    uantitativos Estatsticos

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 11

    Estatstica com aplicaes e anlise exploratria

    Estatstica: definio e aplicaesNo moderno ambiente administrativo e econmico global, dispe-se de

    uma vasta quantidade de informaes estatsticas. Os gerentes e tomadores de deciso de maior sucesso so aqueles capazes de entender a informao e us-la de forma eficaz. As empresas precisam de informaes para tomar as decises: parte dessas informaes ser transformada em dados e em anli-se estatstica.

    Uma definio de dicionrio afirma que estatstica a apresentao de fatos numricos coletados sistematicamente, ordenados e estudados. Para aqueles que tomam decises, o principal papel da estatstica fornecer-lhes os mtodos para obter e converter dados (valores, fatos, observaes, medi-es) em dados teis.

    Dados de Entrada

    Coletar Organizar Analisar Interpretar

    Informaes de sada

    Figura 1 Definio de Estatstica.

    O objetivo da estatstica proporcionar conhecimento a partir de dados. Os dados so nmeros que representam um contexto. Exemplo: o nmero 4,8, no d, por si s, qualquer informao. Mas se o filho recm-nascido de um amigo pesa 4,8 quilos, congratula-se pelo tamanho do filho. O contexto motiva o conhecimento fundamental e permite fazerem-se julgamentos.

    Do ponto de vista prtico, pode-se dividir a estatstica em trs partes.

    (SM

    AIL

    ES, 2

    007)

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 12

    Estatstica com aplicaes e anlise exploratria

    Anlise de dados (estatstica descritiva): consiste em mtodos e ideias para organizar e descrever dados mediante a utilizao de grficos, re-

    sumos numricos e descries matemticas mais elaboradas. A revo-

    luo do computador colocou a anlise de dados no centro da prtica

    estatstica.

    A produo de dados fornece mtodos para produzir dados que podem dar respostas mais claras a questes especficas. Os conceitos bsicos de

    como selecionar amostras (tcnicas de amostragem) e planejar experi-

    mentos so talvez as mais importantes de todas as ideias estatsticas.

    A inferncia estatstica vai alm dos dados disponveis e procura tirar concluses sobre um universo mais amplo. A inferncia estatstica no

    s formula concluses, como tambm as acompanha, indicando seu

    grau de confiabilidade.

    Os dados vm em diferentes formas, cada uma das quais tratada de

    maneira um pouco diferente na converso em informaes.

    Quadro 1 Tipo de dados

    Dados

    Qualitativos (Categricos) Quantitativos

    Nominais

    Categorias nomeadas

    Ordinais

    Nmeros agem como categorias/

    ordenaes

    Contnuos

    Qualquer valor dentro de um intervalo

    possvel

    Discretos

    Somente valores fixos so possveis (valores

    absolutos)

    Supondo as situaes a seguir pode-se entender a importncia da esta-

    tstica e sua aplicao nas atividades em que as decises devem ser tomadas

    em um curto espao de tempo e a um baixo custo.

    Contexto A

    Uma empresa que est se preparando para lanar um novo produto pre-

    cisa conhecer as preferncias dos consumidores no mercado de interesse.

    Para isso, pode fazer uma pesquisa de mercado entrevistando um nmero

    de residncias escolhidas aleatoriamente. Poder ento usar os resultados

    para estimar as preferncias de toda a populao.

    (SM

    AIL

    ES, 2

    007)

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Estatstica com aplicaes e anlise exploratria

    13

    Contexto B

    Um auditor deve verificar os livros de uma empresa, para se certificar de

    que os lanamentos refletem efetivamente a situao financeira da com-

    panhia. Ele deve examinar pilhas de documentos originais, como notas de

    venda, ordens de compra e requisies. Seria um trabalho incalculvel con-

    sultar todos os documentos originais; em vez disso, o auditor pode verificar

    uma amostra de documentos escolhidos aleatoriamente, com base nessa

    amostra, fazer inferncias sobre toda a populao.

    Contexto C

    Um tcnico de controle da qualidade deve realizar um ensaio para ga-

    rantir que o produto fabricado est funcionando conforme as especificaes

    do cliente. Por se tratar de palitos de fsforos, o ensaio destri o produto, o

    tcnico utiliza seleo de amostras para realizar e concluir sua anlise.

    Os contextos permitem refletir como analisar uma situao sem a ne-

    cessidade de levantar todos os dados, isso possvel atravs da estatstica

    e a aplicao de mtodos na coleta de dados que estimam as caractersti-

    cas da populao com base na amostra. Uma das vantagens em utilizar-se

    de amostras, encontra-se no fato de chegar a uma concluso e/ou deciso

    em um tempo menor a um custo reduzido, levando-se tambm em consi-

    derao que em algumas situaes o processo de pesquisa destri o ele-

    mento pesquisado.

    Como dispendioso, difcil e por vezes impraticvel ter acesso a toda

    uma populao, costuma-se escolher uma amostra e estud-la.

    Para evitar predies imprecisas, essencial que a amostra represente

    efetivamente a populao da qual foi extrada.

    Conceitos e regras

    Estatstica uma coleo de mtodos para planejar experimentos, obter dados e or-

    ganiz-los, resumi-los, analis-los, interpret-los e deles extrair concluses.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 14

    Estatstica com aplicaes e anlise exploratria

    Populao (N)

    uma coleo de todos os elementos (valores, pessoas, medidas etc.) a serem estudados.

    Amostra (n)

    uma subcoleo de elementos extrados de uma populao.

    Populao Amostra

    Figura 2 Definio de populao e amostra.

    Parmetro e EstatsticaUm Parmetro uma medida numrica que descreve uma caracterstica

    de uma populao, enquanto Estatstica uma medida numrica que des-creve uma caracterstica de uma amostra.

    Dados quantitativosConsistem em nmeros que representam contagens ou medidas. Ex.: du-

    rao de uma msica.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Estatstica com aplicaes e anlise exploratria

    15

    Dados discretosResultam de um conjunto finito de valores possveis, ou de um conjunto

    enumervel desses valores (o nmero de valores possveis 0, ou 1, ou 2 etc.), ou seja, quando os dados representam contagens so discretos.

    Ex.: contagens, nmeros de mensagens em uma secretria eletrnica, nmero de visitas a Londres.

    Dados contnuos (numricos)Resultam de um nmero infinito de valores possveis que podem ser as-

    sociados a pontos em uma escala contnua de tal maneira que no haja la-cunas ou interrupes, ou seja, quando os dados representam mensuraes, so contnuos. Ex.: alturas, salrios, horrios, pesos.

    Dados qualitativos (ou dados categricos, ou atributos)

    Podem ser separados em diferentes categorias que se distinguem por alguma caracterstica no numrica. Ex.: estilo de msica.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 16

    Estatstica com aplicaes e anlise exploratria

    Nveis de mensurao de dados

    Outra forma de classificar dados tambm muito comum.

    Quadro 2 Nveis de mensurao de dados

    Nvel Sumrio Exemplo

    Nominal Categorias somente. Os dados no podem ser dispostos em um esquema ordenado.

    Carros de alunos

    10 Mercedez

    20 Ferraris

    40 Porsches

    Categorias ou nomes somente

    Ordinal

    As categorias so ordenadas, mas no podem estabelecer diferenas, ou estas no tm sentido.

    Carros de alunos

    10 Compactos

    20 Mdios

    40 Grandes

    Est determinada uma ordem: compacto; mdio e grande.

    Intervalo

    Podemos determinar diferenas entre valores, mas no h ponto de partida inerente. As razes no tm sentido.

    Temperatura no campus

    45 F

    80 F

    90 F

    90 F no duas vezes mais quente do que 45F

    Razo Como intervalo, mas com um ponto de partida inerente. As razes tm sentido.

    Peso de jogadores em uma faculdade

    115 lb

    195 lb

    300 lb

    300 lb duas vezes 150 lb

    Tabelas de frequnciasRelaciona categorias (ou classes) de valores, juntamente com contagens (ou

    frequncias) do nmero de valores que se enquadram em cada categoria.

    Exemplo: tabela de frequncia da idade dos alunos de Administrao.

    idade frequncia

    De 18 a menos de 19 16

    De 19 a menos de 20 7

    De 20 a menos de 21 7

    De 21 a menos de 22 3

    22 ou mais 3

    36

    (TRI

    OLA

    , 199

    9)

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Estatstica com aplicaes e anlise exploratria

    17

    RolUm rol um arranjo de dados numricos brutos em ordem crescente ou

    decrescente de grandeza.

    Exemplo: 2, 3, 4, 5, 6, 7, 8, 9, 10.

    Limites inferiores de classes

    So os menores nmeros que podem efetivamente pertencer s diferen-tes classes.

    De 18 a menos de 19

    Amplitude de classe + limite inferior da primeira classe

    1 + 18 = 19 ( limite inferior da segunda classe)

    idade frequnciaDe 18 a menos de 19 16

    limite inferior de classes

    Limites superiores de classes

    So os maiores nmeros que podem efetivamente pertencer s diferen-tes classes.

    Exemplo:

    classes idade frequncia1 De 18 a menos de 19 16

    limite superior de classes

    Amplitude de classe

    a diferena entre dois limites de classe inferiores consecutivos ou entre duas fronteiras inferiores de classe consecutivas.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 18

    Estatstica com aplicaes e anlise exploratria

    Exemplo:

    Diferena entre dois limites de classes inferiores

    idade frequnciaDe 18 a menos de 19 16

    De 19 a menos de 20 7

    Fronteiras de classes

    So os nmeros usados para separar classes, mas sem as lacunas criadas pelos limites de classe, podendo ser representados pelos intervalos de clas-ses ajustados.

    Exemplo:

    classes intervalo de classes

    1 18 19

    fronteira de classes

    Intervalo de classe

    a amplitude de uma classe, ou intervalo de valores que ela pode conter e dado pela diferena entre seus limites ou fronteiras.

    Exemplo:

    classes intervalo de classes ponto mdio

    1 18 19 18,5

    2 19 20 19,5

    Distribuio de frequncia

    o agrupamento dos dados em um certo nmero de classes, intervalos ou categorias.

    Exemplo:

    Idade frequncia

    De 18 a menos de 19 16

    De 19 a menos de 20 7

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Estatstica com aplicaes e anlise exploratria

    19

    Histograma

    Consiste em uma escala vertical para as frequncias e barras para repre-sentar os valores das frequncias das diversas classes.

    Exemplo:

    40

    30

    20

    10

    0

    11,4 25,9 40,4 54,9 69,4 83,9 98,4 112,9

    25,9 40,4 54,9 69,4 83,9 98,4 112,9 127,4

    Histograma

    Polgono de frequncia

    uma variante do histograma, sendo que as frequncias so marcadas nos pontos mdios, e os valores so unidos por segmentos retilneos.

    Exemplo:

    Polgono de frequncia

    11,4 25,9 40,4 54,9 69,4 83,9 98,4 112,925,9 40,4 54,9 69,4 83,9 98,4 112,9 127,4

    35

    30

    25

    20

    15

    10

    5

    0

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 20

    Estatstica com aplicaes e anlise exploratria

    Ponto mdio

    Obtm-se adicionando os limites inferior e superior de uma classe e divi-dindo-se o resultado por dois.

    Exemplo:

    classes intervalo de classes ponto mdio

    1 18 19 18,5

    2 19 20 19,5

    Ramo e folhas

    uma tabela em que cada linha representa a posio de um ramo e cada algarismo direita da reta pode ser considerado uma folha.

    Exemplo:

    ramo folhas

    1 1 5

    2 6 7 8

    3 7

    4 0 0 0 0 0 1 1 1 2 2 2 2 3 3 4 9

    5 0 2 2 3 3 3 3 4 5 5 5 5 5 5 6 6 6

    6 0 0 0 0 0 0 1 3 3 4 6 6 7 7 7 7 8 8 8 8 9 9

    7 4 5 5 5 6 6 7 7

    8 0 1 2 2 2 2 3 3 3 4 5 5 6 6 9

    9 0 3 4 5 5 6 7 7 7

    10 0 3 8

    Anlise exploratria de dados: o problema

    Contexto AA organizao e apresentao de informaes numricas a primeira

    etapa para entender um problema. Como situao tpica, considerando os valores a seguir, que representam o tempo de percurso at o trabalho de empregados de um grande escritrio localizado no centro de uma cidade.

    (TRI

    OLA

    , 199

    9)

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Estatstica com aplicaes e anlise exploratria

    21

    Os tempos so em minutos e cada valor representa o tempo mdio gasto

    por um empregado em cinco dias teis. A simples coleta de dados por si

    s j no tarefa simples, mas claro que preciso muito mais para tornar

    os nmeros compreensveis. O que se pode fazer para tornar esta massa de

    informaes mais utilizvel?

    Tabela 1 Coleta de dados de tempo de percurso ao trabalho em minutos

    49,6 42,6 43,2 44 50,6 52,6 53,6 42,2 52,4 43

    55,4 53,6 54,6 55 55,4 55,8 55,8 53,6 55,6 53,8

    60,2 56,4 60 60,2 60,4 60,8 61 56,2 60,4 56,4

    67 63,8 66,8 66,8 67,2 67,4 68 63,4 67,4 64

    74 68,2 69,8 69,8 75,4 75,8 76 68 75,8 68,8

    82 77,4 80 81,2 82,4 82,6 82,8 76 82,6 77,8

    85,4 83,2 84 85 86,4 89,6 95,2 83 86,4 83,4

    29,4 15,8 37 28,8 30,2 36,8 38,4 11,4 35,8 26

    41 40,4 40,6 40,8 41 42 42 40,2 41,4 40,4

    103,4 97 97,8 100 108,2 123,8 125,4 96,8 110,2 97

    Explorando o problema

    Ao analisar um conjunto de dados, deve-se determinar se uma amos-tra ou uma populao. Essa determinao afetar no somente os mtodos utilizados, mas tambm suas concluses. Na sequncia utilizar mtodos de

    estatstica descritiva (anlise dos dados) para resumir ou descrever as carac-

    tersticas importantes de um conjunto conhecido de dados, considerando

    a tabela de frequncia e o histograma como um mtodo para organizar e

    resumir os dados coletados.

    O objetivo do uso da tabela de frequncia e histograma identificar a

    natureza ou forma da distribuio dos dados, como forma de sino, uniforme

    ou assimtrica.

    Equacionando o problema

    O processo de construo de uma tabela de frequncia e grficos que

    envolvem os seguintes passos:

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 22

    Estatstica com aplicaes e anlise exploratria

    Passo 1:

    Organizar os dados em ordem crescente ou decrescente de grandeza.

    Arranjar os dados em forma de Rol.

    Aplicando no exemplo:

    Coleta de dados em Rol tempo de percurso ao trabalho em minutos

    11,4 15,8 26 28,8 29,4 30,2 35,8 36,8 37 38,4

    40,2 40,4 40,4 40,6 40,8 41 41 41,4 42 42

    42,2 42,6 43 43,2 44 49,6 50,6 52,4 52,6 53,6

    53,6 53,6 53,8 54,6 55 55,4 55,4 55,6 55,8 55,8

    56,2 56,4 56,4 60 60,2 60,2 60,4 60,4 60,8 61

    63,4 63,8 64 66,8 66,8 67 67,2 67,4 67,4 68

    68 68,2 68,8 69,8 69,8 74 75,4 75,8 75,8 76

    76 77,4 77,8 80 81,2 82 82,4 82,6 82,6 82,8

    83 83,2 83,4 84 85 85,4 86,4 86,4 89,6 95,2

    96,8 97 97 97,8 100 103,4 108,2 110,2 123,8 125,4

    Passo 2:

    Decidir o nmero de classes de sua tabela de frequncia.

    A ttulo de orientao, o nmero de classes deve ficar entre 5 e 20.

    O nmero efetivo de classes pode depender da convenincia de utilizar nmeros arredondados ou outros fatores subjetivos.

    Importante: a relao entre o nmero de classes (k) e o tamanho da amos-tra (n), foi estudada por Sturges, o qual estabeleceu a relao:

    Clculo do nmero de classes (k)

    k (nmero de classes) = 1 + lognlog

    2

    Aplicando no exemplo:

    k = 1 + log100log

    2

    = 764 ou seja, k = 7,64

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Estatstica com aplicaes e anlise exploratria

    23

    Passo 3:

    Determinar o maior e o menor valor dos dados organizados.

    Calcular a amplitude total do Rol (diferena entre o maior e o menor dos valores coletados).

    Aplicando no exemplo:

    Amplitude total do Rol = 125,4 11,4 ou seja, amplitude total do Rol = 114

    Passo 4:

    Dividir a amplitude total do rol pelo nmero de classes.

    Arredondar o resultado para mais, at um nmero conveniente. Esse ar-redondamento para mais, no somente conveniente como tambm ga-rante que todos os valores sejam includos na tabela de frequncias.

    Frmula 1 Clculo da amplitude de classe (h)

    Amplitude de classe (h) = R (Amplitude)

    k (Nmero de classes)(arredondar para mais)

    Aplicando no exemplo:

    Amplitude de classe (h) = =1148

    14,25, ou seja, 14,5

    (os dados originais trabalham com uma casa decimal)

    Passo 5:

    Escolher como limite inferior da primeira classe o menor valor observado ou um valor ligeiramente inferior a ele.

    Esse valor serve como ponto de partida.

    Aplicando no exemplo:

    Limite inferior da primeira classe com intervalo fechado para inclu-lo = 11,4

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 24

    Estatstica com aplicaes e anlise exploratria

    Passo 6:

    Somar a amplitude de classe ao ponto de partida, obtendo o segundo limite inferior de classe.

    Adicionar a amplitude de classe ao segundo limite inferior para obter o terceiro; e assim por diante.

    Aplicando no exemplo:

    Amplitude de classe + limite inferior da primeira classe

    11,4 + 14,5 = 25,9 (limite inferior da segunda classe)

    Obs.: fazer o mesmo at completar as oito classes.

    Passo 7:

    Relacionar os limites inferiores de classe em uma coluna e introduzir os limites superiores, que podem ser facilmente determinados a esta altura.

    Aplicando no exemplo:

    Tabela 2 Frequncia do tempo de percurso ao trabalho em minutos

    classes intervalo de classes

    1 11,4 25,9

    2 25,9 40,4

    3 40,4 54,9

    4 54,9 69,4

    5 69,4 83,9

    6 83,9 98,4

    7 98,4 112,9

    8 112,9 127,4

    Passo 8:

    Representar cada observao por um pequeno trao na classe apropriada e, com auxlio desses traos, determinar a frequncia total de cada classe.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Estatstica com aplicaes e anlise exploratria

    25

    Aplicando no exemplo:

    Tabela 3 Frequncia com classes ajustadas: tempo de percurso at o trabalho em minutos

    classes intervalo de classes intervalo de classe ajustado

    1 11,4 25,9 11,4 a 25,8

    2 25,9 40,4 25,9 a 40,3

    3 40,4 54,9 40,4 a 54,8

    4 54,9 69,4 54,9 a 69,3

    5 69,4 83,9 69,4 a 83,8

    6 83,9 98,4 83,9 a 98,3

    7 98,4 112,9 98,4 a 112,8

    8 112,9 127,4 112,9 a 127,3

    Tabela 4 Frequncia com frequncia total: tempo de percurso ao trabalho em minutos

    classes intervalo de classes frequncia

    1 11,4 25,9 02

    2 25,9 40,4 09

    3 40,4 54,9 23

    4 54,9 69,4 29

    5 69,4 83,9 20

    6 83,9 98,4 11

    7 98,4 112,9 04

    8 112,9 127,4 02

    Passo 9:

    Representar as distribuies de frequncia (dados da tabela de frequn-cia) em forma grfica, conhecida como histograma. Um histograma cons-trudo representando-se as medidas ou observaes que so agrupadas em uma escala horizontal, e as frequncias de classes em uma escala vertical; traam-se os retngulos, onde as bases so iguais aos intervalos de classes e cujas alturas so as frequncias de classe correspondentes.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 26

    Estatstica com aplicaes e anlise exploratria

    Aplicando no exemplo:

    Grfico 1 Histograma dos tempos de percurso ao trabalho

    35

    30

    25

    20

    15

    10

    5

    0

    11,4 25,9 40,4 54,9 69,4 83,9 98,4 112,9

    25,9 40,4 54,9 69,4 83,9 98,4 112,9 127,4

    Histograma

    Passo 10:

    A finalidade do histograma a de ajudar a entender os dados. Aps ter sido construdo deve-se perguntar: Que que estou vendo? Procurar no s um padro global, como tambm desvios acentuados em relao ao mesmo. No caso de um histograma, o padro global a forma geral da dis-tribuio. Os valores discrepantes so um tipo importante de desvio em rela-o ao padro global. Uma vez localizados os valores discrepantes, deve-se procurar uma explicao. Muitos valores discrepantes so provenientes de erros, outros revelam a natureza especial de algumas observaes. A expli-cao dos valores discrepantes, em geral, requer alguma informao bsica do contexto.

    Passo 11:

    Outra forma, no tanto utilizada de apresentao grfica o polgono de frequncia, onde as frequncias so marcadas nos pontos mdios de cada intervalo de classe, e os valores sucessivos so unidos por segmentos retilneos.

    Frmula 2 Clculo do ponto mdio

    (considerar os valores dos intervalos)

    Ponto mdio = (X maior + X menor)2

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Estatstica com aplicaes e anlise exploratria

    27

    Aplicando no exemplo:

    Tabela 5 Frequncia com ponto mdio Tempo de percurso ao trabalho

    classes intervalo de classes ponto mdio frequncia

    1 11,4 25,9 18,65 02

    2 25,9 40,4 33,15 09

    3 40,4 54,9 47,65 23

    4 54,9 69,4 62,15 29

    5 69,4 83,9 76,65 20

    6 83,9 98,4 91,15 11

    7 98,4 112,9 105,65 04

    8 112,9 127,4 120,15 02

    Grfico 2 Polgono de frequncia dos tempos de percurso ao trabalho

    Polgono de frequncia

    11,4 25,9 40,4 54,9 69,4 83,9 98,4 112,925,9 40,4 54,9 69,4 83,9 98,4 112,9 127,4

    35

    30

    25

    20

    15

    10

    5

    0

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 28

    Estatstica com aplicaes e anlise exploratria

    Passo 11:

    Uma tcnica elaborada recentemente, a apresentao ramo e folhas, ofe-rece uma boa visualizao global dos dados. Primeiramente decompem-se cada nmero em seus algarismos das dezenas e das unidades, marcando juntos os valores que tm o mesmo algarismo das dezenas. Considerando os 100 tempos de percurso registrados, esses nmeros foram dados em dci-mos de minutos. Ao fazer o grfico ramo e folhas, recomenda-se ignorar os dcimos, ao invs de arredond-los para o prximo minuto.

    Aplicando no exemplo:

    Grfico 3 Ramo e folhas Tempos de percurso ao trabalho

    Ramo Folhas

    1 1 5

    2 6 8 9

    3 0 5 6 7 8

    4 0 0 0 0 0 1 1 1 2 2 2 2 3 3 4 9

    5 0 2 2 3 3 3 3 4 5 5 5 5 5 5 6 6 6

    6 0 0 0 0 0 0 1 3 3 4 6 6 7 7 7 7 8 8 8 8 9 9

    7 4 5 5 5 6 6 7 7

    8 0 1 2 2 2 2 2 3 3 3 4 5 5 6 6 9

    9 5 6 7 7 7

    10 0 3 8

    11 0

    12 3 5

    Nota: 712

    4 significa 74 minutos3 significa 123 minutos

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Estatstica com aplicaes e anlise exploratria

    29

    Uma forma conveniente de indicar relaes entre os dados qualitativos (ca-tegorias) a construo de um diagrama de Pareto. Um diagrama de Pareto um grfico em barras para dados qualitativos, com as barras ordenadas de acordo com a frequncia. As escalas verticais em um diagrama de Pareto podem representar frequncias absolutas ou relativas. A barra mais alta fica esquerda, e as barras menores na extrema direita.

    Dispondo as barras por ordem de frequncia, o diagrama de Pareto focali-za a ateno sobre as categorias mais importantes.

    Construo do grfico de Pareto

    Nmero de ocupados por setor de atividades - Regio Metropoli-tana SP - Jul/2007

    setores de atividade frequncia

    Servios 4663

    Indstria 1626

    Comrcio 1384

    Outros (1) 978

    Total 861

    (1) incluem construo civil, servios domsticos etc.

    Fonte: SEP. Convnio Seade Dieese e TEM/FAT

    .

    Ampliando seus conhecimentos

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 30

    Estatstica com aplicaes e anlise exploratria

    Nmero de ocupados por setor de atividades Regio Metropo-litana SP Jul/2007

    Grfico de Pareto

    5000

    4000

    3000

    2000

    1000

    0

    Servios Indstria Comrcio Outros (1)

    (1) incluem construo civil, servios domsticos etc.

    Fonte: SEP. Convnio Seade Dieese e TEM/FAT

    .

    Anlise do grfico de Pareto

    Conforme mostra o grfico de Pareto, evidenciou-se uma concentrao de pessoas em atividades no setor de servios na regio metropolitana em So Paulo no ms de julho/2007, comparado com outros setores.

    Curiosidades

    John W. Tukey comeou como qumico e tornou-se matemtico, especia-lizando-se na estatstica, em virtude das experincias com problemas reais e experincias com dados reais no trabalho da Segunda Guerra Mundial. [...] Tukey dedicou muito do seu tempo ao estudo estatstico de problemas confusos com dados complexos: a segurana dos anestsicos utilizados por muitos mdicos e hospitais e em muitos pacientes, o monitoramento da con-cordncia com uma proibio de testes nucleares, e a qualidade do ar e a poluio ambiental. Inventou alguns instrumentos simples como o diagrama em caixa e os diagramas ramo e folhas. Mais importante, modificou a manei-ra de tratar os dados, enfatizando a necessidade de uma abordagem flex-vel, exploratria, que procure no s responder a questes especficas, mas tambm formular questes como o que os dados nos dizem?.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Estatstica com aplicaes e anlise exploratria

    31

    Atividades de aplicao1. Escolha a alternativa correta quanto s caractersticas/variveis: cor de

    olhos, nmero de filhos, peso lquido e idade podem ser classificadas respectivamente, como:

    a) variveis qualitativas, quantitativa discreta, quantitativa contnua e quantitativa contnua.

    b) variveis quantitativa discreta, quantitativa discreta, quantitativa contnua e qualitativa.

    c) variveis qualitativas, quantitativa contnua, quantitativa contnua e qualitativa.

    d) variveis qualitativas, quantitativa discreta, quantitativa contnua e quantitativa contnua.

    2. Identifique a resposta correta.

    a) Uma pesquisa efetuada com 1 015 pessoas indica que 40 delas so assinantes de um servio de computador on-line. Trata-se de uma varivel quantitativa contnua.

    b) Rendas anuais de enfermeiras tratam-se uma varivel qualitativa.

    c) As cores de uma amostra de confeitos M&M so variveis quantita-tivas.

    d) O nmero de inscries do INSS trata-se de uma varivel quantita-tiva discreta.

    3. Escolha a alternativa correta quanto ao conjunto de caractersticas: inteno de votos dos eleitores de uma cidade, opinies dos teles-pectadores sobre um filme de fico exibido num canal de televiso e atitudes de clientes de supermercados face a um novo detergente. Trata-se de:

    a) um conjunto de amostras.

    b) um conjunto de amostragem.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 32

    Estatstica com aplicaes e anlise exploratria

    c) um conjunto de populao

    d) um conjunto de amostragem e populao.

    4. Calcule os pontos mdios conforme tabela de frequncia abaixo:

    peso (kg) frequncia

    0 2,0 20

    2,0 4,0 32

    4,0 6,0 49

    6,0 8,0 31

    8,0 10,0 18

    5. Determine o nmero ideal de classes (k) para um conjunto de dados, conforme orientao de Sturges (arredondando para cima com nme-ro inteiro).

    a) 50 dados (elementos) e

    b) 150 dados (elementos).

    Gabarito1. A

    2. D

    3. C

    4.

    2

    2

    2

    2

    2Ponto mdio 5. classe = (10 + 8) = 9

    Ponto mdio 4. classe = (8 + 6) = 7

    Ponto mdio 3. classe = (6 + 4) = 5

    Ponto mdio 2. classe = (4 + 2) = 3

    Ponto mdio 1. classe = (2 + 0) = 1

    2Ponto mdio = (X maior + X menor)

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Estatstica com aplicaes e anlise exploratria

    33

    5. log 2

    k (nmero de classes) = 1 + log n

    para 50 dados: k (nmero de classes) = log 2

    1 + log 50 = 1 + 5,6438 = 6,6438 ~ 7 classes

    para 150 dados: k (nmero de classes) = log 2

    1 + log 150 = 1 + 7, 2288 = 8,2288 ~ 9 classes

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 35

    Medidas de tendncia central e posio

    DefinioAs medidas de tendncia central tm como finalidade principal a de in-

    formar sobre onde se localiza o centro da distribuio.

    um dado importante para o estabelecimento de um esquema de traba-lho, para a efetivao de uma compra, para a avaliao de um projeto ou de um produto qualquer, etc. Por exemplo, suponha-se uma varivel que seja o nmero de lmpadas vendidas por dia em uma casa comercial. Esse nmero uma varivel X que assume valores possivelmente diferentes ao longo do tempo, mas que se distribuiro em torno de um valor central, o qual fixa e caracteriza as vendas em um determinado nmero de unidades por dia. Na verdade, esse centro seria o valor que representaria o nmero de unidades vendidas, caso ele fosse uma constante ao longo do tempo, ou seja: vender seis lmpadas hoje e dez amanh seria equivalente a vender oito em cada um dos dois.

    Determinar o valor exato do centro de uma distribuio muitas vezes impraticvel, ou mesmo impossvel, seja pela evoluo natural da populao em funo do tempo, seja por deficincia dos aparelhos, dos mtodos, dos observadores. Por isso, em muitos casos, poder-se- contar apenas com uma estimativa do total, obtida por meio de uma amostra.

    H diferentes maneiras de definir o centro e, assim, h diferentes defi-nies de medidas de tendncia central. As medidas de tendncia central frequentemente utilizadas so: mdia aritmtica, mediana, moda e ponto mdio. Qual dessas medidas a melhor? Infelizmente, no h uma respos-ta nica, porque no h critrios objetivos para determinar a medida mais representativa para todos os conjuntos de dados. As diversas medidas de tendncia central tm diferentes vantagens e desvantagens. Uma vantagem importante da mdia aritmtica que se levam em conta todos os valores, mas uma grande desvantagem que, s vezes, pode ser seriamente afetada por alguns valores extremos.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 36

    Medidas de tendncia central e posio

    Tabela1 Comparao entre mdia, mediana e moda

    Medida Definio Existncia Vantagens Desvantagens

    Mdia X = ix

    1n =n

    Existe sempre

    Reflete cada valor.

    Possui propriedades matemticas atraentes.

    influenciada por valores extremos.

    Mediana Valor do meio Existe sempreMenos sensvel a valores extremos do que a mdia.

    Difcil de determinar para grande quantidade de dados.

    Moda Valor de maior frequncia

    Pode no existir;

    Pode haver mais de uma moda

    Valor tpico: maior quantidade de valores concentrados neste ponto.

    No se presta a anlise matemtica.

    Pode no ser moda para certos conjuntos de dados.

    Ponto Mdio

    alto + baixo

    2Existe sempre _________x_________

    Muito sensvel a valores externos

    Raramente usada.

    Comentrios geraisPara um conjunto de dados aproximadamente simtrico com uma moda,

    a mdia, a mediana, a moda e o ponto mdio tendem a coincidir.

    Para um conjunto de dados obviamente assimtricos, convm levar

    em conta a mdia e a mediana.

    A mdia relativamente confivel: ou seja, quando as amostras so

    extradas da mesma populao, as mdias tendem a ser mais constan-

    tes do que outras medidas (constantes no sentido de que as mdias

    amostrais extradas da mesma populao no variam tanto quanto as

    outras medidas).

    Conceitos e regras

    Mdia aritmtica da amostra (X):

    A mdia fornece uma medida central de um conjunto de valores. Se os

    dados so de uma amostra a mdia denotada por x (L-se: x barra).

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de tendncia central e posio

    37

    Talvez a medida de tendncia central mais importante seja a mdia de uma varivel. A mdia fornece uma medida da posio central. Se os dados so de uma amostra, a mdia denotada por x; se os dados so de uma populao, a mdia denotada pela letra grega . Nas frmulas estatsti-cas, costume denotar o valor da primeira observao por x1, o valor da segunda observao por x2 e assim por diante. Em geral, o valor da i-sima observao denotado por xi. Para uma amostra com n observaes.

    Frmula 1 Mdia aritmtica da amostra (x)

    Xn

    i x1n

    =

    Notao:

    : denota somatrio de um conjunto de valores;

    x: a varivel usada para representar valores individuais dos dados;

    n: representa o nmero de valores em uma amostra.

    Mdia

    Figura 1 A mdia como ponto de equilbrio.

    Mdia aritmtica da populao ():

    Tambm fornece uma medida central de um conjunto de valores, mas se os dados so de uma populao, a mdia denotada pela letra grega (L-se: mi).

    Frmula 2 Mdia aritmtica da populao ()

    Ni x1

    N

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 38

    Medidas de tendncia central e posio

    Notao:

    : denota somatrio de um conjunto de valores;

    x: a varivel usada para representar valores individuais dos dados;

    N: representa o nmero de valores de uma populao.

    Mdia ponderada (X):

    s vezes associam-se os nmeros a certos fatores de ponderao ou pesos, que dependem do significado ou importncia atribuda aos nmeros. Nesse caso tem a denominao de mdia ponderada.

    Frmula 3 Mdia ponderada (x)

    X i w1n xi i. i 1

    n wi

    Notao:

    : denota somatrio de um conjunto de valores;

    Xi: a varivel usada para representar valores individuais dos dados;

    Wi: o peso da observao de ordem i.

    Mediana (X):

    Em um conjunto de valores o valor do meio desse conjunto, quando os valores esto dispostos em ordem crescente ou decrescente (l-se x til).

    A mediana outra medida de centralizao de uma varivel. A media-na o valor que fica no meio da sequncia quando os dados so arranja-dos na ordem ascendente (classificao do menor para o maior). Com um nmero mpar de observaes, a mediana o valor do meio. Um nmero par de observaes no tem um valor nico no meio. Neste caso, segue-se a conveno de definir a mediana como sendo a mdia dos valores das duas observaes do meio.

    Processo para determinar a mediana:

    ordenar os valores de forma crescente ou decrescente;

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de tendncia central e posio

    39

    se o nmero de valores impar, a mediana o nmero localizado exa- tamente no meio da lista;

    se o nmero de valores par, a mediana a mdia dos dois valores do meio.

    Moda (M)

    Em um conjunto de dados o dos que ocorre com maior frequncia.

    Podem surgir situaes em que a maior frequncia ocorra em dois ou mais valores diferentes. Nesses casos existe mais de uma moda. Se os dados tm exatamente duas modas, diz-se que so bimodais. Se os dados tm mais de duas modas, diz-se que so multimodais. Nos casos multimodais, a moda quase nunca considerada, porque listar trs ou mais modas no seria par-ticularmente til para descrever a posio dos dados. A moda uma impor-tante medida de posio para os dados qualitativos, em que se observa a caracterstica que apresentou maior frequncia na anlise de um conjunto de dados.

    Quando nenhum valor repetido, o conjunto no tem moda.

    Ponto Mdio (Pm)

    o valor que est a meio caminho entre o maior e o menor valor.

    Embora o Ponto Mdio no seja muito usado, importante enfatizar que existem maneiras diferentes de definir o centro de um conjunto de dados.

    Frmula 4 Ponto mdio (Pm)

    x maior + x menor2

    Pm

    Processo para determinar o ponto mdio:

    identificar o maior valor de todos os valores;

    identificar o menor valor de todos os valores;

    somar os dois valores;

    dividir por dois.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 40

    Medidas de tendncia central e posio

    Mdia geomtrica (G)

    De um conjunto de n nmeros x1, x

    2 , x

    3 , ..., x

    n a raiz de ordem n do pro-

    duto desses nmeros:

    Frmula 5 Mdia geomtrica

    Gn

    x1

    x2

    x3 . . .

    xn

    A mdia geomtrica usada em administrao e economia para achar taxas mdias de variao, de crescimento, ou razes mdias. Dados n valores (todos positivos), a mdia geomtrica de 2, 4, 10 multiplicando-se os trs va-lores o que d 80, e tomando-se a raiz cbica do resultado, cbica porque h trs valores.

    Exemplo:

    Admita-se que, nos ltimos quatro anos, o produto interno bruto (PIB) de um determinado pas cresceu 2,5%, 1,7%, 2,2% e 3,5%. Denota-se por PIB0 o valor do PIB no ano relativo a este perodo, o seu valor do ltimo ano ser dado por:

    PIB4= (R

    1. R

    2. R

    3. R

    4) . PIB

    0

    Onde as razes de crescimento, Rn, so:

    R1 = 1 + 0,025

    R2 = 1 + 0,017

    R3 = 1 + 0,022

    R4 = 1 + 0,035

    Se o crescimento fosse constante nos quatro anos e, globalmente fosse idntico ao verificado, a razo R entre valores sucessivos do PIB deveria sa-tisfazer a seguinte condio:

    R4 = R1. R

    2. R

    3. R

    4

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de tendncia central e posio

    41

    Frmula 6 Mdia geomtrica

    R =4

    R1 R

    2 R

    3 R

    4 =4

    1,025 . 1,017 . 1,022 . 1,035 = 1,0247

    Gn

    x1

    x2

    x3 . . .

    xn

    O valor de R a mdia geomtrica das razes de crescimento R1. R

    2 . R

    3 . R

    4

    a partir de R= 1,0247 obtm-se a taxa mdia anual de crescimento do PIB, que de 2,47%.

    Assimetria

    Uma distribuio de dados assimtrica quando no simtrica, esten-dendo-se mais para um lado do que para o outro (uma distribuio de dados simtrica quando a metade esquerda do seu histograma aproximada-mente a imagem-espelho da metade direita).

    Mdia ModaMediana

    Assimtrica para a esquerda (negativamente assimtrica).

    A mdia e a mediana esto esquerda da moda.

    Moda - Mdia - Mediana

    Simtrica (assimetria zero).

    A mdia, a mediana e a moda coincidem.

    MdiaModaMediana

    Assimtrica para a direita (positivamente assimtrica).

    A mdia e a mediana esto direita da moda.

    Figura 2 Assimetria.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 42

    Medidas de tendncia central e posio

    Na prtica, muitas distribuies de dados so simtricas. As distribuies assimtricas para a direita so mais comuns do que as assimtricas para a es-querda, porque em geral mais fcil obter valores excepcionalmente gran-des do que valores excepcionalmente pequenos. Com as rendas anuais, por exemplo, impossvel termos valores abaixo do limite inferior zero, mas h algumas pessoas que ganham milhes de reais em um ano. Assim, as rendas anuais tendem a ser assimtricas para a direita.

    O problema

    Contexto A

    H uma grande variedade de bebidas alcolicas espalhadas pelo mundo, fazendo do lcool a substncia psicoativa mais popular do planeta. O Brasil detm o primeiro lugar do mundo no consumo de destilados de cachaa e o quinto maior produtor de cerveja. O lcool a droga preferida dos bra-sileiros (68,7% do total). Motoristas alcoolizados so responsveis por 65% dos acidentes fatais em So Paulo. A maioria das fatalidades relacionadas ao consumo de lcool ocorre entre 18 e 25 anos. Com esta preocupao foi coletada a idade de 15 motoristas envolvidos em acidentes fatais.

    Tabela 1 Idades de motoristas envolvidos em acidentes fatais

    Idades

    16 18 19

    17 18 20

    45 20 22

    22 15 18

    21 19 19

    Explorando o problema

    De posse de uma grande lista de nmeros, pouco proveito se pode tirar dela, a menos que possamos reduzi-la a uma ou algumas medidas numri-cas que resumem todo o conjunto. Tais medidas so de mais fcil manejo e compreenso do que os dados originais. Uma caracterstica importante dos dados o valor central ou mais tpico do conjunto. O objetivo deste proble-ma apresentar os mtodos mais teis para resumir dados.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de tendncia central e posio

    43

    Equacionando o problema

    As medidas de posio referem-se a valores de uma varivel que so t-picos ou representativos de um conjunto de dados, isto , eles so um valor em torno do qual uma grande proporo de outros valores est centralizada. Existem alguns mtodos de se obter a medida de posio. Utilizando os valo-res do problema (Contexto A) sero explicadas as diferentes abordagens.

    Calculando a mdia aritmtica da amostra (X)

    Para calcular-se a mdia aritmtica da amostra das idades dos motoristas, conforme o contexto A, tem-se a seguinte condio:

    X i x1n

    n=

    Passo 1:

    Somam-se todas as idades.

    16 + 17 + 45 + 22 + 21 + 18 + 18 + 20 + 15 + 19 + 19 + 20 + 22 +18 + 19 = 309

    Passo 2:

    O total das idades divide-se pelo total de motoristas (15).

    X 30915

    X = 38,625 = 39

    Passo 3:

    Concluir e interpretar o resultado (mdia).

    A mdia aritmtica pode ser calculada para qualquer conjunto de dados e, assim, sempre existe. Leva-se em conta todos os elementos de um conjun-to de dados, mas pode ser influenciada por um valor extremo.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 44

    Medidas de tendncia central e posio

    Calculando a mdia ponderada

    O clculo da mdia ponderada deve levar em conta a quantidade em que cada idade dos motoristas aparece:

    X i w1n xi i. i 1

    n wi

    Passo 1:

    Multiplica-se a idade pela sua respectiva frequncia.

    15 x 1 vez = 15

    16 x 1 vez = 16

    17 x 1 vez = 17

    18 x 3 vezes = 54

    19 x 3 vezes = 57

    20 x 2 vezes = 40

    21 x 1 vez = 21

    22 x 2 vezes = 44

    45 x 1 vez = 45

    Passo 2:

    Somam-se os resultados.

    15 + 16 + 17 + 54 + 57 + 40 + 21 + 44 + 45 = 309

    Passo 3:

    O total divide-se pelo total de idades (15).

    X 30915

    X = 38,625 = 39

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de tendncia central e posio

    45

    Passo 4:

    Concluir e interpretar o resultado (mdia ponderada).

    Calculando a mediana (X)

    A mediana o valor que divide um conjunto de dados em duas partes iguais. Ento, para calcular-se a Mediana das idades dos motoristas, tem-se a seguinte condio:

    Passo 1:

    Ordenar os valores de forma crescente ou decrescente.

    15 16 17 18 18 18 19 19 19 20 20 21 22 22 45

    Passo 2:

    O total de valores impar (15 motoristas). Pega-se o elemento que separa o grupo ao meio (oitavo elemento).

    15 16 17 18 18 18 19 19 19 20 20 21 22 22 45

    X = 19

    Passo 3:

    Concluir e interpretar o resultado (Mediana).

    Mediana (X) o valor central, quando os valores encontram-se ordena-dos. O valor do elemento do meio se n mpar, ou a mdia dos dois valores do meio se n par.

    Calculando a moda (M)

    A moda no genericamente considerada a medida mais eficiente de tendncia central, porque existem muitas situaes em que mltiplos valo-res ou nenhum valor distinto ocorre.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 46

    Medidas de tendncia central e posio

    Passo 1:

    Ordenar os valores de forma crescente ou decrescente.

    15 16 17 18 18 18 19 19 19 20 20 21 22 22 45

    Passo 2:

    Selecionar o valor que ocorre com maior frequncia.

    15 16 17 18 18 18 19 19 19 20 20 21 22 22 45

    M = 18 e 19

    Passo 3:

    Concluir e interpretar os resultados (Moda).

    O conjunto de valores bimodal, possui dois valores que ocorrem com a mesma frequncia mxima.

    Calculando o ponto mdio (Pm)

    Para calcular-se o Ponto Mdio das idades dos motoristas, conforme o contexto A, tem-se a seguinte condio:

    x maior + x menor2

    Pm

    Passo 1:

    Identificar a maior idade e a menor idade.

    Idades

    16 18 19

    17 18 20

    45 20 22

    22 15 18

    21 19 19

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de tendncia central e posio

    47

    Passo 2:

    Somam-se os dois valores.

    45 + 15 = 60

    Passo 3:

    Dividir a soma por dois.

    602

    Pm 30

    Passo 4:

    Concluir e interpretar o resultado (Ponto Mdio).

    Extremamente simples, o Ponto Mdio (Pm

    ), porm, dever ser usado com cuidado como medida de tendncia central. uma medida de localizao de centro quando as distribuies forem simtricas.

    Quartis, Decis e PercentisAssim como a mediana divide os dados em duas partes iguais, os trs quar-

    tis, denotados por Q1, Q

    2 e Q

    3, dividem as observa es ordenadas (dispostas

    em ordem crescente) em quatro par tes iguais. Grosso modo, Q1 separa os

    25% inferiores dos 75% superiores dos valores ordenados; Q2 a mediana e

    Q2 separa os 75% inferiores dos 25% superiores dos dados. Mais precisamen-

    te, ao menos 25% dos dados sero no mximo iguais a Q1 e ao menos 75%

    dos dados sero no mnimo iguais a Q1. Ao menos 75% dos dados sero no

    mximo iguais a Q3, enquanto ao me nos 25% sero, no mnimo, iguais a Q

    3.

    Analogamente, h nove decis, denotados por D1, D

    2, D

    3,..., D

    9, que dividem os

    dados em dez grupos com cerca de 10% deles em cada grupo. H, finalmente, 99 percentis, que dividem os dados em 100 grupos com cerca de 1% em cada grupo. (Os quartis, decis e percentis so exemplos de fractis, que dividem os dados em partes aproximadamente iguais). Um estudante que se submeteu ao vestibular para ingresso em uma faculdade informado de que est no 92. percentil. Isso no significa, entretanto, que ele tenha obtido 92% no exame; indica, apenas, que qualquer que tenha sido a nota obtida, ela foi superior a 92% (e inferior a 8%) das notas de toda a turma. O 92. percentil , pois, uma excelente classificao em relao aos outros que fizeram o exame.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 48

    Medidas de tendncia central e posio

    25% 25% 25% 25%

    Q1

    primeiro quartil

    25% percentil

    Q2

    segundo quartil

    50% percentil

    Q3

    terceiro quartil

    75% percentil

    Figura 2 Posio dos quartis.

    Para calcular os quartis:

    dispomos as observaes em ordem crescente e localizamos a Mediana (X) na lista ordenada de observaes;

    o primeiro quartil Q 1 a mediana das observaes que esto esquer-

    da da mediana global na lista ordenada de observaes;

    o terceiro quartil Q 3 a mediana das observaes que esto direita

    da mediana global na lista ordenada de observaes.

    Frmula 6 Percentil

    Clculo do ndice (i) = p

    100. n

    Onde p o percentil de interesse e o n o nmero de observaes.

    Se no for um nmero inteiro, arredonda-se para cima. O prximo inteiro maior que i denota a posio do p-simo percentil.

    Se i um inteiro, o p-simo percentil a mdia dos valores de dados nas posies i e i+1.

    Exemplo de aplicao

    Frequentemente desejvel dividir os dados em quatro partes, cada parte contendo aproximadamente um quarto, ou 25% das observaes.

    Os dados representam o salrio inicial e esto arranjados em ordem as-cendente. Q

    2, o segundo quartil (mediana), j foi identificado como 2405.

    2210 2255 2350 2380 2380 2390 2420 2440 2450 2550 2630 2825

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de tendncia central e posio

    49

    Clculo do quartil

    Os clculos dos quartis Q1 e Q

    3 exigem o uso da regra para encontrar o 25. e o

    75. percentis. Estes clculos so:

    Para Q1

    Frmula 7 Percentil

    Clculo do ndice (i) = p

    100. n

    i = p

    100n =

    25100

    12 = 3

    Como i um inteiro, indica que o primeiro quartil, ou 25% percentil, a mdia do terceiro e do quarto valor dos dados; assim, Q

    1= (2350+2380)/2 =

    2365.

    Para Q3

    Frmula 8 Percentil

    Clculo do ndice (i) = p

    100. n

    i = p

    100n =

    75100

    12 = 9

    Como i um inteiro, indica que o terceiro quartil, ou 75% percentil, a mdia do nono e do dcimo valores de dados: assim, Q

    3= (2450+2550)/2 = 2500. Os

    quartis dividem os dados dos salrios iniciais em quatro partes, com cada parte contendo 25% das observaes.

    2210 2255 2350 2380 2380 2390 2420 2440 2450 2550 2630 2825

    q1 = 2365 q2 = 2405 q3 = 2500

    Assim, calculam-se os quartis do mesmo modo que os percentis. No entanto, outras convenes podem ser usadas para calcular os quartis. Os valores reais atri-budos aos quartis podem variar levemente, dependendo da conveno usada. Contudo, o objetivo de todos os procedimentos para o clculo dos quartis divi-dir os dados em quatro partes iguais.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 50

    Medidas de tendncia central e posio

    Ampliando seus conhecimentos

    Fundada em 1997, a Small Fry Design uma empresa de brinquedos e de acessrios que pro jeta e importa produtos para crianas. A linha de produtos da empresa inclui ursinhos, mbi les, brinquedos musicais, chocalhos e cober-tores de segurana, caracterizando-se por projetos de brinquedos delicados e de alta qualidade, com nfase na cor, textura e som. Os produtos so projeta-dos nos Estados Unidos e fabricados na China.

    A Small Fry Design utiliza representantes independentes para vender os pro-dutos para as crianas, fornecendo para varejistas, lojas de roupas e acessrios infantis, lojas de presen tes, lojas de departamento de grande porte e principais empresas de catlogo. Atualmente, os produtos da Small Fry Design so distribu-dos em mais de mil canais de varejo por todo o ter ritrio dos Estados Unidos.

    O gerenciamento do fluxo de caixa uma das mais crticas atividades na operao do dia a dia dessa jovem empresa. Assegurar a suficiente entrada de caixa para satisfazer tanto as obrigaes de dbito correntes como as vindou-ras pode significar a diferena entre o sucesso e o fracasso no negcio. Um fator crtico no gerenciamento do fluxo de caixa a anlise e o controle das contas a receber. Avaliando-se o perodo mdio e o valor em dlares das fa-turas pendentes, os gerentes podem prever a disponibilidade de caixa e mo-nitorar as mudanas na posio das contas a receber. A empresa estabeleceu os seguintes objetivos: o tempo mdio de atraso no pagamento das faturas no deve exceder a 45 dias e o valor das faturas com mais de 60 dias no deve exceder a 5% do de todas as contas a receber.

    Em um recente sumrio da posio das contas a rece ber, as seguintes esta-tsticas descritivas foram fornecidas pa ra o perodo das faturas pendentes:

    Mdia: 40 dias Mediana: 35 dias Moda: 31 dias

    A interpretao dessas estatsticas mostra que o perod o mdio de uma fatura de 40 dias. A mediana mostra que metade das faturas tem ficado pen-dente 35 dias ou mais. A moda de 31 dias o perodo mais frequente de fatura, indicando que a extenso de tempo mais comum que uma fatura tem ficado pendente 31 dias. O sumrio estatstico tambm mostrou que somente 3% do valor monetrio de todas as contas a receber ficaram acima de 60 dias. Baseada na informao estatstica, a administrao ficou satisfeita de que as contas a re ceber e a entrada de caixa estejam sob controle.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de tendncia central e posio

    51

    Atividades de aplicao1. Valores de vendas dirias de pizzas do tipo calabresa durante um per-

    odo de nove dias:

    15 7 7 11 9 13 14 12 2

    Relacione as colunas de acordo com as respostas.

    a) Mdia ( ) 7

    b) Mediana ( ) 11

    c) Moda ( ) 8,5

    d) Ponto Mdio ( ) 10

    2. Escolha a alternativa correta quanto aos resultados obtidos do conjun-to a seguir:

    22 19 22 19 18 20 21 22

    a) mdia aritmtica igual a 17,6

    mediana igual a 20

    moda igual a 22

    ponto mdio igual a 3

    b) mdia aritmtica igual a 17,6

    mediana igual a 20,5

    moda igual a 19

    ponto mdio igual a 3

    c) mdia aritmtica igual a 20,4

    mediana igual a 20,5

    moda igual a 22

    ponto mdio igual a 20,0

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 52

    Medidas de tendncia central e posio

    d) mdia aritmtica igual a 16,6

    mediana igual a 20

    moda igual a 19 e 22

    ponto mdio igual a 3

    3. Para os 20 valores de cargas axiais de latas de alumnio, relacionados abaixo, determine (a) a mdia aritmtica, (b) a mediana, (c) a moda e (d) o ponto mdio.

    225 200 201 223 209 230 209 217 234 209

    217 218 220 217 200 219 201 225 200 236

    4. Escolha a alternativa correta quanto aos resultados obtidos do conjun-to a seguir:

    35 25 28 32 31 31 29 30

    a) A distribuio dos dados assimtrica para a esquerda.

    b) A distribuio dos dados simtrica.

    c) A distribuio dos dados assimtrica para a direita.

    5. Para as 30 idades de motoristas envolvidos em acidentes fatais, orde-nadas da mais nova at a mais velha. Determine o percentil correspon-dente a 21.

    17 17 17 18 18 18 18 19 19 19

    19 19 21 22 22 22 23 23 24 25

    27 27 28 29 31 31 32 35 39 40

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de tendncia central e posio

    53

    Gabarito1.

    a) Mdia (C) 7

    b) Mediana (B) 11

    c) Moda (D) 8,5

    d) Ponto Mdio (A) 10

    2. C

    3.

    a) mdia (X) xn 20

    4310 215,5

    b) mediana (X)

    200 200 200 201 201 209 209 209 217 217

    217 218 219 220 223 225 225 230 234 236

    2217 + 217 217

    c) moda (M) = 200, 209 e 217 (multimodal)

    d) Ponto mdio (Pm)

    225 200 201 223 209 230 209 217 234 209

    217 218 220 217 200 219 201 225 200 236

    Pm2

    X maior + X menor 2182

    236 + 200

    4. A

    5. Percentil de 21 = 3012 100 = 40

    A idade de 21 o 40. percentil

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 55

    Medidas de variabilidade

    DefinioUm conjunto de valores pode ser convenientemente resumido, por meio

    de procedimentos estatsticos, em poucos valores representativos mdia aritmtica, mediana e moda. Tais valores podem servir de comparao para dar a posio de qualquer elemento do conjunto. Porm, no o bastante dar uma das medidas de posio para caracterizar perfeitamente um con-junto de valores, pois, mesmo sabendo, por exemplo, que a temperatura mdia de duas cidades a mesma, e igual a 28C, ainda assim, se levado a pensar a respeito do clima dessas cidades. Em uma delas a temperatura poder variar entre limites de muito calor e de muito frio e possuir, ainda, uma temperatura mdia de 28C. A outra poder ter uma variao pequena de temperatura e possuir, portanto, no que se refere temperatura, um clima mais favorvel.

    Por essa razo a mdia ainda que considerada como um nmero que tem a faculdade de representar uma srie de valores no pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compem o conjunto.

    Considerando os seguintes valores das variveis x, y e z:

    X: 60, 60, 60, 60, 60

    Y: 58, 59, 60, 61, 62

    Z: 5,5, 30, 110, 150

    Calculando a mdia aritmtica de cada um desses conjuntos, obtm-se:

    Frmula 1 Mdia aritmtica da amostra

    i 1n xi

    nMdia Aritmtica da amostra (x)

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 56

    Medidas de variabilidade

    i 1n xi

    nvarivel X (x) 300

    560

    i 1n xi

    nvarivel Y (y) 300

    560

    i 1n xi

    nvarivel Z (z) 300

    560

    Observa-se, ento, que os trs conjuntos apresentam a mesma mdia aritmtica: 60.

    , porm, fcil de notar que o conjunto de X mais homogneo que os conjuntos Y e Z, j que todos os valores so iguais mdia.

    O conjunto Y, por sua vez, mais homogneo que o conjunto Z, pois h menor diversificao entre cada um de seus valores e a mdia representati-va. Chamando de disperso ou variao a maior ou menor diversificao dos valores de uma varivel, em torno de um valor de tendncia central tomado como ponto de comparao, pode-se dizer, ento, que o conjunto X apre-senta disperso ou variao nula e que o conjunto Y apresenta uma disper-so ou variao menor que o conjunto Z. Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior ou menor disperso ou variao entre esses valores e a sua medida de posio, a Estatstica recorre a medidas de disperso ou de variao.

    Conceitos e regras

    Disperso ou variao

    O grau aos quais os dados numricos tendem a dispersar-se em torno de um valor mdio chama-se variao ou disperso dos dados.

    Amplitude (R)

    De um conjunto de dados a diferena entre o maior e o menor valor. claro que o valor de R est relacionado com a disperso dos dados. Quanto maior a Amplitude maior a disperso dos dados. Entretanto, por depender de apenas dois valores do conjunto de dados, a amplitude contm relativa-mente pouca informao quanto disperso.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de variabilidade

    57

    Valor maior Valor menorR

    Amplitude (R)

    R = Xmximo

    Xmnimo

    Figura 1 Representao da amplitude em um conjunto de dados.

    Processo para determinar a amplitude:

    ordenar os valores de forma crescente ou decrescente;

    identificar o maior valor de todos os dados da amostra;

    identificar o menor valor de todos os dados da amostra;

    tomar a diferena entre os dois valores.

    Varincia amostral (s2)

    De um conjunto de dados , por definio, a mdia dos quadrados das diferenas dos valores em relao sua mdia.

    Quando se tratar de uma amostra, a simbologia s2 e quando se tratar de populao 2, que a letra minscula sigma. No confundir o (sigma) minsculo com o (sigma) maisculo, este usado para representar um somatrio.

    Propriedades da varincia

    A Varincia de uma constante zero.

    Multiplicando-se uma varivel aleatria por uma constante, sua Varincia fica multiplicada pelo quadrado da constante.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 58

    Medidas de variabilidade

    Somando-se ou subtraindo-se uma constante uma varivel aleatria, sua Varincia no se altera.

    A Varincia da soma ou diferena de duas variveis aleatrias indepen- dentes a soma das respectivas varincias.

    Frmula 2 Varincia da amostra ( x2s )

    nx2s i 1

    n xi(( ( x)2

    1

    Processo para determinar a varincia da amostra:

    Calcular a mdia ( x);

    Subtrair a mdia a cada valor do conjunto (x i x);

    Elevar ao quadrado cada desvio (x i x)2;

    Somar os quadrados dos desvios i 1n (xi x)2; e

    Dividir a soma por (n 1) quando forem dados amostrais, ou simples- mente por (N) para somar o conjunto ou todos os valores da popula-o, conhecido como Varincia da populao e mdia da populao ().

    Frmula 3 Varincia da populao (2)

    (N

    2x )

    XiN

    i 1( )2

    Varincia da populao , onde

    ( )l-se sigma e () l-se Mi

    Desvio-padro amostral (s):

    De um conjunto de valores amostrais uma medida da variao dos va-lores em relao mdia. Define-se desvio-padro como a raiz quadrada po-sitiva da varincia. Seu clculo feito por meio da varincia. Ao contrrio da amplitude, o desvio-padro leva em conta todos os valores, mas essa vanta-gem torna o clculo mais difcil.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de variabilidade

    59

    Frmula 4 Desvio-padro da amostra (sx)

    (sx)

    2

    ni 1

    n xi( x)2

    1

    Frmula 5 Desvio-padro da populao (x)

    i 1N xi( )2

    N

    x )2

    (

    Regras para o desvio-padro

    o desvio-padro (s): mede a disperso em torno da mdia e s deve ser usado quando a mdia tomada como medida de centro.

    o desvio-padro (s) igual a zero: somente quando no h disperso. E isto ocorre quando todas as observaes tm o mesmo valor. Em caso contrrio, s > 0. Na medida em que as observaes se tornam mais dispersas em torno da mdia, s aumenta.

    Assim como a mdia ( x), o Desvio-padro (s) fortemente influenciado por observaes extremas. Uns poucos valores discrepantes podem acarretar um grande valor de s.

    Arredondamento de dados

    O resultado do arredondamento de um nmero como 72,8 para o intei-ro mais prximo 73, posto que 72,8 mais prximos de 73 do que de 72. Semelhantemente em 72,8146 o arredondamento para o centsimo mais prximo, ou com duas decimais, 72,81, porque 72,8146 mais prximo de 72,81 do que 72,82.

    Ao arredondar 72,465 para o centsimo mais prximo, entretanto, de-para-se com um dilema, pois 72,465 dista igualmente de 72,46 e de 72,47. Usa-se, na prtica, em tais casos, aproximar para o nmero par que pre-cede o cinco. Assim, 72,465 arredondado para 72,46, onde 183,575 ar-redondado para 183,58. Essa prtica especialmente valiosa para reduzir ao mnimo os erros acumulados por arredondamento, quando se tratar de grande nmero de operaes.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 60

    Medidas de variabilidade

    O problema

    Contexto A Muitos bancos comerciais costumavam exigir que os clientes formas-

    sem filas separadas para os diversos guichs, mas recentemente passaram a adotar fila nica. Qual o motivo dessa modificao? O tempo mdio de espera no se modifica, porque a fila de espera no afeta a eficincia dos caixas. A adoo de fila nica se deveu ao fato de os clientes preferirem tempos de espera mais consistentes com menor variao. Assim que mi-lhares de bancos efetuaram uma modificao que resultou em uma variao menor (e clientes mais satisfeitos), mesmo que a mdia no tenha sido afe-tada. Considera-se agora uma amostra de dados bancrios, onde os valores relacionados so tempos de espera (em minutos) de clientes.

    Tabela 1 Tempos de espera em minutos em filas de banco

    Banco Jefferson Valley (fila nica) 7,1 7,7 6,7 6,8 6,5 7,3 7,4 7,7 7,7 6,6

    Banco da Providncia (fila mltipla) 7,7 5,4 9,3 6,7 6,2 7,7 4,2 8,5 5,8 10,0

    Os clientes do Banco Jefferson Valley entram em uma fila nica que atendida por trs caixas. Os clientes do Banco da Providncia podem entrar em qualquer uma das trs filas que conduzem a trs guichs.

    Explorando o problema

    So necessrios dois tipos de medidas para descrever adequadamente um conjunto de dados. Alm da informao quanto ao meio de um conjun-to de nmeros, conveniente dispor tambm de um mtodo que permita exprimir a disperso, pois a sumarizao de um conjunto de dados, por meio de uma nica medida de representao central, esconde toda a informao sobre a variao do conjunto de valores. Ento se nota a convenincia de criar-se uma medida que sumariza a variao de uma srie de valores e que permite comparar conjuntos diferentes de valores. A Estatstica recorre s medidas de disperso ou variao para atender esse objetivo.

    Alguns conceitos-chave so fundamentais para dominar a anlise de um conjunto de dados:

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de variabilidade

    61

    a variao se refere a quanto os valores podem diferir entre si e pode ser medida por nmeros especficos;

    os nmeros relativamente prximos uns dos outros tm baixas medi- das de variao, enquanto os valores mais dispersos tm maior medi-da de variao.

    Equacionando o problema

    As medidas de disperso indicam se os valores esto relativamente pr-ximos uns dos outros, ou separados. Esta situao ilustrada esquematica-mente na figura abaixo. As observaes (a) apresentam valores relativamente prximos dos outros, em comparao com os da (b). As formas de encontrar essas medidas de disperso podem ser tratadas atravs da amplitude, vari-ncia amostral e desvio-padro amostral.

    (a)

    (b)

    (a) pequena disperso e (b) grande disperso

    Figura 2 Representao da disperso de dados.

    Calculando a amplitude (R)

    Para medir-se a amplitude dos tempos de espera em filas de bancos, con-forme o contexto A, tem-se a seguinte condio:

    Frmula 6 Amplitude (R)

    Amplitude (R) = Xmximo

    Xmnimo

    Passo 1:

    Ordenar os valores de forma crescente ou decrescente.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 62

    Medidas de variabilidade

    Tabela 2 Tempos de espera em minutos em filas de banco ordenados

    Banco Jefferson Valley (fila nica) 6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7

    Banco da Providncia (fila mltipla) 4,2 5,4 5,8 6,2 6,7 7,7 7,7 8,5 9,3 10,0

    Passo 2:

    Identificar o maior valor (Xmximo

    ) e o menor valor (Xmnimo

    ) para cada banco.

    Tabela 3 Tempos de espera em minutos em filas de banco identificao dos valores extremos

    Banco Jefferson Valley (fila nica) X mximo

    = 7,7 Xmnimo

    = 6,5

    Banco da Providncia (fila mltipla) X mximo

    = 10,0 Xmnimo

    = 4,2

    Passo 3:

    Aplicar a frmula para cada banco.

    Amplitude (R) = Xmximo

    Xmnimo

    Tabela 4 Tempos de espera em minutos em filas de banco valor da amplitude

    Banco Jefferson Valley (fila nica) R = 1,2

    Banco da Providncia (fila mltipla) R = 5,8

    Passo 4:

    Concluir e interpretar os resultados (Amplitude).

    A Amplitude (R) fornece uma ideia do afastamento entre o maior valor e o menor valor, mas no , na realidade, uma boa medida de disperso de toda a distribuio. A amplitude no fornece qualquer informao de toda a dis-tribuio, ou seja, no d qualquer informao sobre qualquer elemento na relao, exceto seus valores extremos. No contexto apresentado dos bancos,

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de variabilidade

    63

    nota-se uma distncia maior dos valores (mximo e mnimo) do Banco da Providncia (fila mltipla) necessita-se ainda de uma medida de disperso que leve em conta todos os nmeros da relao.

    Calculando a varincia amostral s 2( )xA varincia da amostra s

    2x( ) uma medida de disperso extremamente

    importante na teoria estatstica. Do ponto de vista prtico, ela tem o incon-veniente de se expressar numa unidade quadrtica em relao da varivel em questo.

    Frmula 5 Varincia da amostra ( )sx2

    Varincia da amostran

    i 1n xi( x)2

    1s 2x( )

    Passo 1:

    Calcular a mdia aritmtica para cada banco.

    Frmula 6 Mdia aritmtica da amostra (x)

    ni 1

    n xiMdia Aritmtica da amostra (x)

    Tabela 5 Mdia dos tempos de espera em minutos em filas de banco

    Banco Jefferson Valley (fila nica) 10

    6,5 + 6,6 + 6,7 + 6,8 + 7,1 + 7,3 + 7,4 + 7,7 + 7,7 + 7,7xBJV

    7,15

    Banco da Providncia (fila mltipla) 10

    4,2 + 5,4 + 5,8 + 6,2 + 6,7 + 7,7 + 7,7 + 8,5 + 9,3 + 10,0xBPro

    7,15

    Passo 2:

    Subtrair a mdia de cada valor do conjunto (amostra).

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 64

    Medidas de variabilidade

    Tabela 6 Tempos de espera em minutos no Banco Jefferson Valley

    xi x (xi x)6,5 7,15 -0,656,6 7,15 -0,55

    6,7 7,15 -0,45

    6,8 7,15 -0,35

    7,1 7,15 -0,05

    7,3 7,15 0,15

    7,4 7,15 0,25

    7,7 7,15 0,55

    7,7 7,15 0,55

    7,7 7,15 0,55

    Tabela 7 Tempos de espera em minutos no Banco Providncia

    xi x (xi x)4,2 7,15 -2,95

    5,4 7,15 -1,75

    5,8 7,15 -1,35

    6,2 7,15 -0,95

    6,7 7,15 -0,45

    7,7 7,15 0,55

    7,7 7,15 0,55

    8,5 7,15 1,35

    9,3 7,15 2,15

    10,0 7,15 2,85

    Passo 3:

    Elevar ao quadrado cada desvio.

    Tabela 8 Tempos de espera em minutos no Banco Jefferson Valley para clculo da Varincia da Amostra ( )sx

    2

    xi x (xi x) (xi x)2

    6,5 7,15 -0,65 0,4225

    6,6 7,15 -0,55 0,3025

    6,7 7,15 -0,45 0,2025

    6,8 7,15 -0,35 0,1225

    7,1 7,15 -0,05 0,0025

    7,3 7,15 0,15 0,0225

    7,4 7,15 0,25 0,0625

    7,7 7,15 0,55 0,3025

    7,7 7,15 0,55 0,3025

    7,7 7,15 0,55 0,3025

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de variabilidade

    65

    Tabela 9 Tempos de espera em minutos no Banco Providncia para clculo da Varincia da Amostra ( )sx

    2

    xi x (xi x) (xi x)2

    4,2 7,15 -2,95 8,70255,4 7,15 -1,75 3,06255,8 7,15 -1,35 1,82256,2 7,15 -0,95 0,90256,7 7,15 -0,45 0,20257,7 7,15 0,55 0,30257,7 7,15 0,55 0,30258,5 7,15 1,35 1,82259,3 7,15 2,15 4,6225

    10,0 7,15 2,85 8,1225

    Passo 4:

    Somar os quadrados dos desvios.

    Tabela 10 Somatria dos tempos de espera em minutos no Banco Jefferson Valley

    xi x (xi x) (xi x)2

    6,5 7,15 -0,65 0,4225

    6,6 7,15 -0,55 0,3025

    6,7 7,15 -0,45 0,2025

    6,8 7,15 -0,35 0,1225

    7,1 7,15 -0,05 0,0025

    7,3 7,15 0,15 0,0225

    7,4 7,15 0,25 0,0625

    7,7 7,15 0,55 0,3025

    7,7 7,15 0,55 0,3025

    7,7 7,15 0,55 0,3025

    (somatria) = 2,0450

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 66

    Medidas de variabilidade

    Tabela 11 Somatria dos tempos de espera em minutos no Banco Providncia

    xi x (xi x) (xi x)2

    4,2 7,15 -2,95 8,7025

    5,4 7,15 -1,75 3,0625

    5,8 7,15 -1,35 1,8225

    6,2 7,15 -0,95 0,9025

    6,7 7,15 -0,45 0,2025

    7,7 7,15 0,55 0,3025

    7,7 7,15 0,55 0,3025

    8,5 7,15 1,35 1,8225

    9,3 7,15 2,15 4,6225

    10,0 7,15 2,85 8,1225

    (somatria) = 29,8650

    Passo 5:

    Dividir a soma por (n - 1) se tratar de dados amostrais ou simplesmente por N se os dados representam todos os valores de uma populao. No caso dos bancos trata-se de dados amostrais dividindo-se por (n - 1), o valor de n=10 elementos/valores. Encontrar a varincia da amostra (s2).

    Varincia da amostra ( )sx2

    Varincia da amostra s2x( ) i 1

    n xi( x)2

    n 1

    Tabela 12 Valor da varincia da amostra para cada banco ( )sx2

    Banco Jefferson Valley (fila nica)10 12,0450s

    BJV

    2 0,227222

    Banco da Providncia (fila mltipla)10 1

    29,8650sBPRO

    2 3,318333

    Passo 6:

    Concluir e interpretar os resultados (varincia amostral).

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de variabilidade

    67

    A varincia de uma amostra a mdia dos quadrados dos desvios dos valores a contar da mdia. No contexto dos bancos percebe-se uma maior varincia quanto ao tempo de espera na fila do Banco Providncia. Porm, a varincia representa um valor (resultado) elevado ao quadrado, sendo difcil interpretar o valor numrico. Esse inconveniente sanado com a definio do desvio-padro amostral (s).

    Calculando o desvio-padro da amostra (sx)

    O Desvio-Padro da amostra simplesmente a raiz quadrada positiva da varincia da amostra. Assim, para determinar o desvio-padro, calcula-se a varincia e toma-se a raiz quadrada positiva do resultado. O desvio-padro cresce quando a disperso dos dados aumenta.

    Frmula 7 Desvio-padro da amostra (sx)

    Desvio-padro da amostra (sx)

    ni 1

    n xi( x)2

    12

    Passo 1:

    Calcular a raiz quadrada positiva da varincia da amostra, isto , cal-cular o desvio-padro da amostra (s). Tomar uma casa a mais dos dados originais.

    Tabela 13 Valor do desvio-padro da amostra para cada banco (sx)

    Banco Jefferson Valley (fila nica) 10 1

    2,0450sBJV

    2 0,227222 s 0,227222 0,482

    Banco da Providncia (fila mltipla) 10 1

    29,8650sBPRO

    2 3,318333 s 3,318333 1,822

    Passo 6:

    Concluir e interpretar os resultados (varincia amostral).

    O desvio-padro da amostra (s) uma das medidas mais comumen-te utilizadas para distribuies e desempenha papel relevante em toda a

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 68

    Medidas de variabilidade

    Uma desvantagem do desvio-padro como medida de variao que ele depende das unidades de medida. Por exemplo, os pesos de determinado objeto podem ter um desvio-padro de 0,1 miligramas, o valor no informa ou traduz se representa uma grande variao ou pequena variao, somente se existe uma comparao entre duas amostras ou mais. O que interessa nessa situao uma medida de variao relativa, como o coeficiente de variao.

    Coeficiente de variao % (CV%)

    definido como o quociente entre o desvio-padro e a mdia. frequen-temente expresso em porcentagem. Sua vantagem a de caracterizar a dis-perso dos dados em termos relativos a seu valor mdio. Assim, uma peque-na disperso absoluta pode ser, na verdade, considervel quando comparada com a ordem de grandeza dos valores da varivel e vice-versa. Alm disso, por ser adimensional, o coeficiente de variao fornece uma maneira de se com-pararem as disperses de variveis cujas unidades so irredutveis.

    Frmula 9 Coeficiente de variao % (CV%)

    CV% sxx

    100.

    No exemplo dos bancos tem-se a anlise da variao de cada um confirma-da pelo coeficiente de variao.

    Tabela 14 Valor do coeficiente de variao para cada banco

    Banco Jefferson Valley (fila nica) CV%0,48 100.7,15

    6,71%

    estatstica. Cabe observar que a unidade do desvio-padro a mesma uni-dade da mdia aritmtica, permitindo confirmar que entre os bancos o que apresenta uma variao (disperso) maior quanto ao tempo de espera nas filas o banco Providncia, com um desvio-padro de 1,821629, reforando a concluso de que o sistema de fila nica utilizado na amostra do Banco Jefferson Valley tem variao muito menor.

    Ampliando seus conhecimentos

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de variabilidade

    69

    Banco da Providncia (fila mltipla) .CV%1,82 1007,15

    25,87%

    Regra emprica para os dados

    Uma regra que auxilia a interpretao do valor de um desvio-padro a regra emprica, aplicvel somente a conjuntos de dados com distribuio aproximadamente em forma de sino.

    A regra 68-95-99 para os dados com distribuio em forma de sino.

    Cerca de 68% dos valores esto a menos de um desvio-padro a contar da mdia.

    Cerca de 95% dos valores esto a menos de dois desvios-padro a contar da mdia.

    Cerca de 99,7% dos valores esto a menos de trs desvios-padro a contar da mdia.

    Grfico 1 A regra emprica para dados com distribuio em forma de sino

    -4 -3 -2 -1 0 1 2 3 4

    99,73%

    0.4

    0.3

    0.2

    0.1

    0.0

    68%

    95%

    Output

    Curva normal e reas de probabilidade

    O entendimento do grfico acima evidencia valores presumivelmen-te em percentagens (output = sada so os registros dos dados de uma determinada varivel), sendo razovel entender que so aproximada-mente 68%, aproximadamente 95%, ou aproximadamente 99,73% dos valores em torno da mdia (no grfico a mdia representada pelo ponto zero).

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 70

    Medidas de variabilidade

    No Brasil o Instituto Brasileiro de Geografia e Estatstica (IBGE) se constitui no principal provedor de dados e informaes do pas, que atendem s ne-cessidades dos mais diversos segmentos da sociedade civil, bem como dos rgos das esferas governamentais federal, estadual e municipal.

    O IBGE oferece uma viso completa e atual do pas, atravs do desempe-nho de suas principais funes:

    produo e anlise de informaes estatsticas;

    coordenao e consolidao das informaes estatsticas;

    produo e anlise de informaes geogrficas;

    coordenao e consolidao das informaes geogrficas;

    estruturao e implantao de um sistema de informao am- biental;

    documentao e disseminao de informaes;

    coordenao do sistema estatstico e cartogrfico nacionais.

    Histrico do IBGE

    Durante o perodo imperial, o nico rgo com atividades exclusivamente estatsticas era a Diretoria Geral de Estatstica, criada em 1871. Com o adven-to da Repblica, o governo sentiu necessidade de ampliar essas atividades, principalmente depois da implantao do registro civil de nascimentos, casa-mentos e bitos.

    Com o passar do tempo, o rgo responsvel pelas estatsticas no Brasil mudou de nome e de funes algumas vezes at 1934, quando foi extinto o Departamento Nacional de Estatstica, cujas atribuies passaram aos minis-trios competentes.

    Curiosidade

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de variabilidade

    71

    A carncia de um rgo capacitado a articular e coordenar as pesquisas estatsticas, unificando a ao dos servios especializados em funcionamento no Pas, favoreceu a criao, em 1934, do Instituto Nacional de Estatstica (INE), que iniciou suas atividades em 29 de maio de 1936. No ano seguinte, foi insti-tudo o Conselho Brasileiro de Geografia, incorporado ao INE, que passou a se chamar, ento, Instituto Brasileiro de Geografia e Estatstica.

    H 69 anos, o IBGE cumpre a sua misso: identifica e analisa o territrio, conta a populao, mostra como a economia evolui atravs do trabalho e da produo das pessoas, revelando ainda como elas vivem.

    Atividades de aplicao1. Observam-se, a seguir, os tempos (em segundos) de reao a um alar-

    me de incndio, aps a liberao de fumaa de uma fonte fixa:

    12 9 11 7 9 14 6 10

    Escolha a alternativa correta quanto ao valor da amplitude da amostra.

    a) Amplitude igual a 10.

    b) Amplitude igual a 4.

    c) Amplitude igual a 8.

    d) Amplitude igual a 6.

    2. Identifique das alternativas abaixo a resposta correta para a situao descrita:

    Situao: suponha que trs grupos de alunos submetem-se a um tes-te, obtendo as seguintes notas:

    Grupo A: notas = 3 4 5 6 9

    Grupo B: notas = 1 3 5 7 9

    Grupo C: notas = 5 5 5 5 5

    a) O grupo A o que apresenta maior disperso/variao, com ampli-tude igual a 2.

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • 72

    Medidas de variabilidade

    b) O grupo B o que apresenta menor disperso/variao, com am-plitude igual a 4.

    c) O grupo A e B apresentam maior disperso/variao, do que o grupo C .

    d) O grupo C apresenta maior disperso/variao, com amplitude igual a 0 (zero).

    3. Escolha a alternativa correta quanto aos resultados obtidos da amos-tra abaixo:

    Amostra n. 1:

    4 2 9 8 7

    a) A amplitude igual a 3 e a varincia igual a 5,5.

    b) A amplitude igual a 5 e a varincia igual a 8,5.

    c) A amplitude igual a 7 e a varincia igual a 5,5.

    d) A amplitude igual a 7 e a varincia igual a 8,5.

    4. Calcule a varincia da amostra dos valores abaixo:

    Situao: para facilitar um projeto de ampliao da rede de esgotos de uma regio em uma pequena cidade, as autoridades tomaram uma amostra de oito quarteires que compem a regio, e identificaram os seguintes nmeros de casas por quarteires:

    12 6 7 3 15 10 18 5

    5. Calcule o desvio-padro da amostra dos valores abaixo:

    Situao: para facilitar um projeto de ampliao da rede de esgotos de uma regio em uma pequena cidade, as autoridades tomaram uma amostra de oito quarteires que compem a regio, e identificaram os seguintes nmeros de casas por quarteires:

    12 6 7 3 15 10 18 5

    Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br

  • Medidas de variabilidade

    73

    Gabarito1. C

    2. C

    3. D

    4. n

    i 1n xiMdia Aritmtica da amostra (x)

    876 9,5

    Varincia da amostra (s ) i 1n xi( x)2

    n 1x2

    xi x (xi x) (xi x)2

    3 9,5 -6,5 42,25

    5 9,5 -4,5 20,25

    6 9,5 -3,5 12,25

    7 9,5 -2,5 6,25

    10 9,5 0,5 0,25

    12 9,5 2,5 6,25

    15 9,5 5,5 30,25

    18 9,5 8,5 72,25

    190

    Varincia da amostra (s )n

    i 1n xi( x)2

    1x2

    7190 27,14286

    5. n

    i 1n xiMdia Aritmtica da amostra (x)8

    76 9,5

    Varincia da amostra (s )n

    i 1n xi( x)2

    1x2

    xi x (xi x) (xi x)2

    3 9,5 -6,5 42,25

    5 9,5 -4,5 20,25

    6 9,5 -3,5 12,25

    7 9,5 -2,5 6,25

    10 9,5 0,5 0,25

    12 9,5 2,5 6,25

    15 9,5 5,5 30,25

    18 9,5 8,5 72,25

    190

    Varincia da amostra (s )n

    i 1n xi( x)2

    1x2

    7190 27,14286

    Desvio-padro da amostra (sx)

    n i 1n xi( x)2

    12 27,14286

    25,20988

    Este material parte integrante do acervo do I