AULA 02

44
ANDRE ALOY RODRIGUES71620036053 Pacote de Conhecimentos Específicos – Especialista ANTAQ Aula 02 – Estatística Descritiva II Prof. Alexandre Lima www.pontodosconcursos.com.br | Prof. Alexandre Lima 1 1 Caracterização de uma Distribuição de Frequências ............................................... 2 1.1 Medidas de Dispersão .................................................................................................. 2 1.1.1 Variância ......................................................................................................................... 2 1.1.2 Desvio Padrão ............................................................................................................... 12 1.1.3 Coeficiente de Variação ................................................................................................ 13 1.1.4 Desvio Interquartílico ................................................................................................... 13 1.1.5 Amplitude...................................................................................................................... 14 1.1.6 Diagrama de Caixa ........................................................................................................ 14 1.2 Medidas de Assimetria............................................................................................... 18 1.4 Medidas de Curtose .................................................................................................... 20 2 O Mínimo que Você Precisa Saber ................................................................................ 22 3 Exercícios de Fixação ......................................................................................................... 23 4 Gabarito .................................................................................................................................. 28 5 Resolução dos Exercícios de Fixação ........................................................................... 29 Aula 02

description

mat fin

Transcript of AULA 02

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    1

    1 Caracterizao de uma Distribuio de Frequncias ............................................... 2

    1.1 Medidas de Disperso .................................................................................................. 2

    1.1.1 Varincia ......................................................................................................................... 2

    1.1.2 Desvio Padro ............................................................................................................... 12

    1.1.3 Coeficiente de Variao ................................................................................................ 13

    1.1.4 Desvio Interquartlico ................................................................................................... 13

    1.1.5 Amplitude...................................................................................................................... 14

    1.1.6 Diagrama de Caixa ........................................................................................................ 14

    1.2 Medidas de Assimetria ............................................................................................... 18

    1.4 Medidas de Curtose .................................................................................................... 20

    2 O Mnimo que Voc Precisa Saber ................................................................................ 22

    3 Exerccios de Fixao ......................................................................................................... 23

    4 Gabarito .................................................................................................................................. 28

    5 Resoluo dos Exerccios de Fixao ........................................................................... 29

    Aula 02

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    2

    1 Caracterizao de uma Distribuio de Frequncias A distribuio de frequncias de uma varivel quantitativa pode ser caracterizada por grandezas numricas denominadas medidas da distribuio de frequncias. As medidas buscam sumarizar as informaes disponveis sobre o comportamento de uma varivel. As duas medidas estatsticas mais comuns so a mdia (medida de posio) e o desvio padro (medida de disperso). As medidas de posio foram estudadas na aula passada. A aula de hoje aborda as medidas de disperso, que caracterizam a variabilidade dos dados em torno da regio central da distribuio, e as medidas de assimetria e curtose. 1.1 Medidas de Disperso Pense na seguinte situao: uma pessoa faz quatro refeies por dia, enquanto que outra no faz nenhuma refeio por dia. Na mdia, ambas fazem duas refeies por dia. Isto quer dizer que os dois indivduos esto bem alimentados? A resposta bvia no. para isso que servem as medidas de disperso, isto , medidas de como os dados esto agrupados: mais ou menos prximos entre si (mais ou menos dispersos). As medidas de disperso indicam o quanto os dados se apresentam dispersos em torno da regio central. Desta forma, caracterizam o grau de variabilidade existente nos dados. As seguintes medidas de disperso nos interessam: a varincia, o desvio padro, o coeficiente de variao e o desvio interquartlico. 1.1.1 Varincia A varincia de um conjunto de valores },...,,{ 21 nxxxX = pode ser calculada pela frmula

    (1) =

    =n

    i

    ix xxn

    s1

    22 )(1

    em que 2xs denota a varincia e x representa a mdia aritmtica. Neste curso,

    tambm utilizaremos a notao Var(X) para a varincia do conjunto X. Se os valores distintos kxxx ,...,, 21 ocorrerem com as frequncias kfff ,...,, 21 (

    =

    =k

    i

    i nf1

    ), respectivamente, a varincia ser dada por (*)

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    3

    (2) =

    =k

    i

    iix xxfn

    s1

    22 )(1

    .

    (*) Em (1) e (2), consideramos que os dados se referem a uma populao finita. Caso os dados estejam associados a uma amostra, o fator n (= fi) que aparece no denominador do lado direito de (1) e (2) deve ser substitudo por (n1). A justificativa para o uso do fator (n1) foge ao escopo desta aula porque trata-se de um problema de inferncia estatstica. Contudo, o erro cometido quando calculamos a varincia amostral pela frmula (1) (ou (2)) pequeno para grandes valores de n (digamos n>30).

    Considere o conjunto de observaes },...,,{ 21 nxxxX = . A varincia tem as seguintes propriedades:

    Seja o novo conjunto Y=cX={cx1, cx2,..., cxn}, em que c um valor fixo. Ento a varincia de Y igual a c elevado ao quadrado vezes a varincia de X: Var(Y) = c2Var(X).

    Seja o novo conjunto W=c+X={c+x1, c+x2,..., c+xn}, em que c um valor fixo. Ento a varincia de W=c+X igual a varincia de X (*): Var(W) = Var(X).

    (*) A varincia de um valor fixo nula. A frmula (1) pode ser reescrita na forma

    22

    2

    2 111)( xxn

    xn

    xn

    XVari

    i

    i

    i

    i

    i

    =

    = ,

    ou seja, como a diferena entre a mdia aritmtica dos quadrados dos valores e o quadrado da mdia aritmtica dos valores:

    Varincia = Mdia dos Quadrados Quadrado da Mdia. A varincia amostral tambm pode ser reescrita em uma forma anloga:

    2

    1

    2

    1

    2

    11

    1)(

    1

    1)( x

    n

    nx

    nxx

    nXVar

    n

    i

    i

    n

    i

    i

    =

    = ==

    ou

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    4

    2

    1

    2

    11

    1)( x

    n

    nxf

    nXVar

    n

    i

    ii

    = =

    caso os valores distintos kxxx ,...,, 21 ocorram com as frequncias kfff ,...,, 21 (

    =

    =k

    i

    i nf1

    ).

    Varincia Amostral = Soma dos Quadrados/(n1) Quadrado da Mdia corrigido pelo fator n/(n1) EXEMPLO. Julgue o item a seguir. Considere o conjunto de dados {2, 5, 8, 11, 14}. Ento a varincia desse conjunto menor que 20. Resoluo A mdia do conjunto

    85

    1411852=

    ++++=x

    e a varincia

    185

    )814()811()88()85()82()( 222222

    2 =++++

    =

    = n

    xxs

    i

    x Item certo.

    Tambm podemos usar a frmula "maceteada" da varincia:

    Varincia = Mdia dos Quadrados Quadrado da Mdia = 221

    xxn i

    i

    Sequncia de clculos: 1) Mdia dos quadrados:

    825

    410

    5

    1411852122222

    2 ==++++

    =i

    ixn

    .

    2) Quadrado da mdia:

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    5

    6481 22

    2

    ===

    xxn i

    i .

    Ento, 3) 1864822 ==xs (mesmo resultado!).

    GABARITO: C Exemplo (ATRFB/ESAF/2012): A varincia da amostra formada pelos valores 2, 3, 1, 4, 5 e 3 igual a A) 3

    B) 2

    C) 1

    D) 4

    E) 5

    Resoluo A questo pede que voc calcule a varincia de uma amostra (ou varincia amostral). Ento a frmula a ser utilizada a verso corrigida de (14), em que o denominador do lado direito da igualdade (n1):

    =

    =k

    i

    iix xxfn

    s1

    22 )(1

    1

    Clculo da mdia:

    valor (x) frequncia (fi) xi.fi xi2.fi

    1 1 1x1 = 1 12x1 = 1 2 1 2x1 = 2 22x1 = 4 3 2 3x2 = 6 32x2 = 18 4 1 4x1 = 4 42x1 = 16 5 1 5x1 = 5 52x1 = 25 fi = n = 6 xi.fi = 18 xi2.fi = 64

    36

    18

    6

    )15()14()23()12()11(1

    1

    ==++++

    == =

    k

    i

    ii fxn

    x

    Clculo da varincia amostral:

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    6

    5

    ])35(1[])34(1[])33(2[])32(1[])31(1[)(

    1

    1 22222

    1

    22 ++++=

    = =

    k

    i

    iix xxfn

    s

    25

    410142 =++++

    =xs opo B

    A varincia amostral tambm pode ser calculada pela frmula,

    Varincia Amostral = Soma dos Quadrados/(n1) Quadrado da Mdia corrigido pelo fator n/(n1)

    25

    10

    5

    5464

    5

    96

    5

    64

    11

    1 2

    1

    22 ==

    =

    =

    = =

    xn

    nxf

    ns

    n

    i

    iix

    GABARITO: B Varincia Combinada Considere o conjunto de dados A com NA elementos, mdia A e varincia

    2

    As e

    o conjunto B com NB elementos, mdia B e varincia 2

    Bs . Pode-se demonstrar que a varincia da populao conjunta A+B, tambm denominada varincia combinada ou global, dada por

    222

    2

    +

    +

    ++

    += +

    BABABA

    BANN

    BA

    NN

    B

    NN

    As .

    Fazendo N = NA + NB, obtemos

    222

    2

    ++= +

    N

    BA

    N

    B

    N

    As BA .

    Exemplo (REFAP/Cesgranrio/2007): O setor de recursos humanos de uma empresa tem o hbito de divulgar separadamente a mdia e a varincia das notas das avaliaes dos funcionrios do sexo feminino e do masculino. Na ltima avaliao, os resultados obtidos foram:

    Feminino Masculino Nmero de funcionrios 20 30

    Mdia 6 7 Varincia 3,4 4

    A mdia e a varincia das notas dos funcionrios dessa empresa, respectivamente, valem:

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    7

    A) 6,5 e 3,7

    B) 6,6 e 3,4

    C) 6,6 e 4,0

    D) 7,5 e 3,7

    E) 13,0 e 7,5

    Resoluo Dados: NA = 20, 6=A e 4,3

    2 =As (conjunto feminino); NB = 30, 7=B e 0,42 =Bs

    (conjunto masculino). A mdia global ou mdia das mdias dada pela mdia ponderada das mdias dos conjuntos:

    .6,63020

    730620=

    ++

    =++

    =+BA

    BABA

    NN

    BNANX

    O resultado acima j nos permite eliminar as opes A, D e E. Restaram as alternativas B e C. A varincia combinada dada por

    222

    2

    ++= +

    N

    BA

    N

    B

    N

    As BA .

    Calcularemos a varincia combinada se soubermos os valores das somatrias

    A (soma de A), B (soma de B), 2A (soma dos quadrados de A) e 2B (soma dos quadrados de B).

    A mdia do conjunto A 6 120620

    == AA

    (soma de A = 120).

    A mdia do conjunto B 7 210730

    == BB

    (soma de B = 210).

    A varincia de A 3,4. Ento,

    4,3920

    4,3620

    4,320

    4,3

    2

    2

    2

    2

    222

    2 ====

    = AAAA

    N

    A

    N

    As

    AA

    A

    7884,39202 == A (soma dos quadrados de A = 788).

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    8

    A varincia de B 4,0. Logo,

    0,5330

    0,4730

    0,430

    0,4

    2

    2

    2

    2

    222

    2 ====

    = BBBB

    N

    B

    N

    Bs

    BB

    B

    590.153302 ==B (soma dos quadrados de B = 1.590). Finalmente, temos que

    2

    22222

    2 6,656,4750

    330

    50

    378.2

    50

    210120

    50

    590.1

    50

    788=

    =

    ++=

    ++= +

    N

    BA

    N

    B

    N

    As BA

    0,456,4356,472 ==+BAs varincia combinada = 4,0. GABARITO: C Nota: se as mdias dos conjuntos A e B forem iguais, ou seja, se BA = , a varincia combinada pode ser calculada por meio da frmula simplificada

    N

    sNsN

    NN

    sNsNs BBAA

    BA

    BBAABA

    22222 +=

    ++

    =+ ,

    em que N = NA + NB. Repare que trata-se de uma mdia ponderada das varincias individuais. Ateno: a frmula acima um caso particular da frmula anterior da varincia combinada. Voc s poder aplic-la quando as mdias dos conjuntos A e B forem iguais! Exemplo. Sejam os conjuntos de nmeros {2, 5, 8, 11, 14} e {2, 8, 14}, Assinale a opo com a varincia dos conjuntos combinados ou reunidos. A) 8

    B) 20,25

    C) 18

    D) 24

    E) 22

    Resoluo Temos a srie estatstica A = {2, 5, 8, 11, 14} com mdia

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    9

    85

    40

    5

    1411852==

    ++++=A

    e a srie B = {2, 8, 14} com mdia

    83

    24

    3

    1482==

    ++=B .

    Como as mdias so iguais, podemos aplicar a frmula simplificada

    N

    sNsNs BBAABA

    222 +=+ .

    Varincia do 1 conjunto:

    .185

    )814()811()88()85()82()( 222222

    2 =++++

    =

    = A

    AN

    AAs

    Varincia do 2 conjunto: .243

    )814()88()82()( 2222

    2 =++

    =

    = B

    BN

    BBs

    Varincia combinada: .25,2035

    2431852 =+

    +=+BAs

    GABARITO: B Varincia de Dados Agrupados em Intervalos de Classe Como j visto, quando os dados so apresentados em uma distribuio de frequncias, todos os valores includos num certo intervalo de classe so considerados coincidentes com o ponto mdio do intervalo. As frmulas (1) e (2)

    ==

    ==n

    i

    i

    n

    i

    i xxn

    xxn

    XVar1

    22

    1

    2 1)(1

    )(

    ===

    ===k

    i

    ii

    k

    i

    ii

    k

    i

    ii xpxxfxn

    xxfn

    XVar1

    22

    1

    22

    1

    2 1)(1

    )(

    sero vlidas para esses dados agrupados quando se interpretar ix como o

    ponto mdio e if ( nfk

    i

    i ==1

    , 11

    ==

    k

    i

    ip ) como a frequncia de classe

    correspondente.

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    10

    Exemplo. Seja a distribuio em classes de frequncia dada na Tabela 5. Temos que

    Tabela 7: clculo da varincia.

    Classe (limites reais) i

    f ix ii fx ii fx2

    40,0 45,0 6 42,5 255,0 10.837,5

    45,0 50,0 16 47,5 760,0 36.100,0

    50,0 55,0 32 52,5 1.680,0 88.200,0

    55,0 60,0 24 57,5 1.380,0 79.350,0

    60,0 65,0 14 62,5 875,0 54.687,5

    65,0 70,0 6 67,5 405,0 27.337,5

    70,0 75,0 2 72,5 145,0 10.512,5

    Total n = 100 5.500 307.025,0

    Vimos que,

    0,55100

    500.5===

    n

    fxx

    ii .

    Logo,

    Varincia 25,450,025.325,070.355100

    025.3071 2

    1

    222 ==== =

    k

    i

    iix xfxn

    s

    J caiu em prova! (Papiloscopista PF/CESPE-UnB/2004) Classificao mnimo 1 quartil mediana mdia 3 quartil mximo varincia

    A 20 25 27,5 30 32,5 50 49

    B 18 23 32 33 42 52 100

    A ou B x y z 31 w u v

    De acordo com um levantamento estatstico, a mdia das idades de um grupo de presidirios igual a 31 anos de idade. Nesse levantamento, os presidirios foram classificados como A ou B, dependendo da sua condio psicossocial. Constatou-se que a mdia das idades dos presidirios classificados como A menor que a mdia das idades dos presidirios classificados como B. A tabela

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    11

    acima apresenta algumas medidas estatsticas obtidas por meio desse levantamento. A partir das informaes acima, julgue os itens que se seguem. O nmero de presidirios classificados como A igual ao dobro do nmero de presidirios classificados como B. Resoluo Dados: 30=A , 33=B . Mdia das mdias ( X ):

    BA

    BA

    nn

    BnAnX

    ++

    = BA

    BA

    nn

    nn

    ++

    =3330

    31 BA nn 2=

    em que

    An e Bn denotam o nmero de presidirios classificados como A e o nmero de presidirios classificados como B, respectivamente. Logo, correto afirmar que o nmero de presidirios classificados como A igual ao dobro do nmero de presidirios classificados como B. GABARITO: C O valor de v est entre 65 e 75. Resoluo A varincia combinada v dada por

    222

    2

    +

    +

    ++

    +== +

    BABABA

    BAnn

    BA

    nn

    B

    nn

    ASv

    30=A 30=An

    A BA nnA 6030 == , pois BA nn 2=

    33=B 33=Bn

    B BnB 33=

    492 =AS 492

    2

    = An

    A

    A

    9493049 22

    =+=An

    A BA nnA 1898949

    2 ==

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    12

    1002 =BS 1002

    2

    = Bn

    B

    B

    118933100 22

    =+=Bn

    B BnB 1189

    2 =

    6896110293133,39667,6323

    3360

    3

    1189

    3

    1898 22

    2 ==+=

    ++== +

    B

    BB

    B

    B

    B

    BBA

    n

    nn

    n

    n

    n

    nSv

    Ento certo afirmar que 65 < v = 68 < 75. GABARITO: C Valores de x e u so, respectivamente, iguais a 19 e 51 anos de idade. Resoluo O levantamento estatstico no deixa dvida de que o valor mnimo de A ou B x = 18 e o valor mximo de A ou B u = 52. Item errado. GABARITO: E 1.1.2 Desvio Padro O desvio padro mede a disperso absoluta de um conjunto de dados. dado pela raiz quadrada positiva da varincia:

    (3) 2xx ss += .

    O desvio padro est na mesma unidade da varivel e indica, em mdia, qual ser o erro (desvio) cometido ao tentar substituir cada observao pela mdia do conjunto de dados. Nota: tambm utilizaremos a notao DP(X) (ou EP(X)) para o desvio padro (ou Erro Padro) do conjunto X. Exemplo. Determine o desvio padro do conjunto 2, 5, 8, 11, 14. Vimos que esse conjunto possui varincia igual a 18. Logo, 24,418 =xs .

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    13

    Considere o conjunto de valores },...,,{ 21 nxxxX = . O desvio padro tem as seguintes propriedades:

    Seja o conjunto Y=cX={cx1, cx2,..., cxn}, em que c um valor fixo. Ento o desvio padro de Y igual a c vezes o desvio padro de X: DP(Y) = c.DP(X).

    Seja o novo conjunto W=c+X={c+x1, c+x2,..., c+xn}, em que c um valor fixo. Ento o desvio padro de W = c+X igual ao desvio padro de X: DP(W) = DP(X)

    1.1.3 Coeficiente de Variao O coeficiente de variao definido como o quociente entre o desvio padro e a mdia, sendo frequentemente expresso em porcentagem (*):

    (4) x

    XDPxcv

    )()( =

    O coeficiente de variao mede a disperso relativa dos dados. Utiliza-se o coeficiente de variao na comparao do grau de concentrao em torno da mdia para duas ou mais sries distintas. (*) Logo, podemos dizer que o coeficiente de variao um adimensional. Exemplo. Determine o coeficiente de variao do conjunto 2, 5, 8, 11, 14.

    O conjunto tem mdia 8 e desvio padro 4,24. Portanto, %5353,08

    24,4)( ==xcv .

    1.1.4 Desvio Interquartlico O desvio interquartlico (ou amplitude interquartil ou intervalo interquartlico) definido como (5) 13 QQdQ = ,

    em que Qd denota o desvio interquartlico, 3Q o terceiro quartil (ou quartil

    superior) e 1Q o primeiro quartil (ou quartil inferior).

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    14

    A amplitude interquartil pode ser usada como uma medida de disperso. Em distribuies mais dispersas, os valores dos quartis ficam mais distantes. Em distribuies simtricas, a distncia entre o quartil inferior e a mediana igual distncia entre a mediana e o quartil superior, enquanto que em distribuies assimtricas essas distncias so diferentes. O intervalo interquartlico no influenciado por valores extremos (outliers). Exemplo. O primeiro e o terceiro quartis da distribuio das alturas dos estudantes da Universidade de So Paulo so 165,56 cm e 178,59 cm, respectivamente. Calcule o desvio interquartlico dessa distribuio.

    03,1356,16559,17813 === QQdQ cm.

    1.1.5 Amplitude A amplitude total (R) definida como a diferena entre o maior valor e o menor valor do conjunto de dados: (6) minmax xxR = . A amplitude altamente influenciada por valores extremos (outliers) porque se baseia somente em duas observaes. Exemplo. A amplitude do conjunto 3, 3, 4, 5, 5, 6, 7, 7, 7, 10 10 3 = 7. 1.1.6 Diagrama de Caixa Um diagrama de caixa ou box plot ou caixa-de-bigodes um retngulo que representa o desvio interquartlico (IQR) ( a estatstica Qd definida

    por (5)). Para construir esse diagrama (veja a prxima figura), consideramos um retngulo onde esto representados a mediana, o primeiro quartil (Q1) e o terceiro quartil (Q3). A partir do retngulo, para cima, segue uma linha at o ponto mais remoto que no pode exceder LS = Q3 + 1,5.IQR, chamado limite superior. De modo anlogo, a partir do retngulo, para baixo, segue uma linha at o ponto mais remoto que no seja menor que LI = Q1 1,5.IQR, chamado limite inferior. Os valores compreendidos entre esses dois limites so chamandos valores adjacentes. As observaes que estiverem acima do limite superior ou abaixo do limite inferior sero denominadas pontos exteriores. Essas observaes so destoantes das demais e podem ou no ser o que chamamos de outliers ou valores atpicos (*)1. Um outlier pode ser produto de um erro de observao ou de arredondamento. Contudo, as

    1 BUSSAB, Wilton de O.; MORETTIN, Pedro Alberto. Estatstica Bsica. So Paulo: Ed. Saraiva, 2010.

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    15

    denominaes pontos exteriores e outliers so frequentemente usadas com o mesmo significado por alguns autores2: observaes fora de lugar, discrepantes ou atpicas. (*) A mdia aritmtica sensvel a outliers. Um nico valor ruim do conjunto de dados pode distorcer a mdia, ou seja, pode mover a mdia para longe do centro da distribuio de frequncias. As mdias geomtrica e harmnica, assim como a aritmtica, tambm no so robustas a outliers. O box plot nos d uma noo da posio, disperso, assimetria, caudas e dados discrepantes da distribuio. A posio central dada pela mediana e a disperso por IQR. As posies relativas de Q1, Q2 e Q3 nos do uma idia da assimetria da distribuio. Os comprimentos das caudas so dados pelas linhas que vo do retngulo aos valores remotos e pelos valores atpicos. Os comprimentos das caudas so dados pelas linhas que vo do retngulo aos valores remotos e pelos valores atpicos.

    Exemplo. Considere um conjunto de dados com os seguintes percentis:

    0% 25% 50% 75% 100% 1,7524 4,6901 5,7004 6,1768 7,3658

    2 MONTGOMERY, Douglas C.; RUNGER, George C. Estatstica Aplicada e Probabilidade para Engenheiros. Rio de

    Janeiro: LTC, 2008.

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    16

    A prxima figura um box plot do conjunto de dados que gerou a tabela de percentis acima. A cauda inferior longa e isto indica que a distribuio assimtrica. Note tambm a presena de outliers na parte inferior do box plot (so os pontos vermelhos).

    A figura abaixo mostra o histograma associado ao box plot do exemplo.

    _______________________________________________________ A prxima figura refora a relao do box plot com o histograma. A distribuio da esquerda simtrica, enquanto que a da direita assimtrica.

    1

    2

    3

    4

    5

    6

    7V

    alo

    res

    1 2 3 4 5 6 7 80

    10

    20

    30

    40

    50

    60

    70

    80

    90

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    17

    25% 25%

    25%25%

    Qi md Qs

    25% 25%

    25%25%

    Os box plots da figura abaixo mostram a comparao dos tamanhos das ptalas em duas amostras das espcies de flor-de-lis versicolor e virginica3.

    A existncia de um outlier nos dados da espcie versicolor indicada pelo ponto vermelho na parte inferior esquerda da figura.

    3 Conjunto de dados de Fisher.

    versicolor virginica

    3

    3.5

    4

    4.5

    5

    5.5

    6

    6.5

    7

    Valo

    res

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    18

    1.2 Medidas de Assimetria Assimetria o grau de desvio, ou afastamento da simetria, de uma distribuio. As distribuies alongadas direita so ditas positivamente assimtricas, e as alongadas esquerda, negativamente assimtricas. Uma medida conveniente de assimetria, por ser adimensional, dada pelo coeficiente de assimetria (A)

    (7) 3

    3

    1

    3

    3)(

    11

    x

    n

    i

    i

    x s

    mxx

    nsA ==

    =

    em que =

    =n

    i

    i xxn

    m1

    3

    3 )(1

    denota o momento centrado de terceira ordem e

    3

    xs o cubo do desvio padro. O coeficiente de assimetria (7) indica o sentido da assimetria e pode ser usado para comparar vrios casos porque adimensional. O sinal do coeficiente de assimetria ser positivo ou negativo se a distribuio for assimtrica direita ou esquerda, respectivamente. A assimetria tambm pode ser medida pelo primeiro coeficiente de assimetria de Pearson

    (8) x

    ps

    moxA

    =1

    em que x a mdia, mo denota a moda e xs o desvio padro. Para evitar o emprego da moda em (8), pode-se adotar a frmula emprica

    (mdia moda) = 3(mdia - mediana), de forma que (8) pode ser reescrita como

    x

    ps

    mdxA

    )(32

    =

    conhecida como segundo coeficiente de assimetria de Pearson. Uma outra medida de assimetria, denominada coeficiente quartlico de assimetria ( qA ), definida pela frmula

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    19

    (9) 13

    13 2

    QQ

    QmdQAq

    += .

    Exemplo (IPEA/FCC/2004). Numa distribuio de frequncias com assimetria negativa mais de 50% dos dados situam-se A) sobre a mdia B) acima da mdia C) entre a mdia e a moda D) entre a mdia e a mediana E) acima da mediana Resoluo A prxima figura ilustra uma Distribuio de Frequncias com Assimetria Negativa ou Esquerda:

    Observe que

    Mdia < Mediana < Moda Bizu: na assimetria negativa, voc deve puxar a seta com a mo esquerda, de forma que:

    1) a seta puxa a mdia;

    2) a moda est no topo; e

    3) a mediana est no meio.

    0

    1

    2

    3

    4

    5

    6

    7

    8

    0 a 10 10 a 20 20 a 30 30 a 40 40 a 50

    Moda

    Mediana

    Mdia

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    20

    Uma distribuio de frequncias com assimetria negativa alongada esquerda. A mediana o valor que divide a distribuio ao meio, deixando os 50% menores valores de um lado e os 50% maiores valores do outro lado. Logo, numa distribuio de frequncias com assimetria negativa, mais de 50% dos dados esto acima da mdia (pois a mdia menor do que a mediana). Assimetria Positiva ou Direita: Mdia > Mediana > Moda ou Moda < Mediana < Mdia

    Bizu: na assimetria positiva ou direita, voc deve puxar a seta com a mo direita, de modo que:

    1) a seta puxa a mdia;

    2) a moda est no topo; e

    3) a mediana est no meio.

    GABARITO: B 1.4 Medidas de Curtose As medidas de curtose visam caracterizar a forma da distribuio quanto ao seu achatamento. A referncia para comparao dada pela distribuio normal, modelo probabilstico terico de grande aplicao prtica (*). Diz-se que a distribuio normal mesocrtica (veja a figura

    0

    1

    2

    3

    4

    5

    6

    7

    8

    9

    0 a 10 10 a 20 20 a 30 30 a 40 40 a 50

    Moda

    Mediana

    Mdia

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    21

    abaixo). As distribuies mais achatadas que a normal so platicrticas e as menos achatadas so leptocrticas. (*) No fique preocupado se voc no conhece a curva normal. Neste momento, basta que voc saiba que o formato da curva normal lembra um sino.

    Platicrtica

    Mesocrtica

    (normal)

    Leptocrtica

    A caracterizao do achatamento de uma distribuio s tem sentido se a distribuio for aproximadamente simtrica. Entre as possveis medidas de achatamento, temos o coeficiente do momento de curtose (a4), definido como a razo entre o momento centrado de quarta ordem e a quarta potncia do desvio padro:

    (10) .4

    44

    xs

    ma =

    Esse coeficiente adimensional, sendo menor que trs para as distribuies platicrticas, igual a trs para a normal e maior que trs para as distribuies leptocrticas. Outra medida de curtose tambm empregada, denominada coeficiente percentlico de curtose, baseia-se nos quartis e percentis e definida por:

    (11) 1090 PP

    QK

    =

    em que Q a metade da distncia interquartlica, ou seja, Q = (Q3 - Q1)/2.

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    22

    2 O Mnimo que Voc Precisa Saber

    - Varincia = Mdia dos Quadrados Quadrado da Mdia = 221

    xxn i

    i

    - Varincia amostral: 21

    2

    1

    2

    11

    1)(

    1

    1)( x

    n

    nx

    nxx

    nXVar

    n

    i

    i

    n

    i

    i

    =

    = ==

    - Varincia combinada dos conjuntos A e B: 222

    2

    ++= +

    N

    BA

    N

    B

    N

    As BA

    - Desvio Padro = Raiz Quadrada positiva da Varincia.

    - Coeficiente de variao: x

    XDPxcv

    )()( = .

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    23

    3 Exerccios de Fixao (BACEN-rea 4/Cesgranrio/2010) Considere as informaes a seguir para responder s questes de nos 1 a 3. A viabilidade financeira do projeto de uma microempresa leva em considerao dados histricos de 100 projetos semelhantes. A tabela abaixo mostra a distribuio de frequncias do VPL Valor Presente Lquido (valores em milhes de reais) de um conjunto de microempresas similares.

    VPL Frequncia Relativa

    -10 < x 0 10%

    0 < x 10 80%

    10 < x 20 10% 1. Utilizando os dados histricos acima, o valor esperado para o VPL da microempresa, em milhes de reais, (A) -10

    (B) 0

    (C) 5

    (D) 10

    (E) 20

    2. Segundo os dados histricos, o valor, em milhes de reais, que mais se aproxima do desvio padro do VPL da microempresa (A) 1

    (B) 2

    (C) 2,5

    (D) 4

    (E) 4,5

    3. Um projeto alternativo para o investidor apresenta um VPL esperado, em reais, de 6 milhes e um risco (desvio padro) de 2 milhes. Pela tica do risco relativo, qual o melhor investimento, a microempresa ou o projeto alternativo? (A) A microempresa, pois apresenta um Coeficiente de Variao maior.

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    24

    (B) A microempresa, pois apresenta um Coeficiente de Variao menor.

    (C) O projeto alternativo, pois apresenta um Coeficiente de Variao maior.

    (D) O projeto alternativo, pois apresenta um Coeficiente de Variao menor.

    (E) indiferente, pois os investimentos apresentam Coeficientes de Variao iguais.

    (ANACrea 7/CESPE-UnB/2012) Com base no histograma acima apresentado, julgue os itens a seguir. 4. Considerando que o histograma mostra a distribuio dos voos de certo aeroporto por distncia voada, correto afirmar que a distncia mdia dos voos desse aeroporto superior a 150 milhas nuticas. 5. Os quartis das distncias voadas (em milhas nuticas) obtidos a partir do grfico so: 1o quartil = 100,0; 2o quartil (mediana) = 150,0; e 3o quartil = 200,0.

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    25

    nota contagem

    0 27

    1 6

    2 5

    3 7

    4 2

    5 3

    Considerando que uma pesquisa de satisfao referente a um novo terminal de passageiros tenha sido realizada com 50 pessoas e o resultado em uma amostra de notas conforme apresentado na tabela acima, julgue os itens seguintes. 6. A mdia geomtrica da distribuio das notas foi superior mdia aritmtica. 7. A varincia amostral das notas atribudas pelos passageiros foi superior a 2,4. (Analista Judicirio-TST/CESPE-UnB/2007/Adaptada) Considere que, em um ambiente de trabalho industrial, as seguintes medies acerca da poluio do ar tenham sido observadas: 1, 6, 4, 3, 2, 3, 1, 5, 1, 4. Nessas situao, julgue os itens que se seguem. 8. A mediana da amostra igual a 2,5. 9. As mdias harmnica e geomtrica so ambas inferiores a 3. 10. O terceiro quartil igual a 3. 11. A varincia amostral superior a 2,8.

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    26

    Varivel X Frequncia relativa

    0 0,10

    1 0,20

    2 0,30

    3 0,40

    (SEAD-CPC/Cespe-UnB/2007/Adaptada) Considerando a tabela acima, que apresenta as freqncias relativas de uma varivel X, relativa a uma contagem, julgue os itens a seguir. 12. A mdia de X inferior a 1,5. 13. O desvio-padro de X inferior a 1,5. 14. A moda e a mediana de X so iguais a 3. 15. O coeficiente de variao de X superior a 1. (MI-CENAD/ESAF/2012/Adaptada) A distribuio de frequncias em classes do salrio mensal x, medido em nmero de salrios mnimos, de uma amostra aleatria de 50 funcionrios de uma empresa, apresentado a seguir.

    x f

    mais de 0 a 10 22

    mais de 10 a 20 13

    mais de 20 a 30 10

    mais de 30 a 40 3

    mais de 40 a 50 2

    16. Usando os dados acima, obtenha o valor mais prximo da varincia amostral do salrio mensal. (A) 121,5

    (B) 124

    (C) 126,5

    (D) 129

    (E) 131,5

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    27

    17. (ATRFB/ESAF/2012) A varincia da amostra formada pelos valores 2, 3, 1, 4, 5 e 3 igual a (A) 3

    (B) 2

    (C) 1

    (D) 4

    (E) 5

    (ANCINE/CESPE-UnB/2013) Considerando os mtodos descritivos, julgue os itens a seguir. 18. Suponha que A = 5 x I, em que A e I representam, respectivamente, a amplitude total e o intervalo interquartlico de um conjunto de dados. Em face dessa hiptese, sabendo que no existem outliers no extremo inferior da distribuio, infere-se que a distribuio desses dados simtrica. 19. Para o conjunto de dados 1, 1, 1, , 1, 1, 1, o desvio mediano absoluto, que se define como | , , |, positivo.

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    28

    4 Gabarito

    1 C 2 E 3 D 4 C 5 C 6 E 7 C 8 E

    9 C 10 E 11 C 12 E 13 C 14 E 15 E 16 C

    17 B 18 E 19 E

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    29

    5 Resoluo dos Exerccios de Fixao (BACEN-rea 4/Cesgranrio/2010) Considere as informaes a seguir para responder s questes de nos 1 a 3. A viabilidade financeira do projeto de uma microempresa leva em considerao dados histricos de 100 projetos semelhantes. A tabela abaixo mostra a distribuio de frequncias do VPL Valor Presente Lquido (valores em milhes de reais) de um conjunto de microempresas similares.

    VPL Frequncia Relativa

    -10 < x 0 10%

    0 < x 10 80%

    10 < x 20 10% 1. Utilizando os dados histricos acima, o valor esperado para o VPL da microempresa, em milhes de reais, (A) -10

    (B) 0

    (C) 5

    (D) 10

    (E) 20

    Resoluo A questo pede para voc calcular o valor esperado ou mdia de uma distribuio de frequncias de dados numricos agrupados em intervalos de classe. Quando os dados numricos so apresentados em uma distribuio de frequncias, todos os valores includos num certo intervalo de classe so considerados coincidentes com o ponto mdio do intervalo. Utilizemos a seguinte notao: VPL = X, XVPLE =)( (valor esperado de VPL = mdia de X). Clculo de E(VPL):

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    30

    =

    =++=++==3

    1

    0,55,10,45,0)1,015()8,05()1,05(i

    ii pXX

    A memria de clculos ilustrada pela tabela a seguir.

    VPL Xi (ponto mdio do intervalo)

    Freq. Relativa (pi)

    Xipi

    -10 < x 0 -5 0,1 -0,5

    0 < x 10 5 0,8 4,0

    10 < x 20 15 0,8 1,5

    Total Xipi = 5,0

    GABARITO: C 2. Segundo os dados histricos, o valor, em milhes de reais, que mais se aproxima do desvio padro do VPL da microempresa (A) 1

    (B) 2

    (C) 2,5

    (D) 4

    (E) 4,5

    Resoluo Deve-se calcular o desvio padro de uma distribuio de frequncias de dados numricos agrupados em intervalos de classe. Quando os dados numricos so apresentados em uma distribuio de frequncias, todos os valores includos num certo intervalo de classe so considerados coincidentes com o ponto mdio do intervalo. Utilizemos a seguinte notao:

    VPL = X;

    XVPLE =)( (valor esperado de VPL = mdia de X)

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    31

    Var(VPL) denota a varincia de VPL; e

    DP(VPL) representa o desvio padro de VPL.

    DP(VPL) = raiz quadrada positiva de Var(VPL). Clculo de DP(VPL):

    =

    ==++==3

    1

    22222 20254525)1,015()8,05()1,05()(i

    ii XpXVPLVar

    5,447,420)()( === VPLVarVPLDP

    GABARITO: E 3. Um projeto alternativo para o investidor apresenta um VPL esperado, em reais, de 6 milhes e um risco (desvio padro) de 2 milhes. Pela tica do risco relativo, qual o melhor investimento, a microempresa ou o projeto alternativo? (A) A microempresa, pois apresenta um Coeficiente de Variao maior.

    (B) A microempresa, pois apresenta um Coeficiente de Variao menor.

    (C) O projeto alternativo, pois apresenta um Coeficiente de Variao maior.

    (D) O projeto alternativo, pois apresenta um Coeficiente de Variao menor.

    (E) indiferente, pois os investimentos apresentam Coeficientes de Variao iguais.

    Resoluo A questo pede que voc compare os riscos de dois projetos. Pela tica do risco relativo, o melhor investimento aquele que apresenta a distribuio de frequncias com menor disperso em torno do valor esperado. Observe que essa comparao no pode ser feita com o desvio padro, pois essa medida no mede a disperso relativa dos dados. A comparao dos riscos deve ser efetuada por meio do Coeficiente de Variao (CV). Pela tica do risco relativo, o melhor investimento o que possui VPL com o menor Coeficiente de Variao. O coeficiente de variao definido como o quociente entre o Desvio Padro (DP) e a mdia ( X ), sendo frequentemente expresso em porcentagem:

    X

    XDPXCV

    )()( = .

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    32

    Clculo do CV para o investimento microempresa (denotado por X1):

    894,05

    47,4)()(

    1

    11 ===

    X

    XDPXCV

    Clculo do CV para o investimento alternativo (denotado por X2): Dados: DP(X2) = 2 e E(X2) = 6.

    333,06

    2)()(

    2

    22 ===

    X

    XDPXCV

    Como CV(X2) < CV(X1), o melhor investimento, pela tica do risco relativo, o projeto alternativo, pois apresenta um Coeficiente de Variao menor. GABARITO: D

    (ANACrea 7/CESPE-UnB/2012) Com base no histograma acima apresentado, julgue os itens a seguir. 4. Considerando que o histograma mostra a distribuio dos voos de certo aeroporto por distncia voada, correto afirmar que a distncia mdia dos voos desse aeroporto superior a 150 milhas nuticas. Resoluo

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    33

    A mdia aritmtica, ou mdia, de um conjunto de n nmeros nXXX ,...,, 21 definida por (leia-se X barra)

    ==+++==

    Xn

    Xnn

    XXXX

    n

    i

    in 11...

    1

    21

    Se k valores distintos observados kXXX ,...,, 21 ocorrerem com as frequncias

    kfff ,...,, 21 ( nfk

    i

    i ==1

    ), respectivamente, a mdia ser

    ==

    =

    = ===+++++

    +++++=

    k

    i

    ii

    k

    i

    iik

    i

    i

    k

    i

    ii

    ki

    kkii XpXfn

    f

    Xf

    ffff

    XfXfXfXfX

    11

    1

    1

    21

    2211 1

    ......

    ......

    em que pi denota a i-sima frequncia relativa. Quando os dados so apresentados em uma distribuio de frequncias, todos os valores includos num certo intervalo de classe so considerados coincidentes com o ponto mdio do intervalo. As frmulas acima sero vlidas para esses dados agrupados quando se interpretar iX como o ponto mdio do

    intervalo e if como a frequncia de classe correspondente.

    )350%5()250%20()150%50()50%25(4

    1

    +++===i

    iiXpX

    1555,1750755,12)35005,0()25020,0()15050,0()5025,0( =+++=+++=X

    A distncia mdia dos voos desse aeroporto superior a 150 milhas nuticas. Item certo. GABARITO: C 5. Os quartis das distncias voadas (em milhas nuticas) obtidos a partir do grfico so: 1o quartil = 100,0; 2o quartil (mediana) = 150,0; e 3o quartil = 200,0. Resoluo Os quartis dividem os dados do histograma em quatro subconjuntos com igual nmero de elementos. O primeiro quartil (Q1) ou quartil inferior (Qi) delimita os 25% menores valores. O segundo quartil a prpria mediana e o terceiro quartil (Q3) ou quartil superior (Qs) o valor que separa os 25% maiores valores.

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    34

    Neste item, o valor x = 100,0 o primeiro quartil, pois delimita os 25% menores valores. O valor x = 150,0 a mediana, porque corresponde ao valor que divide a distribuio ao meio, deixando os 50% menores valores de um lado e os 50% maiores valores do outro lado. O terceiro quartil o valor x = 200,0, pois separa os 25% maiores valores do restante da distribuio. Item certo. Alm dos quartis, podemos definir os decis (D1, D2,..., D9), que so os valores que dividem os dados em dez partes iguais (note que a mediana corresponde ao quinto decil D5) e os percentis,que so os valores que dividem os dados ordenados em 100 partes iguais, sendo representados por P1, P2,..., P99 (a mediana o percentil P50). De maneira geral, os quartis, decis e percentis e outros valores obtidos mediante subdivises dos dados em partes iguais so denominados quantis. Os quartis, os decis e os percentis so medidas de posio separatrizes, pois so valores que ocupam determinados lugares do eixo horizontal da distribuio de frequncias, abrangendo intervalos iguais de um conjunto de valores coletados e organizados. Observe que a mediana, alm de ser uma medida de posio de tendncia central, tambm uma medida separatriz. GABARITO: C

    nota contagem

    0 27

    1 6

    2 5

    3 7

    4 2

    5 3

    Considerando que uma pesquisa de satisfao referente a um novo terminal de passageiros tenha sido realizada com 50 pessoas e o resultado em uma amostra de notas conforme apresentado na tabela acima, julgue os itens seguintes.

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    35

    6. A mdia geomtrica da distribuio das notas foi superior mdia aritmtica. Resoluo A soma da contagem n = f1+ f2 + ... + f6 = 27 + 6 + 5 + 7 + 2 + 3 = 50, em que os fi, i =1, 2, ..., 6, denotam as frequncias da contagem. A mdia geomtrica nula: 0)5...0()....( 50/1/121 ===

    n

    nG XXXX . Como a mdia aritmtica um valor no nulo, a mdia geomtrica da distribuio das notas inferior mdia aritmtica. Item errado. Clculo da mdia:

    2,150

    60

    50

    )35()24()73()52()61()270(... 6611 ==+++++

    =++

    =n

    XfXfX

    Relao entre as mdias aritmtica, geomtrica e harmnica A mdia geomtrica de um conjunto de nmeros positivos nXXX ,...,, 21 menor

    do que ou igual sua mdia aritmtica, mas maior do que ou igual sua mdia harmnica:

    mdia harmnica mdia geomtrica mdia aritmtica A propriedade acima pode ser usada para se resolver este item sem fazer contas (macete de prova). GABARITO: E 7. A varincia amostral das notas atribudas pelos passageiros foi superior a 2,4. Resoluo Frmula da Varincia amostral:

    2

    1

    2

    11

    1)( X

    n

    nXf

    nXVar

    k

    i

    ii

    = =

    Varincia Amostral = Soma dos Quadrados/(n1) Quadrado da Mdia corrigido pelo fator n/(n1)

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    36

    Clculo da Soma dos Quadrados:

    196)35()24()73()52()61()270( 2222226

    1

    2 =+++++==i

    iiXf

    Clculo da Varincia Amostral:

    53,247,100,42,149

    50

    49

    196)( 2 ==

    =XVar

    GABARITO: C (Analista Judicirio-TST/CESPE-UnB/2007/Adaptada) Considere que, em um ambiente de trabalho industrial, as seguintes medies acerca da poluio do ar tenham sido observadas: 1, 6, 4, 3, 2, 3, 1, 5, 1, 4. Nessas situao, julgue os itens que se seguem. 8. A mediana da amostra igual a 2,5. Resoluo Rol: 1, 1, 1, 2, 3, 3, 4, 4, 5, 6 (N = 10 medies) N = 10 par. Ento

    mediana = mdia aritmtica entre as 5a e 6a medies do rol mediana = (3+3)/2 = 3 GABARITO: E 9. As mdias harmnica e geomtrica so ambas inferiores a 3. Resoluo Frmulas:

    Mdia geomtrica: nn

    i

    in

    ng xxxxx/1

    1

    21 ....

    ==

    =

    Mdia harmnica:

    =

    =+++

    =n

    i in

    h

    x

    n

    xxx

    nx

    121

    11...

    11

    Mdia geomtrica:

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    37

    ( ) 1010/110/121 864086406544332111.... ==== n ng xxxx

    E agora, como fazer a conta acima? Como voc poderia efetuar a raiz dcima de 8640 em uma situao real de prova? Ns faramos uma conta aproximada, como nmeros inteiros. Quer ver? Quanto d 310? 310 = 33 x 33 x 33 x 3 = 27 x 27 x 27 x 3 = 19683 x 3 > 8640 Logo,

    3864010

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    38

    1,139

    118

    1

    1 2 = i i

    xn

    Observe que a frmula da mdia dos quadrados leva em conta o fator 1/(n1) em lugar de 1/n porque trata-se da varincia de uma amostra. Quadrado da Mdia de uma amostra:

    310

    30

    10

    6544332111==

    +++++++++=x 92 =x 109

    9

    10

    1

    2 ==

    xn

    n

    Varincia amostral= 13,1 10 = 3,1 > 2,8 item certo. Nota: calculemos a varincia como se fosse a varincia da populao:

    1182 =i

    ix 8,1110

    1181 2 ==i

    ixn

    Mdia dos quadrados = 11,8 Quadrado da mdia = 9 Varincia = mdia dos quadrados quadrado da mdia = 11,8 9 = 2,8 voc julgaria que o item errado pela conta aproximada. Neste caso, o erro de aproximao (3,1 2,8) = 0,3, correspondente a aproximadamente 10% do valor da varincia amostral (significativo!). O erro percentual da conta aproximada grande porque o nmero de amostras (n=10) pequeno. GABARITO: C

    Varivel X Frequncia relativa

    0 0,10

    1 0,20

    2 0,30

    3 0,40

    (SEAD-CPC/Cespe-UnB/2007/Adaptada) Considerando a tabela acima, que apresenta as freqncias relativas de uma varivel X, relativa a uma contagem, julgue os itens a seguir.

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    39

    12. A mdia de X inferior a 1,5. Resoluo

    = ii pXX , em que pi denota a frequncia relativa de Xi.

    0,22,16,02,00)40,03()30,02()20,01()10,00( =+++=+++=X inferior a 1,5. Item certo. GABARITO: E 13. O desvio-padro de X inferior a 1,5. Resoluo

    = 22)( XpXXVaa ii = mdia dos quadrados quadrado da mdia

    [ ] 0,146,32,12,002)40,03()30,02()20,01()10,00()( 22222 =+++=+++=XVar

    0,1)()( == XVarXDP item certo. GABARITO: C 14. A moda e a mediana de X so iguais a 3. Resoluo

    Varivel X Frequncia relativa Frequncia relativa

    acumulada

    0 0,10 0,10

    1 0,20 0,30

    2 0,30 0,60

    3 0,40 1,00

    O valor de maior frequncia 3,0 moda = 3. A mediana 2, haja vista que a frequncia acumulada at X=1 30% e at X=2 60%. Item errado. GABARITO: E

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    40

    15. O coeficiente de variao de X superior a 1. Resoluo

    5,02

    1)(===

    X

    XDPCVx inferior a 1. Item errado.

    GABARITO: E (MI-CENAD/ESAF/2012/Adaptada) A distribuio de frequncias em classes do salrio mensal x, medido em nmero de salrios mnimos, de uma amostra aleatria de 50 funcionrios de uma empresa, apresentado a seguir.

    x f

    mais de 0 a 10 22

    mais de 10 a 20 13

    mais de 20 a 30 10

    mais de 30 a 40 3

    mais de 40 a 50 2

    16. Usando os dados acima, obtenha o valor mais prximo da varincia amostral do salrio mensal. (A) 121,5

    (B) 124

    (C) 126,5

    (D) 129

    (E) 131,5 Resoluo

    ponto mdio da classe

    f

    5 22

    15 13

    25 10

    35 3

    45 2

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    41

    Soma das frequncias 50

    Mdia aritmtica:

    0,1550

    750

    50

    )245()335()1025()1315()225(==

    ++++=X

    Varincia Amostral:

    2

    1

    2

    11

    1)( X

    n

    nXf

    nXVar

    k

    i

    ii

    = =

    Varincia Amostral de X = Soma dos Quadrados/(n1) Mdia de X

    ao Quadrado corrigida pelo fator n/(n1)

    Xi (Xi)2 fi fi.(Xi)2

    5 25 22 550

    15 225 13 2.925

    25 625 10 6.250

    35 1.225 3 3.675

    45 2.025 2 4.050

    Soma n=50 17.450

    53,12659,22912,3561549

    50450.17

    49

    1)( 2 ==

    =XVar

    E o valor mais prximo da varincia amostral 126,5 (alternativa C). Nota (pegadinha da banca!): como n = 50 > 30, o valor aproximado da varincia amostral

    12422534915450.1750

    11)( 22

    1

    2 === =

    XXfn

    XVark

    i

    ii opo B!

    Voc teria errado a questo se tivesse efetuado o clculo aproximado da varincia amostral. E a? Ser que existe algum problema com a frmula aproximada da varincia amostral?

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    42

    Fique tranquilo(a)! No h nenhum problema com a frmula aproximada da varincia amostral. A frmula pode ser aplicada, desde que voc tome as devidas precaues. Este problema mostra que voc dever estar atento s alternativas das questes da sua prova. Observe que o erro de aproximao () do resultado obtido pela frmula aproximada pequeno:

    %202,053,126

    53,2

    53,126

    12453,126===

    =

    Contudo, a banca imps, por meio de uma escolha cuidadosa das alternativas, o clculo da varincia amostral pela frmula correspondente. GABARITO: C 17. (ATRFB/ESAF/2012) A varincia da amostra formada pelos valores 2, 3, 1, 4, 5 e 3 igual a (A) 3

    (B) 2

    (C) 1

    (D) 4

    (E) 5

    Resoluo Se os k valores distintos },...,,{ 21 kxxx de uma amostra X ocorrem com as

    frequncias },...,,{ 21 kfff , respectivamente (=

    =k

    i

    i nf1

    ), ento a varincia dessa

    amostra dada por =

    =k

    i

    ii xxfn

    XVar1

    2)(1

    1)( , em que )(XVar denota a varincia

    e x representa a mdia amostral. Clculo da mdia e da varincia amostral:

    valor (x) frequncia (fi) xi.fi xi2.fi

    1 1 1x1 = 1 12x1 = 1 2 1 2x1 = 2 22x1 = 4 3 2 3x2 = 6 32x2 = 18 4 1 4x1 = 4 42x1 = 16 5 1 5x1 = 5 52x1 = 25 fi = n = 6 xi.fi = 18 xi2.fi = 64

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    43

    36

    18

    6

    )15()14()23()12()11(1

    1

    ==++++

    == =

    k

    i

    ii fxn

    x

    5

    ])35(1[])34(1[])33(2[])32(1[])31(1[)(

    1

    1)(

    22222

    1

    2 ++++=

    = =

    k

    i

    ii xxfn

    XVar

    25

    41014)( =

    ++++=XVar opo B

    A varincia amostral tambm pode ser calculada pela frmula,

    Varincia Amostral = Soma dos Quadrados/(n1) Quadrado da Mdia corrigido pelo fator n/(n1)

    25

    10

    5

    5464

    5

    96

    5

    64

    11

    1)( 2

    1

    2 ==

    =

    =

    = =

    xn

    nxf

    nXVar

    n

    i

    ii

    GABARITO: B (ANCINE/CESPE-UnB/2013) Considerando os mtodos descritivos, julgue os itens a seguir. 18. Suponha que A = 5 x I, em que A e I representam, respectivamente, a amplitude total e o intervalo interquartlico de um conjunto de dados. Em face dessa hiptese, sabendo que no existem outliers no extremo inferior da distribuio, infere-se que a distribuio desses dados simtrica. Resoluo No h como inferir que a distribuio dos dados necessariamente simtrica a partir dos elementos fornecidos pelo item. Se o item tivesse fornecido, pelo menos, um boxplot do conjunto de dados, a teramos condies de analisar a simetria da distribuio. Item errado. GABARITO: E 19. Para o conjunto de dados 1, 1, 1, , 1, 1, 1, o desvio mediano absoluto, que se define como | , , |, positivo. Resoluo A mediana do conjunto de dados 1, 1, 1, , 1, 1, 1 igual a 1, pois 1. Portante, , , 1.

  • A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3

    Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II

    Prof. Alexandre Lima

    www.pontodosconcursos.com.br | Prof. Alexandre Lima

    44

    O conjunto formado pelas distncias entre cada observao e a mediana do conjunto de observaes (| , , |) dado por

    |1 1|, , |1 1| 0, 0, 0 , 0, 0, 0 todos os elementos so nulos A mediana do conjunto acima igual a zero. Por conseguinte, o desvio mediano absoluto do conjunto original de dados 1, 1, 1, , 1, 1, 1 tambm igual a zero. Item errado. GABARITO: E Abraos e at a prxima aula, Bons estudos, Alexandre Lima [email protected]