Aulas estatística descritiva - Unesp

download Aulas estatística descritiva - Unesp

of 115

Transcript of Aulas estatística descritiva - Unesp

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    1/115

    ANLISE

    EXPLORATRIA DEDADOS

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    2/115

    Populao o conjunto de elementos sobreos quais se desejam informaes.

    Finitas Infinitas

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    3/115

    AmostraTodo subconjunto de elementosretirados de uma populao, para

    obter informaes sobre essapopulao.

    Parmetro: Caracterstica Numrica da Populao.

    Estatstica:Caracterstica numrica da amostra.

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    4/115

    Censos

    Recenseamento:

    Quando so coletados dados sobre todosos elementos da populao.

    Censo:Conjunto de dados obtidos pelorecenseamento.

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    5/115

    Amostragem

    Probabilstica:

    Todos os elementos da populao

    apresentam probabilidade conhecida, ediferente de zero, de pertencer a amostra.

    No probabilstica:So realizadas pela simplicidade ou porimpossibilidade de se obter amostras

    probabilsticas.

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    6/115

    Amostragem Probabilstica

    Amostragem Casual simples: o equivalente a um sorteio lotrico. Todos oselementos da populao tm igual probabilidade

    de pertencer a amostra.

    Amostragem Sistemtica:Quando os elementos da populao seapresentam ordenados e a retirada doselementos da amostra feita periodicamente.

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    7/115

    Amostragem Probabilstica

    Amostragem por Conglomerado:Quando a populao apresenta subdiviso empequenos grupos, conglomerados, as unidades

    de amostragem sero os conglomerados.

    Amostragem Estratificada:Quando a populao se subdivide emsubpopulaes ou estratos, a varivel deinteresse apresenta comportamento homogneo

    entre os estratos e Heterogneo entre os estratos.

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    8/115

    Amostragem No-Probabilstica

    Inacessibilidade a toda a populao:

    Populao-objeto:

    A que temos em mente ao realizar o trabalhoestatstico.

    Populao amostrada:

    Parte da populao acessvel para se retirar aamostra.

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    9/115

    Amostragem No-Probabilstica

    Amostragem a esmo ou sem norma:Utiliza a aleatoriedade sem realizar o sorteio

    Populao formada por materialcontnuo (lquido, gasoso ou slido): feita a homogeneizao do material e retirada a amostraaesmo.

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    10/115

    Amostragem No-Probabilstica

    Amostragem Intencionais: feito um pr julgamento e escolhido determinados

    elementos considerados bem representativos dapopulao.

    Amostragem por Voluntrios

    No tem como se escolher os elementos que faro parteda amostra.

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    11/115

    ANLISEEXPLORATRIA DEDADOS

    Organizando os Dados

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    12/115

    Organizando os Dados

    Dados Brutos:Material obtido na coleta de dados, geralmentedifceis de serem entendidos.

    Dados Elaborados:So obtidos aps a organizao do dos dadosbrutos, o material pronto para anlise.

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    13/115

    Organizando os Dados

    Apurao dos Dados:

    Varivel Nominal ou Ordinal (contagem porcategoria).

    Varivel Quantitativa (devem ser anotados todos osvalores observados)

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    14/115

    Organizao das Distribuies

    de FrequnciasDados Nominais:

    Desempenho Frequncia

    Inferior 9

    Mdio 14Superior 4

    Total 27

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    15/115

    Frequncias

    Frequncias Relativas:

    Desempenho Frequncia Freqncia Relativa

    Inferior 9 33,3 %

    Mdio 14 51,9 %

    Superior 4 14,8 %

    Total 27 100,0 %

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    16/115

    Frequncias

    Frequncias Acumuladas:

    Escore Frequncia Frequncia Acumulada

    0 0 0

    1 0 0

    2 0 03 2 2

    4 12 14

    5 26 40

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    17/115

    Frequncias

    Frequncias Relativas Acumuladas:

    Escore Frequncia FrequnciaRelativa FrequnciaAcumulada Frequncia RelativaAcumulada

    0 0 0 % 0 0 %

    1 0 0 % 0 0 %

    2 0 0 % 0 0 %

    3 2 5 % 2 5 %4 12 30 % 14 35 %

    5 26 65 % 40 100 %

    Total 40 100 % 40 100 %

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    18/115

    Organizao dos dados

    Contnuos em Classes7 18 111 25 101 85 81 75 100

    95 98 108 100 94 34 99 84 90

    95 102 96 105 100 107 117 96 17

    7 25 81 90 95 98 100 102 108

    17 34 84 94 96 99 100 105 111

    18 75 85 95 96 100 101 107 117

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    19/115

    Organizao dos dados

    Contnuos em Classesi = raiz n ou i = 1+ 3,3 log n

    hi = AT / iClasses Valor Central Frequncia

    7 29 18 4

    29 51 40 1

    51 73 62 0

    73 95 84 6

    95117 106 16

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    20/115

    ANLISEEXPLORATRIA DEDADOS

    Estatstica DescritivaMedidas de PosioMedidas de Disperso

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    21/115

    Tem por objetivo sintetizar a informao contida emum conjunto de dados

    Estatstica Descritiva

    Utilizamos de determinadas medidas numricasdescritivas que procuram sumariar o conjunto dedados em um nico nmero

    Medidas de Posio e Medidas de Disperso

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    22/115

    Grandeza numrica que descreve um conjunto dedados, pela indicao da posio do conjunto naescala de valores possveis que a varivel podeassumir

    Medidas de Posio ou de Tendncia Central

    Valores tpicos que tendem a se localizar em umponto central do conjunto de dados ordenados

    Medidas de Posio:Mdia,Mediana eModa

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    23/115

    a mais conhecida

    Mdia

    definida como:

    Exemplo:

    1,69 1,64 1,62 1,69 1,81 1,61 1,58 1,64

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    24/115

    Mdia

    1,69 1,64 1,62 1,69 1,81 3,61 1,58 1,64

    A mdia altamente influenciada por valores extremos(outliers)

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    25/115

    o valor que divide o conjunto de dados em doissubconjuntos de mesmo nmero de elementos

    Mediana

    1,69 1,64 1,62 1,69 1,81 1,61 1,58 1,64

    o valor que divide a distribuio ao meio

    Primeiramente devemos ordenar os valores

    Exemplo:

    1,58 1,61 1,62 1,64 1,64 1,69 1,69 1,81

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    26/115

    S e n par, somo os valores centrais e divido por 2

    Mediana

    1,58 1,61 1,62 1,64 1,64 1,69 1,69 1,81

    S e n impar, a mediana o valor central

    1,58 1,61 1,62 1,64 1,64 1,69 1,69

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    27/115

    A mediana no afetada por outliers

    Mediana

    1,69 1,64 1,62 1,69 1,81 3,61 1,58 1,64

    Ordenando:

    1,58 1,62 1,64 1,64 1,69 1,69 1,81 3,61

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    28/115

    Mediana para dados agrupados

    1. calcula-se a F;

    2. dividir n/2;

    3. a F que se igualar ou exceder n/2, ser a classemediana.

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    29/115

    Mediana para dados agrupados com intervalos declasse

    h

    f

    FN

    lMed

    c

    i .2

    1

    li - limite inferior da classe mediana;

    N - nmero de observaes;

    F-1 - freq. acum. anterior classe mediana;

    fc - freq abs. Simples da classe mediana;

    h - amplitude de classe.

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    30/115

    o valor que ocorre com mais frequncia em umconjunto de dados

    Moda

    1,69 1,64 1,62 1,69 1,81 1,61 1,58

    Primeiramente devemos ordenar os valores

    Exemplo 1:

    1,58 1,61 1,62 1,69 1,69 1,81

    Moda para dados simples

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    31/115

    Moda para dados simples

    Exemplo 2:

    1,58 1,61 1,62 1,62 1,69 1,69 1,81

    Exemplo 3:

    1,58 1,61 1,62 1,69 1,81

    A moda no influenciada por outliers

    Amodal

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    32/115

    Moda para dados agrupados

    Quando as classes tm amplitudes iguais, a classemodal a que tem a maior freq. absoluta simples.

    Salrio f

    12 7

    14 20

    16 33

    18 2520 11

    22 4

    Total 100

    Mo= 16

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    33/115

    Moda para dados agrupados com intervalo declasse

    li - limite inferior da classe modal;

    d1 - diferena entre a freqncia simples da classemodal e a anterior; d2 - diferena entre a freqncia simples da classe

    modal e a posterior; h - amplitude de classe.

    Moda l d

    d dh

    i

    1

    1 2

    .

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    34/115

    Moda para dados agrupados com intervalo declasse

    Salrio f

    140 - 160 7

    160 - 180 20

    180 - 200 33

    200 - 220 25

    220 - 240 11

    240 - 260 4Total

    Mo=?

    Moda l d

    d d hi

    1

    1 2.

    Mo=192,38

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    35/115

    Quando uma distribuio simtrica, as trsmedidas coincidem

    Relao entre a Mdia, Mediana e Moda

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    36/115

    Assimtrica direita

    Relao entre a Mdia, Mediana e Moda

    Assimtrica esquerda

    Quando os valores so diferentes a distribuio assimtrica

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    37/115

    As medidas de posio no informam sobre avariabilidade dos dados e so insuficientes parasintetizar as informaes de um conjunto de dados

    Medidas de Disperso

    Exemplo:

    100 100 100 100 100 100 100

    80 90 100 100 100 110 120

    10 50 100 100 100 150 190

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    38/115

    uma grandeza numrica que descreve umconjunto de dados pela quantificao davariabilidade ou heterogeneidade neles presente

    Medidas de Disperso

    Medidas de disperso: Amplitude total, varincia,desvio padro, coeficiente de variao

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    39/115

    a diferena entre o maior e o menor valorobservado

    Amplitude Total

    1,69 1,64 1,62 1,69 1,81 1,61 1,58 1,64

    Primeiramente devemos ordenar os valores

    Exemplo:

    1,58 1,61 1,62 1,64 1,64 1,69 1,69 1,81

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    40/115

    altamente influenciado por outliers

    Amplitude Total

    1,58 1,62 1,64 1,64 1,69 1,69 1,81 3,61

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    41/115

    Varincia

    Baseia-se nos desvios em relao a mdia

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    42/115

    Varincia

    1,69 1,64 1,62 1,69 1,81 1,61 1,58 1,64

    Exemplo:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    43/115

    Varincia para dados agrupados

    21

    2

    1

    2)( xfxfxxXVar i

    k

    i

    ii

    k

    i

    i

    1

    )( 22

    2

    n

    n

    fxfx

    S

    ii

    ii

    1

    )...(...

    2

    112

    1

    2

    12

    n

    n

    fxfxfxfx

    S

    nnnn

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    44/115

    Varincia para dados agrupados

    1

    )...(...

    2

    112

    1

    2

    12

    n

    n

    fxfxfxfx

    Snnnn

    (xi) fi

    1,58 11,61 1

    1,62 1

    1,64 21,69 2

    1,81 1

    Total 81

    ))1(81,1...)1(58,1(1)81,1(...1)58,1(

    222

    2

    n

    nS

    0051,02 S

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    45/115

    Varincia para dados agrupados com intervalosde classe

    1

    ))3(172...)4(152(1)172(...4)152(

    222

    2

    n

    nS

    2

    S

    i valores xi fi1 150-154 152 4

    2 154-158 156 9

    3 158-162 160 11

    4 162-166 164 85 166-170 168 5

    6 170-174 172 3

    40

    31,79

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    46/115

    Desvio Padro

    Sendo a varincia calculada a partir dos quadradosdos desvios, ela um nmero em unidadequadrada

    O desvio padro tem utilidade e interpretaoprtica

    Exemplo:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    47/115

    Coeficiente de Variao

    A varincia e o desvio padro podem noquantificar em algumas situaes a variabilidadepresente em um conjunto de dados

    Exemplo:

    50 70 60 80

    470 490 460 480

    90,12

    475

    S

    x

    90,12

    65

    S

    x

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    48/115

    3.2.3. Coeficiente de Variao

    O CV uma medida que caracteriza a dispersodos dados em termos relativos a seu valor mdio

    1,69 1,64 1,62 1,69 1,81 1,61 1,58 1,64

    Exemplo:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    49/115

    Erro padro da mdia

    uma medida que d a preciso com que a mdiapopulacional est sendo estimada.

    1,69 1,64 1,62 1,69 1,81 1,61 1,58 1,64

    Exemplo:

    S

    S X n

    08606,08

    0713,0)( xS

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    50/115

    Coeficiente de Preciso

    uma medida mede o grau de preciso do erro padro damdia.

    1,69 1,64 1,62 1,69 1,81 1,61 1,58 1,64

    Exemplo:

    %100.)(

    x

    SCP

    x

    %18,5%100.66,1

    08606,0CP

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    51/115

    Interpretao Prtica

    O erro padro representou apenas 5,18%

    do valor mdio, conclu-se que a mdiapopulacional foi estimada com altapreciso, pois o erro relativo (CP) foi muitopequeno.

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    52/115

    40301010

    Mdia = 22,50

    Mediana (med) = 20

    Moda (mo) = 10varincia amostral (s2) = 225

    varincia populacional (2) = 168,75

    desvio padro amostral (s) = 15

    desvio padro populacional () = 12,99

    coeficiente de variao (CV%) = 66,67

    x

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    53/115

    40301010

    Mdia = 32,50Mediana (med) = 30

    Moda (mo) = 20

    varincia amostral (s2) = 225

    varincia populacional (2) = 168,75

    desvio padro amostral (s) = 15

    desvio padro populacional () = 12,99

    coeficiente de variao (CV%) = 46,15

    + 10

    50402020

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    54/115

    40301010

    Mdia = 45Mediana (med) = 40

    Moda (mo) = 20

    varincia amostral (s2) = 900

    varincia populacional (2) = 675

    desvio padro amostral (s) = 30

    desvio padro populacional () = 25,98

    coeficiente de variao (CV%) = 66,67

    x 2

    80602020

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    55/115

    40301010

    Mdia = 11,25Mediana (med) = 10

    Moda (mo) = 5

    varincia amostral (s2) = 56,25

    varincia populacional (2) = 42,18

    desvio padro amostral (s) = 7,5

    desvio padro populacional () = 6,49

    coeficiente de variao (CV%) = 66,67

    / 2

    201555

    40301010 + 10 50402020

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    56/115

    40301010

    x 2 80602020

    + 10 50402020

    Mdia = 22,50

    Mediana (med) = 20

    Moda (mo) = 10

    varincia amostral (s2) = 225

    varincia populacional (2) = 168,75

    desvio padro amostral (s) = 15

    desvio padro populacional () = 12,99

    coeficiente de variao (CV%) = 66,67

    Mdia = 32,50

    Mediana (med) = 30

    Moda (mo) = 20

    varincia amostral (s2) = 225

    varincia populacional (2) = 168,75

    desvio padro amostral (s) = 15

    desvio padro populacional () = 12,99

    coeficiente de variao (CV%) = 46,15

    Mdia = 45

    Mediana (med) = 40

    Moda (mo) = 20varincia amostral (s2) = 900

    varincia populacional (2) = 675

    desvio padro amostral (s) = 30

    desvio padro populacional () = 25,98

    coeficiente de variao (CV%) = 66,67

    Mdia = 11,25

    Mediana (med) = 10

    Moda (mo) = 5

    varincia amostral (s2) = 56,25

    varincia populacional (2) = 42,18

    desvio padro amostral (s) = 7,5

    desvio padro populacional () = 6,49

    coeficiente de variao (CV%) = 66,67

    / 2 201555

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    57/115

    Separatrizes

    QUARTIL : Qi

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    58/115

    Q1 Q2=md Q3

    0% 75% 100%50%25%

    Q1: Primeiro Quartil

    Q3: Terceiro Quartil

    Q2: Segundo Quartil = Mediana

    QUARTIL : Qi

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    59/115

    Distribuio de freqncias em classes :

    onde:

    lQi : limite inferior da classe que contm o i-simo Quartil

    n: tamanho da Amostra

    F

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    60/115

    ( i)

    Divide o conjunto de dados em 10 partes iguais

    onde:

    lDki: limite inferior da classe que contm o i-simo Decil

    n: nmero de elementos do conjunto de dados;

    F-Dki: frequncia acumulada das classes anteriores classe que contm o i-simoDecil;

    fDki

    : freqncia da classe que contm o i-simo Decil;

    hDki: amplitude da classe que contm o i-simo Decil.

    D1 D50%

    ik

    ik

    ik

    iki D

    D

    D

    Dk hf

    10

    n.

    lD

    F

    k

    10% 20% 40%30% 60%50% 80%70% 90% 100%

    D4D2 D6 D7 D8 D9D3

    D5= mediana

    Percentil (Pi)

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    61/115

    ( i)

    Divide o conjunto de dados em 100 partes iguais

    onde:

    LPki: limite inferior da classe que contm o i-simo Percentiln: nmero de elementos do conjunto de dados;

    F-Pki: frequncia acumulada das classes anteriores classe que contm o i-simoPercentil

    fPki: freqncia da classe que contm o i-simo Percentil

    hPki: amplitude da classe que contm o i-simo Percentil

    P1 P50=md0%

    ik

    ik

    ik

    iki P

    P

    P

    Pk h

    f

    100

    nk

    LP

    F

    1% 2% 3% 50% 98%97% 99% 100%

    P2 P97 P98 P99P3

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    62/115

    Medidas de forma

    Uma distribuio de freqncia podesimtrica, assimtrica positiva ou

    assimtrica negativa.

    Medidas de assimetria:

    Denomina-se assimetria o grau de desvio ouafastamento da simetria de uma distribuio.

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    63/115

    Medidas de forma

    Uma distribuio simtrica apresenta a igualdade entre as

    trs medidas de posio, mdia aritmtica, mediana emodo, ou:xx~M

    o

    xx

    ~

    Mo

    Em uma distribuio assimtrica positiva, ou assimtrica direita, tem-se que:

    Em uma distribuio assimtrica negativa, ou assimtrica esquerda, tem-se que:

    oMx~x

    Medidas de assimetria:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    64/115

    Medidas de forma

    Existem vrias frmulas para o clculo do coeficiente deassimetria, dentre elas duas so bastante utilizadas:

    - 1 Coeficiente de Pearson:s

    MxASou

    MxAS

    oo

    - 2 Coeficiente de Pearson:13

    31

    QQ

    x~2QQAS

    Se AS = 0, a distribuio simtrica

    AS > 0, a distribuio assimtrica positivaAS < 0. a distribuio assimtrica negativa.

    Medidas de assimetria:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    65/115

    Medidas de forma

    Exemplo: Identificar o grau de assimetria dadistribuio:

    Medidas de assimetria:

    Salrios

    ($1.000,00)

    30 50 50 100 100 150

    Empregados 80 50 30

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    66/115

    Medidas de forma

    Exemplo:

    Medidas de assimetria:

    Classes xi f

    i x

    ifi x

    i2fi F

    i

    [30,50[

    [50,100[

    [100,150[

    40

    75

    125

    80

    50

    30

    3200

    3750

    3750

    128000

    281250

    468750

    80

    130

    160

    160 10.700 878000 -

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    67/115

    11/09/2013 08:52

    Medidas de forma

    Exemplo:Medidas de assimetria:

    6,04090

    29040

    QQ

    x~2QQ

    AS96,31s

    796,096,31

    429,4185,66

    s

    MxAS62,1021

    160

    )700.10(000.878

    159

    1s

    502080

    )080(30x~429,4120

    34

    430M

    905050

    )80120(50Q62,1021160

    )700.10(000.8781591s

    402080

    )040(30Q875,66

    160

    700.10x

    13

    31

    o

    2

    2

    o

    3

    2

    2

    1

    - Como AS > 0, ento a distribuio assimtricapositiva.

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    68/115

    Medidas de forma

    Denomina-se curtose o grau de achatamentode uma distribuio.

    Uma distribuio de freqncia pode ser:- Mesocrtica: quando sua forma nem

    achatada e nem delgada;

    - Leptocrtica: quando apresenta a formadelgada;

    - Platicrdica: quando apresenta a formaachatada.

    Medidas de curtose:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    69/115

    Medidas de forma

    Medidas de curtose:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    70/115

    Medidas de forma

    Para medir o o grau de curtose utiliza-se o coeficiente:

    )PP(2

    QQK

    1090

    13

    onde Q3= 3 quartil; P90= 90 percentil;Q1= 1 quartil; P10= 10 percentil.

    SeK = 0,263a curva correspondente distribuio mesocrtica;

    K > 0,263a curva platicrdica;K < 0,263a curva leptocrdica.

    Medidas de curtose:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    71/115

    Medidas de forma

    Exemplo: Para a mesma distribuio do exemplo daassimetria, calcula-se ainda P10eP90; logo:

    Medidas de curtose:

    355,0)34375,104(2

    4090

    )PP(2

    QQK

    375,10450160

    )130144(100P

    342080

    )016(30P

    1090

    13

    90

    10

    - Como K > 0,263, ento a distribuio do tipoplaticrtica.

    TABELAS

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    72/115

    TABELA ou SRIES:

    um quadro que resume um conjunto de observaes.Exemplo:

    PRODUO DE CAFBRASIL1991-1995

    ANOS PRODUO(1.000 t)

    1991 2.5351992 2.6661993 2.1221994 3.7501995 2.007

    TTULO

    CABEALHO

    COLUNANUMRICA

    CASA OU CLULA

    LINHAS

    FONTE: IBGE.

    CORPO

    COLUNAINDICADORA

    RODAP

    CABEALHO

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    73/115

    PRINCIP IS TIPOS

    DE

    T BEL S ou SRIES

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    74/115

    TABELAS OU SRIES HISTRICAS,CRONOLGICAS OU TEMPORAIS.

    Descrevem os valores da varivel, em determinado local,discriminados segundo intervalos de tempo variveis.

    Exemplo:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    75/115

    SRIES GEOGRFICAS, ESPACIAIS,TERRITORIAIS.

    Descrevem os valores da varivel, em determinado instante,discriminados segundo regies.

    Exemplo:

    SRIES ESPECFICAS

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    76/115

    SRIES ESPECFICAS

    Descrevem os valores da varivel, em determinado tempo e

    local, discriminados segundo especificaes ou categorias.Exemplo:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    77/115

    SRIES CONJUGADAS OU TABELA DE DUPLAENTRADA

    Muitas vezes temos necessidade de apresentar, em umanica tabela, a variao de valores de mais uma varivel, isto, fazer uma conjugao de duas ou mais tabelas.

    Exemplo:

    DISTRIBUIO DE FREQUNCIA

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    78/115

    DISTRIBUIO DE FREQUNCIAPara variveis qualitativas: Sua distribuio usa diviso decategorias para melhorar a visualizao da distribuio de dados.

    Para variveis quantitativas: Suaconstruo usa faixa de dados em

    intervalos de classe que aumentama informao visual na distribuiode freqncias.Exemplo:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    79/115

    GRFICOS

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    80/115

    GRFICO EM LINHA

    0

    10

    20

    30

    40

    5060

    70

    80

    90

    100

    1 Trim 2 Trim 3 Trim 4 Trim

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    81/115

    GRFICO EM COLUNAS OU EM BARRAS SIMPLES

    010

    20

    30

    40

    50

    60

    70

    80

    90

    1 Trim 2 Trim 3 Trim 4 Trim

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    82/115

    GRFICO EM COLUNAS OU EM BARRAS MLTIPLAS

    0

    10

    20

    30

    40

    50

    60

    70

    80

    90

    1 Trim 2 Trim 3 Trim 4 Trim

    Leste

    Oeste

    Norte

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    83/115

    GRFICO EM SETORES

    Leste

    Oeste

    Norte

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    84/115

    CARTOGRAMA

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    85/115

    PICTOGRAMA

    HISTOGRAMA:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    86/115

    HISTOGRAMA:

    formado por um conjunto de retngulos justapostos, cujas

    bases se localizam sobre o eixo horizontal, de tal modo queseus pontos mdios coincidam com os pontos mdios dosintervalos de classe.

    POLGONO DE FREQNCIA:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    87/115

    POLGONO DE FREQNCIA:

    um grfico em linhas, sendo as freqncias marcadas sobre

    perpendiculares ao eixo horizontal, levantadas pelos pontosmdios dos intervalos de classe.

    POLGONO DE FREQNCIA ACUMULADA:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    88/115

    POLGONO DE FREQNCIA ACUMULADA:

    traado marcando-se as freqncias acumuladas sobre

    perpendiculares ao eixo horizontal, levantadas nos pontoscorrespondentes aos limites superiores dos intervalos declasse.

    O t A t G fi d D d

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    89/115

    Diagrama de pontos

    Um diagrama de pontos um grfico estatstico que consisteem grupos de pontos de dados traados em uma escalasimples.

    So utilizados para dados contnuos, quantitativos eunivariados, e so muito teis para exibir um pequenoconjunto de dados.

    Esse tipo de grfico permite uma fcil visualizao de duascaractersticas dos dados: a posio (meio) e a disperso(espalhamento ou variabilidade)

    Outras Apresentaes Grficas de Dados

    O tras Apresentaes Grficas de Dados

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    90/115

    Diagrama de pontos

    Exemplo 01 (Montgomery, 2004, p.2-3): Um engenheiro estprojetando um conector de nilon para ser usado em aplicaoautomotiva. Ele considera estabelecer como especificao do

    projeto uma espessura de 3/32 pol., mas est inseguro. Oitounidades do prottipo so produzidas e suas foras de remooso medidas, resultando nos seguintes dados (em libras): 12,6;12,9; 13,4; 12,3; 13,6; 13,5; 12,6 e 13,1. Construa umdiagrama de pontos para esses dados.

    Outras Apresentaes Grficas de Dados

    Outras Apresentaes Grficas de Dados

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    91/115

    Diagrama de caixa (box plot)

    Outras Apresentaes Grficas de Dados

    Uma outra forma grfica de apresentar os dados o chamadodiagrama de caixa (box plot) ou diagrama de caixa e linhas(box and whiskers), que permite descrever simultaneamente

    vrios fatores importantes de uma srie de dados, tais como atendncia central (mdia ou mediana), a disperso (desvio-padro), a possibilidade de detectar outliers (pontos bastantediferentes do conjunto de dados) e o desvio da simetria.

    Um diagrama de caixa apresenta trs quartis, em uma caixaretangular, alinhados tanto horizontal como verticalmente;opcionalmente, pode apresentar a mdia.

    Diagrama de caixa (box plot)

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    92/115

    Diagrama de caixa (box plot)

    A caixa inclui a amplitude interquartil, com o canto esquerdo(ou inferior) no primeiro quartil, Q1, e o canto direito (ousuperior) no terceiro quartil, Q3. Portanto, o comprimento dacaixa igual a amplitude interquartil , DQ= Q3 - Q1.

    Uma linha desenhada atravs da caixa, no segundo quartil

    (que o percentil 50 ou a mediana), Q2. A mdia, como jdito, opcional.

    Uma linha (whisker) estende-se de cada extremidade da caixa.

    A linha inferior (ou esquerda) comea no primeiro quartil indoat o menor valor do conjunto de pontos dentro das amplitudesinterquartis de 1,5, a partir do primeiro quartil.

    Outras Apresentaes Grficas de Dados

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    93/115

    Diagrama de caixa (box plot)

    Outras Apresentaes Grficas de Dados

    A linha superior (ou direita) comea no terceiro quartil indoat o maior do conjunto de pontos dentro das amplitudesinterquartis de 1,5, a partir do terceiro quartil.

    Dados mais afastados dos que as linhas so plotados comopontos individuais. Um ponto alm da linha, porm a menosde 3 amplitudes interquartis a partir da extremidade da caixa, chamado de dispersos (outliers).

    Um ponto a mais de 3 amplitudes interquartis a partir daextremidade da caixa chamado de um outlier extremo.Ocasionalmente, smbolos diferentes (crculos abertos efechados, por exemplo) so usados para identificar os doistipos de outlier.

    Outras Apresentaes Grficas de Dados

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    94/115

    Diagrama de caixa (box plot)

    Outras Apresentaes Grficas de Dados

    Outras Apresentaes Grficas de Dados

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    95/115

    Diagrama de caixa (box plot)

    Outras Apresentaes Grficas de Dados

    Exerccio: Represente o diagrama de caixa para os dados daresistncia compresso do alumnio mostrados no exerccioanterior.

    N = 80Min = 76Max = 245Mdia = 162,7Mediana = 161,5

    Q1= 143,50Q3= 181,00

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    96/115

    Anlise Bidimensional

    Anlise Bidimensional

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    97/115

    Anlise Bidimensional

    Freqentemente estamos interessados em analisar duasvariveis conjuntamente.

    Quando consideramos duas variveis, podemos ter 3

    situaes e as tcnicas de anlise so diferentes.a) as duas qualitativas (tabela de contingncia)

    b) as duas quantitativas (grficos de disperso)

    c) uma qualitativa e outra quantitativa (tabela decontingncia)

    possvel quantificar a relao entre as variveis emestudo

    Variveis Qualitativas

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    98/115

    Variveis Qualitativas

    Analisamos o comportamento conjunto de:

    X: grau de instruo e

    Y: regio de procedncia.

    Tabela 1- Tabela de freqncias absolutas das variveis X e Y

    Tabela de dupla entrada

    Y\XEnsino

    Fundamental Ensino Mdio Superior Total

    Capital 4 5 2 11

    Interior 3 7 2 12

    Outra 5 6 2 13

    Total 12 18 6 36

    Podemos construir tabelas de freqncias relativas.

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    99/115

    Y\XEnsino

    Fundamental Ensino Mdio Superior Total

    Capital 11% 14% 6% 31%

    Interior 8% 19% 6% 33%

    Outra 14% 17% 6% 36%

    Total 33% 50% 17% 100%

    Tabela 1 - Tabela de freqncias relativas ao total geral das variveisX e Y

    Relativa ao total geral

    11% dos empregados vm da capital e tem ensino fundamental.

    31% dos indivduos vm da capital, 33% do interior e 36% de outrasregies.

    33% tem ensino fundamental.

    Existe vrias possibilidades de construo e depende do objetivo doproblema.

    Relativa ao total de colunas

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    100/115

    Tabela 1:Tabela de freqncias relativas ao total de coluna das

    variveis X e Y

    Relativa ao total de colunas

    Entre os empregados com instruo at o ensino fundamental, 33%vm da capital.

    Entre os empregados com ensino mdio, 28% vm da capital.Comparamos a distribuio da procedncia conforme o grau deinstruo.

    De modo anlogo, podemos construir a distribuio do grau deinstruo conforme a procedncia.!!!

    Y\XEnsino

    Fundamental Ensino Mdio Superior Total

    Capital 33% 28% 33% 31%

    Interior 25% 39% 33% 33%

    Outra 42% 33% 33% 36%

    Total 100% 100% 100% 100%

    G fi 1 Di ib i d i d d i d

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    101/115

    0%

    10%

    20%

    30%

    40%50%

    60%

    70%

    80%

    90%

    100%

    Ensino

    Fundamental

    Ensino Mdio Superior Total

    Outra

    Interior

    Capital

    Grfico 1- Distribuio da regio de procedncia por grau deinstruo

    Associao entre variveis qualitativas

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    102/115

    Exemplo: Queremos verificar se existe ou no associao entre o sexo(X) e a carreira escolhida (Y) por 200 alunos de agronomia e zootecnia.

    Y\X Masculino Feminino Total

    Agronomia 85 (61%) 35 (58%) 120 (60%)

    Zootecnia 55 (39%) 25 (42%) 80 (40%)

    Total 140 (100%) 60 (100%) 200 (100%)

    Tabela 4:Tabela de freqncias absolutas (relativas) dos alunos segundo osexo (X) e curso escolhido (Y)

    Independente do sexo 60% preferem agronomia e 40% preferemzootecnia.

    No sexo masculino essas propores so 61% e 39% e no feminino 58e 42%, as quais so prximas de 60 e 40 (marginais)

    Forte indcio de no haver dependncia entre as variveis sexo e curso(no associadas)

    Exemplo: Queremos verificar se existe ou no associao entre o sexo (X) e

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    103/115

    Exemplo: Queremos verificar se existe ou no associao entre o sexo (X) ea carreira escolhida (Y) por 200 alunos de Agronomia e Zootecnia.

    Tabela 5:Tabela de freqncias absolutas (relativas) dos alunos segundo osexo (X) e curso escolhido (Y)

    Independente do sexo 60% preferem Agronomia e 40% preferem

    Zootecnia.No sexo masculino essas propores so 71% e 29% e no feminino 33e 67%. Disparidade bem acentuada nas propores

    Forte indcio de haver dependncia entre as variveis sexo e curso(associadas)

    Y\X Masculino Feminino Total

    Agronomia 100 (71%) 20 (33%) 120 (60%)Zootecnia 40 (29%) 40 (67%) 80 (40%)

    Total 140 (100%) 60 (100%) 200 (100%)

    Exemplo: Queremos verificar se a criao de determinado tipo de

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    104/115

    cooperativa est associada com algum fator regional.

    Tabela Valores observados do total de Cooperativas autorizadas afuncional por tipo e estado pesquisado.

    Estado Consumidor Produtor Escola Outras

    So Paulo 214 (33%) 237(37%) 78 (12%) 119 (18%) 648(100%)

    Paran 51(17%) 102(34%) 126(42%) 22 (7%) 301(100%)

    Rio G. do Sul 111 (18%) 304(51%) 139(23%) 48(8%) 602(100%)

    Total 376(24%) 643 (42%) 343 (22%) 189 (12%) 1551(100%)

    Tipo de Cooperativa

    Total

    Notamos que existe certa associao entre as variveis.

    - Valor observado:

    Sem associao:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    105/115

    Tabela - Valores esperados assumindo independncia entre asvariveis tipo de cooperativa e fator regional.

    Estado Consumidor Produtor Escola Outras

    So Paulo 156 (24%) 272(42%) 142 (22%) 78 (12%) 648(100%)

    Paran 72(24%) 127(42%) 66(22%) 36 (12%) 301(100%)

    Rio G. do Sul 144 (24%) 254(42%) 132(22%) 72(12%) 602(100%)Total 376(24%) 643 (42%) 343 (22%) 189 (12%) 1551(100%)

    Tipo de Cooperativa

    Total

    Por exemplo: caso no houvesse associao, e, fosse esperado quecada estado tivesse 24% de escolas e 12% de outros tipos.

    Assim, o nmero esperado de cooperativas de consumidores noestado de So Paulo seria 648*0.24=156 e no Paran 301*0.24=72....

    A tabela com os valores esperados ficaria assim:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    106/115

    Tabela B:Valores esperados assumindo independncia entre asvariveis tipo de cooperativa e fator regional

    Notamos fortes discrepncias entre os valores observados (O), eesperados (E) assumindo que as variveis no fossem associadas.

    Estado Consumidor Produtor Escola Outras

    So Paulo 156 (24%) 272(42%) 142 (22%) 78 (12%) 648(100%)

    Paran 72(24%) 127(42%) 66(22%) 36 (12%) 301(100%)

    Rio G. do Sul 144 (24%) 254(42%) 132(22%) 72(12%) 602(100%)Total 376(24%) 643 (42%) 343 (22%) 189 (12%) 1551(100%)

    Tipo de Cooperativa

    Total

    Tabela A: Valor observado das Cooperativas autorizadas a funcionalpor tipo e estado.

    Estado Consumidor Produtor Escola Outras

    So Paulo 214 (33%) 237(37%) 78 (12%) 119 (18%) 648(100%)

    Paran 51(17%) 102(34%) 126(42%) 22 (7%) 301(100%)

    Rio G. do Sul 111 (18%) 304(51%) 139(23%) 48(8%) 602(100%)

    Total 376(24%) 643 (42%) 343 (22%) 189 (12%) 1551(100%)

    Tipo de CooperativaTotal

    Consumidor Produtor Escola Outras

    156 (24%) 272(42%) 142 (22%) 78 (12%)

    Tipo de Cooperativa

    Estado Consumidor Produtor Escola Outras

    So Paulo 214 (33%) 237(37%) 78 (12%) 119 (18%)

    Tipo de Cooperativa

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    107/115

    Uma medida de afastamento global pode ser dada pela soma de todasessas medidas. (Qui-quadrado de Pearson)

    Um valor grande de indica associao entre as variveis. No exemploacima temos:

    ( ) ( ) ( ) ( )

    72(24%) 127(42%) 66(22%) 36 (12%)

    144 (24%) 254(42%) 132(22%) 72(12%)

    376(24%) 643 (42%) 343 (22%) 189 (12%)

    Filas

    j

    ijijij

    Colunas

    i

    EEO1

    2

    1

    2 /)(

    2

    2

    24,17372/)7248(...156/)156214( 222

    ( ) ( ) ( ) ( )

    Paran 51(17%) 102(34%) 126(42%) 22 (7%)

    Rio G. do Sul 111 (18%) 304(51%) 139(23%) 48(8%)

    Total 376(24%) 643 (42%) 343 (22%) 189 (12%)

    O nmero de GL em tabelas assim calculado:

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    108/115

    GL = (nmero de linhas -1) x (nmero de colunas -1).

    Portanto:GL = (3 - 1) x (4 - 1) = 6Depois, consulta-se a tabela de Qui quadrado e verifica-se que

    = 20,51.

    Como o valor de obtido maior conclui-se que os desvios sosignificativos. Portanto, os quatro tipos de cooperativas sofreminfluncia dos diferentes estados. Assim sendo, a proporo decooperativas por grupo depende dos estados onde elas seencontram.

    2

    C

    2

    C

    Associao entre variveis quantitativas

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    109/115

    Quando as duas variveis so quantitativas podemos usar o mesmotipo de anlise para variveis qualitativas. (transformando as variveis)

    Uma ferramenta bastante til o grfico de disperso.Exemplo:

    Anos de Servio (X) Nmero de Clientes (Y)

    1 48

    2 50

    3 56

    4 52

    5 43

    6 60

    7 62

    8 58

    9 64

    10 72

    Tabela 8: Nmero de anos de servio (X) por nmero de clientes (Y)de agentes de uma companhia de seguros

    Notamos que medida que aumenta o tempo de servio, aumenta onmero de clientes, logo parece haver uma associao entre essasvariveis

    Grfico 2: Grfico de disperso para as variveis X: anos de

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    110/115

    0

    10

    20

    30

    40

    50

    60

    7080

    0 2 4 6 8 10 12

    Anos de Servio

    NmerodeCleintes

    Grfico 2: Grfico de disperso para as variveis X: anos deservio e Y: nmero de clientes

    0

    5

    10

    15

    20

    25

    0 2 4 6 8 10 12 -12

    -10

    -8

    -6

    -4

    -2

    0

    2

    4

    6

    8

    10

    0 2 4 6 8 10 12

    Grfico 3: Tipos de associaes entre duas variveis

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    111/115

    Coeficiente de correlao

    Em um conjunto de dados com n pares de valores para as variveisX e Y o coeficiente de correlao (r) que mede a dependncialinear entre elas calculado como:

    n

    i

    n

    i

    iiii

    n

    i

    iiii

    n

    i

    n

    i

    iiii

    n

    i

    iiii

    XY

    ynyxnx

    yxnyx

    yyxx

    yyxx

    r

    1 1

    22

    1

    1 1

    22

    1

    ](][[

    )(

    ])(][)([

    ))((Propriedades

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    112/115

    Simplificando:

    Os valores de r variam de 1 a +1

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    113/115

    Se r = +1 correlao perfeita e positivaSe r = -1correlao perfeita e negativa

    Se r = 0no h correlao linear

    Se r + 0,9correlao alta e positivaSe r + 0,5correlao mdia e positiva

    Se r + 0,1correlao baixa e positiva

    Se r - 0,1 correlao baixa e negativaSe r - 0,5 correlao mdia e negativa

    Se r - 0,9 correlao alta e negativa

    Os valores de r variam de 1 a +1

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    114/115

    Anos de Servio (X) Nmero de Clientes (Y)

  • 7/26/2019 Aulas estatstica descritiva - Unesp

    115/115

    1 48

    2 50

    3 56

    4 52

    5 43

    6 60

    7 62

    8 58

    9 64

    10 72