3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas:...

57
3.3. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1 , x 2 , . . . , x n . a) Média amostral: (ou média aritmética amostral) é representada por x e é dada soma das observações, divida pelo número de observações. n x x n i i 1 Exemplo 1: Sejam os dados: 2, 3, 6, 3, 5, 4, 3, 4, 2, 3, logo 35 10 1 i i x 5 , 3 10 35 x Propriedade: Se y = ax + b, então, para uma amostra x 1 , x 2 , . . . , x n , temos: n i b x a y i i , , 2 , 1 , , e b x a y

Transcript of 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas:...

Page 1: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

3.3. Medidas descritiva de variáveis quantitativas:

3.3.1. Medidas de Posição:

Considere uma amostra com n observações: x1, x2, . . . , xn.

a) Média amostral: (ou média aritmética amostral) é

representada por x e é dada soma das observações, divida pelo

número de observações.

n

xx

n

i i 1

Exemplo 1: Sejam os dados: 2, 3, 6, 3, 5, 4, 3, 4, 2, 3,

logo 3510

1

i

ix

5,310

35x

Propriedade:

Se y = ax + b, então, para uma amostra x1, x2, . . . , xn, temos:

nibxay ii ,,2,1, ,

e

bxay

Page 2: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Exemplo 2: Se Y = 2X − 1, então, temos os dados transformados:

3, 5, 11, 5, 9, 7, 5, 7, 3, 5 e 6010

1

i

iy

0,615,32 y

Note que, para duas variáveis x e x, se z = x/y, então:

y

xz

b) Mediana: representada por )(xmed , é dada pela observação

que ocupa a posição central das observações ordenadas.

Definição:

Estatística de ordem: a estatística de ordem i é dada pela i-ésima

observação ordenada, sendo representada por:

x(i), i = 1, 2, . . . , n,

ou seja:

i) x(1) é a primeira estatística de ordem, ou o valor mínimo da

amostra;

ii) x(n) é a n-ésima estatística de ordem ou o valor máximo da

amostra.

iii) x(i) é a i-ésima estatística de ordem, ou a i-ésima observação

ordenada;

Por exemplo, para i = 2, x(2) é a segunda estatística de ordem,

ou o segundo menor valor da amostra;

Page 3: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Desta forma, temos que as estatísticas de ordem fornecem a

amostra ordenada: x(1) x(2) . . . x(n)

Seja a amostra ordenada, x(1) x(2) . . . x(n), então, a posição

central é dada pela estatística de ordem

2

1n, portanto,

2

1)( nxxmed

Exemplo 3: Sejam os dados: 2, 3, 6, 3, 5, 4, 2, 5, 2 (n = 9).

Dados ordenados: 2, 2, 2, 3, 3, 4, 5, 5,

Então, 3)( 5 xxmed

Notas:

i) A mediana também é representada por x~ ;

ii) Se n é par, a mediana é dada pela média aritmética das duas

observações centrais.

Exemplo 4: Sejam agora: 2, 2, 2, 3, 3, 4, 4, 5, 5, 6 (n = 10).

Então, 5,32

43

2)(

)6()5(

5.5

xxxxmed

Page 4: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

c) Moda: representada por )(xmo , é observação da amostra com

maior frequência, ou seja, a que mais se repete.

Um conjunto de dados pode ter mais de uma moda, ou até

mesmo, não ter moda.

Em relação ao número de modas um conjunto de dados pode ser:

i) unimodal: quando o conjunto tem uma única moda;

ii) bimodal: quando o conjunto tem duas modas;

iii) multimodal: quando o conjunto tem três ou mais modas;

iv) amodal: quando o conjunto não tem moda (neste caso, todas

as observações aparecem uma única vez na amostra).

Exemplo 5: Com os dados: 2, 3, 6, 3, 5, 4, 3, 4, 2, 3

Então, 3)( xmo (aparece 4 na amostra)

O conjunto é unimodal.

d) Média Geométrica: MG(x) e é dada pela n-ésima raiz do

produto das n observações da amostra

nn

nn

ii xxxxxMG

21

/1

1

)(

Exemplo 6: Sejam os dados: 2, 3, 6, 3, 5, 4, 3, 4, 2, 3,

logo 15552010

1

i

ix

305,3155520)( 10 xMG

Page 5: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Obs:

i) para o cálculo da média geométrica, os valores devem ser todos

positivos e diferentes de zero;

ii) outra forma de apresentação da média geométrica é dada pela

relação:

n

xxxxMG n )log()log()log(

exp)( 21

n

iix

n 1

)log(1

exp

Exemplo 7: Com os dados anteriores, 9545,11)log(10

1

i

ix , e

305,310

9545,11exp)(

xMG

Propriedades:

i) Seja a amostra x1, x2, . . . , xn, então, )()( xMGaxaMG ;

Exemplo 8: Se y = 2x:

)(2610,6)( 10 xMG159252480yMG

ii) Sejam duas variáveis X e Y, então, )(

)(

yMG

xMG

y

xMG

.

Page 6: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Exemplo 9: Seja a amostra 13, 15, 18, 15, 19, 16, 15, 17, 14, 15 de

uma varável y, então

60615)( ,yMG

e, )(

)(2178,0

yMG

xMG

y

xMG

e) Média Harmônica: MH(x) e é dada pelo recíproco da média

aritmética dos inversos das observações

n

xxxxMH

n/1/1/1

1)(

21

nxxx

nxMH

111)(

21

n

ii

x

nxMH

1

1)(

Obs: também para o cálculo da média harmônica, os valores devem

ser todos positivos e diferentes de zero.

Exemplo 10: Sejam os dados: 2, 3, 6, 3, 5, 4, 3, 4, 2, 3,

logo 2,3110

1

i

ix

Page 7: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

125,32,3

10)( xMH

Propriedade:

Seja a amostra x1, x2, . . . , xn, então, )()( xMHaxaMH

Exemplo 11: Se y = 2x:

então, 6,1110

1

i

iy

)(225,66,1

10)( xMHyMH

3.3.2. Relações entre as medidas deposição

i) Relação de desigualdades entre as médias aritmética, geométrica

e harmônica

xxMGxMH )()(

Se todas as observações forem iguais, ( x1 = x2 = . . . = xn), temos

a igualdade

xxMGxMH )()(

ii) Relação empírica entre média aritmética, mediana e moda.

Karl Pearson, metemático famoso, no final do século XIX e

início do XX, observou empiricamente, a seguinte relação

entre as três medidas de posição média, mediana e moda:

Page 8: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

)(3)( xmedxxmox

ou, ainda

xxmedxmo 2)()(

Observações:

1) Se a distribuição dos dados for perfeitamente simétrica, então

)()( xmoxmedx ;

2) A relação só se aplica a distribuições com boa simetria;

3) Só é valida para casos unimodais;

4) Depende de um tamanho de amostra n elevado.

Page 9: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

3.3.3. Exemplos de medidas da posição

Exemplo 13: uma grande companhia está preocupada com o tempo

em que seus equipamentos ficam em manutenção na assistência

técnica. Assim sendo, fez um levantamento do tempo de

manutenção (dias) de 50 equipamentos para um estudo mais

detalhado.

X = dias em manutenção de equipamentos.

15 13 21 9 5 5 10 6 2 2

9 10 3 4 2 13 12 16 7 6

4 11 8 6 6 10 17 13 9 5

2 5 9 14 15 3 6 18 3 4

5 7 8 3 10 5 5 4 5 2

Dados Ordenados:

2 2 2 2 2 3 3 3 3 4

4 4 4 5 5 5 5 5 5 5

5 6 6 6 6 6 7 7 8 8

9 9 9 9 10 10 10 10 11 12

13 13 13 14 15 15 16 17 18 21

n = 50 observações

Medidas Descritivas de Posição:

i) Média: 3921 ni ix

84,750

392x dias (≈ 8 dias)

Page 10: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

ii) Mediana:

Determinando a posição da mediana

5,252

150

2

1

n

Logo, a mediana é dada pela média entre a 25ª e 26ª

observações ordenadas:

62

66

2)(

)26()25(

xxxmed dias

iii) Moda: mo(x) = 5 dias (aparece 5 na amostra)

o conjunto é unimodal.

iv) Média geométrica: 40

1

10895046,3

n

ii

x

4835610895046,3)(50/140 ,xMG dias

Como 46311,93)log(1

n

ii

x , temos, ainda,

4835,6e50

46311,93exp)( 8693,1

xMG dias.

Page 11: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

v) Média harmônica: 9,48111

1

n

ii

x

5,27379,4811

50)( xMH dias

Exemplo 14: Em 1798 o cientista Henry Cavendish mediu a

densidade do globo terrestre em 29 ensaios. Os dados foram

obtidos do Annals os Statistics, 1977.

X = densidade do globo terrestre (g/cm3).

5,50 5,61 4,88 5,07 5,26 5,55 5,36 5,29 5,58 5,65

5,57 5,53 5,62 5,29 5,44 5,34 5,79 5,10 5,27 5,39

5,42 5,47 5,63 5,34 5,46 5,30 5,75 5,68 5,85

Dados ordenados

4,88 5,07 5,10 5,26 5,27 5,29 5,29 5,30 5,34 5,34

5,36 5,39 5,42 5,44 5,46 5,47 5,50 5,53 5,55 5,57

5,58 5,61 5,62 5,63 5,65 5,68 5,75 5,79 5,85

n = 29 observações

Medidas Descritivas de Posição:

i) Média: 99.1571 ni ix 448,5

29

99,157x g/cm3

ii) Mediana:

Determinando a posição da mediana

152

30

2

1

n

Page 12: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Logo a mediana é a 15ª observação ordenada.

5,46)()15( xxmed g/cm3

iii) Moda: mo1(x) = 5,29 g/cm3 e mo2(x) = 5,34 g/cm3

o conjunto é bimodal.

vi) Média geométrica: 21

1

102,19065

n

ii

x

5,4435102,19065)(29/121 xMG g/cm3

Como 49,13848)log(1

n

ii

x , temos, ainda,

4435,5e29

49,13848exp)( 1,69443

xMG g/cm3.

vii) Média harmônica: 5,3317681

1

n

ii

x

5,43915,331768

29)( xMH g/cm3

Page 13: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Exemplo 15: Altura dos alunos das turmas A e B de Estatística 1 no

primeiro semestre de 2015.

X = altura dos alunos (em metros).

Dados ordenados

1,52 1,55 1,57 1,58 1,59 1,60 1,60 1,60 1,61 1,63

1,63 1,64 1,65 1,65 1,65 1,67 1,68 1,68 1,68 1,69

1,70 1,70 1,70 1,70 1,70 1,72 1,72 1,73 1,73 1,73

1,73 1,74 1,74 1,74 1,75 1,75 1,76 1,77 1,77 1,78

1,78 1,78 1,79 1,79 1,79 1,80 1,80 1,80 1,83 1,83

1,83 1,83 1,89 1,90 1,95

n = 55 observações

Dados:

52,94 ix ;

Calcule as medidas de posição: médias, mediana e moda.

Medidas Descritivas de Posição:

a) Média: xi = 94,52 7185,155

52,94x m

b) Mediana: 282

56

2

1

n, logo a mediana é dada por:

73,1)()28( xxmed m

c) Moda: mo(x) = 1,70m aparece 5 na amostra,

o conjunto é unimodal,

Page 14: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Médias Fonte: Wikipédia.

Arquitas de Tarento, um matemático pitagórico que floresceu

por volta de 400 a.C., definiu que existiam três tipos de média.

Um número m é:

i) a média aritmética de dois outros quando o excesso do

primeiro para o segundo é igual ao excesso do segundo para o

terceiro;

ii) a média geométrica quando a proporção do segundo para o

terceiro é igual à proporção do primeiro para o segundo, e

iii) a média harmônica quando a quantidade que o primeiro

excede o segundo em relação ao primeiro é igual à quantidade

que o segundo excede o terceiro em relação ao terceiro;1

Em notação moderna, sendo o primeiro x, o segundo m e o

terceiro y (x > m > y > 0):

ymmxaa (média aritmética)

y

m

m

x g

g

(média geométrica)

y

ym

x

mxhh

(média harmônica)

Page 15: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Após transformações, chegamos às fórmulas:

2

yxm

a

(média aritmética)

xymg (média geométrica)

yx

mh

11

2 (média harmônica)

Page 16: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

3.3.4. Medidas de Dispersão (ou variação):

a) Amplitude: é dada pela diferença entre o maior e o menor valor

da amostra.

Sejam ],,,[min 21)1( nx

xxxx e ],,,[max 21)( nx

n xxxx ,

então, a amplitude da amostra é definida por:

)1()( xxA n .

A amplitude A representa o tamanho da região na qual os dados

foram observados.

b) Variância amostral: a variância amostral é definida pela soma

dos quadrados dos desvios das observações em relação à media

amostral x , dividida por (n – 1), ou seja

n

i

i

n

xxs

1

22

1.

Mostra-se facilmente que s2 pode ser escrita como

1

21

22

n

xnxs

ni i .

c) Amplitude Interquartil: é dada pela diferença entre o 3º e o 1º

quartis.

Para definir a amplitude interquartil, vamos primeiro definir o

que são quartis amostrais,

Page 17: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Quartis amostrais são medidas descritivas que dividem a

amostra ordenada em quatro parcelas iguais de 25%, ou seja,

25% 25% 25% 25%

------------|------------|------------|------------

Q1 Q2 Q3

med(x)

Assim sendo:

i) Q1 é o primeiro quartil;

ii) Q2 = med(x), é o segundo quartil,

iii) Q3 é o terceiro quartil.

Desta forma, denotada por Aq, é definida por

Aq = Q3 – Q1

Aq determina o tamanho do intervalo em torno da mediana que

contém 50% das observações que ocupam a região central,

Métodos para a obtenção dos quartis amostrais

Para a obtenção dos quartis devemos proceder da mesma forma

que para a mediana.

Uma vez que a mediana esteja determinada, temos o conjunto

de dados ordenados dividido em duas partes. Os quartis, então, são

dados pelas observações centrais destas duas metades.

Page 18: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Q1 med(x) Q3

Observação central

da metade inferior

Observação central

da metade superior

O procedimento para encontrar os quartis é o mesmo usado

para a mediana, porém, teremos dois procedimentos dependendo

do tamanho da amostra n ser par ou ímpar.

i) Se o tamanho da amostra n for par: o procedimento é o mesmo

da mediana, sendo aplicada a cada uma das metades (inferior e

superior);

Exemplo 16:

Dados: 1 1 2 3 4 5 5 6 6 6 7 8 8 9 n = 14

5,52

6 5

2)(

)8()7(

xxxmed

A mediana med(x) = 5,5 divide os dados em dois grupos de 7

observações cada um. Assim,

42

17

Q1 é a 4ª observação da metade inferior e,

Q3 é a 4ª observação da metade superior.

Desta forma, os quartis serão as observações ordenadas que

ocupam as posições 4 e 7 + 4 = 11.

Page 19: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

5,5

1 1 2 3 4 5 5 6 6 6 7 8 8 9

3)4(1 xQ

7)11(3 xQ

ii) Se o tamanho da amostra n for ímpar: devemos optar por

incluir, ou não, a mediana nos cálculos para a determinação dos

quartis.

ii.1) se a mediana não for incluída, então teremos dois grupos,

inferior e superior à mediana, cada um com 2)1( n

observações

2

1n

observações

inferiores

2

1n

observações

superiores

Q1 med(x) Q3

e os quartis Q1 e Q3 são obtidos normalmente.

Exemplo 17:

Dados: 1 1 2 3 4 5 5 6 6 6 7 8 9 n = 13

A mediana 5)( )7( xxmed divide os dados em dois grupos

ordenados de 6 observações cada, e, os quartis serão as médias

Page 20: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

entre as observações ordenadas )3(x e )4(x e as observações )9(x

e )10(x (6 + 3 = 9).

5,32

16

Q1 é a média da 3ª e 4ª observações do

grupo inferior e,

Q3 é a média da 3ª e 4ª observações do

grupo superior.

5

1 1 2 3 4 5 6 6 6 7 8 9

5,22

3 2

2

)4()3(

1

xxQ

5,62

7 6

2

)10()9(

3

xxQ

ii.2) se a mediana for incluída, então, ela deve ser considerada1

tanto para a obtenção do 1º quartil, na metade inferior

como na obtenção do 3º quartil, na metade superior. Desta

forma, teremos 2 grupos, com 2)1( n observações cada.

1 Observe que a mediana é uma só. Ela é apenas considerada nos dois grupos para as contagens das

posições dos quartis.

Page 21: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

grupo

inferior

grupo

superior

Q1 med(x) Q3

e os quartis Q1 e Q3 são obtidos normalmente.

Exemplo 18:

Dados: 1 1 2 3 4 5 5 6 6 6 7 8 9 n = 13

A mediana 5)( )7( xxmed divide os dados em dois grupos

ordenados de 6 observações cada,

Incluindo a mediana ao procedimento, teremos uma observação

a mais em cada grupo, ou seja, teremos 7 observações

42

17

Q1 é a 4ª observação do grupo inferior e,

Q3 é a 4ª observação do grupo superior, ou

seja, a 11ª observação ordenada (7 + 4),

1 1 2 3 4 5 5

5 6 6 6 7 8 9

3)4(1 xQ

6)11(3 xQ

Page 22: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

iii) Outra forma para a obtenção dos quartis é apresentada por

Murteira (2002), ] Se a mediana ocupa a posição (n + 1)/2, então Q1 deverá

ocupar a posição:

4

3

2

12

1

n

n

Para a posição de Q3 fazemos:

4

13

4

3)1(

nnn

Portanto, Q1 e Q3 são dados pelas observações ordenadas que

ocupam as posições 4

3n e

4

13 n, respectivamente,

Se os valores de 4

3n e

4

13 n não forem inteiros, Q1 e Q3

devem ser obtidos por interpolação linear,

Por exemplo, se

kn

4

3,

em que k é a parte inteira e a parte decimal, então, Q1 pertence ao

intervalo );( )1()( kk xx e

][ )()1()(1 kkk xxxQ

Page 23: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Para Q3 o procedimento é semelhante, ou seja, se

4

13n,

então, Q3 pertence ao intervalo );( )1()( xx e

][ )()1()(3 xxxQ

Exemplo 19:

Dados: 1 1 2 3 4 5 5 6 6 6 7 8 8 9 n = 14

Para a determinação de Q1, temos:

posição de Q1: 25,44

17

4

314

.

Como = 0,25, Q1 é a interpolação entre a 4ª e 5ª observações

ordenadas:

25,3)34(25,031

Q .

Para a determinação de Q3, temos:

posição de Q3: 75,104

43

4

1143

.

Aqui = 0,75 e Q3 é a interpolação entre a 10ª e 11ª observações

ordenadas:

75,6)67(75,063

Q .

Obs: o item (iii) com n ímpar é equivalente ao item e (ii.2),

Page 24: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Notas:

Assim como a mediana, os quartis amostrais dependem do

tamanho da amostra n, fazendo com que nem sempre os quatro

grupos tenham o mesmo tamanho;

Existem diversas outras formas para a determinação dos quartis,

Nesta disciplina daremos ênfase nos itens (i) e (ii.1);

Para n pequeno, pode-se, ainda, obter os quartis graficamente

pelo histograma dos dados;

Os quartis são casos especiais dos quantis (ou percentis), que

são denotados por:

x(p) p-ésimo quantil ou quantil de ordem p,

Portanto, o quantil x(p) é dado pela observação ordenada que

deixa uma frequência acumulada igual 100p % abaixo de si,

Assim sendo temos que:

i) Q1 = x(0.25) quantil de ordem 0,25;

ii) Q2 = med(x) = x(0.50) quantil de ordem 0,50;

iii) Q3 = x(0.75) quantil de ordem 0,75.

Page 25: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

3.3.5. Exemplos de medidas de dispersão:

Exemplo 20: Número de pessoas com diabetes em 20 grupos de

1000 pessoas cada. Neste caso, foram obtidos os seguintes dados:

7, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 11, 12

1931 ni ix e 18891

2 ni ix

a) Média: 65,920

193x casos (≈ 10);

b) Mediana: 102

1010

2)(

)11()10(

xxxmed casos

c) Moda: mo(x) = 10 casos.

i) Variância e desvio padrão amostral:

19

45,18621889

120

)65,9(201889 2

2

s

397,119

55,262 s (casos)2

182,1397,1 s casos (≈ 1)

Page 26: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

ii) Amplitude amostral: 5712 A casos

iii) Amplitude interquartil:

posição de Q1: 5,52

110

,

logo, o 1º quartil é dado pela média entre a 5ª e 6ª

observações ordenadas:

92

99

2

)6()5(1

xxQ casos.

posição de Q3: 5,155,510 ,

logo o 3º quartil dado pela média entre a 15ª e 16ª

observações ordenadas:

102

1010

2

)16()15(3

xxQ casos.

Desta forma, a amplitude interquartil é:

1910 qA caso.

Relação entre as amplitudes amostral e interquartil:

2,05

1

A

Aq

Ou seja, a metade das observações, que ocupam a região

central representam 20% da amplitude total dos dados.

Page 27: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Exemplo 21: Altura dos alunos das turmas A e B de Estatística 1 no

primeiro semestre de 2015.

X = altura dos alunos (em metros).

Dados ordenados

1,52 1,55 1,57 1,58 1,59 1,60 1,60 1,60 1,61 1,63

1,63 1,64 1,65 1,65 1,65 1,67 1,68 1,68 1,68 1,69

1,70 1,70 1,70 1,70 1,70 1,72 1,72 1,73 1,73 1,73

1,73 1,74 1,74 1,74 1,75 1,75 1,76 1,77 1,77 1,78

1,78 1,78 1,79 1,79 1,79 1,80 1,80 1,80 1,83 1,83

1,83 1,83 1,89 1,90 1,95

n = 55 observações

Dado: 52,94 ix e 162,88481

2 ni i

x

a) Média: 7185,155

52,94x m;

b) Mediana: 73,1)()28( xxmed m;

c) Moda: 70,1)( xmo .

d) Variância e desvio padrão amostral:

54

4369,1628848,162

155

)7185,1(558848,162 2

2

s

008294,054

4479,02 s m2

09107,0008294,0 s m

Page 28: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

e) Amplitude amostral: A 1.95 − 1.52 = 0.43m

f) Amplitude interquartil: (sem incluir a mediana)

O primeiro quartil é a posição central da metade inferior

65,1)14(1 xQ m

O terceiro quartil é a posição central da metade superior

78,1)42(3 xQ

Desta forma, a amplitude interquartil é:

qA 1,78 − 1,65 = 0,13

Relação entre as amplitudes amostral e interquartil:

302,043,0

13,0

A

Aq

Metade das observações, que ocupam a região central, representam

30,2% da amplitude total dos dados.

Page 29: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Exemplo 22: Dias de manutenção de equipamentos de uma grande

companhia, (n = 50 observações)

X = dias em manutenção de equipamentos,

Dados Ordenados:

2 2 2 2 2 3 3 3 3 4

4 4 4 5 5 5 5 5 5 5

5 6 6 6 6 6 7 7 8 8

9 9 9 9 10 10 10 10 11 12

13 13 13 14 15 15 16 17 18 21

3921

n

i ix e 41781

2

n

i ix

a) 84,750

392x dias

b) 62

)()26()25(

xxxmed dias

c) mo(x) = 8 dias

i) Variância e desvio padrão amostral:

5453,2249

28,30734178

150

)84,7(504178 2

2

s dias2

7482,45453,22 s dias

ii) Amplitude amostral: 19221 A dias

Page 30: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

iii) Amplitude interquartil:

A mediana está entre a 25ª e 26ª posição, logo o primeiro

quartil é a posição central da metade inferior dos dados, ou seja:

132

125

, logo o 1º quartil é a 13ª observação ordenada,

4)13(1 xQ dias,

O terceiro quartil é a posição central da metade superior

381325 , logo o 3º quartil é a 38ª observação ordenada,

10)38(3 xQ dias,

Desta forma, a amplitude interquartil é:

5410 qA dias

Relação da amplitude interquartil com a amplitude total:

316,019

6

A

Aq

.

Metade das observações, que ocupam a região central, representam

31,6% da amplitude total.

Page 31: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Exemplo 23: Dados Cavendish.

X = densidade do globo terrestre (g/cm3).

Dados ordenados

4,88 5,07 5,10 5,26 5,27 5,29 5,29 5,30 5,34 5,34

5,36 5,39 5,42 5,44 5,46 5,47 5,50 5,53 5,55 5,57

5,58 5,61 5,62 5,63 5,65 5,68 5,75 5,79 5,85

n = 29 observações

99,157 ix e 0855,8622 i

x

448,529

99,157x g/cm3

i) Variância amostral:

04773,028

36638,1

129

)4419,5(290855,862 2

2

s (g/cm3)2

Desvio padrão amostral: 21847,004773,0 s g/cm3

ii) Amplitude amostral: 97,088,485,5 A g/cm3

iii) Amplitude interquartil:

A mediana é 15ª observação ordenada, o primeiro quartil

(excluindo-se a mediana do cálculo) é a posição central da metade

inferior dos dados, ou seja:

Page 32: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

295,52

30,529,5

2

)8()7(

1

xxQ g/cm3,

615,52

62,561.5,

2

)23()22(

3

xxQ g/cm3

Desta forma, a amplitude interquartil é:

qA 5,615 – 5,295 = 0,32 g/cm3,

Relação da amplitude interquartil com a amplitude total:

330,097,0

32,0

A

Aq

.

Metade das observações, que ocupam a região central, representam

33,0% da amplitude total.

Page 33: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

O coeficiente de variação amostral:

Uma medida utilizada para quantificar a variabilidade dos

dados é o coeficiente de variação, ou cv.

O cv de variação amostral é dado pela razão do desvio padrão

da amostra s e a média amostral x :

x

scv

Notas:

O coeficiente de variação compara a magnitude do desvio

padrão s com a média x . Se 1cv xs .

O coeficiente de variação é uma medida adimensional (é um

número puro) também podendo ser expresso em %.

Exemplo 24:

a) Número de casos com diabetes em 20 grupos de 1000 pessoas:

65,9x casos

397,12 s casos2

182,1397,1 s casos

122,065,9

182,1cv ou 12,2%

Page 34: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

b) Altura dos alunos da disciplina Estatística 1:

x 1,7185m

2s 0,008294m2

09107,0008294,0 s m

0530,07185,1

09107,0cv ou 5,30%

c) Dias de manutenção de equipamentos:

84,7x dias

5453,222 s dias2

7482,45453,22 s dias

606,084,7

7482,4cv ou 60,6%

d) Dados Cavendish:

448,5x g/cm3

21847,0s g/cm3

00401448,5

21847,0cv ou 4,01%,

Page 35: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Nos exemplos acima temos os cv’s de quatro processos

distintos, sendo o maior deles (dias manutenção) 15 vezes maior

do que o menor (Cavendish), indicando claramente as diferenças

na dispersão dos dados.

Tabela: Coeficientes de variação dos exemplos.

Dados cv cv (%)

Manutenção 0,606 60,6%

Diabetes 0,122 12,2%

Alturas 0,053 5,3%

Cavendish 0,040 4,0%

Um ponto de grande interesse, contudo, diz respeito a

classificar o cv e poder dizer se um conjunto de dados tem uma

dispersão muito alta, ou não. A seguir serão apresentados três

critérios para classificação do coeficiente de variação.

Como classificar o Coeficiente de Variação

O cv tem uma característica particular de ser intrínseco a

cada processo, tendo sido muito estudado na área agrícola, mais

especificamente, na experimentação agronômica.

Vários autores indicam diferentes métodos para se classificar o

coeficiente de variação. A seguir, são apresentadas três

classificações.

Page 36: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

I) Classificação segundo Pimentel Gomes (1985), baseada em

ensaios agrícolas.

Faixa cv dispersão

menor ou igual a 10% baixo baixa dispersão dos dados

entre 10% e 20% médio média dispersão dos dados

entre 20% e 30% alto alta dispersão dos dados

maior do que 30% muito alto dispersão dos dados muito alta

II) Classificação segundo Ferreira, F.V. (1991), Estatística

Experimental Aplicada à Agronomia, classifica com respeito à

precisão do processo.

Faixa cv precisão

Abaixo de 10% muito baixo ótima

entre 10% e 15% baixo boa

entre 15% e 20% médio regular

entre 20% e 30% alto ruim

maior do que 30% muito alto muito ruim

(ou péssima)

III) Classificação obtida no site www.datalyser.com.br, muito

utilizada em CEP - Controle Estatístico do Processo.

Faixa cv dispersão

menor ou igual a 15% baixo baixa dispersão dos dados

entre 15% e 30% médio média dispersão dos dados

maior do que 30% Alto alta dispersão dos dados

Page 37: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Exemplo 25: Considere os exemplos anteriores.

a) Diabetes:

122,065,9

182,1cv (12,2%) cv baixo a médio.

b) Aturas dos alunos:

cv (5,3%) cv baixo.

c) Dias de manutenção de equipamentos:

606,084,7

7482,4cv (60,6%) cv alto ou muito alto.

d) Dados Cavendish:

0401,0448,5

21847,0cv (4,01%) cv baixo.

Page 38: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

3.3.6. O diagrama box-plot

Representação gráfica da dispersão dos dados em torno da

mediana, é construído com as 5 medidas ordenadas: mínimo, Q1,

med(x), Q3 e máximo.

As cinco medidas podem ser apresentadas pela representação dos

cinco números:

med(x)

Q Q1 Q3

E mín(x) max(x)

Observações:

i) A representação dos cinco números, além da construção do

box-plot, ajuda na comparação da assimetria das caudas;

ii) Outros percentis podem ser incluídos, ampliando a

representação.

O diagrama box-plot fornece uma visão simplificada da dispersão

e simetria dos dados, além de indicar possíveis valores fora do

padrão (valores discrepantes). Além disso, pode ser utilizado na

comparação de diferentes processos quanto à centralidade

(posição) e variabilidade (dispersão).

O nome box-plot refere-se à “caixa” construída para representar a

metade das observações centrais entre os quartis.

Page 39: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

O box plot é constituído de 3 partes: caixa central, braços e

valores discrepantes.

i) A caixa central representa a metade das observações centrais

entre os quartis Q1 e Q3.

A mediana é destacada na caixa por uma linha que a divide

em duas partes. Com isso, pode-se avaliar a simetria na região

central da distribuição dos dados;

ii) Os braços são construídos a partir da caixa central,

representando as caudas da distribuição.

A construção dos braços é baseada nos valores dos quartis e, o

tamanho dos braços serve para avaliar a simetria das caudas.

iii) Valores discrepantes são valores fora do padrão de dispersão,

aparecendo muito distantes da maioria dos dados, podendo

indicar grande forte assimetria ou variabilidade (ou ambos).

Os valores discrepantes nem sempre estão presentes, sendo

representados individualmente a partir das caudas.

Valores discrepantes Valores discrepantes

Q1 – 1.5AQ Q1 med(x) Q3 Q3 + 1.5AQ

Page 40: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Procedimento para a construção do box-plot

i) Construir a “caixa” ou “box” com os valores dos quartis Q1 e

Q3;

ii) Com uma linha, demarcar a mediana na caixa, dividindo-a em

duas partes;

iii) Calcular os limites inferior (LI) e superior (Ls):

LI = Q1 – 1.5Aq

LS = Q3 + 1.5Aq

Os limites LI e Ls são utilizados para se identificar valores

discrepantes.

Valores discrepantes são observações menores do que LI ou

maiores do que LS e são destacados individualmente no box-

plot com pontos além desses limites.

iv) Para os “braços” do box-plot, traçar linhas a partir dos centros

das laterais inferior e superior da caixa, obedecendo ao

seguinte critério:

traçar uma linha da lateral inferior da caixa até o menor

valor que não seja discrepante ou até min(x);

marcar os pontos discrepantes menores do que LI, caso

existam;

traçar uma linha da lateral superior da caixa até o maior

valor que não seja discrepante ou até max(x);

marcar os pontos discrepantes maiores do que LS, caso

existam.

Page 41: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Exemplo 26: Variável horas gastas por semana assistindo TV.

0, 2, 2, 2, 2, 3, 4, 5, 5, 5,

5, 5, 5, 5, 6, 7, 7, 8, 8, 8,

10, 10, 10, 10, 10, 10, 10, 10, 10, 10,

10, 12, 12, 12, 12, 14, 14, 14, 14, 14,

15, 16, 18, 20, 20, 20, 25, 25, 28, 30

10

Q 5 14

E 0 30

Figura: Box-plot’s para a variável horas de TV, nas posições vertical e horizontal.

Comandos do R para o box-plot: x <- c( 0, 2, 2, 2, 2, 3, 4, 5, 5, 5, 5, 5, 5, 5,

6, 7, 7, 8, 8, 8,10,10,10,10,10,10,10,10,

10,10,10,12,12, 12,12,14,14,14,14,14,15,16,

18,20,20,20,25,25,28,30)

boxplot(x, col="bisque", main="Horas assistindo

TV", ylab="Horas", pch=19)

Page 42: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Exemplo 27: Valores dos quartis calculados pelo software R.

a) Casos de diabetes: boxplot(diabete, horizontal=T, main="Casos de

diabete", col="bisque", pch=19, cex.main=1)

5 números

10

Q 9 10

E 7 12

b) Dias de manutenção de equipamentos: boxplot(manuten, horizontal=T, main="Manutenção de

equipamentos", col="bisque", pch=19, cex.main=1)

5 números

6

Q 4.25 10

E 2 21

Page 43: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

c) Dados altura dos alunos de Estatística: boxplot(altura, horizontal=T, main="Altura alunos

Estatística", col="bisque", pch=19, cex.main=1)

5 números

1.73

Q 1.65 1.78

E 1.52 1.95

Page 44: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

d) Dados Cavendish boxplot(cavendish, horizontal=T, main="Dados Cavendish",

col="bisque", pch=19, cex.main=1)

5 números

5.46

Q 5.30 5.61

E 4.80 5.85

Page 45: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Exemplo 28: variável Renda PC por exposição à violência

doméstica (grupos exposto e não exposto).

Grupo

Exposto 68 96 100 100 112 112 117 120 120

135 150 160 160 200 260

Não exposto 36 50 70 84 108 109 120 120 150

150 180 220 250 260 300

Estatísticas descritivas (reais), por grupo.

Grupo n x med(x) s2 s Q1 Q3

Exposto 15 134.00 120.00 2257.29 47.51 100 160

Não exposto 15 147.13 120.00 6376.70 79.85 184 220

35 85 135 185 235 285

0

1

2

3

4

5

6

7

8

Grupo Exposto

Fre

ên

cia

0 66 132 198 264 330

0

1

2

3

4

5

6

Grupo não Exposto

Fre

ên

cia

50 150 250

Box-plot renda per capita

Grupo Exposto

0 100 200 300

Grupo Não Exposto

Box-plot renda per capita

Figura: Histogramas e box-plot’s individuais

Page 46: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Figura: box-plot’s por grupo lado-a-lado.

Comandos do R para o box-plot lado-a-lado: exp <- c(68,96,100,100,112,112,117,120,120,135,150,160,

160,200,260)

nexp <- c(36,50,70,84,108,109,120,120,150,150,180,220,

250,260,300)

renda <- c(nexp,exp)

gr <- c(rep("nexp",length(nexp)), rep("exp",length(exp)))

boxplot(renda~gr, pch=19,

col=c("mediumseagreen","lightcoral"))

# para o box-plot horizontal

boxplot(renda~gr, pch=19, horizontal=T,

col=c("mediumseagreen","lightcoral"))

Page 47: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Exemplo 29: Total de pontos obtidos pelos alunos ingressos na

UFSCar no ano de 2007, nos diferentes cursos.

Page 48: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

3.3.7. A simetria dos dados

Considere o histograma abaixo:

Figura: Histograma, com a distribuição de frequências.

O que podemos dizer com relação a simetria da distribuição de

frequências representa por este histograma?

Quando uma distribuição de frequências é perfeitamente

simétrica, teremos que a média aritmética, a moda e a mediana

serão iguais, ou seja:

x = mo(x) = med(x)

E quanto ao exemplo acima, o que podemos dizer?

Quando a distribuição não é simétrica, podemos distinguir duas

situações possíveis, conforme destacado pela figura abaixo:

a) A cauda superior da distribuição é mais alongada, puxando a

distribuição para a direita.

Neste caso, a média é maior do que a moda e a assimetria é

dita à direita ou positiva.

Page 49: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

b) A cauda inferior da distribuição é mais alongada, puxando a

distribuição para a esquerda.

Neste caso, a média é menor do que a moda e a assimetria é

dita à esquerda ou negativa.

Figura: Assimetrias à direita e à esquerda, respectivamente.

Média, moda e mediana e a simetria dos dados

i) A média é sempre influenciada por valores extremos, sendo

puxada na direção da cauda mais alongada (ver a seta na

Figura 5);

ii) A moda é o elemento de maior frequência, sendo o ponto de

máximo de f(x);

iii) A mediana está sempre no meio do conjunto, dividindo-o

em duas partes iguais, ficando entre as duas medidas

anteriores.

Page 50: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Assim, para cada situação, teremos:

a) Quando a simetria é perfeita as três medidas são iguais.

b) Na situação em que ocorre a assimetria à direita, temos como

consequência: moda menor do que a mediana que é menor do

que a média.

c) Para a assimetria à esquerda, como consequência, temos:

média menor do que a mediana que é menor do que a moda.

Page 51: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

3.3.8. Medidas de assimetria

Considere as três situações a seguir:

Figura: Distribuições assimétrica positiva, simétrica e assimétrica negativa.

Page 52: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

O Coeficiente de assimetria amostral (Skewness)

Seja a amostra X1, X2, …, Xn, e sejam os valores padronizados

nis

XXZ i

i ,,2,1,)(

.

Define-se o coeficiente de assimetria amostral, ou skewness,

por:

n

zb i

3

1

Alternativamente, 1b pode ser reescrito como

3

3

1

)(1

s

xx

nb i ,

em que s é o desvio padrão amostral do conjunto de dados.

Em resumo temos:

i) se a distribuição for assimétrica positiva, 01 b

ii) se a distribuição for assimétrica negativa, 01 b ;

iii) se a distribuição for (perfeitamente) simétrica, 01 b ;

Page 53: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Exemplo 30: Cálculo do coeficiente de skewness para dados

obtidos na internet.

14.7 14.8 14.9 15.6 16.0 16.4 16.8 17.0 17.7 17.9

18.0 19.3 19.4 19.4 19.6 20.0 20.0 20.6 22.0 22.2

22.7 22.7 23.1 23.2 23.4 23.7 23.7 23.9 24.6 25.2

25.5 25.6 25.8 25.9 26.0 26.2 26.3 26.6 26.7 27.7

27.8 27.9 28.6 28.7 29.0 29.2 30.0 30.6 30.8 32.0

32.3 32.6 32.8 33.0 33.8 34.1 34.1 34.5 34.6 35.6

38.0 38.2 41.2 42.7 55.0 56.0 56.0 63.5

Figura 4.2: Histograma para os dados obtidos na internet.

n x 3)( xxi

s

68 27,697 1000928,926 10,0829

448,1)0829,10(68

926,10092831

b (assimetria positiva)

Page 54: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Exemplo 31: Dados altura dos alunos do curso de Estatística.

n x 3)( xxi

s

55 1,7185 0,0030 0,09107

7221,0)09107,0(55

0030,031

b (assimetria positiva)

Exemplo 32: Casos de diabetes (por mil):

n x 3)( xxi

s

20 9,65 −8,265 1,1821

2502,0)1821,1(20

265,831

b (assimetria negativa)

Page 55: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Exemplo 33: Dados de manutenção:

n x 3)( xxi

s

50 7,84 4278,470 4,7482

7993,0)7482,4(50

470,427831

b (assimetria positiva)

Page 56: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

Exemplo 34: Dados Cavendish:

n x 3)( xxi

s

29 5,448 −0.1310 0,22095

4188,0)22095,0(29

1310.031

b (assimetria negativa)

Page 57: 3.3. Medidas descritiva de variáveis quantitativas. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x

## Exemplo do cálculo de skewness no R

## (dados da internet)

######################################

x <- c(14.7,14.8,14.9,15.6,16.0,16.4,16.8,17.0,17.7,17.9,

18.0,19.3,19.4,19.4,19.6,20.0,20.0,20.6,22.0,22.2,

22.7,22.7,23.1,23.2,23.4,23.7,23.7,23.9,24.6,25.2,

25.5,25.6,25.8,25.9,26.0,26.2,26.3,26.6,26.7,27.7,

27.8,27.9,28.6,28.7,29.0,29.2,30.0,30.6,30.8,32.0,

32.3,32.6,32.8,33.0,33.8,34.1,34.1,34.5,34.6,35.6,

38.0,38.2,41.2,42.7,55.0,56.0,56.0,63.5)

s3 <- round(sum((x-mean(x))^3),3)

s <- sd(x)

n <- length(x)

c(n, s, s3)

b1 <- s3/(n*s^3)

b1

par(mfrow=c(1,2))

hist(x, col="tomato", main=" ", right=F)

boxplot(x, col="tomato", pch=19, horizontal=T)

par(mfrow=c(1,1))