Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética...

27

Transcript of Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética...

Page 1: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

Métodos Estatísticos BásicosAula 3 - Medidas de tendência central

Prof. Regis Augusto Ely

Departamento de EconomiaUniversidade Federal de Pelotas (UFPel)

Abril de 2014

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 2: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

Média aritméticaDe�nição

As medidas de tendência central são estatísticas que caracterizamum conjunto de dados, sendo o valor em torno do qual se agrupamas observações.

Média aritmética (X ): é o quociente entre a soma dos valores dos

nossos dados e o número total de dados, X̄ =∑n

i=1 Xi

n .

Quando temos dados não-agrupados pela frequência dasobservações, calculamos a média aritmética simples.Ex: 10, 14, 13, 15, 16, 18, 12.Logo, X = (10+14+13+15+16+18+12)

7 = 14.

Desvio em relação à média: é a diferença entre um elemento deum conjunto de valores e a média aritmética desse conjunto, ou seja,di = Xi − X .Ex: d1 = 10− 14 = −4; d2 = 14− 14 = 0, etc.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 3: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

Média aritméticaPropriedades da média

1 A soma algébrica dos desvios em relação à média é nula.

Assim,n∑

i=1

di =n∑

i=1

(Xi − X ) =n∑

i=1

Xi − n.X = 0.

2 Somando ou subtraindo uma constante c a todos os elementos donosso conjunto de dados, a média aumentará em c. Assim,∑n

i=1(Xi+c)n =

∑ni=1 Xin + n.c

n = X + c .3 Multiplicando ou dividindo todos os valores por uma constante c, a

média �ca multiplicada (ou dividida) por c. Assim,∑ni=1(c.Xi)

n =c∑n

i=1 Xin = c .X .

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 4: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

Média aritmética ponderadaDados agrupados sem intervalo de classe

Se os dados estiverem agrupados em uma tabela de frequência,devemos calcular uma média aritmética ponderada. X =

∑ni=1 Xi fi∑n

i=1 fi .Ex:

Dados Frequência

0 21 62 103 124 4

Total 34

X = 0x2+1x6+2x10+3x12+4x434 = 2, 3

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 5: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

Média aritmética ponderadaDados agrupados com intervalos de classe

Se os dados estiverem agrupados em intervalos de classe, utilizamosa média aritmética ponderada, de�nindo Xi como o ponto médio daclasse i. Ex:

Estaturas(cm) Frequência (�) Ponto médio (Xi) Xi.�

50 ` 54 4 52 20854 ` 58 9 56 50458 ` 62 11 60 66062 ` 66 8 64 51266 ` 70 5 68 34070 ` 74 3 72 216Total 40 2440

Assim, X = 244040 = 61

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 6: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

Média geométricaDe�nição

Média geométrica (Xg ): é a raíz n-ésima do produto dos dados,

X̄g =n√∏n

i=1 Xi , onde∏n

i=1 Xi = X1.X2....Xn.

Ex: 10,60,360. Xg = 3√10.60.360 = 60.

Note que aplicando log, temos logXg = 1n

∑ni=1 logXi , de modo que

o logaritmo da média geométrica é igual à média aritmética doslogaritmos dos valores observados.

Assim, podemos notar que a média geométrica é uma médiaaritmética suavizada. Ela é muita utilizada em �nanças e engenharia.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 7: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

Média geométricaRelação com a média aritmética

Sempre teremos Xg ≤ X , valendo a igualdade apenas se xi = xj paratodo i 6= j , ou seja, se todos os dados são iguais.

Para provar que Xg ≤ X basta observar que, para o caso de apenasduas observações, X1 e X2:X 2 − X 2

g = ( X1+X22 )2 − X1.X2=

X21−2.X1.X2+X2

24 = ( X1−X2

2 )² ≥ 0.

Logo, como X 2 − X 2g ≥ 0, temos Xg ≤ X .

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 8: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

Média geométrica ponderadaDados agrupados sem intervalo de classe

Se os dados forem agrupados, calculamos a média geométrica

ponderada, Xg =n∑

i=1fi

√∏ni=1 X

fi

i =n∑

i=1fi

√X f11 .X f2

2 ...X fnn . Ex:

Xi fi

1 23 49 227 1

Total 9

Xg =9√12.34.92.271 = 3, 8296

Se os dados forem agrupados com intervalo de classe o procedimentoé o mesmo, porém agora Xi será o ponto médio de cada classe.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 9: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

Média harmônicaDe�nição

Média harmônica (X h): É o inverso da média aritmética dosinversos de cada elemento do conjunto de dados,X h = ( 1n .

∑ni=1 X

−1i )−1 = n∑n

i=11

Xi

.

A média harmônica é bastante utilizada na física, quandotrabalhamos com grandezas que variam inversamente. Ex:velocidade e tempo.

Sempre teremos X h ≤ X g ≤ X , valendo a igualdade apenas se todosos dados forem iguais. Podemos ver isso para o caso de apenas duasobservações, X 1 e X2:

X h = [ 12 .(1

X1+ 1

X2)]−1 = 2X1.X2

X1+X2=

2.X2g

2.X=

X g .X g

X.

Como X g ≤ X , temos 0 ≤ Xg

X≤ 1. Logo, X h ≤ X g .

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 10: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

Média harmônica ponderadaDados agrupados com intervalo de classe

Se os dados forem agrupados, calculamos a média harmônica

ponderada, X h =∑n

i=1 fi∑ni=1

fiXi

. Ex:

Classes fi Xifi

Xi

1 ` 3 2 2 2/2=13 ` 5 4 4 4/4=15 ` 7 8 6 8/6=1,337 ` 9 4 8 4/8=0,59 ` 11 2 10 2/10=0,2total 20 4,03

Xh = 204,03 = 4, 96

Se os dados forem agrupados sem intervalo de classe o procedimentoé o mesmo, porém agora Xi será o valor de cada elemento doconjunto de dados.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 11: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

Média harmônicaObservações

Obs 1: a média harmônica não aceita valores iguais a zero comodados de uma série.

Obs 2: quando os valores da variável não forem muito diferentes,

veri�ca-se a seguinte relação,Xg = (X+Xh)2 .

Ex: {10,1; 10,1; 10,2; 10,4; 10,5}X = 51,3

5 = 10, 2600Xh = 5

0,4874 = 10, 2574

Xg = 10,26+10,25742 = 10, 2587

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 12: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

ModaDe�nição

Moda (Mo): É o valor que ocorre com maior frequência em umasérie de dados.

Se os dados estiverem não agrupados, devemos procurar o valor quemais se repete.Ex: {7, 8, 9, 10, 10, 10, 11, 12}. Temos Mo=10.

Se nenhum valor aparece mais vezes do que outro, chamamos a sériede amodal.Ex: {3, 5, 8, 10, 12} não apresenta moda. É amodal.

Se dois ou mais valores repetem o mesmo número de vezes, a sérietem mais de um valor modal.Ex: {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9} tem duas modas, é bimodal.Suas modas são 4 e 7.

O emprego da moda é utilizado apenas em alguns casos especí�cos,pois a média aritmética possui maior estabilidade. Ex: salários.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 13: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

ModaDados agrupados

Sem intervalos de classe: com os dados agrupados, é possíveldeterminar a moda apenas olhando o dado com a maior frequência.

Temperatura Frequência

0ºC 31ºC 92ºC 123ºC 6

Mo = 2ºC

Com intervalos de classe: a classe com a maior frequência é aclasse modal. A moda será um valor compreendido entre os limitesda classe moda.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 14: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

ModaDados agrupados

Moda bruta: Mo = ( l∗+L∗2 ), onde l∗ é o limite inferior da classe

modal e L∗ o limite superior da classe modal.

Moda de Czuber: Mc = l ∗+( d1d1+d2

).h∗, onde d1 é a frequência daclasse modal menos a frequência da classe anterior a modal; d2 é afrequência da classe modal menos a frequência da classe posterior amodal; e h∗ é a amplitude da classe modal. Ex:

Classes Frequências

54 ` 58 958 ` 62 1162 ` 66 866 ` 70 5

A classe modal é 58 ` 62, logo Mo = 58+622 = 60; e

Mc = 58 + (11−9)(11−9)+(11−8) .4 = 59, 6

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 15: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

MedianaDe�nição

Mediana (Me): é o valor que separa um conjunto de dados(dispostos em ordem crescente ou decrescente) em doissubconjuntos de mesmo número de elementos.

Se a série tiver número ímpar de termos, a mediana será o elementon+12 .

Se a série tiver numero par de termos, a mediana será a média doselementos n

2 e n2 + 1.

Ex. 1: {1, 3, 0, 0, 2, 4, 1, 2, 5}.1º colocamos a série em ordem crescente {0, 0, 1, 1, 2, 2, 3, 4, 5}.2º como existem 9 elementos, a mediana será o elemento de númeron+12 = 10

2 = 5. Assim, Me = 2.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 16: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

MedianaDe�nição

Ex. 2: {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}.1º colocamos a série em ordem crescente {0, 0, 1, 1, 2, 3, 3, 4, 5,6}.2º como existem dez elementos, a mediana será a média doselementos de número n

2 = 102 = 5 e n

2 + 1 = 6, logoMe = 2+3

2 = 2, 5.

A mediana depende da posição dos valores da série. Ela não se deixain�uenciar por valores extremos, como é o caso da média. Já amoda, depende da frequência. Estes três valores em geral sãodiferentes.

Ex. 3: {5, 7, 10, 10, 18}. X = 10, Mo = 10, Me = 10.

Ex. 4: {5, 5, 10, 13, 67}. X = 20, Mo = 5, Me = 10.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 17: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

MedianaDados agrupados sem intervalo de classe

Se o somatório das frequências for ímpar, a mediana será o elemento∑ni=1 fi+12 .

Identi�camos facilmente esse elemento através da frequênciaacumulada. Ex:

Xi � Fi

0 2 21 6 82 9 173 13 304 5 35

total 35

Temos∑

fi+12 = 36

2 = 18. Logo, Me = 3.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 18: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

MedianaDados agrupados sem intervalo de classe

Se o somatório das frequências for par, a mediana será a média dostermos

∑ni=1 fi

2 e∑n

i=1 fi

2 + 1. Ex:

Xi � Fi

12 1 114 2 315 1 416 2 617 1 720 1 8total 8

Temos∑n

i=1 fi

2 = 82 = 4 e

∑ni=1 fi

2 + 1 = 82 + 1 = 5. Assim,

Me = 15+162 = 15, 5.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 19: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

MedianaDados agrupados com intervalo de classe

Para calcularmos a mediana de dados agrupados com intervalo declasse, seguimos as seguintes etapas:1º Determinamos as frequências acumuladas.

2º Calculamos

n∑i=1

fi

2 .3º Marcamos a classe correspondente a frequência acumulada

imediatamente superior a

n∑i=1

fi

2 . Essa será a classe mediana.

4º Temos queMe = l∗ +[(

∑ni=1 fi2 −FAA).h∗]

f ∗ , onde l∗ é o limite inferiorda classe mediana, FAA é a frequência acumulada da classe anteriorà classe mediana, f ∗ é a frequência simples da classe mediana, e h∗é a amplitude do intervalo da classe mediana.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 20: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

MedianaDados agrupados com intervalo de classe

Ex:

Classes � Fi

50 ` 54 4 454 ` 58 9 1358 ` 62 11 2462 ` 66 8 3266 ` 70 5 3770 ` 74 3 40total 40

∑fi

2 = 20 → Classe mediana: 58 ` 62.

l∗ = 58, FAA = 13, f ∗ = 11, h∗ = 4.

Md = 58 + [(20−13)x4]11 = 58 + 28

11 = 60, 54.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 21: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

MedianaPossíveis empregos da mediana

Quando desejamos obter o ponto que divide a distribuição em duaspartes iguais.

Quando há valores extremos que afetam demais a média.

Em variáveis como salário.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 22: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

SeparatrizesDe�nição

Existem outras medidas de posição que não são medidas detendência central, como os quartis, decis e percentis, conhecidasgenericamente por separatrizes.

Quartil: são os valores que dividem a série em quatro partes iguais.Precisamos 3 quartis para dividir a série em quatro partes.

Note que o segundo quartil (Q2) será sempre igual a mediana.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 23: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

QuartilDados não agrupados

Ex. 1: {5, 2, 6, 9, 10, 13, 15}.1º ordenamos a série {2, 5, 6, 9, 10, 13, 15}.2º calculamos a mediana, que será o segundo quartil Me = Q2 = 9.3º dividimos a série em dois grupos {2, 5, 6} e {10, 13, 15}.4º calculamos os outros quartis como sendo as medianas desses doisgrupos Q1 = 5 e Q2 = 13.

Ex. 2: {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13}.Me = Q2 = 5+6

2 = 5, 5. Logo, temos {1, 1, 2, 3, 5, 5} comQ1 = 2, 5, e {6, 7, 9, 9, 10, 13} com Q3 = 9.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 24: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

QuartilDados agrupados

Se os dados forem agrupados sem intervalos de classe, utilizamos∑ni=1 fi

2 e∑n

i=1 fi

2 + 1 para calcular as posições dos quartis.

Se os dados forem agrupados com intervalos de classe, utilizamos amesma fórmula da mediana para calcular os quartis, entretantosubstituímos

∑ni=1 fi

2 por k∑n

i=1 fi

4 , sendo k o número do quartil:

Q1=l∗ +[(

∑fi

4 −FAA).h∗]

f ∗

Q2= l∗ +[(2

∑fi

4 −FAA).h∗]

f ∗

Q3=l∗ +[(3

∑fi

4 −FAA).h∗]

f ∗

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 25: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

QuartilDados agrupados com intervalo de classe

Ex:

Classes � Fi

50 ` 54 4 454 ` 58 9 1358 ` 62 11 2462 ` 66 8 3266 ` 70 5 3770 ` 74 3 40total 40∑

fi2 = 20 → classe mediana: 58 ` 62. l∗ = 58, FAA = 13, f ∗ = 11, h∗ = 4

Me = Q2 = 58 + [(20−13)x4)11 = 60, 54.∑

fi4 = 10 → classe mediana do 1º grupo: 54 ` 58.

Q1 = 54 + [(10−4)x4]9 = 56, 66.

3.∑

fi4 = 30 →classe mediana do 3º grupo: 62 ` 66.

Q3 = 62 + [(30−24)x4]8 = 65.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 26: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

DecilDe�nição

Decil: são os valores que dividem a série em dez partes iguais.Precisamos 9 decis para dividir a série em 10 partes.

O procedimento é análogo, porém agora o 5º decil será igual ao 2ºquartil, que será igual à mediana.

Ex: calcule o 3º decil da tabela anterior.Como k=3, temos 3.

∑fi

10 = 3. 4010 = 12, e a classe mediana é 54 ` 58.

Logo, D3 = 54 + [(12−4)x4]9 = 57, 55.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Page 27: Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética De nição As medidas de tendência central são estatísticas que caracterizam um

Percentil (ou centil)

Serão os 99 valores que separam a série em 100 partes iguais, demodo que P50 = Me , P25 = Q1 e P75 = Q3. O cálculo é análogo,mas utilizandok .

∑fi

100 .

Prof. Regis Augusto Ely Métodos Estatísticos Básicos