Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética...

Post on 16-Dec-2018

217 views 0 download

Transcript of Métodos Estatísticos Básicos - regisely.comregisely.com/files/3-stat.pdf · Média aritmética...

Métodos Estatísticos BásicosAula 3 - Medidas de tendência central

Prof. Regis Augusto Ely

Departamento de EconomiaUniversidade Federal de Pelotas (UFPel)

Abril de 2014

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Média aritméticaDe�nição

As medidas de tendência central são estatísticas que caracterizamum conjunto de dados, sendo o valor em torno do qual se agrupamas observações.

Média aritmética (X ): é o quociente entre a soma dos valores dos

nossos dados e o número total de dados, X̄ =∑n

i=1 Xi

n .

Quando temos dados não-agrupados pela frequência dasobservações, calculamos a média aritmética simples.Ex: 10, 14, 13, 15, 16, 18, 12.Logo, X = (10+14+13+15+16+18+12)

7 = 14.

Desvio em relação à média: é a diferença entre um elemento deum conjunto de valores e a média aritmética desse conjunto, ou seja,di = Xi − X .Ex: d1 = 10− 14 = −4; d2 = 14− 14 = 0, etc.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Média aritméticaPropriedades da média

1 A soma algébrica dos desvios em relação à média é nula.

Assim,n∑

i=1

di =n∑

i=1

(Xi − X ) =n∑

i=1

Xi − n.X = 0.

2 Somando ou subtraindo uma constante c a todos os elementos donosso conjunto de dados, a média aumentará em c. Assim,∑n

i=1(Xi+c)n =

∑ni=1 Xin + n.c

n = X + c .3 Multiplicando ou dividindo todos os valores por uma constante c, a

média �ca multiplicada (ou dividida) por c. Assim,∑ni=1(c.Xi)

n =c∑n

i=1 Xin = c .X .

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Média aritmética ponderadaDados agrupados sem intervalo de classe

Se os dados estiverem agrupados em uma tabela de frequência,devemos calcular uma média aritmética ponderada. X =

∑ni=1 Xi fi∑n

i=1 fi .Ex:

Dados Frequência

0 21 62 103 124 4

Total 34

X = 0x2+1x6+2x10+3x12+4x434 = 2, 3

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Média aritmética ponderadaDados agrupados com intervalos de classe

Se os dados estiverem agrupados em intervalos de classe, utilizamosa média aritmética ponderada, de�nindo Xi como o ponto médio daclasse i. Ex:

Estaturas(cm) Frequência (�) Ponto médio (Xi) Xi.�

50 ` 54 4 52 20854 ` 58 9 56 50458 ` 62 11 60 66062 ` 66 8 64 51266 ` 70 5 68 34070 ` 74 3 72 216Total 40 2440

Assim, X = 244040 = 61

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Média geométricaDe�nição

Média geométrica (Xg ): é a raíz n-ésima do produto dos dados,

X̄g =n√∏n

i=1 Xi , onde∏n

i=1 Xi = X1.X2....Xn.

Ex: 10,60,360. Xg = 3√10.60.360 = 60.

Note que aplicando log, temos logXg = 1n

∑ni=1 logXi , de modo que

o logaritmo da média geométrica é igual à média aritmética doslogaritmos dos valores observados.

Assim, podemos notar que a média geométrica é uma médiaaritmética suavizada. Ela é muita utilizada em �nanças e engenharia.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Média geométricaRelação com a média aritmética

Sempre teremos Xg ≤ X , valendo a igualdade apenas se xi = xj paratodo i 6= j , ou seja, se todos os dados são iguais.

Para provar que Xg ≤ X basta observar que, para o caso de apenasduas observações, X1 e X2:X 2 − X 2

g = ( X1+X22 )2 − X1.X2=

X21−2.X1.X2+X2

24 = ( X1−X2

2 )² ≥ 0.

Logo, como X 2 − X 2g ≥ 0, temos Xg ≤ X .

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Média geométrica ponderadaDados agrupados sem intervalo de classe

Se os dados forem agrupados, calculamos a média geométrica

ponderada, Xg =n∑

i=1fi

√∏ni=1 X

fi

i =n∑

i=1fi

√X f11 .X f2

2 ...X fnn . Ex:

Xi fi

1 23 49 227 1

Total 9

Xg =9√12.34.92.271 = 3, 8296

Se os dados forem agrupados com intervalo de classe o procedimentoé o mesmo, porém agora Xi será o ponto médio de cada classe.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Média harmônicaDe�nição

Média harmônica (X h): É o inverso da média aritmética dosinversos de cada elemento do conjunto de dados,X h = ( 1n .

∑ni=1 X

−1i )−1 = n∑n

i=11

Xi

.

A média harmônica é bastante utilizada na física, quandotrabalhamos com grandezas que variam inversamente. Ex:velocidade e tempo.

Sempre teremos X h ≤ X g ≤ X , valendo a igualdade apenas se todosos dados forem iguais. Podemos ver isso para o caso de apenas duasobservações, X 1 e X2:

X h = [ 12 .(1

X1+ 1

X2)]−1 = 2X1.X2

X1+X2=

2.X2g

2.X=

X g .X g

X.

Como X g ≤ X , temos 0 ≤ Xg

X≤ 1. Logo, X h ≤ X g .

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Média harmônica ponderadaDados agrupados com intervalo de classe

Se os dados forem agrupados, calculamos a média harmônica

ponderada, X h =∑n

i=1 fi∑ni=1

fiXi

. Ex:

Classes fi Xifi

Xi

1 ` 3 2 2 2/2=13 ` 5 4 4 4/4=15 ` 7 8 6 8/6=1,337 ` 9 4 8 4/8=0,59 ` 11 2 10 2/10=0,2total 20 4,03

Xh = 204,03 = 4, 96

Se os dados forem agrupados sem intervalo de classe o procedimentoé o mesmo, porém agora Xi será o valor de cada elemento doconjunto de dados.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Média harmônicaObservações

Obs 1: a média harmônica não aceita valores iguais a zero comodados de uma série.

Obs 2: quando os valores da variável não forem muito diferentes,

veri�ca-se a seguinte relação,Xg = (X+Xh)2 .

Ex: {10,1; 10,1; 10,2; 10,4; 10,5}X = 51,3

5 = 10, 2600Xh = 5

0,4874 = 10, 2574

Xg = 10,26+10,25742 = 10, 2587

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

ModaDe�nição

Moda (Mo): É o valor que ocorre com maior frequência em umasérie de dados.

Se os dados estiverem não agrupados, devemos procurar o valor quemais se repete.Ex: {7, 8, 9, 10, 10, 10, 11, 12}. Temos Mo=10.

Se nenhum valor aparece mais vezes do que outro, chamamos a sériede amodal.Ex: {3, 5, 8, 10, 12} não apresenta moda. É amodal.

Se dois ou mais valores repetem o mesmo número de vezes, a sérietem mais de um valor modal.Ex: {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9} tem duas modas, é bimodal.Suas modas são 4 e 7.

O emprego da moda é utilizado apenas em alguns casos especí�cos,pois a média aritmética possui maior estabilidade. Ex: salários.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

ModaDados agrupados

Sem intervalos de classe: com os dados agrupados, é possíveldeterminar a moda apenas olhando o dado com a maior frequência.

Temperatura Frequência

0ºC 31ºC 92ºC 123ºC 6

Mo = 2ºC

Com intervalos de classe: a classe com a maior frequência é aclasse modal. A moda será um valor compreendido entre os limitesda classe moda.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

ModaDados agrupados

Moda bruta: Mo = ( l∗+L∗2 ), onde l∗ é o limite inferior da classe

modal e L∗ o limite superior da classe modal.

Moda de Czuber: Mc = l ∗+( d1d1+d2

).h∗, onde d1 é a frequência daclasse modal menos a frequência da classe anterior a modal; d2 é afrequência da classe modal menos a frequência da classe posterior amodal; e h∗ é a amplitude da classe modal. Ex:

Classes Frequências

54 ` 58 958 ` 62 1162 ` 66 866 ` 70 5

A classe modal é 58 ` 62, logo Mo = 58+622 = 60; e

Mc = 58 + (11−9)(11−9)+(11−8) .4 = 59, 6

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

MedianaDe�nição

Mediana (Me): é o valor que separa um conjunto de dados(dispostos em ordem crescente ou decrescente) em doissubconjuntos de mesmo número de elementos.

Se a série tiver número ímpar de termos, a mediana será o elementon+12 .

Se a série tiver numero par de termos, a mediana será a média doselementos n

2 e n2 + 1.

Ex. 1: {1, 3, 0, 0, 2, 4, 1, 2, 5}.1º colocamos a série em ordem crescente {0, 0, 1, 1, 2, 2, 3, 4, 5}.2º como existem 9 elementos, a mediana será o elemento de númeron+12 = 10

2 = 5. Assim, Me = 2.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

MedianaDe�nição

Ex. 2: {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}.1º colocamos a série em ordem crescente {0, 0, 1, 1, 2, 3, 3, 4, 5,6}.2º como existem dez elementos, a mediana será a média doselementos de número n

2 = 102 = 5 e n

2 + 1 = 6, logoMe = 2+3

2 = 2, 5.

A mediana depende da posição dos valores da série. Ela não se deixain�uenciar por valores extremos, como é o caso da média. Já amoda, depende da frequência. Estes três valores em geral sãodiferentes.

Ex. 3: {5, 7, 10, 10, 18}. X = 10, Mo = 10, Me = 10.

Ex. 4: {5, 5, 10, 13, 67}. X = 20, Mo = 5, Me = 10.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

MedianaDados agrupados sem intervalo de classe

Se o somatório das frequências for ímpar, a mediana será o elemento∑ni=1 fi+12 .

Identi�camos facilmente esse elemento através da frequênciaacumulada. Ex:

Xi � Fi

0 2 21 6 82 9 173 13 304 5 35

total 35

Temos∑

fi+12 = 36

2 = 18. Logo, Me = 3.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

MedianaDados agrupados sem intervalo de classe

Se o somatório das frequências for par, a mediana será a média dostermos

∑ni=1 fi

2 e∑n

i=1 fi

2 + 1. Ex:

Xi � Fi

12 1 114 2 315 1 416 2 617 1 720 1 8total 8

Temos∑n

i=1 fi

2 = 82 = 4 e

∑ni=1 fi

2 + 1 = 82 + 1 = 5. Assim,

Me = 15+162 = 15, 5.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

MedianaDados agrupados com intervalo de classe

Para calcularmos a mediana de dados agrupados com intervalo declasse, seguimos as seguintes etapas:1º Determinamos as frequências acumuladas.

2º Calculamos

n∑i=1

fi

2 .3º Marcamos a classe correspondente a frequência acumulada

imediatamente superior a

n∑i=1

fi

2 . Essa será a classe mediana.

4º Temos queMe = l∗ +[(

∑ni=1 fi2 −FAA).h∗]

f ∗ , onde l∗ é o limite inferiorda classe mediana, FAA é a frequência acumulada da classe anteriorà classe mediana, f ∗ é a frequência simples da classe mediana, e h∗é a amplitude do intervalo da classe mediana.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

MedianaDados agrupados com intervalo de classe

Ex:

Classes � Fi

50 ` 54 4 454 ` 58 9 1358 ` 62 11 2462 ` 66 8 3266 ` 70 5 3770 ` 74 3 40total 40

∑fi

2 = 20 → Classe mediana: 58 ` 62.

l∗ = 58, FAA = 13, f ∗ = 11, h∗ = 4.

Md = 58 + [(20−13)x4]11 = 58 + 28

11 = 60, 54.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

MedianaPossíveis empregos da mediana

Quando desejamos obter o ponto que divide a distribuição em duaspartes iguais.

Quando há valores extremos que afetam demais a média.

Em variáveis como salário.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

SeparatrizesDe�nição

Existem outras medidas de posição que não são medidas detendência central, como os quartis, decis e percentis, conhecidasgenericamente por separatrizes.

Quartil: são os valores que dividem a série em quatro partes iguais.Precisamos 3 quartis para dividir a série em quatro partes.

Note que o segundo quartil (Q2) será sempre igual a mediana.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

QuartilDados não agrupados

Ex. 1: {5, 2, 6, 9, 10, 13, 15}.1º ordenamos a série {2, 5, 6, 9, 10, 13, 15}.2º calculamos a mediana, que será o segundo quartil Me = Q2 = 9.3º dividimos a série em dois grupos {2, 5, 6} e {10, 13, 15}.4º calculamos os outros quartis como sendo as medianas desses doisgrupos Q1 = 5 e Q2 = 13.

Ex. 2: {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13}.Me = Q2 = 5+6

2 = 5, 5. Logo, temos {1, 1, 2, 3, 5, 5} comQ1 = 2, 5, e {6, 7, 9, 9, 10, 13} com Q3 = 9.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

QuartilDados agrupados

Se os dados forem agrupados sem intervalos de classe, utilizamos∑ni=1 fi

2 e∑n

i=1 fi

2 + 1 para calcular as posições dos quartis.

Se os dados forem agrupados com intervalos de classe, utilizamos amesma fórmula da mediana para calcular os quartis, entretantosubstituímos

∑ni=1 fi

2 por k∑n

i=1 fi

4 , sendo k o número do quartil:

Q1=l∗ +[(

∑fi

4 −FAA).h∗]

f ∗

Q2= l∗ +[(2

∑fi

4 −FAA).h∗]

f ∗

Q3=l∗ +[(3

∑fi

4 −FAA).h∗]

f ∗

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

QuartilDados agrupados com intervalo de classe

Ex:

Classes � Fi

50 ` 54 4 454 ` 58 9 1358 ` 62 11 2462 ` 66 8 3266 ` 70 5 3770 ` 74 3 40total 40∑

fi2 = 20 → classe mediana: 58 ` 62. l∗ = 58, FAA = 13, f ∗ = 11, h∗ = 4

Me = Q2 = 58 + [(20−13)x4)11 = 60, 54.∑

fi4 = 10 → classe mediana do 1º grupo: 54 ` 58.

Q1 = 54 + [(10−4)x4]9 = 56, 66.

3.∑

fi4 = 30 →classe mediana do 3º grupo: 62 ` 66.

Q3 = 62 + [(30−24)x4]8 = 65.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

DecilDe�nição

Decil: são os valores que dividem a série em dez partes iguais.Precisamos 9 decis para dividir a série em 10 partes.

O procedimento é análogo, porém agora o 5º decil será igual ao 2ºquartil, que será igual à mediana.

Ex: calcule o 3º decil da tabela anterior.Como k=3, temos 3.

∑fi

10 = 3. 4010 = 12, e a classe mediana é 54 ` 58.

Logo, D3 = 54 + [(12−4)x4]9 = 57, 55.

Prof. Regis Augusto Ely Métodos Estatísticos Básicos

Percentil (ou centil)

Serão os 99 valores que separam a série em 100 partes iguais, demodo que P50 = Me , P25 = Q1 e P75 = Q3. O cálculo é análogo,mas utilizandok .

∑fi

100 .

Prof. Regis Augusto Ely Métodos Estatísticos Básicos