Medidas de Dispersão

42
1 UFSC- UNIVERSIDADE FEDERAL DE SANTA CATARINA Profª Andréa Medidas de Dispersão

Transcript of Medidas de Dispersão

Page 1: Medidas de Dispersão

1

CMIP- Centro de Metrologia e Inovação em ProcessosUFSC- UNIVERSIDADE FEDERAL DE SANTA CATARINA

Profª Andréa

Medidas de Dispersão

Page 2: Medidas de Dispersão

2

Medidas de Dispersão

• As Medidas de Tendência Central:

– representam de certa forma uma determinada

distribuição de dados

– só elas não são suficientes para caracterizar a

distribuição.

• Para uma análise estatística mais exata é necessária

a verificação da flutuação dos valores em torno de

sua média aritmética

Page 3: Medidas de Dispersão

3

Medidas de Dispersão

• Suponha as notas de 2 grupos de estudantes,

cada qual com 4 alunos.

• GRUPO “A” : 4, 5, 5, 6

• GRUPO “B” : 0, 0, 10, 10

• Média do grupo “A”: 5

• Média do grupo “B”: 5

Page 4: Medidas de Dispersão

4

Medidas de Dispersão

• Os dois grupos apresentam a mesma média

• O comportamento dos 2 grupos são bem distintos.

GRUPO “A”: valores são mais homogêneos

GRUPO “B”: valores são dispersos em relação à

média

Page 5: Medidas de Dispersão

5

Medidas de Dispersão

• Dentre as medidas de dispersão pode-se citar algumas delas:

Amplitude Total

Variância

Desvio Padrão

Page 6: Medidas de Dispersão

6

Amplitude Total - At

• A amplitude total é a diferença entre o maior e o

menor valor da série ou da distribuição. Representa

a dispersão máxima.

• Ela raramente é usada como única medida de

variabilidade porque é calculada apenas com os

valores extremos

• Exemplo: Nota de 20 alunos:

Xi: 1, 1, 2, 2, 2, 3, 3, 3, 5, 5, 5, 5, 5, 6, 6, 6, 9

At = 9 – 1 = 8

Page 7: Medidas de Dispersão

7

Distribuição de frequência sem intervalos de classes - At

• A definição é a mesma, porém, o maior e o menor valor da série são observados na coluna do valor da variável Xi .

At = 10 – 6At = 4

Page 8: Medidas de Dispersão

8

i Idades (anos) fi

1 18 24 5

2 24 30 10

3 30 36 4

4 36 42 12

5 42 48 7

6 48 54 2

40

Distribuição de frequência com intervalos de classes - At

At = 54 – 18At = 36

Page 9: Medidas de Dispersão

9

Variância

A medida de dispersão usual é a variância e principalmente sua

raiz quadrada que é denominada de desvio padrão.

( )

N

μx

)x(σ)x(Var

N

1i

2

i2

=

==N

x

μ

N

1i

i==

Onde é a média populacionale N é o tamanho da população

estudada.

A variância é expressa por:

e

Page 10: Medidas de Dispersão

10

Quando a média não é exata e precisa ser arredondada, cada

desvio fica afetado ligeiramente por esse arredondamento, que

não deixa de ser um erro, por isso é mais aconselhável que se

utilize a fórmula desenvolvida a seguir:

( )

−=

N

xx

N

1)x(σ

2

i2

i

2

Variância - População

OBS:

A unidade da variância é o quadrado da unidade dos dadoscausando dificuldades para avaliar a dispersão: se por exemplotemos a variável peso com média de 75 kg em um conjunto e aocalcular a variância obtemos 12 kg2 a avaliação da dispersão torna-se difícil.

Page 11: Medidas de Dispersão

11

As equações que definem a variância da amostra, denotada porS2 são, então:

( )

1)()( 1

2

2

===

n

xx

xsxVar

n

i

i

n=é o tamanho da amostra estudada.

amostralmédiax =

( )

−=

n

xx

1n

1)x(s

2

i2

i

2

Variância Amostra

Page 12: Medidas de Dispersão

12

( )

−=

n

xx

1n

1)x(s

2

i2

i

2

Variância Amostra

OBS:

A utilização de n - 1 no denominador é indispensável para que a variância da variável na amostra possa ser um bom estimador da variância da variável na população.

Page 13: Medidas de Dispersão

13

Variância –População e Amostra

Portanto:

( )

−=

N

xx

N

1)x(σ

2

i2

i

2

Amostra

( )

−=

n

xx

1n

1)x(s

2

i2

i

2

População

Page 14: Medidas de Dispersão

14

Desvio Padrão

O desvio padrão é a medida de dispersão maisusada, tendo em comum com o desvio médio o fatode ambos considerarem os desvios em relação àmédia.

2)( =x

2)( sxs =

Amostra

PopulaçãoDispersão

absoluta

Page 15: Medidas de Dispersão

15

Exemplo de Aplicação

Vamos calcular o desvio padrão das notas das trêsequipes. Para facilitar, vamos montar uma tabelacom os dados e os cálculos necessários.

Imagine três equipes de alunos cujas notas numa mesma prova de estatística foram:Considerando que seja a populaçãoEquipe A: 5; 5; 5; 5

Equipe B: 9; 9; 1; 1

Equipe C: 6; 6; 4; 4

Page 16: Medidas de Dispersão

16

Exemplo de Aplicação

Para o cálculo da variância populacional:

( )

−=

N

xx

N

1)x(σ

2

i2

i

2

a) Equipe A: 5; 5; 5; 5

( )

= −N

X

i

iX

N

2

22 1

−=

4

20100

4

1 22

Page 17: Medidas de Dispersão

17

Exemplo de Aplicação

a) Equipe A: 5; 5; 5; 5

−=

4

400100

4

12

1001004

12 −=

Como já esperávamos uma vez que todos os valores são iguais à média e não há variabilidade (dispersão).

2 =

pontospontos 00 2 ==

Page 18: Medidas de Dispersão

18

Exemplo de Aplicação

b) Equipe B: 9; 9; 1; 1

( )

= −N

X

i

iX

N

2

22 1

−=

4

20164

4

1 22

−=

4

400164

4

12

644

12 =

22 16 pontos=

Page 19: Medidas de Dispersão

19

Exemplo de Aplicação

b) Equipe B: 9; 9; 1; 1

22 16 pontos=

O desvio-padrão vale

2 =pontospontos 416 2 ==

Page 20: Medidas de Dispersão

20

Exemplo de Aplicação

c) Equipe C: 6; 6; 4; 4

Xi Xi2

6 36

6 36

4 16

4 16

20 104

( )

= −N

X

i

iX

N

2

22 1

−=

4

20104

4

1 22

−=

4

400104

4

12

1001044

12 −=

Page 21: Medidas de Dispersão

21

Exemplo de Aplicação

c) Equipe C: 6; 6; 4; 4

Xi Xi2

6 36

6 36

4 16

4 16

20 104

O desvio padrão vale

2 =

pontoponto 11 2 ==

Page 22: Medidas de Dispersão

22

Exemplo de Aplicação

Observação – Supondo que para a Equipe Bdo exemplo anterior conhecêssemos os dadosamostrais. Usaríamos, então, n -1 e os cálculosseriam:

Variância:

( )

−= −

n

X

i

iX

nS

2

22

1

1

−=

4

20164

3

1 22S

Page 23: Medidas de Dispersão

23

Exemplo de Aplicação

−=

4

400164

3

12S

1001643

12 −=S

643

12 =S

22 33,21 pontosS =

pontospontosS 62,433,21 2 == DESVIO PADRÃO

Page 24: Medidas de Dispersão

24

Como há repetição dos valores da variável, avariância passa a ser uma média aritméticaponderada dos desvios ao redor da médiaelevados ao quadrado e às equaçõesanteriormente vistas acrescentam-se asfrequências.

Distribuição de frequência sem intervalos de classes

Page 25: Medidas de Dispersão

25

Distribuição de frequência sem intervalos de classes

Para a população, partindo-se da definição tem-se que:

( )

= −N

fX

ii

iifX

N

2

22 1

Page 26: Medidas de Dispersão

26

Para a amostra, partindo-se da definiçãotem-se que

( )

−= −

n

fX

ii

iifX

nS

2

22

1

1

Lembre-se de que nas distribuições o número de observações Nno caso de populações ou n no caso de amostras é obtido

somando-se as frequências simples absolutas das classes .

Distribuição de frequência sem intervalos de classes

Page 27: Medidas de Dispersão

27

Exemplo de Aplicação

Nas aulas anteriores, elaboramos a distribuição defrequências do número de filhos dos funcionáriosde uma empresa X.

Agora, vamos calcular a variância e o desvio padrãolembrando que a população foi investigada.

Para facilitar os cálculos, repetiremos as trêsprimeiras colunas da tabela conforme visto em aula

Page 28: Medidas de Dispersão

28

Exemplo de Aplicação

Page 29: Medidas de Dispersão

29

Exemplo de Aplicação

Page 30: Medidas de Dispersão

30

Exemplo de Aplicação

Page 31: Medidas de Dispersão

31

( )

= −N

fX

ii

iifX

N

2

22 1

−=

40

63165

40

1 22

−=

40

3969165

40

12

225,9916540

12 −=

Cálculo da variância

Exemplo de Aplicação

Page 32: Medidas de Dispersão

32

Cálculo da variância

775,6540

12 =

22 644375,1 filhos=

2 =

DESVIO PADRÃO

filhosfilhos 282332,1644375,1 2 ==

Exemplo de Aplicação

Page 33: Medidas de Dispersão

33

Supondo que a pesquisa na empresa X tivesseabrangido apenas uma amostra de 40funcionários e não a população. Usaríamos, então,n -1 e os cálculos seriam:

Variância:( )

−= −

n

fX

ii

iifX

nS

2

22

1

1

−=

40

63165

39

1 22S

225,9916539

12 −=S

22 686538,1 filhosS =

Exemplo de Aplicação

Page 34: Medidas de Dispersão

34

DESVIO PADRÃO

2SS =

filhosfilhosS 298668,1686538,1 2 ==

Exemplo de Aplicação

Page 35: Medidas de Dispersão

35

Variância - Dados agrupados com intervalo de classes

Para dados agrupados consideraremos a frequência no cálculo

da Variância e quando os dados se apresentarem em intervalos

de classe, Xi será o ponto médio do intervalo de classe. Logo,a

fórmula será:

( )

( )

−=

=

fi

fX

ii

fi

fX

ii

ii

ii

fXfi

s

fXfi

2

2

22

22

1

1

1

Page 36: Medidas de Dispersão

36

iESTATURAS

(cm)fi xi fixi fixi2

1

2

3

4

5

6

150 ι— 154

154 ι— 158

158 ι— 162

162 ι— 166

166 ι— 170

170 ι— 174

4

9

11

8

5

3

152

156

160

164

168

172

608

1.404

1.760

1.312

840

516

92.416

219.024

281.600

215.168

141.120

88.752

∑ = 40 ∑ = 6.440 ∑ = 1038.080

Ponto Médio = Xi

Exemplo de Aplicação

Page 37: Medidas de Dispersão

37

( )

567,531

31124040

1

1036840-1038.08040

1

40

6440-1.038.080

40

1

1

2

22

222

==

===

=

=

=

fi

fX

ii

iifXfi

Exemplo de Aplicação

Page 38: Medidas de Dispersão

38

Medidas de Dispersão Relativa

A dispersão relativa permite ainda compararduas ou mais distribuições, mesmo que essas serefiram a diferentes fenômenos e sejamexpressas em unidades de medidas distintas.

Page 39: Medidas de Dispersão

39

Coeficiente de Variação

É uma medida de dispersão relativaque indica a relação percentual entre odesvio padrão e a média dos dados.

100μ

σCV =

100x

sCV =

População

Amostra

Para:CV < 15% → baixa dispersão15% CV 30% → média dispersãoCV > 30% → alta dispersão

Page 40: Medidas de Dispersão

40

Em uma amostra de moradores de determinada região foramanalisadas a idade (em anos) e a altura (em metros) daspessoas. Deseja-se comparar a dispersão em termos relativosem torno da média dos dois conjuntos de dados, a fim deverificar qual deles é mais homogêneo. Na coleta dos dadosverificou-se que:

Idade das pessoas : média 41,6 e desvio padrão = 0,82

Altura das pessoas: média 1,67 e desvio padrão = 0,2

Qual conjunto de dados apresenta menor dispersão relativa em torno da média?

Coeficiente de Variação- Exemplo

Page 41: Medidas de Dispersão

41

Coeficiente de Variação- Exemplo

Interpretação dos dados: como o coeficiente de variação da

idade foi menor que o coeficiente de variação da altura,

pode-se afirmar que os dados relativos à idade são mais

homogêneos que os dados da altura.

Page 42: Medidas de Dispersão

42