I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14...

30
Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias Universidade Federal de Minas Gerais MEDIDAS RESUMO

Transcript of I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14...

Page 1: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

Estatística Básica

Renato Dourado MaiaInstituto de Ciências Agrárias

Universidade Federal de Minas Gerais

MEDIDAS RESUMO

Page 2: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 2/30

Motivação Básica

• Se você estivesse num ponto de ônibus e alguém perguntasse sobre o quanto um determinado ônibus demora para passar, o que você responderia? – Com certeza você não apresentaria uma tabela de fre-

quências e tampouco um modelo teórico para a variável aleatória de interesse!

• Quem perguntou deseja uma resposta breve que sintetize a informação e não uma completa descri-ção completa dos dados coletados ou de uma mode-lagem que eventualmente foi feita.

Page 3: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 3/30

Motivação Básica

• Nesta unidade serão apresentadas algumas medidas que sumarizam as informações disponíveis sobre o comportamento de uma variável, seja para um con-junto de dados – toda a população ou uma amostra, seja para variáveis aleatórias.

• Essencialmente, estudaremos medidas que represen-tam tendência central e dispersão.

Page 4: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 4/30

Medidas de Posição (Tendência Central)

• Seja uma variável X com observações x1, x2, …,xn. – A mediana (mdobs) é o valor que ocupa a posição central

dos dados ordenados.– A moda (moobs) é dada pelo valor mais frequente.– A média é dada pela soma das observações dividida pelo

número de observações:

xobs=x1+x2+⋯+xn

n=

∑i=1

n

x i

n=

n1 x1+n2 x2+⋯+nk xk

n1+⋯+nk

=

∑i=1

k

ni x i

n=∑

i=1

k n i

nx i .

Tabela de Frequências

Page 5: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 5/30

Exemplo 1

• Suponha que parafusos a serem utilizados em toma-das elétricas são embalados em caixas rotuladas co-mo contento 100 unidades. Em uma construção, 10 caixas de um lote tiveram o número de parafusos contados, fornecendo os valores 98, 102, 100, 100, 99, 97, 96, 95, 99, 100. Determine, para o número de parafusos por caixa, a média, a moda e a mediana.

Page 6: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 6/30

Exemplo 1

• Dados ordenados: 95, 96, 97, 98, 99, 99, 100, 100, 100, 102.

{→ md obs=

quinto elemento+sexto elemento2

=99+99

2=99

→ mo obs=100

→ xobs=98+102+⋯+100

10=

98610

=98,6

Page 7: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 7/30

Pergunta

Quando utilizar cada uma das medidas de

posição?

Page 8: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 8/30

Medidas de Posição (Tendência Central)

• As medidas de posição podem ser utilizadas em con-junto para auxiliar na análise dos dados. Em determi-nadas situações, entretanto, uma pode ser mais con-veniente do que as outras.– Se há valores discrepantes, a mediana é menos afetada do

que a média.– Se há muitas observações, a mediana é mais difícil de ser

calculada, mesmo considerando a utilização de computado-res, pois o processo de ordenação é custoso.

– Há distribuições multimodais – conjuntos de dados com mais do que uma moda.

Page 9: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 9/30

"Basic Statistics of Movable Points" from the Wolfram Demonstrations Project

http://demonstrations.wolfram.com/BasicStatisticsOfMovablePoints

Page 10: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 10/30

"Mean, Median, Mode" from the Wolfram Demonstrations Project

 http://demonstrations.wolfram.com/MeanMedianMode/

Page 11: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 11/30

Medidas de Posição (Tendência Central)

• Seja uma VA X com possíveis valores x1, x2, …,xk e cor-respondentes probabilidades p1, p2, …, pk. – A média, valor esperado ou esperança matemática de X,

denotada por E(X), μX, ou simplesmente μ, é dada pela expressão:

– A moda (Mo) de X é(são) o(s) valor(es) da variável com maior probabilidade, ou seja:

E (X )=∑i=1

k

x i pi .

P (X =Mo)=max( p1, p2,⋯, pk ) .

Page 12: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 12/30

Medidas de Posição (Tendência Central)

• Seja uma VA X com possíveis valores x1, x2, …,xk e cor-respondentes probabilidades p1, p2, …, pk. – A mediana de X (Md) é o valor que satisfaz às seguintes

condições:

– Em algumas situações, as desigualdades são satisfeitas por qualquer valor num certo intervalo e, nesse caso, toma-se a mediana como o ponto médio do intervalo.

P (X ≥Md )≥0,5 e P(X ≤Md )≥0,5.

Page 13: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 13/30

Exemplo 2

• Determine a média, e moda e a mediana para a VA X com a função discreta de probabilidade apresentada na tabela a seguir.

X -5 10 15 20

pi 0,3 0,2 0,4 0,1

{→ μ =∑i=1

4

x i p i=(−5)×(0,3)+10×0,2+15×0,4+20×0,1=8,5

→ Mo=15→ Md ∈ [10,15]⇒ Md=12,5

Page 14: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 14/30

Medidas de Posição (Tendência Central)

X x1 x2 ... xk

ni n1 n2 ... nk

X x1 x2 ... xk

pi p1 p2 ... pk

xobs=1n∑i=1

k

ni x i

Conjunto de Dados Variável Aleatória

Valores

Média

Mediana

Moda

μ=∑i=1

k

x i pi

md obs=valor centralP (X ≥Md )≥0,5 e

P(X ≤Md )≥0,5

moobs=valor com maior

frequênciaMo=valor com maior

probabilidade

Page 15: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 15/30

Pergunta

A renda per capita é a-propriada para compa-

rar a distribuição de renda de dois países?

Page 16: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 16/30

Medidas de Dispersão

• As medidas de posição podem esconder valiosas in-formações, pois elas não capturam a variabilidade dos valores da variável em estudo.– Diferentes conjuntos de dados, por exemplo, podem ter

medidas de posição idênticas. – Nesses casos, é provável que existam diferenças em rela-

ção à dispersão dos dados, isto é, quanto à maneira como os valores de cada conjunto se espalham.

• Para quantificar a dispersão dos dados, são utilizadas medidas de dispersão.

Page 17: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 17/30

Medidas de Dispersão

Page 18: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 18/30

Medidas de Dispersão – Conjunto de Dados

• A amplitude (Δ) é definida como a diferença entre o maior e o menor valor do conjunto de dados.

• Desvio mediano:

• Desvio médio:

desvio mediano=1n∑i=1

n

∣xi−md obs∣.

desvio médio=1n∑i=1

n

∣xi− xobs∣.

Page 19: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 19/30

Medidas de Dispersão – Conjunto de Dados

• Os desvios mediano e médio utilizam a função mó-dulo, cuja derivada é descontínua, o que dificulta o tratamento matemático:– O que se pode dizer sobre a derivada da função módulo?

• Em função disso, é comum a utilização de uma medi-da de dispersão que tenha propriedades matemáti-cas mais interessantes.

Page 20: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 20/30

Medidas de Dispersão – Conjunto de Dados

• A variância de uma variável X referente a um con-junto de dados, denotada por varobs, pode ser calcu-lada por meio da seguinte expressão:

• O desvio-padrão (dpobs), que tem a mesma unidade dos dados originais, é definido como a raiz quadrada positiva da variância.

var obs=1n∑i=1

n

( xi− xobs )2.

Page 21: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 21/30

Medidas de Dispersão – Conjunto de Dados

• A expressão a seguir facilita o cálculo da variância:

• Para o caso de os dados estarem disponíveis numa tabela de frequências, são utilizadas as seguintes ex-pressões para o cálculo da variância:

var obs=(1n∑i=1

n

x i2)− xobs

2 .

var obs=1n∑i=1

k

ni (x i− xobs)2=(1

n∑i=1

k

n i xi2)− xobs

2 .

Page 22: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 22/30

• Seja uma VA X com P(Xi = xi) = pi, i = 1, 2, …, k, e média μ. A variância de X é a ponderação, pelas res-pectivas probabilidades, dos desvios relativos à mé-dia, elevados ao quadrado, isto é,

• Normalmente, a variância por σ2 e o desvio-padrão por σ.

Medidas de Dispersão – Variável Aleatória

Var (X )=∑i=1

k

( xi−μ )2

p i .

Page 23: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 23/30

• A variância de definida no slide anterior pode ainda ser considerada como o valor esperado de uma nova variável aleatória, o desvio ao quadrado, isto é,

• Essa expressão pode ser reescrita da seguinte forma:

Medidas de Dispersão – Variável Aleatória

Var (X )=E [(X −μ )2].

Var (X )=E ( X 2)−μ 2=∑

i=i

k

p i xi2−μ 2 .

Page 24: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 24/30

Medidas de Dispersão

X x1 x2 ... xk

ni n1 n2 ... nk

X x1 x2 ... xk

pi p1 p2 ... pk

Conjunto de Dados Variável Aleatória

Valores

Variância {var obs=1n∑i=1

k

ni ( xi− xobs )2

var obs=(1n ∑i=1

k

n i xi2)− xobs

2 {σ2=E [(X −μ )

2 ]=∑i=1

k

pi (x i−μ )

σ 2=E ( X 2)−μ 2

=∑i=i

k

pi xi2−μ 2

Page 25: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 25/30

Propriedades da Média e da Variância

Exercício interessante: demonstrar essas propriedades...

Conjunto de Dados Variável Aleatória

Y =aX + b

yobs=a xobs+b

var obs(Y )=a2 var obs(X )

Y =aX + b

E (Y )=aE (X )+ b

Var (Y )=a2Var (X )

Page 26: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 26/30

Variável Discreta Valor Esperado Variância

Uniforme (1, k)

Bernoulli (p)

Binomial (n, p)

Geométrica (p)

Poisson (λ)

Hipergeométrica(n, m, r)

1+ k2

p

np

1−pp

λ

rmn

k 2−1

12

p (1− p)

np (1− p)

1−p

p2

λ

rm(n−m)(n−r )

n2(n−1)

Exercício interessante: calcular...

Page 27: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 27/30

"Descriptions of Univariate Data" from the Wolfram Demonstrations Project

http://demonstrations.wolfram.com/DescriptionsOfUnivariateData

Page 28: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 28/30

"Illustrating the Use of Discrete Distributions" from the Wolfram Demonstrations Project

http://demonstrations.wolfram.com/IllustratingTheUseOfDiscreteDistributions

Page 29: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 29/30

"Mathematica 7's Discrete Distributions" from the Wolfram Demonstrations Project

http://demonstrations.wolfram.com/Mathematica7sDiscreteDistributions/

Page 30: I < » Âý9Y: 6#A çó¨ æ ùW `Zûÿ § ÕjGñ¦O)w6ES V)ø,Õѱ ÷Sn7 S ... · 25/08/14 Estatística Básica – Renato Dourado Maia 16/30 Medidas de Dispersão • As medidas

25/08/14 Estatística Básica – Renato Dourado Maia 30/30

That's All Folks!

Próxima aula: exercícios do capítulo 4...