1 ESTATISTICA DESCRITIVA O objetivo da Estatstica Descritiva resumir as principais caractersticas de um conjunto de dados por meio de tabelas e grficos e resumos numricos. Conceitos importantes Populao - o conjunto total de elementos portadores, de pelo menos, uma caracterstica comum. Amostra - uma parcela representativa da populao que ser examinada com o propsito de tirarmos concluses sobre essa populao.
Dados Brutos - So dados que ainda no foram numericamente organizados. Portanto difcil termos uma idia exata do comportamento do grupo como um todo. Rol - Um rol a tabela obtida aps a ordenao dos dados. Classe o intervalo de variao da varivel e simbolizado por i e o nmero total de classe simbolizado por k Limites de Classe So os extremos de cada classe. O menor nmero o limite inferior de classe (li) e o maior nmero limite superior de classe (ls). Amplitude do Intervalo de Classe obtida por meio da diferena entre o limite superior e inferior da classe e simbolizada por
hi = ls li .
Ponto Mdio da Classe o ponto que divide o intervalo de classe em duas partes iguais. Amplitude Total da Amostra (Rol) a diferena entre o valor mximo e o valor mnimo do rol. Em nosso exemplo:
AT = 61 41 = 20
Distribuio de Freqncia sem Intervalos de Classe: a simples condensao dos dados conforme a repetio de seus valores. Distribuio de Freqncia com Intervalo de Classe: Quando o tamanho da amostra mais elevado, mais racional efetuar o agrupamento dos valores em intervalos de classe. Construo: 1) Organizar os dados brutos em um rol; 2) Calcular a amplitude total da amostra; 3) Calcular o n de classes, utilizando a frmula de Sturges k = 1+ 3,22log n, onde n o nmero de dados ou de observaes; 4) Determinar a amplitude do intervalo de classe, dividindo a amplitude total AT da amostra pelo nmero de classes k, ou seja , faa h = AT / k. MEDIDAS DE TENDNCIA CENTRAL So medidas que fornecem o valor do ponto em torno do qual se distribuem os dados. A MDIA ARITMTICA mdia aritmtica uma medida estatstica que calculada somando-se todos os possveis valores de um conjunto de dados e dividindo-se pelo nmero de itens desse mesmo conjunto. 1) Para dados no-agrupados ou dados brutos Utilizamos a expresso
X =
xn
i
2) Para dados agrupados: Dados agrupados so aqueles que esto dispostos em uma tabela de distribuio de freqncias. Utilizamos a expresso:
X =A MEDIANA
x .fi
i
n
.
; onde
n = fi
A mediana o valor que ocupa a posio central de uma distribuio de dados ordenados em um rol. Consideremos tambm dois casos: 1) PARA DADOS NAO AGRUPADOS 5.2.1 Amostras de tamanho impar - Ex: 1, 4, 6, 9 e 11
Md=6
5.2.2 Amostras de tamanho par - Ex: 1, 5, 7, 10, e 11 M d = (7 + 8) /2 = 7,5 2) PARA DADOS AGRUPADOS. Utilizamos a expresso:
M d = lmdl md h n f f md = = = = =
n fi 2 .h + f md
,
Onde:
Limite Inferior da classe que contm a M d Amplitude da classe M d Tamanho da amostra Freqncia acumulada anteriores M d Freqncia absoluta da classe M d
A MODA o valor que ocorre com mais ou maior freqncia em uma distribuio de dados Aqui, tambm temos que considerar dois casos: 1) 5.3.1 DADOS NO AGRUPADOS Valor (es) que mais se repetem
2) 5.3.2 DADOS AGRUPADOS 1 Passo : Identifica-se a classe modal. A classe modal aquela que possui maior freqncia.
2 Passo : Aplica-se a frmula:
M o = li +
1 .h 1 + 2
Onde:
li
= Limite inferior da classe modal;
1 = Diferena entre a freqncia da classe modal e a classe anterior ; 2 = Diferena entre a freqncia da classe modal e a classe posterior; h = Amplitude da classe. QUARTIS So Separatrizes que dividem um conjunto de dados em quatro partes iguais 0% 25% Q1 6.1.1 Primeiro Quartil - Q1 Separatriz que divide a distribuio em duas partes, tal que 25% dos valores sejam menores que ele e 75% maiores que ele. 6.1.2 Segundo Quartil - Q2 O segundo quartil coincide exatamente com a mediana. o valor que divide a distribuio em exatamente metade dos elementos. 6.1.3 Terceiro Quartil - Q3 Valor que deixa 75% dos valores sua esquerda e os 25% restante sua direita - Frmula para o Clculo dos Quartis. a mesma utilizada para o clculo da mediana, com pequenas adaptaes. 50% Q2 75% Q3 100%
n f ant 4 Q1 = lQ1 + f Q1
.h
Determinao de Q 1 1 Passo : Calcula-se n/4; 2 Passo : Identifica-se a classe Q1, atravs da Fi ; 3 Passo : Aplica-se a frmula. - Determinao de Q3 1 Passo : Calcula-se 3n/4; 2 Passo : Identifica-se a classe Q3 pela Fi; 3 Passo : Aplica-se a frmula DECIS - Di So separatrizes que dividem uma srie ou uma seqncia de dados ou de observaes em 10 partes iguais. 0% 10 % 20% 30% 40% 50% . . . . . . . . . . . . . . . . . . . . 90% 100%
D1 - Frmula
D2
D3
D4
D5
D6
D7
D8
D9
D10
A frmula, neste caso, tambm idntica s separatrizes anteriores. - Procedimento 1 passo : Calcula-se (i . n) / 10, i = 1, 2, 3, 4, 5, 6, 7, 8, 9 2 passo: Identifica-se a classe D i pela F ac. 3 passo : Aplica-se a frmula:
Di = l Dil Di n h f Di f ant_
in f ac 10 + f Di
.h
Onde :
= limite inferior da classe D i , i = 1, 2, 3, ..9 = tamanho da amostra = amplitude de classe = freqncia da classe D i = soma das freqncias anteriores classe D i
6.3 PERCENTIS - Pi So as medidas que dividem a amostra em 100 partes iguais. 0% 1% 2% 3% 4% ....... 50% .... 97% 98% 99% 100%
P1
P2
P3
P4 ..
P50 ............P70
P97
P98
P99
P100
- Procedimento: 1 Passo: Calcula-se in / 100 , com i = 1, 2, 3, ......, 98, 99. 2 Passo: Identifica-se a classe Pi pela F ac 3 Passo: Usa-se a mesma frmula dos Decis, trocando-se l di por l Pi e f Di por f Pi MEDIDAS DE DISPERSO (VARIABILIDADE) So medidas que servem fundamentalmente para verificar a representatividade das medidas de tendncia central, pois, estas, por si s, no so suficientes para caracterizar totalmente uma seqncia numrica. A VARINCIA E O DESVIO-PADRO 1. Nosso propsito medir o grau de concentrao dos dados em torno da mdia; 2. Nada mais interessante de que estudarmos os desvios de cada valor em relao media, isto ,
(Xi X )
3. Tomando-se o somatrio de todos esses desvios, temos que: O DESVIO MDIO
d
i
=(Xi X ) =0
DM =
X
i
X
n
. fi
7.3.1 Clculo da Varincia e do Desvio-padro: Para o clculo da varincia e do desvio-padro vamos considerar as seguintes expresses: Varincia Desvio-padro Universo Populacional Amostral
2 =
( X i X )2 . fi ni
2S2
S2 =
( X
X )2 . fi
n 1
Comentrios 1 - No clculo da varincia, quando elevamos os desvios ao quadrado, a unidade de medida tambm ficar elevada ao quadrado, sempre; 2 - Em diversas situaes, a unidade de medida da varincia nem faz sentido. o caso por exemplo, em que os dados so expressos em litros, pizzas, salrios, etc... Portanto, o valor da varincia no pode ser comparado diretamente com os dados da srie, ou seja, a varincia no tem interpretao 3 - Exatamente para suprir essa deficincia da varincia que lanamos mo da definio do desvio-padro, que por sua vez, ter sempre a mesma unidade de medida da srie e portanto admite interpretao. 7.3.3 Interpretao do Desvio-padro O desvio-padro , sem dvida a mais importante das medidas de disperso e vital que o pesquisador consiga relacionar o valor obtido atravs da frmula, com os dados da srie. Quando uma curva de freqncia representativa de uma srie perfeitamente simtrica , a construo grfica em forma de sino corresponde curva normal (curva de Gauss) e podemos afirmar que:
3
2
X
+
+2
+3
Zona de normalidade (2) Intervalo (%) de valores contidos da srie 68 95 99
(X ) ( X 2 ) ( X 3 )- ZONA DE NORMALIDADE
A zona de normalidade definida por um conjunto de valores (ou uma regio) em torno da mdia aritmtica, contidos num intervalo de amplitude 2 , ou seja, - antes da mdia e + depois da mdia COEFICIENTE DE VARIAO (Disperso Relativa) Coeficiente de Variao, ou seja,
Cv =Concluso
X
1. 2.
O coeficiente de variao um nmero puro, portanto pode ser expresso em percentual. O coeficiente de variao leva em considerao tanto a mdia quanto a disperso absoluta da srie, portanto uma medida mais completa do que a disperso absoluta isoladamente;
3 . Para nosso exemplo, comparando os C V de X e Y conclui-se que Y tem menor disperso relativa do que X. MEDIDAS DE ASSIMETRIA Assimetria o grau de afastamento de uma distribuio da unidade de simetria. Quando uma distribuio simtrica, os valores da mdia, da moda e da mediana so coincidentes. A figura abaixo (a) mostra uma distribuio simtrica; (b) assimtrica positiva e (c) assimtrica negativa. (a) f f (b) f (c)
X =Mo =Mdsimtrica 8.1 COEFICIENTE DE ASSIMETRIA 1 Coeficiente de Pearson
M o M d Xassimtrica positiva
X M d M oassimtrica negativa
2 Coeficiente de Pearson (Bowley)
(X M o ) As = Observaes 1 2
As =
(Q1 + Q3 2M d ) Q3 Q1
O uso de um ou outro coeficiente vai depender da dificuldade de se calcular uma ou outra estatstica. (Q3 Q1) Chama-se Intervalo Interqualtico. = 0 < > 0 0 distribuio Simtrica. Assimtrica Negativa Assimtrica Positiva
3
AS
MEDIDAS DE CURTOSE Curtose o grau de achatamento de uma distribuio. As figuras a, b, e c mostram as trs formas que uma distribuio pode se apresentar segundo sua curtose. (b) f f f (a) (c)
mesocrtica k = 0,263 k > 0,263
leptocrtica k < 0,263
platicrtica
9.1 CLCULO DO COEFICIENTE DE CURTOSE Para se medir o Grau de Achatamento ou de Curtose de uma distribuio utiliza-se o Coeficiente:
K=
Q P90 P10
que chamado de Coeficiente Percentlico de Curtose Onde Q = 1/2 (Q 3 - Q 1) chamado de Intervalo Semi-interqualtico