ESTATSTICA DESCRITIVA
1
ESTATSTICA DESCRITIVAEtapa inicial da anlise utilizada para descrever, organizar e resumir os dados coletados.
A disponibilidade de uma grande quantidade de dados e de mtodos computacionais muito eficientes revigorou esta rea da Estatstica.
2
ESTATSTICA DESCRITIVA
O que fazer com as observaes que coletamos?
Primeira Etapa: Resumo dos dados = Estatstica descritiva3
Varivel:Qualquer caracterstica associada a uma populao.
Classificao das variveis:NOMINAL QUALITATIVA ORDINAL classe social, grau de instruo
sexo, cor dos olhos
CONTNUA QUANTITATIVA DISCRETA
peso, altura, salrio, idadenmero de filhos, nmero de carros 4
Populao:Populao estatstica ou universo estatstico o conjunto de entes portadores de pelo menos uma caracterstica em comum. Por exemplo, os estudantes constituem uma populao com uma caracterstica em comum: so os que estudam.
Amostra um subconjunto finito de uma populao5
EXERCCIOSClassifique as variveis em qualitativas ou quantitativas (contnuas ou discretas): a) Cor dos cabelos b) Nmero de filhos c) Comprimento de peas produzidas por certa mquina
6
DISTRIBUIO DE FREQUENCIA
Uma distribuio de freqncia um mtodo de se agrupar dados em classes de modo a fornecer a quantidade (e/ou a percentagem) de dados em cada classe.
Frequncia: a quantidade de vezes que um mesmo valor de um dado repetido; Dados Brutos: so os dados originais que ainda no foram numericamente organizados aps a coleta; Rol: a ordenao dos valores obtidos em ordem crescente ou descrente de grandeza numrica ou qualitativa.
7
DADOS BRUTOSFaixa etria de crianas de um acampamento X6 8 9 11 12 10 11 10 6 11 9 12 8 12 4 14 5 6 11 10 7 9 7 15 7 4 13 14 13 13
10
9
8
12
13
7
Dificulta estabelecer em torno de qual valor tendem a se concentrar as idades das crianas, ou ainda que se encontram acima ou abaixo de determinada idade.
ROL4 6 8 1010 4 7 8 10 4 7 8 12 12 13 13
11
13
5
7
9
10 11
12 12
14
6
7
9 11 13
14
6
8
9
15
Dados organizados
FREQUNCIAIdade 4 5 6 7 8 9 10 11 12 13 14 15 Frequncia 3 1 3 4 4 4 4 3 4 4 2 1
ELEMENTOS DE UMA DISTRIBUIO DE FREQUNCIAClasses: caso as colunas da tabela de distribuiao de frequncia contenham muitos valores elencados, podemos reduzir a quantidade desses valores elencados agrupando-os em intervalos. Esses agrupamentos de valores num intervalo de abragncia so chamados de classes
CLASSESIdade4I-6 6l-8 8l-10 10l-12 12l-14
Frequncia4 7 8 7 8
14l-16
3
LIMITES DE CLASSE
Limite inferior (li): o nmero menor o limite inferior da classe (4l-6) em que l1 = 4.
Limite superior (Li): o nmero maior o limite superior da classe (4l-6) em que L1 = 6.l- : este simbolo estabelece incluso e excluso para os valores limites de um dado intervalo de classe. Ex:
4 l- 6 = indica incluso do limite inferior (4) e excluso do limite superior (6).
AMPLITUDE DE CLASSES (HI)
A amplitude de um intervalo de classe (hi) a diferena entre o limite superior e inferior de uma classe:
hi = Li lih1= 6 4 = 2 anos; h2= 8 6 = 2 anos; h3= 10 8 = 2 anos; h4= 12 10 = 2 anos; h5= 14 12 = 2 anos; h6= 16 14 = 2 anos;
AMPLITUDE DO INTERVALO DE CLASSEAmplitude do intervalo de Classe (h): o comprimento da classe, sendo geralmente definida como a diferena entre os limites superior e inferior ou:
15
PONTO MDIO DE UMA CLASSE (XI)
Ponto mdio de uma classe (xi) o ponto que , por situar-se numa posio mdia da distribuio de valores do intervalo de classe, divide o intervalo em duas partes iguais.
Xi = li + Li/2 Ponto mdio da primeira classe: x1 = 4+6/2 = 5.
N. DE CLASSES
O nmero de classes em uma distribuio de freqncias, representado por k. REGRA DE STURGES para determinao do nmero de classes: Essa regra estabelece que o nmero de classes igual a: k = 1 + 3,3 log10 n, onde k = nmero de classes e n = n total de observaes Exemplos: a) Se o nmero de observaes for 500: n = 500; k = 1 + 3,3 log10(500) = 1 + 3,3(2,699) = 9,907 k = 9,907 ou arredondando k=10 b) Se n = 50: k = 1 + 3,3log10(50) = 1 + 3,3(1,699) = 6,607 k=7
17
TIPOS DE FREQUNCIAFrequncia simples ou absoluta (fi): o nmero de observaes de um valor individual (ou de uma classe).FrequnciaQuantidade de crianas por faixa etria 4 7 8 7 8 3
Idade4I-6 6l-8 8l-10 10l-12 12l-14 14l-16
Frequncia Simples ou Absoluta
Frequncia relativa (fr): representa a proporo de observaes de um valor (ou de uma classe) em relao ao nmero total de observaes, o que facilita a observao.Frequncia (fi)4 7 8 7 8 3 37
Idade4I-6 6l-8 8l-10 10l-12 12l-14 14l-16 Total
Fr = fi/fi *100
Fr2= 7/37*100 = 18,9% esta classe representa
Frequncia acumulada (Fi): a soma de todas as frequncias abaixo do limite superior de uma classe considerada. F4 = f1 + f2 + f3 + f4 = 4 + 7 + 8 + 7 = 26 F4 =26 Existem 30 crianas abaixo de 12 anos.Idade4I-6 6l-8 8l-10 10l-12 12l-14 14l-16 Total
Frequncia (fi)4 7 8 7 8 3 37
TABELA DE DADOSIdade 4I-6 6l-8 8l-10 10l-12 fi 7 8 8 7 xi 5 7 9 11 fr (%) 18,9 21,6 21,6 18,9 Fi 7 15 23 30 Fri
12l-1414l-16 Total
61 37
1215
16,22,8
3637
EXERCCIOS
Tabular os seguintes dados, calcular as respectivas frequncias, elaborar classes, calcular os pontos mdios. Elaborar um grfico com as classes criadas com suas respectivas frequncia relativa.2832 45 30 30 21 23
2054 55 55 46 49 49
4545 61 61 63 65 25
2727 49 46 34 32 29
6654 53 50 50 25 25
5555 57 57 59 45 44
4848 48 41 41 35 28
4040 49 47 36 39 39
5660 33 35
6265 23 26
2433 37 38
2937 38 42
3133 26 37
4437 37 32
2626 36 47
4342 30 30
EXERCCIOS1)Os resultados do lanamento de um dado 20 vezes foram: 656 343 5241 4561 312415 Forme uma distribuio de frequncia sem intervalos de classe. 2) Observe a distribuio de frequncia:
23
VARIVEIS QUANTITATIVAS
MEDIDAS DE POSIO:Mnimo, Mximo, Moda, Mdia, Mediana, Percentis
MEDIDAS DE DISPERSO:Amplitude, Varincia, Desvio Padro, Coeficiente de Variao.24
MEDIDAS DE POSIO
Mximo (max): a maior observao Mnimo (min): a menor observao Moda (mo): o valor (ou atributo) que ocorre com maior freqncia.
Dados: 4, 5, 4, 6, 5, 8, 4max = 8 min = 4 mo = 425
Mdia:
x1 x2 x3 ... xn x nDados: 2, 5, 3, 7, 825378 x 5 5
xi 1
n
i
n
26
Mediana:A mediana o valor da varivel que ocupa a posio central de um conjunto de n dados ordenados.Posio da mediana: n+1 227
Exemplos:Dados: 2, 6, 3, 7, 8Posio da Mediana
n = 5 (mpar) Md=6
Dados ordenados: 2 3 6 7 8
Dados: 4, 8, 2, 1, 9, 6
n = 6 (par)
Dados ordenados: 1 2 4 6 8 9 Md Md = (4 + 6) / 2 = 528
Medidas de DispersoFinalidade: encontrar um valor que resuma a variabilidade de um conjunto de dadosAmplitude (A): A = mx - min Para os grupos anteriores, temos: Grupo 1, A = 4 Grupo 2, A = 8 Grupo 3, A = 0
29
Varincia:(x1 x )2 (x 2 x )2 ... (x n x ) 2 n (xi x )2 2 Varincia s n 1 n 1 i 1
Desvio padro:Desvio Padro s Varincia
30
Clculo para os grupos:G1: s2 =(3-5)2+(4-5)2+ (5-5)2+ (6-5)2+ (7-5)2
4 s2 = 10/4= 2,5 s = 1,58G2: s2 = 10 s = 3,16 G3: s2 = 0 s = 031
Frmula alternativa:
S
2
Xii 1
n
2
nX
2
( n 1)
Em G1: Xi2 = 9 + 16 + 25 + 36 +49 = 135 S2 = 135 - 5(5)2 = 2,5
4
32
Coeficiente de Variao (CV)- uma medida de disperso relativa - elimina o efeito da magnitude dos dados - exprime a variabilidade em relao mdias CV 100% x33
Exemplo 3:Altura e peso de alunosMdiaAltura 1,143m Peso 50 kg Desvio Padro 0,063m 6kg Coef. de Variao 5,5% 12%
Concluso: Os alunos so, aproximadamente, duas vezes mais dispersos quanto ao peso do que quanto altura.34
Exemplo 4:Altura (em cm) de uma amostra de recmnascidos e de uma amostra de adolescentesMdiaRecm-nascidos Adolescentes
Desvio padro6 16
Coef. de variao12% 10%
50 160
Concluso: Em relao s mdias, as alturas dos adolescentes e dos recm-nascidos apresentam 35 variabilidade quase iguais.
Medidas de Posio Tendncia Central
Exerccio:Inspecionaram-se quinze rdios antes da remessa e os nmeros de defeito por unidade so apresentados no quadro abaixo:
1 0 3
Nmeros de defeito por rdio 4 0 2 2 3 0 1 1 1
1 0 1
Encontre a mdia, a mediana, a moda, a varincia e o desvio-padro do nmero de defeitos.
EXERCCIOS
Uma pesquisa foi realizada numa cidade, do interior de Minas Gerais, cujo intuito saber o nmero de pessoas por residncia. A amostra de 30 residncias e as primeiras informaes seguem no Quadro 1 :
37
EXERCICIOSDada uma amostra das notas dos alunos da disciplina de estatistica, calcule a media aritmetica: {5.0, 6.5, 5.5, 8.0, 7.5, 6.0, 5.1, 7.0} Do-se a seguir o nmero de ces perdidos que foram capturados e encaminhados a um abrigo de animais em 20 dias: 4 6 8 4 2 6 4 3 4 9 5 8 5 3 5 7 6 3 8 6 Calcule a mdia de ces capturados por dia Calcule a Moda Calcule a Mediana Calcule o desvio-padro
38
Mdias e Desvio-padro - ExercciosUm comerciante est interessado em comprar 100 garrafas de cachaa para o seu estabelecimento. No entanto, como de preferncia de sua clientela, necessrio que a cachaa escolhida apresente um teor alcolico de no mnimo 33% em volume. Ele consultou alguns fornecedores e obteve as seguintes informaes:
Teor alcolico de trs tipos de aguardente pesquisadas. Marca A (R$ 3,50/l) Marca B (R$ 4,10/l) Marca C (R$ 3,65/l) 38,7 35,7 38,7 33,5 36,4 33,5 32,5 35,9 34,5 31,2 33,2 34,2 35,9 34,1 35,9Calcule mdia,moda, coeficiente de variao mediana, desvio-padro e
Vamos supor que eu quero comprar uma lmpada para a minha casa e quero que ela dure pelo menos 700 h. Eu solicito a dois fabricantes o tempo de vida til de suas lmpadas e eles me fornecem os seguintes dados:
Fabricante A (h) 730 710 705 720 765 750
Fabricante B (h) 1000 687 700 850 587 710
Supondo que as duas lmpadas custam o mesmo valor, qual delas eu deveria comprar?
MDIA EM DADOS AGRUPADOS
41
MDIA EM DADOS AGRUPADOS
42
MEDIANA EM DADOS AGRUPADOS
43
MEDIANA EM DADOS AGRUPADOS
44
45
EXERCCIO
Ache a mdia e mediana da seguinte distribuio de notas de 500 alunos de um teste de estatstica:Nota 10-24 25-39 40-54 55-69 70-84 85-99 Total Nmero de Estudantes 44 70 92 147 115 32 500
46
EXERCCIO
Ache a mdia e mediana da seguinte distribuio de idades dos membros do sindicato:Idade 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 Total Freqncia 18 42 78 115 178 107 88 52 30 11 71947