Estatística Descritiva
Variáveis estatísticas
Medidas de tendência central
Medidas de dispersão
Prof. Geisla
Estatística é um conjunto de métodos usados para se analisar dados. A Estatística pode ser aplicada em praticamente todas as áreas do conhecimento humano.
O que é Estatística?
• População é o conjunto de todos os elementos ou resultados sob investigação.
• Amostra é um subconjunto de elementos pertencentes a uma população.
Variável
Quantitativa Qualitativa
Discreta Contínua Ordinal Nominal
Dados Brutos: são os primeiros dados obtidos.
Rol: organização dos dados por ordem de valor, sendo ele crescente ou decrescente.
Amplitude total (AT): dispersão entre o maior e o menor número. Quanto maior a amplitude, mais heterogêneo é o grupo.
Freqüências simples ou absolutas (fi) são os valores que realmente representam o número de dados de cada classe.
∑ fi = n
Freqüência acumulada (Fi) é o total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma dada classe:
Fk = f1 + f2 + ... + fk ou
Fk = ∑ fi (i = 1, 2, ..., k)
Freqüência acumulada relativa (Fri) de uma classe é a freqüência acumulada da classe, dividida pela freqüência total da distribuição:
Fri = Fi / ∑ f
iESTATURAS
(cm)fi xi fri Fi Fri
123456
150 154 —׀154 158 —׀158 162 —׀162 166 —׀166 170 —׀170 174 —׀
49
11853
152156160164168172
0,1000,2250,2750,2000,1250,075
491324323740
0,1000,3250,6000,8000,9251,000
∑ = 40 ∑ = 1,000
Histograma é o tipo de gráfico mais amplamente utilizado, é constituído desenhando-se barras, cujas bases são determinadas pelos intervalos de classe e cujas alturas são determinadas pelas correspondentes freqüências de classe.
Amplitude de um intervalo de classe hi = Li - li Amplitude total AT = L(máx) – l(mín) Número de classes i ≈ 1 + 3,3 . log n
Valor médio ou típico de um conjunto dados.
Média aritmética: é o valor que aponta para onde mais se concentram os dados de uma distribuição. Pode ser considerada o ponto de equilíbrio das frequências, num histograma.
n
x
n
xxxxx
n
ii
n
1321
...
A Mediana divide um grupo ordenado de valores em 2 partes iguais (50% acima e 50% abaixo da Mediana).
Se o número de itens for ímpar, a Mediana será o valor do meio.
Se o número de itens é par, a Mediana será a média dos 2 valores do meio.
2
1
nMd
2
2
1
2
nn
Md
Moda: é o valor que detém o maior número de observações, ou seja, o valor ou valores mais frequentes. A moda não é necessariamente única, ao contrário da média ou da mediana. É especialmente útil quando os valores ou observações não são numéricos, uma vez que a média e a mediana podem não ser bem definidas.
Média: Quando os dados estão agrupados em uma distribuição de frequência, o ponto médio é o valor representativo da classe.
X - ponto médio da classe f - frequência da classe
xf x
n
f x
n ( . ) .
=
Como encontrar a classe mediana:
calcula-se a F; dividir n/2; a F que se igualar ou exceder n/2,
será a classe mediana.
Med l
NF
fhi
c
2 1.
Quando as classes têm amplitudes iguais, a classe modal é a que tem a maior frequência absoluta simples.
Moda ld
d dhi
1
1 2.
li - limite inferior da classe modal;d1 - diferença entre a freqüência simples da classe modal e a anterior;d2 - diferença entre a freqüência simples da classe modal e a posterior;h - amplitude de classe.
O quanto os dados dispersam-se em torno de um valor (média).
Variância (V): Média dos quadrados dos desvios, onde desvio é a diferença entre cada dado e a média do conjunto.
1
2
n
)XX(Var
Desvio Padrão (Dp) : quanto os dados dispersam-se da média. Quanto mais próximo de zero estiver o desvio padrão, mais regular será o conjunto de valores, ou seja, mais próximos da média estarão esses valores.
VariânciaPadrão Desvio
Desvio Médio (Dm): O Desvio Médio Simples é uma medida da dispersão dos dados em relação à média de uma sequência, o “afastamento” em relação a essa média.
DM =
Top Related