Unidade I
ESTATÍSTICA APLICADA
Prof. Luiz Felix
O termo estatística
Provém da palavra Estado e foi utilizadooriginalmente para denominarlevantamentos de dados, cuja finalidadeera orientar o Estado em suas decisões.
Foi utilizado em épocas remotas paradeterminar o valor dos impostoscobrados dos cidadãos e até mesmopara determinar a estratégia de umanova batalha.
Definição
Estatística é um conjunto de técnicas e métodos que nos auxiliam no processode tomada de decisão na presença de incerteza.
Exemplos de aplicações:
caracterização de perfil sócio-econômico;
análise de intenção de votos;
levantamento de pessoas com nível universitário.
População e amostra
População conjunto de todos os itens(pessoas, coisas, objetos) que interessam ao estudo de um fenômenocoletivo segundo alguma característica.
Amostra qualquer subconjunto nãovazio de uma população.
Estatística descritiva
Estatística descritiva é a parte da Estatística que tem por objetivodescrever os dados observados.
Exemplo: Índice Nacional de Preço aoConsumidor (INPC), que envolve asintetização dos aumentos dos produtos da cesta básica.
Estatística indutiva
Estatística indutiva é a parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra, através do cálculo de probabilidade. O cálculo de probabilidade é queO cálculo de probabilidade é que viabiliza a inferência estatística.
Exemplo: análise do mercado financeiro visando explicar tendênciasdas taxas de juros.
Principais fases do método estatístico
Definição do problema
Planejamento
Coleta de dados
Apuração dos dados
Apresentação dos dados
Análise e interpretação dos dados
Dados estatísticos
Quando se trabalha com a observação, a mensuração, a análise e a interpretação de números, esses números nos conduzem a índices inflacionários, índices de desemprego, probabilidade de determinado candidato ganhar asdeterminado candidato ganhar as eleições etc.
Tais números serão chamados de dados estatísticos.
Dados brutos e rol
Dados brutos uma sequência devalores numéricos não organizados, obtidos diretamente da observação deum fenômeno coletivo. Exemplo: idade dos meus professores: 49 63 34 2749, 63, 34, 27.
Rol uma sequência ordenada dedados brutosExemplo: idade dos meus professores: 27, 34, 49, 63 ou 63, 49, 34, 27.
Variáveis
Quantitativas
Contínuas – assumem qualquer valor em um intervalo. Ex.: idade.
Discretas – originam-se da contagem de itens. Ex.: quantidade de produtositens. Ex.: quantidade de produtos produzidos por dia.
Qualitativas
Nominais – definem categorias. Ex.: separação por sexo.
Por posto – dispõem os elementos em uma ordem de preferência. Ex.: primeiro, segundo...
Interatividade
Qual das seguintes séries abaixo representa um rol?
a) X: 1, 2, 3, 5, 4, 6
b) Y: 6, 5, 4, 7, 8, 9
c) Z: 1 1 3 3 5c) Z: 1, 1, 3, 3, 5
d) K: 5, 1, 1, 3, 3
e) L: 2, 2, 7, 8, 9, 1
Notação por índices
O símbolo xi (lê-se “x índice i”) irá representar qualquer um dos n valores assumidos pela variável x. (x1, x2, ..., xn). “n” é denominado índice e poderá assumir qualquer dos números entre 1, 2 3 4 n2, 3, 4..., n.
NOTAÇÃO SIGMA (∑):A maioria dos processos estatísticos irá exigir o cálculo da soma de um conjunto de números. A letra maiúscula grega sigma (∑) é utilizada para representarsigma (∑) é utilizada para representar essas somas.
Medidas de tendência central
Quando estamos diante de um conjunto de dados, seja ele pequeno ou grande, em geral, buscamos medidas que possam ser usadas para indicar um valor que tende a representar melhor aquele determinado conjunto de númerosdeterminado conjunto de números.
As medidas mais usadas nesse sentido são as chamadas medidas de tendência central:
média;
mediana;mediana;
moda.
Média aritmética
É um valor calculado para um grupo de dados, usado para descrevê-los. É o ponto de equilíbrio dos dados.
x = ∑ xix ∑ xi
n
xi : cada variável da amostra.
n: é o número total de observações.
Média aritmética – exemplo
Calcule a média aritmética do conjunto de dados:
xi = 3, 5, 8, 12, 7, 25
x = ∑ x = 3 + 5 + 8 + 12 + 7 + 25 = 60 = 10
n 6 6
Interpretação: O valor médio dos dados é 10, ou seja, os valores deste conjunto , j , jde dados concentram-se em torno do 10.
Média aritmética – exemplo
Calcule a média aritmética do conjunto de dados:
xi = 1, 1, 3, 5
x = ∑ x = 1 + 1 + 3 + 5 = 10 = 2,5
n 4 4
Interpretação: O valor médio dos dados é 2,5, ou seja, os valores deste conjunto de , , j , jdados concentram-se em torno do 2,5.
Média aritmética ponderada
A cada valor xi deverá ser atribuído um peso wi .
xp = ∑ xi . wi
∑ w∑ wi
xi : cada variável da amostra.
wi : cada peso da amostra.
Média aritmética ponderada –exemplo
Um aluno tirou as notas 7, 3, 6 e 5 em quatro avaliações que, respectivamente, tinham os pesos 2, 5, 1, 2. Calcule a média do aluno levando-se em conta os pesos das avaliações.
xp = ∑ xi . wi = 7.2 + 3.5 + 6.1 + 5.2 = 45 = 4,5
∑ wi 2 + 5 + 1 + 2 10
Mediana
É um valor que separa o rol em duas partes deixando à sua esquerda o mesmo número de elementos que estão à sua direita. É o ponto que ocupa a posição central em uma série.
Se o número de elementos do rol forímpar, a mediana será o valor do meio.
Se o número de elementos do rol for par, a mediana será a média dos 2 valores do meio.
Podemos calcular a posição da mediana com a fórmula:
posmed = (n + 1)
2
Mediana – exemplo
Determinar a mediana
xi = 2, 20, 12, 23, 20, 8, 12
Solução:
Rol xi: 2, 8, 12, 12, 20, 20, 23
n = 7, logo:
posmed = (7 + 1) = 8 = 4ª posição
2 2
A mediana é o elemento que ocupa a 4ª posição: mediana = 12posição: mediana = 12
Mediana – exemplo
Determinar a mediana
xi = 7, 21, 13, 15, 10, 8, 9, 13
Solução:
Rol xi: 7, 8, 9, 10, 13, 13, 15, 21
n = 8, logo:
posmed = (8 + 1) = 9 = 4,5ª posição
2 2
Neste caso, deve-se tirar a média entre os 2 valores do meio para se obter a medianavalores do meio para se obter a mediana.md = 10 + 13 = 23 = 11,5
2 2
Moda
É o valor de maior frequência em um conjunto de dados.
Se o conjunto de dados possui:
Uma moda unimodal
Duas modas bimodal Duas modas bimodal
Três modas trimodal
4 ou mais modas polimodal
Nenhuma moda amodal
Moda – exemplos
Determinar a moda
xi = 2, 8, 3, 5, 4, 5, 3, 5, 5, 1
Solução: Rol xi: 1, 2, 3, 3, 4, 5, 5, 5, 5, 8
moda = 5 unimodal
Determinar a moda
xi = 5, 4, 3, 3, 5, 4
Solução: Rol xi: 3, 3, 4, 4, 5, 5
não existe moda amodal
Interatividade
Para o seguinte conjunto de dados
xi = 5, 9, 7, 31, 21, 13, 13, 21,
determinar a média aritmética simples, a mediana e a moda.
a) Média = 15; mediana = 13; moda = 13 e 21a) Média = 15; mediana = 13; moda = 13 e 21
b) Média = 15; mediana = 26; moda = 13 e 21
c) Média = 14; mediana = 26; moda = 13
d) Média = 15; mediana = 13; moda = 21
e) Média = 14; mediana = 26; moda = 13 e 21e) Média = 14; mediana = 26; moda = 13 e 21
Medidas de dispersão
Indicam o quanto os dados estão
dispersos em torno da região central.
Quanto maiores as medidas de dispersão, mais heterogêneos são os dados e ao contrário quanto menoresdados, e, ao contrário, quanto menores essas medidas, mais homogêneo o conjunto.
Analisaremos as seguintes medidas de dispersão:
lit d t t l amplitude total;
desvio padrão;
variância.
Medidas de dispersão
Considere os seguintes conjuntos de valores das variáveis X, Y e Z:
X: 70, 70, 70, 70, 70
Y: 68, 69, 70, 71, 72
Z: 5 15 50 120 160Z: 5, 15, 50, 120, 160
Os 3 conjuntos apresentam a mesma média aritmética: 70.
Notamos que o conjunto X é mais homogêneo que os conjuntos Y e Z.
Medidas de dispersão
Quando se deseja entender, analisar e descrever de forma adequada um determinado conjunto de dados, faz-se necessário dispor não apenas de informações relativas à média, mediana e modamoda.
É preciso que se disponha de informações relativas à variabilidade (dispersão) dos números que compõem o referido conjunto de dados.
Essas medidas de variabilidade ou dispersão indicam se os dados observados estão próximos ou separados uns dos outros.
Amplitude total
A amplitude total, ou intervalo, de um determinado conjunto de dados é obtido pela diferença entre o maior e o menor valor nesse conjunto de números.
Amplitude Total = Valor Máximo – Valor Mínimo
Sendo xi: 7, 8, 9, 10, 13, 20
Amplitude Total = 20 – 7 = 13
Desvio médio
A dispersão dos dados em relação à média de uma sequência pode ser avaliada através dos desvios de cada elemento da sequência em relação à média da sequência.
DMédio = ∑ | xi x |
n
Em que n é o número de observações.
Exemplo de | x |
| 3 | = 3
| 3 | = 3
Desvio médio – exemplo
Para o conjunto de dados xi = 2, 8, 4, 6, calcule o desvio médio.
Solução: DMédio = ∑ | xi x |
n
x = 2 + 8 + 4 + 6 = 20 = 5x = 2 + 8 + 4 + 6 = 20 = 5
4 4
DM = | 2 5 | + | 8 5 | + | 4 5 | + | 6 5 |
4
D = | 3| + | 3 | + | 1| + | 1 | = 3 + 3 + 1 + 1DM = | 3| + | 3 | + | 1| + | 1 | = 3 + 3 + 1 + 1
4 4
DM = 2
Variância e desvio padrão (população e amostra)
POPULAÇÃO
Variância: σ2 = ∑ (xi – x)2
n
Desvio Padrão: σ = σ2
AMOSTRA
Variância: S2 = ∑ (xi – x)2
n – 1
Desvio Padrão: S = S2
Variância e desvio padrão (população) – exemplo
Para a população xi = 4, 5, 8, 5, calcule a variância e o desvio padrão.
Solução: σ2 = ∑ (xi x)2 e σ = σ2
n
x = 4 + 5 + 8 + 5 = 22 = 5 5x = 4 + 5 + 8 + 5 = 22 = 5,5
4 4
σ2 = (4 5,5)2 + (5 5,5)2 + (8 5,5)2 + (55,5)2
4
σ2 = ( 1 5)2 + ( 0 5)2 + (2 5)2 + ( 0 5)2 = 2 25σ2 = (1,5)2 + (0,5)2 + (2,5)2 + (0,5)2 = 2,25
4
Desvio padrão: σ = σ2 = 2,25 = 1,5
Variância e desvio padrão (amostra) – exemplo
Para a amostra xi= 4, 5, 8, 5, calcule a variância e o desvio padrão.
Solução: S2 = ∑ (xi x)2 e S = S2
n – 1
x = 4 + 5 + 8 + 5 = 22 = 5 5x = 4 + 5 + 8 + 5 = 22 = 5,5
4 4
S2 = (4 5,5)2 + (5 5,5)2 + (8 5,5)2 + (55,5)2
4 – 1
S2 = ( 1 5)2 + ( 0 5)2 + (2 5)2 + ( 0 5)2 = 9 = 3S2 = (1,5)2 + (0,5)2 + (2,5)2 + (0,5)2 = 9 = 3
3 3
Desvio padrão: S = S2 = 3 = 1,73
Interatividade
Para a população xi = 1, 9, 3, 7, 5, calcule a variância e o desvio padrão.
a) Variância = 7 e desvio padrão = 2,64
b) Variância = 8 e desvio padrão = 2,82
c) Variância = 9 e desvio padrão = 3c) Variância = 9 e desvio padrão = 3
d) Variância = 10 e desvio padrão = 3,16
e) Variância = 11 e desvio padrão = 3,31
Distribuição de frequências
A distribuição de frequências é o modo de tratamento de dados utilizado quando é grande a quantidade de dados brutos, e passamos a agrupar os dados estatísticos em subconjuntos com características semelhantescaracterísticas semelhantes.
A distribuição de frequências é a organização de dados em classes ou intervalos, para determinar o número de observações ou a percentagem de observações de cada classe chamadaobservações de cada classe, chamada de frequência de classes.
Distribuição de frequências
Classe: são intervalos que subdividem a amplitude total.
Limites de classe: são os limites extremos de cada classe.
Li é o menor valor das classes consideradas.
Ls é o maior valor das classes consideradas.
Amplitude de classe: é a diferença entre o limite Li e o Ls da classe e determina alimite Li e o Ls da classe e determina a amplitude das classes de uma distribuição de frequências.
h = Ls – Li
Distribuição de frequências
Li = 140 Ls = 150
Nº de classes = 4
Amplitude da classe h = 10
Alguns conceitos de uma distribuição de frequência
Frequência relativa %: é o quociente entre a frequência absoluta da i-ésima classe com o somatório das frequências, multiplicando esse resultado por 100:
fri% = fi . 100
n
Frequência acumulada: é o somatório da frequência absoluta da i-ésima classe com a frequência absoluta das classes anteriores.
Distribuição de frequências –exemplo
A observação das notas de 30 alunos em uma prova mostrou os valores:
3; 4; 2,5; 4; 4,5; 6; 5; 5,5; 6,5; 7;
7,4; 2; 3,5; 5; 5,5; 8; 8,5; 7,5; 9; 9,5;
5; 5 5; 4 5; 4; 7 5; 6 5; 5; 6; 6 5; 65; 5,5; 4,5; 4; 7,5; 6,5; 5; 6; 6,5; 6.
Distribuição de frequências –variável contínua
Rol
2; 2,5; 3; 3,5; 4; 4; 4; 4,5; 4,5; 5;
5; 5; 5; 5,5; 5,5; 5,5; 6; 6; 6; 6,5;
6,5; 6,5; 7; 7,4; 7,5; 7,5; 8; 8,5; 9; 9,5
xi fi fri% Fi Fri%
2 |-- 4 4 13,33 4 13,33
4 |-- 6 12 40 16 53,33
6 |-- 8 10 33 34 26 86 676 | 8 10 33,34 26 86,67
8 |-- 10 4 13,33 30 100
∑ 30 100 --- ---
Distribuição de frequências –exemplo
xi fi fri% Fi Fri%
2 |-- 4 4 13,33 4 13,33
4 |-- 6 12 40 16 53,33
6 |-- 8 10 33,34 26 86,67
Alunos com nota > = 4 e menor 6: 12
|
8 |-- 10 4 13,33 30 100
∑ 30 100 --- ---
Alunos com nota menor que 6: 16
%Alunos com nota > = 4 e menor que 6: 40%
%Alunos com nota < que 6: 53,33%
Interatividade
A observação das notas de 30 alunos em uma prova mostrou os seguintes valores conforme mostrado na distribuição de frequências abaixo. Indique qual o percentual de alunos com nota menor que 8.
a) 10%
b) 33,34%
c) 26%
d) 86,67%
Notas fi
2 |-- 4 4
4 |-- 6 12
6 |-- 8 10e) 13,33%
8 |-- 10 4
ATÉ A PRÓXIMA!
Top Related