Estatística – Conteúdo Programático Conceitos básicos de Estatística e suas aplicações...

Post on 17-Apr-2015

121 views 2 download

Transcript of Estatística – Conteúdo Programático Conceitos básicos de Estatística e suas aplicações...

Estatística – Conteúdo Programático• Conceitos básicos de Estatística e suas aplicações

• População, amostra, variáveis aleatórias

• Distribuição de freqüência

• Gráficos e séries estatísticas

• Medidas de Tendência Central:

• Separatrizes

• Medidas de dispersão e assimetria

• Probabilidade

Estatística – Bibliografia• SILVA, ERMES MEDEIROS DA. Estatística: para os cursos de

Economia, Administração e Ciências Contábeis. v.1  São Paulo: Altas, 2008

• KAZMIER, LEONARD J. Teoria e problemas de Estatística aplicada à Administração e Economia. Porto Alegre: Bookaman, 2007

• MORETIN, LUIZ GONZAGA, Estatística Básica:Probabilidade. São Paulo: Makron do Brasil 

• LEVINE, DAVID M.;BERENSON, MARK L.; STEPHAN, DAVID.  Estatística: Teoria e Aplicações:usando Microsoft Excel em português. LTC – Livros Técnicos e Científicos:Rio de Janeiro, 2000

• CRESPO, ANTONIO ARNOT, Estatística Fácil, ed.18, Saraiva:São Paulo, 2006.

Estatística – Bibliografia• STEVENSON, WILLIAM J. Estatística aplicada à Administração.

 Harbra: São Paulo, 2001

• LARSON, RON; FARBER BETSY, Estatística Aplicada, 2 ed., Pearson Education do Brasil : São Paulo, 2004

• MONTGOMERY, DOUGLAS C. Introdução ao controle estatístico da qualidade. Rio de Janeiro: LTC, 2004

• ANDERSON, DAVID R.;SWEENEY, DENNIS J.;WILLIAMS, THOMAS A. Estatística aplicada à Administração e Economia. Cengage Learning: São Paulo, 2008.

ESTATÍSTICA ?

PRA QUÊ ?

ESTATÍSTICA• Exemplo:

• Bolsa fechou em alta de 3,12 % com a Vale

• Dólar cai para R$ 2,287

http://www.uol.com.br

(disponível em 8/ago/2013)

• Dívida do BNDES com o Tesouro em BILHÕES DE REAIS

2007 ........... 7 Bi

2010 .......... 237 Bi

2013 .......... 379 Bi

Revista Veja, edição 2329 nº 28 de 10/06/2013

ESTATÍSTICA - sentido comumSegundo DPVAT: 60.752 mortos no trânsito em 2012

Contra 57.116 em 2007

50.780 em 2010

Dos mortos em 2012:

-41% tinham entre 18 e 34 anos = 2x (mortes Boate

Kiss) por semana

Em 2011 : 58.134 no trânsito

52.198 por homicídio

ESTATÍSTICA - sentido comum98% dos acidentes de trânsito são causados por ERRO ou NEGLIGÊNCIA humana.

Principais causas:

1)Usar o celular ao volante:

ler mensagem de texto a 60 km/h = 76 metros às cegas

2) Dirigir alcoolizado =

21% acidentes, pelo menos um estava alcoolizado

ESTATÍSTICA - sentido comum

3) Dirigir colado na traseira do carro à frente:

12% acidentes nas estradas federais

4) Dirigir acima da velocidade permitida

12% acidentes

5) Deixar de usar cinto de segurança

60 km/h = 1.000 kgs

Revista Veja, edição 2333 nº 32 de 7/08/2013

ESTATÍSTICA

• Vem do latim “status” = Estado

• inicialmente envolvia:– compilações de dados e gráficos representativos

dos vários aspectos de um estado ou país.• taxa de mortalidade, • taxa nascimento,• renda, • taxas de desemprego, etc.

ESTATÍSTICA

• É uma coleção de métodos para:– planejar experimentos,

– obter dados,

– organizar,

– resumir,

– analisar

– concluir sobre as informações coletadas

Estatística

• Ramo da matemática que analisa dados estatísticos– Estatística Descritiva– Inferência Estatística

Aplicação na Administração(DOWNING, DOUGLAS;CLARK JEFFREY – ESTATÍSTICA APLICADA)

• Uma firma que está se preparando para lançar um novo produto precisa conhecer as preferências do consumidor no mercado de interesse.

Deve-se fazer pesquisa de mercado entrevistando um número de residências escolhidas aleatoriamente.

Poderá usar os resultados para estimar as preferências da população.

Aplicação na Administração

• A venda de automóveis é influenciado por:- modelo

- cor - poder aquisitivo,

- concorrência-Através da análise de regressão pode-se determinar quais fatores têm efeitos mais importantes

Aplicação na Administração

• Antes de lançar um novo remédio no mercado, é necessário fazer várias experiências para garantir que o produto é seguro e eficiente.Toma-se dois grupos tão semelhantes quanto possível, e dar o remédio a um grupo, mas não a outro.Verificar se os resultados nos dois grupos são diferentes.Determina-se que eventuais diferenças observadas são causadas pelo remédio ou por outros fatores

Aplicação na Administração

• No recebimento de um grande embarque de mercadorias de um fornecedor, teremos de nos certificar de que o produto realmente satisfaz os requisitos de qualidade acordados.

Inspeciona-se uma amostra de itens escolhidos aleatoriamente inferindo-se sobre a qualidade de todo o lote

Aplicação na Administração

• Auditor: verificar livros de uma firma para certificar que os lançamentos refletem a situação financeira da companhia.

Em vez de examinar todos os documentos originais (notas de venda, ordens de compra, requisições), verifica-se apenas uma amostra de documentos escolhidos aleatoriamente, inferindo o resultado sobre toda a população

Estatística

• tem objeto e métodos próprios• não tem um objetivo em si mesma.• tem como função auxiliar as outras ciências,

sendo portando considerada um método científico de trabalho

• não é uma ciência.

Estatística

• UTILIZAÇÃO: aplicável a qualquer ramo do conhecimento onde se manipulem dados numéricos:– Física Química Economia– Biologia Engenharia Medicina– Ciências Sociais– Ciências Administrativas, etc.

Estatística

• Estatística pode ser dividida em duas partes:– .Estatística Descritiva - cuida da:

• Organização

• descrição dos dados experimentais;

– .Estatística Indutiva - cuida da:

• análise

• interpretação dos dados

Estatística

• Conceitos fundamentais:

– POPULAÇÃO

– AMOSTRA

População (Universo Estatístico)

• conjunto de elementos com pelo menos uma característica comum.

• Esta característica deve delimitar quais os elementos que pertencem à população e quais os que não pertencem.

• Exemplo: Vamos estudar o desempenho dos estudantes em 2011. – POPULAÇÃO = todos os estudantes de 2011

População - Universo Estatístico

• COMO DEFINIR UMA POPULAÇÃO?• A quem interessa este resultado?• Se o analista dos resultados for o

responsável pelos cursos Administração, será que interessa a ele o desempenho dos alunos de Engenharia?

• Devemos procurar as características que interessam ao analista dos resultados

População - Universo Estatístico

• Os alunos do curso “ X ” em 2013• Os alunos do curso “ X “ em 2013 que

cursam o 4º semestre;• a cada item, estamos especificando cada vez

mais as características das pessoas a serem observadas, restringindo a “população” objeto de nossos estudos.

Levantamento

• definida as características da POPULAÇÃO, o passo seguinte é o levantamento de dados acerca das características objeto de estudo.

• PERGUNTA-SE...• Deve-se pesquisar dados de toda a

população?

Levantamento

• Em grande parte das vezes não é conveniente e em muitas vezes é impossível

• E Por que?

Levantamento

TEMPO: as informações devem ser obtidas com rapidez

PRECISÃO: as informações devem ser corretas

CUSTO: no processo de coleta, sistematização, análise e interpretação, o custo deve ser o menor possível.

Amostra• Outros motivos para se tomar uma amostra

– Exame de doença contagiosa: o pesquisador poderia infectar-se e começar a transmitir a doença a todos os entrevistados.

– Testes destrutivos– exame de sangue de um paciente– trabalho extenso: anotações erradas

Amostra• Devemos então delimitar nossas

observações a uma parte da população, isto é, a uma amostra proveniente dessa população.

• AMOSTRA: É um subconjunto de uma população, necessariamente finito, pois todos os seus elementos serão examinados para efeito da realização do estudo estatístico desejado.

Amostra

• A Estatística Indutiva tira conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações.

• A partir do conhecimento de uma parte, procura-se tirar conclusões sobre a realidade, no todo.

• Logicamente a indução não traz resultado exato, dando margem a erro.

Amostra

• A Estatística Indutiva, entretanto, irá nos dizer até que ponto poderemos estar errando em nossas induções e com que probabilidade.

Amostra

• Quanto maior a amostra, mais confiáveis serão as induções ?

• erros grosseiros e conclusões falsas podem ocorrer devido a falhas na amostragem.

POPULAÇÃO E AMOSTRA

POPULAÇÃO: – é uma coleção completa de todos os elementos

a serrem estudados

AMOSTRA:– é um subconjunto da população

CENSO:– é uma coleção da dados relativos a todos os

elementos de uma população:

Variável• Antes de tudo, é necessário que se tenham

bem definidas quais características deverão ser verificadas. Ex.: Alunos de Administração. (Universo Estatístico ou População).

• Dentro da população, é preciso definir quais as características que nos interessa averiguar. Ex. idade, sexo, estado civil, etc.

• A escolha da variável dependerá dos objetivos do estudo estatístico.

Variável• é o conjunto de resultados possíveis de um

fenômeno.• é a característica ou propriedade da

população que está sendo medida. Ex.:– População: moradores de uma cidade– Variável : número de filhos– População: alunos de Administração– Variável : sexo

Variável– População: moradores de um prédio– Variável : peso

• CLASSIFICAÇÃO DA VARIÁVEL• pode ser: • A) QUANTITATIVA A 1 - DISCRETA

A.2 - CONTÍNUA• B) QUALITATIVA B 1 - NOMINAL

B.2 - ORDINAL

A - Variáveis Quantitativas

• quando pode ser expressa em números. Ex:– quantidade de valores de notas de uma moeda– quantidade de sabores de refresco– duração de uma bateria de telefone celular– número de ossos existentes em um animal

A - Variáveis Quantitativas• A.1. - Quantitativas DISCRETAS:

– quando os valores podem assumir apenas determinados valores e resultam de uma contagem.

– O conjunto de valores possíveis que a variável pode assumir é finito ou infinitos enumerável. Ex:

• valores das cédulas da moeda brasileira• número de filhos dos casais de Lins

A - Variáveis Quantitativas• A.2. - Quantitativas CONTÍNUAS:

– quando os valores podem assumir pertence ao conjunto dos números reais. Podem assumir qualquer valor.

– Obtido por medição. Ex;• peso de um paciente• altura • tempo de vôo entre duas cidades

B - Variáveis Qualitativas

• quando a variável é não numérica ou definida através de atributos, categorias. Ex:– sexo– religião– naturalidade– cor dos olhos

B - Variáveis QualitativasB.1. - qualitativas NOMINAIS:

não tem ordenamento nem hierarquia;

Ex: sexo dos pacientes da clínica; tipo de convênio utilizado.

B.2. - qualitativas ORDINAIS: existe uma ordem, uma hierarquia;

Ex: presidente, diretor, gerente, etc...

Classificação: bom, regular, ruim.

ESCALA DE MEDIÇÃO DAS VARIÁVEIS

• ESCALA NOMINAL:

– dão nome a uma categoria ou classe.

– Os dados não podem ser dispostos em um esquema ordenado.

Ex: Respostas do tipo “sim”, “não” ou “indeciso”

Procedência de qual cidade (Lins, Promissão, etc.)

– não se faz cálculos (ex: tirar a média)

– algumas vezes são atribuídos números aos dados para serem inseridas no computador: 0 - sim; 1 - não, 2 - indeciso. Neste caso são apenas rótulos e não podem ser efetuados cálculos com estes números.

ESCALA DE MEDIÇÃO DAS VARIÁVEIS

• ESCALA ORDINAL:

– dão nome e uma ordem a uma categoria ou classe.

– Diferença entre os valores dos dados não podem ser determinadas ou não fazem sentido.

• Ex: grau de instrução:1= sem instrução; 2 = ensino fundamental; 3 = ensino médio, 4 = superior; 5 = Mestre; 6 = Doutor.

Não mantém a propriedade dos números: embora 3 seja maior do que 2, não significa que 3 + 2 = 5.

– Não é possível quantificar o quanto o nível 3 é melhor do que 2 ou o 4 é melhor do que 3.

ESCALA DE MEDIÇÃO DAS VARIÁVEIS

• ESCALA INTERVALAR: elimina a limitação da escala ordinal estabelecendo intervalos iguais com o mesmo significado.

Ex: na medição de temperatura tanto de 25º a 30º o aumento é de 5º, como o aumento de temperatura tanto de 30º a 35º o aumento é de 5º.

Porém, não se pode afirmar que 60º é o dobro de 30º, pois 0º da escala de temperatura é arbitrário.

• ESCALA PROPORCIONAL ou NÍVEL DE RAZÃO: Apresenta um ZERO absoluto. Ex: peso. Peso Zero = ausência de peso. 60 kgs é o dobro de 30 kgs.

Variáveis DEPENDENTES E INDEPENDENTES

Variável Independente:– é a que influencia, determina ou afeta outra variável;

– referida como fator determinante, condição ou causa para ocorrência de determinada resposta.

Variável dependente:– a sua resposta varia em virtude dos diferentes valores

que a variável independente pode assumir;

– modificando-se a variável independente, altera-se o valor da variável dependente.

Variáveis DEPENDENTES E INDEPENDENTES

• Variável Independente (VI): é o antecedente;• Variável dependente(VD): é o conseqüente

Variável Independente Variável Dependente

idade comprimento

sexo Resistência física

Variáveis DEPENDENTES E INDEPENDENTES

• Como detectar se uma variável é dependente ou independente ?

• Critério de sucetibilidade à influência:– Variável dependente é alterada ou influenciada pela

variável independente:

– Ex: dependente: predisposição a problemas cardíacos

independente: sexo

Variáveis DEPENDENTES E INDEPENDENTES

• Critérios para identificar o sentido de influência entre as variáveis dependente e independente ?

• 1) Ordem temporal:– o que ocorre depois não pode influenciar o que

aconteceu antes. Ex:V. independente V. dependente

Aumento do U$ em relação ao R$

Aumento dos preços dos combustíveis

Variáveis DEPENDENTES E INDEPENDENTES

• 2) Fixidez: em Ciência Biológicas, muitas variáveis podem ser consideradas fixas, ou não são sujeitas a influências. Ex:

– suscetibilidade a certas doenças está associada ao sexo do indivíduo;

– variáveis bioquímicas em animais e no homem são dependentes da idade.

– Peso do recém-nascido está relacionado com a ordem de nascimento.

CO-VARIÁVEIS

• Em todo experimento existe:– variável dependente: a ser analisada;– variável independente:

• que são fatores que influenciam os resultados da variável dependente;

• determinam as condições sob os quais a variável dependente é obtida.

• Podem interferir nos resultados da pesquisa

CO-VARIÁVEIS

é um fator que o pesquisador procura neutralizar intencionalmente em uma

investigação, com a finalidade de impedir que interfira na análise da relação entre as

variáveis independentes e dependentes

Tabela Primitiva • Dado um levantamento de dados estatísticos

de uma variável quantitativa, como por exemplo, a altura dos alunos , que tenha dado os seguintes valores (em cm.):

• 165 167 172 160 158 175 157 168

174 179 154 160 173 181 155 166

185 172 157 164 170 168 174 155

Tabela Primitiva • Notamos que a tabela não está

numericamente organizada. • A esta tabela denominamos TABELA

PRIMITIVA.• com os dados dispostos desta maneira é

difícil fazer qualquer análise e tirarmos alguma conclusão a respeito deste levantamento.

• Para facilitar a análise vamos dispor em uma ordem crescente ou decrescente.

ROL• 154 155 155 157 157 158 160 160

164 165 166 167 168 168 170 172172 173 174 174 175 179 181 185

• Concluímos que a menor estatura é de 154 e a maior é de 185.

• A amplitude é de 185 - 154 = 31.• A leitura da tabela fica mais clara.• A esta tabela organizada denominamos ROL.

Estatística• Resumindo:

• TABELA PRIMITIVA: é a tabela onde o : é a tabela onde o conjunto de elementos não foram conjunto de elementos não foram numericamente ordenados.numericamente ordenados.

• ROL: a tabela onde os dados foram a tabela onde os dados foram numericamente ordenados de forma numericamente ordenados de forma crescente ou decrescentecrescente ou decrescente.

Distribuição de Freqüência• Para facilitar a análise dos dados:

– vamos ordenar em colunas colocando o número de vezes que aparece repetido.

• TABULAR: é registrar quantas vezes o termo aparece no rol.

• Este processo pode ser inconveniente, pois pode gera uma tabela muito extensa pela quantidade de valores diferentes no levantamento de dados

Distribuição de Freqüência

Altura

• Estaturas dos alunos

freqüência

154 1

155 2

157 2

158 1

160 2

154 1

Altura freqüência

165 1

166

167 1

2

170 1

172 2

168

1

Fonte: Dados fictícios

Distribuição de Freqüência

Altura

• Estaturas dos alunos de um determinado curso

freqüência

173 1

174 2

175 1

179 1

181 1

185 1

total 24

Distribuição de Freqüência• Para facilitar a análise dos dados obtidos,

agrupar os valores em intervalos de classes (principalmente para variáveis contínuas).

• Assim dividimos nossa distribuição em INTERVALOS DE CLASSE

• INTERVALO DE CLASSE: é a forma de agrupar valores.

Distribuição de FreqüênciaALUNOS DE DETERMINADO ANO

Altura freqüência

154 158.......... 5

158 162.......... 3162 166.......... 2

166 170.......... 4

170 174.......... 4

174 178.......... 3

178 182.......... 2

182 186.......... 1

total......... 24

Fonte: Dados fictícios

Distribuição de Freqüência• CLASSES DE FREQÜÊNCIA

• São intervalos de variação da variável As classes são representadas

simbolicamente por “ i ” Assim o intervalo 162 166 define a 3ª

classe i = 3

A distribuição é formada por 8 classes

Distribuição de Freqüência

As classes são:

1ª classe: 154 158

2ª classe 158 162

3ª classe 162 166

4ª classe 166 170

5ª classe 170 174

6ª classe 174 178

7ª classe 178 182

8ª classe 182 186

Distribuição de Freqüência• LIMITES DE CLASSE

• São os extremos de cada classe. Temos• li = limite inferior da classe

• ls = limite superior da classe

• Referente à 3ª classe temos:– 162 166 li = 162 inclui limite inferior

– lS = 166 exclui limite superior

Distribuição de Freqüência• FREQÜÊNCIA

• É o número de ocorrências em que uma única característica é observada.

• FREQÜÊNCIA SIMPLES ou ABSOLUTA (fi)

• São os valores que representam o número de dados de classe

• é resultante da contagem.• Ex: Na 3ª classe a freqüência foi igual a 2, ou

seja duas pessoas têm estatura entre 162 a 166 cm (exclusive).

Distribuição de Freqüência• FREQÜÊNCIA ACUMULADA (Fac ou Fi )

• É o valor total (soma) das freqüências dos valores inferiores ao limite superior do intervalo de uma das classes.

• FREQÜÊNCIA RELATIVA ( Fr )

• É dado pela razão da freqüência simples e a freqüência total.

Fr = freqüência simples (f i)

freqüência total

Distribuição de FreqüênciaFREQÜÊNCIA RELATIVA PERCENTUAL

(Fr %)

Fr % = Fr x 100

PONTO MÉDIO ( PM )• É o ponto que divide o intervalo de classe em

duas partes iguais.

PM = li + ls

2

Distribuição de FreqüênciaAMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT)

• AT=limite superior máximo-limite inferior mínimo

• No nosso exemplo AT = 186 - 154 = 32

AMPLITUDE DE UM INTERVALO DE CLASSE ( h )

h = limite superior da classe - limite inferior da classe

h = ls - li

1) Quantos elementos foram pesquisados?

2) Quantas pessoas têm altura entre 160 (inclusive) e 170 (excluindo)

3) Isto representa quantos porcento do total?

4) Quantos porcento têm altura entre 160 (inclusive ) e 180 (excluindo)?

5) Quantas pessoas têm altura inferior a 170?

6) Quantos porcento têm altura de no mínimo 160?

7) Quantos porcento têm altura abaixo de 180?

8) Qual a classe (faixa de altura) de maior freqûëncia? Quantos porcento esta classe representa do total?

9) Qual a classe de menor freqüência? Quantos alunos representam?

10) Se for sorteado um elemento ao acaso, qual a probabilidade deste elemento ter altura mínima de 170?

11) Escolhido um aluno ao acaso, sabendo-se que ele têm altura abaixo de 170, qual a probabilidade dele ter altura entre 160 (inclusive) e 170?

12) Escolhido um aluno ao acaso, sabendo que ele tem altura maior ou igual a 160, qual a probabilidade dele ter altura acima de 170?

Histograma

Comprimento de peças produzidas

0

2

4

6

8

10

12

158 162 166 170 174 178 182 186

comprimento

Fre

ên

cia

Polígono de Freqüências

0

5

10

15

20

25

30

1 2 3 4 5 6 7

GRÁFICOS

Variáveis qualitativas

Variáveis QualitativasDefeitos em um lote de peças

Defeitos quantidade

Cor 20

Mancha 11

Risco 8

Espessura 6

Textura 5

total 50

Fonte: Dados fictícios

Gráfico de colunasDefeitos em um lote de peças

0

5

10

15

20

25

cor manchas risco espessura textura

Defeitos

Qu

anti

dad

e

Gráfico de barras

Defeitos em um lote de peças

0 5 10 15 20 25

cor

manchas

risco

espessura

textura

De

feit

os

quantidade

Gráfico de setores ou “pizza”

Defeitos em um lote de peças

cor40%

manchas10%

risco16%

espessura22%

textura12%

75

Diagrama de Pareto

MAIORIA DAS PERDAS

POUCOS TIPOS

DEFEITOS

Pequenas quantidades de

causas

Se identificados;

pode-se eliminar a maiorias das perdas concentrando-se nestas causas principais

76

Diagrama de Pareto

• No controle de qualidade– Dr. J.M Juran demonstrou que em muitos

casos:

•a maior parte dos defeitos decorrem de um número relativamente pequeno de causas.

Variáveis QualitativasDefeitos em um lote de peças

Defeitos ( %) ( % )

acumuladaCor 40 % 40 %

Mancha 22 % 62 %

Risco 16 % 78 %

Espessura 12 % 90 %

Textura 10 % 100 %

total 100 %

Fonte: Dados fictícios

Diagrama de Pareto

0%

10%

20%

30%

40%

50%60%

70%

80%

90%

100%

cor manchas risco espessura textura

•MEDIDAS DE TENDÊNCIA CENTRAL

•MEDIDAS DE DISPERSÃO

79

Estatística

• ELEMENTOS TÍPICOS DE UMA DISTRIBUIÇÃO:

Medidas de posição

Medidas de variabilidade ou dispersão

80

Medidas de Tendência Central

• É um valor calculado para um grupo de dados• usado para descrever esses dados. • Tipicamente, desejamos que o valor seja

representativo de todos os valores do grupo• os dados observados tendem, em geral, a se

agrupar em torno dos valores centrais.

81

Medidas de Tendência Central

• São Medidas de Tendência Central:

1. média;

2. mediana;

3. moda

82

1 - MÉDIA ARITMÉTICA

• definida como a soma dos valores dividida pelo número de elementos.

• Sua aplicação é seguramente a mais usada• podem ser:

– Média para dados simples– Média para dados agrupados– Média para dados agrupados em classes.

83

Exemplo: Dado um a idade de 5 crianças

Xi (idade) : 4; 6; 8; 10; 12

média - x = 4 + 6 + 8 + 10 +12

5

X = ∑xi n

sendo “ n “ o número de elementos

Assim: X = 40 = 8 5 Portanto a idade média dessas 5 crianças é 8 anos.

84

1.1. MÉDIA ARITMÉTICA PARA DADOS SIMPLES amostra: (X) população:

• Exemplo: Notas de 20 alunos:

Xi: 1, 1, 1, 2, 2, 2, 3, 3, 3, 3

5, 5, 5, 5, 5, 5, 6, 6, 6, 9

X = 1+1+1 + 2+2+2 + 3+3+3+3 + 5+5+5+5+5+5 + 6+6+6 + 9 20

X = 1 . 3 + 2 . 3 + 3 . 4 + 5 . 6 + 6 . 3 + 9 .1 = 3+6+12+30+18+9 3 + 3 + 4 + 6 + 3 + 1 20 85

1.1. MÉDIA ARITMÉTICA PARA DADOS SIMPLES amostra: (X) população:

• Quando o conjunto de dados para os quais precisamos calcular a média é mais extenso, temos a necessidade de agrupar os dados. Assim, a média desse grupo é calculado da seguinte forma:

X = (Xi . fi )

fi

86

1.2. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS (MÉDIA ARITMÉTICA PONDERADA)

amostra: (X) população:

Xi fi Xi . fi

1 3 3 X = Xi . fi

2 3 6 fi

3 4 12 X = 78 = 3,9

5 6 30 20

6 3 18

9 1 9

- 20 78

Fonte: dados fictícios 87

1.2. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS (MÉDIA ARITMÉTICA PONDERADA)

amostra: (X) população:

IDADE DE ALUNOS

Xi PM fi PM.fi

0 2.......... 1 3 1.3 = 3

2 4.......... 3 7 3.7 = 21 4 6.......... 5 6 5.6 = 30

6 8.......... 7 3 7.3 = 21

8 10.......... 9 1 9.1 = 9

total ......... 20 84

Fonte: Dados fictícios

X = (PM. Fi ) X = 84 X = 4,2

fi 20

88

1.3. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS EM CLASSES

amostra: (X) população:

2 – MEDIANA ( X )

• É o valor que se localiza no centro da distribuição

• é obtida a partir de seus valores centrais• Pode ser:

2.1 MEDIANA PARA DADOS SIMPLES

2.2 MEDIANA PARA DADOS AGRUPADOS

2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES INTERVALARES

89

2.1 MÉDIANA PARA DADOS SIMPLES (X)

Há duas situações:

1) Quando o número de elementos pesquisados é ímpar

Xi (idade) : 4; 6; 8; 10; 12 Posição: 1ª 2ª 3ª 4ª 5ª

“ n “ o número de elementos ímparUma posição central - P

P = n +1 P = 5 + 1 = 3ª posição => Xi = 8, portanto X = 8 2 2

~

posição central

Xi

~

90

2.1 MÉDIANA PARA DADOS SIMPLES (X)

2) Quando o número de elementos pesquisados é par

Xi (idade) : 4; 6; 8; 10; 10; 12 Posição: 1ª 2ª 3ª 4ª 5ª 6ª

~

X1 X2

~

P1 P2 (2 Posições centrais)

~

“ n = 6 número PAR de elementosDuas posições centrais - P1 e P2

P1 = n P1 = 6 = 3ª posição => X1 = 8, X = X1 + X2 = 8 + 10

2 2 2 2P2 = é a próxima P2 = 4ª posição => X2= 10, X = 9

91

2.2 MEDIANA PARA DADOS AGRUPADOS

1)Quando o nº de elementos é IMPAR Xi fi fac nº de elementos =

1 2 2 fi = 19 (ímpar) 2 3 5 3 4 9 uma posição

central 5 6 15 P = fi +1 =

19+1 6 3 18 2 2 9 1 19 P = 10ª posição - 19

92

2.2 MEDIANA PARA DADOS AGRUPADOS

Xi fi fac 1 2 2 2 3 5

3 4 9 5 6 15 6 3 18

9 1 19 Σ 19

Xi 1 1 2 2 2 3 3

posição 1ª 2ª 3ª 4ª 5ª 6ª 7ª

Xi 3 3 5 5 5 5 5 posição 8ª 9ª 10ª 11ª 12ª 13ª 14ª

Xi 5 6 6 6 9 posição 15ª 16ª 17ª 18ª 19ª

Xi 1 1 2 2 2 3 3

posição 1ª 2ª 3ª 4ª 5ª 6ª 7ª

Xi 3 3 5 5 5 5 5 posição 8ª 9ª 10ª 11ª 12ª 13ª 14ª

Xi 5 6 6 6 9 posição 15ª 16ª 17ª 18ª 19ª

93

2.2. MÉDIANA PARA DADOS AGRUPADOS

~

1) Quando o nº de elementos é IMPAR

Xi fi fac P = 10ª posição 1 2 2 2 3 5 3 4 9

Xi = 5 6 15 6 3 18 X = 5 9 1 19 - 19

94

2.2 MÉDIANA PARA DADOS AGRUPADOS

2)Quando o nº de elementos é PAR

Xi fi fac nº de elementos = fi = 20(par) 1 2 2

2 3 5 3 4 9 duas posição centrais 5 6 15 P1 = fi = 20 = 10ª posição 6 3 18 2 2 9 2 20 P2 = é a próxima= 11ª posição - 20

95

2.2 MÉDIANA PARA DADOS AGRUPADOS

~

2)Quando o nº de elementos é PAR

Xi fi fac P1 = 10ª posição

1 2 2 P2 = 11ª posição

2 3 5

3 4 9

X1= X2= 5 6 15

6 3 18 X = (X1+ X2) = 5 + 5

9 2 20 2 2

- 20 X = 5

96

2.3. MEDIANA PARA DADOS AGRUPADOS EM CLASSES

Xi PM fi fac

0 2.......... 1 3 3

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

1º passo: ACHAR A POSIÇÃO CENTRAL “P”

P = Fi P = 23 P = 11,5º posição

2 2

2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE MEDIANA”

97

2.3. MEDIANA PARA DADOS AGRUPADOS EM CLASSES

Xi PM fi fac

0 2.......... 1 3 3 faa

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

1º passo: ACHAR A POSIÇÃO CENTRAL “P”

P = Fi P = 23 P = 11,5º posição

2 2

2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE MEDIANA”

li

ls

98

2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES

Xi PM fi fac

0 2.......... 1 3 3 faa

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

Posição central -> P = 11,5º posição

Limite inferior da classe -> li = 2

Limite superior da classe -> ls = 4

Amplitude da classe -> h = ls - li = 4 – 2 = 2

Freqüência da classe -> fi = 10

Freqüência acumulada anterior -> faa = 3

li

ls

P - faa . h fi

+li=X~

11,5 - 3 . 2 10

+=~X 2

99

2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES

Xi PM fi fac

0 2.......... 1 3 3 faa

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

li

ls

8,5 . 2 10

+2=X~

X = 2 + 0,85 . 2~

X = 2 + 1,70~

X = 3,70~

100

2 – MODA ( X )

• É o ponto de maior concentração de ocorrências de uma variável

• Coincide com o conceito vulgar da palavra, isto é, o que ocorre com maior freqüência

^

101

2.1 – MODA PARA DADOS SIMPLES ( X )

• Exemplo: Notas de 20 alunos:

Xi: 1, 1, 1, 2, 2, 2, 3, 3, 3, 3

5, 5, 5, 5, 5, 5, 6, 6, 6, 9

O valor que apareceu maior número de vezes é o 5

portanto => X = 5

^

^

102

2.2 – MODA PARA DADOS AGRUPADOS ( X )^

^

Maior valor de fiXi =

Xi = 5

Xi fi 1 2 2 3 3 4 5 6 6 3 9 1 - 19

103

2.3. MODA PARA DADOS AGRUPADOS EM CLASSES – MODA DE CZUBER - Xcz

fmax

Xi PM fi

0 2.......... 1 3

2 4.......... 3 10 4 6.......... 5 6

6 8.......... 7 3

8 10.......... 9 1

total ......... 23

1º passo: Achar a classe onde se encontra a maior freqüência - fmax

^

104

2.3. MODA DE Czuber - XCZ

Xi PM fi

0 2.......... 1 3

2 4.......... 3 10 4 6.......... 5 6

6 8.......... 7 3

8 10.......... 9 1

total ......... 23

Limite inferior => li = 2 freqüência máxima => fmax = 10

Limite superior => ls = 4 freqüência anterior => fant = 3

freqüência posterior => fpost = 6

Amplitude da classe=> h = ls – li = 4 – 2 = 2

1 = fmax – fant = 10 – 3 = 7

2 = fmax – fpost = 10 – 6 = 4

li

ls

^

fant

fpos

fmax

105

2.3. MODA DE Czuber - XCZ^

Limite inferior => li = 2 freqüência máxima => fmax = 10

Limite superior => ls = 4 freqüência anterior => fant = 3

freqüência posterior => fpost = 6

Amplitude da classe=> h = ls – li = 4 – 2 = 2

1 = fmax – fant = 10 – 3 = 7

2 = fmax – fpost = 10 – 6 = 4

Cálculo da moda de Czuber

Xcz = li + ___ 1 ___ . h

1 + 2

Xcz = 2 + __7__ . 2 = 2 + _7_ . 2 = 2 + 14 = 2 + 1,3 = 3,3

7 + 4 11 11

^

^

106

2.3. MODA DE KING - Xki

Xi PM fi

0 2.......... 1 3

2 4.......... 3 10 4 6.......... 5 6

6 8.......... 7 3

8 10.......... 9 1

total ......... 23

Limite inferior => li = 2 freqüência máxima => fmax = 10

Limite superior => ls = 4 freqüência anterior => fant = 3

freqüência posterior => fpost = 6

Amplitude da classe=> h = ls – li = 4 – 2 = 2

li

ls

^

fant

fpos

fmax

107

2.3. MODA DE KING - Xki^

^

^

Limite inferior => li = 2 freqüência máxima => fmax = 10

Limite superior => ls = 4 freqüência anterior => fant = 3

freqüência posterior => fpost = 6

Amplitude da classe=> h = ls – li = 4 – 2 = 2

Cálculo da moda de KING

Xki = li + fpost . h

fant + fpost

Xcz = 2 + 6 . 2 = 2 + 6 . 2 = 2 + 12 = 2 + 1,3 = 3,3

3 + 6 9 9

108

2.3. MODA DE Pearson - Xpe^

^

^

Cálculo da moda de PEARSON

Xpe = 3. X - 2. X

Exemplo: Em um levantamento de dados onde a Mediana = X = 4

e a Moda = X = 4,2

A moda de Pearson será:

X = 3.4 - 2 . 4,2 = 12 – 8,4

X = 3,6

~

~

_

^

^

109

Outras separatrizes

• A Mediana divide a distribuição em duas partes.

• É o atributo que está no meio da distribuição:– 50% dos valores acima da mediana– 50% dos valores abaixo da mediana

110

Outras separatrizes

QUARTIS ou QUARTILHOS

• o Quartil divide a distribuição em 4 partes de igual freqüência.

• Seu cálculo é importante para as medidas de dispersão e variabilidade

• São três:

111

Outras separatrizes

Quartil

• São três:

• Q1 = quartil inferior ou primeiro quartil. Tem 25% da distribuição abaixo de si

• Q2 = é a mediana ou quartil mediano

• Q3 = quartil superior ou terceiro quartil. Tem 75% da distribuição abaixo de si

112

Quartil

• 1º quartil - Q1 = assume a posição P1q = Σfi

4• 2º quartil – Q2 = assume a posição P2q = 2. Σfi

4 • 3º quartil - Q3 = assume a posição P3q = 3.Σfi

4

113

1º QUARTIL – Q1

Xi PM fi fac

0 2.......... 1 3 3

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

1º passo: ACHAR A POSIÇÃO DO PRIMEIRO QUARTIL “ P1q ”

P1q = Fi P1q = 23 P 1q = 5,75º posição

4 4

2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O PRIMEIRO QUARTIL – Q1”

114

1º QUARTIL – Q1

Xi PM fi fac

0 2.......... 1 3 3 faa

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

Posição 1º quartil -> P 1q= 5,75º posição

Limite inferior da classe -> li = 2

Limite superior da classe -> ls = 4

Amplitude da classe -> h = ls - li = 4 – 2 = 2

Freqüência da classe -> fi = 10

Freqüência acumulada anterior -> faa = 3

li

ls

P1q - faa . h fi

+li=Q1

5,75 - 3 . 2 10

+=Q1 2

115

1º QUARTIL – Q1

Xi PM fi fac

0 2.......... 1 3 3 faa

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

li

ls

2,75 . 2 10

+2=Q1

Q1 = 2 + 0,55

Q1 = 2,55

116

3º QUARTIL – Q3

Xi PM fi fac

0 2.......... 1 3 3

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

1º passo: ACHAR A POSIÇÃO DO TERCEIRO QUARTIL “ P3q ”

P3q = 3. Fi P3q = 3. 23 P 3q = 17,25º posição

4 4

2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O TERCEIRO QUARTIL – Q3”

117

3º QUARTIL – Q3

Xi PM fi fac

0 2.......... 1 3 3

2 4.......... 3 10 13 faa 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

Posição central -> P 3q= 17,25º posição

Limite inferior da classe -> li = 4

Limite superior da classe -> ls = 6

Amplitude da classe -> h = ls - li = 6 – 4 = 2

Freqüência da classe -> fi = 6

Freqüência acumulada anterior -> faa = 13

li

ls

P3q - faa . h fi

+li=Q3

17,25 - 13 .2 6

+=Q3 4

118

3º QUARTIL – Q3

Xi PM fi fac

0 2.......... 1 3 3 faa

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

li

ls

4,25 . 2 13

+4=Q3

Q3 = 4 + 0,65

Q3 = 4,65

119

Outras separatrizes

Decil

• Dividem a distribuição em 10 partes de igual freqüência.

• São nove

• o quinto decil é a mediana.

120

Decil

• 1º decil - D1 = assume a posição P1d= Σfi

10• 2º decil – D2 = assume a posição P2d = 2. Σfi

10

• 9º decil - D9 = assume a posição P9d = 9.Σfi

10

121

1º DECIL – D1

Xi PM fi fac

0 2.......... 1 3 3

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

1º passo: ACHAR A POSIÇÃO DO PRIMEIRO DECIL “ P1d ”

P1d = Fi P1d = 23 P 1d = 2,3º posição

10 10

2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O PRIMEIRO DECIL – D1”

122

1º DECIL – D1

Xi PM fi fac

0 2.......... 1 3 3 faa

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

Posição 1º DECIL -> P 1d= 2,3º posição

Limite inferior da classe -> li = 0

Limite superior da classe -> ls = 2

Amplitude da classe -> h = ls - li = 2 – 0 = 2

Freqüência da classe -> fi = 3

Freqüência acumulada anterior -> faa = 0

li

ls

P1d - faa . h fi

+li=D1

2,3 – 0 . 2 3

+=D1 0

123

1º DECIL – D1

Xi PM fi fac

0 2.......... 1 3 3

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

2,3 . 2 3

+0=D1

D1 = 1,53

124

9º DECIL – D9

Xi PM fi fac

0 2.......... 1 3 3

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

1º passo: ACHAR A POSIÇÃO DO NONO DECIL “ P9d ”

P9d = 9. Fi P9d = 9. 23 P9d = 20,70º posição

10 10

2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O NONO DECIL – D9”

125

9º DECIL – D9

li

ls

P9d - faa . h fi

+li=D9

20,7 - 19 .2 3

+=D9 6

Xi PM fi fac

0 2.......... 1 3 3

2 4.......... 3 10 13 faa 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

Posição central -> P 9d= 20,7º posição

Limite inferior da classe -> li = 6

Limite superior da classe -> ls = 8

Amplitude da classe -> h = ls - li = 8 – 6 = 2

Freqüência da classe -> fi = 3

Freqüência acumulada anterior -> faa = 19126

9º DECIL – D9

Xi PM fi fac

0 2.......... 1 3 3

2 4.......... 3 10 13 4 6.......... 5 6 19 faa

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

1,7 . 2 3

+6=D9

D9 = 6 + 1,13

D9 = 7,13

127

Outras separatrizes

Centil ou Percentil

• Dividem a distribuição em 100 partes de igual freqüência.

• São noventa e nove

• o qüinquagésimo centil é a mediana.

128

Percentil - Ci

• 1º percentil - C1 = assume a posição P1c= Σfi

100• 2º percentil – C2 = assume a posição P2c = 2. Σfi

100

• 99ºpercentil - C99 = assume a posição P99c =99.Σfi

100

129

10º PERCENTIL – C10

Xi PM fi fac

0 2.......... 1 3 3

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

1º passo: ACHAR A POSIÇÃO DO DÉCIMO PERCENTIL “ P10c ”

P10c = 10 . Fi P10c = 10 .23 P 10c = 2,3º posição

100 100

2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O Décimo Percentil – C10”

130

10º PERCENTIL – C10

Xi PM fi fac

0 2.......... 1 3 3 faa

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

Posição 10º percentil -> P 10c= 2,3º posição

Limite inferior da classe -> li = 0

Limite superior da classe -> ls = 2

Amplitude da classe -> h = ls - li = 2 – 0 = 2

Freqüência da classe -> fi = 3

Freqüência acumulada anterior -> faa = 0

li

ls

P10c - faa . h fi

+li=C10

2,3 – 0 . 2 3

+=C10 0

131

10º PERCENTIL – C10

Xi PM fi fac

0 2.......... 1 3 3

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

2,3 . 2 3

+0=C10

C10 = 1,53

132

90º percentil – C90

Xi PM fi fac

0 2.......... 1 3 3

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

1º passo: ACHAR A POSIÇÃO DO NONAGÉSIMO PERCENTIL “ P90c ”

P90c = 90. Fi P90c = 9. 23 P90c = 20,70º posição

100 100

2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O nonagésimo percentil – C90”

133

90º PERCENTIL – C90

li

ls

P90c - faa . h fi

+li=C90

20,7 - 19 .2 3

+=C90 6

Xi PM fi fac

0 2.......... 1 3 3

2 4.......... 3 10 13 faa 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

Posição central -> P 90c= 20,7º posição

Limite inferior da classe -> li = 6

Limite superior da classe -> ls = 8

Amplitude da classe -> h = ls - li = 8 – 6 = 2

Freqüência da classe -> fi = 3

Freqüência acumulada anterior -> faa = 19134

90º PERCENTIL – C90

Xi PM fi fac

0 2.......... 1 3 3

2 4.......... 3 10 13 4 6.......... 5 6 19

6 8.......... 7 3 22

8 10.......... 9 1 23

total ......... 23

1,7 . 2 3

+6=C90

C90 = 6 + 1,13

C90 = 7,13

135

Relações

Quartil Decil Percentil Mediana

D1 = C10

Q1 = = C25

Q2 = D5 = C50 = X

Q3 = = C75

D9 = C90

~

136

Outras médiasMÉDIA DE INTERVALOÉ a média entre a menor e a maior observação em um

conjunto de dados.

MÉDIA DAS JUNTAS ou MidhingeÉ a média entre o primeiro e o terceiro quartil.

XXMENOR MENOR + X+ XMAIORMAIOR

22Média de Intevalo =Média de Intevalo =

Outras médiasOutras médias

XXMENOR MENOR + X+ XMAIORMAIOR

22Média de Intevalo =Média de Intevalo =

QQ1 1 + Q+ Q33

22MidhingeMidhinge = =

137

Medidas de Dispersão

• As Medidas de Tendência Central:– representam de certa forma uma determinada

distribuição de dados– só elas não são suficientes para caracterizar a

distribuição.

• Para uma análise estatística mais exata é necessária a verificação da flutuação dos valores em torno de sua média aritmética

138

Medidas de Dispersão

• Suponha as notas de 2 grupos de estudantes, cada qual com 5 alunos.

• GRUPO “A” : 4, 5, 5, 6

• GRUPO “B” : 0, 0, 10, 10

• Média do grupo “A”: 5

• Média do grupo “B”: 5

139

Medidas de Dispersão

• Os dois grupos apresentam a mesma média

• O comportamento dos 2 grupos são bem distintos. GRUPO “A”: valores são mais homogêneos

GRUPO “B”: valores são dispersos em

relação à média

140

Medidas de Dispersão

• Dentre as medidas de dispersão pode-se citar algums delas:– a) Amplitude Total– b) Amplitude Interquartil– c) Desvio Quartílico ou Amplitude Semi-interquartílico– d)Desvio Médio– e) Variância– f) Desvio Padrão

141

a) Amplitude Total - R

– é a diferença entre o maior e o menor valor observados.

R = Limite superior - Limite Inferior

• Exemplo 5: Idade de 20 alunos:

Xi: 1, 1, 2, 2, 2, 3, 3, 3, 5, 5, 5, 5, 5, 6, 6, 6, 9

R = 9 – 1 = 8

142

b) Amplitude Interquartil – AIQou IQR ( InterQuartile Range )

é a diferença entre o terceiro quartil e o primeiro quartil.

AIQ ou IQR = Q3 - Q1

– Supera a dependência dos valores extremos– Abrange 50% dos valores centrais,

eliminando os 25% dos valores mais baixos e os 25% dos valores mais altos

143

c) Desvio Quartílico ouAmplitude Semi-interquartílicoé a diferença entre o terceiro quartil e o

primeiro quartil.

Dq = Q3 - Q1

2

144

d) Desvio Médio - DM

é a diferença entre o terceiro quartil e o primeiro quartil. Para uma amostra

DM = Σ Xi – X_

n - 1

Sendo: DM = Desvio Médio Xi = vr. variável

n = nº elementos

X = média aritmética

d) Desvio Médio - DM

Para uma população

DM = Σ Xi – _

n Sendo: DM = Desvio Médio Xi = vr. variável

n = nº elementos

= média aritmética

d) Desvio Médio - DM

Exemplo 6: Dado o levantamento:

Xi : 2, 2, 3, 3, 3, 4, 4, 4, 5, 10

a) Calcule a média X = = = 4

b) Montar a tabela a seguir:

ΣΣ Xi Xinn

40401010

d) Desvio Médio - DMXi Xi - x Xi – x 2 2 – 4 = - 2 2 2 2 – 4 = - 2 2 3 3 – 4 = - 1 1 3 3 – 4 = - 1 1 3 3 – 4 = - 1 1 DM = = 4 4 – 4 = 0 0 4 4 – 4 = 0 0 DM = 1,56 4 4 – 4 = 0 0 5 5 – 4 = 1 110 10 – 4 = 6 6

Σ 14

ΣΣ Xi – x_ Xi – x_ n - 1n - 1

1414 99

Considerando uma amostra

e) Variância – população: 2

amostra: s2

– é a média dos quadrados dos afastamentos entre as os valores da variável e sua média aritmética

– Revela a dispersão do conjunto que se estuda

é a diferença entre o terceiro quartil e o primeiro quartil. Para uma amostra

s2 = Σ (Xi – X )2_

n - 1

Sendo: s2= variância amostra Xi = vr. variável

n = nº elementos

X = média aritmética

e) Variância – população: 2

amostra: s2

Para uma população

2 = Σ (Xi – )2_

n Sendo: 2 = variância população Xi = vr. variável

n = nº elementos

= média aritmética

e) Variância – população: 2

amostra: s2

d.1) Variância - 2 – dados simples

Exemplo 7: Dado o levantamento:

Xi : 2, 2, 3, 3, 3, 4, 4, 4, 5, 10

a) Calcule a média X = = = 4

b) Montar a tabela a seguir:

ΣΣ Xi Xinn

40401010

d.1) Variância - s2 – dados simplesXi Xi - x ( Xi – x )2 2 2 – 4 = - 2 22 = 4 2 2 – 4 = - 2 22 = 4 3 3 – 4 = - 1 12 = 1 3 3 – 4 = - 1 12 = 1 3 3 – 4 = - 1 12 = 1 s2 = = 4 4 – 4 = 0 02 = 0 4 4 – 4 = 0 02 = 0 4 4 – 4 = 0 02 = 0 s2 = = 5,33 5 5 – 4 = 1 12 = 110 10 – 4 = 6 62 = 36

Σ 48

ΣΣ ( Xi – x ) ( Xi – x )22

n - 1n - 1

4848 99

d.2) Variância - s2 – dados agrupados

Xi fi Xi . fi Xi - x ( Xi – x )2 ( Xi – x )2 . fi 2 2 2 . 2 = 4 2 – 4 = -2 (-2)2 = 4 4 . 2 = 8 3 3 3 . 3 = 9 3 – 4 = -1 (-1)2 = 1 1 . 3 = 3 4 3 4 . 3 = 12 4 – 4 = 0 02 = 0 0 . 3 = 0 5 1 5 . 1 = 5 5 – 4 = 1 12 = 1 1 . 1 = 110 1 10 . 1 = 10 10 - 4 = 6 62 = 36 36 . 1 = 36

Σ fi = 10 Σ fi = 40 Σ fi = 48

se amostra

s2 =

s2 = = 5,33

ΣΣ ( Xi – x ) ( Xi – x )2 2 . fi. fi ΣΣ fi - 1 fi - 1

4848 99

d.2) Variância - s2 – dados agrupados em classes

Xi PM fi PM.fi PM-x ( PM–x )2 ( PM–x )2.fi

0 2..... 1 2 1.2 = 2 1-5= -4 (-4)2 = 16 16 . 2 = 32

2 4..... 3 4 3.4 = 12 3-5= -2 (-2)2 = 4 4 . 4 = 16

4 6..... 5 8 5.8 = 40 5-5= 0 02 = 0 0 . 8 = 0

6 8..... 7 6 7.6 = 42 7-5= 2 (2)2 = 4 4 . 6 = 24

8 10.... 9 1 9.1 = 9 9-5= 4 (4)2 = 16 16 . 1 = 16

total .... 21 105 88

ΣΣ ( PM – x ) ( PM – x )2 2 . fi. fi ΣΣ fi - 1 fi - 1

ΣΣ ( PM.fi) ( PM.fi) ΣΣ fi fi

X = = 105 105 2121

X = 5

ss22 = = 8888 2020

ss22 =

ss22 = 4,4

d) Desvio Padrão

– Por definição, é a raiz quadrada da média aritmética dos quadrados dos desvios

– É a mais utilizada– Revela a dispersão do conjunto que se estuda

para uma população = 22

para uma amostra ss = ss22

e) Desvio Padrão - “” ou “s”– Se todos os valores forem iguais, o desvio padrão

é nulo.– quanto maior o desvio padrão mais heterogênea é

a distribuição, significa que os valores são mais dispersos em torno da média

– MEDIA ± 1 => 68,26% dos valores– MEDIA ± 2 => 95,44% dos valores– MEDIA ± 3 => 99,74% dos valores

f) Coeficiente de Variação - CV

CV = - desvio padrão

X X - média artitmética

– o CV mede o grau de heterogeneidade da distribuição

– Valor máximo é CV = 1

0 ≤ CV ≤ 1

158

Coeficiente de Variação - CV

– Quanto mais próximo de 1:mais heterogênea é a distribuiçãoOs valores estão mais dispersos

– Quanto mais próximo de 0:mais homogênea é a distribuiçãoOs valores da variável estão mais próximos em torno

da média

159

Coeficiente de Variação - CV

– Ex: Dado 2 estudantes cujas notas bimestrais foram:• “a”: 60; 40; 50; 50• “b”: 70; 70; 30; 30• Qual foi mais regular ?

160

f) Coeficiente de Variação - CV

Na comparação de variabilidade de dois ou mais conjuntos de dados:

1. expressos em diferentes unidades de medida

2. expressos nas mesmas unidades, mas com médias diferentes.

161

f) Coeficiente de Variação - CV

Comparação de valores expressos em diferentes unidades de medida

Exemplo 8: Deseja-se comparar qual grandeza varia mais: PESO ou COMPRIMENTO

XPESO = 20 kg XCOMPRIMENTO = 50 metros

PESO = 2 kg COMPRIMENTO = 4 metros

162

f) Coeficiente de Variação - CV

XXPESOPESO

PESOPESOCVCVPP =

COMPRIMENTOCOMPRIMENTO

XXCOMPRIMENTOCOMPRIMENTO

CVCVCC =

22 2020CVCVPP =

44 5050CVCVCC =

CVCVPP = 0,10

CVCVCC = 0,08

CVCVPESOPESO = 0,10 ≥ CVCVCOMPRIMENTOCOMPRIMENTO = 0,08

PESO varia mais que o comprimentoPESO varia mais que o comprimento

163

f) Coeficiente de Variação - CV

expressos nas mesmas unidades, mas com médias diferentes

Exemplo 9: Deseja-se comparar qual grupo “ A ”

ou “ B “ tem mais variação de rendimento em um processo:

XA = 80 % XB = 50 %

A = 2 % B = 1 %

164

f) Coeficiente de Variação - CV AA

CVCVAA =XXAA

BBCVCVBB =

XXBB

22 8080CVCVPP =

11 5050CVCVBB =

CVCVAA = 0,025

CVCVBB = 0,020

CVCVAA = 0,025 ≥ CVCVBB = 0,020

O rendimento do Produto A varia mais que o O rendimento do Produto A varia mais que o rendimento do produto B no decorrer do processorendimento do produto B no decorrer do processo

165

Esquema dos 5 NúmerosBox – Plot ou

Gráfico Box-and-Whisker

Q3

3º Quartil

Q1

1º Quartil

X

Mediana

~

XMENOR XMAIOR

25% dos dados 25% dos dados25% 25%

166

Dados suspeitos ou Outliers

Q1 – 1,5. IQR Q3 + 1,5. IQR

Possível suspeito

Q3 + 3 . IQR

Suspeito

Q1 - 3 . IQR

IQR = Q3 - Q1

167