Métodos Quantitativos Métodos - qualittert.com.br · Métodos Quantitativos Estatísticos...
Embed Size (px)
Transcript of Métodos Quantitativos Métodos - qualittert.com.br · Métodos Quantitativos Estatísticos...
-
Mt
odos
Qua
ntita
tivos
Est
ats
ticos
MtodosQuantitativos
Estatsticos
MtodosQuantitativosEstatsticos
Denise Maria Martins
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Denise Maria Martins
Mtodos Quantitativos Estatsticos
IESDE Brasil S.A.Curitiba
2012
Edio revisada
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
2008 IESDE Brasil S.A. proibida a reproduo, mesmo parcial, por qualquer processo, sem autorizao por escrito dos autores e do detentor dos direitos autorais.
CIP-BRASIL. CATALOGAO-NA-FONTESINDICATO NACIONAL DOS EDITORES DE LIVROS, RJ __________________________________________________________________________________M341m Martins, Denise Maria Mtodos quantitativos estatsticos / Denise Maria Martins. - 1.ed., rev. - Curitiba, PR : IESDE Brasil, 2012. 138p. : 24 cm Inclui bibliografia ISBN 978-85-387-2986-0 1. Estatstica matemtica. 2. Probabilidades. I. Ttulo. 12-5023. CDD: 519.5 CDU: 519.2 16.07.12 31.07.12 037526 __________________________________________________________________________________
Capa: IESDE Brasil S.A.
Imagem da capa: Shutterstock
IESDE Brasil S.A.Al. Dr. Carlos de Carvalho, 1.482. CEP: 80730-200 Batel Curitiba PR 0800 708 88 88 www.iesde.com.br
Todos os direitos reservados.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Denise Maria MartinsMestre em Administrao Estratgica pela Universidade Cidade de So Paulo (Unicid). Especialista em Engenharia da Qualidade pela Universidade Catlica de Minas Gerais (PUC-Minas). Graduada em Estatstica pelo Centro Universitrio Capital (Unicapital). Atua como gestora de processos.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
sum
rio
sum
rio
sum
rio
sum
rio Estatstica com aplicaes e anlise exploratria 1111 | Estatstica: definio e aplicaes13 | Conceitos e regras20 | Anlise exploratria de dados: o problema
Medidas de tendncia central e posio 35
35 | Definio
47 | Quartis, Decis e Percentis
Medidas de variabilidade 55
55 | Definio
60 | O problema
Introduo probabilidade e distribuio de probabilidade discretas
75
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Distribuio de probabilidade contnua
113
113 | Definio
132 | Apndice n. 1 Tabela 1: reas sob a curva normal
Referncias 137
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Apresentao Mtodos Q
uantitativos Estatsticos
O assunto da estatstica pode ser apresentado em diversos nveis de dificuldades matemticas e orientado para aplicaes em vrios campos de pesquisa. A consequncia apresentao de textos sobre estatstica mdia, estatstica para administrao, estatstica educacional, estatsti-ca psicolgica e at mesmo estatstica para his-toriadores. Embora os problemas que surgem nessas diversas reas por vezes exijam tcnicas estatsticas especiais, nenhum dos mtodos bsicos apresentados neste livro est restrito a qualquer campo particular de aplicao.Os objetivos gerais da Estatstica aplicados Ad-ministrao so os seguintes:
Desenvolver a confiana dos alunos ao lidar com dados numricos;
Expor o leitor a uma ampla variedade de tcnicas estatsticas introdutrias para uso na interpretao e anlise de dados empre-sariais.
No livro, temos a descrio das principais ferra-mentas e mtodos, apresentando a estatstica e a anlise exploratria, em que so indicados conceitos bsicos e ferramentas para anlise gr-fica. A aplicao da estatstica envolve medidas de tendncia central e de posio, evidenciando mtodos e ferramentas para indicar valores que representam a maioria dos dados de forma resu-mida. O desenvolvimento e o entendimento de medidas de variabilidade que permitem ao leitor
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
acrescentar a sua interpretao e anlise de ferramen-tas para medir as disperses de amostras analisadas. Temos a Introduo probabilidade e distribuies de probabilidade discretas demonstrando mtodos para tratamento de dados discretos e indicando clculos de probabilidade. Como encerramento apresentada a distribuio de probabilidade contnua, representada pela distribuio normal como meio para a realizao de previses em determinados contextos onde temos varivel contnua como dados.
Mtodos Q
uantitativos Estatsticos
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
11
Estatstica com aplicaes e anlise exploratria
Estatstica: definio e aplicaesNo moderno ambiente administrativo e econmico global, dispe-se de
uma vasta quantidade de informaes estatsticas. Os gerentes e tomadores de deciso de maior sucesso so aqueles capazes de entender a informao e us-la de forma eficaz. As empresas precisam de informaes para tomar as decises: parte dessas informaes ser transformada em dados e em anli-se estatstica.
Uma definio de dicionrio afirma que estatstica a apresentao de fatos numricos coletados sistematicamente, ordenados e estudados. Para aqueles que tomam decises, o principal papel da estatstica fornecer-lhes os mtodos para obter e converter dados (valores, fatos, observaes, medi-es) em dados teis.
Dados de Entrada
Coletar Organizar Analisar Interpretar
Informaes de sada
Figura 1 Definio de Estatstica.
O objetivo da estatstica proporcionar conhecimento a partir de dados. Os dados so nmeros que representam um contexto. Exemplo: o nmero 4,8, no d, por si s, qualquer informao. Mas se o filho recm-nascido de um amigo pesa 4,8 quilos, congratula-se pelo tamanho do filho. O contexto motiva o conhecimento fundamental e permite fazerem-se julgamentos.
Do ponto de vista prtico, pode-se dividir a estatstica em trs partes.
(SM
AIL
ES, 2
007)
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
12
Estatstica com aplicaes e anlise exploratria
Anlise de dados (estatstica descritiva): consiste em mtodos e ideias para organizar e descrever dados mediante a utilizao de grficos, re-
sumos numricos e descries matemticas mais elaboradas. A revo-
luo do computador colocou a anlise de dados no centro da prtica
estatstica.
A produo de dados fornece mtodos para produzir dados que podem dar respostas mais claras a questes especficas. Os conceitos bsicos de
como selecionar amostras (tcnicas de amostragem) e planejar experi-
mentos so talvez as mais importantes de todas as ideias estatsticas.
A inferncia estatstica vai alm dos dados disponveis e procura tirar concluses sobre um universo mais amplo. A inferncia estatstica no
s formula concluses, como tambm as acompanha, indicando seu
grau de confiabilidade.
Os dados vm em diferentes formas, cada uma das quais tratada de
maneira um pouco diferente na converso em informaes.
Quadro 1 Tipo de dados
Dados
Qualitativos (Categricos) Quantitativos
Nominais
Categorias nomeadas
Ordinais
Nmeros agem como categorias/
ordenaes
Contnuos
Qualquer valor dentro de um intervalo
possvel
Discretos
Somente valores fixos so possveis (valores
absolutos)
Supondo as situaes a seguir pode-se entender a importncia da esta-
tstica e sua aplicao nas atividades em que as decises devem ser tomadas
em um curto espao de tempo e a um baixo custo.
Contexto A
Uma empresa que est se preparando para lanar um novo produto pre-
cisa conhecer as preferncias dos consumidores no mercado de interesse.
Para isso, pode fazer uma pesquisa de mercado entrevistando um nmero
de residncias escolhidas aleatoriamente. Poder ento usar os resultados
para estimar as preferncias de toda a populao.
(SM
AIL
ES, 2
007)
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Estatstica com aplicaes e anlise exploratria
13
Contexto B
Um auditor deve verificar os livros de uma empresa, para se certificar de
que os lanamentos refletem efetivamente a situao financeira da com-
panhia. Ele deve examinar pilhas de documentos originais, como notas de
venda, ordens de compra e requisies. Seria um trabalho incalculvel con-
sultar todos os documentos originais; em vez disso, o auditor pode verificar
uma amostra de documentos escolhidos aleatoriamente, com base nessa
amostra, fazer inferncias sobre toda a populao.
Contexto C
Um tcnico de controle da qualidade deve realizar um ensaio para ga-
rantir que o produto fabricado est funcionando conforme as especificaes
do cliente. Por se tratar de palitos de fsforos, o ensaio destri o produto, o
tcnico utiliza seleo de amostras para realizar e concluir sua anlise.
Os contextos permitem refletir como analisar uma situao sem a ne-
cessidade de levantar todos os dados, isso possvel atravs da estatstica
e a aplicao de mtodos na coleta de dados que estimam as caractersti-
cas da populao com base na amostra. Uma das vantagens em utilizar-se
de amostras, encontra-se no fato de chegar a uma concluso e/ou deciso
em um tempo menor a um custo reduzido, levando-se tambm em consi-
derao que em algumas situaes o processo de pesquisa destri o ele-
mento pesquisado.
Como dispendioso, difcil e por vezes impraticvel ter acesso a toda
uma populao, costuma-se escolher uma amostra e estud-la.
Para evitar predies imprecisas, essencial que a amostra represente
efetivamente a populao da qual foi extrada.
Conceitos e regras
Estatstica uma coleo de mtodos para planejar experimentos, obter dados e or-
ganiz-los, resumi-los, analis-los, interpret-los e deles extrair concluses.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
14
Estatstica com aplicaes e anlise exploratria
Populao (N)
uma coleo de todos os elementos (valores, pessoas, medidas etc.) a serem estudados.
Amostra (n)
uma subcoleo de elementos extrados de uma populao.
Populao Amostra
Figura 2 Definio de populao e amostra.
Parmetro e EstatsticaUm Parmetro uma medida numrica que descreve uma caracterstica
de uma populao, enquanto Estatstica uma medida numrica que des-creve uma caracterstica de uma amostra.
Dados quantitativosConsistem em nmeros que representam contagens ou medidas. Ex.: du-
rao de uma msica.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Estatstica com aplicaes e anlise exploratria
15
Dados discretosResultam de um conjunto finito de valores possveis, ou de um conjunto
enumervel desses valores (o nmero de valores possveis 0, ou 1, ou 2 etc.), ou seja, quando os dados representam contagens so discretos.
Ex.: contagens, nmeros de mensagens em uma secretria eletrnica, nmero de visitas a Londres.
Dados contnuos (numricos)Resultam de um nmero infinito de valores possveis que podem ser as-
sociados a pontos em uma escala contnua de tal maneira que no haja la-cunas ou interrupes, ou seja, quando os dados representam mensuraes, so contnuos. Ex.: alturas, salrios, horrios, pesos.
Dados qualitativos (ou dados categricos, ou atributos)
Podem ser separados em diferentes categorias que se distinguem por alguma caracterstica no numrica. Ex.: estilo de msica.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
16
Estatstica com aplicaes e anlise exploratria
Nveis de mensurao de dados
Outra forma de classificar dados tambm muito comum.
Quadro 2 Nveis de mensurao de dados
Nvel Sumrio Exemplo
Nominal Categorias somente. Os dados no podem ser dispostos em um esquema ordenado.
Carros de alunos
10 Mercedez
20 Ferraris
40 Porsches
Categorias ou nomes somente
Ordinal
As categorias so ordenadas, mas no podem estabelecer diferenas, ou estas no tm sentido.
Carros de alunos
10 Compactos
20 Mdios
40 Grandes
Est determinada uma ordem: compacto; mdio e grande.
Intervalo
Podemos determinar diferenas entre valores, mas no h ponto de partida inerente. As razes no tm sentido.
Temperatura no campus
45 F
80 F
90 F
90 F no duas vezes mais quente do que 45F
Razo Como intervalo, mas com um ponto de partida inerente. As razes tm sentido.
Peso de jogadores em uma faculdade
115 lb
195 lb
300 lb
300 lb duas vezes 150 lb
Tabelas de frequnciasRelaciona categorias (ou classes) de valores, juntamente com contagens (ou
frequncias) do nmero de valores que se enquadram em cada categoria.
Exemplo: tabela de frequncia da idade dos alunos de Administrao.
idade frequncia
De 18 a menos de 19 16
De 19 a menos de 20 7
De 20 a menos de 21 7
De 21 a menos de 22 3
22 ou mais 3
36
(TRI
OLA
, 199
9)
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Estatstica com aplicaes e anlise exploratria
17
RolUm rol um arranjo de dados numricos brutos em ordem crescente ou
decrescente de grandeza.
Exemplo: 2, 3, 4, 5, 6, 7, 8, 9, 10.
Limites inferiores de classes
So os menores nmeros que podem efetivamente pertencer s diferen-tes classes.
De 18 a menos de 19
Amplitude de classe + limite inferior da primeira classe
1 + 18 = 19 ( limite inferior da segunda classe)
idade frequnciaDe 18 a menos de 19 16
limite inferior de classes
Limites superiores de classes
So os maiores nmeros que podem efetivamente pertencer s diferen-tes classes.
Exemplo:
classes idade frequncia1 De 18 a menos de 19 16
limite superior de classes
Amplitude de classe
a diferena entre dois limites de classe inferiores consecutivos ou entre duas fronteiras inferiores de classe consecutivas.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
18
Estatstica com aplicaes e anlise exploratria
Exemplo:
Diferena entre dois limites de classes inferiores
idade frequnciaDe 18 a menos de 19 16
De 19 a menos de 20 7
Fronteiras de classes
So os nmeros usados para separar classes, mas sem as lacunas criadas pelos limites de classe, podendo ser representados pelos intervalos de clas-ses ajustados.
Exemplo:
classes intervalo de classes
1 18 19
fronteira de classes
Intervalo de classe
a amplitude de uma classe, ou intervalo de valores que ela pode conter e dado pela diferena entre seus limites ou fronteiras.
Exemplo:
classes intervalo de classes ponto mdio
1 18 19 18,5
2 19 20 19,5
Distribuio de frequncia
o agrupamento dos dados em um certo nmero de classes, intervalos ou categorias.
Exemplo:
Idade frequncia
De 18 a menos de 19 16
De 19 a menos de 20 7
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Estatstica com aplicaes e anlise exploratria
19
Histograma
Consiste em uma escala vertical para as frequncias e barras para repre-sentar os valores das frequncias das diversas classes.
Exemplo:
40
30
20
10
0
11,4 25,9 40,4 54,9 69,4 83,9 98,4 112,9
25,9 40,4 54,9 69,4 83,9 98,4 112,9 127,4
Histograma
Polgono de frequncia
uma variante do histograma, sendo que as frequncias so marcadas nos pontos mdios, e os valores so unidos por segmentos retilneos.
Exemplo:
Polgono de frequncia
11,4 25,9 40,4 54,9 69,4 83,9 98,4 112,925,9 40,4 54,9 69,4 83,9 98,4 112,9 127,4
35
30
25
20
15
10
5
0
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
20
Estatstica com aplicaes e anlise exploratria
Ponto mdio
Obtm-se adicionando os limites inferior e superior de uma classe e divi-dindo-se o resultado por dois.
Exemplo:
classes intervalo de classes ponto mdio
1 18 19 18,5
2 19 20 19,5
Ramo e folhas
uma tabela em que cada linha representa a posio de um ramo e cada algarismo direita da reta pode ser considerado uma folha.
Exemplo:
ramo folhas
1 1 5
2 6 7 8
3 7
4 0 0 0 0 0 1 1 1 2 2 2 2 3 3 4 9
5 0 2 2 3 3 3 3 4 5 5 5 5 5 5 6 6 6
6 0 0 0 0 0 0 1 3 3 4 6 6 7 7 7 7 8 8 8 8 9 9
7 4 5 5 5 6 6 7 7
8 0 1 2 2 2 2 3 3 3 4 5 5 6 6 9
9 0 3 4 5 5 6 7 7 7
10 0 3 8
Anlise exploratria de dados: o problema
Contexto AA organizao e apresentao de informaes numricas a primeira
etapa para entender um problema. Como situao tpica, considerando os valores a seguir, que representam o tempo de percurso at o trabalho de empregados de um grande escritrio localizado no centro de uma cidade.
(TRI
OLA
, 199
9)
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Estatstica com aplicaes e anlise exploratria
21
Os tempos so em minutos e cada valor representa o tempo mdio gasto
por um empregado em cinco dias teis. A simples coleta de dados por si
s j no tarefa simples, mas claro que preciso muito mais para tornar
os nmeros compreensveis. O que se pode fazer para tornar esta massa de
informaes mais utilizvel?
Tabela 1 Coleta de dados de tempo de percurso ao trabalho em minutos
49,6 42,6 43,2 44 50,6 52,6 53,6 42,2 52,4 43
55,4 53,6 54,6 55 55,4 55,8 55,8 53,6 55,6 53,8
60,2 56,4 60 60,2 60,4 60,8 61 56,2 60,4 56,4
67 63,8 66,8 66,8 67,2 67,4 68 63,4 67,4 64
74 68,2 69,8 69,8 75,4 75,8 76 68 75,8 68,8
82 77,4 80 81,2 82,4 82,6 82,8 76 82,6 77,8
85,4 83,2 84 85 86,4 89,6 95,2 83 86,4 83,4
29,4 15,8 37 28,8 30,2 36,8 38,4 11,4 35,8 26
41 40,4 40,6 40,8 41 42 42 40,2 41,4 40,4
103,4 97 97,8 100 108,2 123,8 125,4 96,8 110,2 97
Explorando o problema
Ao analisar um conjunto de dados, deve-se determinar se uma amos-tra ou uma populao. Essa determinao afetar no somente os mtodos utilizados, mas tambm suas concluses. Na sequncia utilizar mtodos de
estatstica descritiva (anlise dos dados) para resumir ou descrever as carac-
tersticas importantes de um conjunto conhecido de dados, considerando
a tabela de frequncia e o histograma como um mtodo para organizar e
resumir os dados coletados.
O objetivo do uso da tabela de frequncia e histograma identificar a
natureza ou forma da distribuio dos dados, como forma de sino, uniforme
ou assimtrica.
Equacionando o problema
O processo de construo de uma tabela de frequncia e grficos que
envolvem os seguintes passos:
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
22
Estatstica com aplicaes e anlise exploratria
Passo 1:
Organizar os dados em ordem crescente ou decrescente de grandeza.
Arranjar os dados em forma de Rol.
Aplicando no exemplo:
Coleta de dados em Rol tempo de percurso ao trabalho em minutos
11,4 15,8 26 28,8 29,4 30,2 35,8 36,8 37 38,4
40,2 40,4 40,4 40,6 40,8 41 41 41,4 42 42
42,2 42,6 43 43,2 44 49,6 50,6 52,4 52,6 53,6
53,6 53,6 53,8 54,6 55 55,4 55,4 55,6 55,8 55,8
56,2 56,4 56,4 60 60,2 60,2 60,4 60,4 60,8 61
63,4 63,8 64 66,8 66,8 67 67,2 67,4 67,4 68
68 68,2 68,8 69,8 69,8 74 75,4 75,8 75,8 76
76 77,4 77,8 80 81,2 82 82,4 82,6 82,6 82,8
83 83,2 83,4 84 85 85,4 86,4 86,4 89,6 95,2
96,8 97 97 97,8 100 103,4 108,2 110,2 123,8 125,4
Passo 2:
Decidir o nmero de classes de sua tabela de frequncia.
A ttulo de orientao, o nmero de classes deve ficar entre 5 e 20.
O nmero efetivo de classes pode depender da convenincia de utilizar nmeros arredondados ou outros fatores subjetivos.
Importante: a relao entre o nmero de classes (k) e o tamanho da amos-tra (n), foi estudada por Sturges, o qual estabeleceu a relao:
Clculo do nmero de classes (k)
k (nmero de classes) = 1 + lognlog
2
Aplicando no exemplo:
k = 1 + log100log
2
= 764 ou seja, k = 7,64
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Estatstica com aplicaes e anlise exploratria
23
Passo 3:
Determinar o maior e o menor valor dos dados organizados.
Calcular a amplitude total do Rol (diferena entre o maior e o menor dos valores coletados).
Aplicando no exemplo:
Amplitude total do Rol = 125,4 11,4 ou seja, amplitude total do Rol = 114
Passo 4:
Dividir a amplitude total do rol pelo nmero de classes.
Arredondar o resultado para mais, at um nmero conveniente. Esse ar-redondamento para mais, no somente conveniente como tambm ga-rante que todos os valores sejam includos na tabela de frequncias.
Frmula 1 Clculo da amplitude de classe (h)
Amplitude de classe (h) = R (Amplitude)
k (Nmero de classes)(arredondar para mais)
Aplicando no exemplo:
Amplitude de classe (h) = =1148
14,25, ou seja, 14,5
(os dados originais trabalham com uma casa decimal)
Passo 5:
Escolher como limite inferior da primeira classe o menor valor observado ou um valor ligeiramente inferior a ele.
Esse valor serve como ponto de partida.
Aplicando no exemplo:
Limite inferior da primeira classe com intervalo fechado para inclu-lo = 11,4
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
24
Estatstica com aplicaes e anlise exploratria
Passo 6:
Somar a amplitude de classe ao ponto de partida, obtendo o segundo limite inferior de classe.
Adicionar a amplitude de classe ao segundo limite inferior para obter o terceiro; e assim por diante.
Aplicando no exemplo:
Amplitude de classe + limite inferior da primeira classe
11,4 + 14,5 = 25,9 (limite inferior da segunda classe)
Obs.: fazer o mesmo at completar as oito classes.
Passo 7:
Relacionar os limites inferiores de classe em uma coluna e introduzir os limites superiores, que podem ser facilmente determinados a esta altura.
Aplicando no exemplo:
Tabela 2 Frequncia do tempo de percurso ao trabalho em minutos
classes intervalo de classes
1 11,4 25,9
2 25,9 40,4
3 40,4 54,9
4 54,9 69,4
5 69,4 83,9
6 83,9 98,4
7 98,4 112,9
8 112,9 127,4
Passo 8:
Representar cada observao por um pequeno trao na classe apropriada e, com auxlio desses traos, determinar a frequncia total de cada classe.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Estatstica com aplicaes e anlise exploratria
25
Aplicando no exemplo:
Tabela 3 Frequncia com classes ajustadas: tempo de percurso at o trabalho em minutos
classes intervalo de classes intervalo de classe ajustado
1 11,4 25,9 11,4 a 25,8
2 25,9 40,4 25,9 a 40,3
3 40,4 54,9 40,4 a 54,8
4 54,9 69,4 54,9 a 69,3
5 69,4 83,9 69,4 a 83,8
6 83,9 98,4 83,9 a 98,3
7 98,4 112,9 98,4 a 112,8
8 112,9 127,4 112,9 a 127,3
Tabela 4 Frequncia com frequncia total: tempo de percurso ao trabalho em minutos
classes intervalo de classes frequncia
1 11,4 25,9 02
2 25,9 40,4 09
3 40,4 54,9 23
4 54,9 69,4 29
5 69,4 83,9 20
6 83,9 98,4 11
7 98,4 112,9 04
8 112,9 127,4 02
Passo 9:
Representar as distribuies de frequncia (dados da tabela de frequn-cia) em forma grfica, conhecida como histograma. Um histograma cons-trudo representando-se as medidas ou observaes que so agrupadas em uma escala horizontal, e as frequncias de classes em uma escala vertical; traam-se os retngulos, onde as bases so iguais aos intervalos de classes e cujas alturas so as frequncias de classe correspondentes.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
26
Estatstica com aplicaes e anlise exploratria
Aplicando no exemplo:
Grfico 1 Histograma dos tempos de percurso ao trabalho
35
30
25
20
15
10
5
0
11,4 25,9 40,4 54,9 69,4 83,9 98,4 112,9
25,9 40,4 54,9 69,4 83,9 98,4 112,9 127,4
Histograma
Passo 10:
A finalidade do histograma a de ajudar a entender os dados. Aps ter sido construdo deve-se perguntar: Que que estou vendo? Procurar no s um padro global, como tambm desvios acentuados em relao ao mesmo. No caso de um histograma, o padro global a forma geral da dis-tribuio. Os valores discrepantes so um tipo importante de desvio em rela-o ao padro global. Uma vez localizados os valores discrepantes, deve-se procurar uma explicao. Muitos valores discrepantes so provenientes de erros, outros revelam a natureza especial de algumas observaes. A expli-cao dos valores discrepantes, em geral, requer alguma informao bsica do contexto.
Passo 11:
Outra forma, no tanto utilizada de apresentao grfica o polgono de frequncia, onde as frequncias so marcadas nos pontos mdios de cada intervalo de classe, e os valores sucessivos so unidos por segmentos retilneos.
Frmula 2 Clculo do ponto mdio
(considerar os valores dos intervalos)
Ponto mdio = (X maior + X menor)2
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Estatstica com aplicaes e anlise exploratria
27
Aplicando no exemplo:
Tabela 5 Frequncia com ponto mdio Tempo de percurso ao trabalho
classes intervalo de classes ponto mdio frequncia
1 11,4 25,9 18,65 02
2 25,9 40,4 33,15 09
3 40,4 54,9 47,65 23
4 54,9 69,4 62,15 29
5 69,4 83,9 76,65 20
6 83,9 98,4 91,15 11
7 98,4 112,9 105,65 04
8 112,9 127,4 120,15 02
Grfico 2 Polgono de frequncia dos tempos de percurso ao trabalho
Polgono de frequncia
11,4 25,9 40,4 54,9 69,4 83,9 98,4 112,925,9 40,4 54,9 69,4 83,9 98,4 112,9 127,4
35
30
25
20
15
10
5
0
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
28
Estatstica com aplicaes e anlise exploratria
Passo 11:
Uma tcnica elaborada recentemente, a apresentao ramo e folhas, ofe-rece uma boa visualizao global dos dados. Primeiramente decompem-se cada nmero em seus algarismos das dezenas e das unidades, marcando juntos os valores que tm o mesmo algarismo das dezenas. Considerando os 100 tempos de percurso registrados, esses nmeros foram dados em dci-mos de minutos. Ao fazer o grfico ramo e folhas, recomenda-se ignorar os dcimos, ao invs de arredond-los para o prximo minuto.
Aplicando no exemplo:
Grfico 3 Ramo e folhas Tempos de percurso ao trabalho
Ramo Folhas
1 1 5
2 6 8 9
3 0 5 6 7 8
4 0 0 0 0 0 1 1 1 2 2 2 2 3 3 4 9
5 0 2 2 3 3 3 3 4 5 5 5 5 5 5 6 6 6
6 0 0 0 0 0 0 1 3 3 4 6 6 7 7 7 7 8 8 8 8 9 9
7 4 5 5 5 6 6 7 7
8 0 1 2 2 2 2 2 3 3 3 4 5 5 6 6 9
9 5 6 7 7 7
10 0 3 8
11 0
12 3 5
Nota: 712
4 significa 74 minutos3 significa 123 minutos
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Estatstica com aplicaes e anlise exploratria
29
Uma forma conveniente de indicar relaes entre os dados qualitativos (ca-tegorias) a construo de um diagrama de Pareto. Um diagrama de Pareto um grfico em barras para dados qualitativos, com as barras ordenadas de acordo com a frequncia. As escalas verticais em um diagrama de Pareto podem representar frequncias absolutas ou relativas. A barra mais alta fica esquerda, e as barras menores na extrema direita.
Dispondo as barras por ordem de frequncia, o diagrama de Pareto focali-za a ateno sobre as categorias mais importantes.
Construo do grfico de Pareto
Nmero de ocupados por setor de atividades - Regio Metropoli-tana SP - Jul/2007
setores de atividade frequncia
Servios 4663
Indstria 1626
Comrcio 1384
Outros (1) 978
Total 861
(1) incluem construo civil, servios domsticos etc.
Fonte: SEP. Convnio Seade Dieese e TEM/FAT
.
Ampliando seus conhecimentos
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
30
Estatstica com aplicaes e anlise exploratria
Nmero de ocupados por setor de atividades Regio Metropo-litana SP Jul/2007
Grfico de Pareto
5000
4000
3000
2000
1000
0
Servios Indstria Comrcio Outros (1)
(1) incluem construo civil, servios domsticos etc.
Fonte: SEP. Convnio Seade Dieese e TEM/FAT
.
Anlise do grfico de Pareto
Conforme mostra o grfico de Pareto, evidenciou-se uma concentrao de pessoas em atividades no setor de servios na regio metropolitana em So Paulo no ms de julho/2007, comparado com outros setores.
Curiosidades
John W. Tukey comeou como qumico e tornou-se matemtico, especia-lizando-se na estatstica, em virtude das experincias com problemas reais e experincias com dados reais no trabalho da Segunda Guerra Mundial. [...] Tukey dedicou muito do seu tempo ao estudo estatstico de problemas confusos com dados complexos: a segurana dos anestsicos utilizados por muitos mdicos e hospitais e em muitos pacientes, o monitoramento da con-cordncia com uma proibio de testes nucleares, e a qualidade do ar e a poluio ambiental. Inventou alguns instrumentos simples como o diagrama em caixa e os diagramas ramo e folhas. Mais importante, modificou a manei-ra de tratar os dados, enfatizando a necessidade de uma abordagem flex-vel, exploratria, que procure no s responder a questes especficas, mas tambm formular questes como o que os dados nos dizem?.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Estatstica com aplicaes e anlise exploratria
31
Atividades de aplicao1. Escolha a alternativa correta quanto s caractersticas/variveis: cor de
olhos, nmero de filhos, peso lquido e idade podem ser classificadas respectivamente, como:
a) variveis qualitativas, quantitativa discreta, quantitativa contnua e quantitativa contnua.
b) variveis quantitativa discreta, quantitativa discreta, quantitativa contnua e qualitativa.
c) variveis qualitativas, quantitativa contnua, quantitativa contnua e qualitativa.
d) variveis qualitativas, quantitativa discreta, quantitativa contnua e quantitativa contnua.
2. Identifique a resposta correta.
a) Uma pesquisa efetuada com 1 015 pessoas indica que 40 delas so assinantes de um servio de computador on-line. Trata-se de uma varivel quantitativa contnua.
b) Rendas anuais de enfermeiras tratam-se uma varivel qualitativa.
c) As cores de uma amostra de confeitos M&M so variveis quantita-tivas.
d) O nmero de inscries do INSS trata-se de uma varivel quantita-tiva discreta.
3. Escolha a alternativa correta quanto ao conjunto de caractersticas: inteno de votos dos eleitores de uma cidade, opinies dos teles-pectadores sobre um filme de fico exibido num canal de televiso e atitudes de clientes de supermercados face a um novo detergente. Trata-se de:
a) um conjunto de amostras.
b) um conjunto de amostragem.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
32
Estatstica com aplicaes e anlise exploratria
c) um conjunto de populao
d) um conjunto de amostragem e populao.
4. Calcule os pontos mdios conforme tabela de frequncia abaixo:
peso (kg) frequncia
0 2,0 20
2,0 4,0 32
4,0 6,0 49
6,0 8,0 31
8,0 10,0 18
5. Determine o nmero ideal de classes (k) para um conjunto de dados, conforme orientao de Sturges (arredondando para cima com nme-ro inteiro).
a) 50 dados (elementos) e
b) 150 dados (elementos).
Gabarito1. A
2. D
3. C
4.
2
2
2
2
2Ponto mdio 5. classe = (10 + 8) = 9
Ponto mdio 4. classe = (8 + 6) = 7
Ponto mdio 3. classe = (6 + 4) = 5
Ponto mdio 2. classe = (4 + 2) = 3
Ponto mdio 1. classe = (2 + 0) = 1
2Ponto mdio = (X maior + X menor)
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Estatstica com aplicaes e anlise exploratria
33
5. log 2
k (nmero de classes) = 1 + log n
para 50 dados: k (nmero de classes) = log 2
1 + log 50 = 1 + 5,6438 = 6,6438 ~ 7 classes
para 150 dados: k (nmero de classes) = log 2
1 + log 150 = 1 + 7, 2288 = 8,2288 ~ 9 classes
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
35
Medidas de tendncia central e posio
DefinioAs medidas de tendncia central tm como finalidade principal a de in-
formar sobre onde se localiza o centro da distribuio.
um dado importante para o estabelecimento de um esquema de traba-lho, para a efetivao de uma compra, para a avaliao de um projeto ou de um produto qualquer, etc. Por exemplo, suponha-se uma varivel que seja o nmero de lmpadas vendidas por dia em uma casa comercial. Esse nmero uma varivel X que assume valores possivelmente diferentes ao longo do tempo, mas que se distribuiro em torno de um valor central, o qual fixa e caracteriza as vendas em um determinado nmero de unidades por dia. Na verdade, esse centro seria o valor que representaria o nmero de unidades vendidas, caso ele fosse uma constante ao longo do tempo, ou seja: vender seis lmpadas hoje e dez amanh seria equivalente a vender oito em cada um dos dois.
Determinar o valor exato do centro de uma distribuio muitas vezes impraticvel, ou mesmo impossvel, seja pela evoluo natural da populao em funo do tempo, seja por deficincia dos aparelhos, dos mtodos, dos observadores. Por isso, em muitos casos, poder-se- contar apenas com uma estimativa do total, obtida por meio de uma amostra.
H diferentes maneiras de definir o centro e, assim, h diferentes defi-nies de medidas de tendncia central. As medidas de tendncia central frequentemente utilizadas so: mdia aritmtica, mediana, moda e ponto mdio. Qual dessas medidas a melhor? Infelizmente, no h uma respos-ta nica, porque no h critrios objetivos para determinar a medida mais representativa para todos os conjuntos de dados. As diversas medidas de tendncia central tm diferentes vantagens e desvantagens. Uma vantagem importante da mdia aritmtica que se levam em conta todos os valores, mas uma grande desvantagem que, s vezes, pode ser seriamente afetada por alguns valores extremos.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
36
Medidas de tendncia central e posio
Tabela1 Comparao entre mdia, mediana e moda
Medida Definio Existncia Vantagens Desvantagens
Mdia X = ix
1n =n
Existe sempre
Reflete cada valor.
Possui propriedades matemticas atraentes.
influenciada por valores extremos.
Mediana Valor do meio Existe sempreMenos sensvel a valores extremos do que a mdia.
Difcil de determinar para grande quantidade de dados.
Moda Valor de maior frequncia
Pode no existir;
Pode haver mais de uma moda
Valor tpico: maior quantidade de valores concentrados neste ponto.
No se presta a anlise matemtica.
Pode no ser moda para certos conjuntos de dados.
Ponto Mdio
alto + baixo
2Existe sempre _________x_________
Muito sensvel a valores externos
Raramente usada.
Comentrios geraisPara um conjunto de dados aproximadamente simtrico com uma moda,
a mdia, a mediana, a moda e o ponto mdio tendem a coincidir.
Para um conjunto de dados obviamente assimtricos, convm levar
em conta a mdia e a mediana.
A mdia relativamente confivel: ou seja, quando as amostras so
extradas da mesma populao, as mdias tendem a ser mais constan-
tes do que outras medidas (constantes no sentido de que as mdias
amostrais extradas da mesma populao no variam tanto quanto as
outras medidas).
Conceitos e regras
Mdia aritmtica da amostra (X):
A mdia fornece uma medida central de um conjunto de valores. Se os
dados so de uma amostra a mdia denotada por x (L-se: x barra).
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de tendncia central e posio
37
Talvez a medida de tendncia central mais importante seja a mdia de uma varivel. A mdia fornece uma medida da posio central. Se os dados so de uma amostra, a mdia denotada por x; se os dados so de uma populao, a mdia denotada pela letra grega . Nas frmulas estatsti-cas, costume denotar o valor da primeira observao por x1, o valor da segunda observao por x2 e assim por diante. Em geral, o valor da i-sima observao denotado por xi. Para uma amostra com n observaes.
Frmula 1 Mdia aritmtica da amostra (x)
Xn
i x1n
=
Notao:
: denota somatrio de um conjunto de valores;
x: a varivel usada para representar valores individuais dos dados;
n: representa o nmero de valores em uma amostra.
Mdia
Figura 1 A mdia como ponto de equilbrio.
Mdia aritmtica da populao ():
Tambm fornece uma medida central de um conjunto de valores, mas se os dados so de uma populao, a mdia denotada pela letra grega (L-se: mi).
Frmula 2 Mdia aritmtica da populao ()
Ni x1
N
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
38
Medidas de tendncia central e posio
Notao:
: denota somatrio de um conjunto de valores;
x: a varivel usada para representar valores individuais dos dados;
N: representa o nmero de valores de uma populao.
Mdia ponderada (X):
s vezes associam-se os nmeros a certos fatores de ponderao ou pesos, que dependem do significado ou importncia atribuda aos nmeros. Nesse caso tem a denominao de mdia ponderada.
Frmula 3 Mdia ponderada (x)
X i w1n xi i. i 1
n wi
Notao:
: denota somatrio de um conjunto de valores;
Xi: a varivel usada para representar valores individuais dos dados;
Wi: o peso da observao de ordem i.
Mediana (X):
Em um conjunto de valores o valor do meio desse conjunto, quando os valores esto dispostos em ordem crescente ou decrescente (l-se x til).
A mediana outra medida de centralizao de uma varivel. A media-na o valor que fica no meio da sequncia quando os dados so arranja-dos na ordem ascendente (classificao do menor para o maior). Com um nmero mpar de observaes, a mediana o valor do meio. Um nmero par de observaes no tem um valor nico no meio. Neste caso, segue-se a conveno de definir a mediana como sendo a mdia dos valores das duas observaes do meio.
Processo para determinar a mediana:
ordenar os valores de forma crescente ou decrescente;
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de tendncia central e posio
39
se o nmero de valores impar, a mediana o nmero localizado exa- tamente no meio da lista;
se o nmero de valores par, a mediana a mdia dos dois valores do meio.
Moda (M)
Em um conjunto de dados o dos que ocorre com maior frequncia.
Podem surgir situaes em que a maior frequncia ocorra em dois ou mais valores diferentes. Nesses casos existe mais de uma moda. Se os dados tm exatamente duas modas, diz-se que so bimodais. Se os dados tm mais de duas modas, diz-se que so multimodais. Nos casos multimodais, a moda quase nunca considerada, porque listar trs ou mais modas no seria par-ticularmente til para descrever a posio dos dados. A moda uma impor-tante medida de posio para os dados qualitativos, em que se observa a caracterstica que apresentou maior frequncia na anlise de um conjunto de dados.
Quando nenhum valor repetido, o conjunto no tem moda.
Ponto Mdio (Pm)
o valor que est a meio caminho entre o maior e o menor valor.
Embora o Ponto Mdio no seja muito usado, importante enfatizar que existem maneiras diferentes de definir o centro de um conjunto de dados.
Frmula 4 Ponto mdio (Pm)
x maior + x menor2
Pm
Processo para determinar o ponto mdio:
identificar o maior valor de todos os valores;
identificar o menor valor de todos os valores;
somar os dois valores;
dividir por dois.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
40
Medidas de tendncia central e posio
Mdia geomtrica (G)
De um conjunto de n nmeros x1, x
2 , x
3 , ..., x
n a raiz de ordem n do pro-
duto desses nmeros:
Frmula 5 Mdia geomtrica
Gn
x1
x2
x3 . . .
xn
A mdia geomtrica usada em administrao e economia para achar taxas mdias de variao, de crescimento, ou razes mdias. Dados n valores (todos positivos), a mdia geomtrica de 2, 4, 10 multiplicando-se os trs va-lores o que d 80, e tomando-se a raiz cbica do resultado, cbica porque h trs valores.
Exemplo:
Admita-se que, nos ltimos quatro anos, o produto interno bruto (PIB) de um determinado pas cresceu 2,5%, 1,7%, 2,2% e 3,5%. Denota-se por PIB0 o valor do PIB no ano relativo a este perodo, o seu valor do ltimo ano ser dado por:
PIB4= (R
1. R
2. R
3. R
4) . PIB
0
Onde as razes de crescimento, Rn, so:
R1 = 1 + 0,025
R2 = 1 + 0,017
R3 = 1 + 0,022
R4 = 1 + 0,035
Se o crescimento fosse constante nos quatro anos e, globalmente fosse idntico ao verificado, a razo R entre valores sucessivos do PIB deveria sa-tisfazer a seguinte condio:
R4 = R1. R
2. R
3. R
4
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de tendncia central e posio
41
Frmula 6 Mdia geomtrica
R =4
R1 R
2 R
3 R
4 =4
1,025 . 1,017 . 1,022 . 1,035 = 1,0247
Gn
x1
x2
x3 . . .
xn
O valor de R a mdia geomtrica das razes de crescimento R1. R
2 . R
3 . R
4
a partir de R= 1,0247 obtm-se a taxa mdia anual de crescimento do PIB, que de 2,47%.
Assimetria
Uma distribuio de dados assimtrica quando no simtrica, esten-dendo-se mais para um lado do que para o outro (uma distribuio de dados simtrica quando a metade esquerda do seu histograma aproximada-mente a imagem-espelho da metade direita).
Mdia ModaMediana
Assimtrica para a esquerda (negativamente assimtrica).
A mdia e a mediana esto esquerda da moda.
Moda - Mdia - Mediana
Simtrica (assimetria zero).
A mdia, a mediana e a moda coincidem.
MdiaModaMediana
Assimtrica para a direita (positivamente assimtrica).
A mdia e a mediana esto direita da moda.
Figura 2 Assimetria.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
42
Medidas de tendncia central e posio
Na prtica, muitas distribuies de dados so simtricas. As distribuies assimtricas para a direita so mais comuns do que as assimtricas para a es-querda, porque em geral mais fcil obter valores excepcionalmente gran-des do que valores excepcionalmente pequenos. Com as rendas anuais, por exemplo, impossvel termos valores abaixo do limite inferior zero, mas h algumas pessoas que ganham milhes de reais em um ano. Assim, as rendas anuais tendem a ser assimtricas para a direita.
O problema
Contexto A
H uma grande variedade de bebidas alcolicas espalhadas pelo mundo, fazendo do lcool a substncia psicoativa mais popular do planeta. O Brasil detm o primeiro lugar do mundo no consumo de destilados de cachaa e o quinto maior produtor de cerveja. O lcool a droga preferida dos bra-sileiros (68,7% do total). Motoristas alcoolizados so responsveis por 65% dos acidentes fatais em So Paulo. A maioria das fatalidades relacionadas ao consumo de lcool ocorre entre 18 e 25 anos. Com esta preocupao foi coletada a idade de 15 motoristas envolvidos em acidentes fatais.
Tabela 1 Idades de motoristas envolvidos em acidentes fatais
Idades
16 18 19
17 18 20
45 20 22
22 15 18
21 19 19
Explorando o problema
De posse de uma grande lista de nmeros, pouco proveito se pode tirar dela, a menos que possamos reduzi-la a uma ou algumas medidas numri-cas que resumem todo o conjunto. Tais medidas so de mais fcil manejo e compreenso do que os dados originais. Uma caracterstica importante dos dados o valor central ou mais tpico do conjunto. O objetivo deste proble-ma apresentar os mtodos mais teis para resumir dados.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de tendncia central e posio
43
Equacionando o problema
As medidas de posio referem-se a valores de uma varivel que so t-picos ou representativos de um conjunto de dados, isto , eles so um valor em torno do qual uma grande proporo de outros valores est centralizada. Existem alguns mtodos de se obter a medida de posio. Utilizando os valo-res do problema (Contexto A) sero explicadas as diferentes abordagens.
Calculando a mdia aritmtica da amostra (X)
Para calcular-se a mdia aritmtica da amostra das idades dos motoristas, conforme o contexto A, tem-se a seguinte condio:
X i x1n
n=
Passo 1:
Somam-se todas as idades.
16 + 17 + 45 + 22 + 21 + 18 + 18 + 20 + 15 + 19 + 19 + 20 + 22 +18 + 19 = 309
Passo 2:
O total das idades divide-se pelo total de motoristas (15).
X 30915
X = 38,625 = 39
Passo 3:
Concluir e interpretar o resultado (mdia).
A mdia aritmtica pode ser calculada para qualquer conjunto de dados e, assim, sempre existe. Leva-se em conta todos os elementos de um conjun-to de dados, mas pode ser influenciada por um valor extremo.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
44
Medidas de tendncia central e posio
Calculando a mdia ponderada
O clculo da mdia ponderada deve levar em conta a quantidade em que cada idade dos motoristas aparece:
X i w1n xi i. i 1
n wi
Passo 1:
Multiplica-se a idade pela sua respectiva frequncia.
15 x 1 vez = 15
16 x 1 vez = 16
17 x 1 vez = 17
18 x 3 vezes = 54
19 x 3 vezes = 57
20 x 2 vezes = 40
21 x 1 vez = 21
22 x 2 vezes = 44
45 x 1 vez = 45
Passo 2:
Somam-se os resultados.
15 + 16 + 17 + 54 + 57 + 40 + 21 + 44 + 45 = 309
Passo 3:
O total divide-se pelo total de idades (15).
X 30915
X = 38,625 = 39
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de tendncia central e posio
45
Passo 4:
Concluir e interpretar o resultado (mdia ponderada).
Calculando a mediana (X)
A mediana o valor que divide um conjunto de dados em duas partes iguais. Ento, para calcular-se a Mediana das idades dos motoristas, tem-se a seguinte condio:
Passo 1:
Ordenar os valores de forma crescente ou decrescente.
15 16 17 18 18 18 19 19 19 20 20 21 22 22 45
Passo 2:
O total de valores impar (15 motoristas). Pega-se o elemento que separa o grupo ao meio (oitavo elemento).
15 16 17 18 18 18 19 19 19 20 20 21 22 22 45
X = 19
Passo 3:
Concluir e interpretar o resultado (Mediana).
Mediana (X) o valor central, quando os valores encontram-se ordena-dos. O valor do elemento do meio se n mpar, ou a mdia dos dois valores do meio se n par.
Calculando a moda (M)
A moda no genericamente considerada a medida mais eficiente de tendncia central, porque existem muitas situaes em que mltiplos valo-res ou nenhum valor distinto ocorre.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
46
Medidas de tendncia central e posio
Passo 1:
Ordenar os valores de forma crescente ou decrescente.
15 16 17 18 18 18 19 19 19 20 20 21 22 22 45
Passo 2:
Selecionar o valor que ocorre com maior frequncia.
15 16 17 18 18 18 19 19 19 20 20 21 22 22 45
M = 18 e 19
Passo 3:
Concluir e interpretar os resultados (Moda).
O conjunto de valores bimodal, possui dois valores que ocorrem com a mesma frequncia mxima.
Calculando o ponto mdio (Pm)
Para calcular-se o Ponto Mdio das idades dos motoristas, conforme o contexto A, tem-se a seguinte condio:
x maior + x menor2
Pm
Passo 1:
Identificar a maior idade e a menor idade.
Idades
16 18 19
17 18 20
45 20 22
22 15 18
21 19 19
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de tendncia central e posio
47
Passo 2:
Somam-se os dois valores.
45 + 15 = 60
Passo 3:
Dividir a soma por dois.
602
Pm 30
Passo 4:
Concluir e interpretar o resultado (Ponto Mdio).
Extremamente simples, o Ponto Mdio (Pm
), porm, dever ser usado com cuidado como medida de tendncia central. uma medida de localizao de centro quando as distribuies forem simtricas.
Quartis, Decis e PercentisAssim como a mediana divide os dados em duas partes iguais, os trs quar-
tis, denotados por Q1, Q
2 e Q
3, dividem as observa es ordenadas (dispostas
em ordem crescente) em quatro par tes iguais. Grosso modo, Q1 separa os
25% inferiores dos 75% superiores dos valores ordenados; Q2 a mediana e
Q2 separa os 75% inferiores dos 25% superiores dos dados. Mais precisamen-
te, ao menos 25% dos dados sero no mximo iguais a Q1 e ao menos 75%
dos dados sero no mnimo iguais a Q1. Ao menos 75% dos dados sero no
mximo iguais a Q3, enquanto ao me nos 25% sero, no mnimo, iguais a Q
3.
Analogamente, h nove decis, denotados por D1, D
2, D
3,..., D
9, que dividem os
dados em dez grupos com cerca de 10% deles em cada grupo. H, finalmente, 99 percentis, que dividem os dados em 100 grupos com cerca de 1% em cada grupo. (Os quartis, decis e percentis so exemplos de fractis, que dividem os dados em partes aproximadamente iguais). Um estudante que se submeteu ao vestibular para ingresso em uma faculdade informado de que est no 92. percentil. Isso no significa, entretanto, que ele tenha obtido 92% no exame; indica, apenas, que qualquer que tenha sido a nota obtida, ela foi superior a 92% (e inferior a 8%) das notas de toda a turma. O 92. percentil , pois, uma excelente classificao em relao aos outros que fizeram o exame.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
48
Medidas de tendncia central e posio
25% 25% 25% 25%
Q1
primeiro quartil
25% percentil
Q2
segundo quartil
50% percentil
Q3
terceiro quartil
75% percentil
Figura 2 Posio dos quartis.
Para calcular os quartis:
dispomos as observaes em ordem crescente e localizamos a Mediana (X) na lista ordenada de observaes;
o primeiro quartil Q 1 a mediana das observaes que esto esquer-
da da mediana global na lista ordenada de observaes;
o terceiro quartil Q 3 a mediana das observaes que esto direita
da mediana global na lista ordenada de observaes.
Frmula 6 Percentil
Clculo do ndice (i) = p
100. n
Onde p o percentil de interesse e o n o nmero de observaes.
Se no for um nmero inteiro, arredonda-se para cima. O prximo inteiro maior que i denota a posio do p-simo percentil.
Se i um inteiro, o p-simo percentil a mdia dos valores de dados nas posies i e i+1.
Exemplo de aplicao
Frequentemente desejvel dividir os dados em quatro partes, cada parte contendo aproximadamente um quarto, ou 25% das observaes.
Os dados representam o salrio inicial e esto arranjados em ordem as-cendente. Q
2, o segundo quartil (mediana), j foi identificado como 2405.
2210 2255 2350 2380 2380 2390 2420 2440 2450 2550 2630 2825
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de tendncia central e posio
49
Clculo do quartil
Os clculos dos quartis Q1 e Q
3 exigem o uso da regra para encontrar o 25. e o
75. percentis. Estes clculos so:
Para Q1
Frmula 7 Percentil
Clculo do ndice (i) = p
100. n
i = p
100n =
25100
12 = 3
Como i um inteiro, indica que o primeiro quartil, ou 25% percentil, a mdia do terceiro e do quarto valor dos dados; assim, Q
1= (2350+2380)/2 =
2365.
Para Q3
Frmula 8 Percentil
Clculo do ndice (i) = p
100. n
i = p
100n =
75100
12 = 9
Como i um inteiro, indica que o terceiro quartil, ou 75% percentil, a mdia do nono e do dcimo valores de dados: assim, Q
3= (2450+2550)/2 = 2500. Os
quartis dividem os dados dos salrios iniciais em quatro partes, com cada parte contendo 25% das observaes.
2210 2255 2350 2380 2380 2390 2420 2440 2450 2550 2630 2825
q1 = 2365 q2 = 2405 q3 = 2500
Assim, calculam-se os quartis do mesmo modo que os percentis. No entanto, outras convenes podem ser usadas para calcular os quartis. Os valores reais atri-budos aos quartis podem variar levemente, dependendo da conveno usada. Contudo, o objetivo de todos os procedimentos para o clculo dos quartis divi-dir os dados em quatro partes iguais.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
50
Medidas de tendncia central e posio
Ampliando seus conhecimentos
Fundada em 1997, a Small Fry Design uma empresa de brinquedos e de acessrios que pro jeta e importa produtos para crianas. A linha de produtos da empresa inclui ursinhos, mbi les, brinquedos musicais, chocalhos e cober-tores de segurana, caracterizando-se por projetos de brinquedos delicados e de alta qualidade, com nfase na cor, textura e som. Os produtos so projeta-dos nos Estados Unidos e fabricados na China.
A Small Fry Design utiliza representantes independentes para vender os pro-dutos para as crianas, fornecendo para varejistas, lojas de roupas e acessrios infantis, lojas de presen tes, lojas de departamento de grande porte e principais empresas de catlogo. Atualmente, os produtos da Small Fry Design so distribu-dos em mais de mil canais de varejo por todo o ter ritrio dos Estados Unidos.
O gerenciamento do fluxo de caixa uma das mais crticas atividades na operao do dia a dia dessa jovem empresa. Assegurar a suficiente entrada de caixa para satisfazer tanto as obrigaes de dbito correntes como as vindou-ras pode significar a diferena entre o sucesso e o fracasso no negcio. Um fator crtico no gerenciamento do fluxo de caixa a anlise e o controle das contas a receber. Avaliando-se o perodo mdio e o valor em dlares das fa-turas pendentes, os gerentes podem prever a disponibilidade de caixa e mo-nitorar as mudanas na posio das contas a receber. A empresa estabeleceu os seguintes objetivos: o tempo mdio de atraso no pagamento das faturas no deve exceder a 45 dias e o valor das faturas com mais de 60 dias no deve exceder a 5% do de todas as contas a receber.
Em um recente sumrio da posio das contas a rece ber, as seguintes esta-tsticas descritivas foram fornecidas pa ra o perodo das faturas pendentes:
Mdia: 40 dias Mediana: 35 dias Moda: 31 dias
A interpretao dessas estatsticas mostra que o perod o mdio de uma fatura de 40 dias. A mediana mostra que metade das faturas tem ficado pen-dente 35 dias ou mais. A moda de 31 dias o perodo mais frequente de fatura, indicando que a extenso de tempo mais comum que uma fatura tem ficado pendente 31 dias. O sumrio estatstico tambm mostrou que somente 3% do valor monetrio de todas as contas a receber ficaram acima de 60 dias. Baseada na informao estatstica, a administrao ficou satisfeita de que as contas a re ceber e a entrada de caixa estejam sob controle.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de tendncia central e posio
51
Atividades de aplicao1. Valores de vendas dirias de pizzas do tipo calabresa durante um per-
odo de nove dias:
15 7 7 11 9 13 14 12 2
Relacione as colunas de acordo com as respostas.
a) Mdia ( ) 7
b) Mediana ( ) 11
c) Moda ( ) 8,5
d) Ponto Mdio ( ) 10
2. Escolha a alternativa correta quanto aos resultados obtidos do conjun-to a seguir:
22 19 22 19 18 20 21 22
a) mdia aritmtica igual a 17,6
mediana igual a 20
moda igual a 22
ponto mdio igual a 3
b) mdia aritmtica igual a 17,6
mediana igual a 20,5
moda igual a 19
ponto mdio igual a 3
c) mdia aritmtica igual a 20,4
mediana igual a 20,5
moda igual a 22
ponto mdio igual a 20,0
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
52
Medidas de tendncia central e posio
d) mdia aritmtica igual a 16,6
mediana igual a 20
moda igual a 19 e 22
ponto mdio igual a 3
3. Para os 20 valores de cargas axiais de latas de alumnio, relacionados abaixo, determine (a) a mdia aritmtica, (b) a mediana, (c) a moda e (d) o ponto mdio.
225 200 201 223 209 230 209 217 234 209
217 218 220 217 200 219 201 225 200 236
4. Escolha a alternativa correta quanto aos resultados obtidos do conjun-to a seguir:
35 25 28 32 31 31 29 30
a) A distribuio dos dados assimtrica para a esquerda.
b) A distribuio dos dados simtrica.
c) A distribuio dos dados assimtrica para a direita.
5. Para as 30 idades de motoristas envolvidos em acidentes fatais, orde-nadas da mais nova at a mais velha. Determine o percentil correspon-dente a 21.
17 17 17 18 18 18 18 19 19 19
19 19 21 22 22 22 23 23 24 25
27 27 28 29 31 31 32 35 39 40
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de tendncia central e posio
53
Gabarito1.
a) Mdia (C) 7
b) Mediana (B) 11
c) Moda (D) 8,5
d) Ponto Mdio (A) 10
2. C
3.
a) mdia (X) xn 20
4310 215,5
b) mediana (X)
200 200 200 201 201 209 209 209 217 217
217 218 219 220 223 225 225 230 234 236
2217 + 217 217
c) moda (M) = 200, 209 e 217 (multimodal)
d) Ponto mdio (Pm)
225 200 201 223 209 230 209 217 234 209
217 218 220 217 200 219 201 225 200 236
Pm2
X maior + X menor 2182
236 + 200
4. A
5. Percentil de 21 = 3012 100 = 40
A idade de 21 o 40. percentil
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
55
Medidas de variabilidade
DefinioUm conjunto de valores pode ser convenientemente resumido, por meio
de procedimentos estatsticos, em poucos valores representativos mdia aritmtica, mediana e moda. Tais valores podem servir de comparao para dar a posio de qualquer elemento do conjunto. Porm, no o bastante dar uma das medidas de posio para caracterizar perfeitamente um con-junto de valores, pois, mesmo sabendo, por exemplo, que a temperatura mdia de duas cidades a mesma, e igual a 28C, ainda assim, se levado a pensar a respeito do clima dessas cidades. Em uma delas a temperatura poder variar entre limites de muito calor e de muito frio e possuir, ainda, uma temperatura mdia de 28C. A outra poder ter uma variao pequena de temperatura e possuir, portanto, no que se refere temperatura, um clima mais favorvel.
Por essa razo a mdia ainda que considerada como um nmero que tem a faculdade de representar uma srie de valores no pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compem o conjunto.
Considerando os seguintes valores das variveis x, y e z:
X: 60, 60, 60, 60, 60
Y: 58, 59, 60, 61, 62
Z: 5,5, 30, 110, 150
Calculando a mdia aritmtica de cada um desses conjuntos, obtm-se:
Frmula 1 Mdia aritmtica da amostra
i 1n xi
nMdia Aritmtica da amostra (x)
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
56
Medidas de variabilidade
i 1n xi
nvarivel X (x) 300
560
i 1n xi
nvarivel Y (y) 300
560
i 1n xi
nvarivel Z (z) 300
560
Observa-se, ento, que os trs conjuntos apresentam a mesma mdia aritmtica: 60.
, porm, fcil de notar que o conjunto de X mais homogneo que os conjuntos Y e Z, j que todos os valores so iguais mdia.
O conjunto Y, por sua vez, mais homogneo que o conjunto Z, pois h menor diversificao entre cada um de seus valores e a mdia representati-va. Chamando de disperso ou variao a maior ou menor diversificao dos valores de uma varivel, em torno de um valor de tendncia central tomado como ponto de comparao, pode-se dizer, ento, que o conjunto X apre-senta disperso ou variao nula e que o conjunto Y apresenta uma disper-so ou variao menor que o conjunto Z. Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior ou menor disperso ou variao entre esses valores e a sua medida de posio, a Estatstica recorre a medidas de disperso ou de variao.
Conceitos e regras
Disperso ou variao
O grau aos quais os dados numricos tendem a dispersar-se em torno de um valor mdio chama-se variao ou disperso dos dados.
Amplitude (R)
De um conjunto de dados a diferena entre o maior e o menor valor. claro que o valor de R est relacionado com a disperso dos dados. Quanto maior a Amplitude maior a disperso dos dados. Entretanto, por depender de apenas dois valores do conjunto de dados, a amplitude contm relativa-mente pouca informao quanto disperso.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de variabilidade
57
Valor maior Valor menorR
Amplitude (R)
R = Xmximo
Xmnimo
Figura 1 Representao da amplitude em um conjunto de dados.
Processo para determinar a amplitude:
ordenar os valores de forma crescente ou decrescente;
identificar o maior valor de todos os dados da amostra;
identificar o menor valor de todos os dados da amostra;
tomar a diferena entre os dois valores.
Varincia amostral (s2)
De um conjunto de dados , por definio, a mdia dos quadrados das diferenas dos valores em relao sua mdia.
Quando se tratar de uma amostra, a simbologia s2 e quando se tratar de populao 2, que a letra minscula sigma. No confundir o (sigma) minsculo com o (sigma) maisculo, este usado para representar um somatrio.
Propriedades da varincia
A Varincia de uma constante zero.
Multiplicando-se uma varivel aleatria por uma constante, sua Varincia fica multiplicada pelo quadrado da constante.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
58
Medidas de variabilidade
Somando-se ou subtraindo-se uma constante uma varivel aleatria, sua Varincia no se altera.
A Varincia da soma ou diferena de duas variveis aleatrias indepen- dentes a soma das respectivas varincias.
Frmula 2 Varincia da amostra ( x2s )
nx2s i 1
n xi(( ( x)2
1
Processo para determinar a varincia da amostra:
Calcular a mdia ( x);
Subtrair a mdia a cada valor do conjunto (x i x);
Elevar ao quadrado cada desvio (x i x)2;
Somar os quadrados dos desvios i 1n (xi x)2; e
Dividir a soma por (n 1) quando forem dados amostrais, ou simples- mente por (N) para somar o conjunto ou todos os valores da popula-o, conhecido como Varincia da populao e mdia da populao ().
Frmula 3 Varincia da populao (2)
(N
2x )
XiN
i 1( )2
Varincia da populao , onde
( )l-se sigma e () l-se Mi
Desvio-padro amostral (s):
De um conjunto de valores amostrais uma medida da variao dos va-lores em relao mdia. Define-se desvio-padro como a raiz quadrada po-sitiva da varincia. Seu clculo feito por meio da varincia. Ao contrrio da amplitude, o desvio-padro leva em conta todos os valores, mas essa vanta-gem torna o clculo mais difcil.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de variabilidade
59
Frmula 4 Desvio-padro da amostra (sx)
(sx)
2
ni 1
n xi( x)2
1
Frmula 5 Desvio-padro da populao (x)
i 1N xi( )2
N
x )2
(
Regras para o desvio-padro
o desvio-padro (s): mede a disperso em torno da mdia e s deve ser usado quando a mdia tomada como medida de centro.
o desvio-padro (s) igual a zero: somente quando no h disperso. E isto ocorre quando todas as observaes tm o mesmo valor. Em caso contrrio, s > 0. Na medida em que as observaes se tornam mais dispersas em torno da mdia, s aumenta.
Assim como a mdia ( x), o Desvio-padro (s) fortemente influenciado por observaes extremas. Uns poucos valores discrepantes podem acarretar um grande valor de s.
Arredondamento de dados
O resultado do arredondamento de um nmero como 72,8 para o intei-ro mais prximo 73, posto que 72,8 mais prximos de 73 do que de 72. Semelhantemente em 72,8146 o arredondamento para o centsimo mais prximo, ou com duas decimais, 72,81, porque 72,8146 mais prximo de 72,81 do que 72,82.
Ao arredondar 72,465 para o centsimo mais prximo, entretanto, de-para-se com um dilema, pois 72,465 dista igualmente de 72,46 e de 72,47. Usa-se, na prtica, em tais casos, aproximar para o nmero par que pre-cede o cinco. Assim, 72,465 arredondado para 72,46, onde 183,575 ar-redondado para 183,58. Essa prtica especialmente valiosa para reduzir ao mnimo os erros acumulados por arredondamento, quando se tratar de grande nmero de operaes.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
60
Medidas de variabilidade
O problema
Contexto A Muitos bancos comerciais costumavam exigir que os clientes formas-
sem filas separadas para os diversos guichs, mas recentemente passaram a adotar fila nica. Qual o motivo dessa modificao? O tempo mdio de espera no se modifica, porque a fila de espera no afeta a eficincia dos caixas. A adoo de fila nica se deveu ao fato de os clientes preferirem tempos de espera mais consistentes com menor variao. Assim que mi-lhares de bancos efetuaram uma modificao que resultou em uma variao menor (e clientes mais satisfeitos), mesmo que a mdia no tenha sido afe-tada. Considera-se agora uma amostra de dados bancrios, onde os valores relacionados so tempos de espera (em minutos) de clientes.
Tabela 1 Tempos de espera em minutos em filas de banco
Banco Jefferson Valley (fila nica) 7,1 7,7 6,7 6,8 6,5 7,3 7,4 7,7 7,7 6,6
Banco da Providncia (fila mltipla) 7,7 5,4 9,3 6,7 6,2 7,7 4,2 8,5 5,8 10,0
Os clientes do Banco Jefferson Valley entram em uma fila nica que atendida por trs caixas. Os clientes do Banco da Providncia podem entrar em qualquer uma das trs filas que conduzem a trs guichs.
Explorando o problema
So necessrios dois tipos de medidas para descrever adequadamente um conjunto de dados. Alm da informao quanto ao meio de um conjun-to de nmeros, conveniente dispor tambm de um mtodo que permita exprimir a disperso, pois a sumarizao de um conjunto de dados, por meio de uma nica medida de representao central, esconde toda a informao sobre a variao do conjunto de valores. Ento se nota a convenincia de criar-se uma medida que sumariza a variao de uma srie de valores e que permite comparar conjuntos diferentes de valores. A Estatstica recorre s medidas de disperso ou variao para atender esse objetivo.
Alguns conceitos-chave so fundamentais para dominar a anlise de um conjunto de dados:
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de variabilidade
61
a variao se refere a quanto os valores podem diferir entre si e pode ser medida por nmeros especficos;
os nmeros relativamente prximos uns dos outros tm baixas medi- das de variao, enquanto os valores mais dispersos tm maior medi-da de variao.
Equacionando o problema
As medidas de disperso indicam se os valores esto relativamente pr-ximos uns dos outros, ou separados. Esta situao ilustrada esquematica-mente na figura abaixo. As observaes (a) apresentam valores relativamente prximos dos outros, em comparao com os da (b). As formas de encontrar essas medidas de disperso podem ser tratadas atravs da amplitude, vari-ncia amostral e desvio-padro amostral.
(a)
(b)
(a) pequena disperso e (b) grande disperso
Figura 2 Representao da disperso de dados.
Calculando a amplitude (R)
Para medir-se a amplitude dos tempos de espera em filas de bancos, con-forme o contexto A, tem-se a seguinte condio:
Frmula 6 Amplitude (R)
Amplitude (R) = Xmximo
Xmnimo
Passo 1:
Ordenar os valores de forma crescente ou decrescente.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
62
Medidas de variabilidade
Tabela 2 Tempos de espera em minutos em filas de banco ordenados
Banco Jefferson Valley (fila nica) 6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7
Banco da Providncia (fila mltipla) 4,2 5,4 5,8 6,2 6,7 7,7 7,7 8,5 9,3 10,0
Passo 2:
Identificar o maior valor (Xmximo
) e o menor valor (Xmnimo
) para cada banco.
Tabela 3 Tempos de espera em minutos em filas de banco identificao dos valores extremos
Banco Jefferson Valley (fila nica) X mximo
= 7,7 Xmnimo
= 6,5
Banco da Providncia (fila mltipla) X mximo
= 10,0 Xmnimo
= 4,2
Passo 3:
Aplicar a frmula para cada banco.
Amplitude (R) = Xmximo
Xmnimo
Tabela 4 Tempos de espera em minutos em filas de banco valor da amplitude
Banco Jefferson Valley (fila nica) R = 1,2
Banco da Providncia (fila mltipla) R = 5,8
Passo 4:
Concluir e interpretar os resultados (Amplitude).
A Amplitude (R) fornece uma ideia do afastamento entre o maior valor e o menor valor, mas no , na realidade, uma boa medida de disperso de toda a distribuio. A amplitude no fornece qualquer informao de toda a dis-tribuio, ou seja, no d qualquer informao sobre qualquer elemento na relao, exceto seus valores extremos. No contexto apresentado dos bancos,
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de variabilidade
63
nota-se uma distncia maior dos valores (mximo e mnimo) do Banco da Providncia (fila mltipla) necessita-se ainda de uma medida de disperso que leve em conta todos os nmeros da relao.
Calculando a varincia amostral s 2( )xA varincia da amostra s
2x( ) uma medida de disperso extremamente
importante na teoria estatstica. Do ponto de vista prtico, ela tem o incon-veniente de se expressar numa unidade quadrtica em relao da varivel em questo.
Frmula 5 Varincia da amostra ( )sx2
Varincia da amostran
i 1n xi( x)2
1s 2x( )
Passo 1:
Calcular a mdia aritmtica para cada banco.
Frmula 6 Mdia aritmtica da amostra (x)
ni 1
n xiMdia Aritmtica da amostra (x)
Tabela 5 Mdia dos tempos de espera em minutos em filas de banco
Banco Jefferson Valley (fila nica) 10
6,5 + 6,6 + 6,7 + 6,8 + 7,1 + 7,3 + 7,4 + 7,7 + 7,7 + 7,7xBJV
7,15
Banco da Providncia (fila mltipla) 10
4,2 + 5,4 + 5,8 + 6,2 + 6,7 + 7,7 + 7,7 + 8,5 + 9,3 + 10,0xBPro
7,15
Passo 2:
Subtrair a mdia de cada valor do conjunto (amostra).
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
64
Medidas de variabilidade
Tabela 6 Tempos de espera em minutos no Banco Jefferson Valley
xi x (xi x)6,5 7,15 -0,656,6 7,15 -0,55
6,7 7,15 -0,45
6,8 7,15 -0,35
7,1 7,15 -0,05
7,3 7,15 0,15
7,4 7,15 0,25
7,7 7,15 0,55
7,7 7,15 0,55
7,7 7,15 0,55
Tabela 7 Tempos de espera em minutos no Banco Providncia
xi x (xi x)4,2 7,15 -2,95
5,4 7,15 -1,75
5,8 7,15 -1,35
6,2 7,15 -0,95
6,7 7,15 -0,45
7,7 7,15 0,55
7,7 7,15 0,55
8,5 7,15 1,35
9,3 7,15 2,15
10,0 7,15 2,85
Passo 3:
Elevar ao quadrado cada desvio.
Tabela 8 Tempos de espera em minutos no Banco Jefferson Valley para clculo da Varincia da Amostra ( )sx
2
xi x (xi x) (xi x)2
6,5 7,15 -0,65 0,4225
6,6 7,15 -0,55 0,3025
6,7 7,15 -0,45 0,2025
6,8 7,15 -0,35 0,1225
7,1 7,15 -0,05 0,0025
7,3 7,15 0,15 0,0225
7,4 7,15 0,25 0,0625
7,7 7,15 0,55 0,3025
7,7 7,15 0,55 0,3025
7,7 7,15 0,55 0,3025
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de variabilidade
65
Tabela 9 Tempos de espera em minutos no Banco Providncia para clculo da Varincia da Amostra ( )sx
2
xi x (xi x) (xi x)2
4,2 7,15 -2,95 8,70255,4 7,15 -1,75 3,06255,8 7,15 -1,35 1,82256,2 7,15 -0,95 0,90256,7 7,15 -0,45 0,20257,7 7,15 0,55 0,30257,7 7,15 0,55 0,30258,5 7,15 1,35 1,82259,3 7,15 2,15 4,6225
10,0 7,15 2,85 8,1225
Passo 4:
Somar os quadrados dos desvios.
Tabela 10 Somatria dos tempos de espera em minutos no Banco Jefferson Valley
xi x (xi x) (xi x)2
6,5 7,15 -0,65 0,4225
6,6 7,15 -0,55 0,3025
6,7 7,15 -0,45 0,2025
6,8 7,15 -0,35 0,1225
7,1 7,15 -0,05 0,0025
7,3 7,15 0,15 0,0225
7,4 7,15 0,25 0,0625
7,7 7,15 0,55 0,3025
7,7 7,15 0,55 0,3025
7,7 7,15 0,55 0,3025
(somatria) = 2,0450
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
66
Medidas de variabilidade
Tabela 11 Somatria dos tempos de espera em minutos no Banco Providncia
xi x (xi x) (xi x)2
4,2 7,15 -2,95 8,7025
5,4 7,15 -1,75 3,0625
5,8 7,15 -1,35 1,8225
6,2 7,15 -0,95 0,9025
6,7 7,15 -0,45 0,2025
7,7 7,15 0,55 0,3025
7,7 7,15 0,55 0,3025
8,5 7,15 1,35 1,8225
9,3 7,15 2,15 4,6225
10,0 7,15 2,85 8,1225
(somatria) = 29,8650
Passo 5:
Dividir a soma por (n - 1) se tratar de dados amostrais ou simplesmente por N se os dados representam todos os valores de uma populao. No caso dos bancos trata-se de dados amostrais dividindo-se por (n - 1), o valor de n=10 elementos/valores. Encontrar a varincia da amostra (s2).
Varincia da amostra ( )sx2
Varincia da amostra s2x( ) i 1
n xi( x)2
n 1
Tabela 12 Valor da varincia da amostra para cada banco ( )sx2
Banco Jefferson Valley (fila nica)10 12,0450s
BJV
2 0,227222
Banco da Providncia (fila mltipla)10 1
29,8650sBPRO
2 3,318333
Passo 6:
Concluir e interpretar os resultados (varincia amostral).
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de variabilidade
67
A varincia de uma amostra a mdia dos quadrados dos desvios dos valores a contar da mdia. No contexto dos bancos percebe-se uma maior varincia quanto ao tempo de espera na fila do Banco Providncia. Porm, a varincia representa um valor (resultado) elevado ao quadrado, sendo difcil interpretar o valor numrico. Esse inconveniente sanado com a definio do desvio-padro amostral (s).
Calculando o desvio-padro da amostra (sx)
O Desvio-Padro da amostra simplesmente a raiz quadrada positiva da varincia da amostra. Assim, para determinar o desvio-padro, calcula-se a varincia e toma-se a raiz quadrada positiva do resultado. O desvio-padro cresce quando a disperso dos dados aumenta.
Frmula 7 Desvio-padro da amostra (sx)
Desvio-padro da amostra (sx)
ni 1
n xi( x)2
12
Passo 1:
Calcular a raiz quadrada positiva da varincia da amostra, isto , cal-cular o desvio-padro da amostra (s). Tomar uma casa a mais dos dados originais.
Tabela 13 Valor do desvio-padro da amostra para cada banco (sx)
Banco Jefferson Valley (fila nica) 10 1
2,0450sBJV
2 0,227222 s 0,227222 0,482
Banco da Providncia (fila mltipla) 10 1
29,8650sBPRO
2 3,318333 s 3,318333 1,822
Passo 6:
Concluir e interpretar os resultados (varincia amostral).
O desvio-padro da amostra (s) uma das medidas mais comumen-te utilizadas para distribuies e desempenha papel relevante em toda a
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
68
Medidas de variabilidade
Uma desvantagem do desvio-padro como medida de variao que ele depende das unidades de medida. Por exemplo, os pesos de determinado objeto podem ter um desvio-padro de 0,1 miligramas, o valor no informa ou traduz se representa uma grande variao ou pequena variao, somente se existe uma comparao entre duas amostras ou mais. O que interessa nessa situao uma medida de variao relativa, como o coeficiente de variao.
Coeficiente de variao % (CV%)
definido como o quociente entre o desvio-padro e a mdia. frequen-temente expresso em porcentagem. Sua vantagem a de caracterizar a dis-perso dos dados em termos relativos a seu valor mdio. Assim, uma peque-na disperso absoluta pode ser, na verdade, considervel quando comparada com a ordem de grandeza dos valores da varivel e vice-versa. Alm disso, por ser adimensional, o coeficiente de variao fornece uma maneira de se com-pararem as disperses de variveis cujas unidades so irredutveis.
Frmula 9 Coeficiente de variao % (CV%)
CV% sxx
100.
No exemplo dos bancos tem-se a anlise da variao de cada um confirma-da pelo coeficiente de variao.
Tabela 14 Valor do coeficiente de variao para cada banco
Banco Jefferson Valley (fila nica) CV%0,48 100.7,15
6,71%
estatstica. Cabe observar que a unidade do desvio-padro a mesma uni-dade da mdia aritmtica, permitindo confirmar que entre os bancos o que apresenta uma variao (disperso) maior quanto ao tempo de espera nas filas o banco Providncia, com um desvio-padro de 1,821629, reforando a concluso de que o sistema de fila nica utilizado na amostra do Banco Jefferson Valley tem variao muito menor.
Ampliando seus conhecimentos
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de variabilidade
69
Banco da Providncia (fila mltipla) .CV%1,82 1007,15
25,87%
Regra emprica para os dados
Uma regra que auxilia a interpretao do valor de um desvio-padro a regra emprica, aplicvel somente a conjuntos de dados com distribuio aproximadamente em forma de sino.
A regra 68-95-99 para os dados com distribuio em forma de sino.
Cerca de 68% dos valores esto a menos de um desvio-padro a contar da mdia.
Cerca de 95% dos valores esto a menos de dois desvios-padro a contar da mdia.
Cerca de 99,7% dos valores esto a menos de trs desvios-padro a contar da mdia.
Grfico 1 A regra emprica para dados com distribuio em forma de sino
-4 -3 -2 -1 0 1 2 3 4
99,73%
0.4
0.3
0.2
0.1
0.0
68%
95%
Output
Curva normal e reas de probabilidade
O entendimento do grfico acima evidencia valores presumivelmen-te em percentagens (output = sada so os registros dos dados de uma determinada varivel), sendo razovel entender que so aproximada-mente 68%, aproximadamente 95%, ou aproximadamente 99,73% dos valores em torno da mdia (no grfico a mdia representada pelo ponto zero).
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
70
Medidas de variabilidade
No Brasil o Instituto Brasileiro de Geografia e Estatstica (IBGE) se constitui no principal provedor de dados e informaes do pas, que atendem s ne-cessidades dos mais diversos segmentos da sociedade civil, bem como dos rgos das esferas governamentais federal, estadual e municipal.
O IBGE oferece uma viso completa e atual do pas, atravs do desempe-nho de suas principais funes:
produo e anlise de informaes estatsticas;
coordenao e consolidao das informaes estatsticas;
produo e anlise de informaes geogrficas;
coordenao e consolidao das informaes geogrficas;
estruturao e implantao de um sistema de informao am- biental;
documentao e disseminao de informaes;
coordenao do sistema estatstico e cartogrfico nacionais.
Histrico do IBGE
Durante o perodo imperial, o nico rgo com atividades exclusivamente estatsticas era a Diretoria Geral de Estatstica, criada em 1871. Com o adven-to da Repblica, o governo sentiu necessidade de ampliar essas atividades, principalmente depois da implantao do registro civil de nascimentos, casa-mentos e bitos.
Com o passar do tempo, o rgo responsvel pelas estatsticas no Brasil mudou de nome e de funes algumas vezes at 1934, quando foi extinto o Departamento Nacional de Estatstica, cujas atribuies passaram aos minis-trios competentes.
Curiosidade
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de variabilidade
71
A carncia de um rgo capacitado a articular e coordenar as pesquisas estatsticas, unificando a ao dos servios especializados em funcionamento no Pas, favoreceu a criao, em 1934, do Instituto Nacional de Estatstica (INE), que iniciou suas atividades em 29 de maio de 1936. No ano seguinte, foi insti-tudo o Conselho Brasileiro de Geografia, incorporado ao INE, que passou a se chamar, ento, Instituto Brasileiro de Geografia e Estatstica.
H 69 anos, o IBGE cumpre a sua misso: identifica e analisa o territrio, conta a populao, mostra como a economia evolui atravs do trabalho e da produo das pessoas, revelando ainda como elas vivem.
Atividades de aplicao1. Observam-se, a seguir, os tempos (em segundos) de reao a um alar-
me de incndio, aps a liberao de fumaa de uma fonte fixa:
12 9 11 7 9 14 6 10
Escolha a alternativa correta quanto ao valor da amplitude da amostra.
a) Amplitude igual a 10.
b) Amplitude igual a 4.
c) Amplitude igual a 8.
d) Amplitude igual a 6.
2. Identifique das alternativas abaixo a resposta correta para a situao descrita:
Situao: suponha que trs grupos de alunos submetem-se a um tes-te, obtendo as seguintes notas:
Grupo A: notas = 3 4 5 6 9
Grupo B: notas = 1 3 5 7 9
Grupo C: notas = 5 5 5 5 5
a) O grupo A o que apresenta maior disperso/variao, com ampli-tude igual a 2.
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
72
Medidas de variabilidade
b) O grupo B o que apresenta menor disperso/variao, com am-plitude igual a 4.
c) O grupo A e B apresentam maior disperso/variao, do que o grupo C .
d) O grupo C apresenta maior disperso/variao, com amplitude igual a 0 (zero).
3. Escolha a alternativa correta quanto aos resultados obtidos da amos-tra abaixo:
Amostra n. 1:
4 2 9 8 7
a) A amplitude igual a 3 e a varincia igual a 5,5.
b) A amplitude igual a 5 e a varincia igual a 8,5.
c) A amplitude igual a 7 e a varincia igual a 5,5.
d) A amplitude igual a 7 e a varincia igual a 8,5.
4. Calcule a varincia da amostra dos valores abaixo:
Situao: para facilitar um projeto de ampliao da rede de esgotos de uma regio em uma pequena cidade, as autoridades tomaram uma amostra de oito quarteires que compem a regio, e identificaram os seguintes nmeros de casas por quarteires:
12 6 7 3 15 10 18 5
5. Calcule o desvio-padro da amostra dos valores abaixo:
Situao: para facilitar um projeto de ampliao da rede de esgotos de uma regio em uma pequena cidade, as autoridades tomaram uma amostra de oito quarteires que compem a regio, e identificaram os seguintes nmeros de casas por quarteires:
12 6 7 3 15 10 18 5
Este material parte integrante do acervo do IESDE BRASIL S.A., mais informaes www.iesde.com.br
-
Medidas de variabilidade
73
Gabarito1. C
2. C
3. D
4. n
i 1n xiMdia Aritmtica da amostra (x)
876 9,5
Varincia da amostra (s ) i 1n xi( x)2
n 1x2
xi x (xi x) (xi x)2
3 9,5 -6,5 42,25
5 9,5 -4,5 20,25
6 9,5 -3,5 12,25
7 9,5 -2,5 6,25
10 9,5 0,5 0,25
12 9,5 2,5 6,25
15 9,5 5,5 30,25
18 9,5 8,5 72,25
190
Varincia da amostra (s )n
i 1n xi( x)2
1x2
7190 27,14286
5. n
i 1n xiMdia Aritmtica da amostra (x)8
76 9,5
Varincia da amostra (s )n
i 1n xi( x)2
1x2
xi x (xi x) (xi x)2
3 9,5 -6,5 42,25
5 9,5 -4,5 20,25
6 9,5 -3,5 12,25
7 9,5 -2,5 6,25
10 9,5 0,5 0,25
12 9,5 2,5 6,25
15 9,5 5,5 30,25
18 9,5 8,5 72,25
190
Varincia da amostra (s )n
i 1n xi( x)2
1x2
7190 27,14286
Desvio-padro da amostra (sx)
n i 1n xi( x)2
12 27,14286
25,20988
Este material parte integrante do acervo do I