Alexandre Lima - Medidas de Dispersão
Transcript of Alexandre Lima - Medidas de Dispersão
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 1
Estatística Aula 02
Estatística Descritiva – Medidas de Dispersão
1 Medidas de Dispersão .......................................................................................................... 21.1 Variância ............................................................................................................................ 21.2 Desvio Padrão .................................................................................................................. 71.3 Coeficiente de Variação ................................................................................................ 71.4 Desvio Interquartílico .................................................................................................... 81.5 Diagrama de Caixa ......................................................................................................... 8
2 Resumo.................................................................................................................................... 123 Exercícios de Fixação ......................................................................................................... 134 Gabarito .................................................................................................................................. 215 Resolução dos Exercícios de Fixação ........................................................................... 22
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 2
1 Medidas de Dispersão
Pense na seguinte situação: uma pessoa faz quatro refeições por dia, enquanto que outra não faz nenhuma refeição por dia. Na média, ambas fazem duas refeições por dia. Isto quer dizer que os dois indivíduos estão bem alimentados? A resposta óbvia é não. É para isso que servem as medidas de dispersão, isto é, medidas de como os dados estão agrupados: mais ou menos próximos entre si (mais ou menos dispersos).
As medidas de dispersão indicam o quanto os dados se apresentam dispersos em torno da região central. Desta forma, caracterizam o grau de variabilidade existente nos dados. As seguintes medidas de dispersão nos interessam: a variância, o desvio padrão, o coeficiente de variação e o desvio interquartílico.
1.1 Variância
A variância de um conjunto de observações }x,...,x,x{ n21 pode ser calculada pela fórmula
(1) ∑=
−=n
1i
2i
2x )xx(
n1s
em que 2xs denota a variância e x representa a média aritmética. Se os valores
distintos k21 x,...,x,x ocorrerem com as frequências k21 f,...,f,f (∑=
=k
1iif n ),
respectivamente, a variância será dada por (*)
(2) ∑=
−=k
1i
2ii
2x )xx(f
n1s .
(*) Em (1) e (2), consideramos que os dados se referem a uma população finita. Caso os dados estejam associados a uma amostra, o fator n (= Σfi) que aparece no denominador do lado direito de (1) e (2) deve ser substituído por (n–1):
∑=
−−
=n
1i
2i
2x )xx(
1n1s
A justificativa para o uso do fator (n–1) na fórmula da variância amostraldada acima foge ao escopo deste curso. Para satisfazer a sua curiosidade, posso apenas mencionar que o uso do fator (n–1) resolve um problema de estatística indutiva (e paro por aqui!). É importante saber que a diferença entre as duas definições torna-se desprezível para grandes valores de n.
A variância tem, entre outras, as seguintes propriedades:
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 3
a) multiplicando todos os valores de uma variável por uma constante, a variância do conjunto fica multiplicada pelo quadrado dessa constante. Seja x a variável de interesse, c um valor constante e y = cx. Então 2
x22
y scs = .
b) somando ou subtraindo uma constante a todos os valores de uma variável, a variância não se altera. Seja x a variável de interesse, c um valor constante e y = x + c. Então 2
xy2s s= .
Note-se que (1) pode ser reescrita na forma
2
i
2i
2
ii
i
2i
2x xx
n1x
n1x
n1s −⎟
⎠
⎞⎜⎝
⎛=⎟
⎠
⎞⎜⎝
⎛−⎟
⎠
⎞⎜⎝
⎛= ∑∑∑ ,
ou seja, como a diferença entre a média aritmética dos quadrados dos valores e o quadrado da média aritmética dos valores:
⇒ VARIÂNCIA = Média dos Quadrados – Quadrado da Média.
Demonstra-se que a variância amostral também é dada por
2n
1i
2i
2x x
1nnx
1n1s ⎟
⎠⎞
⎜⎝⎛
−−
−= ∑
=
Exemplo. Considere o conjunto de dados {2, 5, 8, 11, 14}. Então a variância desse conjunto é
A) 8
B) 20,25
C) 18
D) 24
E) 22
Resolução
A média do conjunto é
85
1411852x =++++
=
e a variância
.185
)814()811()88()85()82(n
)xx(s
222222i2
x =−+−+−+−+−
=−
= ∑
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 4
Também podemos usar a fórmula "maceteada" da variância:
Variância = Média dos Quadrados – Quadrado da Média = 2
ii x2x
n1
−⎞⎟⎠
⎜⎝
⎛ ∑
Sequência de cálculos:
1) Média dos quadrados:
825
4105
1411852xn1 22222
i
2i ==
++++=∑ .
2) Quadrado da média:
648xxn1 22
2
ii ===⎟⎠
⎞⎜⎝
⎛ ∑ .
Então,
3) 186482s2x =−= (mesmo resultado!).
GABARITO: C
Variância Combinada
Considere o conjunto de dados A com NA elementos, média A e variância 2As e
o conjunto B com NB elementos, média B e variância 2Bs . Pode-se demonstrar
que a variância da população conjunta A+B, também denominada variância combinada ou global, é dada por
2
BABA
2
BA
22
BA NNBA
NNB
NNA
s ⎥⎦
⎤⎢⎣
⎡
++
−+
++
= ∑ ∑∑∑+ .
Fazendo N = NA + NB, obtemos
2222
BA NBA
NB
NA
s ⎟⎟⎠
⎞⎜⎜⎝
⎛ +−+= ∑∑∑∑
+ .
Já caiu em prova! (Adm. Jr./REFAP/2007/Cesgranrio). O setor de recursos humanos de uma empresa tem o hábito de divulgar separadamente a média e a variância das notas das avaliações dos funcionários do sexo feminino e do masculino. Na última avaliação, os resultados obtidos foram:
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 5
Feminino Masculino Número de funcionários 20 30
Média 6 7 Variância 3,4 4
A média e a variância das notas dos funcionários dessa empresa, respectivamente, valem:
A) 6,5 e 3,7
B) 6,6 e 3,4
C) 6,6 e 4,0
D) 7,5 e 3,7
E) 13,0 e 7,5
Resolução
Dados: NA = 20, 6A = e 4,3s2A = (conjunto feminino); NB = 30, 7B = e 0,4s2
B = (conjunto masculino).
A média global ou média das médias é dada pela média ponderada das médias dos conjuntos:
.6,63020
730620NN
BNANXBA
BABA =
+×+×
=++
=+
O resultado acima já nos permite eliminar as opções A, D e E. Restaram as alternativas B e C.
A variância combinada é dada por
2222
BA NBA
NB
NA
s ⎟⎟⎠
⎞⎜⎜⎝
⎛ +−+= ∑∑∑∑
+ .
Calcularemos a variância combinada se soubermos os valores das somatórias A∑ (soma de A), B∑ (soma de B), A2∑ (soma dos quadrados de A) e B2∑
(soma dos quadrados de B).
A média do conjunto A é 6 ⇒ 120A620
A=⇒= ∑∑ (soma de A = 120).
A média do conjunto B é 7 ⇒ 210B730
B=⇒= ∑∑ (soma de B = 210).
A variância de A é 3,4. Então,
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 6
4,3920A
4,3620A
4,3A20A
4,3N
AN
As
22
22
22
AA
22A =⇒=−⇒=−⇒⎟ =⎟
⎠
⎞⎜⎜⎝
⎛−= ∑∑∑∑∑
7884,3920A2 =×=⇒ ∑ (soma dos quadrados de A = 788).
A variância de B é 4,0. Logo,
0,5330
B0,47
30B
0,4B30
B0,4
NB
NB
s2
22
222
BB
22B =⇒=−⇒=−⇒⎟ =⎟
⎠
⎞⎜⎜⎝
⎛−= ∑∑∑∑∑
590.15330B2 =×=⇒ ∑ (soma dos quadrados de B = 1.590).
Finalmente, temos que
222222
2BA 6,656,47
50330
50378.2
50210120
50590.1
50788
NBA
NB
NA
s −=⎟⎠⎞
⎜⎝⎛−=⎟
⎠⎞
⎜⎝⎛ +
−+⎟ =⎟⎠
⎞⎜⎜⎝
⎛ +−+= ∑∑∑∑
+
0,456,4356,47s2BA =−=+ ⇒ variância combinada = 4,0.
GABARITO: C
Nota: se as médias dos conjuntos A e B forem iguais, ou seja, se BA = , a variância combinada pode ser calculada por meio da fórmula simplificada
NsNsN
NNsNsNs
2BB
2AA
BA
2BB
2AA2
BA+
=++
=+ ,
em que N = NA + NB. Repare que trata-se de uma média ponderada das variâncias individuais.
Atenção: a fórmula acima é um caso particular da fórmula anterior da variância combinada. Você só poderá aplicá-la quando as médias dos conjuntos A e B forem iguais!
Exemplo. Sejam os conjuntos de números {2, 5, 8, 11, 14} e {2, 8, 14}, Assinale a opção com a variância dos conjuntos combinados ou reunidos.
A) 8
B) 20,25
C) 18
D) 24
E) 22
Resolução
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 7
Temos a série estatística A = {2, 5, 8, 11, 14} com média
8540
51411852A ==
++++=
e a série B = {2, 8, 14} com média
8324
31482B ==
++= .
Como as médias são iguais, podemos aplicar a fórmula simplificada
NsNsNs
2BB
2AA2
BA+
=+ .
Variância do 1º conjunto:
.185
)814()811()88()85()82(N
)AA(s
22222
A
22A =
−+−+−+−+−=
−= ∑
Variância do 2º conjunto: .243
)814()88()82(N
)BB(s
222
B
22B =
−+−+−=
−= ∑
Variância combinada: .25,2035
243185s2BA =
+×+×
=+
GABARITO: B
1.2 Desvio Padrão
O desvio padrão de um conjunto de dados é a raiz quadrada positiva da variância, ou seja,
(3) 2xxs s+= .
O desvio padrão está na mesma unidade da variável, sendo, por isso, de maior interesse na prática.
Exemplo. Determine o desvio padrão do conjunto 2, 5, 8, 11, 14.
Vimos que esse conjunto possui variância igual a 18. Logo, 24,418 ≈=xs .
1.3 Coeficiente de Variação
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 8
O coeficiente de variação é definido como a razão entre o desvio padrão e a média, sendo frequentemente expresso em porcentagem:
(4) xs)x(cv x= .
Esta medida caracteriza a dispersão dos dados em termos relativos a seu valor médio.
Exemplo. Determine o coeficiente de variação do conjunto 2, 5, 8, 11, 14.
O conjunto tem média 8 e desvio padrão 4,24. Portanto, %5353,0824,4)x(cv =≈= .
1.4 Desvio Interquartílico
O desvio interquartílico, definido por
(5) isQ QQd −= ,
em que Qd denota o desvio interquartílico, sQ é o quartil superior e iQ o
quartil inferior, pode ser usado como uma medida de dispersão. Em distribuições mais dispersas, os valores dos quartis ficam mais distantes. Em distribuições simétricas, a distância entre o quartil inferior e a mediana é igual à distância entre a mediana e o quartil superior, enquanto que em distribuições assimétricas essas distâncias são diferentes.
Exemplo. O primeiro e o terceiro quartis da distribuição das alturas dos estudantes da Universidade de São Paulo são 165,56 cm e 178,59 cm, respectivamente. Calcule o desvio interquartílico dessa distribuição.
03,1356,16559,178QQd isQ =−=−= cm.
1.5 Diagrama de Caixa
Um diagrama de caixa ou box plot ou “caixa-de-bigodes” é um retângulo que representa o desvio interquartílico (IQR) (é a estatística Qd definida
por (5)). Para construir esse diagrama (veja a próxima figura), consideramos um retângulo onde estão representados a mediana, o primeiro quartil (Q1) e o terceiro quartil (Q3). A partir do retângulo, para cima, segue uma linha até o ponto mais remoto que não pode exceder LS = Q3 + 1,5.IQR, chamado limite superior. De modo análogo, a partir do retângulo, para baixo, segue uma linha até o ponto mais remoto que não seja menor que LS = Q1 –1,5.IQR, chamado limite inferior. Os valores compreendidos entre esses dois limites são chamandos valores adjacentes. As observações que estiverem acima do limite superior ou abaixo do limite inferior serão denominadas pontos
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 9
exteriores. Essas observações são destoantes das demais e podem ou não ser o que chamamos de outliers ou valores atípicos (*)1. Um outlier pode ser produto de um erro de observação ou de arredondamento. Contudo, as denominações pontos exteriores e outliers são frequentemente usadas com o mesmo significado por alguns autores2: observações fora de lugar, discrepantes ou atípicas.
(*) A média aritmética é sensível a outliers. Um único valor “ruim” do conjunto de dados pode distorcer a média, ou seja, pode mover a média para longe do centro da distribuição de frequências. As médias geométrica e harmônica, assim como a aritmética, também não são robustas a outliers.
O box plot nos dá uma noção da posição, dispersão, assimetria, caudas e dados discrepantes da distribuição. A posição central é dada pela mediana e a dispersão por IQR. As posições relativas de Q1, Q2 e Q3 nos dão uma idéia da assimetria da distribuição. Os comprimentos das caudas são dados pelas linhas que vão do retângulo aos valores remotos e pelos valores atípicos. Os comprimentos das caudas são dados pelas linhas que vão do retângulo aos valores remotos e pelos valores atípicos.
Exemplo. Considere um conjunto de dados com os seguintes percentis:
0% 25% 50% 75% 100%
1 BUSSAB, Wilton de O.; MORETTIN, Pedro Alberto. Estatística Básica. São Paulo: Ed. Saraiva, 2010. 2 MONTGOMERY, Douglas C.; RUNGER, George C. Estatística Aplicada e Probabilidade para Engenheiros. Rio de Janeiro: LTC, 2008.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 10
1,7524 4,6901 5,7004 6,1768 7,3658
A próxima figura é um box plot do conjunto de dados que gerou a tabela de percentis acima. A cauda inferior é longa e isto indica que a distribuição é assimétrica. Note também a presença de outliers na parte inferior do box plot(são os pontos vermelhos).
1
2
3
4
5
6
7
Val
ores
A figura abaixo mostra o histograma associado ao box plot do exemplo.
1 2 3 4 5 6 7 80
10
20
30
40
50
60
70
80
90
_______________________________________________________
A próxima figura reforça a relação do box plot com o histograma. A distribuição da esquerda é simétrica, enquanto que a da direita é assimétrica.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 11
Os box plots da figura abaixo mostram a comparação dos tamanhos das pétalas em duas amostras das espécies de flor-de-lis versicolor e virginica3.
versicolor virginica
3
3.5
4
4.5
5
5.5
6
6.5
7
Val
ores
A existência de um outlier nos dados da espécie versicolor é indicada pelo ponto vermelho na parte inferior esquerda da figura.
3 Conjunto de dados de Fisher.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 12
2 Resumo
- Variância = Média dos Quadrados – Quadrado da Média = 2
ii x2x
n1
−⎟⎠
⎞⎜⎝
⎛ ∑
- Variância amostral: 2n
1i
2i
n
1i
2i
2x x
1nnx
1n1)xx(
1n1s ⎟
⎠⎞
⎜⎝⎛
−−
−=−
−= ∑∑
==
- Variância combinada dos conjuntos A e B: 222
2BA N
BANB
NA
s ⎟⎟⎠
⎞⎜⎜⎝
⎛ +−+= ∑∑∑∑
+
- Desvio Padrão = Raiz Quadrada positiva da Variância.
- Coeficiente de variação: xs)x(cv x= .
- Desvio interquartílico: isQ QQd −=
- Um diagrama de caixa ou box-plot é um retângulo que representa o desvio interquartílico. Esse retângulo indica, portanto, a faixa dos 50% dos valores mais típicos da distribuição. O retângulo é dividido no valor correspondente à mediana; assim, ele indica o quartil inferior, a mediana e o quartil superior.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 13
3 Exercícios de Fixação
Classificação mínimo 1º quartil mediana média 3º quartil máximo variância
A 20 25 27,5 30 32,5 50 49
B 18 23 32 33 42 52 100
A ou B x y z 31 w u v
(Papiloscopista PF/2004/Cespe-UnB) De acordo com um levantamento estatístico, a média das idades de um grupo de presidiários é igual a 31 anos de idade. Nesse levantamento, os presidiários foram classificados como A ou B, dependendo da sua condição psicossocial. Constatou-se que a média das idades dos presidiários classificados como A é menor que a média das idades dos presidiários classificados como B. A tabela acima apresenta algumas medidas estatísticas obtidas por meio desse levantamento.
A partir das informações acima, julgue os itens que se seguem.
1. O valor de v está entre 65 e 75.
2. valores de x e u são, respectivamente, iguais a 19 e 51 anos de idade.
3. (ICMS-RJ/2009/FGV) Para comparar as rendas de dois grupos de pessoas, A e B, foram preparados diagramas de caixas (box-plots) com os valores observados dos salários, representados na figura a seguir:
A respeito desses diagramas, considere as seguintes afirmativas:
I. O salário médio dos dois grupos é o mesmo.
II. A distribuição dos salários no grupo A é assimétrica à direita.
III. Há mais pessoas no grupo A do que no grupo B.
Assinale:
A) se somente a afirmativa I for verdadeira.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 14
B) se somente a afirmativa II for verdadeira.
C) se somente a afirmativa III for verdadeira.
D) se somente as afirmativas I e II forem verdadeiras.
E) se somente as afirmativas II e III forem verdadeiras.
4. (ICMS-RJ/2008/FGV) Uma companhia utiliza um sistema de avaliação de desempenho de seus funcionários por meio de dois indicadores de performance: Qualidade das tarefas e a Tempestividade com que as tarefas são realizadas.
Os funcionários receberam, na última avaliação, as medidas indicadas na tabela a seguir:
Medidas
Indicador
Qualidade Tempestividade
Média 50 25
Desvio-Padrão 10,0 6,0
Coeficiente de
Variação (%) 20 24
Com base na tabela, é correto afirmar que:
A) a média aritmética não é uma boa medida para representar a performancedos funcionários em face do elevado nível de dispersão das avaliações.
B) as avaliações da Qualidade foram mais dispersas do que as avaliações da Tempestividade.
C) as avaliações da Qualidade foram mais homogêneas do que as da Tempestividade.
D)os funcionários demoram mais para realizar as tarefas, mas a qualidade das tarefas, mas a qualidade das tarefas é melhor.
E) nada se pode afirmar sem o conhecimento do tamanho da amostra.
5. (ICMS-RJ/2007/FGV) Considere as informações contidas no Box Plotabaixo, referente aos salários dos engenheiros de uma empresa, por sexo.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 15
É correto afirmar que:
A) o salário médio dos homens é igual ao das mulheres.
B) a distribuição dos salários das mulheres é assimétrica negativa.
C) o desvio interquartílico dos salários das mulheres é maior do que o dos homens.
D) a distribuição dos salários dos homens é atípica.
E) o salário mediano das mulheres é superior ao dos homens.
6. (AFRF/2001/ESAF) Numa amostra de tamanho 20 de uma população de contas a receber, representadas genericamente por X, foram determinadas a média amostral M = 100 e o desvio-padrão s = 13 da variável transformada (X � 200)/5. Assinale a opção que dá o coeficiente de variação amostral de X:
A) 3,0%
B) 9,3%
C) 17,0%
D) 17,3%
E) 10,0%
(AFRF/2002/ESAF) Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 16
existem observações coincidentes com os extremos das classes. As questões de 7 a 10 referem-se a esses ensaios.
Classes P (%)70-90 5 90-110 15 110-130 40 130-150 70 150-170 85 170-190 95 190-210 100
7. Assinale a opção que dá o valor médio amostral de X.
A) 140,10
B) 115,50
C) 120,00
D) 140,00
E) 138,00
8. Assinale a opção que corresponde à estimativa do quinto decil da distribuição de X.
A) 138,00
B) 140,00
C) 136,67
D) 139,01
E) 140,66
9. Assinale a opção que corresponde à estimativa da freqüência relativa de observações de X menores ou iguais a 145.
A) 62,5%
B) 70,0%
C) 50,0%
D) 45,0%
E) 53,4%
10. Considere a transformação Z=(X-140)/10. Para o atributo Z encontrou-se
∑=
=7
1i
2ii 680.1fZ , onde fi é a freqüência simples da classe i e Zi o ponto médio de
classe transformado. Assinale a opção que dá a variância amostral do atributo X.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 17
A) 720,00
B) 840,20
C) 900,10
D) 1200,15
E) 560,30
11. (Analista do BACEN/2006/FCC) A média aritmética dos valores das vendas diárias realizadas pelas 50 empresas do Setor A é de R$ 1.000,00, com desvio padrão de R$ 100,00. Sabe-se ainda que a média aritmética dos valores das vendas diárias realizadas pelas 200 empresas do Setor B é de R$ 2.000,00, com desvio padrão de R$ 200,00. A variância em (R$)2 dos valores das vendas diárias realizadas pelos dois setores reunidos é
A) 34.000,00
B) 50.000,00
C) 194.000,00
D) 207.500,00
E) 288.000,00
12. (ICMS-RJ/2010/FGV) A média, a mediana e a variância das idades de um grupo de vinte pessoas são, hoje, iguais, respectivamente, a 34, 35 e 24. Daqui a dez anos, os valores da média, da mediana e da variância das idades dessas pessoas serão, respectivamente:
A) 44, 35 e 34
B) 44, 45 e 12
C) 44, 45 e 24
D) 34, 35 e 12
E) 44, 45 e 124
(Analista de Estatística/Perito/MPU/2010/CESPE) Considere que um perito tenha efetuado um estudo acerca do tempo gasto — X —, em meses, por empresas notificadas para quitar suas pendências com a Previdência Social. Uma amostra de 35 empresas notificadas com pendências foi selecionada de um banco de dados da Previdência. A partir dessa amostra, o perito fez uma análise exploratória da variável X, cujos resultados são apresentados a seguir.
Estatísticas Descritivas:
tempo mínimo = 2 meses tempo máximo = 128 meses
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 18
∑=
=35
1ii ;1027x ∑
=
=35
1i
2i ;66317x 11,30135x
351
235
1ii =⎟⎠
⎞⎜⎝
⎛∑=
Nesse estudo, o perito efetuou avaliações acerca do número de irregularidades – Y – que geraram pendências em função do porte das empresas: com menos de 20 empregados e com 20 ou mais empregados. Os resultados foram os seguintes.
tamanho da empresa y s n < 20 empregados 6,8 1,7 15 ≥ 20 empregados 2,6 1,3 20
Com base nessas informações julgue os itens de 13 a 18.
13. O diagrama de caixas, conhecido como boxplot, indica que a distribuição de X é assimétrica. Portanto, o número de observações acima do segundo quartil (Q2) foi proporcionalmente superior ao número de observações abaixo de Q2.
14. O tempo mediano da variável X foi aproximadamente igual a 29,34 meses.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 19
15. No diagrama de caixas, quatro observações foram identificadas como valores atípicos por estarem fora do intervalo [0; 77,25].
16. O diagrama apresentado a seguir é o resumo dos 5 números para a distribuição de X.
17 6 34,5 2 128
17. Nessa situação, a variabilidade do número de irregularidades nas empresas com menos de 20 empregados corresponde à metade da variabilidade do número de irregularidades nas empresas com 20 ou mais empregados.
18. O desvio padrão amostral de X foi inferior a 31 meses.
(Analista Judiciário/TST/2007/Cespe-UnB/Adaptada) Considere que, em um ambiente de trabalho industrial, as seguintes medições acerca da poluição do ar tenham sido observadas: 1, 6, 4, 3, 2, 3, 1, 5, 1, 4. Nessas situação, julgue os itens que se seguem.
19. A mediana da amostra é igual a 2,5.
20. As médias harmônica e geométrica são ambas inferiores a 3.
21. O terceiro quartil é igual a 3.
22. A variância amostral é superior a 2,8.
Variável X Frequência relativa
0 0,10
1 0,20
2 0,30
3 0,40
(SEAD-CPC/2007/Cespe-UnB/Adaptada) Considerando a tabela acima, que apresenta as freqüências relativas de uma variável X, relativa a uma contagem, julgue os itens a seguir.
23. A média de X é inferior a 1,5.
24. O desvio-padrão de X é inferior a 1,5.
25. A moda e a mediana de X são iguais a 3.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 20
26. O coeficiente de variação de X é superior a 1.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 21
4 Gabarito
1 – C 2 – E 3 – B 4 – C 5 – C 6 – B 7 – E 8 – C 9 – A 10 – B 11 – C 12 – C 13 – E 14 – E 15 – C 16 – C 17 – C 18 – E 19 – E 20 – C 21 – E 22 – C 23 – E 24 – C 25 – E 26 – E
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 22
5 Resolução dos Exercícios de Fixação
Classificação mínimo 1º quartil mediana média 3º quartil máximo variância
A 20 25 27,5 30 32,5 50 49
B 18 23 32 33 42 52 100
A ou B x y z 31 w u v
(Papiloscopista PF/2004/Cespe-UnB) De acordo com um levantamento estatístico, a média das idades de um grupo de presidiários é igual a 31 anos de idade. Nesse levantamento, os presidiários foram classificados como A ou B, dependendo da sua condição psicossocial. Constatou-se que a média das idades dos presidiários classificados como A é menor que a média das idades dos presidiários classificados como B. A tabela acima apresenta algumas medidas estatísticas obtidas por meio desse levantamento.
A partir das informações acima, julgue os itens que se seguem.
1. O valor de v está entre 65 e 75.
Resolução
Dados: 30A = , 33B = e 31X = (média das médias)
BA
BA
nnBnAnX
++
= ⇒ BA
BA
nn33n30n31
++
= ⇒ BA n2n =
A variância combinada v é dada por
2
BABA
2
BA
22
BA nnBA
nnB
nnA
Sv ⎥⎦
⎤⎢⎣
⎡
++
−+
++
== ∑∑∑∑+
30A = ⇒ 30n
A
A
=∑ ⇒ BA n60n30A ==∑
33B = ⇒ 33n
B
B
=∑ ⇒ Bn33B =∑
49S2A = ⇒ 49A
nA 2
A
2
=−∑ ⇒ 9493049n
A 2
A
2
=+=∑ ⇒ BA2 n1898n949A ==∑
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 23
100S2B = ⇒ 100B
nB 2
B
2
=−∑ ⇒ 118933100n
B 2
B
2
=+=∑ ⇒ B2 n1189B =∑
6896110293133,39667,632n3
n33n60n3
n1189n3
n1898Sv 22
B
BB
B
B
B
B2BA =−=−+=⎥
⎦
⎤⎢⎣
⎡ +−+== +
Então é correto afirmar que 65 < v = 68 < 75.
GABARITO: C
2. valores de x e u são, respectivamente, iguais a 19 e 51 anos de idade.
Resolução
O levantamento estatístico não deixa dúvida de que o valor mínimo de A ou B é x = 18 e o valor máximo de A ou B é u = 52. Item errado.
GABARITO: E
3. (ICMS-RJ/2009/FGV) Para comparar as rendas de dois grupos de pessoas, A e B, foram preparados diagramas de caixas (box-plots) com os valores observados dos salários, representados na figura a seguir:
A respeito desses diagramas, considere as seguintes afirmativas:
IV. O salário médio dos dois grupos é o mesmo.
V. A distribuição dos salários no grupo A é assimétrica à direita.
VI. Há mais pessoas no grupo A do que no grupo B.
Assinale:
A) se somente a afirmativa I for verdadeira.
B) se somente a afirmativa II for verdadeira.
C) se somente a afirmativa III for verdadeira.
D) se somente as afirmativas I e II forem verdadeiras.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 24
E) se somente as afirmativas II e III forem verdadeiras.
Resolução
ANÁLISE DAS AFIRMATIVAS
I- Os diagramas de caixas indicam que as medianas dois grupos A e B são iguais e não as suas respectivas médias ⇒ FALSA.
II- A distribuição dos salários no grupo A é assimétrica à direita porque a distância entre o terceiro quartil (Q3) e a mediana (md), ou seja, Q3 � md, é maior do que a distância entre a mediana e o primeiro quartil, dada por md � Q1. ⇒ VERDADEIRA.
III- O número de pessoas nos dois grupos é igual, haja vista que as distâncias entre os extremos superior e inferior nas distribuições dois dois grupos é aproximadamente 2.500 (3.100 � 600 = 2.500 para o grupo A e 2.900 � 400). ⇒ FALSA.
GABARITO: B
4. (ICMS-RJ/2008/FGV) Uma companhia utiliza um sistema de avaliação de desempenho de seus funcionários por meio de dois indicadores de performance: Qualidade das tarefas e a Tempestividade com que as tarefas são realizadas.
Os funcionários receberam, na última avaliação, as medidas indicadas na tabela a seguir:
Medidas
Indicador
Qualidade Tempestividade
Média 50 25
Desvio-Padrão 10,0 6,0
Coeficiente de
Variação (%) 20 24
Com base na tabela, é correto afirmar que:
A) a média aritmética não é uma boa medida para representar a performancedos funcionários em face do elevado nível de dispersão das avaliações.
B) as avaliações da Qualidade foram mais dispersas do que as avaliações da Tempestividade.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 25
C) as avaliações da Qualidade foram mais homogêneas do que as da Tempestividade.
D)os funcionários demoram mais para realizar as tarefas, mas a qualidade das tarefas, mas a qualidade das tarefas é melhor.
E) nada se pode afirmar sem o conhecimento do tamanho da amostra.
Resolução
Análise das afirmativas:
A) A média aritmética é uma medida de posição de uma distribuição de frequências. Logo, é uma medida válida (“boa”) para caracterizar o desempenho dos funcionários. Além disso, não se pode afirmar que a média não seja uma medida “boa” devido ao elevado nível de dispersão da distribuição. Posição e dispersão são características distintas de uma distribuição de frequências ⇒ ERRADA.
B) As medidas de coeficiente de variação ( x/s)x(cv x= ) dizem que é o contrário, ou seja, as avaliações da Tempestividade foram mais dispersas do que as avaliações da Qualidade, pois )qualidade(cv2024)dadetempestivi(cv =>= ⇒ ERRADA.
C) As avaliações da Qualidade foram mais homogêneas, ou seja, menos dispersas, do que as da Tempestividade, haja vista que
)dadetempestivi(cv2420)qualidade(cv =<= ⇒ CERTA.
D) Qualidade e Tempestividade são variáveis distintas; logo, essa comparação não faz sentido (não podemos comparar “banana” com “laranja”). A qualidade das tarefas é melhor em relação a quê? Os funcionários demoram mais para realizar as tarefas em relação a qual métrica de comparação? ⇒ ERRADA.
E) Está implícito que a companhia avaliou todos os seus funcionários. Logo, as medidas referem-se à população dos funcionários. As medidas tabeladas não são estimativas de parâmetros da população, mas sim os verdadeiros valores de média, desvio-padrão e coeficiente de variação das variáveis Qualidade e Tempestividade ⇒ ERRADA.
GABARITO: C
5. (ICMS-RJ/2007/FGV) Considere as informações contidas no Box Plotabaixo, referente aos salários dos engenheiros de uma empresa, por sexo.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 26
É correto afirmar que:
A) o salário médio dos homens é igual ao das mulheres.
B) a distribuição dos salários das mulheres é assimétrica negativa.
C) o desvio interquartílico dos salários das mulheres é maior do que o dos homens.
D) a distribuição dos salários dos homens é atípica.
E) o salário mediano das mulheres é superior ao dos homens.
Resolução
Análise das afirmativas:
A) Os diagramas de caixa indicam que as medianas dos salários, e não os salários médios, são iguais, com um valor aproximado de R$ 3.700 ⇒ERRADA.
B) A distribuição dos salários das mulheres é assimétrica positiva, pois é alongada à direita (a distância entre o quartil superior e a mediana é maior do que distância entre o quartil inferior e a mediana) ⇒ ERRADA.
C) O desvio interquartílico dos salários das mulheres é aproximadamente igual a 4.400 � 3.400 = 1.000. O desvio interquartílico dos salários dos homens é aproximadamente igual a 3.900 � 3.300 = 600. Logo a afirmativa está CERTA.
D) O enunciado não fornece dados para se fazer este tipo de conclusão. Qual seria a distribuição dos salários dos homens típica? ⇒ ERRADA.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 27
E) O salário mediano das mulheres é igual ao dos homens ⇒ ERRADA.
GABARITO: C
6. (AFRF/2001/ESAF) Numa amostra de tamanho 20 de uma população de contas a receber, representadas genericamente por X, foram determinadas a média amostral M = 100 e o desvio-padrão s = 13 da variável transformada (X � 200)/5. Assinale a opção que dá o coeficiente de variação amostral de X:
A) 3,0%
B) 9,3%
C) 17,0%
D) 17,3%
E) 10,0%
Resolução
Y = (X – 200)/5 => X = 5Y + 200
M = Y = 100 Logo, X = 5 Y + 200 = 5 x 100 + 200 = 700
s = sy = 13
Logo, sx = 5sy = 5 x 13 = 65
CVx = sx/ X = 65/700 = 0,093 = 9,3%
GABARITO: B
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 28
(AFRF/2002/ESAF) Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. As questões de 7 a 10 referem-se a esses ensaios.
Classes P (%)70-90 5 90-110 15 110-130 40 130-150 70 150-170 85 170-190 95 190-210 100
7. Assinale a opção que dá o valor médio amostral de X.
A) 140,10
B) 115,50
C) 120,00
D) 140,00
E) 138,00
Resolução
Se k valores distintos observados k21 x,...,x,x ocorrerem com as freqüências relativas k21 p,...,p,p , respectivamente, a média será
∑=
=k
1jjjpxx
em que pj denota a j-ésima frequência relativa.
Quando os dados são apresentados em uma distribuição de freqüências, todos os valores incluídos num certo intervalo de classe são considerados coincidentes com o ponto médio do intervalo. As fórmula acima será válida para esses dados agrupados quando se interpretar jx como o ponto médio e jp
como a frequência relativa
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 29
Classe (limites reais)
Pj pi xi xjpj
70 � 90 0,05 0,05 (90+70)/2=80 4 90 � 110 0,15 0,15�0,05=0,10 (110+90)/2=100 10 110 � 130 0,40 0,40�0,15=0,25 (130+110)/2=120 30 130 � 150 0,70 0,70�0,40=0,30 (150+130)/2=140 42 150 � 170 0,85 0,85�0,70=0,15 (170+150)/2=160 24 170 � 190 0,95 0,95�0,85=0,10 (190+170)/2=180 18 190 � 210 1,00 1,00�0,95=0,05 (210+190)/2=200 10
Soma 1,00 138
Logo, 138pxxk
1jjj == ∑
=
, conforme a tabela acima.
GABARITO: E
8. Assinale a opção que corresponde à estimativa do quinto decil da distribuição de X.
A) 138,00
B) 140,00
C) 136,67
D) 139,01
E) 140,66
Resolução
A mediana é o quinto decil. A mediana (md) de uma distribuição em classes de freqüências é dada pela expressão
mdmd
ai h
fF)2/n(
Lmd ×−
+= ,
em que iL é o limite inferior da classe que contém a mediana, n é o número de elementos do conjunto de dados, aF é a soma das frequências das classes anteriores à que contém a mediana, mdf é a frequência da classe que contém a mediana e mdh é a amplitude da classe que contém a mediana.
Considere a Tabela das freqüências (fj) e freqüências acumuladas (Fj) abaixo:
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 30
Classe (limites reais)
pj fj Fj
70 � 90 0,05 200 x 0,05 =10 10 90 � 110 0,10 200 x 0,10 =20 10 + 20 = 30 110 � 130 0,25 200 x 0,25 =50 30 + 50 = 80 130 � 150 0,30 200 x 0,30 =60 80 + 60 = 140 150 � 170 0,15 200 x 0,15 =30 140 + 30 = 170 170 � 190 0,10 200 x 0,10 =20 170 + 20 = 190 190 � 210 0,05 200 x 0,05 =10 190 + 20 = 200
Soma 1,00 200 = n
Temos que: 200n = , 130Li = , 80Fa = , 60fmd = e 20h md =
Então, 67,1362060
80)2/200(130md ≈×−
+= .
GABARITO: C
9. Assinale a opção que corresponde à estimativa da freqüência relativa de observações de X menores ou iguais a 145.
A) 62,5%
B) 70,0%
C) 50,0%
D) 45,0%
E) 53,4%
Resolução
Classes fi 70-90 10 90-110 20 110-130 50 130-150 60 Fazendo a interpolação:
(150 – 130) = 20 = 60 (145 – 130) = 15 = x x = (15 x 60)/20 = 45
Número de elemento abaixo de 145 = 10 + 20 + 50 + 45 = 125 Total de elementos = 200
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 31
Freqüência Relativa = 125/200 = 0,625 = 62,5%
GABARITO: A
10. Considere a transformação Z=(X-140)/10. Para o atributo Z encontrou-se
∑=
=7
1i
2ii 680.1fZ , onde fi é a freqüência simples da classe i e Zi o ponto médio de
classe transformado. Assinale a opção que dá a variância amostral do atributo X.
A) 720,00
B) 840,20
C) 900,10
D) 1200,15
E) 560,30
Resolução
10/)140x(z −= ⇒ 140z10x += ⇒ 2z
2z
22x s100s10s == ⇒ o valor da variância
AMOSTRAL de X será determinado a partir do cálculo da variância AMOSTRAL de Z.
Aprendemos que se os valores distintos k21 z,...,z,z ocorrem com as frequências
k21 f,...,f,f (∑=
=k
1i
f i n ), respectivamente, a variância de Z é dada por
2k
1i
2ii
k
1i
2ii
2z zzf
n1)zz(f
n1s −=−= ∑∑
==
ou
variância = média dos quadrados – quadrado da média.
A fórmula acima considera que os dados referem-se a uma população finita.
Contudo, a questão diz que as observações coletadas pertencem a uma amostra da população. Neste caso, o fator n (= Σfi) que aparece no denominador do lado direito da fórmula da variância deve ser substituído por (n–1). A justificativa para o uso do fator (n–1) será apresentada nas aulas sobre inferência estatística (aguarde!). Mas a diferença entre as duas definições torna-se desprezível para grandes valores de n.
CÁLCULO DA VARIÂNCIA AMOSTRAL DE X
.20,010/)140138(10/)140x(z −=−=−=
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 32
⎥⎦
⎤⎢⎣
⎡+−
−=+−
−=−
−= ∑ ∑∑∑∑
= ====
k
1i
k
1ii
2k
1iii
2ii
k
1i
2i
2ii
k
1i
2ii
2z fzzfz2zf
1n1)zzz2z(f
1n1)zz(f
1n1s
1nzn
1n
zfznzn2zf
1n1s
2
k
1i
2iik
1i
222ii
2z −
−−
=⎥⎦
⎤⎢⎣
⎡+−
−=
∑∑ =
=
2k
1i
2ii
2z z
1nnzf
1n1s ⎟
⎠⎞
⎜⎝⎛
−−
−= ∑
=
⇒ note que o fator )1n/(1 − multiplica a soma dos quadrados e o fator )1n/(n − multiplica o quadrado da média.
Seja a Tabela abaixo:
Classes if ix 10/)140( −= ii xz ii fz ii fz 2
70-90 10 80 -6 -60 360 90-110 20 100 -4 -80 320 110-130 50 120 -2 -100 200 130-150 60 140 0 0 0 150-170 30 160 2 60 120 170-190 20 180 4 80 320 190-210 10 200 6 60 360
Total 200 -40 1.680
402,8199
)2,0(2001991680
1nznzf
1n1s
22k
1i
2ii
2z =
−×−=
−−
−= ∑
=
,
2,840402,8100s100s 2z
2x =×== (opção B)
Uma pergunta: acertaríamos a questão se tivéssemos utilizado a fórmula 2
k
1i
2ii
2z zzf
n1s −= ∑
=
? Vamos tirar essa dúvida?
36,804,040,8)2,0(200
1680zzfn1s 22
k
1i
2ii
2z =−=−−=−= ∑
=
836360,8100s100s 2z
2x =×== ⇒ opção com o valor mais próximo é a “B” (840,20).
Conclusão: você também acertaria a questão. A princípio, você poderá fazer o cálculo aproximado da variância na prova quando o número de obervações for
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 33
muito grande. Neste exercício, 1199/200)1n/(n ≈=− , o que justifica a validade da aproximação adotada.
GABARITO: B
11. (Analista do BACEN/2006/FCC) A média aritmética dos valores das vendas diárias realizadas pelas 50 empresas do Setor A é de R$ 1.000,00, com desvio padrão de R$ 100,00. Sabe-se ainda que a média aritmética dos valores das vendas diárias realizadas pelas 200 empresas do Setor B é de R$ 2.000,00, com desvio padrão de R$ 200,00. A variância em (R$)2 dos valores das vendas diárias realizadas pelos dois setores reunidos é
A) 34.000,00
B) 50.000,00
C) 194.000,00
D) 207.500,00
E) 288.000,00
Resolução
A banca pediu para o candidato calcular a “variância em (R$)2 dos valores das vendas diárias realizadas pelos dois setores reunidos”, ou seja, a variância da população conjunta
}b,...,b,b,a,...,a,a{BABA N21N21=+ .
Variância da população conjunta A+B:
2
BABA
2
BA
22
BA NNBA
NNB
NNA
s ⎥⎦
⎤⎢⎣
⎡
++
−+
++
= ∑ ∑∑∑+ .
Fazendo N = NA + NB, obtemos
2222
BA NBA
NB
NA
s ⎟⎟⎠
⎞⎜⎜⎝
⎛ +−+= ∑∑∑∑
+ .
em que N = NA + NB = 50 + 200 = 250. A variância 2BAs + será calculada uma
vez conhecidos os valores dos somatórios ∑ 2A , ∑ 2B , ∑A e ∑ B . Os
somatórios ∑A e ∑B serão calculados em função das médias aritméticas A
e B , respectivamente. Os somatórios ∑ 2A , ∑ 2B serão determinados em
função de ( 2As , A ) e ( 2
Bs , B ), respectivamente.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 34
A fim de facilitar as contas, cortaremos três zeros dos dados fornecidos: 1000.1/000.1A == [mil], 1,0000.1/100sA == [mil], 2000.1/000.2B == [mil] e 2,0000.1/200sB == [mil].
∑= A501A ⇒ 5050150AA =×=×=∑
∑= B2001B ⇒ 400200BB =×=∑
222A AA
501s −= ∑ ⇒ 5,50]101,0[50]11,0[50)As(50A 2222
A2 =+×=+×=+×=∑
222B BB
2001s −= ∑ ⇒ 808]404,0[200]22,0[200)Bs(200B 2222
B2 =+×=+×=+×=∑
⎟ =⎟⎠
⎞⎜⎜⎝
⎛ +−+= ∑∑∑∑+
2
222BA N
BAB
N1A
N1s
1940,024,34340,38,12320,32020,0250
40050250808
2505,50 2
2
=−=−+=⎟⎠⎞
⎜⎝⎛ +
−+=
Para dar a resposta final, devemos multiplicar a variância (= quadrado do desvio-padrão) obtida acima por (1.000)2, haja vista que as médias e desvios padrão foram divididas por 1.000:
000.1941019410100,194)10(100,194000.11940,0s 36323322BA =×=××=××=×= −−
+
GABARITO: C
12. (ICMS-RJ/2010/FGV) A média, a mediana e a variância das idades de um grupo de vinte pessoas são, hoje, iguais, respectivamente, a 34, 35 e 24. Daqui a dez anos, os valores da média, da mediana e da variância das idades dessas pessoas serão, respectivamente:
A) 44, 35 e 34
B) 44, 45 e 12
C) 44, 45 e 24
D) 34, 35 e 12
E) 44, 45 e 124
Resolução
Está implícito que todas as pessoas do grupo estarão vivas daqui a dez anos. A dispersão da distribuição de frequências (das idades) não mudará com o envelhecimento das pessoas do grupo (ou seja, a forma da distribuição se
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 35
mantém ao longo do tempo). Logo, a variância daqui a dez anos ainda será igual a 24. A única opção com este valor é a C.
Daqui a dez anos, a média e a mediana serão acrescidas de 10 unidades (anos), haja vista que a distribuição de frequências sofrerá um deslocamento para a direita de 10 unidades. Assim, a média e a mediana serão iguais a 44 e 45, respectivamente.
GABARITO: C
(Analista de Estatística/Perito/MPU/2010/CESPE) Considere que um perito tenha efetuado um estudo acerca do tempo gasto — X —, em meses, por empresas notificadas para quitar suas pendências com a Previdência Social. Uma amostra de 35 empresas notificadas com pendências foi selecionada de um banco de dados da Previdência. A partir dessa amostra, o perito fez uma análise exploratória da variável X, cujos resultados são apresentados a seguir.
Estatísticas Descritivas:
tempo mínimo = 2 meses tempo máximo = 128 meses
∑=
=35
1ii ;1027x ∑
=
=35
1i
2i ;66317x 11,30135x
351
235
1ii =⎟⎠
⎞⎜⎝
⎛∑=
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 36
Nesse estudo, o perito efetuou avaliações acerca do número de irregularidades – Y – que geraram pendências em função do porte das empresas: com menos de 20 empregados e com 20 ou mais empregados. Os resultados foram os seguintes.
tamanho da empresa y s n < 20 empregados 6,8 1,7 15 ≥ 20 empregados 2,6 1,3 20
Com base nessas informações julgue os itens de 13 a 18.
13. O diagrama de caixas, conhecido como boxplot, indica que a distribuição de X é assimétrica. Portanto, o número de observações acima do segundo quartil (Q2) foi proporcionalmente superior ao número de observações abaixo de Q2.
Resolução
É correto afirmar que o boxplot indica que a distribuição de X é assimétrica, pois a distribuição tem cauda levemente alongada para a direita (note que a distância entre o quartil superior e a mediana é maior que a distância entre o quartil inferior e a mediana). Mas é incorreto dizer que o número de observações acima do segundo quartil (mediana) foi proporcionalmente superior ao número de observações abaixo da mediana, haja vista que a mediana divide o conjunto ordenado de dados em dois subconjuntos com igual número de elementos. Portanto, o item está errado.
GABARITO: E
14. O tempo mediano da variável X foi aproximadamente igual a 29,34 meses.
Resolução
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 37
Rol: {2 3 4 4 6 6 6 6 6 6 7 10 11 12 12 14 15 17 17 20 20 23 25 25 27 34 35 49 57 62 68 88 92 110 128}
O rol acima possui 35 amostras em ordem crescente. A mediana é o valor que ocupa a 18ª posição, a saber, o valor 17. Uma rápida inspeção do box plotconfirma que o valor da mediana é inferior a 20. Item errado.
GABARITO: E
15. No diagrama de caixas, quatro observações foram identificadas como valores atípicos por estarem fora do intervalo [0; 77,25].
Resolução
Uma rápida inspeção do box plot sugere que os valores 88, 92, 110 e 128 (vide diagrama de ramo e folhas) são outliers. Item Certo. Resolvo mais detalhadamente a seguir.
Rol: {2 3 4 4 6 6 6 6 6 6 7 10 11 12 12 14 15 17 17 20 20 23 25 25 27 34 3549 57 62 68 88 92 110 128}
Q1 (primeiro quartil) = 6 (ocupa a 9ª posição do rol)
Q3 (terceiro quartil) = 35 (ocupa a 27ª posição do rol)
Logo, o desvio interquartílico (IQR) é dado por
IQR = Q3 – Q1 = 35 – 6 = 29
E o Limite Superior (LS) do diagrama será
LS = Q3 + (1,5 x IQR) = 35 + 1,5 x 29 = 35 + 43,5 = 78,5
Contudo, a banca trabalhou com LS = 77,25, valor diferente do calculado acima. Qual é a provável causa dessa discrepância?
Vamos supor a banca tenha adotado Q3= (34 + 35)/2 = 34,5.
Neste caso, IQR = Q3 – Q1 = 34,5 - 6 = 28,5 ⇒ 28,5 x 1,5 = 42,75 ⇒ LS = 42,75 + 34,5 = 77,25.
Foi daí que saiu o valor 77,25 citado no item. Mas isso não quer dizer que eu concorde com o raciocínio da banca. A questão não foi anulada.
GABARITO: C
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 38
16. O diagrama apresentado a seguir é o resumo dos 5 números para a distribuição de X.
17 6 34,5 2 128
Resolução
O diagrama com o resumo dos 5 números tem a seguinte interpretação:
17 (mediana) 6 (quartil inferior) 34,5 (quartil superior)
2 (mínimo amostral) 128 (máximo amostral)
Os diagramas de caixas e de ramo e folhas confirmam que os dados relacionados acima estão corretos.
GABARITO: C
17. Nessa situação, a variabilidade do número de irregularidades nas empresas com menos de 20 empregados corresponde à metade da variabilidade do número de irregularidades nas empresas com 20 ou mais empregados.
Resolução
Considere que o número de irregularidades nas empresas com menos de 20 empregados seja representado pela variável A e o número de irregularidades nas empresas com 20 ou mais empregados pela variável B. A comparação entre as variabilidades (dispersões) das distribuições de A e B deve ser feita em termos relativos. Para tal, deve-se usar o coeficiente de variação (cv), que é definido como a razão entre o desvio padrão e a média. Esta medida de dispersão caracteriza o espalhamento dos valores da distribuição em termos relativos ao seu valor médio (*).
cv(A) = sA/médiaA = 1,7/6,8 = 1/4 = 0,25
cv(B) = sB/médiaB = 1,3/2,6 = 1/2 = 0,50
⇒ cv(A) = cv(B)/2 (item correto!)
(*) Não faz sentido comparar objetos diferentes (por exemplo, banana com laranja), utilizando uma medida absoluta como o desvio padrão. É por isso que é necessário trabalhar com um adimensional como o coeficiente de variação.
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 39
GABARITO: C
18. O desvio padrão amostral de X foi inferior a 31 meses.
Resolução
Variância = Média dos Quadrados – Quadrado da Média
Como o valor de n=35 é “grande”, usarei a fórmula aproximada
∑ ∑ ⎟⎠⎞
⎜⎝⎛−=
222 x
n1x
n1s
QUADRADO DA MÉDIA:
( ) ( ) 11,135.30351x
n1
n1x
n1x
n1 22
2
2
×=⎥⎦⎤
⎢⎣⎡×==⎟
⎠⎞
⎜⎝⎛ ∑∑∑
MÉDIA DOS QUADRADOS:
317.66351x
n1 2 ×=∑
77,033.135
09,181.3635
11,135.3035317.66s2 ==−= ⇒ 15,3277,033.1s ≈=
O desvio padrão é superior a 31 meses.
GABARITO: E
(Analista Judiciário/TST/2007/Cespe-UnB/Adaptada) Considere que, em um ambiente de trabalho industrial, as seguintes medições acerca da poluição do ar tenham sido observadas: 1, 6, 4, 3, 2, 3, 1, 5, 1, 4. Nessas situação, julgue os itens que se seguem.
19. A mediana da amostra é igual a 2,5.
Resolução
Rol: 1, 1, 1, 2, 3, 3, 4, 4, 5, 6 (N = 10 medições)
N = 10 é par. Então
mediana = média aritmética entre as 5a e 6a medições do rol
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 40
mediana = (3+3)/2 = 3
GABARITO: E
20. As médias harmônica e geométrica são ambas inferiores a 3.
Resolução
Fórmulas:
Média geométrica: n/1n
1ii
nn21g xx...x.xx ⎟⎟
⎠
⎞⎜⎜⎝
⎛== ∏
=
Média harmônica:
∑=
=+++
= n
1i in21
h
x1
n
x1...
x1
x1
nx
Média geométrica:
( ) 1010/110/1nn21g 864086406544332111x...x.xx ==×××××××××==
E agora, como fazer a conta acima? Como você poderia efetuar a raiz décima de 8640 em uma situação real de prova?
Eu faria uma conta aproximada, como números inteiros. Quer ver? Quanto dá 310?
310 = 33 x 33 x 33 x 3 = 27 x 27 x 27 x 3 = 19683 x 3 > 8640
Logo,
38640x 10g <=
Média harmônica:
32151300
30613
10
61
51
41
41
31
31
21
11
11
11
10
x1...
x1
x1
nx
n21
h <≈=+
=+++++++++
=+++
=
GABARITO: C
21. O terceiro quartil é igual a 3.
Resolução
Rol: 1, 1, 1, 2, 3, 3, 4, 4, 5, 6 (N = 10 medições)
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 41
O terceiro quartil é a mediana da sub-série 3, 4, 4, 5, 6 ⇒ Q3 = 4
GABARITO: E
22. A variância amostral é superior a 2,8.
Resolução
Variância Amostral = 2
i
2i x
1nnx
1n1
−−⎟
⎠
⎞⎛⎜⎝ − ∑
Média dos quadrados corrigida pelo fator n–1:
1183625161699436544332111x 2222222222
i
2i =+++++++=+++++++++=∑
1,139
118x1n
1i
2i ≈=
− ∑
Observe que o cálculo da média dos quadrados usa o fator n-1 no denominador da média, em vez de n, quando se trata da variância de uma amostra.
Quadrado da média corrigido pelo fator n/(n-1):
31030
106544332111x ==
+++++++++= ⇒ 9x2 = ⇒ 109
910x
1nn 2 =×=⎟
⎠⎞
⎜⎝⎛
−
Variância amostral= 13,1 – 10 = 3,1 > 2,8 ⇒ item certo.
Nota: calculemos a variância da população:
118xi
2i =∑ ⇒ 8,11
10118x
n1
i
2i ==∑
Média dos quadrados = 11,8
Quadrado da média = 9
Variância = média dos quadrados – quadrado da média = 11,8 – 9 = 2,8 ⇒você julgaria que o item é errado pela conta aproximada. Neste caso, o erro de aproximação é (3,1 – 2,8) = 0,3, correspondente a aproximadamente 10% do valor da variância amostral (significativo!). O erro percentual da conta aproximada é grande porque o número de amostras (n=10) é “pequeno”.
GABARITO: C
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 42
Variável X Frequência relativa
0 0,10
1 0,20
2 0,30
3 0,40
(SEAD-CPC/2007/Cespe-UnB/Adaptada) Considerando a tabela acima, que apresenta as freqüências relativas de uma variável X, relativa a uma contagem, julgue os itens a seguir.
23. A média de X é inferior a 1,5.
Resolução
∑= iipXX , em que pi denota a frequência relativa de Xi.
0,22,16,02,00)40,03()30,02()20,01()10,00(X =+++=×+×+×+×= ⇒ inferior a 1,5. Item certo.
∑ −
GABARITO: E
24. O desvio-padrão de X é inferior a 1,5.
Resolução
= 22ii
2x XpXS = média dos quadrados – quadrado da média
[ ] 0,146,32,12,002)40,03()30,02()20,01()10,00(S 222222x =−+++=−×+×+×+×=
0,1S2xx ==σ ⇒ item certo.
GABARITO: C
25. A moda e a mediana de X são iguais a 3.
Resolução
Variável X Frequência relativa Frequência relativa acumulada
0 0,10 0,10
1 0,20 0,30
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio
Profs. Alexandre Lima www.pontodosconcursos.com.br 43
2 0,30 0,60
3 0,40 1,00
O valor de maior frequência é 3,0 ⇒ moda = 3.
A mediana é 2, haja vista que a frequência acumulada até X=1 é 30% e até X=2 é 60%.
Item errado.
GABARITO: E
26. O coeficiente de variação de X é superior a 1.
Resolução
5,021
XSCV x
x === ⇒ inferior a 1. Item errado.
GABARITO: E
Bom estudo e até a próxima aula!
Alexandre Lima.