EDITAL ANTERIOR | PRF 2013 | Matemática · - 2 - Neste caso, a nota corresponde à variável X...

12
- 1 - EDITAL ANTERIOR | PRF 2013 | Matemática Noções de estatística. MÉDIA ARITMÉTICA ( ) Sejam x1, x2, ..., xn, portanto n valores da variável X. A média aritmética simples, ou simplesmente média de X, representada por é definida por: ou simplesmente onde n é o número de elementos do conjunto. Exemplo: Determinar a média aritmética simples dos valores: 3, 7, 8, 10, 11. Observação: O símbolo (mi) é usado para denotar a média de uma população e ̅ (x barra) para denotar a média de uma amostra. Quando os dados estiverem agrupados numa distribuição de frequência usaremos a média aritmética dos valores x1, x2, x3, ..., xn, ponderados pelas respectivas frequências absolutas: f1, f2, f3, ..., fn. Assim, = = = ou simplesmente = Exemplo: Determinar a média da distribuição:

Transcript of EDITAL ANTERIOR | PRF 2013 | Matemática · - 2 - Neste caso, a nota corresponde à variável X...

- 1 -

EDITAL ANTERIOR | PRF 2013 | Matemática Noções de estatística.

MÉDIA ARITMÉTICA (�̅�)

Sejam x1, x2, ..., xn, portanto n valores da variável X. A média aritmética simples, ou simplesmente média de X, representada por �̅� é definida por:

ou simplesmente

onde n é o número de elementos do conjunto.

Exemplo:

Determinar a média aritmética simples dos valores: 3, 7, 8, 10, 11.

Observação: O símbolo 𝜇 (mi) é usado para denotar a média de uma população e �̅� (x barra) para

denotar a média de uma amostra.

Quando os dados estiverem agrupados numa distribuição de frequência usaremos a média aritmética

dos valores x1, x2, x3, ..., xn, ponderados pelas respectivas frequências absolutas: f1, f2, f3, ..., fn. Assim,

�̅� =∑ 𝒙𝒊 ∙ 𝒇𝒊

𝒏𝒊=𝟏

∑ 𝒇𝒊𝒏𝒊=𝟏

ou simplesmente

�̅� =∑ 𝒙𝒊 ∙ 𝒇𝒊

∑ 𝒇𝒊

Exemplo: Determinar a média da distribuição:

- 2 -

Neste caso, a nota corresponde à variável X pesquisada. Na primeira coluna estão os valores xi da

variável e, na segunda coluna, suas respectivas frequências fi. Assim, temos a seguinte tabela:

xi fi xi . fi

0 2 0

1 10 10

2 20 40

3 47 141

4 46 184

Total 125 375

Daí:

�̅� =∑ 𝑥𝑖 ∙ 𝑓𝑖

∑ 𝑓𝑖=

375

125⇒ �̅� = 3

Caso os dados estejam agrupados em intervalos, utilizamos a mesma técnica dos dados agrupados sem

intervalos, tomando o ponto médio de cada classe como seu respectivo valor da variável xi. As fórmulas são as mesmas.

Exemplo:

Determinar a média da distribuição:

A partir dos dados, temos a seguinte tabela:

classes Renda Familiar

xi (ponto médio)

fi Nº de Familias

xi . fi

2 ⊢ 4 3 5 15

4 ⊢ 6 5 10 50

6 ⊢ 8 7 14 98

8 ⊢ 10 9 8 72

10 ⊢ 12 11 3 33

Total 40 268

Daí:

�̅� =∑ 𝑥𝑖 ∙ 𝑓𝑖

∑ 𝑓𝑖=

268

40⇒ �̅� = 6,7

�̅� = 6,7

- 3 -

MEDIANA (Me) A mediana é outra medida de posição definida como o número que se encontra no centro de uma série

de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no

conjunto que o separa em dois subconjuntos de mesmo número de elementos.

A mediana de um conjunto de dados ordenados é o termo do conjunto que o divide em duas partes

iguais, isto é, divide o conjunto em dois subconjuntos com o mesmo número de elementos tais que a cada um deles pertencem todos os elementos menores ou todos os elementos maiores que a mediana.

A mediana é geralmente simbolizada por Me ou por Md.

1º Caso: número de dados ímpar

A mediana será o valor da variável que ocupa a posição 𝑛+1

2.

2º Caso: número de dados par

A mediana será a média entre os valores das variáveis que ocupam a posição 𝑛

2 e

𝑛+2

2.

Por exemplo, consideremos os pesos ao nascer, em kg, de 9 cordeiros, dados abaixo:

2,1 2,8 2,9 3,0 3,1 3,2 3,2 3,5 4,0

Nesse caso, como n = 9 (ímpar), a mediana será o dado que ocupa a 5ª posição, pois 9+1

2= 5 .

Assim, Me = 3,1, ou seja, o peso mediano é 3,1 kg.

Suponhamos agora que fossem 10 cordeiros, com os seguintes pesos:

2,1 2,8 2,9 3,0 3,1 3,2 3,2 3,2 3,5 4,0

Nesse caso, como n = 10 (par), a mediana será a média entre o 5º e o 6º dados, pois 10

2= 5 e

10+2

2= 6

.

Assim:

𝑀𝑒 =3,1 + 3,2

2= 3,15

Assim, Me = 3,15, ou seja, o peso mediano é 3,15 kg.

Importante: Observe que os dados já estão em ordem crescente. Caso isso não aconteça, devemos

primeiro colocar os dados em ordem crescente, para depois determinar o valor da mediana.

Importante: Observe ainda que a Mediana não é influenciada por valores extremos (é uma medida robusta).

Quando os dados estiverem agrupados numa distribuição de frequência sem intervalos de classe, usaremos a mesma técnica que utilizamos no caso dos dados não agrupados, para determinar a posição

da mediana. Depois de determinada a posição da mediana, basta tomar como referência a primeira frequência acumulada que ultrapasse essa posição. O dado correspondente à essa frequência acumulada

será a mediana.

Exemplos:

- 4 -

a) Dada a distribuição:

Como n = 11, n é impar, logo a mediana (Me) será o elemento de posição:

𝑛 + 1

2=

11 + 1

2= 6º

Será, portanto, o 6º dado. Para identifica-lo, a partir da distribuição dada, construímos a coluna Fi das

frequências acumuladas, somando as frequências simples fi até cada linha (1; 1+3=4; 1+3+5=9 e 1+3+5+2=11). A primeira frequência acumulada que ultrapassar o número 6 corresponde à linha que

contém o 6º dado. Assim,

O valor do dado xi que se encontra nessa linha será o valor da mediana. No nosso exemplo, temos

Me = 3

Importante: Observe que a mediada é o xi correspondente à classe que contiver a ordem calculada.

b) Seja:

Como n = 42, n é par, logo a mediana (Me) será a média entre os elementos de posição:

𝑛

2=

42

2= 21º

e 𝑛 + 2

2=

42 + 2

2= 22º

Como no exemplo anterior, identificam-se os elementos de ordem 21 e 22 pela frequência acumulada:

Assim, o 21º corresponde a 87 e o 22º corresponde a 87. Então,

- 5 -

𝑀𝑒 =87 + 87

2= 87

Me = 87

ATENÇÃO: é preciso ter cuidado quando, numa quantidade par de dados, as posições 𝑛

2 e

𝑛+2

2 forem

correspondentes a duas linhas diferentes da tabela dada. Quando isso acontecer, os dados xi utilizados

para calcular a mediana serão diferentes. Isso vai acontecer quando a posição 𝑛

2 corresponder a um

valor exato da coluna das frequências acumuladas (Fi), e a posição 𝑛+2

2 corresponder a linha seguinte.

MODA (Mo) Denominamos moda o valor que ocorre com maior frequência em uma série de valores. Desse modo,

por exemplo, o salário modal dos empregados de uma indústria é o salário mais comum, isto é, o salário

recebido pelo maior número de empregados dessa indústria.

De acordo com o comportamento das observações, podemos ter: o Conjunto amodal: não existe moda, pois todos os valores do conjunto ocorrem com a mesma

frequência. Por exemplo, no conjunto 2, 2, 3, 3, 4, 4, 7, 7, 5 e 5, todos os elementos têm a mesma frequência

(2).

o Conjunto modal (ou unimodal): existe uma única moda.

Por exemplo, a moda do conjunto 3, 4, 4, 8, 4, 5, 4, 3, 5, 4, 9, 4, 3 e 6, é Mo = 4.

o Conjunto bimodal: existem duas modas. Por exemplo, o conjunto 3, 5, 5, 5, 5, 10, 10, 10, 10 e 15, é bimodal, pois possui duas modas,

Mo = 5 e Mo = 10. o Conjunto multimodal: existem mais de duas modas.

Por exemplo, o conjunto 2, 2, 2, 4, 4, 5, 5, 5, 6, 6, 8, 8, 8, 9 e 10, é multimodal, pois possui três modas,

Mo = 2, Mo = 5 e Mo = 8.

Por exemplo, vamos retomar o caso dos pesos ao nascer, em Kg, de 10 cordeiros, dados a seguir:

2,1 2,8 2,9 3,0 3,1 3,2 3,2 3,2 3,5 4,0

Observamos que Mo = 3,2, ou seja, a moda é o peso de 3,2 Kg. (unimodal)

Quando os dados estiverem agrupados numa distribuição de frequência sem intervalos de classe, a moda

será o dado (xi) que corresponde à maior frequência (fi).

Assim, por exemplo, para a distribuição

a moda será 245, pois corresponde à maior frequência, que é 17. Então,

Mo = 245

- 6 -

VARIÂNCIA (V) Dado um conjunto de dados, a variância é uma medida de dispersão que mostra o quão distante cada

valor desse conjunto está do valor central (média).

Quanto menor é a variância, mais próximos os valores estão da média; mas quanto maior ela é, mais

os valores estão distantes da média.

Considere que 𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏 são os n elementos de uma amostra e que �̅� é a média aritmética desses

elementos. O cálculo da variância amostral (V) é dado por:

𝑽 =∑ (𝒙𝒊 − �̅�)𝟐𝒏

𝒊=𝟏

𝒏 − 𝟏

Se quisermos calcular a variância populacional (V), consideraremos todos os elementos da população, e não apenas de uma amostra. Nesse caso, o cálculo possui uma pequena diferença. Observe:

𝑽 =∑ (𝒙𝒊 − �̅�)𝟐𝒏

𝒊=𝟏

𝒏

DESVIO PADRÃO (DP) O desvio padrão é capaz de identificar o “erro” em um conjunto de dados, caso quiséssemos substituir

um dos valores coletados pela média aritmética.

O desvio padrão aparece junto à média aritmética, informando o quão “confiável” é esse valor. Ele é

apresentado pelo intervalo: [�̅� − 𝑫𝑷; �̅� + 𝑫𝑷]

O cálculo do desvio padrão é feito a partir da raiz quadrada positiva da variância, ou seja:

𝑫𝑷 = √𝑽

Vamos agora aplicar o cálculo da variância e do desvio padrão em um exemplo: Considere que, em uma escola, a direção decidiu observar a quantidade de alunos que apresentam todas

as notas acima da média em todas as disciplinas. Para tanto, considerou a amostra de uma turma do 9º ano do Ensino Fundamental, ao longo de um ano. Os dados obtidos foram:

Quantidade de alunos acima da média

9º ano

1º Bimestre 2º Bimestre 3º Bimestre 4º Bimestre

8 13 9 4

Para facilitar os cálculos, vamos dispor os dados coletados em uma tabela, sempre com a seguinte estrutura:

nº de alunos (𝒙𝒊)

(𝒙𝒊 − �̅�) (𝒙𝒊 − �̅�)𝟐

8

13

9

4

34

- 7 -

Inicialmente, calculamos a média:

�̅� =∑ 𝑥𝑖

𝑛=

34

4= 8,5

Com o valor da média, calculamos a segunda coluna da tabela, fazendo “dado menos média” (observe que a soma dessa coluna (𝒙𝒊 − �̅�) será sempre igual a zero.

nº de alunos (𝒙𝒊)

(𝒙𝒊 − �̅�) (𝒙𝒊 − �̅�)𝟐

8 8 – 8,5 = –0,5

13 13 – 8,5 = 4,5

9 9 – 8,5 = 0,5

4 4 – 8,5 = –4,5

TOTAL 34 0

Agora, tomamos os resultados da coluna (𝒙𝒊 − �̅�) e elevamos cada um deles ao quadrado, preenchendo

a terceira coluna da tabela:

nº de alunos (𝒙𝒊)

(𝒙𝒊 − �̅�) (𝒙𝒊 − �̅�)𝟐

8 8 – 8,5 = –0,5 (−0,5)2 = 0,25

13 13 – 8,5 = 4,5 (4,5)2 = 20,25

9 9 – 8,5 = 0,5 (0,5)2 = 0,25

4 4 – 8,5 = –4,5 (−4,5)2 = 20,25

TOTAL 34 0 41

Com a tabela preenchida e os totais calculados, podemos calcular a variância, lembrando que, nesse caso, trata-se de uma amostra:

𝑽 =∑ (𝒙𝒊 − �̅�)𝟐𝒏

𝒊=𝟏

𝒏 − 𝟏

𝑉 =41

4 − 1

𝑉 =41

3

𝑉 = 13,67

Conhecida a variância, vamos calcular agora o desvio padrão:

𝑫𝑷 = √𝑽

𝐷𝑃 = √13,67

𝐷𝑃 = 3,7

- 8 -

EXERCÍCIOS 01. Ano: 2008 / Banca: CESPE / Órgão: TJ-DFT A tabela acima apresenta a distribuição de frequência absoluta das notas

dadas por 125 usuários de um serviço público, em uma avaliação da qualidade do atendimento. Considerando essas informações, julgue os

próximos itens.

A média, a moda e a mediana dos valores apresentados na tabela são superiores a 2,8 e inferiores a 3,3.

( ) Certo ( ) Errado

02. Ano: 2010 / Banca: CESGRANRIO / Órgão: IBGE

A tabela abaixo apresenta a distribuição de frequências das idades de um grupo de crianças. A média das idades dessas crianças, em anos, é

a) 5,0

b) 5,2 c) 5,4

d) 5,6 e) 5,8

03. Ano: 2010 / Banca: CESGRANRIO / Órgão: IBGE

(MESMO TEXTO DA QUESTÃO 02) A mediana da distribuição de frequências apresentada é

a) 5,5

b) 5,6 c) 5,7

d) 5,8 e) 5,9

04. Ano: 2016 Banca: ESAF Órgão: ANAC

Os valores a seguir representam uma amostra 3 3 1 5 4 6 2 4 8

Então, a variância dessa amostra é igual a

a) 4,0 b) 2,5.

c) 4,5. d) 5,5

e) 3,0

05. Ano: 2010 Banca: CESGRANRIO Órgão: BNDES Em uma pesquisa de preços de determinado produto, foram obtidos os

valores, em reais, de uma amostra aleatória colhida em 6 estabelecimentos

que o comercializam. A variância dessa amostra é a) 1,50

b) 1,75 c) 2,00

d) 2,25 e) 2,50

06. Ano: 2010 Banca: FGV Órgão: SEAD-AP

Os dados a seguir são as quantidades de empregados de cinco pequenas empresas: 6, 5, 8, 5, 6. A variância da quantidade de empregados dessas cinco empresas é igual a:

a) 0,8

b) 1,2 c) 1,6

d) 2,0 e) 2,4

- 9 -

07. Ano: 2010 Banca: CESGRANRIO Órgão: IBGE No último mês, Alípio fez apenas 8 ligações de seu telefone celular cujas durações, em minutos, estão

apresentadas no rol abaixo. 5 2 11 8 3 8 7 4

O valor aproximado do desvio padrão desse conjunto de tempos, em minutos, é a) 3,1

b) 2,8

c) 2,5 d) 2,2

e) 2,0

08. Ano: 2009 Banca: CESPE Órgão: CEHAP-PB O custo médio nacional para a construção de habitação com padrão de acabamento normal, segundo

levantamento realizado em novembro de 2008, foi de R$ 670,00 por metro quadrado, sendo R$ 400,00/m2 relativos às despesas com materiais de construção e R$ 270,00/m2 com mão-de-obra. Nessa

mesma pesquisa, os custos médios regionais apontaram para os seguintes valores por metro quadrado:

R$ 700,00 (Sudeste), R$ 660,00 (Sul), R$ 670,00 (Norte), R$ 640,00 (Centro-Oeste) e R$ 630,00 (Nordeste).

Sistema Nacional de Pesquisa de Custos e Índices da Construção Civil. SINAPI/IBGE, nov./2008 (com adaptações).

O desvio padrão dos custos médios regionais por metro quadrado foi a) inferior a R$ 30,00.

b) superior a R$ 30,01 e inferior a R$ 40,00. c) superior a R$ 40,01 e inferior a R$ 50,00.

d) superior a R$ 50,01.

RESPOSTAS

01) C 02) C 03) A 04) C 05) C 06) B 07) B 08) A

- 10 -

QUESTÕES DE PROVAS – PRF 01. CESPE - PRF/PRF/2008

Ficou pior para quem bebe

O governo ainda espera a consolidação dos dados do primeiro mês de aplicação da Lei Seca para avaliar seu impacto sobre a cassação de CNHs. As primeiras projeções indicam, porém, que as apreensões

subirão, no mínimo, 10%. Antes da vigência da Lei Seca, eram suspensas ou cassadas, em média,

aproximadamente 155.000 CNHs por ano. Se as previsões estiverem corretas, a média anual deve subir para próximo de 170.000. A tabela a seguir mostra esses resultados nos últimos anos (fonte:

DENATRAN).

Veja, ed. 2.072, 6/8/2008, p. 51 (com adaptações).

Para que a média de CNHs suspensas ou cassadas, de 2003 a 2008, atinja o valor previsto de 170.000,

será necessário que, em 2008, a quantidade de CNHs suspensas ou cassadas seja um número a) inferior a 180.000.

b) superior a 180.000 e inferior a 200.000.

c) superior a 200.000 e inferior a 220.000. d) superior a 220.000 e inferior a 240.000.

e) superior a 240.000.

02. CESPE - PRF/PRF/2003 O gráfico acima ilustra o número de acidentes de trânsito

nos estados do Acre, Mato Grosso do Sul, Amazonas, Espírito Santo e Minas Gerais, no ano de 2001. Com base

nessas informações, julgue o item seguinte.

A média aritmética de acidentes de trânsito nos cinco

estados citados é superior a 7.000. ( ) Certo ( ) Errado

03. CESPE - AA (PRF)/PRF/2012 A tabela acima mostra a distribuição da quantidade Q de pessoas transportadas,

incluindo o condutor,

por veículo de passeio circulando em determinado município, obtida como resultado de uma pesquisa feita nesse município para se avaliar o sistema de transporte local.

Nessa tabela, P representa a porcentagem dos veículos de passeio circulando no município que transportam Q pessoas, para Q = 1, ..., 5. Com base nessas

informações, julgue o seguinte item. Em média, cada veículo de passeio que circula no referido município transporta duas pessoas. Portanto,

se, em determinado momento, houver 10 mil veículos circulando nesse município, a quantidade esperada de pessoas que estão sendo transportadas por todos esses veículos, incluindo-se os condutores, será

igual a 20 mil.

( ) Certo ( ) Errado

Q P

(%)

1 50

2 20

3 15

4 10

5 5

- 11 -

04. CESPE - PRF/PRF/2003 O gráfico acima ilustra o número de acidentes de trânsito

nos estados do Acre, Mato Grosso do Sul, Amazonas, Espírito Santo e Minas Gerais, no ano de 2001. Com base

nessas informações, julgue o item seguinte. Se, no ano de 2004, com relação ao ano de 2001, o

número de acidentes de trânsito no Acre crescesse 10%,

o do Mato Grosso do Sul diminuísse 20%, o do Amazonas aumentasse 15% e os demais permanecessem

inalterados, então a média aritmética da série numérica formada pelo número de acidentes de trânsito em cada

estado, em 2004, seria maior que a mediana dessa mesma série.

( )Certo ( ) Errado

05. CESPE - PRF/PRF/2013

Considerando os dados apresentados no gráfico, julgue o item seguinte.

A média do número de acidentes ocorridos no período de

2007 a 2010 é inferior à mediana da sequência de dados apresentada no gráfico.

( ) Certo ( ) Errado

06. CESPE - AA (PRF)/PRF/2012 A tabela acima mostra a distribuição da quantidade Q de pessoas transportadas,

incluindo o condutor, por veículo de passeio circulando em determinado município, obtida como resultado de uma pesquisa feita nesse município para se avaliar o

sistema de transporte local. Nessa tabela, P representa a porcentagem dos veículos de passeio circulando no município que transportam Q pessoas, para Q = 1, ..., 5.

Com base nessas informações, julgue o seguinte item. Como a moda da distribuição descrita representa a maior frequência observada, seu

valor é igual a 50%.

( ) Certo ( ) Errado

07. CESPE - PRF/PRF/2003 O gráfico acima ilustra o número de acidentes de trânsito

nos estados do Acre, Mato Grosso do Sul, Amazonas, Espírito Santo e Minas Gerais, no ano de 2001. Com base

nessas informações, julgue o item seguinte. Se, no ano de 2004, com relação ao ano de 2001, o número

de acidentes de trânsito no Acre passasse para 2.500, o

número de acidentes de trânsito no Espírito Santo fosse reduzido para 10.000, o de Minas Gerais fosse reduzido para

13.000 e os demais permanecessem inalterados, então o desvio-padrão da série numérica formada pelo número de

acidentes de trânsito em cada estado em 2004 seria superior ao desvio-padrão da série numérica formada pelo número de acidentes de trânsito em cada estado em 2001.

( ) Certo ( ) Errado

Q P

(%)

1 50

2 20

3 15

4 10

5 5

- 12 -

08. CESPE - AA (PRF)/PRF/2012 A tabela acima apresenta as estatísticas produzidas em um

levantamento acerca do número diário de acidentes que envolvem motocicletas em determinado local. Com base

nessas informações, julgue o próximo item. A variância da distribuição do número diário de acidentes

com motocicletas no referido local é inferior a 100.

( ) Certo ( ) Errado

09. CESPE - PRF/PRF/2003 O gráfico acima ilustra o número de acidentes de trânsito

nos estados do Acre, Mato Grosso do Sul, Amazonas, Espírito Santo e Minas Gerais, no ano de 2001. Com base

nessas informações, julgue o item seguinte.

Se, no ano de 2004, com relação ao ano de 2001, o número de acidentes de trânsito em cada um dos estados

considerados aumentasse de 150, então o desvio-padrão da série numérica formada pelo número de acidentes de

trânsito em cada estado em 2004 seria superior ao desvio-padrão da série numérica formada pelo número de

acidentes de trânsito em cada estado em 2001. ( ) Certo ( ) Errado

RESPOSTAS

01) D 02) C 03) C 04) C 05) E 06) E 07) E 08) E 09) E

ESTATÍSTICA VALOR

(acidentes por

dia)

Média 10

Mediana 8

Desvio padrão 12

Primeiro quartil 5

Terceiro quartil 15