ESTATÍSTICA - csfx.org.br

16
ESTATÍSTICA Estatística é o ramo da matemática que permite, de forma organizada, recolher dados sobre uma população, analisá-los e tirar conclusões. O uso da pesquisa é bastante comum nas várias atividades humanas. 1. POPULAÇÃO E AMOSTRA 1.1 POPULAÇÃO ou universo estatístico é o conjunto de entes portadores de, pelo menos, uma característica em comum. É a totalidade de pessoas, animais, plantas ou objetos, da qual se podem recolher dados. É um grupo de interesse que se deseja descrever ou acerca do qual se deseja tirar conclusões. 1.2 AMOSTRA é um subconjunto da população, que nos permite tirar conclusões da população sem ter a necessidade de entrevistar a todos. Para melhor entender a diferença entre população e amostra, pense na seguinte situação: Ao preparar uma sopa, Guilherme prova uma colherada para avaliar o teor de sal. Para experimentar o tempero, ele não precisa tomar toda a sopa da panela, pois sabe que o teor de sal da colherada (uma amostra da sopa) será o mesmo teor de sal de toda a sopa (população).

Transcript of ESTATÍSTICA - csfx.org.br

Page 1: ESTATÍSTICA - csfx.org.br

ESTATÍSTICA

Estatística é o ramo da matemática que permite, de forma organizada, recolherdados sobre uma população, analisá-los e tirar conclusões. O uso da pesquisa ébastante comum nas várias atividades humanas.

1. POPULAÇÃO E AMOSTRA

1.1 POPULAÇÃO ou universo estatístico é o conjunto de entes portadores de, pelomenos, uma característica em comum. É a totalidade de pessoas, animais, plantasou objetos, da qual se podem recolher dados. É um grupo de interesse que sedeseja descrever ou acerca do qual se deseja tirar conclusões.

1.2 AMOSTRA é um subconjunto da população, que nos permite tirar conclusões dapopulação sem ter a necessidade de entrevistar a todos.

Para melhor entender a diferença entre população e amostra, pense na seguintesituação:

Ao preparar uma sopa, Guilherme prova uma colherada para avaliar o teor de sal.Para experimentar o tempero, ele não precisa tomar toda a sopa da panela, poissabe que o teor de sal da colherada (uma amostra da sopa) será o mesmo teor desal de toda a sopa (população).

Page 2: ESTATÍSTICA - csfx.org.br

Atividade

Uma concessionária de automóveis tem cadastrados 3 500 clientes e fez uma

pesquisa sobre a preferência de compra em relação a “cor” (branco, vermelho ou

azul), “preço”, “número de portas” (duas ou quatro) e “estado de conservação” (novo

ou usado). Foram consultados 210 clientes. Diante dessas informações, responda:

a) Qual é o universo estatístico e qual é a amostra dessa pesquisa?

2. FREQUÊNCIAS

2.1. FREQUÊNCIA ABSOLUTA (FA): o número de vezes que um valor da variável écitado representa a frequência absoluta daquele valor.

2.2. FREQUÊNCIA RELATIVA (FR): que registra a frequência absoluta em relaçãoao total de citações. É calculada fazendo a razão entre a frequência absoluta e afrequência total.

2.3. FREQUÊNCIA TOTAL (FT): é a soma das frequências absolutas.

EXEMPLO

Para uma pré-avaliação do desempenho dos candidatos em um exame vestibular,foi selecionada uma amostra de 80 provas.

Depois de corrigidas essas provas, as notas foram organizadas em uma tabela,mostrada a seguir:

Page 3: ESTATÍSTICA - csfx.org.br

Atividade

A tabela a seguir é resultante de uma pesquisa. Copiem e completem a tabela nocaderno.

3. GRÁFICOS

Os dados da tabela anterior também podem ser descritos por gráficos de diferentestipos. Os gráficos constituem um importante instrumento de análise e interpretaçãode um conjunto de dados. Diariamente é possível encontrar representações gráficasnos mais variados veículos de comunicação (jornais, revistas, televisão, Internet),associadas a assuntos diversos do nosso dia-a-dia, como resultados de pesquisasde opinião, saúde e desenvolvimento humano, economia, esportes, cidadania, etc.

3.1 GRÁFICO DE SETORES

De um modo geral, quando uma variável assume k valores distintos, dividimos umcírculo em k setores circulares cujas medidas dos ângulos são proporcionais às

frequências correspondentes a cada um dessesvalores.

Para determinar o ângulo central de cada setorcircular ou o percentual de cada categoria, basta

Page 4: ESTATÍSTICA - csfx.org.br

montar e calcular uma regra de três simples, fazendo a seguinte relação:

100% – 360° – Frequência Total

3.2 GRÁFICO DE COLUNAS/BARRAS

São representados por retângulos de base comum e altura proporcional à magnitudedos dados.

3.2.1 GRÁFICO DE COLUNAS

3.2.2 GRÁFICO DE BARRAS

3.3 GRÁFICO DE LINHAS

O gráfico de linhas é muito usado quando se quer representar o comportamento deuma variável cujos valores diminuem ou aumentam no decorrer do tempo demaneira contínua. O gráfico abaixo mostra o percentual de vendas de dois produtosno decorrer de um ano:

Page 5: ESTATÍSTICA - csfx.org.br

Atividades

01. Em uma eleição para representante de classe, os candidatos foram Ricardo,

Paula e Fausto. Observe o resultado da votação no gráfico de barras, em que estão

especificados os votos das mulheres e dos homens, e, em seguida, responda:

a) Quantos alunos votaram?

Desses, quantas mulheres e quantos homens?

b) Quantos votos obteve a candidata Paula?

c) Quantas mulheres votaram em Ricardo?

d) Qual é a porcentagem de votos recebidos por Fausto?

02. Para mostrar quanto tempo gasta com suas atividades, Luísa construiu um gráfico de setores.

Page 6: ESTATÍSTICA - csfx.org.br

a) Quantas horas por dia Luísa estuda em casa?

b) Que porcentagem do dia ela usa para dormir?

4. HISTOGRAMA

Quando uma variável tem seus valores indicados por classes (intervalos), é comumo uso de um tipo de gráfico conhecido por histograma.Por exemplo, consideremos a altura (em centímetros) de um grupo de alunos,agrupada em intervalos, e a seguir os histogramas correspondentes às frequênciasabsolutas e relativas:

Atividade

Fazendo o levantamento dos salários dos vinte funcionários de um escritório, foramobtidos os seguintes valores em reais: 650, 800, 720, 620, 700, 750, 780, 680, 720,600, 846, 770, 630, 740, 680, 640, 710, 750, 680 e 690. A partir deles, construam nocaderno:

Page 7: ESTATÍSTICA - csfx.org.br

a) a tabela de frequências com 5 classes;b) o histograma correspondente relacionando faixa salarial e frequência absoluta

5. MEDIDAS DE TENDÊNCIA CENTRAL

As medidas de tendência central são assim chamadas por indicarem um ponto emtorno do qual se concentram os dados. Este ponto tende a ser o centro dadistribuição dos dados, ou o “centro de gravidade” dos dados.

Para resumir a quantidade de informação contida em um conjunto de dados, osestatísticos definem medidas que descrevem, através de um só número, ascaracterísticas dos mesmos. Algumas dessas medidas descrevem a tendênciacentral, isto é, a tendência que os dados têm de se agrupar em torno de certosvalores. Dentre as Medidas de Tendência Central, destacamos: Média, Mediana eModa.

5.1 MÉDIAS

Para um conjunto de dados numéricos, a Média é o número capaz de representartodo o conjunto em operações matemáticas e possibilitar a obtenção de resultadossatisfatórios. Estudaremos, em nossas aulas de Noções de Estatística o ENEM, aMédia Aritmética Simples e a Média Aritmética Ponderada.

a) MÉDIA ARITMÉTICA SIMPLES(�)

A média aritmética simples é a ideia que ocorre à maioria das pessoas quando sefala em “média”. E como ela possui certas propriedades matemáticas convenientes,é amais importante das três medidas de tendência central (de posição) queestudaremos.

A média aritmética simples (x) de um conjunto de dados X= �1, �2, �3, …, �� é asoma dos mesmos dividida pela respectiva quantidade.

Exemplo: Calcule a média dos dados: A = { 0; 2; 4; 6; 8 }.

Observação-1: É comum, no cálculo da média aritmética simples, depararmos com

casos em que os dados apresentam repetições (frequências diferentes de 1).

Exemplo: Seja o conjunto “X” de dados abaixo.

Page 8: ESTATÍSTICA - csfx.org.br

X = { 1;1;1;1;2;2;2;6} , determine a média aritmética dos seus elementos.

Resolução:

Percebe-se claramente que se trata de um cálculo envolvendo Média Aritmética

Simples, entretanto, otimizada com a utilização das frequências dos respectivos

dados, ou seja:

Maneira específica para o cálculo da Média Aritmética Simples envolvendo dados

agrupados (em frequências).

Observação-2:

A principal desvantagem da Média Aritmética é que ela é afetada por valores

extremamente grandes ou extremamente pequenos (em relação aos demais

elementos do conjunto). Por isso, a média nem sempre é a medida de localização

central mais significativa. Essa desvantagem pode tornar-se séria, se estivermos

lidando com pequenos conjuntos de números.

Exemplo: A Média Aritmética Simples dos elementos do conjunto X =

{ 1;1;2;2;2;3;3;50} .

b) MÉDIA ARITMÉTICA PONDERADA ( �)

Na Estatística surgem muitas situações em que se deseja levar em conta a

importância relativa de diferentes quantidades ao se calcular uma média.

Seja x1 ,x2 ,... xn um conjunto de números e p1, p2, ... pn um segundo conjunto de

números denominados pesos. Define-se a média ponderada como:

Page 9: ESTATÍSTICA - csfx.org.br

Exemplo: As notas, em Cálculo II, obtidas pelo aluno Raiworld Feyssibuki (RAI-

MUNDO, quando estudante do Curso de Arquitetura na UFES) encontram-se

apresentadas no quadro abaixo, no qual também são informados os pesos das

provas I e II:

A média final “MF” alcançada por Raiworld Feyssibucki foi:

Observação-3: A Média Aritmética Simples para dados agrupados (exemplo

apresentado na Observação-1 no índice “a” anterior) é um caso especial da Média

Aritmética Ponderada, em que todos os pesos são iguais a 1 (um).

Atividades

01. Um time de futebol realizou algumas partidas e os resultados foram 3 a 1, 4 a 2,

1 a 1, 0 a 0, 3 a 2, 2 a 1 e 1 a 0. Sabendo que o time não perdeu nenhuma partida,

calcule a média aritmética dos gols:

a) marcados;

b) sofridos.

02. Se um aluno já fez dois trabalhos e obteve notas 8,5 e 5,0, qual deve ser a nota

do terceiro trabalho para que a média aritmética dos três seja 7,0?

03. Qual é a média de idade de um grupo em que há 6 pessoas de 14 anos, 9 de 20

anos e 5 de 16 anos?

5.2 MODA e MEDIANA

a) MODA (Mo)

A moda é o valor que ocorre com maior frequência num conjunto de dados. Uma

distribuição de frequências pode ser AMODAL (não há moda), UNIMODAL ou

MODAL (uma única moda), BIMODAL (duas modas) ou MULTIMODAL (três ou

mais modas).

Page 10: ESTATÍSTICA - csfx.org.br

Exemplos:

De um ponto de vista puramente descritivo, a moda indica o valor “típico” em termos

de maior ocorrência. Além disso, se as frequências são razoavelmente uniformes, a

moda perde muito de sua importância como medida descritiva. Por outro lado, a

utilidade da moda se acentua quando um ou dois valores, ou um grupo de valores,

ocorre com muito mais frequência que os outros. Quando há perda de informação, a

moda se refere a uma “classe modal”, e não a um valor único. Ela mostra a

tendência central dos dados identificando a área em que os dados estão mais

concentrados.

Finalmente, a moda também pode ser usada para descrever dados qualitativos.

Como, nesse caso, a moda é a categoria que ocorre com maior frequência, ela

mostra a categoria que mais concentra dados.

A moda foi não cortar gastos, o que não significa que seja esse o comportamento da

população em geral.

b) MEDIANA (Md)

Outra medida de tendência central de um conjunto de números é a Mediana. Ela é o

valor que ocupa a posição central do conjunto dos dados ordenados (no ROL).

Da definição de mediana, segue-se que sua característica principal é dividir um

conjunto ordenado de dados em dois grupos iguais; a metade terá valores inferiores

à mediana, a outra metade terá valores superiores à mediana.

I. MEDIANA para uma quantidade ímpar de dados

Page 11: ESTATÍSTICA - csfx.org.br

Exemplo: ROL: 3 / 3 / 4 / 5 / 6 / 6 / 7 / 7 /8⟹Md = 6

Exemplo: (ENEM) Na tabela, são apresentados dados da cotação mensal do ovo

extra branco vendido no atacado, em Brasília, em reais, por caixa de 30 dúzias de

ovos, em alguns meses dos anos 2007 e 2008.

De acordo com esses dados, o valor da mediana das cotações mensais do ovo extra

branco nesse período era igual a:

a) R$ 73,10. b) R$ 81,50. c) R$ 82,00. d) R$ 83,00. e) R$ 85,30.

Resolução: Primeiramente temos que organizar o ROL

ROL: 73 / 81,6 / 82 / 83 / 84 / 84,6 / 85,3

Como a quantidade de dados é ímpar, Md = 83

II. MEDIANA para uma quantidade par de dados

Exemplo:

ROL: 3 / 4 / 5 / 6 / 6 / 7⟹ � =5+6

2⟹ Md = 5,5

Exemplo: (FGV–SP 2007) Quatro amigos calcularam a média e a mediana de suas

alturas, tendo encontrado como resultado 1,72 m e 1,70 m, respectivamente. A

média entre as alturas do mais alto e do mais baixo, em metros, é igual a:

a) 1,70. b) 1,71. c) 1,72. d) 1,73. e) 1,74.

Resolução: Considerando as alturas, em ordem crescente, por A, B, C e D, teremos:

Page 12: ESTATÍSTICA - csfx.org.br

III. MEDIANA para dados agrupados

Exemplo:

Uma equipe de futebol realizou um levantamento das

massas dos seus 40 atletas e chegou à distribuição de

frequências dada pela tabela a seguir:

Com base nesses dados, pode-se afirmar que o valor

da MEDIANA das massas é igual a:

a) 75 b) 72 c) 74 d) 73 e) 70

Resolução:

1º passo: encontrar a “Classe” que contenha o “Valor Central” da variável analisada

(Massa).

Como, neste exemplo, há 40 dados (total de atletas), precisamos verificar em qual

“intervalo de massas” encontra-se o “Valor Central” (MEDIANA), ou seja,

2º passo: encontrada a “Classe” que contenha o “Valor Central” (MEDIANA): 72

⊢76, com frequência 12, devemos proceder com os cálculos da seguinte forma:

Page 13: ESTATÍSTICA - csfx.org.br

Atividades

01. De segunda-feira a sábado, os gastos com alimentação de uma pessoa foram 15,

13, 12, 10, 14 e 14 reais. Determinem a média diária de gastos (MA) e a mediana

(Me).

02. Considerando os números 126, 130, 126 e 102, calculem:

a) a média aritmética (MA);

b) a média aritmética ponderada (MP), com pesos 2, 3, 1 e 2, respectivamente;

c) a mediana (Me);

d) a moda (Mo)

03. A média das idades dos 11 funcionários de uma empresa era de 40 anos. Um

dos funcionários se aposentou com 60 anos, saindo da empresa. A média

de idade dos 10 funcionários restantes passou a ser:

a) 40 anos.

b) 39,8 anos.

c) 38,9 anos.

d) 38 anos.

e) 37,8 anos

6. MEDIDAS DE DISPERSÃO

Já estudamos as medidas de tendência central mais usadas, como a médiaaritmética, a moda e a mediana. Elas têm como objetivo concentrar em um úniconúmero os diversos valores de uma variável quantitativa.Neste item estudaremos casos em que as medidas de tendência central sãoinsuficientes.

Page 14: ESTATÍSTICA - csfx.org.br

Considere a seguinte situação:Uma pessoa é encarregada de organizar atividades de lazer para um grupo de 6pessoas e recebe a informação de que a média de idade do grupo é 20 anos. Nessecaso, apenas a informação da média não é suficiente para planejar as atividades,pois podemos ter grupos com média de idade de 20 anos e característicastotalmente diferentes.

Variância (V)

A ideia básica de variância é tomar os desvios dos valores xi em relação à médiaaritmética (xi - MA). Mas a soma desses desvios é igual a 0 (por uma propriedade damédia). Uma opção é considerar o total dos quadrados dos desvios

�=1

� �� − �� 2∑

e expressar a variância (V) como a média dos quadrados dos desvios, ou seja:

Desvio padrão (DP)

O desvio padrão (DP) é a raiz quadrada da variância. Ele facilita a interpretação dosdados, pois é expresso na mesma unidade dos valores observados (do conjunto dedados).

Atividades

01. Um concurso utiliza como nota a média e o desvio padrão de 3 provas. Calcule amédia, a variância e o desvio padrão de um candidato que nas provas obteve,respectivamente, 63 pontos, 56 pontos e 64 pontos.

02. (Ibmec) Chama-se mediana de um conjunto de 50 dados ordenados em ordemcrescente o número x dado pela média aritmética entre o 25º e o 26º dados.Observe no gráfico a seguir uma representação para as notas de 50 alunos doprimeiro semestre de Ciências Econômicas numa determinada prova.

Page 15: ESTATÍSTICA - csfx.org.br

A mediana das notas dos 50 alunos de Ciências Econômicas nesta prova é igual a:

a) 3

b) 4

c) 5

d) 6

e) 7

03. (UFSM-RS) O Brasil é o quarto produtor mundial de alimentos, produzindo mais

do que o necessário para alimentar sua população. Entretanto, grande parte da

produção é desperdiçada.

O gráfico mostra o percentual do desperdício de frutas nas feiras do estado de São

Paulo.

Page 16: ESTATÍSTICA - csfx.org.br

Considerando os dados do gráfico, a média aritmética, a moda e a mediana são,

respectivamente:

a) 28,625; 25 e 40; 25,5

b) 28,625; 25 e 40; 26

c) 28,625; 40; 26

d) 20,5; 25 e 40; 25,5

e) 20,5; 40; 25,5

Bibliografia:

CURY, Marcus Vinicius Quintella, Estatística,1ª, Rio de Janeiro: FGV Management

– Cursos de Educação Continuada, 2007.

DOWNING, D. e JEFFREY, C., Estatística Aplicada, Rio de Janeiro, Saraiva, 1998.

TOREZANI, Walquiria, Estatística I, 2004. 59p. Notas de Aula. Apostila.