apostila_de_estatistica_-_versao_11 (1)
-
Upload
marcelo2010 -
Category
Documents
-
view
151 -
download
1
Transcript of apostila_de_estatistica_-_versao_11 (1)
1
UNIVERSIDADE SÃO FRANCISCO
DISCIPLINA
DE
PROBABILIDADE
E
ESTATÍSTICA
Adalberto Nobiato Crespo 2013 Versão 11
2
3
Sumário
1 - A Estatística .................................................................................................................................... 6
1.1 - Fases do Método Estatístico .................................................................................................... 6
1.2 - Definições Básicas da Estatística ............................................................................................. 7
2 - Amostragem .................................................................................................................................. 10
3 - Séries Estatísticas.......................................................................................................................... 14
4 - Gráficos Estatísticos ..................................................................................................................... 16
5 - Distribuição de Freqüência ........................................................................................................... 20
5.1 - Elementos de Uma Distribuição de Frequência ..................................................................... 21
5.2 - Método Prático para Construção de Distribuição de Freqüências ......................................... 22
5.3 - Representação Gráfica de uma Distribuição de Freqüência .................................................. 23
Primeira Lista de Exercícios .............................................................................................................. 26
6 - Medidas de Posição ...................................................................................................................... 28
6.1 - Média Aritmética ................................................................................................................... 28
6.2 - Média Geométrica ................................................................................................................. 31
6.3 - Média Quadrática ................................................................................................................... 33
6.4 - Moda ...................................................................................................................................... 34
6.5 - Mediana ................................................................................................................................. 36
6.6 – Separatrizes – Quartis, Decis e Percentis .............................................................................. 40
Segunda Lista de Exercícios .............................................................................................................. 43
7 – Medidas de Dispersão ou Variabilidade: ..................................................................................... 43
7.1 - Medidas de Dispersão Absoluta ............................................................................................ 46
7.1.1 - Amplitude Total .............................................................................................................. 46
7.1.2 - Desvio Médio Absoluto .................................................................................................. 47
7.1.3 - Desvio Padrão ................................................................................................................. 49
7.1.4 - Variância ......................................................................................................................... 51
7.2 - Medidas de Dispersão Relativa ............................................................................................. 52
Terceira Lista de Exercícios ............................................................................................................... 54
4
Teste de Avaliação do Conhecimento ................................................................................................ 56
8 - Probabilidade ................................................................................................................................ 59
8.1 - Experimento Aleatório - E ..................................................................................................... 59
8.2 - Espaço Amostral - S .............................................................................................................. 59
8.3 - Eventos .................................................................................................................................. 60
8.4 – Evento União: .................................................................................................................. 60
8.5 – Evento Intersecção: .......................................................................................................... 61
8.6 – Eventos Mutuamente Exclusivos .......................................................................................... 61
8.6 – Eventos Complementares ...................................................................................................... 61
8.7 - Conceito de Probabilidade ..................................................................................................... 62
8.7.1 - Propriedades ................................................................................................................... 63
8.7.2 - Teoremas Fundamentais ................................................................................................. 63
8.8 - Eventos Independentes .......................................................................................................... 64
8.9 - Probabilidade Condicional ..................................................................................................... 65
Quarta Lista de Exercícios ................................................................................................................. 68
9 - Distribuição de Probabilidades ..................................................................................................... 71
9.1 - Distribuição Binomial ............................................................................................................ 73
Quinta Lista de Exercícios ................................................................................................................. 76
9.2 - Distribuição de Poisson ......................................................................................................... 78
Sexta Lista de Exercícios ................................................................................................................... 81
9.3 - Distribuição Normal .............................................................................................................. 82
9.3.1 - Propriedades da Distribuição Normal ............................................................................. 82
9.3.2 - A Distribuição Normal Padronizada ............................................................................... 83
9.3.3 - Utilização da Tabela Z ................................................................................................... 84
Sétima Lista de Exercícios ................................................................................................................. 87
10 – Intervalos de Confiança ............................................................................................................. 89
10.1 – Intervalos de Confiança para a Média ................................................................................. 92
10.2 – Determinação do Tamanho de uma Amostra ...................................................................... 94
Oitava Lista de Exercícios ................................................................................................................. 96
11 - Resumo das Fórmulas.................................................................................................................98
5
6
PROBABILIDADE E ESTATÍSTICA
1 - A Estatística
É uma parte da matemática aplicada que fornece métodos para coleta, organização,
descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de
decisões.
A coleta, a organização, a descrição dos dados, o cálculo e a interpretação de
coeficientes pertencem à ESTATÍSTICA DESCRITIVA.
A análise e a interpretação dos dados, associado a uma margem de incerteza, ficam a
cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, também chamada como a
medida da incerteza ou métodos que se fundamentam na teoria da probabilidade.
1.1 - Fases do Método Estatístico
1º - DEFINIÇÃO DO PROBLEMA: Definir exatamente aquilo que se pretende
pesquisar é o mesmo que definir corretamente o
problema.
2º - PLANEJAMENTO: Como levantar informações? Que dados deverão ser obtidos?
Qual levantamento a ser utilizado? Censitário? Por
amostragem? E o cronograma de atividades? Os custos
envolvidos?, etc.
3º - COLETA DE DADOS: É a fase operacional, ou seja, é o registro sistemático de
dados com um objetivo determinado.
Dados primários: quando são publicados pela própria pessoa ou organização que coletou.
Ex: tabelas do censo demográfico do IBGE.
Dados secundários: quando são publicados por outra organização. Ex: quando
determinado jornal publica estatísticas referentes ao censo
demográfico extraídas do IBGE.
Definição
do
Problema
Planeja
mento
Coleta
dos
Dados
Apuração
dos
Dados
Análise e
Interpretação
dos Dados
Apresentação
dos
Dados
Tabelas
Gráficos
7
OBS: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz o
grande risco de erros de transcrição.
Coleta Direta: quando é obtida diretamente da fonte. Ex: Empresa que realiza uma
pesquisa para saber a preferência dos consumidores pela sua marca.
A coleta direta pode ser:
Contínua: registros de nascimento, óbitos, casamentos, etc.
Periódica: recenseamento demográfico, censo industrial; pesquisa mensal de empregos,
etc.
Ocasional: registro de casos de dengue.
Coleta Indireta: É feita por deduções a partir dos elementos conseguidos pela coleta
direta, por analogia, por avaliação, indícios ou proporcionalização.
Exemplo: Pesquisa sobre mortalidade infantil que é feita através de
dados colhidos por uma coleta direta.
4º - APURAÇÃO DOS DADOS: É o resumo dos dados através de sua contagem e
agrupamento. É a condensação e tabulação de dados.
5º - APRESENTAÇÃO DOS DADOS: Há duas formas de apresentação, que não se
excluem mutuamente.
Apresentação Tabular: é uma apresentação numérica dos dados em linhas e colunas
distribuídas de modo ordenado, segundo regras práticas fixadas
pelo Conselho Nacional de Estatística.
Apresentação Gráfica: constitui uma apresentação geométrica permitindo uma visão
rápida e clara do fenômeno.
6º - ANÁLISE E INTERPRETAÇÃO DOS DADOS: É a última fase do trabalho
estatístico é a mais importante e delicada. Está ligada essencialmente
ao cálculo de medidas e coeficientes, cuja finalidade principal é
descrever o fenômeno (estatística descritiva). Na estatística indutiva a
interpretação dos dados se fundamenta na teoria da probabilidade.
1.2 - Definições Básicas da Estatística
FENÔMENO ESTATÍSTICO: é qualquer evento que se pretenda analisar cujo estudo
seja possível da aplicação do método estatístico. São
divididos em três grupos:
8
Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos por uma
simples observação. A estatística dedica-se ao estudo
desses fenômenos. Ex: A natalidade na Grande São
Paulo, O preço médio da cerveja em Campinas, etc.
Fenômenos individuais: são aqueles que irão compor os fenômenos de massa. Ex: cada
nascimento na Grande São Paulo, cada preço de cerveja em
Campinas, etc.
DADO ESTATÍSTICO: é um dado numérico, considerado a matéria-prima sobre a qual
se aplicam os métodos estatísticos.
POPULAÇÃO: é o conjunto total de elementos portadores de pelo menos uma
característica comum.
AMOSTRA: é uma parcela representativa da população que é examinada com o
propósito de tirar conclusões sobre a população.
PARÂMETROS: É uma medida que descreve alguma característica da população.
Para se definir um parâmetro deve-se examinar toda a população.
Exemplo: Os alunos da USF têm em média 1,70 metros de estatura.
ESTATÍSTICA: É uma medida que descreve alguma característica da amostra.
Exemplo: Num grupo de 100 alunos da USF, a estatura média foi de
1,72 metros.
ESTIMATIVA: é um valor aproximado do parâmetro; é calculado com o uso da
amostra.
ATRIBUTO: quando os dados estatísticos apresentam um caráter qualitativo, o
levantamento e os estudos necessários ao tratamento desses dados são
designados genericamente de estatística de atributo.
Exemplo: Classificação dicotômica do atributo: A classificação dos alunos
da USF quanto ao sexo.
VARIÁVEL: É o conjunto de resultados possíveis de um fenômeno.
VARIÁVEL QUALITATIVA: Quando seus valores são expressos por atributos.
Exemplo: sexo, cor da pele, cor dos olhos, estado civil,
etc.
VARIÁVEL QUANTITATIVA: Quando seus valores são expressos em números.
Exemplo: salário, altura, peso, idade, etc.
9
As variáveis quantitativas podem ser: Discreta ou Contínuas.
VARIÁVEL DISCRETA: Seus valores são expressos geralmente através de números
inteiros não negativos. Resulta normalmente de contagens.
Exemplo: Nº de alunos presentes às aulas.
VARIÁVEL CONTÍNUA: podem assumir, teoricamente, qualquer valor entre dois
limites.
Exemplo: Quando você vai medir a temperatura de seu corpo
com um termômetro de mercúrio o que ocorre é o
seguinte: O filete de mercúrio, ao dilatar-se, passará
por todas as temperaturas intermediárias até chegar
à temperatura atual do seu corpo.
EXERCÍCIO - Classifique as variáveis em qualitativas ou quantitativas (contínuas ou
discretas):
Cor dos olhos das alunas... Resp:qualitativa
Índice de liquidez nas índústrias capixaba... Resp:quantitativa contínua
Produção de café no Brasil... Resp:quantitativa contínua
Número de defeitos em aparelhos de TV... Resp:quantitativa discreta
Comprimento dos pregos produzidos por uma empresa... Resp:quantitativa contínua
O ponto obtido em cada jogada de um dado... Resp:q
Tipo sanguíneo. Resp:
Área de um círculo. Resp:
Raça. Resp:
Número de livros numa biblioteca. Resp:a
Religião. Resp:
Comprimento de uma reta. Resp:
Estado civil. Resp:
Profissão. Resp:
Volume de água numa piscina. Resp:
10
2 - Amostragem
População ou Universo
População ou Universo: é o conjunto de todos os elementos que possuem pelo menos
uma característica em comum.
Exemplo:
- O conjunto de todas as pessoas que são alunos da USF.
- O conjunto de todas as pessoas portadoras de AIDES.
- O conjunto de todas as pessoas moradoras de uma cidade.
Amostra
Amostra: é um subconjunto da população utilizado para se fazer uma análise sobre toda
a população.
Esquematicamente tem-se:
Métodos Probabilísticos
Exige que cada elemento da população possua determinada probabilidade de ser
selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho
da população, a probabilidade de cada elemento ser selecionado numa pesquisa será 1/N.
trata-se do método que garante cientificamente a aplicação das técnicas estatísticas de
inferências. Somente com base em amostragens probabilísticas é que se podem realizar
inferências ou induções sobre a população a partir do conhecimento da amostra.
É uma técnica especial para recolher amostras, que garantem, tanto quanto possível, o
acaso na escolha.
Amostragem Aleatória Simples:
É o processo mais elementar e frequentemente utilizado. É equivalente a um sorteio
lotérico. Pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir,
por meio de um dispositivo aleatório qualquer, x números dessa seqüência, os quais
corresponderão aos elementos pertencentes à amostra.
População Amostra
11
Exemplo: Obter uma amostra de 10% representativa para a pesquisa da estatura de 90
alunos de uma escola:
1º - enumeram-se os alunos de 1 a 90.
2º - escrevem-se os números dos alunos, de 1 a 90, em pedaços iguais de
papel, coloca-se numa urna e após misturar retiram-se, um a um, nove
números que formarão a amostra.
Amostragem Proporcional Estratificada:
Quando a população se divide em estratos (subpopulações), convém que o sorteio dos
elementos da amostra leve em consideração tais estratos, daí obtém os elementos da
amostra proporcional ao número de elementos desses estratos.
Exemplo: Obter uma amostra proporcional estratificada de 10% do exemplo anterior,
supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São,
portanto, dois estratos (sexo masculino e sexo feminino).
Logo, tem-se:
Sexo População 10 % Amostra
Masculino 54 5,4 5
Feminino 36 3,6 4
Total 90 9,0 9
Enumeram-se então os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90,
meninas e procede-se ao sorteio casual.
Amostragem Sistemática:
Quando os elementos da população já se acham ordenados, não há necessidade de
construir o sistema de referência. São exemplos os prontuários médicos de um hospital,
os prédios de uma rua, etc. Nestes casos, a seleção dos elementos que constituirão a
amostra pode ser feita por um sistema imposto pelo pesquisador.
Procedimento:
Seja N o tamanho da população.
Seja n o tamanho da amostra.
a) Calcular o intervalo de amostragem através da razão: r = N/n. Se a razão r der um
número fracionário, pegue o número inteiro mais próximo.
b) Sortear (ou escolher) um número x qualquer entre 1 e r. O número x sorteado
chama-se passo da amostra.
c) Formar a amostra com os n elementos da seguinte maneira:
x; x+r; x+2r; x+3r; .... x+(n-1)r.
12
Exemplo: Supõem-se uma rua com 900 casas, das quais se deseja obter uma amostra
formada por 50 casas para uma pesquisa de opinião.
Solução:
População N= 900
Amostra n = 50
a) O intervalo de amostragem será r = 900/50 = 18.
b) Sortear (ou escolher) um número x qualquer entre 1 e 18. O número x
sorteado chama-se passo da amostra. Vamos escolher o número 4.
c) A amostra com os 50 elementos será:
4; 4+18; 4+2.18; 4+3.18; ... 4+(50-1).18
Ou seja: 4; 22; 40; 58; 76; ... 886 seriam os números das casas que
deveriam ser pesquisadas.
Amostragem por Conglomerados (ou Agrupamentos)
Algumas populações não permitem, ou tornam extremamente difícil que se identifiquem
seus elementos. Não obstante, isso pode ser relativamente fácil identificar alguns
subgrupos da população. Em tais casos, uma amostra aleatória simples desses subgrupos
(conglomerados) pode se colhida, e uma contagem completa deve ser feita para o
conglomerado sorteado. Agrupamentos típicos são quarteirões, famílias, organizações,
agências, edifícios etc.
Exemplo: Num levantamento da população de determinada cidade, pode-se dispor do
mapa indicando cada quarteirão e não dispor de uma relação atualizada dos
seus moradores. Pode-se, então, colher uma amostra dos quarteirões e fazer a
contagem completa de todos os que residem naqueles quarteirões sorteados.
Métodos não Probabilísitcos
São amostragens em que há uma escolha deliberada dos elementos da amostra. Não é
possível generalizar os resultados das pesquisas para a população, pois as amostras não-
probabilísticas não garantem a representatividade da população.
Amostragem Acidental
Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são
possíveis de se obter até completar o número de elementos da amostra. Geralmente
utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente
escolhidos.
Exemplos: Pesquisas de opinião em praças públicas, ruas movimentadas de grandes
cidades etc.
13
Amostragem Intencional
De acordo com determinado critério, é escolhido intencionalmente um grupo de
elementos que irão compor a amostra. O investigador se dirige intencionalmente a
grupos de elementos dos quais deseja saber a opinião.
Exemplo: Numa pesquisa sobre preferência por determinado cosmético, o pesquisador se
dirige a um grande salão de beleza e entrevista as pessoas que ali se
encontram.
Exercícios:
1 - Uma escola de 1º grau abriga 124 alunos. Obtenha uma amostra representativa
correspondente a 15% da população.
2 - Tenho 80 lâmpadas numeradas numa caixa. Como se obtém uma amostra de 12
lâmpadas?
3 - Uma população encontra-se dividida em três estratos, com tamanhos,
respectivamente, n1= 40, n2= 100 e n3= 60. Sabendo que, ao realizar uma
amostragem estratificada proporcional, 9 elementos da amostra foram retirados do
3º estrato, determine o número de elementos da amostra.
4 - Mostre como seria possível retirar uma amostra de 32 elementos de uma população
ordenada formada por 2.432 elementos. Na ordenação geral, qual dos elementos
abaixo seria escolhido para pertencer à amostra, sabendo-se que o elemento 1.420º a
ela pertence?
1.648º, 290º, 725º, 2.025º ou 1.120º
14
3 - Séries Estatísticas
TABELA: É um quadro que resume um conjunto de dados dispostos segundo linhas e
colunas de maneira sistemática.
Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto..
Série Estatística: É qualquer tabela que apresenta a distribuição de um conjunto de
dados estatísticos em função da época, do local ou da espécie.
Séries Homógrafas: são aquelas em que a variável descrita apresenta variação discreta.
Podem ser do tipo temporal, geográfica ou específica.
a) Série Temporal: Identifica-se pelo caráter variável do fator cronológico. O local
e a espécie (fenômeno) são elementos fixos. Esta série também
é chamada de histórica ou evolutiva.
ABC VEÍCLULOS LTDA.
Vendas no 1º bimestre de 1996
(em mil unidades)
Período Unidades vendidas
Janeiro 2 0
Fevereiro 1 0
Total 3 0
.b) Série Geográfica: Apresenta como elemento variável o fator geográfico. A
época e o fato (espécie) são elementos fixos. Também é
chamada de espacial, territorial ou de localização.
ABC VEÍCLULOS LTDA.
Vendas no 1º bimestre de 1996
(em mil unidades)
Filiais Unidades Vendidas
São Paulo 1 3
Rio de Janeiro 1 7
TOTAL 3 0
15
c) Série Específica: O caráter variável é apenas o fato ou espécie. Também é
chamada de série categórica.
ABC VEÍCLULOS LTDA.
Vendas no 1º bimestre de 1996
(em mil unidades)
Marca Unidades Vendidas
Fiat 1 8
Gm 1 2
Total 3 0
d) Séries Conjugadas: Também chamadas de tabelas de dupla entrada. São
apropriadas para a apresentação de duas ou mais séries de
maneira conjugada, havendo duas ordens de classificação: uma
horizontal e outra vertical. O exemplo seguinte é de uma série
geográfica-temporal.
ABC VEÍCLULOS LTDA.
Vendas no 1º bimestre de 1996
( em mil unidades)
Filiais Janeiro Fevereiro
São Paulo 1 0 3
Rio de Janeiro 1 2 5
TOTAL 2 2 8
16
4 - Gráficos Estatísticos
São representações visuais dos dados estatísticos que devem corresponder, mas nunca
substituir, as tabelas estatísticas.
Características:
Uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade.
Gráficos de Informação: São gráficos destinados principalmente ao público em
geral, objetivando proporcionar uma visualização
rápida e clara. São gráficos tipicamente expositivos,
dispensando comentários explicativos adicionais. As
legendas podem ser omitidas, desde que as
informações desejadas estejam presentes.
Gráficos de Análise: São gráficos que se prestam melhor ao trabalho estatístico,
fornecendo elementos úteis à fase de análise dos dados,
sem deixar de ser também informativos. Os gráficos de
análise frequentemente vêm acompanhados de uma
tabela estatística. Inclui-se, muitas vezes um texto
explicativo, chamando a atenção do leitor para os pontos
principais revelados pelo gráfico.
Classificação dos gráficos: Diagramas, Estereogramas, Pictogramas e Cartogramas.
.1 - Diagramas:
São gráficos geométricos dispostos em duas dimensões. São os mais usados na
representação de séries estatísticas.
Os diagramas podem ser:
1.1 - Gráficos em Barras Horizontais.
Número de Acidentes numa Rodovia
0 10 20 30 40 50 60 70 80 90 100
1° Trim
2° Trim
3° Trim
4° Trim
17
1.2 - Gráficos em Barras Verticais.
Número de Acidentes numa Rodovia
0
20
40
60
80
100
1° Trim 2° Trim 3° Trim 4° Trim
1.3 - Gráficos em Barras Compostas.
Número de Acidentes em Rodovias
0
20
40
60
80
100
1° Trim 2° Trim 3° Trim 4° Trim
Bandeirantes D. Pedro
1.4 - Gráficos em Linhas.
São frequentemente usados para representação de séries cronológicas com um grande
número de períodos de tempo. As linhas são mais eficientes do que as colunas, quando
existem intensas flutuações nas séries ou quando há necessidade de se representarem
várias séries em um mesmo gráfico.
18
Número de Acidentes em Rodovias
0
20
40
60
80
100
1° Trim 2° Trim 3° Trim 4° Trim
Bandeirantes D. Pedro
1.5 - Gráficos em Setores.
Este gráfico é construído com base em um círculo, e é empregado sempre que se deseja
ressaltar a participação do dado no total. O total é representado pelo círculo, que fica
dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são
respectivamente proporcionais aos dados da série. O gráfico em setores só deve ser
empregado quando há, no máximo, sete dados.
Obs: As séries temporais geralmente não são representadas por este tipo de gráfico.
Número de Acidentes numa Rodovia
1° Trim; 20,4
2° Trim; 27,4
3° Trim; 90
4° Trim; 20,4
.2 - Estereogramas:
São gráficos geométricos dispostos em três dimensões, pois representam volume. São
usados nas representações gráficas das tabelas de dupla entrada. Em alguns casos este
tipo de gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem.
19
0
20
40
60
80
100
1° Trim 2° Trim 3° Trim 4° Trim
Número de Acidentes em Rodovias
Bandeirantes D. Pedro
3 - Pictogramas:
São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo
de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é
atraente e sugestiva. Os símbolos devem ser auto-explicativos. A desvantagem dos
pictogramas é que apenas mostram uma visão geral do fenômeno, e não de detalhes
minuciosos. Veja o exemplo abaixo:
4- Cartogramas:
São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de
figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.
20
5 - Distribuição de Freqüência
É um tipo de tabela que condensa uma coleção de dados conforme as freqüências
(repetições de seus valores).
Tabela Primitiva ou Dados Brutos: É uma tabela ou relação de elementos
que não foram numericamente organizados. É difícil formar
uma idéia exata do comportamento do grupo como um todo, a
partir de dados não ordenados.
Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
ROL: É a tabela obtida após a ordenação dos dados (ordem crescente ou decrescente).
Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
Distribuição de freqüência sem intervalos de classe: É a
simples condensação dos dados conforme as repetições de seus
valores. Para um ROL de tamanho razoável esta distribuição de
freqüência é inconveniente, já que exige muito espaço.
Exemplo:
Dados Frequência
41 3
42 2
43 1
44 1
45 1
46 2
50 2
51 1
52 1
54 1
57 1
58 2
60 2
Total 20
Distribuição de freqüência com intervalos de classe: Quando o
tamanho da amostra é grande é mais racional efetuar o
agrupamento dos valores em vários intervalos de classe.
21
Exemplo:
Classes Freqüências
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20
5.1 - Elementos de Uma Distribuição de Frequência
Com intervalos de classe:
Classe: são os intervalos de variação da variável e é simbolizada por i. O número total
de classes é simbolizado por k.
Ex: na tabela anterior k = 5 e 49 |------- 53 é a 3ª classe, onde i=3.
Limites de Classe: são os extremos de cada classe. O menor número é o limite inferior
de classe (li) e o maior número, limite superior de classe (Li).
Ex: em 49 |------- 53... l3= 49 e L3= 53.
O símbolo |------- representa um intervalo fechado à esquerda e
aberto à direita.
O dado 53 do ROL não pertence a classe 3 e sim a classe 4
representada por 53 |------- 57.
Amplitude do Intervalo de Classe: é obtida através da diferença entre o limite superior
e inferior da classe e é simbolizada por hi = Li - li.
Ex: na tabela anterior hi = 53 - 49 = 4.
Obs.: Na distribuição de freqüência com classe o hi será igual em
todas as classes.
Amplitude Total da Distribuição: é a diferença entre o limite superior da última classe
e o limite inferior da primeira classe.
Notação: AT = L(max) - l(min).
Ex: na tabela anterior AT = 61 - 41= 20.
22
Amplitude Total da Amostra (Rol): é a diferença entre o valor máximo e o valor
mínimo da amostra (ROL).
Notação: AA = Xmax - Xmin.
Neste exemplo AA = 60 - 41 = 19.
Obs: AT sempre será maior que AA.
PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em duas partes
iguais. Ex: em 49 |------- 53 o ponto médio x3 = (53+49)/2 = 51, ou seja x3=(l3+L3)/2.
5.2 - Método Prático para Construção de Distribuição de Freqüências
Com Classe:
1º - Organize os dados brutos em um ROL.
2º - Calcule a amplitude amostral AA.
Nesse exemplo: AA =60 - 41 =19
3º - Calcule o número de classes através da "Regra de Sturges": k = 1+3,3.log(n)
Onde: k é o numero de classes na tabela.
n é o número total de dados a serem tabulados.
Obs: Qualquer regra para determinação do nº de classes da tabela não leva a uma decisão
final; esta vai depender na realidade de um julgamento pessoal, que deve estar
ligado à natureza dos dados.
No exemplo: n = 20 dados, então, a princípio, a regra sugere a adoção de 5 classes.
k = 1+3,3*log(20) = 5,29. Arredonda-se para 5.
4º - Decidido o nº de classes, calcule então a amplitude do intervalo de classe h > AA/k.
Nesse exemplo: AA/k = 19/5 = 3,8.
Obs: Como h > AA/k pega-se um valor ligeiramente superior para haver folga na
última classe. Utiliza-se então h = 4.
5º - Tem-se então o menor nº. da amostra, o nº. de classes e a amplitude do intervalo.
Pode-se montar a tabela, com o cuidado para não aparecer classes com freqüência 0
(zero).
23
No exemplo: o menor nº. da amostra = 41 + h = 45, logo a primeira classe será
representada por..41|------- 45. As classes seguintes respeitarão o mesmo
procedimento.
O primeiro elemento das classes seguintes sempre será formado pelo último
elemento da classe anterior.
Exemplo:
Classes Freqüências
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20
5.3 - Representação Gráfica de uma Distribuição de Freqüência
.Histograma, Polígono de freqüência e Polígono de freqüência acumulada.
Em todos os gráficos anteriores se utilizou o primeiro quadrante do sistema de eixos
coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocaram-
se os valores da variável e na linha vertical (eixo das ordenadas), as freqüências.
Histograma: é formado por um conjunto de retângulos justapostos, cujas bases se
localizam sobre o eixo horizontal, de tal modo que seus pontos médios
coincidam com os pontos médios dos intervalos de classe. A área de um
histograma é proporcional à soma das freqüências simples ou absolutas.
Freqüências simples ou absolutas: são os valores que realmente representam o
número de dados de cada classe. A soma das freqüências
simples é igual ao número total dos dados da distribuição.
Freqüências relativas: são os valores das razões entre as freqüências absolutas de
cada classe e a freqüência total da distribuição. A soma das
freqüências relativas é igual a 1 (100 %).
Polígono de Freqüência: é um gráfico em linha, sendo as freqüências marcadas sobre
perpendiculares ao eixo horizontal, levantadas pelos pontos
médios dos intervalos de classe. Para realmente obtermos
um polígono (linha fechada), deve-se completar a figura,
ligando os extremos da linha obtida aos pontos médios da
classe anterior à primeira e da posterior à última, da
distribuição.
24
.Polígono de Freqüência Acumulada: é traçado marcando-se as freqüências
acumuladas sobre perpendiculares ao eixo horizontal,
levantadas nos pontos correspondentes aos limites
superiores dos intervalos de classe.
Freqüência simples acumulada de uma classe: é o total das freqüências de
todos os valores inferiores ao limite superior do intervalo de
uma determina classe.
Freqüência relativa acumulada de uma classe: é a freqüência acumulada da
classe, dividida pela freqüência total da distribuição.
...Classe.. ......fi..... .....xi..... .....fri..... ou fri.%. .....Fi..... . Fri..... ou Fri..%.
50 |-------- 54 4 52 0,100 10 4 0,100 10
54 |-------- 58 9 56 0,225 22,5 13 0,325 32,5
58 |-------- 62 11 60 0,275 27,5 24 0,600 60
62 |-------- 66 8 64 0,200 20 32 0,800 80
66 |-------- 70 5 68 0,125 12,5 37 0,925 92,5
70 |-------- 74 3 72 0,075 7,5 40 1,000 1,000
Total 40 1,000 100
Onde:
fi = frequência simples ou frequência absoluta ;
xi = ponto médio de classe i;
fri = frequência relativa da classe i;
Fi = frequência simples acumulada até a classe i;
Fri = frequência relativa acumulada até a classe i.
Frequência Absoluta
0
2
4
6
8
10
12
50|---54 54|---58 58|---62 62|---66 66|---70 70|---74
25
Polígono de Frequência Absoluta
0
2
4
6
8
10
12
50|---54 54|---58 58|---62 62|---66 66|---70 70|---74
Frequência Absoluta Acumulada
0
10
20
30
40
50
50|---54 54|---58 58|---62 62|---66 66|---70 70|---74
Poígono de Frequência Absoluta Acumulada
0
10
20
30
40
50
50|---54 54|---58 58|---62 62|---66 66|---70 70|---74
Observação: Os mesmo gráficos podem ser obtidos com as Freqüências Relativas
Simples e Freqüências Relativas Acumuladas.
.
26
Primeira Lista de Exercícios
Distribuição de Freqüências
1 - Classifique as variáveis em qualitativas ou quantitativas (contínuas ou discretas):
a) Universo: alunos de uma escola. Variável: cor dos cabelos.
b) Universo: casais residentes em uma cidade. Variável: número de filhos.
c) Universo: peças produzidas por certa máquina. Variável: número de peças produzidas por
hora.
d) Universo: peças produzidas por certa máquina. Variável: diâmetro externo.
2 - Nos exercícios abaixo, identifique cada número como discreto ou contínuo:
a) Cada cigarro Camel tem 16,13 mg de alcatrão.
b) Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinantes da internet.
c) De 1000 consumidores pesquisados, 930 reconheceram a marca de sopa Campbell.
d) Ao completar um programa de treinamento, um atleta pesava 12,44 lb menos do que no
início do treinamento.
3 – A tabela abaixo representa os salários pagos a 100 operários da empresa XPTO & Cia.
No. Se salários
Mínimos
No. De
Operários
0 |--- 2
2 |--- 4
4 |--- 6
6 |--- 8
8 |--- 10
40
30
10
15
5
Total 100
a) Determine a freqüência absoluta acumulada, a freqüência relativa e a freqüência relativa
acumulada.
b) Quantos operários ganham até dois salários mínimos?
c) Quantos operários ganham menos que 6 salários mínimos?
d) Qual a porcentagem de operários com salário entre 6 e 8 salários mínimos?
e) Qual a porcentagem de operários com salário inferior a 4 salários mínimos?
f) Construa o histograma e o polígono de frequências absoluta.
4 – Os dados seguintes representam 20 observações relativas ao índice pluviométrico em
determinados municípios do estado.
Milímetros de chuva: 144 152 159 160 160 151 157 146 154 145 141 150
142 146 142 141 141 150 143 158
a) Construa uma tabela de freqüência absoluta.
b) Determine as freqüências absolutas acumuladas
c) Determine as freqüências relativas
d) Determine as freqüências relativas acumuladas
e) Construa o histograma e o polígono de freqüências
5 - Imagine que foi obtida a opinião de 1.000 pessoas a respeito da liberação de determinado filme
para exibição em televisão. Dessas 1.000 pessoas, 432 mostravam-se favoráveis, 322 eram
contrárias, 122 não quiseram declarar a opinião e as restantes disseram não Ter opinião. Mostre
esses dados numa tabela.
27
6 - Imagine que, das 1.000 pessoas entrevistadas cujas respostas foram apresentadas no exercício
anterior, 500 eram homens e 500 eram mulheres. Do total de homens, 289 mostravam-se
favoráveis, 120 eram contrários, 78 não quiseram declarar a opinião e os restantes disseram não
ter opinião. Construa uma tabela para apresentar a distribuição das respostas segundo o sexo.
7 – Os dados abaixo representam o preço de varejo (em reais) de uma amostra de 39 marcas diferentes de
balanças para banheiro:
50 50 50 28 65 40 50 22 32 30 79 50 22 20
24 35 25 120 35 35 65 20 14 25 24 48 15 10
25 17 50 22 60 30 12 10 12 20 30.
a) Construa uma distribuição de freqüências para representar dos dados acima.
b) Determine as freqüências absolutas.
c) Determine as freqüências absolutas acumuladas
d) Determine as freqüências relativas
e) Determine as freqüências relativas acumuladas
f) Construa o histograma e o polígono de freqüências
8 - A tabela seguinte representa as alturas em cm de 40 alunos de uma classe.
162 163 148 166 169 154 170 166 164 165 159 175 155
163 171 172 170 157 176 157 157 165 158 158 160 158
163 165 164 178 150 168 166 169 152 170 172 165 162
164.
a) Construa uma distribuição de freqüências para representar dos dados acima.
b) Determine as freqüências absolutas.
c) Determine as freqüências absolutas acumuladas
d) Determine as freqüências relativas
e) Determine as freqüências relativas acumuladas
f) Construa o histograma e o polígono de freqüências
9 – Considere a seguinte tabela de dados:
Classes Freq. Absoluta
2,75 |---- 2,80
2,80 |---- 2,85
2,85 |---- 2,90
2,90 |---- 2,95
2,95 |---- 3,00
3,00 |---- 3,05
3,05 |---- 3,10
3,10 |---- 3,15
3,15 |---- 3,20
3,20 |---- 3,25
2
3
10
11
24
14
9
8
6
3
T O T A L 90
a) Determine as freqüências absolutas acumuladas.
b) Determine as freqüências relativas.
c) Determine as freqüências relativas acumuladas.
28
6 - Medidas de Posição
São as estatísticas que representam uma série de dados que orientam quanto à posição da
distribuição em relação ao eixo horizontal do gráfico da curva de freqüência.
As medidas de posições mais importantes são as medidas de tendência central ou
promédias.
As medidas de tendência central mais utilizadas são:
Média Aritmética
Moda
Mediana
Outras medidas de tendência central menos utilizadas são:
Média Geométrica
Média Quadrática
As outras medidas de posição são as separatrizes, que englobam:
Mediana
Decis
Quartis
Percentis.
6.1 - Média Aritmética
É representada por: X___
se for uma amostra e se for uma população.
É igual ao quociente entre a soma dos elementos do conjunto e o número total dos
elementos.
n
xn
ii
X
1___
.onde xi são os valores da variável e n o número de elementos da amostra.
Ou
n
xn
ii
1 .onde xi são os valores da variável e n o número de elementos da população.
.Dados não-agrupados:
Quando se deseja conhecer a média dos dados não-agrupados em tabelas de freqüências,
determina-se a média aritmética simples.
Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de
10, 14, 13, 15, 16, 18 e 12 kilos, então a venda média diária na semana é:
X___
.= (10+14+13+15+16+18+12) / 7 = 14 kilos
29
Desvio em relação à média: é a diferença entre cada elemento de um conjunto de
valores e a média aritmética, ou seja:.. di = xi - X___
No exemplo anterior têm-se sete desvios:...
d1 = 10 - 14 = -4 d3 = 13 - 14 = -1 d5 = 16 - 14 = 2 d7 = 12 - 14 = -2
d2 = 14 - 14 = 0 d4 = 15 - 14 = 1 d6 = 18 - 14 = 4
Propriedades da Média
1ª propriedade: A soma algébrica dos desvios em relação à média é nula.
No exemplo anterior: d1+d2+d3+d4+d5+d6+d7 = 0
2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de
uma variável, a média do conjunto fica aumentada (ou diminuída) dessa
constante.
Se no exemplo original for somado a constante c = 2 a cada um dos valores da variável
tem-se:
Y = [12+16+15+17+18+20+14] / 7 = 16 kilos ou Y = .+ 2 = 14 +2 = 16 kilos
3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por
uma constante (c), a média do conjunto fica multiplicada (ou dividida)
por essa constante.
Se no exemplo original for multiplicado a constante c = 3 nos valores da variável tem-se:
Y = [30+42+39+45+48+54+36] / 7 = 42 kilos ou Y = x 3 = 14 x 3 = 42 kilos
Dados agrupados:
Sem intervalos de classe
Considere-se a distribuição relativa a 34 famílias de quatro filhos, tomando para variável
o número de filhos do sexo masculino. Pretende-se calcular a quantidade média de
meninos por família:
Nº. de meninos Freqüência fi
0 2
1 6
2 10
3 12
4 4
Total 34
30
Como as freqüências são números indicadores da intensidade de cada valor da variável,
elas funcionam como fatores de ponderação, o que nos leva a calcular a média
aritmética ponderada, dada pela fórmula:
n
ii
i
n
ii
f
fx
X1
1___
.
.xi. ..fi. ..xi.fi .
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
total 34 78
Onde 78 / 34 = 2,3 meninos por família.
Com intervalos de classe
Neste caso, convenciona-se que todos os valores incluídos em um determinado intervalo
de classe coincidem com o seu ponto médio, e determina-se a média aritmética
ponderada por meio da fórmula:
n
ii
i
n
ii
f
fx
X1
1___
..onde Xi é o ponto médio da classe.
Exemplo: Calcular a estatura média de bebês conforme a tabela seguinte:
Estaturas (cm) Freqüência = fi Ponto médio = xi ..xi.fi.
50 |------------ 54 4 52 208
54 |------------ 58 9 56 504
58 |------------ 62 11 60 660
62 |------------ 66 8 64 512
66 |------------ 70 5 68 340
70 |------------ 74 3 72 216
Total 40 2.440
Aplicando a fórmula acima se tem: 2.440 / 40.= 61. logo... = 61 cm
31
6.2 - Média Geométrica
É a raiz n-ésima do produto de todos os elementos.
Média Geométrica Simples: nnxxxXg ...21
____
ou nnxxxXg
1
21
____
)...(
Exemplo - Calcular a média geométrica dos seguintes conjuntos de números: E
a) { 10, 60, 360 }........ 60360.60.103
____
Xg
b) { 2, 2, 2 }........ 22.2.23
____
Xg
c) { 1, 4, 16, 64 }........ 864.16.4.14
____
Xg
.Média Geométrica Ponderada: i nf f
n
ffxxxXg ...21
21
____
ou inff
n
ffxxxXg
1
21
____
)...( 21
Exemplo - Calcular a média geométrica dos valores da tabela abaixo:
...xi... ...fi...
1 2
3 4
9 2
27 1
total 9
Isto é: 8296,3)27.9.3.1(9 1242__
Xg
.Propriedades da Média Geométrica
1ª propriedade: O produto dos quocientes entre cada valor de um conjunto de números
e a média geométrica do conjunto é = 1.
Exemplo: Comprovar a 1ª propriedade da média geométrica com os
dados {10, 60, 360}.
g = 60... onde... 10/60 x 60/60 x 360/60 = 1
.2ª propriedade: Séries que apresentam o mesmo número de elementos com o mesmo
produto têm a mesma média geométrica.
Exemplo: Comprovar a 2ª propriedade da média geométrica com os
dados:
a) {8 ; 12,5}.. ga = 10.. b) {2 ; 50}... gb = 10
32
3ª propriedade: A média geométrica é menor ou igual a média aritmética.
A desigualdade g < ..sempre se verifica, quando os valores da série forem positivos e
nem todos iguais. Se entre eles houver um ou mais zeros, a média geométrica será nula.
A igualdade g = ..só ocorrerá quando todos os valores da série forem iguais.
.4ª propriedade: Quanto maior a diferença entre os valores originais maior será
diferença entre as médias aritmética e geométrica. Veja na próxima
tabela:
conjunto média aritmética média geométrica
X = {2, 2} 2 2
Y = {14, 16} 15 14,97
W = {8, 12} 10 9,8
Z = {2, 50} 26 10
.Aplicações da Média Geométrica.
a) Média de Relações
Empresa Capital líquido Dívida Capital líquido/Dívida
A 2.500 1.000 2,5
B 1.000 2.000 0,5
1180,15,0*5,22
____
Xg
Obs: Se, para uma determinada empresa, se deseja estabelecer uma relação do tipo
capital/dívida que seja independente da dívida ou do capital das diferentes
empresas envolvidas, é recomendável o uso da média geométrica.
Se o que se deseja saber é a relação capital/dívida de certo número de empresas,
após a consolidação, a cifra correta será obtida através da média aritmética.
b) Média em distribuições assimétricas ( Será visto mais adiante )
c) Média de taxas de variação
Exemplo: Supõe-se que um indivíduo tenha aplicado um capital de R$ 500,00 em 1995.
Após um ano de aplicação, essa importância chegou a R$ 650,00.
33
Reaplicando essa última quantia, ao final de mais um ano seu montante
situava-se em R$ 910,00. Qual a taxa média de aumento de capital?
Período Taxa
1995 a 1996 650/500 = 1,3
1996 a 1997 910/650 = 1,4
A taxa média será 3491,14,1*3,12
____
Xg ..ou seja, a raiz quadrada do produto de 1,3 e
1,4.
Resposta: A taxa média de aumento de capital é: 1,3491
6.3 - Média Quadrática
É a raiz quadrada da média aritmética dos quadrados
Média Quadrática Simples: (para dados não agrupados)
n
xxx nXq22
2
2
1
___...
Exemplo: Calcular a média quadrática simples do seguinte conjunto de números:
A = { 2 , 3 , 4 , 5 } ....Resp: 3,67
.Média Quadrática Ponderada: Quando os valores da variável estiverem dispostos em
uma tabela de freqüências, a média quadrática será
determinada pela seguinte expressão:
i
ii
f
fxpXq
2___
Exemplo: Calcular a média quadrática dos valores da tabela abaixo:
classes ....fi.... ....xi.... .. (xi)2.. ... (xi)
2. fi
2 |--------- 4 5 3 9 45
4 |--------- 6 10 5 25 250
6 |--------- 8 12 7 49 588
8 |-------- 10 10 9 81 810
10 |-------- 12 5 11 121 605
total 42 2298
34
Aplica-se a raiz quadrada sobre (2298)/42
40,742
22982___
i
ii
f
fxpXq .
..
OBS:
Sempre que os valores de X forem positivos e pelo menos um dado diferente é
válida a seguinte relação: qg XXX
A igualdade entre as médias acima se verifica quando os valores da variável
forem todos iguais.
A média quadrática é largamente utilizada em Estatística, principalmente quando
se pretende calcular a média de desvios ( x - .) , em vez de a média dos valores
originais. Neste caso, a média quadrática é denominada desvio-padrão, que é
uma importante medida de dispersão.
6.4 - Moda
É o valor que ocorre com maior freqüência em uma série de valores.
A Moda é representada pelo símbolo: Mo
Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum,
isto é, o salário recebido pelo maior número de empregados dessa fábrica.
.A Moda para dados não agrupados.
A moda é facilmente reconhecida: basta, de acordo com definição, procurar o
valor que mais se repete.
Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10.
Há séries nas quais não existe valor modal, isto é, nas quais nenhum valor aparece
mais vezes que outros.
Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal.
.Em outros casos, pode haver dois ou mais valores de concentração. Diz-se, então,
que a série tem dois ou mais valores modais.
Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7.
A série é bimodal.
35
.A Moda para dados agrupados.
a) Sem intervalos de classe
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o
valor da variável de maior freqüência.
Exemplo: Qual a temperatura mais comum medida no mês abaixo:
Temperaturas Freqüência
0º C 3
1º C 9
2º C 12
3º C 6
Resp: 2º C é a temperatura modal, pois é a de maior freqüência.
.b) Com intervalos de classe.
A classe que apresenta a maior freqüência é denominada classe modal. Pela definição,
pode-se afirmar que a moda, neste caso, é o valor dominante que está compreendido
entre os limites da classe modal.
O Método mais utilizado para se calcular a moda com intervalo de classes é o método
pela fórmula de CZUBER.
Fórmula de CZUBER *
21
1* hDD
DlM o
Onde temos que:
l*= limite inferior da classe modal...
D1= [freqüência da classe modal] menos [freqüência da classe anterior à classe modal]
D2= [freqüência da classe modal] menos [freqüência da classe posterior à classe modal]
h*= amplitude da classe modal
Exemplo: Calcule a estatura modal conforme a tabela abaixo.
Classes (em cm) Freqüência
54 |------------ 58 9
58 |------------ 62 11
62 |------------ 66 8
66 |------------ 70 5
36
l*= 58
D1 = 11 - 9=2
D2 = 11 – 8 = 3
h = 4
Mo = 58 + [2/(2+3)]x4 = 58 + 8/5 = 58 + 1,6 = 59,6
Conclusão: a Moda Mo = 59,6
Obs: A moda é utilizada quando se deseja obter uma medida rápida e aproximada de
posição ou quando a medida de posição deva ser o valor mais típico da
distribuição.
Já a média aritmética é a medida de posição que possui a maior estabilidade.
6.5 - Mediana
A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou
decrescente), é o valor situado de tal forma no conjunto que o separa em dois
subconjuntos com o mesmo número de elementos.
Símbolo da mediana: Md
Mediana para dados não agrupados
Dada uma série de valores: { 5, 2, 6, 13, 9, 15, 10 }
Valore em ordem crescente: { 2, 5, 6, 9, 10, 13, 15 }
O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9.
.Método prático para o cálculo da Mediana
a) Se a série dada tiver número ímpar de termos:
O valor mediano será o termo de ordem dado pela fórmula: 2
1
nMd
Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 }
1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 }
n = 9. Então (n + 1)/2 é dado por (9 + 1) / 2 = 5, ou seja, o 5º elemento da série
ordenada será a mediana
A mediana será o 5º elemento, ou seja, Md = 2.
Md
0% 50% 100%
37
b) Se a série dada tiver número par de termos:
O valor mediano será o termo de ordem dado pela fórmula: 2
)12
(2
nn
Md
Obs: n/2 e (n/2 + 1) serão termos de ordem e devem ser substituídos pelos valores
correspondentes.
Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }
Ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
n = 10. Logo a fórmula ficará: [( 10/2 ) + (10/2 + 1)] / 2
[( 5 + 6)] / 2 será na realidade (5º termo+ 6º termo) / 2
5º termo = 2 e 6º termo = 3
A mediana será = (2+3) / 2 ou seja, Md = 2,5 .
A mediana no exemplo será a média aritmética do 5º e 6º termos da série.
Notas:
Quando o número de elementos da série estatística for ímpar, haverá coincidência
da mediana com um dos elementos da série.
Quando o número de elementos da série estatística for par, pode não haver
coincidência da mediana com um dos elementos da série. A mediana será sempre
a média aritmética dos 2 elementos centrais da série.
Em uma série a mediana, a média e a moda não têm, necessariamente, o mesmo
valor.
A mediana depende da posição e não dos valores dos elementos na série
ordenada. Essa é uma da diferenças marcantes entre mediana e média ( que se
deixa influenciar, e muito, pelos valores extremos).
Exemplo: Em { 5, 7, 10, 13, 15 } a média = 10 e a mediana = 10
Em { 5, 7, 10, 13, 65 } a média = 20 e a mediana = 10
Isto é, a média do segundo conjunto de valores é maior do que a do primeiro,
por influência dos valores extremos, ao passo que a mediana permanece a
mesma.
Mediana para dados agrupados
a) Sem intervalos de classe
Neste caso, basta identificar a freqüência acumulada imediatamente superior à metade da
soma das freqüências. A mediana será aquele valor da variável que corresponde a tal
freqüência acumulada.
38
Exemplo:
Variável xi Freqüência fi Freqüência Acumulada
0 2 2
1 6 8
2 9 17
3 13 30
4 5 35
total 35
Quando o somatório das freqüências for ímpar o valor mediano será o termo de ordem
dado pela fórmula:.2
1
ifMd
Como o somatório das freqüências = 35 a fórmula ficará: ( 35+1 ) / 2 = 18º termo = 3
Quando o somatório das freqüências for par o valor mediano será o termo de ordem
dado pela fórmula:.2
122
ii ff
Md
Exemplo - Calcule a Mediana dos dados na seguinte tabela:
Variável xi Freqüência fi Freqüência Acumulada
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
total 8
Aplicando a fórmula acima tem-se:
[(8/2)+ (8/2+1)]/2 = (4º termo + 5º termo) / 2 = (15 + 16) / 2 = 15,5
39
b) Com intervalos de classe
Devem-se seguir os seguintes passos:
1º) Determinam-se as freqüências acumuladas;
2º) Calcular: 2
if ;
3º) Marcar a classe correspondente à freqüência acumulada imediatamente superior à
2
if . Tal classe será a classe mediana;
4º) Calcular a Mediana pela seguinte fórmula: *
*
*2
f
hFaaf
lMd
i
Onde:
l*: é o limite inferior da classe mediana.
Faa: é a freqüência acumulada da classe anterior à classe mediana.
f* : é a freqüência simples da classe mediana.
h*: é a amplitude do intervalo da classe mediana.
Exemplo:
Classes Freqüência = fi Freqüência Acumulada
50 |------------ 54 4 4
54 |------------ 58 9 13
58 |------------ 62 11 24
62 |------------ 66 8 32
66 |------------ 70 5 37
70 |------------ 74 3 40
Total 40
2
if = 40 / 2 =.20...logo.a classe mediana será 58 |------ 62, l*=58.
Faa = 13,.... f* = 11,.. h*= 4. Substituindo esses valores na fórmula, obtem-se:
Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54
OBS: Esta mediana é estimada, pois não se tem os 40 valores da distribuição.
Emprego da Mediana
Quando se deseja obter o ponto que divide a distribuição em duas partes iguais.
Quando há valores extremos que afetam de maneira acentuada a média aritmética.
Quando a variável em estudo é salário.
40
6.6 – Separatrizes – Quartis, Decis e Percentis
Além das medidas de posição estudadas, há outras que consideradas individualmente,
não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua
característica de separar a série em duas partes que apresentam o mesmo número de
valores.
As medidas - os quartis, os decis e os percentis - são, juntamente com a mediana,
conhecidas pelo nome genérico de separatrizes.
QUARTIS
Denominam-se quartis os valores de uma série que a dividem em quatro partes iguais.
Precisa-se, portanto de 3 quartis (Q1, Q2 e Q3 ) para dividir a série em quatro partes
iguais.
Obs: O quartil 2 ( Q2 ) é igual a mediana da série.
Quartis para dados não agrupados
O método mais prático é utilizar o princípio do cálculo da mediana para os 3 quartis. Na
realidade serão calculadas "3 medianas " em uma mesma série.
Exemplo1: Calcule os quartis da série: { 5, 2, 6, 9, 10, 13, 15 }
O primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos
valores: { 2, 5, 6, 9, 10, 13, 15 }
O valor que divide a série acima em duas partes iguais é o 9, logo a Md = 9.
Que será = Q2.
Tem-se agora {2, 5, 6 } e {10, 13, 15 } como sendo os dois grupos de
valores iguais proporcionados pela mediana ( quartil 2).
Para o cálculo do quartil 1 e quartil 3 (Q1 e Q3) basta calcular as medianas
das partes iguais provenientes da verdadeira Mediana da série (quartil 2).
Logo em { 2, 5, 6 } a mediana é = 5 . Ou seja: será o quartil 1 (Q1)
Em {10, 13, 15 } a mediana é =13 . Ou seja: será o quartil 3 (Q3)
Exemplo2: Calcule os quartis da série: { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 }
A série já está ordenada, então se calcula o Quartil 2 = Md = (5+6)/2 = 5,5
O quartil 1 (Q1) será a mediana da série à esquerda de Md : { 1, 1, 2, 3, 5, 5 }
Q1 = (2+3)/2 = 2,5
O quartil 3 (Q3) será a mediana da série à direita de Md : {6, 7, 9, 9, 10, 13 }
Q3 = (9+9)/2 = 9
Q2= Md
0% 50% 100% 25% 75%
Q3 Q1
41
Quartis para dados agrupados
Uitliza-se a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da
mediana, 2
if .... por .. 4
* if
k . onde k é o número de ordem do quartil.
Assim, tem-se:
*
*
*4
1f
hFaaf
lQ
i
*
*
*4
2
2f
hFaaf
lQ
i
*
*
*4
3
3f
hFaaf
lQ
i
Q1 – Primeiro quartil: valor situado de tal modo na série que uma quarta parte (25%) dos
dados é menor que ele e as três quartas partes restantes (75%) são maiores.
Q2 – Segundo quartil (mediana): valor situado de tal modo na série que a metade (50%)
dos dados é menor que ele e a metade restante (50%) são maiores.
Q3 – Terceiro quartil: valor situado de tal modo na série que as três quartas partes (75%)
dos dados são menores que ele e uma quarta parte (25%) é maior.
Exemplo3 - Calcule os quartis da tabela abaixo:
Classes Freqüência = fi Freqüência Acumulada
50 |------------ 54 4 4
54 |------------ 58 9 13 <--- Q1
58 |------------ 62 11 24 <--- Q2
62 |------------ 66 8 32 <--- Q3
66 |------------ 70 5 37
70 |------------ 74 3 40
Total 40
O quartil 2 = Q2 = Md , logo:
2
if = 40 / 2 =.20........... Assim, a classe mediana será 58 |---------- 62
l* = 58........... F** = 13........... f* = 11........... h* = 4
Substituindo esses valores na fórmula, obtem-se:
Q2 = Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54
O quartil 1 : 4
if = 10
Q1 = 54 + [ (10 - 4) x 4] / 9 = 54 + 2,66 = 56,66
.O quartil 3 : 4
*3 if = 30
Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65
42
DECIS
A definição dos decis obedece o mesmo princípio dos quartis, com a modificação da
porcentagem de valores que ficam aquém e além do decil que se pretende calcular.
A fómula básica será : 10
* if
k onde k é o número de ordem do decil a ser calculado.
Indicam-se os decis : D1, D2, ... , D9. Deste modo precisa-se de 9 decis para dividir uma
série em 10 partes iguais.
De especial interesse é o quinto decil, que divide o conjunto em duas partes iguais.
Assim sendo, o quinto decil é igual ao segundo quartil, que por sua vez é igual à
mediana.
Para D5 tem-se: 10
*5 if =
2
if
Exemplo: Calcule o 3º decil da tabela anterior com classes.
k= 3 onde 10
*3 if = 3x40/10 = 12. Este resultado corresponde a 2ª classe.
D3 = 54 + [ (12 - 4) x 4] / 9 = 54 + 3,55 = 57,55
PERCENTIL ou CENTIL
Denomina-se percentis ou centis como sendo os noventa e nove valores que separam
uma série em 100 partes iguais.
Indica-se: P1, P2, ... , P99. É evidente que P50 = Md ; P25 = Q1 e P75 = Q3.
O cálculo de um centil segue a mesma técnica do cálculo da mediana, porém a fórmula
será: 100
* if
k onde k é o número de ordem do percentil a ser calculado.
Exemplo: Calcule o 8º percentil da tabela anterior com classes.
k= 8 onde 100
*8 if = 8x40/100 = 3,2. Este resultado corresponde a 1ª classe.
P8 = 50 + [ (3,2 -0) x 4] / 4 = 50 + 3,2 = 53,2
43
Segunda Lista de Exercícios
População, Amostra, Média, Moda, Mediana, Quartis e Decis
1 - Determine a média aritmética, a moda e a mediana para cada um dos conjuntos de dados:
a) 7; 9; 2; l; 5; 4,5; 7,5; 6,2
b) 90, 87, 92, 81, 78, 85, 95, 80
c) 0,011; 0,032; 0,027; 0,035; 0,042
2 - Qual seria o efeito sobre a média de um conjunto de números se fosse adicionado l0 unidades:
a) A apenas um dos números do conjunto?
b) A cada um dos números do conjunto?
3 - Calcule a média aritmética, a moda e a mediana do seguinte conjunto de dados:
83, 92, 100, 57, 85, 88, 84, 82, 94, 93, 91, 95, supondo que:
a) O conjunto representa toda a população.
b) O conjunto representa uma amostra da população.
4 - Calcule a média aritmética, a moda e a mediana do número de clientes que aguardam nas filas de
12 caixas da matriz de um grande banco: l, 3, 4, 3, 4, 2, 4, l, 2, 2, 1, 0
5 - Se cada um dos dados de um conjunto de números fosse duplicado, qual seria o efeito:
a) Sobre a média.
b) Sobre a moda.
c) Sobre a mediana.
6 - Considere os seguintes dados correspondentes a preços (em reais) de propostas de venda de um
produto: 26,50; 27,50; 25,50; 26,00; 27,00; 23,40; 25,10; 26,20; 26,80
a) Determine a média dos preços.
b) Determine a mediana dos preços
c) Determine a moda dos preços
7 – A tabela abaixo representa os salários pagos a 100 operários da empresa XPTO & Cia.
No. de salários
Mínimos
No. de
Operários
0 |--- 2
2 |--- 4
4 |--- 6
6 |--- 8
8 |--- 10
40
30
10
15
5
Total 100
a) Determine a moda dos salários da empresa.
b) Calcule a média dos salários da empresa.
c) Calcule a mediana dos salários da empresa.
44
8 – Os dados seguintes representam 20 observações relativas ao índice pluviométrico em
determinados municípios do estado.
Milímetros de chuva: 144 152 159 160 160 151 157 146 154 145 141 150
142 146 142 141 141 150 143 158
a) Determine o índice pluviométrico que esteve em moda.
b) Ache o índice pluviométrico médio.
c) Ache o índice pluviométrico mediano.
9 - Utilize os resultados da tabela construída no exercício 4 da primeira lista de exercícios
a) Determine a média, a mediana e a moda dos índices pluviométrico.
b) Compare os resultados obtidos no exercício 8.
10 – Os números abaixo representam a distribuição das espessuras de 60 folhas de tabaco.
2,01 2,08 1,96 3,04 2,01 3,18 1,94 2,19 2,24 2,18 2,59 1,96 2,29 3,18 2,09
1,96 2,06 2,18 2,05 2,04 2,43 1,56 1,94 3,15 2,35 2,08 2,56 2,17 1,96 1,59
2,22 2,34 2,24 1,95 2,01 3,12 3,03 3,12 2,04 1,66 1,87 2,49 3,12 2,24 1,76
3,20 2,38 1,58 1,89 1,98 1,89 1,71 2,42 1,62 1,97 2,18 1,69 3,14 2,18 3,06
a) Determine a espessura que esteve em moda.
b) Ache a espessura mediana.
c) Ache a espessura média.
11 - Utilize os resultados da tabela construída no exercício 7 da primeira lista de exercícios
a) Determine o preço que esteve em moda.
b) Ache o preço mediano das balanças.
c) Ache o preço médio das balanças.
12 – Considere a seguinte tabela de dados:
Classes Freq. Absoluta
2,75 |---- 2,80
2,80 |---- 2,85
2,85 |---- 2,90
2,90 |---- 2,95
2,95 |---- 3,00
3,00 |---- 3,05
3,05 |---- 3,10
3,10 |---- 3,15
3,15 |---- 3,20
3,20 |---- 3,25
2
3
10
11
24
14
9
8
6
3
T O T A L 90
a) Calcule o primeiro quartil dos dados.
b) Calcule a mediana dos dados.
c) Calcule o terceiro quartil dos dados.
45
13 - Dados os conjuntos de números: A = {100; 101; 102; 103; 104; 105} e B = { 0, 1, 2, 3, 4, 5},
podemos afirmar que:
a) A média de A é igual à B multiplicada por 100;
b) A média de A é igual à média de B;
c) A média de A é igual à média de B dividida por 100;
d) A média de A é igual a média de B mais a constante 100.
14 - A média mínima para aprovação em determinada disciplina é 5,0. Se um estudante obtém as
notas 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5; 4,0 nos trabalhos mensais da disciplina em questão,
pergunta-se: ele foi ou não aprovado? Explique.
15 - A tabela abaixo apresenta a distribuição das exportações de empresas eletrônicas em 1972.
Volume exportado (R$) Nº de empresas (fi)
50.000 |-- 60.000 5
60.000 |-- 70.000 10
70.000 |-- 80.000 20
80.000 |-- 90.000 10
90.000 |-- 100.000 5
T o t a l Σfi = 50
a) Calcule a média das exportações.
b) A mediana das exportações.
c) A moda das exportações.
16 - Um caminhão cujo peso vazio é 3.000 kg será carregado com 480 caixas de 10kg cada, 350
caixas de 8kg cada, 500 caixas de 4kg cada e 800 caixas de 5kg cada. O motorista do caminhão
pesa 80kg e a lona de cobertura da carga pesa 50kg.
a) Se este caminhão tem que passar por uma balança que só permite passagens a caminhões
com peso máximo de 15 toneladas, este caminhão passará pela balança?
b) Qual é o peso médio das caixas carregadas no caminhão?
46
7 – Medidas de Dispersão ou Variabilidade:
Mede a dispersão dos valores de uma variável em torno de um valor de tendência central
(média ou mediana) tomado como ponto de comparação.
A média - ainda que considerada como um número para representar uma série de valores
- não consegue destacar o grau de homogeneidade ou heterogeneidade que existe entre
os valores que compõem o conjunto.
Considere os seguintes conjuntos de valores das variáveis X, Y e Z:
X = { 70, 70, 70, 70, 70 }
Y = { 68, 69, 70 ,71 ,72 }
Z = { 5, 15, 50, 120, 160 }
Observa-se que os três conjuntos apresentam a mesma média aritmética = 350/5 = 70
Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já
que todos os valores são iguais à média.
O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor
dispersão entre cada um de seus valores comparado com a média.
Conclui-se então que o conjunto X apresenta dispersão nula e que o conjunto Y
apresenta uma dispersão menor que o conjunto Z.
7.1 - Medidas de Dispersão Absoluta
7.1.1 - Amplitude Total
Amplitude total – AT é a única medida de dispersão que não tem a média como ponto de
referência.
Quando os dados não estão agrupados a amplitude total é a diferença entre o maior e o
menor valor observado:
AT = (valor máximo - valor mínimo).
Exemplo: Para os valores 40, 45, 48, 62 e 70 a amplitude total será: AT = 70 - 40 = 30
Quando os dados estão agrupados sem intervalos de classe ainda tem-se: AT = (valor máximo - valor mínimo).
47
Exemplo:
xi fi
0 2
1 6
3 5
4 3
AT = 4 - 0 = 4
Com intervalos de classe a amplitude total é a diferença entre o limite superior da
última classe e o limite inferior da primeira classe.
Então AT = L máximo - l mínimo
Exemplo:
Classes fi
4 |------------- 6 6
6 |------------- 8 2
8 |------------- 10 3
AT = 10 - 4 = 6
A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da
série, não considerando os valores intermediários.
Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura
em um dia, no controle de qualidade ou como uma medida de cálculo rápido sem
muita exatidão.
7.1.2 - Desvio Médio Absoluto
a) Desvio Médio Absoluto para dados não agrupados
É a média aritmética dos valores absolutos dos desvios tomados em relação a uma das
seguintes medidas de tendência central: média ou mediana. Símbolo = Dm
Fórmula: para a Média: n
Xx
Dmi
___
Fórmula: para a Mediana: n
MdxDm
i
As barras verticais indicam que são tomados os valores absolutos dos desvios.
48
Exemplo: Calcular o desvio médio do conjunto de números { - 4 , - 3 , - 2 , 3 , 5 }
= - 0, 2 e Md = - 2
Tabela auxiliar para cálculo do desvio médio
Desvio em Relação à Média Desvio em Relação à Mediana
Xi Xi - |Xi - | Xi - Md |Xi - Md|
- 4 (- 4) - (-0,2) = -3,8 3,8 (- 4) - (-2) = - 2 2
- 3 (- 3) - (-0,2) = -2,8 2,8 (- 3) - (-2) = - 1 1
- 2 (- 2) - (-0,2) = -1,8 1,8 (- 2) - (-2) = 0 0
3 3 - (-0,2) = 3,2 3,2 3 - (-2) = 5 5
5 5 - (-0,2) = 5,2 5,2 5 - (-2) = 7 7
∑ = 16,8 ∑ = 15
Pela Média: Dm = 16,8 / 5 = 3,36 Pela Mediana : Dm = 15 / 5 = 3
b) Desvio médio para Dados Agrupados
Se os valores vierem dispostos em uma tabela de freqüências, agrupados ou não em
classes, serão usadas as seguintes fórmulas:
Cálculo pela média:
i
ii
f
fXx
Dm
*___
Cálculo pela mediana:
i
ii
f
fMdxDm
*
Exemplo de cálculo pela média:
Xi f i Xi . f i Xi - |Xi - | |Xi - | . f i
3 2 6 4,7 - 1,7 1,7 3,4
4 2 8 4,7 - 0,7 0,7 1,4
5 3 15 4,7 0,3 0,3 0,9
6 3 18 4,7 1,3 1,3 3,9
∑ = 10 47 ∑ = 9,6
Dm = 9,6 / 10 = 0,96
49
Exemplo de cálculo pela mediana:
Xi f i Md Xi - Md |Xi - Md| |Xi - Md| . f i
3 2 5 - 2 2 4
4 2 5 - 1 1 2
5 3 5 0 0 0
6 3 5 1 1 3
∑ = 10 ∑ = 7
Dm = 7 / 10 = 0,70
Obs: Apesar de o desvio médio expressar aceitavelmente a dispersão de uma amostra,
não é tão frequentemente empregado como o desvio-padrão. O desvio médio
despreza o fato de alguns desvios serem negativos e outros positivos, pois essa
medida os trata como se fossem todos positivos. Todavia será preferido o uso do
desvio médio em lugar do desvio-padrão, quando esse for indevidamente
influenciado pelos desvios extremos.
7.1.3 - Desvio Padrão
É a medida de dispersão mais geralmente empregada, pois leva em consideração a
totalidade dos valores da variável em estudo. É um indicador de variabilidade bastante
estável. O desvio padrão baseia-se nos desvios em torno da média aritmética e a sua
fórmula básica pode ser traduzida como: a raiz quadrada da média aritmética dos
quadrados dos desvios e é representada por S ou .
a) Para Dados não Agrupados
Desvio Padrão de uma amostra: 1
)( 2__
n
XxS
i
Desvio Padrão de uma população: n
xi
2)(
A fórmula acima é empregada quando se trata de uma população de dados não-
agrupados.
50
Exemplo: Calcular o desvio padrão da população representada por: - 4 , -3 , -2 , 3 , 5
Xi
- 4 - 0,2 - 3,8 14,44
- 3 - 0,2 - 2,8 7,84
- 2 - 0,2 - 1,8 3,24
3 - 0,2 3,2 10,24
5 - 0,2 5,2 27,04
∑ = 62,8
Sabe-se que n = 5 e 62,8 / 5 = 12,56.
A raiz quadrada de 12,56 é o desvio padrão: = 3,54
Obs: Quando o interesse se restringe à descrição dos dados da amostra visando tirar
inferências válidas para toda a população, efetua-se uma modificação que consiste
em usar o divisor n - 1 em lugar de n.
O desvio padrão de uma amostra é calculado pela fórmula: 1
)( 2__
n
XxS
i
Se os dados - 4, -3, -2, 3, 5 representassem uma amostra o desvio padrão amostral seria a
raiz quadrada de 62,8 / (5 -1) = 3,96, ou seja: S = 3,96.
Propriedades do Desvio padrão:
1ª - Somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável, o
desvio padrão não se altera.
2ª - Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma
constante (diferente de zero), o desvio padrão fica multiplicado ( ou dividido) por
essa constante.
b) Para Dados Agrupados
Quando os dados estão agrupados em classes a fórmula do desvio padrão é:
Para os dados de uma população:
i
ii
f
fx 2)(
51
Para os dados de uma amostra: 1
)( 2__
i
ii
f
fXx
S
Exemplo: Calcule o desvio padrão populacional da tabela abaixo:
ix if ii fx __
X )(__
Xxi 2__
)( Xxi ii fXx 2__
)(
0 2 0 2,1 -2,1 4,41 8,82
1 6 6 2,1 -1,1 1,21 7,26
2 12 24 2,1 -0,1 0,01 0,12
3 7 21 2,1 0,9 0,81 5,67
4 3 12 2,1 1,9 3,61 10,83
Total 30 63 ∑= 32,70
Sabe-se que ∑fi = 30 e 32,7 / 30 = 1,09.
A raiz quadrada de 1,09 é 1,044. Logo = 1,044.
Se considerar os dados como sendo de uma amostra o desvio padrão será:
A raiz quadrada de 32,7 / (30 -1) = 1,062. Logo S = 1,062.
Obs: Nas tabelas de freqüências com intervalos de classe a fórmula a ser utilizada é a
mesma do exemplo anterior.
7.1.4 - Variância
É o desvio padrão elevado ao quadrado e é represejntado por S2 ou 2
A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é
extremamente importante na inferência estatística e em combinações de amostras.
A variância é o quadrado do desvio padrão.
a) Para Dados não Agrupados
Variância da população: n
xi
2_
2)(
Variância da amostra: 1
)( 2__
2
n
XxS
i
52
b) Para Dados Agrupados
Para os dados de uma população:
i
ii
f
fx 2
2
)(
Para os dados de uma amostra: 1
)( 2__
2
i
ii
f
fXx
S
EXERCÍCIOS
1 - Considere os seguintes conjuntos de números:
A = { 10, 20, 30, 40, 50 } B = { 100, 200, 300, 400, 500 }
Que relação existe entre os desvios padrões dos dois conjuntos de números?
2 - Dados os conjuntos de números:
A = { 220, 230, 240, 250, 260 } B = { 20, 30, 40, 50, 60 }
Que relação existe entre os desvios padrões dos dois conjuntos de números?
3 - Dados os conjuntos de números: A = {-2, -1, 0, 1, 2} B = {220, 225, 230, 235, 240}.
De acordo com as propriedades do desvio padrão, pode-se afirmar que:
a) AB ;
b) AB *5 ;
c) 230*5 AB ;
d) 230 AB .
7.2 - Medidas de Dispersão Relativa
CV: Coeficiente de Variação
Na estatística descritiva o desvio padrão por si só tem grandes limitações. Assim, um
desvio padrão de 2 unidades pode ser considerado pequeno para uma série de valores
cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser
dito.
Além disso, o fato do desvio padrão ser expresso na mesma unidade dos dados limita o
seu emprego quando se deseja comparar duas ou mais séries de valores, relativamente à
sua dispersão ou variabilidade, quando expressas em unidades diferentes.
53
Para contornar essas dificuldades e limitações, pode-se caracterizar a dispersão ou
variabilidade dos dados em termos relativos ao seu valor médio.
Medida essa denominada de CV: Coeficiente de Variação
O coeficiente de variação é a razão entre o desvio padrão e a média.
A fórmula do coeficiente de variação é: 100.___
XCV
O resultado neste caso é expresso em percentual, entretanto pode ser expresso também
através de um fator decimal, desprezando assim o valor 100 da fórmula.
Exemplo: Tomam-se os resultados das estaturas e dos pesos de um mesmo grupo de
indivíduos:
Discriminação M É D I A DESVIO PADRÃO
ESTATURAS 175 cm 5,0 cm
PESOS 68 kg 2,0 kg
Qual das medidas (Estatura ou Peso) possui maior homogeneidade?
Resposta: Tem-se que calcular o CV da Estatura e o CV do Peso.
O CV menor será o de maior homogeneidade (menor dispersão ou
variabilidade).
CVestatura = ( 5 / 175 ) x 100 = 2,85 %
CVpeso = ( 2 / 68 ) x 100 = 2,94 %.
Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de
dispersão que os pesos.
54
Terceira Lista de Exercícios
Amplitude Total, Desvio Médio, Desvio Padrão, Variança e
Coeficiente de Variação.
1 - Responda e explique o porquê de cada uma das questões abaixo.
a) O desvio padrão de um conjunto de dados pode ser zero?
b) O desvio padrão de um conjunto de dados pode se negativo?
c) O desvio médio absoluto de um conjunto de dados pode ser zero?
d) O desvio médio absoluto de um conjunto de dados pode ser negativo?
2 - Calcule a amplitude total, o desvio médio, o desvio padrão e a variância do seguinte conjunto de
dados: 83, 92, 100, 57, 85, 88, 84, 82, 94, 93, 91, 95, supondo que:
a) O conjunto representa toda a população.
b) O conjunto representa uma amostra da população.
3 - Calcule a média e o desvio padrão dos clientes que aguardam nas filas de 12 caixas da matriz de
um grande banco: l, 3, 4, 3, 4, 2, 4, l, 2, 2, 1, 0.
4 - Se cada um dos dados de um conjunto de números fosse duplicado, qual seria o efeito:
a) Sobre a amplitude total.
b) Sobre o desvio padrão.
5 - Considere os seguintes dados correspondentes a uma amostra de preços (em reais) de propostas
de venda de um produto: 26,50; 27,50; 25,50; 26,00; 27,00; 23,40; 25,10; 26,20; 26,80
a) Calcule a Amplitude Total dos preços.
b) Determine o Desvio Médio Absoluto dos preços.
c) Calcule o Desvio Padrão dos preços.
d) Calcule a Variância dos preços.
6 – A tabela abaixo representa os salários pagos a 100 operários da empresa XPTO & Cia.
No. de Salários
Mínimos
No. de
Operários
0 |--- 2
2 |--- 4
4 |--- 6
6 |--- 8
8 |--- 10
40
30
10
15
5
Total 100
a) Calcule a Média e o Desvio Padrão considerando os 100 salários como uma amostra.
b) Calcule a Média e o Desvio Padrão considerando os 100 salários como uma população.
7 – Os dados seguintes representam 20 observações relativas ao índice pluviométrico em
determinados municípios do estado.
Milímetros de chuva: 144 152 159 160 160 151 157 146 154 145 141 150
142 146 142 141 141 150 143 158
d) Determine a Média e o Desvio Padrão considerando os índices como uma amostra.
e) Determine a Média e o Desvio Padrão considerando os índices como uma população.
55
8 – Considere a seguinte tabela de dados:
Classes Freq. Absoluta
2,75 |---- 2,80
2,80 |---- 2,85
2,85 |---- 2,90
2,90 |---- 2,95
2,95 |---- 3,00
3,00 |---- 3,05
3,05 |---- 3,10
3,10 |---- 3,15
3,15 |---- 3,20
3,20 |---- 3,25
2
3
10
11
24
14
9
8
6
3
T O T A L 90
a) Calcule a Média e o Desvio Padrão considerando os dados como uma amostra.
b) Calcule a Média e o Desvio Padrão considerando os dados como uma população.
9 – O salário médio mensal em Hortolândia é de R$ 750,00 e em Cosmópolis é de R$ 500,00. Os
desvios padrões são R$ 100,00 e R$ 80,00. Faça uma análise comparativa quanto ao grau de
homogeneidade do salário nestas duas localidades:
10 – O risco de uma ação de uma empresa pode ser devidamente avaliado através da variabilidade
dos retornos esperados. Portanto, a comparação das distribuições probabilísticas dos retornos,
relativas a cada ação individual, possibilita a quem toma decisões perceber os diferentes graus
de risco. Analise, abaixo, os dados estatísticos relativos aos retornos de 5 ações e diga qual é a
menos arriscada :
Discriminação Ação A Ação B Ação C Ação D Ação E
Valor esperado 15 12 5 10 4
Desvio padrão 6 6,6 2,5 3 2,6
Coeficiente de variação 0,40% 0,55% 0,50% 0,30% 0,65%
11 - Um grupo de 85 moças tem estatura média 160,6 cm, com um desvio padrão igual a 5,97 cm.
Outro grupo de 125 moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a
6,01 cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais
homogêneo?
12 - Um grupo de 196 famílias tem renda média de 163,8 dólares, com um coeficiente de variação
de 3,3%. Qual o desvio padrão da renda desse grupo?
13 - Uma distribuição apresenta as seguintes estatísticas: S = 1,5 e CV = 2,9 % . Determine a média
da distribuição.
14 - Numa pequena cidade, 65 famílias têm a renda média de 57,5 dólares e o desvio padrão de
5,98 dólares. A variabilidade relativa das famílias foi de:
a) 0,104 dólares b) 10,4 dólares c) 0,104 % d) 10,4 % e) 0,104 famílias
56
Teste de Avaliação do Conhecimento
Teste sobre Medidas de Posição e Medidas Dispersão
Para cada questão, assinale a alternativa correta:
1 - Em uma prova de Estatística, 3 alunos obtiveram a nota 8,2 ; outros 3 obtiveram a nota 9,0 ; 5
obtiveram a nota 8,6 ; 1 obteve a nota 7,0 e 1 a nota 8,9. A nota média dos alunos será:
a) Uma média aritmética simples com valor 8,0;
b) Uma média aritmética simples com valor 8,7;
c) Uma média aritmética ponderada com valor 8,0;
d) Uma média aritmética ponderada com valor 8,5;
e) Uma média aritmética ponderada com valor 8,6, pois é o de maior freqüência.
2 - Um professor, após verificar que toda a classe obteve nota baixa, eliminou as questões que não
foram respondidas pelos alunos. Com isso, as notas de todos os alunos foram aumentadas de 3
pontos. Então se pode afirmar que:
a) A média aritmética ficou alterada, assim como a mediana.
b) Apenas a média aritmética ficou alterada.
c) Apenas a mediana ficou alterada.
d) Não houve alteração nem na média nem na mediana.
e) Nada podemos afirmar sem conhecer o número total de alunos.
3 - Na tabela primitiva: {6, 2, 7, 6, 5, 4} a soma dos desvios em relação à média aritmética é igual a:
a) Ao número:- 4
b) Ao número: 8
c) Ao número: 0
d) Ao número: 25
e) Ao número: 4
4 - A mediana da série {1, 3, 8, 15, 10, 12, 7} é:
a) Igual a 15
b) Igual a 10
c) Igual a 8
d) Igual a 3,5
e) Não há mediana, pois não existe repetição de valores.
5 - Numa pesquisa de opinião, 80 pessoas são favoráveis ao divórcio, 50 são desfavoráveis, 30 são
indiferentes e 20 ainda não têm opinião formada a respeito do assunto. Então a média aritmética
será:
a) Igual a 180, porque todos opinaram somente uma vez.
b) Igual a 40, porque é a média entre os valores 50 e 30.
c) Igual a 45.
d) Igual a 1, porque todos opinaram somente uma vez.
e) Não há média aritmética.
57
6 - Segundo o site de VEJA na internet 28% da população brasileira é de origem africana, 32% de
origem portuguesa, 20% de origem italiana e 20% de outras origens. Qual é a moda da
população brasileira quanto à origem?
a) 32%
b) 20%
c) 32% da população.
d) Origem portuguesa.
e) Não podemos identificar a moda por falta de dados.
7 - Numa determinada Escola com 300 alunos 34% deles completam o 2º grau em 3 anos e 66% em
4 anos. Qual o tempo médio de conclusão do 2º grau na referida escola.
a) 7 anos.
b) 3 e 4 anos.
c) 3,66 anos.
d) 3 ou 4 anos.
e) 3,5 anos.
8 - Na série estatística formada por { -1 , -2 , 3 , 4 }:
a) A mediana está entre -2 e 3.
b) A mediana é 0,5.
c) A questão 1 e 2 estão corretas.
d) A mediana é 2.
e) Não existe mediana, pois não há dados repetidos.
9 - Na série estatística formada por { 3 , 1 , 2 , 3 , 6 }:
a) Mediana > Moda > Média.
b) Moda < Média < Mediana.
c) Moda = Mediana = Média.
d) Mediana = Média e não há Moda.
e) Média > Mediana e não há Moda.
10 - Na série estatística formada por { 3 , 1 , 2 , 3 , 4 } se for alterado o valor máximo:
a) A média poderá ser alterada ou não.
b) A mediana não vai ser alterada.
c) A moda não será alterada.
d) A média não será alterada.
e) A mediana vai ser alterada.
11 - Quando a medida de posição deve ser o valor mais típico da distribuição utilizamos:
a) A média.
b) A mediana.
c) A moda.
d) A média, a moda e mediana.
e) A moda ou a média.
58
12 - Quando desejamos o ponto médio exato de uma distribuição de freqüência, basta calcular:
a) O desvio médio.
b) A média.
c) A moda.
d) A mediana.
e) Qualquer medida de posição.
13 - Considere uma série estatística com 2351 elementos. A posição da mediana é representada
pelo:
a) 1175º elemento.
b) 1176º elemento.
c) Ponto médio entre o 1175º e o 1176º elemento.
d) 1175,5º elemento.
e) Impossível resolução, pois não há identificação dos elementos.
14 - Dados os conjuntos de números B = {0 , 1 , 2 , 3 , 4 , 5} e A = {220, 225, 230, 235, 240, 245},
podemos afirmar, de acordo com as propriedades da média, que a média de A:
a) É igual à constante 220 somada ao produto da média de B por 5.
b) É igual à média de B mais a constante 220.
c) É igual à média de B multiplicada por uma constante arbitrária.
d) É igual à média de B mais a constante 220 e esse último resultado multiplicado por 5.
e) É igual à média de B multiplicada pela constante 94.
15 - Dados os conjuntos de números: A = {100; 101; 102; 103; 104; 105} e B = { 0, 1, 2, 3, 4, 5},
podemos afirmar que:
a) A média de A é igual à B multiplicada por 100;
b) A média de A é igual à média de B;
c) A média de A é igual à média de B dividida por 100;
d) A média de A é igual à média de B mais a constante 100.
59
8 - Probabilidade
Introdução:
O cálculo das probabilidades pertence ao campo da Matemática, entretanto a maioria dos
fenômenos de que trata a Estatística são de natureza aleatória ou probabilística. O
conhecimento dos aspectos fundamentais do cálculo das probabilidades é uma
necessidade essencial para o estudo da Estatística Indutiva ou Inferencial.
8.1 - Experimento Aleatório - E
São fenômenos que, mesmo repetido várias vezes sob condições semelhantes,
apresentam resultados imprevisíveis. O resultado final depende do acaso.
Representa-se um evento com a letra: E
Exemplos de eventos:
1 - Da afirmação: "é provável que o meu time ganhe a partida hoje"
pode resultar: - que ele ganhe - que ele perca - que ele empate
Este evento tem três possibilidades.
2 – Lançar um dado e observar o n úmero ocorrido na face superior.
3 – Selecionar ao acaso um aluno da USF e verificar seu semestre no curso.
4 – Jogar uma moeda 4 vezes e observar a seqüência de “caras” obtidas.
5 – Escolher uma pessoa ao acaso e verificar sua idade.
8.2 - Espaço Amostral - S
É o conjunto universo ou o conjunto de todos os resultados possíveis de um experimento
aleatório.
Representa-se o espaço amostral com a letra: S
Exemplos de espaço amostral:
1 - No experimento aleatório "lançamento de uma moeda" tem-se o espaço amostral:
S = {cara, coroa}.
2 - No experimento aleatório "lançamento de um dado" tem-se o espaço amostral:
S = {1, 2, 3, 4, 5, 6}.
3 - No experimento aleatório "dois lançamentos sucessivos de uma moeda" tem-se o
espaço amostral: S = {(ca,ca) , (co,co) , (ca,co) , (co,ca)}
4 – No lançamento de dois dados ao mesmo tempo tem-se o espaço amostral
S = {(1,1), (1,2),...(1,6), (2,1), (2,2),...(2,6), ...(6,1), (6,2),...(6,6)}. Tem-se um
espaço amostral com 36 resultados.
60
Obs: Cada elemento do espaço amostral que corresponde a um resultado recebe o nome
de ponto amostral. No primeiro exemplo: cara pertence ao espaço amostral
S = {cara, coroa}.
8.3 - Eventos
Sejam “E” um experimento e “S” o espaço amostral.
Um evento é qualquer subconjunto do espaço amostral S de um experimento aleatório E.
Assim, qualquer que seja o evento A, se A S (A está contido em S), então A é um
evento de S.
Se A = S , A é chamado de evento certo.
Se A S e A é um conjunto unitário então A é chamado de evento elementar.
Se A = Ø , A é chamado de evento impossível.
Exercícios:
1 - No lançamento de um dado tem-se S = {1, 2, 3, 4, 5, 6}. Formule os eventos
definidos pelas sentenças:
a) Obter um número par na face superior do dado: A = {2, 4, 6} onde A S.
b) Obter um número menor ou igual a 6 na face superior: B = {1, 2, 3, 4, 5, 6}, onde
B = S, logo B é um evento certo de S.
c) Obter o número 4 na face superior: C = {4}, logo C é um evento elementar de S.
d) Obter um número maior que 6 na face superior: D = Ø, logo D é um evento
impossível de S.
2 - No lançamento de três moedas, uma de 50 centavos, uma de 10 centavos e outra de 5
centavos,nesta ordem, pergunta-se:
a) Qual é o espaço amostral?
Sugestão: represente coroa como sendo a face com os números 50, 10 ou 5 e cara
(Ca) como sendo a face sem números.
b) Formule os eventos definidos pelas sentenças:
Obter uma cara
Obter pelo menos uma cara
Obter apenas um cara
Obter no máximo duas caras
Obter uma cara e uma coroa
Obter uma coroa ou uma cara
8.4 – Evento União:
E: um experimento
Sejam: S: o espaço amostral
A S
B S
61
Os eventos A e B, contidos no mesmo espaço amostral S.
O evento AB ocorre se ocorre o evento A ou ocorre o evento B.
AB = x/ xA ou xB
Exemplo: A = 1 e B = 2 AB = 1, 2, ocorre 1 ou ocorre 2.
8.5 – Evento Intersecção:
E: um experimento
Sejam: S: o espaço amostral
A S
B S
Os eventos A e B, contidos no mesmo espaço amostral S.
O evento AB ocorre se ocorre o evento A e ocorre o evento B.
AB = x/ xA e xB
Exemplo: A = 1, 3 e B = 1, 2, 3 AB = 1, 3.
8.6 – Eventos Mutuamente Exclusivos
E: um experimento
Sejam: S: o espaço amostral
A S
B S
Os eventos A e B são mutuamente exclusivos se A B =
Exemplos:
1 - Sejam S = 1, 2, 3, 4, 5, 6 A = 1, 2 e B = 4, 5
Os eventos A e B são mutuamente exclusivos.
2 - Sejam S = Cara, Coroa A = Cara e B = Coroa
Os eventos A e B são mutuamente exclusivos.
8.6 – Eventos Complementares
E: um experimento
Sejam: S: o espaço amostral
A S
B S
Os eventos A e B são complementares se AB = S A B =
62
Exemplos:
1 - Sejam S = 1, 2, 3, 4, 5, 6 A = 1, 6 e B = 2, 3, 4, 5
AB = S e A B =
Os eventos A e B são complementares.
2 - Sejam S = Cara, Coroa A = Cara e B = Coroa
AB = S A B =
Os eventos A e B são complementares.
Obs.: Os eventos complementares são também mutuamente exclusivos.
8.7 - Conceito de Probabilidade
Seja “E” um experimento aleatório e seja “S” o espaço amostral.
A cada evento A do espaço amostral associa-se um número real representado por P(A),
denominado probabilidade de ocorrência do evento A.
Ou seja: Chama-se probabilidade de um evento A o número real definido como: P(A).
Ao realizar um experimento e observar o evento A, calcula-se P(A) como:
P(A): número de vezes que ocorreu o evento A dividido pelo número total de casos.
OBS: Quando todos os elementos do Espaço amostral têm a mesma chance de acontecer,
o espaço amostral é chamado de conjunto equiprovável.
Exemplos:
1 - No lançamento de uma moeda qual a probabilidade de obter cara?
Evento A: ocorrência de cara (ca) no lançamento de uma moeda.
S = {ca, co} = 2 A = {ca} = 1 P(A) = 1/2 = 0,5 = 50%
2 - No lançamento de um dado qual a probabilidade de obter um número par?
Evento A: ocorrência dos números 2, 4 ou 6.
S = { 1, 2, 3, 4, 5, 6 } = 6 A = { 2, 4, 6 } = 3 P(A) = 3/6 = 0,5 = 50%
3 - No lançamento de um dado qual a probabilidade de obter um número menor ou igual
a 6?
Evento A: ocorrência dos números 1, 2, 3, 4, 5 ou 6.
S = { 1, 2, 3, 4, 5, 6 } = 6 A = { 1, 2, 3, 4, 5, 6 } = 6 P(A) = 6/6 = 1,0 = 100%
Obs.: a probabilidade de todo evento certo é 1 ou 100%.
63
4 - No lançamento de um dado qual a probabilidade de obter um número maior que 6?
Evento A: ocorrência de um número maior que 6.
S = { 1, 2, 3, 4, 5, 6 } = 6 A = P(A) = 0/6 = 0 = 0%
Obs.: a probabilidade de todo evento impossível é 0 ou 0%
5 – Extrai-se uma única carta de baralho de 52 cartas. Acha a probabilidade de:
a) Sair um valete
E: extrair uma carta do baralho
S: conjunto formado por 52 cartas
A: sair um valete
A = valete de paus, valete de copas, valete de ouro, valete de espada
Logo P(A) = 4/52 = 0,076.
b) Sair uma carta vermelha
E: extrair uma carta do baralho
S: conjunto formado por 52 cartas
A: sair uma carta vermelha
A = 26 cartas
Logo P(A) = 26/52 = 0,5.
8.7.1 - Propriedades
1 – 0 P(A) 1.
2 – P(S) = 1.
3 – Se A e B são eventos mutuamente exclusivos então P(AB) = P(A) + P(B).
Obs: no caso de eventos complementares, sabe-se que um evento pode ocorrer ou não.
1 - Sendo p a probabilidade de que o evento ocorra (sucesso) e q a probabilidade de
que o evento não ocorra (insucesso), para um mesmo evento existe sempre a
relação:
p + q = 1
2 - Numa distribuição de probabilidades o somatório das probabilidades atribuídas a
cada evento elementar é igual a 1 onde p1 + p2 + p3 + ... + pn = 1.
8.7.2 - Teoremas Fundamentais
Teorema 1 – Se A = , for o evento vazio então: P(A) = 0.
Teorema 2 – Se __
A é o evento complementar de A então: P(A) = 1 – P(__
A ).
Teorema 3 – Se A e B são dois eventos quaisquer, então:
P(AB) = P(A) + P(B) – P(AB).
64
Teorema 4 – Se A, B, C são três eventos quaisquer, então:
P(ABC) = P(A) + P(B) + P(C) – PAB) – P(AC) – P(BC) + P(ABC).
Teorema 5 – Se A B então P(A) P(B).
Exemplos:
1 – Sabe-se que a probabilidade de tirar o nº 4 no lançamento de um dado é p = 1/6.
Logo, a probabilidade de não tirar o nº 4 no lançamento de um dado: q = 1 - p ou
q = 1 - 1/6 = 5/6.
2 - Calcular a probabilidade de um piloto de automóvel vencer uma dada corrida, onde
as suas "chances", segundo os entendidos, são de "3 para 2". Calcule também a
probabilidade dele perder:
O termo "3 para 2" significa: De cada 5 corridas ele ganha 3 e perde 2.
Então p = 3/5 (ganhar) e q = 2/5 (perder).
3 - Um dado foi fabricado de tal forma que num lançamento a probabilidade de ocorrer
um número par é o dobro da probabilidade de ocorrer número ímpar na face
superior, sendo que os três números pares ocorrem com igual probabilidade, bem
como os três números ímpares. Determine a probabilidade de ocorrência de cada
evento elementar.
4 - Seja S = {a, b, c, d}. Considere a seguinte distribuição de probabilidades:
P(a) = 1/8; P(b) = 1/8; P(c) = 1/4 e P(d) = x. Calcule o valor de x.
5 - As chances de um time de futebol T ganhar o campeonato que está disputando são
de "5 para 2". Determinar a probabilidade de T ganhar e a probabilidade de T
perder:
6 - Três cavalos C1, C2 e C3 disputam um páreo, onde só se premiará o vencedor. Um
conhecedor dos 3 cavalos afirma que as "chances" de C1 vencer são o dobro das de
C2, e que C2 tem o triplo das "chances" de C3. Calcule as probabilidades de cada
cavalo vencer o páreo.
8.8 - Eventos Independentes
E: um experimento
Sejam: S: o espaço amostral
A S
B S
Os eventos A e B são independentes se P(AB) = P(A) . P(B)
65
Quando a realização ou não realização de um dos eventos não afeta a probabilidade da
realização do outro e vice-versa.
Exemplo: Quando se lança dois dados, o resultado obtido em um deles independe do
resultado obtido no outro. Então qual seria a probabilidade de obter,
simultaneamente, o nº 4 no primeiro dado e o nº 3 no segundo dado?
P1 = P(4 dado1) = 1/6 P2 = P(3 dado2) = 1/6
P total = P (4 dado1) x P (3 dado2) = 1/6 x 1/6 = 1/36
8.9 - Probabilidade Condicional
Sejam A e B dois eventos de um experimento E.
Denota-se por P(A/B) a probabilidade condicional do evento A dado que ocorreu o
evento B.
Analogamente, P(B/A) a probabilidade condicional do evento B dado que ocorreu o
evento A.
Calcula-se a probabilidade condicional como:
)(
)()/(
BP
BAPBAP
se P(B) > 0 logo P(AB) = P(B).P(A/B)
)(
)()/(
AP
BAPABP
se P(A) > 0 Logo P(AB) = P(A).P(B/A)
Nota: Se A e B são evento independentes então: P(A/B) = P(A) e P(B/A) = P(B).
Exemplo 1: Seja o experimento aleatório E: lançar um dado.
Seja o evento A = {sair o numero 3}.
Então: P(A) = 1/6.
Seja o evento B = {sair o numero impar} = {1, 3, 5}.
Podemos estar interessados em avaliar a probabilidade do evento A estar
condicionado à ocorrência do evento B, designado por P(A/B).
P(A/B) = 1/3.
Exemplo 2: Seja o experimento aleatório E: Duas cartas são retiradas de um baralho sem
haver reposição.
Qual a probabilidade de ambas serem COPAS?
P(Copas1 e Copas2) = P(Copas1) x P(Copas2/Copas1) = 13/52 x 12/51 =
0,0588 = 5,88 %
P(Copas1) = 13/52
P(Copas2/Copas1) = 12/51
Obs: No exemplo anterior se a 1ª carta retirada voltasse ao baralho o experimento seria
do tipo com reposição e seria um evento independente. O resultado seria:
P(Copas1) x P(Copas2) = 13/52 x 13/52 = 0,0625 = 6,25 %
66
Observações: Espaço amostral do baralho de 52 cartas:
Cartas pretas = 26
Páus = 13 (ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
Espadas = 13 (ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
Cartas vermelhas = 26
Ouros = 13 (ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
Copas = 13 (ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
Exercícios:
1 – Num baralho com 52 cartas, qual é a probabilidade de sair o ÁS de ouro quando
retiramos 1 carta de um baralho?
2 - Qual a probabilidade de sair o um REI quando retiramos 1 carta de um baralho de 52
cartas?
3 - Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule:
a) a probabilidade de essa peça ser defeituosa.
b) a probabilidade de essa peça não ser defeituosa.
4 - De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro
baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho
ser um REI e a do segundo ser o 5 de paus?
5 - Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 nolas
brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes.
Uma bola é retirada de cada urna. Qual é a probabilidade de as três bolas retiradas
das urnas A, B e C serem, respectivamente, branca, preta e verde?
6 - De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual é a
probabilidade de a primeira carta ser o ÁS de paus e a segunda ser o REI de paus?
7 - Qual a probabilidade de sair uma figura (rei ou dama ou valete) quando se retira uma
carta de um baralho de 52 cartas?
8 - São dados dois baralhos de 52 cartas. Tira-se, ao mesmo tempo, uma carta do
primeiro baralho e uma carta do segundo. Qual a probabilidade de tirarmos uma
DAMA e um REI, não necessariamente nessa ordem?
67
9 - Duas cartas são retiradas de um baralho sem haver reposição. Qual a probabilidade
de ambas serem COPAS ou ESPADAS?
10 - Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e
3 bolas pretas. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta?
11 - Duas bolas são retiradas (com reposição) de uma urna que contém 2 bolas brancas
e 3 bolas pretas. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta?
12 - Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e
3 bolas pretas e 5 bolas verdes.
a) Qual a probabilidade de que ambas sejam verdes?
b) Qual a probabilidade de que ambas sejam da mesma cor?
68
Quarta Lista de Exercícios
Probabilidades
1 - Um grupo de 100 pessoas foi observado quanto ao sexo e cor dos olhos, obtendo-se os seguintes
resultados: 51 homens; 68 pessoas de olhos azuis; 34 homens de olhos azuis.
Sendo os eventos A= {homens} e B={pessoas de olhos azuis}, determina as probabilidades dos
seguintes eventos:
a) A b) B c) B d) AB e) A B f) A B g) A B
h) AB i) A B j) A B k) A/B l) A B/ m) A B/ n) B/A
o) B A/ p) A B/
Sugestão: Utilize uma das leis de Morgan: BA BA ou BA BA
[ Resp.: a) 0,51; b) 0,68; c) 0,32; d) 0,34; e) 0,34; f) 0,17; g) 0,66; h) 0,85; i) 0,83 ]
[ Resp.: j) 0,66; k) 0,50; l) 0,50; m) 0,53; n) 0,67; o) 0,33; p) 0,47 ]
2 - Suponha que a probabilidade de uma criança em idade escolar já ter sido vacinada contra a
poliomielite seja 0,98. Três crianças foram escolhidas ao acaso em uma escola, sendo:
A1 = { a criança 1 foi vacinada }
A2 = { a criança 2 foi vacinada }
A3 = { a criança 3 foi vacinada }
Calcule a probabilidade de apenas uma criança ter sido vacinada. (Resp.: 0,001176)
3 - Se P(A) =1/2; P(B) =1/3; e P(AB) =1/4. Calcule o valor de:
a) P(AB) (Resp.: 7/12) b) P(A/B) (Resp.: 3/4) c) P(B/A) (Resp.: 1/2)
d) P( A B/ ) e) P( B A/ )
Sugestão: Utilize uma das leis de Morgan: BA BA ou BA BA
4 - Uma pessoa joga um dado equilibrado duas vezes. Sejam os eventos:
A1 = {o resultado da 1a jogada é 1 ou 2}
A2 = {o resultado da 2a jogada é 1 ou 3}
B1 = {a soma dos resultados é 7}
B2 = {a soma dos resultados é 3}
Verifique quais das proposições abaixo são verdadeiras:
a) os eventos A1 e A2 são mutuamente exclusivos.
b) B1 e B2 são independentes
c) B2 (A1 A2)
5 - Dentre 100 estudantes de uma mesma turma, 58 são homens e 30 deles passaram no vestibular
na 1a opção. Um estudante desta turma foi selecionado ao acaso.
Sejam os eventos:
A = { o estudante é homem }
B = { o estudante passou na 1a opção }
Calcule: a) P(AB) b) P( A B ) c) P(A/B)
d) P( A B/ ) e)P(AB) f) P( A B )
6 - No lançamento simultâneo de dois dados, determine a probabilidade de se obter:
a) "soma dos números iguais a 8"
b) "pares de números iguais"
c) "soma dos números iguais a 4"
69
7 - Uma caixa contém bolas pretas e bolas brancas.
Seja o experimento E: retirar sucessivamente três bolas da caixa
a) Determine o espaço amostral do experimento E
Determine o conjunto dos elementos que correspondem aos seguintes eventos:
b) "as três bolas têm a mesma cor"
c) "a 1ª. bola retirada é uma bola branca"
d) "pelo menos duas bolas são brancas"
e) "o número de bolas brancas é igual ao número de bolas pretas"
f) "pelo menos duas bolas da mesma cor"
8 - Sorteando-se ao acaso um número do conjunto V = { l, 2, 3, 4, 5, 6, 7, 8, 9,10, 11, 12} qual é a
probabilidade de ser um múltiplo de 3 dado que o número sorteado é um número ímpar ?
9 - Um casal pretende ter três filhos do mesmo sexo. A probabilidade de que isto ocorra é:
a) 1/2 b) 1/4 c) 1/8 d) 40%
10 - Um grupo de 20 pessoas apresenta a seguinte composição:
15 brasileiros e 5 estrangeiros; 10 homens e 10 mulheres; 18 casados e 2 solteiros
A probabilidade de uma pessoa escolhida ao acaso seja um homem solteiro e estrangeiro é:
a)1/4 b) 12,5% c)1/16 d)1,25%
11- Suponha uma caixa contendo duas urnas: URNA Y e URNA Z
Cada URNA contém bolas Verdes e bolas Brancas conforme a figura indica.
Cada URNA tem a mesma probabilidade de ser selecionada.
Seja o experimento E: Selecionar uma bola da caixa.
Calcule as seguintes probabilidades
a) P(bola V / URNA Y) (Resp.: 8/10)
b) P(bola V / URNA Z) (Resp.: 5/10)
c) P(bola B / URNA Y) (Resp.: 2/10)
d) P(bola B / URNA Z) (Resp.: 5/10)
e) P(bola V e URNA Z) (Resp.: 1/4)
f) P(bola V e URNA Y) (Resp.: 2/5)
g) Qual é a probabilidade de sair uma bola Branca da caixa? (Resp.: 7/20)
12 - De 100 pessoas que solicitaram emprego de programador de computador, durante o ano
passado numa empresa, 40 possuíam experiência anterior e 30 possuíam um certificado
profissional. Vinte dos candidatos possuíam tanto experiência anterior como certificado
profissional. Qual é a probabilidade de que um candidato selecionado tenha experiência ou
certificado?
13 - Em geral, a probabilidade de que um possível cliente faça uma compra quando procurado por
um vendedor é 0,4. Se um vendedor seleciona 3 clientes e faz o contato com os mesmos, qual é
a probabilidade de que os 3 façam compras?
14 - De um total de 500 empregados, 200 participam de um plano de participação de lucros da
empresa, 400 contam com cobertura de seguro médico e 200 empregados participam de ambos
os programas. Qual é a probabilidade de um determinado empregado participar de um ou outro
programa?
Bolas
Urna Y Urna Z
Bolas
8V
2B
5V
5B
70
15 - A probabilidade de que uma nova política de mercado tenha sucesso foi estimada em 0,6. A
probabilidade de que a despesa para o desenvolvimento da estratégia seja mantida dentro dos
limites do orçamento previsto é de 0,5. A probabilidade de que ambos os objetivos sejam
alcançados é 0,3. Qual é a probabilidade de que um ou outro objetivo seja alcançado?
16 - A proporção global de itens defeituosos em um processo de produção contínuo é de 10%.
Se forem escolhidos 3 itens qual a probabilidade de que:
a) todos tenham defeitos
b) nenhum tenha defeito
17 - Uma fábrica de louças tem um processo de inspeção com quatro etapas. A probabilidade de ma
peça defeituosa passar uma etapa de inspeção sem ser detectada é de aproximadamente 20%.
Com base nesta cifra, determine:
a) A probabilidade de uma peça defeituosa passar por todas as quatro etapas de inspeção sem
ser detectada;
b) Qual seria sua resposta se fosse acrescentada uma Quinta etapa de inspeção, com 50% de
probabilidade de detectar peças defeituosas
18 – Uma firma exploradora de petróleo perfura um poço quando acha que há pelo menos 25% de
chance de encontrar petróleo. A firma perfura 4 poços: A, B, C, e D e estima,
respectivamente, as probabilidades 0,3; 0,4; 0,7; e 0,8 de encontrar petróleo.
a) Determine a probabilidade de nenhum dos poços produzirem petróleo, com base nas
estimativas da firma.
b) Determine a probabilidade de os quatro poços produzirem petróleo.
c) Qual é a probabilidade de que somente os poços A e C produzem petróleo?
19 - Paulo quer telefonar para uma colega para sair. Ele sabe que o telefone dela é 2688-473?, mas não
consegue se lembrar do último algarismo. Se Paulo só possui uma ficha telefônica e decide “chutar”
o último algarismo; Qual a probabilidade de ele acertar o telefone da colega?
20 - Considere a experiência que consiste em pesquisar famílias com 3 crianças, em relação ao sexo
das mesmas, segundo a ordem do nascimento. Defina o conjunto dos seguintes eventos:
a) ocorrência de somente dois filhos do sexo masculino;
b) ocorrência de pelo menos um filho do sexo masculino;
c) ocorrência de no máximo duas crianças do sexo feminino.
21 - Duas pessoas atiram ao mesmo tempo numa caça; sabendo-se que a primeira pessoa tem 60%
de probabilidade de acertar e a segunda pessoa tem 80%, qual a probabilidade da caça não ser
atingida? (Resp.: 0,08 ou 8%).
22 - Duas pessoas atiram numa caça; sabe-se que a probabilidade da primeira pessoa acertar é 40%
e da segunda 70%. Qual a probabilidade:
a) de ambas acertarem; (Resp.: 28%)
b) da caça ser atingida; (Resp.: 82%)
c) de só uma acertar; (Resp.: 54%)
d) de nenhuma acertar. (Resp.: 18%)
23 - Resolver cada pergunta com reposição e sem reposição.
Uma caixa contém: 6 bolas vermelhas e 3 azuis. Retirando-se 2 bolas dessa caixa, qual a
probabilidade delas serem:
a) ambas da mesma cor; (Resp.: com reposição: 55,6%; sem reposição: 50%)
b) uma de cada cor. (Resp.: com reposição: 44,4%; sem reposição: 50%)
71
9 - Distribuição de Probabilidades
Variável Aleatória
Qualquer função X que associa um número real a todo elemento do espaço amostral S é
denominada variável aleatória.
Muitas vezes não se está interessado propriamente no resultado de um experimento
aleatório, mas em alguma característica numérica a ele associada. Essa característica será
chamada variável aleatória.
Assim, se o espaço amostral relativo ao "lançamento simultâneo de duas moedas" é S =
{(ca,ca), (ca,co), (co,ca), (co,co)} e se X representa o "número de caras" que aparecem, a
cada ponto amostral pode-se associar um número para X, de acordo com a tabela abaixo
( X é a variável aleatória associada ao número de caras observado):
Ponto Amostral X
(ca, ca) 2
(ca, co) 1
(co, ca) 1
(co, co) 0
Logo se pode escrever:
Número de caras (X) Probabilidade (X)
2 1/4
1 2/4
0 1/4
Total 4/4 = 1
Exemplo: Considere-se a distribuição de freqüências relativa ao número de acidentes
diários na Rodovia Bandeirantes durante o mês de novembro de 1997:
Número de Acidentes Frequência
0 22
1 5
2 2
3 1
Total 30
Pode-se então escrever a tabela de distribuição de probabilidade:
72
Número de Acidentes (X) Probabilidade (X)
0 0,73
1 0,17
2 0,07
3 0,03
Total 1,00
A tabela apresenta os valores de uma variável aleatória X e as probabilidades de X
ocorrer, ou seja, a tabela de distribuição de probabilidades.
Assim, tem-se que: P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = 1
Generalizando tem-se que: ∑ P(X = xi) = 1
Funções de probabilidades: f(x) = P(X= xi)
Ao definir a distribuição de probabilidade, estabelece-se uma correspondência unívoca
entre os valores x1, x2, x3, ..., xn da variável aleatória X e os valores das probabilidades:
p1 = P(X = x1), p2 = P(X = x2), p3 = P(X = x3), ... pn = P(X = xn).
Esta correspondência define uma função onde os valores xi formam o domínio da função
e os valores pi o seu conjunto imagem.
Assim, ao lançar um dado, a variável aleatória X, definida por "pontos de um dado",
pode tomar os valores 1, 2, 3, 4, 5 e 6.
Então resulta na seguinte distribuição de probabilidade:
x1
x2
x3
.
.
xn
p1
p2
p3
.
.
pn
Domínio Conjunto Imagem
f(xi) = pi
73
X = xi P (X=xi)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
T o t a l 6/6 = 1
9.1 - Distribuição Binomial
Imagine fenômenos cujos resultados só podem ser de dois tipos, um dos quais é
considerado como sucesso e o outro como insucesso. Este fenômeno pode ser repetido
tantas vezes quanto se queira (n vezes), nas mesmas condições. As provas repetidas
devem ser independentes, isto é, o resultado de uma não deve afetar os resultados das
sucessivas. No decorrer do experimento, a probabilidade p do sucesso e a probabilidade
q do insucesso manter-se-ão constantes (q = 1 - p) . Nessas condições X é uma variável
aleatória discreta que segue uma distribuição Binomial, com a seguinte distribuição de
probabilidades:
)(..)()( knkn
k qpkPkXP
Onde:
)!(!
!
knk
nn
k
P(k) = é a probabilidade de que o evento se realize k vezes em n provas.
p = é a probabilidade de que o evento ocorra, ou seja, é a probabilidade de sucesso.
q = é a probabilidade de que o evento não ocorra, ou seja, probabilidade de insucesso.
OBS: O nome Binomial é devido à fórmula, pois representa o termo geral do
desenvolvimento do Binômio de Newton.
Parâmetros da Distribuição Binomial
Média: pnX .__
Desvio padrão: qpn .. Variância: qpn ..2
74
Restrições sobre o uso da distribuição Binomial
1 – Haja “n” repetições idênticas do experimento.
2 – Cada experimento tem sempre dois resultados possíveis, um chamado “sucesso” e
outro chamado “falha” ou insucesso.
3 – As probabilidades p de sucesso e 1-p de falha permanecem constantes em todas as
realizações do experimento.
4 – Os resultados das realizações do experimento são independentes um do outro.
Exemplos:
1 – Dos estudantes da USF, 40% fumam cigarro. Escolhe-se 6 estudantes ao acaso para
darem sua opinião sobre o fumo.
a) Ache a probabilidade de nenhum dos 6 estudantes ser fumante.
)(..)( knkn
k qpkXP n = 6 ; p = 0,4 ; q = 1 – p = 0,6
046,0)6,0.(1.)!06(!0
!6)6,0.()4,0.()0( 6)06(06
0
XP
b) Ache a probabilidade de todos serem fumantes.
004,01.)4,0.()!66(!6
!6)6,0.()4,0.()6( 6)66(66
6
XP
c) Ache a probabilidade de pelo menos a metade ser fumante.
P( X ≥ 3) = P(X = 3) + P(X = 4) + P(X = 5) + P(X = 6) ou
P( X ≥ 3) = 1 – P(X 3) = 1 – [P(X = 0) + P(X = 1) + P(X = 2)]
2 – Um fabricante de mesa de bilhar suspeita que 2% de seu produto apresenta algum
defeito. Se existe essa suspeita, determine a probabilidade de que numa amostra de 9
mesas:
a) Haja pelo menos uma mesa defeituosa.
n = 9
p = 0,02
q = 1 – p = 0,98
166,0)98,0.()02,0.(1)0(1)1(1)1( 909
0 XPXPXP
b) Não haja nenhuma mesa defeituosa.
83,0)98,0.()02,0.()0( 909
0 XP
75
3 – Os registros de uma pequena empresa indicam que 40% das faturas emitidas são
pagas após o vencimento. De 14 faturas expedidas, determine a probabilidade de:
a) Nenhuma fatura ser paga com atraso.
n = 14; p = 0,4; q = 1 – p = 0,6 00078,0)6,0.()4,0.()0( 14014
0 XP
b) No máximo 2 faturas serem pagas com atraso.
036,0029,0007,000078,0)2()1()0()2( XPXPXPXP
c) Pelo menos 3 serem pagas com atraso.
964,0036,01)2(1)3( XPXP
Exercícios:
1 - Uma moeda é lançada por 5 vezes seguidas e independentes. Calcule a probabilidade
de serem obtidas 3 caras nessas 5 provas. (Resp.: 5/16)
2 - Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade do
time A ganhar 4 jogos.
3 - Determine a probabilidade de se obter exatamente 3 caras em 6 lances de uma
moeda.
4 - Jogando-se um dado três vezes, determine a probabilidade de se obter um múltiplo de
3 duas vezes.
5 - Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o
time A:
a) - ganhar dois ou três jogos;
b) - ganhar pelo menos um jogo;
6 - A probabilidade de um atirador acertar o alvo é 2/3. Se ele atirar 5 vezes, qual a
probabilidade de acertar exatamente 2 tiros?
7 - Seis parafusos são escolhidos ao acaso da produção de certa máquina, que apresenta
10% de peças defeituosas. Qual a probabilidade de serem defeituosos dois deles?
76
Quinta Lista de Exercícios
Distribuição Binomial
1. A probabilidade de um atirador acertar o alvo é 2/3. Se ele atirar 5 vezes qual a probabilidade de
acertar exatamente 2 tiros? (Resp.: 40/243)
2. A probabilidade de um atirador acertar o alvo é 1/2. Se ele atirar 5 vezes qual a probabilidade de
acertar exatamente 2 tiros?
3. Seis parafusos são escolhidos ao acaso da produção de certa máquina, que apresenta 10% de
peças defeituosas. Qual a probabilidade de dois parafusos serem defeituosos? (Resp.: 9,84%)
4. Um time A tem 2/3 de probabilidade de vitória sempre que joga. Se A jogar 4 partidas, encontre a
probabilidade de A vencer:
a) Exatamente 2 partidas; (Resp.: 8/27)
b) Pelo menos 1 partida; (Resp.: 80/81)
c) Mais que a metade das partidas. (Resp.: 48/81)
5. Em 10.000 famílias com 8 filhos cada uma, quantas se esperaria que tivessem:
a) Exatamente 2 meninos; (Resp.: 1094 famílias)
b) Nenhum menino; (Resp.: 39 famílias)
c) Três meninos. (Resp.: 2.190 famílias)
6. Num hospital 5 pacientes devem submeter-se a um tipo de operação, da qual 80% sobrevivem.
Qual a probabilidade de que:
a) Todos sobrevivam; (Resp.: 32,77%)
b) Pelo menos 2 sobrevivam; (Resp.: 99,33%)
c) No máximo 3 não consigam sobreviver. (Resp.: 99,33%)
7. Se 3% das canetas de certa marca são defeituosas, achar a probabilidade de que numa amostra de
10 canetas, escolhidas ao acaso, desta mesma marca, tenham:
a) Nenhuma defeituosa; (Resp.: 73,74%)
b) Cinco canetas defeituosas. (Resp.: 0,0005%)
b) Pelo menos 2 defeituosas; (Resp.: 3,45%)
c) No máximo 3 defeituosas. (Resp.: 99,95%)
8. Se a probabilidade de ocorrência de uma peça defeituosa é 0,2 determine a média e o desvio
padrão da distribuição de peças defeituosas em um total de 600. (Resp.: 120 e 9,8)
9. Uma amostra de 15 peças é extraída com reposição de um lote que contém 10% de peças
defeituosas. Calcule a probabilidade de que:
a) O lote não contenha peça defeituosa; (Resp.: 20,59%)
b) O lote contenha exatamente três peças defeituosas; (Resp.: 12,9%)
c) O lote contenta pelo menos uma peça defeituosa; (Resp.: 79,4%)
d) O lote contenha entre 3 e 6 peças defeituosas; (Resp.: 5,3%)
e) O lote contenha de 3 a 6 peças defeituosas. (Resp.: 18,4%)
10. Calcule a média e o desvio padrão para o número de peças defeituosas na amostra do problema
anterior. (Resp.: 1,5 e 1,16)
77
11. Uma confecção de roupa infantil suspeita que 30% de sua produção apresenta algum defeito. Se
tal suspeita é correta, determine a probabilidade de que, numa amostra de quatro peças, sejam
encontradas:
a) No mínimo duas peças com defeito; (Resp.: 34,83%)
b) Menos que três peças boas. (Resp.: 34,83%)
12. Um vendedor programa 6 visitas e acredita que a probabilidade de ele ser recebido pelo
encarregado de compras das empresas visitadas é de 80%.
a) Qual a probabilidade de ele completar pelo menos quatro visitas? (Resp.: 90,11%)
b) Qual a probabilidade de ele ser recebido por todos os encarregados de compra?
(Resp.: 26,21%)
c) Se ele acredita que completando uma visita suas despesas do dia estão cobertas, qual a
probabilidade de ele ter prejuízo nesse dia? (Resp.: 0,01%)
78
9.2 - Distribuição de Poisson
Diz-se que uma variável aleatória tem distribuição de Poisson quando a freqüência de
ocorrência dessa variável aleatória segue a distribuição de Poisson.
A distribuição de Poisson é útil para descrever as probabilidades do número de
ocorrência num intervalo contínuo, geralmente o tempo ou espaço.
Exemplos:
1 – Número de defeitos por metro quadrado.
2 – Número de acidentes por dia.
3 – Número de clientes por hora.
4 – Número de chamadas telefônicas por minuto.
Restrições sobre o uso da distribuição e Poisson
1 – A probabilidade de ocorrência é a mesma em todo o campo de observação.
2 – A probabilidade de mais de uma ocorrência num único ponto é zero.
3 – O número de ocorrências em qualquer intervalo é independente do número de
ocorrências em outros intervalos.
A distribuição de Poisson é muito usada como aproximação para a distribuição
Binomial.
A distribuição de probabilidade de Poisson tem a seguinte fórmula:
!
.)()(
k
etkXP
tk
Onde:
: é a taxa média de ocorrência do evento, por unidade.
e: é uma constante que representa o valor igual a 2,718.
t: número de unidades.
k: número de ocorrências
= t é o número médio de ocorrências no intervalo t.
A média da distribuição de Poisson é = t.
Ou seja: !
.)(
k
ekXP
k
79
OBS: Pode acontecer experimento com uma distribuição Binomial com um “p”
(sucesso) muito pequeno de tal modo que se tem um “n” muito grande para que o
sucesso ocorra. Nestes casos, pode-se simplificar os cálculos usando a
distribuição de Poisson como aproximação para a distribuição Binomial.
Para que os resultados aproximados pela distribuição de Poisson sejam
satisfatórios só se deve fazer a substituição da distribuição Binomial pela
distribuição de Poisson quando “n” for maior ou igual a 50 e “p” menor ou igual a
0,1 ou “p” maior ou igual a 0,9 (“p” próximo de 0 ou próximo de 1).
Exemplos:
1 – Um processo mecânico produz tecidos para tapetes com uma média de dois defeitos
por metro. Determine a probabilidade de um metro quadrado ter exatamente:
a) Um defeito
t = 1 metro
= 2
= t = 2
P(X = 1) = (21 .e-2)/1! = 0,27
b) Dois defeitos
P(X = 2) = (22 .e-2)/2! = 0,27
c) Três defeitos
P(X = 3) = (23 .e-2)/3! = 0,18
d) Nenhum defeito
P(X = 0) = (20 .e-2)/0! = 0,13
2 – Em média, 2 pessoas por minuto utilizam os serviços de um caixa automático de um
banco durante as horas de maior movimento. Qual é a probabilidade de:
a) Nenhuma pessoa utilizar os caixas.
= 2; t = 1; = t = 2.1 = 2
P(X = 0) = (20 .e-2)/0! = 0,13
b) Duas pessoas utilizar os caixas.
P(X = 2) = (22 .e-2)/2! = 0,27
c) Menos de duas pessoas utilizarem os caixas.
P(X< 2) = P(X = 0) + P(X = 1) = 0,4
3 – O número médio de acidentes mensais em um determinado cruzamento é três. Qual é
a probabilidade de que em um determinado mês ocorram quatro acidentes no
cruzamento?
= 3; k = 4
P(X = 4) = (µk.e-µ)/k! = (34 .e-3)/4! = 0,168
80
4 – Uma empresa de vendas de produtos recebe em média 10 chamadas por minuto.
Calcule a probabilidade de:
a) Não ocorrer nenhuma chamada em 1 minuto
= t = 10.1 = 10 chamadas por minuto; k = 0.
P(X = 0) = (µk. e-µ)/k! = (100 .e-10)/0! = 0,000045
b) Ocorrer menos que três chamadas em 2 minutos
= t = 10.2 = 20 chamadas por minuto.
P(X < 3) = P(X = 0) + P(X = 1) + P(X = 2)
P(X = 0) = (µk. e-µ)/k! = (200 .e-20)/0! ≈ 0 (nota: e-20 ≈ 0)
P(X = 1) = (µk. e-µ)/k! = (201 .e-20)/1! ≈ 0
P(X = 2) = (µk. e-µ)/k! = (202 .e-20)/0! ≈ 0
Logo, P(X < 3) = 0
c) Ocorrer mais que quatro chamadas em 0,3 minutos.
= t = 10.0,3 = 3 chamadas por minuto.
PX > 4) = 1 – P(X ≤ 4) = 1 – [P(X = 0)+P(X = 1)+P(X = 2)+P(X = 3)+P(X = 3)]
P(X = 0) = (µk.e-µ)/k! = (30.e-3)/0! = 0,049787
P(X = 1) = (µk.e-µ)/k! = (31.e-3)/1! = 0,149361
P(X = 2) = (µk.e-µ)/k! = (32.e-3)/2! = 0,224042
P(X = 3) = (µk.e-µ)/k! = (33.e-3)/3! = 0,224042
P(X = 4) = (µk.e-µ)/k! = (34.e-3)/4! = 0,168031
Logo, P(X > 4) = 0,184737 ou aproximadamente 18,47%
5 – Se 2% dos fusíveis são defeituosos. Qual a probabilidade de que uma amostra de 400
fusíveis exatamente 6 sejam defeituosos?
Nota: Como “n” é muito grande e “p” é muito pequeno, usa-se a distribuição de
Poisson como aproximação da distribuição Binomial.
p = 0,02 n = 400 = n.p = (400).(0,02) = 8
P(X = 6) = (µk. e-µ)/k! = (86 .e-8)/6! = 0,1221 ou 12,21%
81
Sexta Lista de Exercícios
Distribuição de Poisson
1 – Caminhões chegam a um depósito à razão de 2,8 caminhões por hora. Determine a
probabilidade de chegarem três ou mais caminhões, nas seguintes situações:
a) Num período de 30 minutos (Resp. 0,1665)
b) Num período de 1 hora (Resp. 0,5305)
c) Num período de 2 horas (Resp. 0,9176)
2 – Uma central telefônica recebe chamadas à razão de 4,6 chamadas por minuto. Num intervalo de
1 minuto, determine a probabilidade nas seguintes situações:
a) Ocorrer exatamente 2 chamadas (Resp. 0,1063)
b) Ocorrer ao menos 2 chamadas (Resp. 0,9437)
c) Ocorrer nenhuma chamada (Resp. 0,0101)
d) Ocorrer entre 2 e 6 chamadas (Resp. 0,7617)
3 – Os acidentes numa fábrica têm aproximadamente uma distribuição de Poisson com média de 3
acidentes por mês. Num mês qualquer, determine a probabilidade nas seguintes situações:
a) Ocorre nenhum acidente (Resp. 0,0498)
b) Ocorre um acidente (Resp. 0,1493)
c) Ocorrem de 3 a 4 acidentes (Resp. 0,3921)
4 – Estima-se em 0,01 a probabilidade de vender uma apólice de seguro a pessoa que respondem a
um anúncio especial da empresa. Nesta base, se 1000 pessoas respondem ao anúncio, qual é a
probabilidade de que:
a) Nenhuma pessoa compre uma apólice (Resp. 0)
b) Pelo menos uma pessoa compre uma apólice (Resp. 1 ou 100%)
c) Mais de 10 pessoas comprem apólices (Resp. 0,417)
5 – Se o número de peixes pescados por hora em certo pesqueiro é uma variável que segue a
distribuição de Poisson com média igual a 1,8, achar a probabilidade de que um pescador,
pescando durante uma hora:
a) Não pegue nenhum peixe.
b) Pegue exatamente 2 peixes.
c) Pegue no máximo 4 peixes.
d) Pegue pelo menos dois peixes.
6 - Se 4% de passageiros de avião tem problemas com a bagagem, qual a probabilidade de que
entre 150 passageiros até 2 passageiros tenham problemas com suas bagagens?
82
a b
9.3 - Distribuição Normal
Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é
a distribuição Normal. A distribuição Normal tem a sua importância na estatística porque
permite representar as freqüências observadas de muitos fenômenos naturais.
Muitas das variáveis analisadas na pesquisa sócio-econômica correspondem à
distribuição normal ou se aproximam a uma distribuição normal.
9.3.1 - Propriedades da Distribuição Normal
1 – A curva da distribuição Normal tem a forma de um sino
2 – A distribuição Normal é simétrica em relação a média .
3 – A distribuição Normal assume qualquer valor real.
4 – Cada distribuição Normal fica especificada pela sua média e seu desvio padrão .
5 – A área total sob a curva Normal é 1 (ou 100%).
6 – A área sob a curva entre dois pontos é a probabilidade de uma variável aleatória com
distribuição Normal assumir os valores entre esses dois pontos.
Isto é, P( a X b) = a área da curva entre os valores “a” e “b”.
7 – P(X = k) = 0.
83
-3 -2 - + +2 +3
68%
95,5%
99,7%
A probabilidade da variável aleatória X assumir os valores entre “a” e “b” é calculada
como:
b
a
x
dxebXaP
2
2
1
2
1)(
Para qualquer distribuição Norma tem-se:
Quando se tem uma variável aleatória com distribuição normal o principal interesse está
em obter a probabilidade de essa variável aleatória assumir um valor em um determinado
intervalo.
Exemplo: Seja X a variável aleatória que representa os diâmetros dos parafusos
produzidos por certa máquina. Supondo que essa variável tenha uma
distribuição normal com média 2 cm e desvio padrão 0,04 cm. Qual a
probabilidade de um parafuso ter o diâmetro com valor entre 2 e 2,05 cm ?
Deseja-se calcular: P ( 2 < X < 2,05)
9.3.2 - A Distribuição Normal Padronizada
Seja X uma variável aleatória com distribuição Normal de média e desvio padrão .
Isto é: X N(, ).
Fazendo
XZ , então a variável Z tem uma distribuição Normal com média =0 e
desvio padrão = 1.
Isto é: Z N(0, 1).
84
Utiliza-se uma tabela da distribuição Normal padronizada, que dá a probabilidade de z
tomar qualquer valor entre a média 0 e um dado valor z, isto é: P ( 0 < Z < z).
Tem-se então que: zZPxX
PxXP
)( ,
Onde Z é uma variável com distribuição normal de média 0 e desvio padrão 1.
No exemplo anterior deseja-se calcular P(2 < X < 2,05), onde = 2 e = 0,04.
Para obter essa probabilidade, precisa-se transformar a variável para Z.
Isto é: 25,1004,0
205,2
04,0
2205,22)05,22(
ZPZP
XPXP
9.3.3 - Utilização da Tabela Z
Procura-se na tabela Z o valor de z = 1,25
Na primeira coluna encontra-se o valor até uma casa decimal 1,2. Em seguida, encontra-
se, na primeira linha, o valor 5, que corresponde ao último algarismo do número 1,25.
Na intersecção da linha e coluna correspondentes encontra-se o valor 0,3944, o que
permite escrever:
P (0 < Z < 1,25 ) = 0,3944 ou 39,44 %.
Assim a probabilidade de um certo parafuso apresentar um diâmetro entre 2cm e 2,05
cm é de 39,44 %.
Exemplos:
1 – Seja X N(3, 8), ou seja, X é uma distribuição Normal com média = 3 e desvio
padrão = 8. Calcule P(X < 5).
5987,00987,05,025,08
35
8
3)5(
ZP
XPXP
0 0,25
85
0,1254
2 - 1 – Seja X N(3, 8), ou seja, X é uma distribuição Normal com média = 3 e desvio
padrão = 8. Calcule P(10 < X < 15).
)5,187,0(
8
12
8
7
8
315
8
3
8
310)1510( ZPZP
XPXP
1254,03078,04332,0)87,0()5,1()5,187,0( ZPZPZP
3 – Seja X N(5, 6), ou seja, X é uma distribuição Normal com média = 5 e desvio
padrão = 6. Calcule P(X > 2).
6915,01915,05,05,06
52
6
5)2(
ZP
XPXP
0 0,87 1,5
- 0,5 0
0,1915 0,5
86
Exercícios:
1- Determine as probabilidades:
a) P(-1,25 < Z < 0)
b) P(-0,5 < Z < 1,48)
c) P(0,8 < Z < 1,23)
d) P(-1,25 < Z < -1,20)
e) P( Z < 0,92)
f) P(Z > 0,6)
2 - Os salários dos bancários são distribuídos normalmente, em torno da média R$
10.000,00, com desvio padrão de R$ 800,00. Calcule a probabilidade de um
bancário ter o salário situado entre R$ 9.800,00 e R$ 10.400,00.
Deve-se inicialmente calcular os valores z1 e z2,
z1 = (9800 - 10000) / 800 = -0,25 e z2 = (10400 - 10000) / 800 = 0,5
P( 9800 < X < 10400) = P(-0,25 < Z < 0,5) =
P(-0,25 < Z < 0) + P(0 < Z < 0,5) = 0,0987 +0,1915 = 0,2902 ou 29,02 %
3 - Um teste padronizado de escolaridade tem distribuição normal com média = 100 e
desvio padrão = 10. Determine a probabilidade de um aluno submetido ao teste ter
nota :
a) Maior que 120
b) Maior que 80
c) Entre 85 e 115
d) Maior que 100
87
Sétima Lista de Exercícios
Distribuição Normal de Probabilidades
1. Um processo de fabricação produz peças com comprimento médio de 500 mm e desvio padrão de
10 mm. Qual a porcentagem de peças que se situam:
a) Acima de 510 mm. (Resp.: 15,87%)
b) Entre 470 e 530 mm. (Resp.: 99,72%)
c) Abaixo de 525,8 mm. (Resp.: 99,51%)
2. Um fabricante de baterias, sabe por experiência passada, que as baterias de sua fabricação têm
vida média de 600 dias e desvio padrão de 100 dias, sendo que a duração tem aproximadamente
distribuição normal. Oferece uma garantia de 312 dias, isto é, troca as baterias que apresentarem
falhas nesse período. Fabrica 10.000 baterias mensalmente. Quantas deverão trocar pelo uso da
garantia, mensalmente?
(Resp.: 19,88 aproximadamente 20 baterias)
3. Uma fábrica de carros sabe que os motores de sua fabricação têm duração normal, com média de
I50.000 km e desvio padrão de 5.000 km. Qual a probabilidade de que um carro, escolhido ao
acaso, dos fabricados por essa firma, tenha um motor que dure:
a) Menos de 170.000 km? (Resp.: 0,999968)
b) Entre 140.000 km e 165.000 km?
c) Se a fábrica substitui o motor que apresenta duração inferior à garantia, qual deve ser esta
garantia, para que a porcentagem de motores substituídos seja inferior a 0,2%?
4. Uma peça é aceita num controle de qualidade com dimensões entre 299 e 301 mm. Verifica se
que l0% das peças são rejeitadas como grandes e 20% como pequenas. Calcular a porcentagem
de rejeição, no caso da especificação ser ampliada para 298,5 e 301,5 mm. 8,53% como
pequenos; 3,51% como grandes.
5. Levantamento do custo unitário de produção de um item da empresa revelou que sua
distribuição é normal com média 50 e desvio padrão 4. Se o preço de venda unitário desse
produto é 60, qual a probabilidade de uma unidade desse item, escolhido ao acaso, ocasionar
prejuízo à empresa? (Resp.: 0,621%)
6. Os balancetes semanais realizados em uma empresa mostraram que o lucro realizado distribui-se
normalmente com média 48.000 u.m. e desvio padrão 8.000 u.m.. Qual a probabilidade de que:
a) Na próxima semana o lucro seja maior que 50.000 u.m.? (Resp.: 40,129%)
b) Na próxima semana o lucro esteja entre 40.000 u.m. e 45.000 u.m.? (Resp.: 19,33%)
c) Na próxima semana haja prejuízo? (Resp.: 0%)
7. Os resultados de um concurso de habilitação tiveram distribuição normal com média 50 e desvio
padrão 10. Os candidatos serão classificados conforme o seguinte critério decrescente: A=10%
das notas mais altas; B=15% das próximas notas; C=50% das notas; D=15% das notas; E=10%
das notas mais baixas. Determine as notas limites para a classificação dos candidatos.
(Res,p: A > 62,8; 56,7< B < 62,8; 43,3< C <56,7; 37,2< D <43,3; E <37,2).
8. Dois estudantes foram informados de que alcançaram as variáveis reduzidas de z1 = 0,8 e
z2 = - 0,4, respectivamente, em um exame de múltipla escolha de inglês. Se suas notas foram 8,8
e 6,4, respectivamente, determinar a média e o desvio padrão das notas do exame.
(Resp.: = 7,2; e = 2).
88
9. O peso dos ovos de certa raça de galinha tem distribuição normal, com média de 65 gramas e
desvio padrão de 5 gramas. Considere uma caixa desses ovos como uma amostra aleatória
simples de tamanho 12 da população de todos os ovos. Qual a probabilidade de que o peso de
uma embalagem caia entre 750 gramas e 825 gramas?
89
10 – Intervalos de Confiança
No capítulo 6 vimos que é possível estimar a média aritmética de uma população por
meio de uma amostra aleatória. Este tipo de estimação chama-se Estimativa Pontual.
A estimação pontual é o processo de se estimar um parâmetro da população por meio de
um único valor, no caso a média amostral.
Definição:
Estimativa Pontual é uma estimativa de um único valor para um parâmetro
populacional.
A estimativa pontual mais adequada para a média µ de uma população é a média
amostral __
X .
Exemplo 1: Os dados a seguir representam uma amostra aleatória do número de frases
encontrado em 54 anúncios de propagandas em revistas.
9 20 18 16 9 16 16 9 11 13 22 16 5 18 6 6 5 12
25 17 23 7 10 9 10 10 5 11 18 18 9 9 17 13 11 7
14 6 11 12 11 15 6 12 14 11 4 9 18 12 12 17 11 20
O número médio de frases por anuncio é dado pela média amostral que é uma estimação
pontual.
Isto é, 4,1254
671
54
54
11__
i
i
n
i
i x
n
x
X .
Portanto, 4,12__
X é uma estimativa pontual do número médio de frase na população de
anúncios.
No entanto, o valor 12,4 é apenas uma estimativa, pois o verdadeiro valor da média não
é conhecido.
O valor 12,4 estimado não é exatamente igual a media da população, mas é um valor
bastante próximo.
Neste procedimento, pode-se estar cometendo um erro para mais ou para menos no
valor da média.
Para solucionar este problema, pode-se calcular um intervalo de confiança para o valor
da média da população. O intervalo de confiança é uma estimativa intervalar.
Definição:
Intervalo de Confiança é um intervalo de valores usado para estimar um parâmetro da
população.
Para se formar um intervalo de confiança, use a estimativa pontual como centro do
intervalo e depois adicione ou subtraia deste valor a margem de erro desejada.
Antes de criar o intervalo de confiança é necessário determinar qual é o nível de
confiança desejado para o intervalo.
90
Definição:
O Nível de Confiança C é a probabilidade de que o intervalo contenha o parâmetro da
população. Quanto maior é o nível de confiança, maior será a probabilidade de o
intervalo conter o verdadeiro valor do parâmetro.
Exemplo 2: Para a média 54,12__
X do exemplo anterior, poderemos ter vários intervalos
de confiança, dependendo da confiança desejada.
Intervalo A:
Intervalo B:
Observações: 1 – O intervalo B é maior que o intervalo A.
2 – O nível de confiança do intervalo B é maior que o nível de confiança do intervalo A.
2 – O intervalo B é de maior confiança mas o Erro cometido também é maior.
3 – O erro E2 cometido no intervalo B é maior que o erro E1 cometido no intervalo A.
Conclusão: Quanto maior for o intervalo de confiança, maior será o erro cometido.
O nível de confiança c é a área da curva normal padrão entre os valores –zc e +zc.
Isto é, c é a porcentagem da área da curva normal padrão. A área restante é 1– c.
Exemplo 3: Para c = 90% então ½(1 – c) equivale a 5%. Isto significa que, olhando na
tabela da normal padronizada tem-se zc = 1,645.
Na maior parte dos casos, naturalmente µ é um valor desconhecido e __
X varia de amostra
para amostra. Entretanto, pode-se calcular um valor máximo para o erro se souber o
nível de confiança desejado.
12,4 12,4 + E1 12,4 – E1
[ ]
Erro Erro
C = Área entre –zc e +zc
+zc –zc
½(1 – c) ½(1 – c)
Z = 0
12,4 12,4 + E2 12,4 – E2
[ ]
Erro Erro
91
Definição:
Dado um nível de confiança c, o Erro da Estimativa E é o erro máximo cometido
quando se calcula um intervalo de confiança. É a maior distância entre a estimativa
pontual e o verdadeiro valor do parâmetro.
O erro da estimativa é calculado pela fórmula: n
zE c
Onde:
Zc é um valor consultado na tabela da normal padronizada, de acordo com o nível de
confiança desejado.
é o desvio padrão da população.
n é o tamanho da amostra.
Nota: no caso de não conhecer , pode-se usar S que é o desvio padrão da amostra,
quando n ≥ 30.
Isto é: n
Sz
nzE cc
, quando n ≥ 30.
Exemplo 4: No exemplo 2 temos:
No intervalo de confiança A, E1 é a maior distância entre a estimativa
pontual e o verdadeiro valor do parâmetro.
E1 é o erro da estimativa.
No intervalo de confiança B, E2 é a maior distância entre a estimativa
pontual e o verdadeiro valor do parâmetro.
E2 é o erro da estimativa.
Exemplo 5: No exemplo 1, número de frases nos anúncios de propaganda, para um nível
de confiança de 95%, calcule o erro da estimativa e o intervalo de confiança.
Para um nível de confiança de c = 95%, tem-se (1 – c) = 5% e ½(1 – c) = 2,5% = 0,025.
Consultando a tabela da normal padronizada, deve-se olhar o valor de zc para 0,475.
Observe que: 0,5 – 0,025 = 0,475.
Logo zc = 1,96.
n = 54.
O desvio padrão da amostra é calculado por: 0,553
2,1333
1
)( 2__
n
XxS
i
Logo 3,154
596,1
n
SzE c .
Portanto para um nível de confiança de 95% o erro cometido na estimativa pontual da
média é de 1,3.
92
10.1 – Intervalos de Confiança para a Média
Usando uma estimativa pontual e um erro de estimativa, pode-se construir um intervalo
de confiança para um parâmetro da população.
Definição:
Dado um nível de confiança c, um Intervalo de Confiança para a média µ de uma
população é obtido por:
EX __
< µ < EX __
, isto é, [ EX __
; EX __
].
O nível de confiança c é a probabilidade de que o intervalo contenha a média µ da
população.
Exemplo 6: Construir um intervalo com 95% de confiança para o número médio de
frases nos anúncios de propagandas em revistas, ou seja, o número médio
da população. Veja exemplo 1.
No exemplo 1, vimos que 4,12__
X .
No exemplo 5, vimos que 3,1E .
Logo o intervalo para a média será: EX __
< µ < EX __
, isto é [ EX __
; EX __
].
Isto é: 11,1 < µ < 13,7 ou então [11,1 ; 13,7].
Portanto, com 95% de confiança pode se dizer que o número médio de frases em
anúncios de propaganda em revistas está entre 11,1 e 13,7.
Isto é, o número médio populacional está entre 11,1 e 13,7.
Exemplo7: Construir um intervalo com 99% de confiança para a média populacional de
frases na população de anúncios de propagandas em revistas, veja o
exemplo 1.
No exemplo 1, vimos que 4,12__
X
Para um nível de confiança de c = 99%, ou 0,99, tem-se (1 – c) = 0,01 e então
½(1 – c) = 0,005.
Consultando a tabela da normal padronizada, deve-se olhar o valor de zc para 0,495, isto
é (0,5 – 0,005).
Observe que: 0,5 – 0,005 = 0,495.
Logo zc = 2,58.
n = 54
No exemplo 5, vimos que o desvio padrão da amostra é calculado por:
0,553
2,1333
1
)( 2__
n
XxS
i
Então o erro de estimativa será: 7,154
558,2
n
SzE c
93
Logo o intervalo de confiança para a média de frases na população de anúncios será:
EX __
< µ < EX __
, isto é, [ EX __
; EX __
].
Isto é: 10,7 < µ < 14,1 ou então [10,7 ; 14,1]
Portanto, com 95% de confiança pode se dizer que o número médio populacional de
frases em anúncios de propaganda em revistas está entre 10,7 e 14,1.
Observação:
No exemplo 6 o intervalo com 95% de confiança para a média é [11,1 ; 13,7].
No exemplo 7 o intervalo com 99% de confiança para a média é [10,7 ; 14,1].
Repare que, quando se deseja um maior nível de confiança, por conseqüência tem-se um
intervalo maior.
Orientações para se obter um Intervalo de Confiança para média µ da população
1 – Com a amostra aleatória dos valores obtenha a média amostral n
x
X
n
i
i 1
__
.
2 – Se o desvio padrão da população não for conhecido, use S o desvio padrão da
amostra calculado como: 1
)( 2__
n
XxS
i.
3 – Dado um nível de confiança c determine o valor de zc consultado a tabela de
probabilidade da normal padrão. Lembre-se de que zc é o número na tabela cuja
probabilidade é igual a [0,5 – ½(1 – c)].
4 – Determine o erro máximo da estimativa da seguinte maneira:
n
zE c
ou
n
SzE c , quando n ≥ 30.
Nota: O desvio padrão poderá ser substituído por S somente se n ≥ 30.
Se n < 30 e não se conhece o valor de então o cálculo do intervalo de
confiança envolve outro método ainda não conhecido.
5 – Determine o extremo direito e o extremo esquerdo e forme o intervalo de confiança
da seguinte forma:
EX __
< µ < EX __
, ou então [ EX __
; EX __
].
94
Principais Valores para o Cálculo de Intervalos de Confiança
Confiança c Desejada Valor de zc Cálculo Intervalo de Confiança
90% 1,65
nzE c
[ EX
__
; EX __
]
95% 1,96
nzE c
[ EX
__
; EX __
]
99% 2,58
nzE c
[ EX
__
; EX __
]
Exemplo 8: O responsável pelo vestibular da Universidade São Francisco deseja estimar
a idade média da população de alunos aprovados no vestibular no ano de
2011. Em uma amostra aleatória de 20 estudantes, a idade média
encontrada foi de 22,9 anos. A partir de estudantes do vestibular no
passado, sabe-se que o desvio padrão da população é de 1,5 anos e que a
população está normalmente distribuída. Construa um intervalo de
confiança de 90% para idade média da população de estudantes.
Solução:
Tem-se os seguintes dados:
n=20; __
X =22,9 anos; = 1,5 é o desvio padrão da população
Para um nível de confiança de c = 90%, ou 0,9, tem –se (1 – c) = 0,1 e ½(1 – c) = 0,05.
Consultando a tabela da normal padronizada, deve-se olhar o valor de zc para 0,45
(0,5 – 0,05).
Logo zc = 1,645;
Então o erro de estimativa será: 55,020
5,1645,1
nzE c
.
Logo o intervalo de confiança para a média será: EX __
< µ < EX __
, isto é [ EX __
; EX __
].
Isto é: 22,35 < µ < 23,45 ou então [22,35 ; 23,45].
Portanto, com 90% de confiança pode se dizer que a idade média da população de
estudantes do vestibular da USF está entre 22,35 e 23,45 anos.
10.2 – Determinação do Tamanho de uma Amostra
Para as mesmas amostras aleatórias, à medida que o nível de confiança cresce, o
intervalo de confiança se alarga. À medida que o intervalo de confiança se alarga, a
precisão da estimativa diminui. Uma forma de aumentar a precisão de uma estimativa
sem a redução do nível de confiança é ampliar o tamanho da amostra aleatória.
95
Assim, a pergunta que se faz é:
Qual deve ser o tamanho da amostra para assegurar certo nível de confiança com um
determinado erro da estimativa?
Tamanho Mínimo de uma Amostra para Estimar a Média µ da População
Dados um nível de confiança c e um erro de estimativa E, o tamanho mínimo da amostra
necessário para estimar a média µ de uma população é dado por:
Sabe-se que n
zE c
logo o tamanho n da amostra será obtido por:
2
E
zn c
Se o desvio padrão da população for desconhecido, pode-se estimar o desvio padrão S
usando uma amostra preliminar com pelo menos 30 observações.
Exemplo 9: Para produzir um intervalo de 90% de confiança, com um erro E=1 em
qualquer dos sentidos do intervalo sabendo-se que o desvio padrão da
população é 10, qual deve ser o tamanho da amostra?
Solução:
c = 90% ou 0,9 (1 – c ) = 0,1 1/2(1 – c ) = 0,05; (0,5 – 0,05 = 0,45) zc = 1,65
= 10 e E = 1
Tem-se que: 2
E
zn c logo,
2
1
10.65,1
n = 272,25 ≈ 273.
Conclusão: Para um intervalo de 90% de confiança, a amostra deve conter 273
observações.
Exemplo 10: Resolva o exemplo 9 utilizando um intervalo de 95% de confiança.
Solução:
c = 95% ou 0,95 (1 – c ) = 0,05 1/2(1 – c ) = 0,025;
(0,5 – 0,025 = 0,475) zc = 1,96.
= 10 e E = 1
Tem-se que: 2
E
zn c logo,
2
1
10.96,1
n = 384,16 ≈ 385
Conclusão: Para um intervalo de 95% de confiança, a amostra deve conter 385
observações.
96
Oitava Lista de Exercícios
Intervalos de Confiança
1 – Quando se estima a média de uma população, é mais provável estar correto usando uma
estimativa pontual ou um intervalo de confiança? Explique seu raciocínio.
2 – Dadas as mesmas estatísticas amostrais, qual dos seguintes níveis de confiança produziria um
intervalo de confiança mais largo. Explique seu raciocínio.
a) 90%
b) 95%
c) 98%
d) 99%
3 – Qual é o efeito produzido na amplitude do intervalo de confiança quando o tamanho da amostra
é aumentado? Explique sua resposta.
a) A amplitude cresce
b) A amplitude decresce
c) A amplitude não se altera
4 – Obtenha o valor crítico zc necessário para formar um intervalo de confiança nos seguintes níveis
de confiança c:
a) c = 80% (Resp. zc = 1,28)
b) c = 85%
c) c = 75% (Resp. zc = 1,15)
d) c = 97%
5 – Dados os valores de confiança c, desvio padrão S e tamanho da amostra n, calcule o erro E
máximo.
a) c = 0,90 S = 2,5 n = 36 (Resp. E = 0,6875)
b) c = 0,65 S = 1,5 n = 50 (Resp. E = 0,197)
6 – Dados os valores abaixo, construa o intervalo de confiança para a média µ da população.
a) c = 0,90 __
X =15,2 S = 2,0 n = 60 (Resp. [14,775 ; 15,625])
b) c = 0,95 __
X = 31,39 S = 0,8 n = 82
7 – Uma amostra aleatória de 32 grelhas a gás tem preço médio de R$ 630,00 e desvio padrão de R$
56,70. Construa um intervalo de confiança para o preço médio nas seguintes situações:
a) c = 90% (Resp. [614,41 ; 647,39])
b) b = 95%
c) Qual dos intervalos de confiança é mais largo.
8 – Uma amostra aleatória de 40 custos sobre consertos de máquinas de lavar tem uma média de
R$ 100,00 por conserto e um desvio padrão de R$ 17,50. Construa um intervalo de confiança
de 95% para a média populacional.
(Resp. [94,577 ; 105,423])
9 – Como cada uma das mudanças indicadas afeta o intervalo de confiança?
a) Aumento do nível de confiança
b) Aumento do tamanho da amostra
c) Aumento do desvio padrão
97
10 – Numa amostra de 30 empregados de uma empresa o salário médio semanal foi de R$ 180,00
com um desvio padrão de R$ 14,00. Ache um intervalo com 95% de confiança para o salário
médio da população.
(Resp. [175,00 ; 185,00])
11 – Um analista do departamento de pessoal de uma empresa deseja estimar o número médio de
horas de treinamento dado para o pessoal de uma divisão da empresa. Com base nos
treinamentos em outras divisões, sabe-se que o desvio padrão é de 20 horas. Qual deve ser o
tamanho da amostra de treinamentos para se obter um intervalo de 90% de confiança,
admitindo-se um erro máximo de 3 horas para a estimativa da média de horas de treinamento.
(Resp. n = 120)
12 – O gerente de uma lanchonete no aeroporto de Viracopos deseja estimar o valor médio de
gastos por cliente. Com base em dados da mesma loja em outros aeroportos, sabe-se que o
desvio padrão dos gastos por cliente é de R$ 8,00. Qual deve ser o tamanho da amostra para
se obter o intervalo de 90% de confiança para a média dos gastos, admitindo um erro máximo
de R$ 2,50?
(Resp. n = 28)
13 – O diâmetro de um artigo produzido em série segue distribuição normal com desvio padrão
σ = 3. Com base numa amostra aleatória de 25 unidades obteve-se um valor médio de 48 para
o diâmetro. Construa um intervalo de confiança a 90% para o valor médio do diâmetro
universo de peças.
14 – A duração da vida de uma peça de equipamento é tal que σ = 3 horas. Foram amostradas
aleatoriamente 100 peças, obtendo-se uma média de 500 horas. Construa um intervalo de
confiança para a verdadeira média da peça com um nível de 95% de confiança.
15 – Supondo que o tempo de duração de certas lâmpadas apresenta uma distribuição normal de
desvio padrão de 100 horas, e admitindo-se um grau de confiança de 90%, qual deverá ser o
tamanho da amostra para que o erro na estimativa da duração média não seja superior a 10
horas?
16 – Se fossem retiradas 200 amostras de tamanho 40 a partir da mesma população, de modo que
com elas fossem construídos 200 intervalos com 99% de confiança para a média da
população, quantos destes intervalos se esperaria que contivessem o verdadeiro valor da
média população em análise?
17 – Numa prova de probabilidade e estatística, uma amostra de 150 alunos da faculdade obtiveram
uma média de 77,6 com um desvio padrão de 14,2. Ache um intervalo de 80% de confiança da
média de probabilidade e estatística para toda a faculdade.
98
RESUMO DAS FÓRMULAS Media
Média Aritmética: n
xn
ii
X
1___
Média Aritmética Ponderada:
n
ii
i
n
ii
f
fx
X1
1___
Média Geométrica: nnxxxXg ...21
____
Média Geométrica Ponderada: i nf f
n
ffxxxXg ...21
21
____
Média Quadrática: n
xxx nXq22
2
2
1
___...
Média Quadrática Ponderada:
i
ii
f
fxpXq
2___
Moda
Termo de maior freqüência
Moda para Dados Agrupados
a) Sem Intervalo de Classe: Intervalo com maior freqüência
b) Com intervalo de Classe: *
21
1* hDD
DlMo
Mediana
Mediana para Dados não Agrupados
a) Série com número impar de termos: 2
1
nMd
b) Série com número par de termos: 2
)12
(2
nn
Md
Mediana para Dados Agrupados
a) Sem intervalo de classe
n é impar: 2
1
ifMd n é par:
2
122
ii ff
Md
b) Com intervalo de classe
n par ou impar: *
*
*2
f
hFaaf
lMd
i
Quartis para Dados Agrupados: Q1; Q2; Q3 (Q2 = Md)
*
*
*4
1f
hFaaf
lQ
i
*
*
*4
2
2f
hFaaf
lQ
i
*
*
*4
3
3f
hFaaf
lQ
i
99
Medias de Dispersão ou Variabilidade
Amplitude Total: AT = (valor máximo - valor mínimo).
Desvio Médio Absoluto
a) Para Dados não Agrupados
Usando a média: n
Xx
Dmi
___
Usando a mediana:
n
MdxDm
i
b) Para Dados Agrupados
Usando a média:
i
ii
f
fXx
Dm
*___
Usando a mediana:
i
ii
f
fMdxDm
*
Desvio Padrão
a) Para Dados não Agrupados
Amostra: 1
)( 2__
n
XxS
i
População:
n
Xxi
2__
)(
b) Para Dados Agrupados
Amostra: 1
)( 2__
i
ii
f
fXx
S
População:
i
ii
f
fXx 2__
)(
Variância
a) Para Dados não Agrupados
Amostra: 1
)( 2__
2
n
XxS
i População: n
Xxi
2__
2)(
b) Para Dados Agrupados
Amostra: 1
)( 2__
2
i
ii
f
fXx
S População:
i
ii
f
fXx 2__
2
)(
Coeficiente de Variação:
XCV
___
2
ou:
X
SCV
___
2
100
Probabilidades
Probabilidade Condicional:
)(
)()/(
BP
BAPBAP
se P(B)>0
)(
)()/(
AP
BAPABP
se P(A)>0
Distribuição de Poisson: !
.)(
k
ekXP
k
Distribuição Binomial: )(..)()( xnxn
x qpxPxXP , e )!(!
!
xnx
nn
x
Intervalos de Confiança: n
zE c
Tamanho da Amostra:
2
E
zn c
101
Tabela 1. Área sob a Curva Normal Padronizada Compreendida entre os Valores 0 e Z
Z 0 1 2 3 4 5 6 7 8 9
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990 3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993 3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995 3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997 3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998 3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000
0 z
102
Trabalho de Estatística
Instruções:
Participantes: grupo de 4 alunos.
Data de entrega: Entregar no dia da Prova
Coloque uma capa de papel, contendo o nome e o RA dos participantes.
Não coloque capa plástica.
Sejam criativos, utilizem os recursos que desejarem ou que o grupo disponha para
facilitar a análise dos resultados. Computador, slides, datashow, etc.
Todos os componentes do grupo devem participar do trabalho.
Questionamentos sobre os resultados do trabalho poderão ser cobrados na prova.
Faça um levantamento de dados real, realizado através de uma pesquisa sobre
qualquer tema.
Se desejar, estratifique sua pesquisa por alguma variável que achar interessante, Ex:
sexo, nível de instrução, estado civil, faixa de renda, etc.
Apresente sua pesquisa obedecendo aos seguintes itens:
a) Coloque um nome na sua pesquisa, explique o objetivo da pesquisa, o significado
dos dados coletados e como os dados foram obtidos.
b) Faça a coleta dos dados numa amostra contendo pelo menos 50 observações.
c) Coloque todos os dados levantados na pesquisa na mesma ordem em que foram
obtidos.
Para cada variável do seu trabalho, os itens d), e), f) e g) podem ser feitos numa
única tabela.
d) Construa uma distribuição de freqüência absoluta conveniente para os dados
coletados, faça um histograma e trace o polígono de freqüência.
e) Determine as freqüências absolutas acumuladas. Faça uma análise dos resultados.
f) Determine as freqüências relativas, faça um histograma e trace o polígono de
freqüências relativas. Comente os resultados.
g) Determine as freqüências relativas acumuladas. Faça uma analise dos resultados.
h) Calcule a média a mediana a moda e o desvio padrão dos dados coletados e
comente, separadamente, o significado de cada uma dessas medidas na sua
pesquisa.
i) Apresente os resultados usando gráficos, tabelas ou qualquer outro meio que achar
interessante.
Nota: a avaliação do trabalho terá um grande peso sobre o item a) e também nas
análises dos resultados obtidos em cada um dos itens.
USE A SUA CRIATIVIDADE