Apostila Estatística

81
Universidade Presbiteriana Mackenzie ESTATÍSTICA APLICADA I PROFESSORA: Grácia Maria Catelli Anacleto 1. CONCEITOS BÁSICOS: A estatística é a ciência que tem como objetivo fornecer subsídios para o planejamento e a execução de experimentos, bem como para a coleta, a descrição e a análise de dados e para a interpretação de resultados. Nesse contexto a estatística pode ser dividida em duas partes: ESTATÍSTICA DESCRITIVA: Que trata da descrição tabular, gráfica e paramétrica (relativo a parâmetro) dos dados provenientes de populações e amostras. Na verdade ela é a parte da estatística que se fundamenta por apenas descrever o comportamento dos dados, sem tirar inferências sobre os mesmos. ESTATÍSTICA INFERENCIAL: Parte dos resultados obtidos nas amostras e faz inferências para a população. Estuda a estimação e os testes sobre os parâmetros populacionais. Inferência Estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informações de uma amostra. Para se analisar os dados de forma estatística podem-se obter os resultados de duas maneiras: através de um censo ou através de uma amostragem (pesquisa em uma amostra). POPULAÇÃO: Em termos estatísticos define-se uma população como sendo um conjunto de informações que tenham, pelo menos, uma característica em comum. Exemplos: Moradores de Porto Alegre; Peças produzidas por uma máquina; Consumidores de uma marca de sabão em pó; Empresas produtoras de peças para relógios; Lagartas em uma plantação de soja; Contribuintes para a receita estadual. etc. Uma população pode ainda ser caracterizada como sendo: FINITA: É aquela população que podemos enumerar todos os seus elementos (podem ser totalizados e expressos por uma quantidade definida). Exemplo: Número de eleitores no município de Porto Alegre; Número de empresas cadastradas na Junta Comercial. etc. INFINITA: É quando a quantidade de elementos da população não pode ser expressa por uma quantidade definida de valores. 1

description

Nova Apostila de Estatística da Profª Grácia.

Transcript of Apostila Estatística

Page 1: Apostila Estatística

Universidade Presbiteriana MackenzieESTATÍSTICA APLICADA IPROFESSORA: Grácia Maria Catelli Anacleto

1. CONCEITOS BÁSICOS:A estatística é a ciência que tem como objetivo fornecer subsídios para o

planejamento e a execução de experimentos, bem como para a coleta, a descrição e a análise de dados e para a interpretação de resultados. Nesse contexto a estatística pode ser dividida em duas partes:

ESTATÍSTICA DESCRITIVA: Que trata da descrição tabular, gráfica e paramétrica (relativo a parâmetro) dos dados provenientes de populações e amostras. Na verdade ela é a parte da estatística que se fundamenta por apenas descrever o comportamento dos dados, sem tirar inferências sobre os mesmos.

ESTATÍSTICA INFERENCIAL: Parte dos resultados obtidos nas amostras e faz inferências para a população. Estuda a estimação e os testes sobre os parâmetros populacionais.

Inferência Estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informações de uma amostra.

Para se analisar os dados de forma estatística podem-se obter os resultados de duas maneiras: através de um censo ou através de uma amostragem (pesquisa em uma amostra).

POPULAÇÃO: Em termos estatísticos define-se uma população como sendo um conjunto de informações que tenham, pelo menos, uma característica em comum.

Exemplos:Moradores de Porto Alegre;Peças produzidas por uma máquina;Consumidores de uma marca de sabão em pó;Empresas produtoras de peças para relógios;Lagartas em uma plantação de soja;Contribuintes para a receita estadual. etc.

Uma população pode ainda ser caracterizada como sendo:

FINITA: É aquela população que podemos enumerar todos os seus elementos (podem ser totalizados e expressos por uma quantidade definida).

Exemplo:Número de eleitores no município de Porto Alegre;Número de empresas cadastradas na Junta Comercial. etc.INFINITA: É quando a quantidade de elementos da população não pode ser expressa por uma quantidade definida de valores. Mesmo que esta quantidade exista mas não possa ser contada por ser incomensurável.Exemplo:Peças produzidas por uma linha de produção que trabalhe 24 horas por dia. Nesse caso o tamanho da população é sempre incrementado a cada dia;Quantidade de plantas em uma mata nativa. A quantidade é tão grande que pode ser considerada infinita.

Parâmetro: São medidas obtidas através dos elementos da população.

Os símbolos são apresentados por letras grega.:

= Média, ² = Var. absoluta; = Desvio Padrão.

Estatísticas Amostrais ou Estatísticas: São medidas obtidas através dos elementos das amostras.:

Média da Amostra = X; Variância = S²;Desvio padrão amostral = S

1

Page 2: Apostila Estatística

2. ESTATÍSTICA DESCRITIVA

2.1. VARIÁVEIS E ATRIBUTOSNa investigação estatística de dados uma definição muito utilizada é a variável. Define-se variável como o resultado de um experimento. As variáveis podem ser:

VARIÁVEIS QUALITATIVAS:São aquelas usadas para descrever qualidades, categorias, etc. São também definidas como ATRIBUTOS.Exemplos:Sexo: Masculino e feminino.Cor dos olhos: Verde, azul, preto, castanho, etc.Classe de renda: Alta, média e baixa, etc.

VARIÁVEIS QUANTITATIVAS:São aquelas que descrevem quantidades e, deste modo, podem ser comparadas a conjuntos numéricos. Podem ser classificadas em discretas e contínuas.Variáveis discretas: São as variáveis usadas para descrever dados discretos, ou seja, apenas assumem valores inteiros, pois é oriunda de uma contagem. Exemplos:Número de filhos por casais;Número de Fiscais do Tesouro do Estado por setor;Quantidade de desempregados na região, etc.

Variáveis contínuas: São usadas para descrever dados contínuos, ou seja, podem assumir valores não inteiros, pois são oriundas de uma medição.Exemplos:Renda familiar;Preço de um produto;Peso, altura, etc.

2.2. DISTRIBUIÇÃO DE FREQÜÊNCIA Organização de dados estatísticos:

Os dados estatísticos coletados podem ser apresentados em forma tabular (através de tabelas ) ou gráfica (através de gráficos ). Podem também ser classificados em séries estatísticas de dados grupados ( distribuições de freqüências: por intervalos e por pontos ) ou não grupados ( séries temporais, históricas e geográficas ).

Antes de apresentar os dados nas mais diferentes formas cabe descrever quais são as normas técnicas de apresentação.

NORMAS PARA APRESENTAÇÃO TABULAR DE DADOS

Tabela é um quadro, não fechado nas extremidades, que resume um conjunto de observações.

Uma tabela compõem-se de:

a. corpo – conjunto de linhas e colunas que contêm informações sobre a variável em estudo;

b. cabeçalho – parte superior da tabela que especifica o conteúdo das colunas;c. coluna indicadora – parte da tabela que especifica o conteúdo das linhas;d. casa ou célula – espaço destinado a um só número;e. título – conjunto de informações, as mais completas possíveis, respondendo às

perguntas: O quê?, Quando?, Onde?, localizado no topo da tabela;

2

Page 3: Apostila Estatística

f. fonte – indicação da entidade responsável pelo fornecimento dos dados ou pela sua elaboração.

Séries Estatísticas

Denomina-se de séries estatísticas toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie.

Séries temporais, históricas, cronológicas ou marchas

Descrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempo variáveis.

Exemplo: Taxas de desemprego no Município de Porto Alegre 1995/2000

ANOS Taxas de Desemprego1995 9,61996 11,71997 12,51998 14,41999 16,92000 15,4

Fonte; PED-RMPA – Convênio FEE, FGTAS/SINE-RS,SEADE-SP, DIEESE E PMPA

Séries geográficas, espaciais, territoriais ou de localização

Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias.Exemplo: Taxas de desemprego na Região Metropolitana de Porto Alegre, no Município de Porto Alegre e demais Regiões Metropolitanas selecionadas – 2000

Regiões Taxas de DesempregoBelo Horizonte 17,8Salvador 26,6Recife 20,7São Paulo 17,6Porto Alegre 15,4RMPA 16,6

Fonte; PED-RMPA – Convênio FEE, FGTAS/SINE-RS,SEADE-SP, DIEESE E PMPASéries específicas ou categóricas

Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias.

Exemplo: PRINCIPAL PROBLEMA DO BRASIL EM %.

AMOSTRA REALIZADA EM SETEMBRO DE 1998 COM 12079 PESSOAS EM296 CIDADES.

3

Page 4: Apostila Estatística

PROBLEMA %DESEMPREGO 53SAÚDE 9VIOLÊNCIA/SEGURANÇA/POLÍCIA 8FOME/MISÉRIA 5EDUCAÇÃO 4CORRUPÇÃO 3ECONOMIA 2SALÁRIO 2HABITAÇÃO 1INFLAÇÃO 1REFORMA AGRÁRIA/SEM TERRA 0OUTRAS 6NÃO SABE 6Fonte: DATAFOLHA

Séries mistas

Descrevem os valores da variável, em relação a dois critérios (tabela cruzada). Exemplo1:

PERFIL DA POPULAÇÃO BRASILEIRA EM % -1998- PESQUISA AMOSTRAL DATAFOLHA-BRASIL

MA

SC

FE

M

IDA

DE

M

ÉD

IA

AT

É 1

º G

2º G

SU

P

PO

S-

GR

AD

RE

ND

A

FA

M

RE

ND

A

IND

SU

DE

ST

E

SU

L

NO

RD

ES

TE

NO

RT

E/C

-O

ES

TE

ELITE 53 47 37 0 25 67 8 3724 1601 63 16 11 9BATALHADORES 59 41 40 65 35 0 0 3943 1539 61 15 13 11REMEDIADOS 53 47 38 54 46 0 0 1692 624 55 16 18 11DESLOCADOS 49 51 32 0 83 16 1 756 394 49 18 22 11EXCLUIDOS 49 51 40 87 13 0 0 403 207 37 15 34 15 POBRES 55 45 39 91 9 0 0 752 377 56 20 13 11 DESPOSSUÍDOS 48 52 35 72 28 0 0 350 183 35 14 36 16 MISERÁVEIS 48 52 46 100 0 0 0 234 131 27 13 45 16TOTAL 50 50 38 64 28 7 1 907 413 43 15 28 13FONTE: DATAFOLHA (BASE 100,8 MILHÕES DE PESSOAS)

DISTRIBUIÇÕES DE FREQÜÊNCIAS

Os dados em distribuições de freqüências são uma maneira de apresentar informações grupadas. Neste caso a variável pode ser expressa por ponto ( um único valor ) ou por intervalo ( dentro de um intervalo de valores ). Ao se constituir uma distribuição de freqüências (DF) precisa-se descrever alguns componentes da mesma.

Tabela Primitiva

Supondo uma coleta amostral de dados relativos aos salários semanais de quarenta funcionários que compõem uma amostra de uma Empresa Z. Os valores de cada um dos salários estão listados a seguir:

SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z

166 160 161 150 162 160 165 167 164 160162 161 168 163 156 173 160 155 164 168155 152 163 160 155 155 169 151 170 164154 161 156 172 153 157 156 158 158 161

4

Page 5: Apostila Estatística

A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva ou dados brutos.

Rol

O rol é uma lista em que os valores estão dispostos em uma determinada ordem, crescente ou decrescente. Veja a seguir:

150 154 155 157 160 161 162 164 166 169151 155 156 158 160 161 162 164 167 170152 155 156 158 160 161 163 164 168 172153 155 156 160 160 161 163 165 168 173

Distribuição de Freqüência

A freqüência é o número de repetições da observação no conjunto de observações.A distribuição de freqüência de uma série de observações é uma função que representa

os pares de valores formados por cada observação e seu número de repetições.

Exemplo:

SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z

Salários semanais (R$) Freqüências150 |--- 154 4154 |--- 158 9158 |--- 162 11162 |--- 166 8166 |--- 170 5170 |--- 174 3

Total 40FONTE: PESQUISA DO SETOR DE PESSOAL

Elementos de uma Distribuição de Freqüência

- Classe

Classes de freqüência ou, simplesmente, classe são intervalos de variação da variável.

As classes são representadas simbolicamente por i, sendo i = 1, 2, 3, . . ., k (onde k é o número total de classes da distribuição).

Exemplo: O intervalo 154 |--- 158 define a segunda classe (i = 2) A distribuição é formada por seis classes, podemos afirmar que i = 6.

– Limites de Classe

Determina-se limites de classes os extremos de cada classe.

O menor número é o limite inferior da classe ( li ) e o maior número, o limite superior da classe ( ls ).

Exemplo: Na terceira classe do exemplo acima, temos: li3 = 158 e Ls3= 162

– Amplitude de um Intervalo de Classe ( h )

É a medida de intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior. Assim:

Exemplo: Calcule o intervalo de classe do exemplo acima.

5

Page 6: Apostila Estatística

– Amplitude Total ( H )

É a diferença entre o valor máximo e o valor mínimo da amostra.

Exemplo: Calcule amplitude amostral do exemplo acima.

– Ponto Médio de uma Classe ( Xi )

É o ponto que divide o intervalo de classe em duas partes iguais.

Exemplo: O ponto médio da segunda classe, em nosso exemplo, é 156.

– Freqüência Simples ou Absoluta ( fi )

É o número de observações correspondentes a uma classe.

A soma de todas freqüências é representada por:

( população ) ( amostra )

Exemplo: Para a distribuição em estudo, temos:

– Número de Classes

Pode-se utilizar a regra de STURGES, que fornece o número de classes em função do total de casos:

Onde: K é o número de classes; N ou n é o número total de observações.

Para determinar a amplitude do intervalo de classe, temos:

Exemplo: a) Se o número de observações for 500:b) Se n = 50

Truman L. Kelley, sugere os seguintes números de classes, com base no número total de observações, para efeito de representação gráfica:

n 5 10 25 50 100 200 500 1000

K 2 4 6 8 10 12 15 15

SIMBOLOGIA ENTRE OS VALORES DE CLASSE:

6

Page 7: Apostila Estatística

Inclui o valor da esquerda mas não o da direita. Inclui o valor da direita mas não o da esquerda. Não inclui nem o valor da direita, nem o da esquerda. Inclui tanto o valor da direita quanto o da esquerda.

– Tipos de Freqüências

– Freqüências Relativas simples (fri)

São os valores da razão entre as freqüências simples e a freqüência total.

Exemplo: Calcule a freqüência relativa simples da terceira classe, em nosso exemplo:

( R. 27,5 % dos funcionários recebem salário de R$ 158 até menos de R$ 162. )

– Freqüência Acumulada ( Fi )

É o total das freqüências de todos os valores inferiores ao limite superior.do intervalo de uma dada classe.

ou

Exemplo: Calcule a freqüência acumulada correspondente à terceira classe, em nosso exemplo:( R. 24 funcionários recebem salário de R$ 150 até menos de R$ 162. )

– Freqüência Acumulada Relativa ( Fri )

É a freqüência acumulada da classe, dividida pela freqüência total da distribuição.

Exemplo: Para a terceira classe, qual é a freqüência acumulada relativa?( R. 60 % dos funcionários recebem salário de R$ 150 até menos de R$ 162. )

EXERCÍCIOComplete a seguinte tabela e responda as seguintes perguntas:

SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z

Salários semanais (R$) Freqüências Xi fri % fri FI Fri

150 |--- 154 4 152 0,1 10 4 0,1154 |--- 158 9 156 0,225 22,5 13 0,325158 |--- 162 11 160 0,275 27,5 24 0,6162 |--- 166 8 164 0,2 20 32 0,8166 |--- 170 5 168 0,125 12,5 37 0,925170 |--- 174 3 172 0,075 7,5 40 1

Total 40 1 100FONTE: PESQUISA DO SETOR DE PESSOAL

a) Quantos empregados tem salário entre R$ 154, inclusive, e R$ 158? ( R. 9 )

b) Qual a percentagem de empregados cujas salários são inferiores a R$ 154? ( R.10% )

7

Page 8: Apostila Estatística

c) Quantos empregados tem salário abaixo de R$ 162? ( R. 24 )

d) Quantos empregados tem salário não inferior a R$ 158? ( R. 27 )

– Distribuição de Freqüência sem Intervalos de Classe

Quando se trata de variáveis discreta de variação relativamente pequena, cada valor pode ser tomado como um intervalo de classe.

Exemplo: Se X a variável é o número de filhos do sexo masculino de 34 famílias de quatro filhos pesquisadas, complete a tabela:

i X fi fri Fi Fri

0 2 0,0588 2 0,05881 6 0,1765 8 0,23532 10 0,2941 18 0,52943 12 0,3529 30 0,88244 4 0,1176 34 1,0000

EXERCÍCIOS

1. Conhecidas as notas de 50 alunos:84 68 33 52 47 73 68 61 73 7774 71 81 91 65 55 57 35 85 8859 80 41 50 53 55 76 85 73 6067 41 78 56 94 35 45 55 64 7465 94 66 48 39 69 89 98 42 54

Obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para intervalo das classes.

NOTAS 30 40 40 50 50 60 60 70 70 80 80 90 90 100fi 4 6 10 10 9 7 4

2. Os resultados do lançamento de um dado 50 vezes foram os seguintes

6 5 2 6 4 3 6 2 6 51 6 3 3 5 1 3 6 3 45 4 3 1 3 5 4 4 2 62 2 5 2 5 1 3 6 5 15 6 2 4 6 1 5 2 4 3

Forme uma distribuição de freqüência sem intervalos de classe.

XI 1 2 3 4 5 6fi 6 8 9 7 10 10

– Representação Gráfica

O gráfico estatístico é uma forma de apresentação dos dados, onde o objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e visual do fenômeno em estudo.

Veja alguns exemplos de gráficos:

1. POLIGONAL: Gráfico de linha ou poligonal.

8

Page 9: Apostila Estatística

2. GRÁFICO DE COLUNAS:Com os mesmos dados do exemplo anterior:

9

1990 1991 1992 1993 1994 1995 1996 1997 1998*

0

10.000

20.000

30.000

40.000

50.000

60.000

70.000

US

$

ANOS

EXPORTAÇÕES E IMPORTAÇÕES BRASILEIRAS

IMPORTAÇÕES EXPORTAÇÕES

Page 10: Apostila Estatística

3. GRÁFICO DE BARRAS:Com os mesmos dados anteriores.

4. GRÁFICO DE SETORES:

5. HISTOGRAMA:

Um histograma é uma representação gráfica de uma série de dados grupados por meio de retângulos cujas áreas são proporcionais às freqüências absolutas simples de cada intervalo (classe).

Exemplo:Número de salários mensais recebidos pelos funcionários da Empresa Beta - POA - 1999.

10

EXPORTAÇÕES E IMPORTAÇÕES BRASILEIRAS EM 1997

61.358

52.086

IMPORTAÇÕES EXPORTAÇÕES

EXPORTAÇÕES E IMPORTAÇÕES BRASILEIRAS EM 1997

20.661

21.041

20.544

25.256

33.079

49.583

53.301

61.358

27.970

0 10.000 20.000 30.000 40.000 50.000 60.000 70.000

1990

1991

1992

1993

1994

1995

1996

1997

1998*

ANOS

US

$

IMPORTAÇÕES

Page 11: Apostila Estatística

Os dados deste histograma foram obtidos a partir da seguinte tabela:

SALÁRIOS MENSAIS Número de funcionários

0 2 20 2 4 100

4 6 200 6 8 150

810 30Total 500

6. POLÍGONO DE FREQÜÊNCIAS:

É a representação gráfica de uma série de dados grupados por meio de um polígono, considerados os pontos médios de classes e as respectivas freqüências absolutas dos mesmos.

Com os dados do exemplo anterior:

Número de salários

salários.

2.4. MEDIDAS DE TENDÊNCIA CENTRAL Na maior parte das vezes em que os dados estatísticos são analisados,

procuramos obter um valor para representar um conjunto de dados. Este valor deve sintetizar, da melhor maneira possível, o comportamento do conjunto do qual ele é

11

Page 12: Apostila Estatística

originário. Nem sempre os dados estudados têm um bom comportamento, isto pode fazer com que um único valor bem represente ou não o grupo.

As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de tendência central, destaca-se as seguintes: Média aritmética, Moda e Mediana. Cada uma com um significado diferenciado, porém tendo como serventia representar um conjunto de dados.

A maneira de se obter estas medidas é um pouco diferenciada dependendo de como os dados são apresentados. Eles podem vir de forma isolada (não grupados) ou ainda ponderados (grupados em intervalos ou sem intervalo de classe, por ponto).

2.4.1. – Média Aritmética ( ou x )

É o quociente da divisão da soma dos valores da variável pelo número deles:

ou

Sendo: ou x : média aritmética Xi : valores da variável n ou N : número de valores

2.4.1.1. – Dados não-agrupados

Quando deseja-se conhecer a média dos dados não-agrupados, determinamos a média aritmética simples .

Exemplo: Sabendo-se que as vendas diárias da empresa A, durante uma semana, foram de 10, 14, 13, 15, 16, 18 e 12 unidades, tem-se, para produção média da semana: (R. 14 unidades )

2.4.1.2. – Propriedades da Média1ª Propriedade

A soma algébrica dos desvios em relação à média é nula.

No exemplo anterior, temos:Desvio em relação à média

É a diferença entre cada elemento do conjunto de valores e a média . ou

Para o exemplo dado, temos:

d1 = 10 – 14 = -4 d5 = 16 – 14 = 2d2 = 14-14 = 0 d6 = 18 – 14 = 4d3 = 13 – 14= -1 d7 = 12 – 14 = -2d4 = 15 – 14 = 1

2ª Propriedade

Somando-se (ou subtraindo-se) uma constante (c ) a de todos os valores de uma variável a média do conjunto fica aumentada (ou diminuída) dessa constante.

Somando-se 2 a cada um dos valores da variável do exemplo dado, tem-se:

y1 = 12 , y2 = 16 , y3 = 15 , y4 = 17 , y5 = 18 , y6 = 20 e y7 = 14

Calcule .3ª Propriedade

12

Page 13: Apostila Estatística

Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante ( c ), a média do conjunto fica multiplicada (ou dividida) por essa constante.

ou

Multiplicando-se por 3 cada um dos valores da variável do exemplo dado, obtem-se:

y1 =30 , y2 = 42 , y3 = 39 , y4 = 45 , y5 = 48 , y6 = 54 e y7 = 36

Calcule = 422.4.1.4 – Dados Agrupados

2.4.1.4.1 – Sem intervalos de classe

As freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que leva a calcular a média aritmética ponderada .

( população ) ( amostra )

Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, adotando-se a variável “número de

filhos do sexo masculino”, determine a média.

N.º de Meninos fi

0 21 62 103 124 4

= 34

2.4.1.4.2. – Com intervalos de classe

Convenciona-se que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determina-se a média aritmética ponderada.

( população ) ( amostra )

onde Xi é o ponto médio da classe.

Exemplo: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS

FUNCIONÁRIOS DA EMPRESA Z Salários semanais (R$) Freqüências

150 |--- 154 4154 |--- 158 9158 |--- 162 11162 |--- 166 8166 |--- 170 5170 |--- 174 3

Total 40FONTE: PESQUISA DO SETOR DE PESSOAL

13

Page 14: Apostila Estatística

EXERCÍCIOS

1 – Calcule a média aritmética das seguintes distribuições amostrais:

a) Classes 30 |--- 50 |--- 70 |--- 90 |--- 110 |--- 130

fi 2 8 12 10 5

b) Consumo (kwh) 5 |--- 25 |--- 45 |--- 65 |--- 85 |--- 105 |--- 125 |--- 145 |--- 165

N.º de Usuários 4 6 14 26 14 8 6 2

c) Custos (R$) 450 |--- 550 |--- 650 |--- 750 |--- 850 |--- 950 |--- 1050 |--- 1150

fi 8 10 11 16 13 5 1

Respostas: a) x = 84,3, x = 79,5 Kwh x = R$ 754,69

2.4.2. – Moda ( Mo )

A moda de uma distribuição é o valor da variável que tem a maior freqüência absoluta simples, quer dizer aquele valor que aparece mais [mais se repete]. Existem algumas situações nas quais não existe moda, isto é, todos os valores da variável só aparecem uma vez, não se repetem. Em outras situações pode-se ter mais de uma moda, isto é, quando dois ou mais valores da variável têm maior freqüência [freqüências iguais], neste caso diz-se que o conjunto é bimodal. Pode-se ter três, quatro, etc. Nestes casos é difícil escolher a moda como um representante do grupo, uma vez que teremos muitos representantes.

Para que se possa obter o valor da moda é necessário que os dados estejam no mínimo em escala nominal, quer dizer, com qualquer nível de mensuração podemos obter o valor da moda, uma vez que ela é oriunda apenas de uma contagem. Portanto, a moda é o valor que ocorre com maior freqüência em uma série de valores.

Exemplo: - o dono do restaurante vai preparar mais o filé de maior saída;- maioria tirou “C” numa turma;- o proprietário da loja de sapato vai comprar mais os números de maior saída.

2.4.2.1 – Dados não-agrupados

A moda é facilmente reconhecida: basta procurar o valor que mais se repete.

Exemplo: A série de dados: 7, 8, 9, 10, 10, 10, 11, 12, 12, 12, 12, 13, 15 tem moda igual a 12 .

Amodal : são as séries nas quais nenhuma valor apareça mais vezes que outros.

Exemplo: 3, 5, 8, 10, 13.

Multimodal : é uma série que possui dois ou mais valores modais.

Exemplo: Xi = 2 3 4 4 4 5 6 7 7 7Mo1 = 4 Mo2 = 7

2.4.2.2. – Dados agrupados

2.4.2.2.1 – Sem intervalos de classe

É o valor da variável de maior freqüência.

Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos (ver página 14), indique a moda dessa distribuição. R: = 3

14

Page 15: Apostila Estatística

2.4.2.2.2 – Com intervalos de classe

A classe que apresenta maior freqüência é denominada classe modal .

O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta .

Há, para o cálculo da moda, outros métodos mais elaborados, como, por exemplo, o que faz uso da fórmula de CZUBER :

na qual:li : Limite inferior de classe modal.h : Amplitude da classe modal.D1: fMo – f ant : freqüência simples da classe modal menos a freq. anterior.D2: fMo – f post : freqüência simples da classe modal menos a freq. posterior.

Exemplo:

Calcule a moda da seguinte distribuição pela fórmula de Czuber:SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS

SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z Salários semanais (R$) Freqüências

150 |--- 154 4154 |--- 158 9158 |--- 162 11162 |--- 166 8166 |--- 170 5170 |--- 174 3

Total 40FONTE: PESQUISA DO SETOR DE PESSOAL

R: R$ 159,6

2.4.3. – Mediana ( Md )

É o número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem.

Para que se possa obter o valor da mediana os dados têm que estar em uma escala de medida no mínimo ordinal, uma vez que precisa-se ordená-los.

A mediana é o valor que divide o conjunto ao meio, isto é, concentra antes e depois de si, 50% das observações ordenadas. Ao contrário da média aritmética a mediana não sofre influência quando temos no conjunto valores discrepantes [ tanto para mais como para menos ]. Neste caso a mediana pode melhor representar um conjunto do que a média aritmética, porém não tem o mesmo significado que aquela. A mediana pode ou não pertencer ao conjunto do qual ela é originária, vai pertencer sempre que o conjunto tiver um número ímpar de informações e vai ou não pertencer quando o conjunto tiver um número par de observações. Com isso já podemos ver que a quantidade de observações influi na maneira pela qual vamos encontrar o valor da mediana.

2.4.3.1. – Dados não-agrupados

Estando ordenados os valores de uma série e sendo n o número de elementos da série, o valor mediano será, quando n for:

impar : o termo de ordem ;

par : a média aritmética dos termos de ordem e .

Exemplo 1: Dada a série de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, identifique a mediana.

15

Page 16: Apostila Estatística

Md = 10

Exemplo 2: Dada a série de valores: 2, 6, 7, 10, 12, 13, 18, 21, calcule a mediana.Md = 11

O valor da mediana pode coincidir ou não com um elemento da série.

2.4.3.2. – Dados agrupadosPara o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é dada por:

2.4.3.2.1 – Sem intervalos de classe

É o bastante identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada.

Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino, determine a mediana:

N.º de Meninos fi

0 21 62 103 124 4

= 34 R: 2 meninos

No caso de existir uma freqüência acumulada (Fi), tal que:

a mediana será dada por: isto é, a mediana será a média aritmética entre o valor

da variável correspondente a essa freqüência acumulada e a seguinte.Exemplo: Determine a mediana da distribuição abaixo:

Xi fi Fi

12 114 215 116 217 120 1

R: Md = 15,5

2.4.3.2.2 – Com intervalos de classe

Classe mediana é aquela correspondente à freqüência acumulada imediatamente superior a .

Em seguida, emprega-se a fórmula:

onde: li Md = Limite inferior da classe da mediana. fi Md = Freqüência simples da classe da mediana. h = amplitude da classe da mediana.

Fant = Freqüência acumulada anterior a classe da mediana. Exemplo: Calcule a mediana da seguinte distribuição:

16

Page 17: Apostila Estatística

SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z

Salários semanais (R$) Freqüências150 |--- 154 4154 |--- 158 9158 |--- 162 11162 |--- 166 8166 |--- 170 5170 |--- 174 3

Total 40FONTE: PESQUISA DO SETOR DE PESSOAL

R: Md = R$ 160,54

No caso de existir uma freqüência acumulada exatamente igual a , a mediana será o limite

superior da classe correspondente.Exemplo:

i Classes fi Fi

0 |--- 10 110 |--- 20 320 |--- 30 930 |--- 40 740 |--- 50 450 |--- 60 2

26

EXERCÍCIOS1 – Considerando os conjuntos de dados calcule a média, a mediana e a moda.

a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 R: X = 5,1 Md = 5 mo = 5b) 20, 9, 7, 2, 12, 7, 20, 15, 7 R: X = 11 Md = 9 mo = 7c) 51,6; 48,7; 50,3; 49,5; 48,9 R: X = 49,8 Md = 49,5 amodal d) 15, 18, 20, 13, 10, 16, 14 R: X = 15,1 Md = 15 amodal

2.5. MEDIDAS DE DISPERSÃO

2.5.1. – Dispersão ou Variabilidade

A média, ainda que considerada como um número que tem a faculdade de representar uma série de números não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto.

Considerando os seguintes conjuntos de valores das variáveis X, Y e Z:

X: 5, 5, 5, 5, 5.Y: 3, 4, 5, 6, 7.Z: 5, 0, 10, 8, 2.

Calculando a média aritmética de cada um desses conjuntos, obtem-se: 5 .

Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno do valor da média, pode-se dizer que o conjunto Xi apresenta dispersão ou variabilidade nula e que o conjunto yi apresenta uma dispersão ou variabilidade menor que o conjunto zi.

Para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua média, é necessário recorre às medidas de dispersão. Dessas medidas, estudaremos: a .variância absoluta, o desvio padrão e o coeficiente de variação ou de variabilidade .

2.5.2. – Variância ( ² ou s² ) e Desvio Padrão ( ou s )

17

Page 18: Apostila Estatística

A amplitude total e o desvio médio também são medidas de variação, no entanto a variância e o desvio padrão levam em consideração a totalidade dos valores da variável em estudo sem utilizar a idéia de módulo, o que faz delas índices de variabilidade bastante estáveis e os mais empregados.

A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios.

Dados não agrupados Dados agrupados

ou ( população )

ou ( amostra )

ou

( população )

( amostra )

Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente.

Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas, denominada desvio padrão, definida como a raiz quadrada da variância.

( população )

( amostra )

Tanto o desvio padrão como a variância são usados como medidas de dispersão ou variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha em vista.

A variância é uma medida que tem pouca utilidade na estatística descritiva, porém é extremamente importante na inferência estatística e em combinações de amostras.

Para o cálculo do desvio padrão, considera-se os seguintes casos:2.5.2.1. – Dados não-agrupados

( população ) ou

( amostra )

Observe como exemplo, o conjunto de valores da variável populacional x:

40, 45, 48, 52, 54, 62, 70

O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas:

Xi xi2

R: = 9,49

18

Page 19: Apostila Estatística

Exemplo: Calcule o desvio padrão, dados os valores da população: 8, 10, 11, 15, 16, 18R: = 3,56

2.5.2.2. – Dados Agrupados

– Sem intervalo de classe

Como, neste caso, temos a presença de freqüências, deve-se levá-las em consideração, resultando a fórmula:

( população ) ou

( amostra )

Exemplo: Calcule o desvio padrão da seguinte distribuição amostral:

Xi fi Xi fi X²i fi

0 2 0 01 6 6 62 12 24 483 7 21 634 3 12 48

30 63 165

R: s = 1,06

– Com intervalos de classe

Exemplo: Calcule o desvio padrão da tabela abaixo.SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS

FUNCIONÁRIOS DA EMPRESA Z Salários semanais (R$) Freqüências

150 |--- 154 4154 |--- 158 9158 |--- 162 11162 |--- 166 8166 |--- 170 5170 |--- 174 3

Total 40FONTE: PESQUISA DO SETOR DE PESSOAL

R: s = R$ 5,64 As fórmulas apresentadas abaixo, para o cálculo do desvio padrão, só não são o método

usualmente mais prático, como também mais preciso. Quando a média não é exata e tem de ser arredondada, cada desvio fica afetado ligeiramente do erro, devido a esse arredondamento. O mesmo acontece com os quadrados, podendo os resultados do cálculo ser menos exatos.

Dados não agrupados Dados agrupados

ou ( população ) ou

ou ( amostra )

2.5.2.3 - Propriedades

19

Page 20: Apostila Estatística

1º) Somando-se (ou subtraindo-se) uma constante ( c ) a (de) todos os valores de uma variável, o desvio padrão não se altera:

2º) Multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado por essa constante:

ou

3º) Em se tratando de uma distribuição normal, observa-se que entre os limites proporcionados por:a) , estão contidas cerca de 68% das informações;b) 2, estão contidas cerca de 95% das informações;c) 3, estão contidas cerca de 99% das informações.

2.5.3. – Coeficiente de Variação ( para população ou g para amostras )

É a caracterização da dispersão ou variabilidade dos dados em termos relativos a seu valor.

ou

Exemplo 1: Determine o coeficiente de variação da distribuição de freqüência da página anterior:R: g = 3,5%

Exemplo 2: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos:

s Estaturas 175 cm 5,0 cm

R: g1 = 2,86% < g2 = 2,94% Pesos 68 kg 2,0 kg

EXERCÍCIOS

1 – Calcule os desvios padrões dos conjuntos de dados amostrais :a) 1, 3, 5, 9 R: s = 3,42b) 20, 14, 15, 19, 21, 22, 20 R: s = 3,07c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2 R: s = 3,30d) -10, -6, 2, 3, 7, 9, 10 R: s = 7,60

2 – Calcule os desvios padrões das distribuições:

a) Xi 2 3 4 5 6 7 8 R: s = 1,54

fi 1 3 5 8 5 4 2

3 – Dada a distribuição relativa a 100 lançamentos de 5 moedas simultaneamente: N.º de Caras 0 1 2 3 4 5 R: s = 1,13

Freqüências 4 14 34 29 16 3 Calcule o desvio padrão.

– Calcule o desvio padrão da distribuição:

Classe 2 |--- 6 6 |--- 10 10 |--- 14 14 |--- 18 18 |--- 22fi 5 12 21 15 7

R: s = 4,485 – Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio padrão, 0,80. Em Estatística, entretanto, o grau médio final foi 7,3 e o desvio padrão, 0,76. Em que disciplina foi maior a dispersão? R: Estatística

20

Page 21: Apostila Estatística

6 – Medidas as estaturas de 107 indivíduos, obtivemos = 162,2 cm e s = 8,01 cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso? R: Estatura

7 – Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão de 5,97 cm. Outro grupo de 125 moças tem um estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo?8 – Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação de 3,3 %. Qual o desvio padrão desse grupo? R: 3,72% e 3,71% ; o segundo

9 – Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e g = 2,9 % . Determine a média da distribuição. R: 51,72

3. NÚMEROS ÍNDICES

3.1. RELATIVOS E ÍNDICES

3.1.1. Conceito e aplicaçõesNúmeros índices são medidas estatísticas usadas para mostrar as diferentes

variações da variável, ou variáveis em relação ao tempo, a localização, rendimento ou outras características.

Um conjunto de números índices com determinada característica chama-se de série de índices.

Os números índices servem para comparar custos referentes à alimentação, custo de vida e produção de uma região, durante um período com os de outro período ou outra região. Normalmente são utilizados nos negócios e na economia, porém também têm sua utilidade na educação, saúde, segurança, etc.

Com finalidade financeira e econômica, os índices fornecem parâmetros para as previsões e informações gerais freqüentemente utilizadas nos negócios. No Brasil encontram-se índices de salários, de produção, de desemprego, custo de vida e outros. Os índices mais conhecidos são o ÍNDICE GERAL DOS PREÇOS (IGP), calculado pela Fundação Getúlio Vargas, e o ÍNDICE DE PREÇO AO CONSUMIDOR ( IPC), calculado pelo IBGE. Nos contratos de trabalho, torna-se comum o uso de cláusulas de indexação que prevêem aumentos automáticos de salários correspondentes ao acréscimo do custo de vida.

Pode-se dizer que o número índice é um indicador de tendência central de um conjunto de variáveis, em duas ou mais situações, pretendendo refletir o comportamento de modo aproximado de determinadas variáveis.

Normalmente a “cesta de produtos”, usualmente adotada para o cálculo do índice do custo de vida, inclui o custo da:

- alimentação;- vestuário;- habitação;- educação;- transportes;- gastos gerais.Há limitação no cálculo destes índices, e pode-se dizer que eles funcionam bem

nos períodos de prosperidade e depressão moderadas, porém, falham durante uma forte depressão.

3.2. ÍNDICE DE UM BEM3.2.1. Relativos de preço

É um indicador que fornece a variação dos preços de uma mercadoria ou conjunto de mercadorias, entre dois tempos ou espaços distintos.

É a relação entre o preço de uma única utilidade , em um período determinado, e o de outro período chamado básico de referência.

21

Page 22: Apostila Estatística

Se os preços não se mantêm constantes em um período, pode-se obter uma média adequada para expressar esta variação.

Seja:Po = preço da utilidade durante o período básicoPt = preço da utilidade durante o período considerado

Preço relativo = x 100

Representa-se por: Pt,n

De maneira geral Pa e Pb são preços de uma utilidade durante os períodos a e b respectivamente.

O preço relativo do período b, referido ao período a é definido por:

Pb/Pa e notado por: Pa,b =

Ex.: O preço médio de um litro de leite nos anos de 1999 e 2000 são respectivamente R$ 0,6 e R$ 0,8. Tomando-se 1999 como básico e 2000 como ano dado tem-se:

Preço relativo = P1999, 2000 = = = 1,33 = 133%

Significa que o preço do leite em 2000 foi de 133% do de 1999, ou seja aumentou 33%.

3.2.2. Relativo de quantidade

É o indicador que fornece a variação nas quantidades de um produto ou de um conjunto de produtos, entre dois períodos de tempo ou pontos no espaço. Por exemplo, num índice de produção a expressão é a seguinte:

o,t = x 100

3.3. OS ÍNDICES DE LASPEYRES E DE PAASCHE3.3.1. ÍNDICES PONDERADOSOs índices simples apresentam algumas desvantagens, em especial, a

inexistência de pesos diferentes para cada utilidade que os compõem, de acordo com sua importância relativa.

A ponderação utilizada nos métodos a seguir baseia-se na participação de cada bem no valor transacionado total, mediante a fixação do peso na época básica ou peso variável na época atual.

3.3.2. Índice de Laspeyres (época básica)Constitui uma média ponderada de relativos, sendo os fatores de ponderação

determinados a partir de preços e de quantidades da época básica.

3.4.2.1. Índice de Preço ILPo, t

ILPo,t =

3.4..2.2. Índice de Quantidade(permuta-se P por q)

ILQo,t =

22

Page 23: Apostila Estatística

No Índice de Preço a diferença da importância gasta deve-se a variação nos preços, e no índice de quantidade a variação se deve a variação nas quantidades adquiridas, uma vez que os preços permanecem constantes.

Exemplo: Com os dados da tabela abaixo e considerando o ano de 2000 como base, determine um índice de preço e de quantidade consumida, usando o método de Laspeyres .

Artigos 2000 2001 2002Preço médio

Quantidadeconsumida

Preço médio

Quantidadeconsumida

Preço médio

Quantidadeconsumida

açúcararrozfeijão

235

432

246

525

368

636

Índice de Laspeyres de preço

ILPo,t =

ILP00,01 = 1,1852 ou 118,52%

ILP00,02 = 1,7037 ou 170,37%

Índice de Laspeyres de Quantidade

ILQo,t =

ILQ00,01 = 1,5185 ou 151,85%

ILQ00,02 = 1,8889 ou 188,89%

3.3..3. Índice de Paasche (época atual)Trata-se de uma média ponderada de relativos, sendo os pesos calculados com

base nos preços e nas quantidades dos bens da época atual. A base portanto é a época atual. É a relação do dispêndio com o componente i na época atual com o total da mesma época.

3.3..3.1. Índice de Paasche de preço

IPPo,t =

O índice mede a relação entre o dispêndio monetário necessário para adquirir bens nas quantidades e sistemas de preços da época atual e o dispêndio dado pelas quantidades da época atual aos preços vigentes na época básica.

3.3..3.2. Índice de Paasche de Quantidade

IPQo,t =

3.4. ÍNDICES DE BASE FIXA E MÓVEL

3.4.1. ÍNDICES DE BASE FIXA

23

Page 24: Apostila Estatística

São séries de números índices construídas através da fixação de um período base.

A fixação da base possui uma importância considerável já que alguns índices, geralmente, não satisfazem a propriedade circular, no caso do Índice de Laspeyres, por exemplo, ao fixar-se a base de comparação, fixa-se também a base de ponderação.

3.4.2. ÍNDICE DE BASE MÓVEL (ENCADEADA)A base, neste método, é alterada de período a período. O método consiste:a) construção de índices em elos

IO,1,I1,2. I (t-l),tb) construção de um índice em cadeia, fixando-se determinado período como

base, aplicando-se o critério circular.IO,1 = IO,1IO,2 = IO,1.I1,2IO,3 = IO,1 . I1,2. I2,3

3.5. TROCA DE BASE

A mudança de base na prática, de uma série de número, para uma base mais recente, é feita dividindo-se cada índice da série original pelo número índice correspondente à nova época base. Sob o aspecto matemático este procedimento só é válido e aplicável quando os números índices satisfazem as propriedades circular (não é válido para os índices de Laspeyres, Paasche, pois apresentam pesos variáveis, onde a mudança no período exige a mudança dos pesos).

Exemplo: A tabela a seguir apresenta a produção industrial no período de 1979 a 1990, sendo o ano de 1979 considerado a época base. Obter um novo índice adotando como básico o ano de 1983.

1) Anos Índice produção industrial

(1979 = 100)Novo índice(1983 = 100)

197919801981198219831984198519861987198819891990

10010497

112120124134125139143143134

83878193

100103112104116119119112

Fonte: Dados Hipotéticos

2) Conjugação de duas ou mais séries.Ano Índice antigo

(1980 = 100)Índice novo(1985=100)

Mudança baseíndice antigo (1985 = 100)

Índice conjugado(1985=100

19801981198219831984198519861987198819891990

10090

108160196200 100

120160210240250

5045548098

100

5045548098

100120160210240250

24

Page 25: Apostila Estatística

Os índices, na mudança de base para 1985, foram divididos por 200 e multiplicados por 100 este resultado. A última coluna fornece a série completa.

Se a série de 80 a 85 for construída com base na fórmula de Laspeyres, estaríamos admitindo que as quantidades de 1985 e não de 1980 estariam agora figurando como pesos, uma vez que neste índice, os pesos (quantidades) mudam quando mudar a base.

Pelo método de Laspeyres os I83,80 e I85,80 seriam assim expressos:

e

Mudando de base para 1985, pelo método abreviado para o ano de 1983, as expressões seriam:

0,8 ou 80%

Os valores só coincidem quando as quantidades (pesos) de 1980 forem iguais a 1985. Esse exemplo mostra as limitações do método prático.

3.6. NÚMEROS ÍNDICES EM CADEIA

São encadeamentos de números índices que satisfazem o teste circular.

Seja P1, P2 e P3 os preços de um produto em 3 períodos. Então pode-se dizer:

I (P3/P1) = I (P3/P2). I (P2/P1)

O mesmo acontece com as quantidades. E isto é denominado de encadeamentos que satisfazem o teste circular.

Os índices construídos por encadeamento somente coincidem com os de base fixa, quando a fórmula utilizada satisfizer a propriedade circular.

4. PROBABILIDADE

4.1. – Experimento Aleatório

São aqueles que não podem ser previamente determinados. Essa impossibilidade de prever-se os resultados, chamamos de acaso .

Exemplo: Lançar um dado e anotar o número que ocorrerá na face voltada para cima.

4.2. – Espaço Amostral ( E )

É o conjunto formado por todos os resultados possíveis de um experimento aleatório.

Exemplo 1: Ao se lançar um dado e observar a face superior, tem-se o espaço amostral: E = { 1,2,3,4,5,6 }

Exemplo 2: Numa partida de futebol, uma das equipes pode obter resultados tais como: vitória (v), empate (e) ou derrota (d). Tem-se então:

E = { v, e, d }4.3. – Evento

25

Page 26: Apostila Estatística

É um conjunto qualquer de resultados de um experimento aleatório. Pode-se dizer que um evento é um subconjunto do espaço amostral.

Tipos de eventos:

Evento certo – é o próprio espaço amostral.

Exemplo: Lançamento de um dado e ocorrência de um número menor ou igual a 6 na face superior.

Evento impossível – é o subconjunto vazio do espaço amostral.

Exemplo: Lançamento de um dado e ocorrência de um número maior do que 6 na face superior.

Eventos elementares – são aqueles que têm um só elemento.

Exemplo: Lançamento de um dado e ocorrência de um número ímpar maior do que 4 na face superior.

EXERCÍCIOS

1 – No lançamento de uma moeda duas vezes consecutivas, determine o número de ocorrência de:

R: E = { (C,C),(C,K),(K,C),(K,K) }a) duas coroas (c); R: 1b) duas caras (k); R:1c) exatamente uma cara; R: 2d) exatamente uma coroa; R: 2e) pelo menos uma cara; R: 3f) pelo menos uma coroa; R: 3g) no mínimo uma cara; R: 3h) no máximo uma cara. R: 3

2 - No lançamento consecutivo de dois dados de cores diferentes, um vermelho e um branco, observando-se a face superior temos o seguinte espaço amostral:

( 1 , 1 ) ; ( 1 , 2 ) ; ( 1 , 3 ) ; ( 1 , 4 ) ; ( 1 , 5 ) ; ( 1 , 6 ) ( 2 , 1 ) ; ( 2 , 2 ) ; ( 2 , 3 ) ; ( 2 , 4 ) ; ( 2 , 5 ) ; ( 2 , 6 ) E = ( 3 , 1 ) ; ( 3 , 2 ) ; ( 3 , 3 ) ; ( 3 , 4 ) ; ( 3 , 5 ) ; ( 3 , 6 ) ( 4 , 1 ) ; ( 4 , 2 ) ; ( 4 , 3 ) ; ( 4 , 4 ) ; ( 4 , 5 ) ; ( 4 , 6 ) ( 5 , 1 ) ; ( 5 , 2 ) ; ( 5 , 3 ) ; ( 5 , 4 ) ; ( 5 , 5 ) ; ( 5 , 6 ) ( 6 , 1 ) ; ( 6 , 2 ) ; ( 6 , 3 ) ; ( 6 , 4 ) ; ( 6 , 5 ) ; ( 6 , 6 )

Com base no espaço amostral acima, determine a ocorrência de números:

a) iguais nos dois dados; R: 6b) cuja soma seja 12; R: 1c) cuja soma seja menor ou igual a 12; R: 36d) cuja soma seja igual a 9; R: 4e) cuja soma seja menor que 10; R: 30f) cuja soma seja 7; R: 6g) iguais ou com soma igual a 8; R: 10h) múltiplos de 3 nos dois dados. R: 4

4.1. O CÁLCULO DA PROBABILIDADEChamamos de probabilidade de um evento A o número real P(A), tal que:

26

Page 27: Apostila Estatística

onde: n(A) é o número de elementos de A; n(E) é o número de elementos de E.

Exemplo 1: Considerando o lançamento de uma moeda e o evento A “obter cara”.

R: E = { k, c } n ( E ) = 2A = { k } n ( A ) = 1

Exemplo 2: Considerando o lançamento de um dado, vamos calcular a probabilidade do:R: E = { 1,2,3,4,5,6 }

a) evento A “obter um número par na face superior”. R: 1/2b) evento B “obter um número menor ou igual a 6 na face superior”. R: 6/6c) evento C “obter um número 4 na face superior”. R: 1/6d) evento D “obter um número maior que 6 na face superior”. R: 0/6

Pelos exemplos que acabamos de ver, podemos concluir que: Probabilidade do evento certo é igual a 1. Probabilidade do evento impossível é igual a 0. Probalidade de um evento A qualquer um número real P(A), tal que:

0 P( A ) 1

Exemplo 3: Qual a probabilidade de sair o ás de ouro quando retiramos uma carta de um baralho de 52 cartas?

R:1/52

Exemplo 4: Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52 cartas?

R:1/13

Exemplo 5: Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule a probabilidade de essa peça ser defeituosa.

R:1/3

Exemplo 6: No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5.R:1/9 Eventos Complementares ( P (A ) )

A probabilidade de não ocorrer o evento A é igual a 1 menos a probabilidade de ocorrer A, que pode ser representada por:

P (A ) = 1 – P(A)

Exemplo: A tabela a seguir, apresenta o número de bombas injetoras existentes em uma fábrica, conforme as suas características. Todas estão em caixas iguais. Escolhendo uma caixa ao acaso, determine a probabilidade dela:

Bombas Elétricas ManuaisNovas 45 30

Usadas 15 10

a) conter uma bomba nova;R:3/4b) conter uma bomba manual;R:2/5

27

Page 28: Apostila Estatística

c) não conter uma bomba elétrica nova;R:11/20d) não conter uma bomba manual usada.R:9/10

3.2. AXIOMAS E TEOREMASA probabilidade de ocorrer um evento A é representado por p(A) que satisfaz os seguintes

axiomas.1) P (A) 0

2) P (s) = 1

3) P ( A probalidade de um conjunto vazio é zero.)

4) P (AUB) = P (A) + P (B) ( teorema da soma para eventos mutuamente exclusivos)

EVENTOS MUTUAMENTE EXCLUSIVOS (DISJUNTOS):

Dois ou mais eventos são mutuamente exclusivos quando a ocorrência de um impede a ocorrência do outro. Diferentemente dos eventos complementares onde não necessariamente a união de dois eventos mutuamente exclusivos vai constituir o espaço amostral. Por isso todos os eventos complementares são mutuamente exclusivos, mas a recíproca não é verdadeira. Por exemplo, se lançarmos um dado e considerarmos os seguintes eventos: o primeiro estabelece o resultado como um número maior que dois { 3, 4 , 5 , 6} e o segundo um resultado menor que dois { 1 }. Nesse caso um número não pode ser maior e menor que dois ao mesmo tempo e a união dos dois conjuntos não forma o espaço amostral, pois o 2 está de fora. Sendo A e B evento mutuante excludentes, isto é não podem ocorrer ao mesmo por A B =

5) Se A1, A2.... An são dois eventos mutuante excludentes.

P ( A1 U A2 U A3 U.... U An U...) = P (Ai) i=1

6) P (AUB) = P (A) + P (B) – P (A B ) ( regra geral ou para eventos não exclusivos)

EVENTOS NÃO EXCLUSIVOS:

Dois ou mais eventos são não mutuamente exclusivos quando é possível ambos ocorrerem simultaneamente. Necessariamente os dois eventos não necessitam ocorrer juntos.

4.3. PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA DE EVENTOS

REGRAS DE MULTIPLICAÇÃO:

As regras de multiplicação se relacionam com a determinação da probabilidade da ocorrência conjunta de A e B, isto é a interseção de A e B.

P (A e B) = P (A B ) = P (A) . P (B) (para eventos independentes)P (A e B) = P (A B ) = P (A) . P (B / A) (para eventos dependentes)

EVENTOS INDEPENDENTES:

Diz-se que dois ou mais eventos são independentes, quando eles não exercem ações recíprocas, comportando-se cada um de maneira que lhe é própria, sem influenciar os demais. Isto é, a ocorrência de um não influencia de maneira alguma a ocorrência do outro. Lançando-se uma

28

A B

A B

Page 29: Apostila Estatística

moeda o fato de sair cara no primeiro lançamento em nada influencia a probabilidade de sair uma nova cara, ou não, em um segundo lançamento, porém, em um sorteio como o da loto, o fato de um número ter saído no primeiro sorteio já altera as probabilidades dos outros números saírem nos próximos sorteios.

EVENTOS DEPENDENTES:

Dois ou mais eventos são dependentes, quando eles exercem ações recíprocas, ou seja a ocorrência de um influencia de alguma maneira a ocorrência do outro.

O diagrama de árvore é particularmente útil como método para descrever os possíveis eventos conjuntos associados com as observações ou as tentativas seqüenciais.

Exemplo: A probabilidade de duas pessoas A e B resolverem um problema são 1/3 e 2/5, respectivamente. Sabendo que a resolução do problema é independente para A e B, calcule a probabilidade de que:(a) nenhum resolva o problema(b) pelo menos um resolva o problema (c) A resolva o problema, mas B não(d) B resolva o problema, mas A não.

Pessoa A pessoa B evento conjunto probabilidade do evento conjunto

Br Ar e Br 1/3 . 2/5

Ar Ar e Br 1/3 . 3/5

Br

Ar Br Ar e Br 2/3 . 2/5

Br Ar e Br 2/3 . 3/5

4.5. DISTRIBUIÇÃO DE PROBABILIDADE

4.5.1. Variáveis Aleatórias

É uma função com valores numéricos, cujo valor é determinado por fatores de chance .

As variáveis aleatórias são discretas ou contínuas .

Uma variável aleatória é considerada discreta quando os valores podem ser contados .

Exemplo: - Número de acidentes numa semana;- Número de defeitos de sapatos;- Número de terremotos;- Número de livros numa estante; etc.

4.5.2. Valor Esperado ou Esperança Matemática ( E (x) )

Se uma variável aleatória x com os valores x1, x2,...xn, associado as probabilidades correspondentes p(x1), p(x2),...p(xn) então o seu valor esperado é:

E(x) = x1 p(x1 ) + x2 p(x2) + .... +xn p(xn)

O valor esperado de um experimento é uma média, e pode ser calculado como:

E(x) = Xi p(Xi)

Exemplo 1: Se jogamos um dado equilibrado, qual o valor esperado numa jogada?

29

Page 30: Apostila Estatística

R.: 3,5

Exemplo 2: Um investidor julga que tem 0,40 de probabilidade de ganhar R$ 25 000,00 e 0,60 de probabilidade de perder R$ 15 000,00 num investimento. Seu ganho esperado é:

R.: R$ 10004.5.3. Desvio padrão ( (x) )

O desvio padrão é calculado com a fórmula:

Exemplo 3: Um empreiteiro faz as seguintes estimativas:

Prazo de execução Probabilidade Xi P(Xi) Xi² P(Xi)10 dias 0,20 2 215 dias 0,30 4,5 4,522 dias 0,50 11 11

17,5 17,5

O prazo esperado para execução da obra, de acordo com essas estimativas, é:R.: 17,5 DIAS.

O desvio padrão é: = 4,82

EXERCÍCIOS

1 – Dez por cento dos carros num parque de carros usados têm bateria defeituosa. Se há 82 carros no lote, qual o número esperado de carros com bateria defeituosa?R.: 8,22 – O número de chamadas telefônicas recebidas por uma mesa e suas respectivas probabilidades para um intervalo de 3 minutos são:

Número de chamadas 0 1 2 3 4 5Freqüência relativa 0,60 0,20 0,10 0,04 0,03 0,03

Em média, quantas chamadas podem ser esperadas num intervalo de 3 minutos?R.: 0,793 – O Departamento Nacional de Saúde relata que aproximadamente 15% dos adultos do país serão atingidos por determinada espécie de gripe nos próximos 12 meses. Para uma cidade de 250 000 adultos, quantos podemos esperar serem afetados?R.: 37500

4.6. – Distribuição de Probabilidade

Consideremos a distribuição de freqüências relativa ao número de acidentes diários em um estacionamento:

Número de Acidentes Freqüências Probabilidades0 22 0,731 5 0,172 2 0,073 1 0,03

Em um dia, a probabilidade de:a) não ocorrer acidente é: R.: 0,73b) ocorrer um acidente é: R.: 0,17c) ocorrerem dois acidentes é: R.: 0,07d) ocorrerem três acidentes é: R.: 0,03

30

Page 31: Apostila Estatística

Pode-se, então, escrever:Número de Acidentes (Xi) Probabilidades P(Xi)

0 0,731 0,172 0,073 0,03 1

Essa tabela é denominada DISTRIBUIÇÃO DE PROBABILIDADE .

Seja X uma variável aleatória que pode assumir os valores x1, x2,...xn. A cada Xi

correspondem pontos do espaço amostral. Associando, então, a cada valor X i a probabilidade pi

de ocorrência de tais pontos no espaço amostral tem-se um distribuição de probabilidade.

Onde, pi = 1

Exemplo 1: Considerando o espaço amostral relativo ao “lançamento simultâneo de duas moedas” e se X representa “o número de caras” que aparecem, a cada ponto amostral, construa uma distribuição de probabilidade.

Número de caras (XI) P( XI )

0 0,25

1 0,5

2 0,25

14.7. Distribuição Binomial

Requisitos:1) Um experimento repetido n vezes independentes.

2) A probabilidade de ocorrer um evento A é representado por p e é dita prob. de sucesso.

O valor de p é calculado para um experimento isolado.

3) A probabilidade de não ocorrer A é dita, prob. de insucesso e é representado por q, sendo p + q = 1

4) Seja X a variável aleatória discreta (vad) que assume os valores 0, 1, 2, ....n e representa o número de sucessos em n repetições do experimento.

Satisfeitas estas condições a P (X = x) = f (x) =

x = nº de sucessosn = nº de experimento p = probabilidade de sucesso com 1 experimento.

Ex:

1) A probabilidade de ganhar em um certo jogo é 40% em 1 rodada, se uma pessoa vai jogar 5 rodadas, qual a probabilidade de ganhar:

a) uma rodada:

P = 0,40 q = 0,60 p + q = 1 x = 1

31

Page 32: Apostila Estatística

n = 5

P(X=1)=5x 0,4x 0,1296 = 0,2592 x x (n-x)

P ((X = x) = f (1) = C . p . q n b) mais de 4 rodadas

X = 4 5 5 0

P (x>4) = (x=5) f (x) = C . 0,4 . 0,6 = 1 x 0,01024 = 0,01014 5

c) no máximo 1 rodada

X = 0 f (0) + f (1) = f (0) + f (1) 0,2592 + 0,0776 = 0,3868 0 0 5

C . 0,4 . 0,6 = 0,0776 5

d) no mínimo 2 rodadas

f (2) U f (3) U f (4) U f (5)

ou

1 - (f (0) + f (1)) = 0,6632

2. Um time de futebol tem prob. constante de vencer um jogo num torneio equivalente a 30% qual a probabilidade de vencer a maioria das partidas em um torneio constituído por 5 jogos.

P (X 3) = P (x = 3) + P (x = 4) + P (x = 5)

n = 5p = 0,30q = 0,70

3. Uma companhia que vende equipamentos eletrônicos verifica que de todas as máquinas por ela instaladas, 40% exigem novos ajustamentos após a instalação.

a) Em 4 equipamentos instalados, qual a probabilidade de pelo menos 1 equipamento necessitar ajustamento.

a) P = 0,40 q = 0,60 n = 4

p (x 1 ) = 1 - p (x = 0)

0 0 4 - 0 p (x = 0) = C p q

4 p (x 1) = 1 - 0,1292 = 0,8704

4.,7. DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE

4.7.1. A DISTRIBUIÇÃO NORMAL

32

Page 33: Apostila Estatística

Entre as distribuições teóricas de variável aleatória contínuas, uma das mais empregadas é a DISTRIBUIÇÃO NORMAL .

O aspecto gráfico de uma distribuição normal é o da figura abaixo:

Principais características:

1ª) A variável aleatória X pode assumir todo e qualquer valor real .

2ª) A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em torno da média, que recebe o nome de curva normal ou GAUSS .

3ª) A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área corresponde à probabilidade de a variável aleatória X assumir qualquer valor real.

4ª) A curva normal é ASSINTÓTICA em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcançá-lo.

5ª) Como a curva é SIMÉTRICA em torno da média, a probabilidade de ocorrer valor maior do que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5 . Escreve-se: P (X ) = P (X ) = 0,5 .

Quando existe uma variável aleatória com distribuição normal, o principal interesse é obter a probabilidade dessa variável aleatória assumir um valor em um determinado intervalo. Para calcular essa probabilidade é usada a distribuição normal padrão.

A DISTRIBUIÇÃO NORMAL REDUZIDA (PADRÃO) (Z) tem distribuição normal de média 0 e desvio padrão 1. X N ( = 0; = 1)

A tabela de distribuição normal reduzida, em anexo, apresenta a probabilidade de Z assumir qualquer valor entre a média 0 e um dado valor Z, isto é: P(0<Z<Z)

Exemplo 1: Em um exame final de Matemática, a média foi 72 e o desvio padrão 15. Determinar a variável reduzida (isto é, os graus expressos em unidades de desvio padrão) dos estudantes que obtiveram graus:

a) 60; R.: -0,8 b) 93; R.: 1,4 c) 72. R.: 0

Exemplo 2: Com referência ao exemplo 1, determinar os graus correspondentes aos escores reduzidos:

a) –1 ; R.: 57 b) 1,6. R.: 96

Exemplo 3: Dois estudantes foram informados de que alcançaram as variáveis reduzidas de 0,8 e –0,4, respectivamente, em um exame de múltipla escolha de inglês. Se seus graus foram 88 e 64, respectivamente, determinar a média e o desvio padrão dos graus do exame.

R.: 72 e 20Exemplo 4: Determinar a área limitada pela curva normal em cada um dos casos abaixo:a) Entre z = 0 e z = 1,2 R.: 0,3849b) Entre z = -0,68 e z = 0 R.: 0,2518c) Entre z = -0,46 e z = 2,21 R.: 0,6636d) Entre z = 0,81 e z = 1,94 R.: 0,1828e) À esquerda de z = - 0,6 R.: 0,2742

33

Page 34: Apostila Estatística

f) À direita de z = -1,28 R.: 0,8997g) À direita de z = 2,05 e à esquerda de z = -1,44 R.: 0,0951

EXERCÍCIOS

1 – Determinar a média e o desvio padrão de um exame, cujos graus 70 e 88 correspondem, respectivamente, os escores reduzidos –0,6 e 1,4.

R.: 75,4 e 92 – Determinar a área subtendida pela curva normal:

a) cc R.: 0,2991b) À esquerda de z = -1,78 R.: 0,0375c) À esquerda de z = 0,56 R.: 0,7123d) À direita de z = -1,45 R.: 0,9265e) Correspondente a z 2,16 R.: 0,0154f) Corresponde a -0,80 z 1,53 R.: 0,7252g) À esquerda de z = -2,52 e à direita de z = 1,83 R.: 0,0395h) Corresponde a z -1,64 R.: 0,9495i) Corresponde a -1,96 z 1,96 R.: 0,9500

Exemplo 5: Determinar o valor, ou valores, de z em cada um dos casos, nos quais as áreas referem-se às limitadas pela curva normal:

a) A área entre 0 e z é 0,3770.b) A área à esquerda de z é 0,8621.c) A área entre –1,5 e z é 0,0217.Exemplo 6: O peso médio de 500 estudantes do sexo masculino, de uma determinada

universidade, é 75,5 kg e o desvio padrão é 7,5 kg. Admitindo-se que os pesos estão distribuídos normalmente, determinar quantos estudantes pesam:

a) entre 60 e 77,5 kg; R.: 294 estudantesb) mais do que 92,5 kg. R.: 6 estudantes

Exemplo 7: Determinar quantos estudantes do exemplo 6 pesam:

a) menos do que 64 kg; R.: 32 estudantesb) 64 kg; R.: 0 estudantes

Exemplo 8: A média dos diâmetros internos de uma amostra de 200 arruelas produzidas por uma certa máquina é 0,502 polegadas e o desvio padrão é 0,005 polegadas. A finalidade para a qual essas arruelas são fabricadas permite a tolerância máxima, para o diâmetro, de 0,496 a 0,508 polegadas; se isso não se verificar, as arruelas serão consideradas defeituosas. Determinar a percentagem de arruelas defeituosas produzidas pela máquina, admitindo-se que os diâmetros são distribuídos normalmente.

R.: 0,2302

5. AMOSTRAGEM

5.1. CENSO X AMOSTRA

População:

Qualquer conjunto que possui, pelo menos, uma característica em comum.

Exemplo: Produção de peças da Indústria X.

A população pode ser finita ou infinita.

População finita:

É aquela em que é possível enumerar todos os seus elementos.

População infinita:

É aquela em que não é possível enumerar todos os seus elementos.

Uma população finita pode ser transformada, mediante processos operacionais, em infinita.

Ex.: Retirar as fichas de uma urna e, depois de cada extração, repô-las.

34

Page 35: Apostila Estatística

Pesquisa estatística: Pode ser feita através de dois processos: censo e amostragem. CENSO: Quando é investigada todas (sem exceção) as unidades de uma população.

AMOSTRA: Uma amostra é qualquer subconjunto não vazio de uma população. Pode ser uma amostra com caráter científico: probabilística ou sem caráter científico: não probabilística.

AMOSTRAGEM: É o processo através do qual é selecionada uma amostra de uma população. Nesta etapa define-se quais unidades populacionais que irão fazer parte da amostra.

As razões pelas quais opta-se por realizar uma pesquisa amostral ao invés de um censo são:

Economia de tempo;

Economia de custos;

Economia de trabalho;

Quando a população for infinita ou muito grande;

Quando a investigação for destrutiva.Apesar do processo amostral apresentar estas vantagens sobre o processo

censitário ele acaba perdendo em precisão, pois é estudado apenas um subconjunto da população. Nesse caso todo resultado de amostra está sujeito a um erro amostral, o que não ocorre no censo, porém este custa mais caro, leva mais tempo e dá mais trabalho, principalmente quando a população é muito grande.

5.2. AMOSTRAGEM PROBABILÍSTICA E SUBJETIVAO método de amostragem, como foi dito, é classificado em:

PROBABILÍSTICO: Quando todos os elementos da população têm probabilidade conhecida, e diferente de zero, de ser incluídos na amostra. Nesse caso este tipo de amostragem é o que dá a melhor garantia de representatividade da amostra em relação a população.

NÃO-PROBABILÍSTICO: Quando a seleção é subjetiva, ou seja, a escolha dos elementos da amostra é feita de forma não-aleatória, justificadamente ou não. A chance que cada elemento tem de ser selecionado na amostra é desconhecida. Decorre disso que as probabilidades de serem identificadas características semelhantes da amostra e da população são pequenas ou inconsistentes.

5.3. O MÉTODO DE AMOSTRAGEM ALEATÓRIA SIMPLES1. Conceitos Básicos:Um processo de amostragem pode ser desenvolvido de duas maneiras distintas, são elas:

AMOSTRAGEM COM REPOSIÇÃO:Uma amostra é dita com reposição quando as unidades amostrais são devolvidas à

população, após cada extração.AMOSTRAGEM SEM REPOSIÇÃO:Quando a unidade amostral que é investigada não volta novamente para a

população. Nesse caso utilizamos este tipo de amostragem para pequenas amostras.A diferença básica entre um tipo e outro de amostragem é a possibilidade de um

elemento ser ou não considerado mais de uma vez na amostra que está sendo produzida.

Processo de amostragem aleatória simples: (AAS) É aquele em que a amostra é dita aleatória simples.

Definição: Uma amostra aleatória simples ( A A S ) é aquela em que cada elemento da população tem mesma chance de pertencer a amostra. Para o processo de AAS é necessário: 1º) ter um cadastro; 2º) a variância da população deve ser pequena; 3º) cada elemento deve ter igual probabilidade de seleção.

Tipos de amostragem aleatória simples: a) A A S com reposição; b) A A S sem reposição.

Número de A A S que se obtêm de uma população:

a) Finita

- Adotando o processo A A S com reposição.

35

Page 36: Apostila Estatística

K = Nn onde N é o tamanho da população, n é o tamanho da amostra.

- Processo de A A S sem reposição

b) Infinita: Não se conhece o número de elementos da população.Teremos infinitas amostras

5.4.Distribuição Amostral de MédiasSe a partir de uma certa população, calcula-se a média de todas as amostras possíveis de mesmo tamanho n, teremos uma distribuição amostral de médias.

Propriedades de uma distribuição amostral de médias:1º Propriedade:

A expectância de X é a média da população. E (X) = 2º Propriedade:

O desvio padrão da distribuição amostral de medias de uma população infinita é da pela expressão.

3ºPropriedade: O desvio padrão da distribuição de media considerando uma população finita é dado pela expressão.

onde ,

é dito fator de correção para populações finitas.

Exercícios sobre amostragem:

1.Uma população consiste de 5 números: 1, 3, 5, 7 e 9.

a) Determine os parâmetros média e variância absoluta.b) Determine o número de amostras possíveis de tamanho 2, que podemos obter da

população em questão, adotando-se o esquema de AAS, sem reposição. c) Considerando a variável x, baseado em todas as amostras possíveis sem reposição,

determine a média e o desvio padrão da distribuição amostral de x. a)

= 2,83

b)

Adotando-se o processo de A A S sem reposição com amostras de tamanho 2, tem-se:

1, 3 1, 5 1, 7 1, 9 3, 5 3, 7 3, 9 5, 7 5, 9 7, 9

amostras Médias amostrais P(x) x i . P(x) x² i . P(x)1;3 2,0 0,10 0,20 0,40

36

Page 37: Apostila Estatística

1;5 3,0 0,10 0,30 0,901;7 4,0 0,10 0,40 1,601;9 5,0 0,10 0,50 2,503;5 4,0 0,10 0,40 1,603;7 5,0 0,10 0,50 2,503;9 6,0 0,10 0,60 3,605;7 6,0 0,10 0,60 3,605;9 7,0 0,10 0,70 4,907;9 8,0 0,10 0,80 6,40

1 5,00 28,00

c)

2. Uma variável apresenta média 56 e variância 6,7. Considerando todas as amostras possíveis de tamanho 100 que podem ser selecionadas dessa população, utilizando o processo de AAS sem reposição, determine.

a) A média da distribuição amostral de médias.b) A variância absoluta da distribuição amostral de médias.c) O desvio padrão da distribuição amostral de médias.

= 56²= 6,7

n = 100

a)

b)

c)

4º) Propriedade Seja X uma variável aleatória normalmente distribuída com média e desvio

padrão . A variável aleatória x obtida de todas as amostras possíveis de tamanho n, terá distribuição normal com média E (X) = e desvio padrão x. Portanto podemos associar a V.A. X uma V.A. padronizada:

3. Sabendo-se que o peso, dado em gramas, de determinado produto, produzido por uma fábrica está normalmente distribuído com média 400 e desvio padrão 40g, determinar.

a) A probabilidade da média de 1 amostra de tamanho 100, pertencer ao intervalo [390;410].

37

Page 38: Apostila Estatística

b) A probabilidade da média de 1 amostra de tamanho 25, pertencer ao intervalo [390;410].

c) A probabilidade da média de 1 amostra constituída por 400 artigos pertencer ao intervalo [390;410].

= 400; = 40a) P (390 x 410) = P (Z1 Z Z2)

n = 100

-2,5 2,5

0,9938 - 0,0062 = 0,9876

b) n = 25 _ P (390 x 410) = 0,78871

-1,25 1,25

_ c)P (390 x 410)

38

Page 39: Apostila Estatística

-5 5

d) Quanto maior a amostra mais chance existe para acertar o valor do parâmetro.

5.5. Distribuição amostral da proporção

Parâmetro proporção da populaçãoEstatística proporção P da amostra

P P P p p E (p) = P P P

5.5.1. Propriedades:

1ªPropriedade: E (p) = : a expectativa ou média da distribuição amostral de proporção corresponde ao parâmetro populacional proporção.

2ªPropriedade: O desvio padrão da distribuição amostral de proporções para populações infinitas é dado pela fórmula.

3ª Propriedade: O desvio padrão da distribuição amostral de proporções para populações finitas é:

4ª Propriedade: A estatística proporção amostral P, que associa a variável padronizada Z é:

Exercício: 1. Sabendo que 80% das unidades produzidas por determinada fábrica são

classificadas como artigo de exportação. Considerando a extração de uma amostra aleatória de 64 unidades, determine a probabilidade que a proporção de unidades classificadas como artigos de exportação assumir um valor abaixo de 76%.

a) Considere o mesmo enunciado para uma amostra de 100 unidade.

= 0,8 n= 64

39

Page 40: Apostila Estatística

P ( P -,76) = P (Z - 0,8) = 0,2119 = 21,19%

a)

P (P 0,76) = P (Z -1,0) = 0,1587 15,87%

2. Numa eleição determinado candidato recebeu 46% dos votos. Determine a probabilidade de que um escrutínio efetuado em 212 votantes se obtenha a maioria em favor do candidato.

= 0,46 n = 212 1- = 0,54

E (p) = 0,46 p = 0,0342

P (p 0,5) = P (Z > 1,17) = 0,121 12,1%

6. ESTIMAÇÃO

É o processo com a finalidade de estimar parâmetros populacionais através de amostras. Com resultados calculados na amostra (estatística amostrais) estima parâmetros populacionais.

6.1. ESTIMADORES E SUAS PROPRIEDADES ACONSELHÁVEIS

Parâmetro Estatística X => E (x) = P p => E (p) = pT t => E (t) T² s² => E (s²) ²

Estimador não tendencioso:

Um estimador é dito não tendencioso se sua expectância corresponde ao valor do parâmetro. _

Ex.: X e P

Exemplo de estimadores tendenciosos:

40

Page 41: Apostila Estatística

_1- do total: t = N x

2- da variância absoluta: S²

6.2. ESTIMATIVAS PONTUAIS E INTERVALARES

6.2.1. ESTIMATIVAS PONTUAIS6.2.1.1 – O parâmetro média populacional , pode ser estimado através de um

único valor não-tendêncioso X . _

Ex.: X = 20 logo, 20 é uma estimativa de

6.2.1.2 - Parâmetro variância populacional ² através do estimados não-tendêncioso S².

Ex.: S² = 2,3, então 2,3 é uma estimativa de ².

6.2.1.3 - Parâmetro proporção , através do estimador não-tendêncioso P.

Ex.: P = 0,6 é estimativa de .

6.2.2 ESTIMATIVAS INTERVALARES DA MÉDIA E DA PROPORÇÃO POPULACIONAL

6.2.2.1. - Estimativa para a média populacional,

1- Variância populacional conhecida e população normalmente distribuída.

Intervalo genérico _ _

[ x - E x + E ] _ _ _ _

[ x - Z x x + Z x ] (fórm. 01)

E = erro absoluto de estimação = Z x

nível de confiança

Fórmulas usadas:Pop. infinita

Pop. Finita

Exercício:

41

Page 42: Apostila Estatística

1. Para uma amostra de 50 firmas tomadas de um parque industrial o n.º médio de empregados por firma é 420,4, neste parque industrial há um total de 380 firmas. Determine o interva-lo de confiança de 95% para estimar o n.º médio de trabalhadores por firma do parque industrial, admitindo-se que esta variável tem distribuição normal, com desvio padrão de 55,7.

n = 50x = 420,4N = 380 firmas

1 - = 95% = ? = 55,7x = 7,35

-1,96 1,96

95% Z = ± 1,96

X ~ N ( ,55,7²) _ _ _ _

[ X - Z. x x + Z x ]

[ 420,4 – (1,96)7,35 < 420,4 + (1,96)7,35 ]

[ 405,99 434,81 ]

2- Variância populacional desconhecida e população normalmente distribuída.

a- Amostra 30 (grande)normal ou não, pois n 30, distribuição se comporta como normal. _ _ _ _

[ x - Z (x ) x + Z ( x )]

Ex.: A empresa ABC enviou um questionário a 100 pessoas de uma população de 4000 clientes perguntando qual seria sua provável necessidade em relação a certo produto, no semestre seguinte. As respostas estão na tabela abaixo.

Número provável de unidades Número de clientes xifi fixi²

12345

20828440

20168416200

203225264

1000

100 336 1368

Construa o intervalo de confiança de 95,45% para a provável:

a) necessidade média de 4000 clientes.n = 100

42

Page 43: Apostila Estatística

N = 4000 _ _ _ _

a) [ x - Z x x + Z x ]

X = 3,36

P (Z1 Z Z2) = 0,9545 Z = 2

Z = 2 95,45%

[3,06 ; 3,66]

P [ 3,06 3,66 ] = 95,45%

b- Amostras pequenas (n < 30) a distribuição deve ser sempre “t” (variância desconhecida).

Ex.: Foi testada uma amostra de 15 cigarros de certa marca com relação ao conteúdo de nicotina, obtendo-se uma média de 22 mg e um desvio padrão de 4mg. Encontre-os limites de confiança para média de nicotina dos cigarros desta marca, considerando um nível de confiança de 95%.

1 - = 95% n = 15x = 22 S = 4Tabela tGraus de liberdade = n - 1 = 15 - 1 = 14

nível de significância = 1 - 0,95 = 0,05

t14; 0,05 => 2,145 -2,145 2,145

[19,78 ; 24,22]

6.2.2.2 - Estimativa para a proporção populacional,

Normalmente o n é maior que 100. Então, é usada a estatística z.

[ P - Z p P + Z p ]

Formulário:

Pop. infinita

Pop. finita

43

Page 44: Apostila Estatística

Onde: p = proporção na amostra e p = desvio padrão da distribuição amostral das proporções. Ex.: Deseja-se conhecer o nível de desemprego em uma certa comunidade, com este objetivo realizou-se uma amostra aleatória de 900 pessoas que indicou uma taxa de desemprego de 9%. Ache o intervalo de confiança de 90% para proporção de desemprego nesta comunidade.

n = 900taxa de desemprego => 9%= 0,9 p => Q = 1- 0,09 = 0,91

1 - = 90% Z => 1,64

[ P - Z p P + Z.p ]

[ 0,09 - 1,64 (0,00954) 0,09 + 1,64 (0,00954) ]

[ 0,0737 ; 0,106 ] = [ -7,37% ; 10, 6% ]Espera-se com 95% de confiança que este intervalo contenha a proporção populacional.

7. DIMENSIONAMENTO DA AMOSTRA 7.1. Para a estimação da média

7.1.1 - Erro fixado e ² conhecido (erro absoluto)

Z² ²no = (população infinita com repos.)

E² Quando as populações são finitas é considerado o coeficiente:

N. non =

N + no

Ex.: Deseja-se estimar a renda média dos moradores do bairro A da cidade C, sabendo-se que o desvio padrão da renda é de 300 UM. Exige-se um erro absoluto de 20 UM e uma confiança de 95% nos resultados.

a) Qual deve ser o tamanho da amostra?b) Supondo que exista 5.000 moradores no bairro A, qual o tamanho de amostra a ser

utilizado?

R: 864 e 736

7.1.2 Erro fixado e ² desconhecido (erro absoluto)

Z² S²no = (população infinita - com rep.)

N. non = (pop. finita - sem repos.)

N + noEx.: Suponha-se que em uma escola deseja-se uma estimativa da altura média dos

estudantes, com erro de 5cm de confiança de 99%. A variância das alturas é estimada em 625.a) Qual deve ser o tamanho da amostra?b) Supondo que a escola tenha 200 alunos, qual o tamanho da amostra?

7.1.3 - Erro relativo fixado e ² conhecida

44

Page 45: Apostila Estatística

_ _ ²Obs: Er = Z x x = _______

n

Z² ² no = _______ (pop. infinita com rep.)

Er² N no

n = (pop. finita - sem rep.) N + no

Ex.: Deseja-se estimar a produção média de trigo em determinada área geográfica onde o coeficiente de variação da produção é 70%. Exige-se um erro de estimação de 5% e uma confiança de 95%.

a) Quantas propriedades produtoras devem ser examinadas?b) Admitindo N = 2.000, qual o n?

R: 752 e 546

7.1.4 - Erro relativo fixado e ² desconhecida

Z² ²no = _______ (pop. infinita - com repos.)

Er²

N non = (pop. finita - sem repos.)

N + no

Ex.: 1- Quantos estabelecimentos industriais devem ser examinados a fim de se estimar o número médio de empregados por estabelecimento com erro de 10% e confiança de 95%? (coeficiente de variação do nº de empregados é estimado em 60%)

2- Admita 500 estabelecimentos, qual deve ser o tamanho da amostra

R: 138 e 108

7.3. Para a estimação da proporção

7.3.1 - Erro rel. fixado e PQ conhecidos

Z² PQ no = _______ (pop. admitida infinita - com repos.)

Er² N no

n = ______ (pop. finita - sem repos.) N + no

Ex.: Uma amostra preliminar de 50 famílias foi selecionada de 4.000 famílias. Constatou-se que na amostra 30 famílias possuiam renda superior a 1.000 UM. Qual o tamanho da amostra a ser selecionada, com nível de confiança de 95%, para um erro de estimação de famílias com renda de 1.000 UM seja no máximo de 5%?

R: 369 e 338

7.3.2 - Erro relativo fixado e PQ desconhecidos.

Admite-se o maior valor de P.Q tal que P + Q = 1. Isto significa que P = Q = 0,5 e PQ = 0,25.

45

Page 46: Apostila Estatística

Ex.: A proporção de agricultores que utilizam implementos agrícolas deve ser estimada para uma população de 3000 agricultores. Exige-se um nível de confiança de 95% e um erro de 5% nos resultados. Qual o tamanho da amostra?

R: 384 ou 340

LISTA DE EXERCÍCIOS

ESTATÍSTICA DESCRITIVA

01- Considerando uma população hipotética , cujos elementos são vinte dias em um determinado Hospital contando-se o número de leitos disponíveis por dia, obteve-se os seguintes dados:2 1 0 2 4 1 2 1 0 2 1 2 2 1 0 3 4 2 3 3

Pede-se: a) organizar uma tabela sem intervalo de classes b) calcular a média, moda, mediana, a variância absoluta, a variância relativa , o desvio-padrão e o coeficiente de variabilidade.

02- Uma amostra de vinte e dois trabalhadores de uma microempresa, apresentou os seguintes salários em Reais para uma dada semana: 140 140 140 140 140 140 140 140 140 155 155 161 165 165 180 180 190 200 205 225 230 250

Determine:

a) uma tabela com intervalo de classe usando a fórmula de STURGES.b) calcular a média, moda, mediana, a variância absoluta, a variância relativa , o desvio-padrão e o coeficiente de variabilidade.

03- Abaixo são mostrados os saldos médios amostrais de 48 contas de clientes do BB S.A. ( dados brutos em US$ 1,00).

450 500 150 1.000 250 275 550 500 225 475 150 450 950 300 800 275 600 750 375 650 150 500 1.000 700 475 900 800 275 600 750 375 650 150 500 225 250 150 120 250 360 230 500 350 375 470 600 1.000 270

Pede-se:

a) agrupar os dados numa distribuição de freqüências com intervalo de classes ( use form. de STURGES);b) construa o correspondente histograma de freqüências absolutas e relativas simples e acumuladas;c) construa a ogiva de freqüência absoluta e acumuladas;d) determine as freqüências simples e acumuladas (absolutas e relativas);e) calcule a interprete: fr2, f3 e Fr4 - Fr2;f) calcule as medidas de tendência central : moda, média e mediana (Interprete);g) encontre as medidas de variabilidade: amplitude, variância absoluta e relativa, desvio-padrão e coeficiente de variação.

04- Os dados abaixo representam todos a idade dos clientes que acessaram a página da internet da Empresa “X” no mês de julho de 1998.

Faixa etária 0 -----10 10 -----20 20 ----- 30 30 ----- 40 40 -----50 50 ----- 60

N° de casos 27 71 118 20 18 10

46

Page 47: Apostila Estatística

Calcule as medidas de tendência central e de dispersão.

05- Os vinte funcionários d e um programa de treinamento (pop.) obtiveram as seguintes notas:

84 88 78 80 8994 95 74 81 9083 87 91 83 9290 92 77 86 99

Pede-se determinar: a) agrupar os dados numa distribuição de freqüências com intervalo de classes ( use form. de STURGES);b) a amplitude total das notas;c) o desvio-padrão das notas;d) a variância absoluta das notas;e) o coeficiente de variaçãof) a proporção de alunos com notas maiores que 89;g) a média, sabendo-se que o professor resolveu acrescentar 5 pontos para cada aluno;h) o desvio-padrão quando foi adicionado 5 pontos.

06- Para facilitar um projeto de ampliação da rede de filiais de uma empresa comercial de uma certa região, tomaram uma amostra de tamanho 50 dos 270 lojas que compõe a região, e foram encontrados os seguintes números de clientes semanais:

02 02 03 10 13 14 15 15 16 16 18 1820 21 22 22 23 24 25 25 26 27 29 2930 32 36 42 44 45 45 46 48 52 58 5961 61 61 65 66 66 68 75 78 80 89 9092 97

Pede-se:a) Construa uma distribuição de freqüências considerando seu limite inferior igual a dois e uma amplitude de classe igual a 14;b) Calcule a moda, mediana e a média da distribuição do item “a”.

07- Sabendo que uma distribuição da variável “x” possui média igual a 50 e o desvio-padrão igual a 6, calcule o coeficiente de variação da variável cuja distribuição é dado por y = 2x + 3.

08-O Departamento Pessoal de uma certa firma fez um levantamento dos 120 funcionários de todo o setor de produção, obtendo os seguintes resultados:

Salário (x sal. min.) Freqüência relativa0 ----- 22 ----- 44 ----- 66 ----- 8

0,250,400,200,15

Pede-se:a) Construa um histograma de freqüências absolutas;b) Calcule a média dos saláriosc) Calcule o desvio-padrão dos salários;d) Se for concedido um aumento para esses funcionários de 100%, haverá alteração na média? E no desvio-padrão? Justifique.e) Se for concedido um abono de um salário mínimo para todos os 120 funcionários, haverá alteração na média? E no desvio-padrão? Justifique.

09- Calcule as medidas de tendência central e de variabilidade dos dados apresentados a seguir:

47

Page 48: Apostila Estatística

Número de peças defeituosas, por dia, num levantamento realizado em uma população de 350 lotes de fabricação de um produto:

N° de peças defeituosas 0 1 2 3 4 5 6Nº de lotes 55 60 112 82 31 8 2 Fonte: Dados fictícios

10- Complete a tabela a seguir: Salário dos 50 empregados da empresa ‘x’. (valores em R$)salários fi fri % fri Fi Fri % Fri100 I----- 120 4120 I----- 140 0,22 140 I----- 160 0,78160 I----- 180 16180 I----I 200

fonte: dados fictícios.11. Considerando a tabela a seguir:a) calcular e interpretar estas medidas a média , moda , e mediana da distribuição amostral apresentada abaixo;b) calcular e interpretar %fr3,F4,f2 e %Fr3. c) Calcule o desvio-padrão dos salários;

Idade de uma amostra de candidatos a um programa de treinamento

Idade (anos) Nº de Candidatos

18 |-----20 20 |-----22 22 |-----24 24 |-----26 26 |-----28

5 18 10 6 5

12. Para o seguinte conjunto de observações amostrais determine:a) a média aritmética o desvio padrão e o coeficiente de variação.b) a moda e a mediana.----------------------------------------------------------------- Tempo de serviço Freqüência acumulada----------------------------------------------------------------- 5 I---- 10 9 10 I---- 15 12 15 I---- 20 18 20 I----I 25 25-----------------------------------------------------------------

RESPOSTAS:1. a)

Nr. de leitos disponíveis/dia Nr. de dias0 31 52 73 34 2 20

b) = 1,8 Nr. de leitos disponíveis/dia ; Mo = 2 Nr. de leitos disponíveis/dia ; Md = 2 Nr. de leitos disponíveis/dia; ² = 1,36 Nr. de leitos disponíveis/dia ² ; ² = 0,4198 ou 48,98 %; = 1,17 Nr. de leitos disponíveis/dia; = 0,6479 ou 64,79 %.

48

Page 49: Apostila Estatística

2. a) salários em R$ nr. de empregados

140 I----------- 162 12162 I----------- 184 4184 I----------- 206 3206 I----------- 228 1228 I----------- 250 2

22

_b) x = R$ 172,00 ; Mo = R$ 153,20 ; Md = R$ 160,17; s² = R$ 851,71² ; g² = 0,0288 ou

2,88 %; s = R$ 29,18; g = 0,1697 ou 16,97 %.3.

saldos médios fi fri % fri Fi Fri % Fri119 I----- 245 9 0,1875 18,75 9 0,1875 18,75245 I----- 371 10 0,2083 20,83 19 0,3958 39,58371 I----- 497 8 0,1667 16,67 27 0,5625 56,25497 I----- 623 9 0,1875 18.75 36 0,7500 75,00623 I----- 749 3 0,0625 6,25 39 0,8125 81,52749 I----- 875 4 0,0833 8,33 43 0,8958 89,58875 I----- 1001 5 0,1042 10,42 48 1,0000 1,00

e) fr2 = 0,2083; f3 = 8; Fr4 - Fr2 = 0,3542 _f) x = 483,88; Mo = 287; Md = 449,75g) AT = US$ 880 ou US$ 882 na tabela; s² = US$ 59.274,62² ; g² = 0,2532 ou 25,32 %; s = US$ 243,46; g = 0,5031 ou 50,31 %.

4. = 23,52 anos ; Mo = 23,24 anos ; Md = 22,88 anos; AT = 60 anos; ² = 134,56 anos² ; = 1160 anos.

5. a)notas fi

74 I------ 79 379 I------ 84 484 I------ 89 489 I------ 94 694 I------ 99 3

20

b) AT = 25c) = 6,5d) ² = 42,25e) = 0,0747f) 0,45 ou 45 %g) + 5 = 87 + 5 = 92h) = 6,5

6. a)nr. de cliente / semana fi

2 I------------ 16 816 I------------ 30 1630 I------------ 44 444 I------------ 58 6

49

Page 50: Apostila Estatística

58 I------------ 72 972 I------------ 86 386 I------------ 100 4

50 _b) x = 41,76 cliente / semana; Mo = 21,6 cliente / semana; Md = 33,5 cliente / semana.

7. 11,65 %8. b) = 3,5 S. M.

c) = 1,987 S. M.d) sim, média = 2(3,5) = 7 S. M; desvio-padrão = 2( 1,987) = 3,975 S. M.e) média = 3,5 + 1,0 = 4,5 S.M; o desvio-padrão permanece inalterado.

9. = 2,02 peças defeituosas ; Mo = 2 peças defeituosas ; Md = 2 peças defeituosas; AT = 6 peças defeituosas; ² = 1,69 peças defeituosas ² ; = 1,298 peças defeituosas.

10. salários fi fri % fri Fi Fri % Fri100 I----- 120 4 0,08 8 4 0,08 8120 I----- 140 11 0,22 22 15 O,30 30140 I----- 160 24 0,48 48 39 0,78 78160 I----- 180 8 0,16 16 47 0,94 94180 I----I 200 3 0,06 6 50 1,0 100

50 1,0 100 - - -

11. _a) x = 22,45 anos ; Mo = 21,24 anos ; Md = 21,89 anos.b) % fr3 = 22,73 % dos candidatos apresentam idade de 22 até menos que 24. F4 = 39 candidatos apresentam idade de 18 até menos que 26. f2 = 18 candidatos apresentam idade de 20 até menos que 22. % Fr3 = 75 % dos candidatos apresentam idade de 18 até menos que 24.c) s = 2,38 anos.

12. _ a) x = 14,7 anos; s =6,30 anos g = 0,4289 ou 42,89 %.

b) Mo = 8 anos ; Md = 15,25 anos.

RELATIVOS E ÍNDICES

1. A tabela a seguir mostra os preços médios para o varejo e as quantidades vendidas dos produtos: carne bovina, carne suína e ovina durante os anos de 1991, 1992 e 1993 (dados fictícios).

Produtos 1991 1992 1993Preço Quantidade Preço Quantidade Preço Quantidade

Carne bovina 37 120 45 150 43 170Carne suína 35 80 33 100 38 90Carne ovina 28 90 30 100 35 150 a) Calcule o índice de preços de 1993,tomando como base 1992;b) Calcule o índice de quantidade para 1993, tomando como base 1992;c) Calcule o índice de preços de Laspeyres para 1993, admitindo como período-base 1991;d)Calcule o índice de quantidade de Laspeyres para 1993, admitindo a base para 1991;e) Determine o índice de Paasche para o preço de 1993, tomando como base 1992;f) Qual é o índice de quantidade de Paasche para 1993, sendo 1991 a base?

50

Page 51: Apostila Estatística

2- Dada a tabela abaixo:

Anos 1991 1992 1993 1994 1995 1996Artigo P Q P Q P Q P Q P Q P QA 3 10 3,5 15 4,2 18 5,0 25 5,1 23 5,5 28B 10 20 11,0 25 13,0 30 15,0 35 15,0 40 17,0 45C 5 5 5,5 8 6,0 18 7,5 10 8,0 30 9,0 20

a) Determine os relativos de preços para o artigo A, tomando 1991 = 100;b) Determine os relativos de quantidades para o artigo B, tomando 1992 = 100;c) Usando base móvel, estude as variações de preços para o artigo A;d) Calcule o índice de preços de Laspeyres, sendo 1991 = 100 e 1996 a época atual.

3- Dada a tabela abaixo calcule os índices relativos adotando uma base móvel. Interprete os resultados.Ano 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992Dív. ext.* 62,4 74,0 85,3 93,6 102,0 105,1 111,0 121,2 113,5 115,1 123,4 123,9 132,3(*) Os dados são referentes a dívida externa brasileira, expressa em US$ bilhões.

4- Considere a tabela a seguir:Crianças Assassinadas (RJ)

Ano Homicídios total Até 17 anos198519861987198819891990199119921993

4.5424.9965.4836.0237.6547.8507.5107.6358.026

172204227294437427306450656

(*) Estimativa. Fonte: Sec. Est. Pol. Civil RJ.Com base nos dados acima, calcule os relativos de quantidade, com base em 1985. Interprete os resultados.

5- Considerando os dados constantes na tabela abaixo, determine:a) os relativos de quantidade para 1993 tomando como base 1992;b) os índices agregativos simples de quantidade para 1993 tendo como base 1992;c) a média aritmética simples dos relativos de quantidade para 1993 com 1992 = 100. Produção em toneladas

anos Variação (%)Cultura 1992 1993arroz 9.961.899 10.186.384cebola 886.128 821.262feijão 2.795.011 2.503.243fumo 577.494 671.513milho 30.556.634 29.177.581soja 19.184.919 22.762.777uva 798.800 806.303

Fonte: IBGE - ago/1993

6- Dada a tabela abaixo obtenha nova série de índices, adotando 1992 como base.Ano 1988 1989 1990 1991 1992 1993 1994 1995Índice de produção (88 = 100) 100 132 125 130 140 148 162 150

7- Dadas as variações (em relação ao mês anterior) da produção industrial brasileira de janeiro a setembro de 1993, segundo o IBGE, calcule:

a) a variação acumulada até o mês de setembro;b) a taxa média mensal de variação no referido período.

Meses jan. fev. mar. abr. maio jun. jul. ago. set.

51

Page 52: Apostila Estatística

variações/ mês 5,05 0,36 4,80 1,30 2,13 -5,10 -0,80 -2,00 -1,70

8- O índice constante da tabela abaixo foi calculado com base móvel.

Anos 1981 1982 1983 1984 1985

Índices 120 150 110 130 120

Calcule:a) o índice com base em 1980;b) o índice com base em 1985.

9- Suponha que um índice de preços mostrou os seguintes dados relativos ao faturamento de 1980 a 1984.

Ano Faturamento IGP 1977 = 10019801981198219831984

50.00060.000140.000200.000250.000

40755984814932811

a) Calcule o faturamento real da empresa, a preços de 1980.b) Calcule a taxa anual de variação do faturamento real no período.10.Ano Valor das Vendas

IndustriaisSalários na Indústria (anual)

ICV 1999 = 100 Índice de Preços Industriais 1999 = 100

199819992000

200.000,00220.000,00250.000,00

40.000,0050.000,0060.000,00

80100108

60100108

a) Determine o valor das vendas industriais a preços constantes de 1978 ( 1978 = 100)b) Determine o salário, os preços constantes de 1978 ( 1978 = 100).

11. Os índices abaixo foram calculados com base móvel.

meses jan fev mar abr maiíndices 136 149 128 95 155

calcular: a)os índices com base fixa em abril. b)os índices com base fixa em dezembro.

12. Utilizando os dados da tabela seguinte, calcule os índices de Laspeyres, Paasche e Fischer para preços com base em janeiro.

meses jan fev marprodutos p q p q p qa 14 7 13 10 10 6b 15 6 14 12 12 8

13. Uma revista publicou a tabela a seguir com o respectivo comentário: A produção de batata aumentou 113% no ano de 2002 em relação a 1999 e, aumentou 83% em 2001 com base em 1999. Esta informação está correta? Justifique. produção de batatas

anos quantidade(ton)1999 122000 112001 102002 13

14. Os índices abaixo foram calculados com base móvel.

52

Page 53: Apostila Estatística

meses jan fev mar abr maiíndices 136 149 138 95 89

calcular: a) os índices com base fixa em abril. b) os índices com base fixa em dezembro.

RESPOSTAS1. a) 95,56; 115,15; 116,67.b) 113,33; 90,00; 150,00.c) 116,29.d) 139,75.e) 105,69.f) 140,79.2. a) 100; 116,7; 140; 166,7; 170; 183,3.b)80; 100; 120; 140; 160; 180.c) 116,7; 120; 119; 102; 107,8.d)172,5.3. 118,6; 115,3; 109,7; 109; 103; 105,6; 109,19; 93,6; 101,4; 107,2; 100,4; 106,8.4. Homicídios total: 100; 110; 120,72; 132,61; 168,52; 172,83; 165,35; 168,1; 176,71. Hom. Até 17 anos: 100; 118,6; 131,98; 170,93; 254,07; 248,26; 177,1; 201,63; 381,4.5. a) 102,15; 92,68; 89,56; 116,28; 95,49; 118,65; 100,94.

b) 103,33.c) 117,01.

6. Ano 1988 1989 1990 1991 1992 1993 1994 1995Índice de produção 92=100 71,43 94,29 89,29 92,86 100 105,71 115,71 107,14

7.a) 3,67%

b) 0,40%.8.Anos 1981 1982 1983 1984 1985Índices 80=100 120 180 198 257,4 308,9Índices 85=100 38,9 58,3 64,1 83,3 100

9. Ano IGP 1980 = 100 Faturamento 80 = 100 taxa de variação19801981198219831984

100137207367691

50.00043.79667.63354.49636.179

--12,4154,43-19,42-33,61

10. Ano Valor das Vendas

IndustriaisSalários na Indústria (anual)

ICV 1998 = 100 Índice de Preços Industriais 1999 = 100

199819992000

200.000,00131.974,00138.889,00

40.000,0040.000,0044.444,00

100125135

100166,7180

11.meses jan fev mar abr maiíndices a) 55,19 82,28 105 100 155índices b) 136 202,6 259,4 246,4 381,9

53

Page 54: Apostila Estatística

12. LJ,M =93,09% LJ,M=75,53% PJ,M =93,13% PJ,M=76,47% FJ,M =93,11% FJ,M=75,99%13. Não está correta a notícia. I1999,2002 = 118% (AUMENTO DE 18%) I1999,2001 = 83,33% (REDUÇÃO DE 16,67%)

14.meses jan fev mar abr maiíndices a) 51,19 76,28 105,3 100 98índices b) 136 202,6 279,6 265,7 236,4

EXERCÍCIOS DE PROBABILIDADE:

1. Determinar a probabilidade ou sua estimativa da cada um dos seguintes eventos:a) Aparecer um rei, valete ou dama , ao tirar uma carta única de um baralho de 52 cartas, bem embaralhadas.b) Resultar soma oito em um lance único de dois dados honestos. c) Encontra-se um parafuso não defeituoso se entre 600, doze eram defeituosos.d) Obter 7 ou 11 em uma única jogada de um par de dados não chumbados.e) Ocorrer ao menos uma cara em três lances de uma moeda honesta.

2. Um grupos de 15 elementos apresenta a seguinte composição.

HOMENS MULHERES

Menores 5 3

Adultos 5 2

Um elemento é escolhido ao acaso, qual a probabilidade de:a . Ser homem? b . Ser adultoc . Ser menor e mulher.

3. A probabilidade de duas pessoas A e B resolverem um problema são 1/3 e 2/5, respectivamente. Sabendo que a resolução do problema é independente para A e B, calcule a probabilidade de que:a) nenhum resolva o problema;b) pelo menos um resolva o problema;c) A resolva o problema, mas B não;d) B resolva o problema, mas A não.

4. A probabilidade de um homem estar vivo daqui a 30 anos é de 2/3 e a de sua mulher é de 3/5. Considerando que as sobrevivências são independentes, determine a probabilidade de que, daqui a 30 anos:(a) ambos estejam vivos(b) somente o homem esteja vivo(c) ambos estejam mortos(d) pelo menos um esteja vivo.

RESPOSTAS1. a) = 0,23

b) = 0,138

588c) = ------ 600

54

Page 55: Apostila Estatística

8d) = ----------- 36

2.a) 10

P (H) = ------ 15b) 7

P (A) = ----- 15c) P (M) P(M) = 3

P (M e M) = ------- = ( Ver na tabela) 15

3.(a) 0,4 (b) 0,6 (c) 0,2 (d) 0,2667

4. (a) 0,4 (b) 0,2667 (c) 0,1333 (d) 0,8667

EXERCÍCIOS DE PROBABILIDADE BINOMIAIS:

1. Devido as altas de taxas de juros, uma firma informa que 30% de suas contas a receber de outras firmas comerciais se encontram vencidas. Se um contador escolhe aleatoriamente uma amostra de cinco delas, determinar a probabilidade de cada um dos seguintes eventos usando a fórmula da probabilidade binomiais:a) Nenhuma das contas está vencidab) Exatamente duas contas estão vencidasc) A maioria das contas estão vencidasd) Exatamente 20% das contas estão vencidas. 2. Uma firma de pedidos pelo correio envia uma carta circular que terá uma taxa de respostas de 10%. Suponha que 20 cartas circulares são endereçadas a uma nova área geográfica como um teste de mercado. Supondo que na nova área é aplicável a taxa de respostas de 10, determinar as probabilidades dos seguintes eventos, usando a tabela de probabilidades binomiais:a) Ninguém respondeb) Exatamente duas pessoas respondemc) A maioria das pessoas responded) Respondem menos do que 20% das pessoas.3. Existe 90% de probabilidade de que um certo tipo de componente se comporte de forma adequada sob condições de elevadas temperaturas. Se o dispositivo em questão tem quatro de tais componentes, determinar, por meio de fórmula de probabilidade binomiais, a probabilidade de cada um dos seguintes eventos. a) Todos os componentes se comportam de forma adequada e, por conseguinte, o dispositivo

funciona.b) O dispositivo não funciona porque falha um dos quatro componentes.c) O dispositivo não funciona porque falham um ou mais dos componentes.4.Usando a tabela de probabilidade binomiais, determinar:a) P (X = 8 | n = 20,p = 0,30)b) P (X 10 | n = 20,p = 0,30)c) P (X 5 | n = 20,p = 0,30)d) P(X = 5 | n = 10,p = 0,40)e) P(X > 5 | n = 10,p = 0,30)f) P(X < 5 | n = 10,p = 0,40)5. Determinar, por meio da tabela de probabilidade binomiais:a) P(X = 4 | n = 12,p = 0,70)b) P(X 9 | n = 12,p = 0,70)c) P(X 3 | n = 8,p = 0,60)d) P(X < 3 | n = 8,p = 0,60)

55

Page 56: Apostila Estatística

e) P(X = 5 | n = 10,p = 0,90)f) P(X > 7 | n = 10,p = 0,90)6. Suponha que 40% dos empregados horistas de uma grande empresa estejam a favor da representação sindical e que se peça uma resposta anônima a uma amostra aleatória de 10 empregados. Qual a probabilidade de estarem a favor da representação sindical:a) A maior parte dos que respondemb) Menos da metade dos que respondem.

RESPOSTAS1. a) 0,16807

2. a) 0,12,16 b) 0,2852

c) 0d) 1

3. a) 0,65611 b) 0,2916 c) 0,3439

4. a) 0,1144 b) 0,0479 c) 0,4165 d) 0,2007 e) 0,0473 f) 0,6330

5. a) 0,0078 b) 0,4925 c) 0,1738 d) 0,0499 e) 0,0015 f) 0,9298

6. a) 0,1663 b) 0,6330

EXERCÍCIOS DE DISTRIBUIÇÃO NORMAL:

1. Os resultados de um exame nacional para estudantes recém-formados apresentarem uma média = 500 com o desvio padrão = 100. Os resultados têm uma distribuição aproximadamente normal. Qual a probabilidade de que o grau de um indivíduo escolhido aleatoriamente esteja:

a) entre 500 e 650?b) entre 450 e 600?c) inferior a 300?d) superior a 650?

2. A vida útil de uma certa marca de pneus radiais tem uma distribuição normal com = 38.000 Km e = 3.000Km. a) Qual a probabilidade de que um pneu escolhido aleatoriamente tenha uma vida útil de no mínimo

35.000Km?b) Qual a probabilidade de que ele dure mais do que 45.000Km? 3. Sabendo que o tempo gasto pelos indivíduos para resolver um teste é normalmente distribuído

com média de 20 minutos e desvio-padrão de 4 minutos, determine a probabilidade de que uma pessoa gaste para resolver um teste:

(a) entre 16 e 22 minutos(b) entre 22 e 25 minutos(c) mais do que 23 minutos(d) menos que 16 minutos

56

Page 57: Apostila Estatística

4. A duração de um certo componente eletrônico é normalmente distribuída com média de 850 dias e desvio-padrão de 45 dias. Calcule a probabilidade de um componente desse tipo durar:(a) entre 700 e 1000 dias (b) mais do que 800 dias(c) menos do que 750 dias

5. O número de pessoas que almoçam num restaurante suburbano é aproximadamente normal com média de 250 e desvio padrão de 20 pessoas, por dia. Determine a probabilidade de que, em um dia qualquer, sejam atendidas:(a) menos de 200 pessoas(b) entre 225 e 275 pessoas

6. As notas de Estatística dos alunos de uma Universidade distribuem-se normalmente com média de 6,4 e desvio-padrão de 0,8. Em uma classe de 80 alunos, quantos terão nota:(a) menor do que 5,0?(b) entre 5,0 e 7,5?(c) maior que 7,5?

7. Numa pesquisa salarial, verificou-se que o salário de determinada categoria segue uma distribuição normal com média de 15.000 u.m. e desvio-padrão de 2.000 u.m. Determine:(a) a probabilidade de que um empregado tenha salário entre 17.000 u.m. e 18.000 u.m. (b) quantos empregados entre 1.000, tem salário superior a 18.000 u.m.?

8. O peso médio dos alunos de uma escola é 57,45 Kg, com desvio-padrão de 6,12 Kg, normalmente distribuído. Se são 850 os alunos desta escola:(a) quantos têm peso inferior a 50 Kg?(b) qual a probabilidade de um aluno sorteado pesar entre 55 Kg e 65 Kg?(c) é considerado gordo um aluno que pesa mais de 70 Kg. Quantos serão considerados

gordos?

RESPOSTAS1. a) 0,4332 b) 0,5328 c) 0,0228 d) 0,0668

2. a) 0,8413 b) 0,0099

3. (a) 0,5328 (b) 0,2029 (c) 0,2266 (d) 0,15874. (a) 0,9992 (b) 0,8665 (c) 0,01325. (a) 0,0062 (b) 0,78886. (a) 3 (b) 70 (c) 77. (a) 0,0919 (b) 678. (a) 95 (b) 0,5461 (c) 17

EXERCÍCIOS SOBRE AMOSTRAGEM

1. Uma população consiste de 5 números: 2, 3, 6, 8 e 11.

a) Determine os parâmetros média e a variância absoluta.b) Determine o número de amostras possíveis de tamanho 3, que podemos obter da

população em questão, adotando-se o esquema de AAS, sem reposição. _c) Considerando a variável x, baseado em todas as amostras possíveis sem reposição

determine a média e o desvio padrão da distribuição amostral de x.

57

Page 58: Apostila Estatística

2. Uma variável apresenta média 56 e variância 6,7. Considerando todas as amostras possíveis de tamanho 100 que podem ser selecionadas dessa população, utilizando o processo de AAS sem reposição, determine.

a) A média da distribuição amostral de médias.b) A variância absoluta da distribuição amostral de médias.c) O desvio padrão da distribuição amostral de médias.

3. O valor médio das vendas de um determinado produto durante o último ano foi de R$ 3400 por varejistas que trabalha com o produto, com desvio padrão de R$ 220. Se um grande número de varejistas trabalha com o produto, determine o erro padrão da média admitindo-se amostras de tamanho 25.

4. Admita-se no exercício anterior, que apenas 100 varejistas trabalhem com o produto.

5. Sabendo-se que o peso, dado em gramas, de determinado produto, produzido por uma fábrica está normalmente distribuído com média 400 e desvio padrão 40g, determinar.

a) A probabilidade da média de 1 amostra de tamanho 100, pertencer ao intervalo [390;410].

b) A probabilidade da média de 1 amostra de tamanho 25, pertencer ao intervalo [390;410].c) A probabilidade da média de 1 amostra constituída por 400 artigos pertencer ao intervalo

[390;410].

RESPOSTAS

1. a) 6 e 10,8 b) 10 c) 6 e 1,342. a) 56 b) 10 c) 0.263. R$ 44,004. R$ 38,005. a) 0,98759 b) 0,78871 c) 1

EXERCÍCIOS SOBRE ESTIMAÇÃO DA MÉDIA

1. Um analista de um departamento de pessoal seleciona aleatoriamente os registros de 16 empregados horistas e acha que a taxa de salários por hora é R$ 7,50. Supõe-se que os salários da firma sejam distribuídos normalmente. Se o desvio padrão dos salários é conhecido e igual a R$ 1,00, estimar a taxa média de salários na firma usando um intervalo de confiança de 95%.

2. Para uma mostra de 50 firmas tomada de uma determinada indústria, o número médio de empregados por firma é 420,4 com um desvio padrão na amostra de 55,7. Nesta indústria, há um total de 380 firmas. Determinar o intervalo de confiança de 90%, para estimar o número médio de trabalhadores por firma da indústria.

(Obs: indústria eqüivale a um parque industrial).

3. Considerando os resultados do exercício anterior qual o erro absoluto de estimação obtido?

4. Um departamento de manutenção recebeu um carregamento de 100 máquinas defeituosas. Sabe-se por experiência anterior que o desvio padrão em relação ao tempo necessário para conserto é de 15 minutos. Estimar o tempo médio, por máquina, necessário para consertar as máquinas do carregamento, usando um nível de confiança de 90%. Para tal finalidade tomou-se uma amostra aleatória de 10 máquinas e o tempo médio necessário para conserto de 85,0 minutos.

5. Foi testada uma amostra de 15 cigarros de certa marca, com relação ao conteúdo de nicotina, obtendo-se uma média de 22 miligramas e um desvio padrão de 4 miligramas de nicotina. Encontre os limites de confiança para (média populacional), considerando 1 - = 95%.

58

Page 59: Apostila Estatística

6. O diâmetro médio de uma amostra de 12 bastões cilíndricos em um carregamento é de 2,35mm. A distribuição dos diâmetros de todos os 2000 bastões incluídos no carregamento é aproximadamente normal com desvio padrão de 0,05 mm. Determinar o intervalo de confiança de 99% para estimar o diâmetro médio de todos os bastões incluídos no carregamento.

RESPOSTAS

1. [6,97 8,03]

2. [408,35 432,45]

3. 12,05

4. [77,6 92,4]

5. [19,71 24,29]

6. [2,322 2,37]

INTERVALO DE CONFIANÇA PARA A PROPORÇÃO

1. Uma centena de componentes foi ensaiada e 93 deles funcionaram mais de 500 horas. Determinar um intervalo de confiança de 95% para a proporção.

2. Uma amostra aleatória de 400 domicílios mostra-nos que 25% deles são casas de aluguel. Qual é o intervalo de confiança que podemos, razoavelmente supor que seja o da proporção de casas de aluguel? = 2%.

3. Em 50 lances de uma moeda, foram obtidas 30 caras. A partir de um intervalo de confiança de 96%, pode dizer que a moeda é honesta?

4. Para verificar se um dado era viciado, jogou-se o mesmo 120 vezes, obtendo-se 25 vezes o número cinco. Calcular um intervalo de confiança para a proporção: = 1%. Pode-se dizer que o dado é viciado?

5. Uma amostra de 300 habitantes de uma cidade mostrou que 180 desejavam a água fluorada. Encontrar os limites de confiança para a proporção da população favorável a floruação.

6. Numa eleição determinado candidato recebeu 46% dos votos. Determine a probabilidade de que um escrutínio efetuado em 212 votantes se obtenha a maioria em favor do candidato.

7. Deseja-se conhecer o nível de desemprego em uma certa comunidade, com este objetivo realizou-se uma amostra aleatória de 900 pessoas que indicou uma taxa de desemprego de 9%. Ache o intervalo de confiança de 90% para proporção de desemprego nesta comunidade.

RESPOSTAS

1. 0,88 P 0,98

2. 0,20 P 0,30

3. 0,46 P 0,74 , SIM

4. 0,11 P 0,31, NÃO

5. a) 0,55 P 0,65 b) 0,54 P 0,66

59

Page 60: Apostila Estatística

6. P (p 0,5) = P (Z > 1,17) = 0,121 12,1%

7. [ -7,43% ; 10,56% ]

CONSTRUÇÃO DE TABELAS E CÁLCULOS ESTATÍSTICOS USANDO O EXCEL

Partindo da seguinte série de dados, vamos construir: uma distribuição de freqüência sem intervalo de classe e com intervalo de classe, um histograma e cálculos de estatística descritiva.

14 12 13 11 12 13 16 14 14 15 17 14 1113 14 15 13 12 14 13 14 13 15 16 12 12

Entrada de Dados

Para entrar no Microsoft Excel, clicar no botão . Entrar com os dados na coluna A. Na célula C1, digitar Variáveis. Na célula D1, digitar fi. Na célula E1, digitar fri. Na célula F1, digitar Fi. Na célula G1, digitar Fri. Marcar as células C1:G1, na barra de formatos, clicar no botão Negrito e no botão

Centralizar .

Nas células C2:C8, digitar as variáveis correspondentes a cada classe para uma distribuição de freqüência sem intervalo de classe. (11, 12, 13, 14, 15, 16, 17)

Marcar as células C2:C9, na barra de formatos, clicar no botão Negrito e no botão Centralizar .

Freqüência Simples

Marcar as células D2:D8, na barra de ferramentas, clicar no botão Colar Função

Na janela da esquerda, clicar em Estatística e na janela da direita, procurar Freqüência, clicar em Ok.

Na Matriz_dados, digitar A1:A26. Na Matriz_bin, digitar C2:C8. Como os dados foram preparados para obter os dados da função freqüência como matriz

coluna, no lugar de pressionar Ok ou a tecla Enter , devemos pressionar ao mesmo tempo as três teclas Ctrl + Shift + Enter.

Se não funcionar, começamos por: Marcar as células D2:D8 Digitar a fórmula = FREQÜÊNCIA(A1:A26;C2:C8) Sem pressionar a tecla Enter , devemos pressionar ao mesmo tempo as três teclas Ctrl + Shift

+ Enter. Na célula C9, digitar Total. Clicar na célula D9 e na barra de ferramentas, clicar no botão Auto Soma . (Vai aparecer

os valores acima marcados e a fórmula.) Pressionar a tecla Enter. Marcar D2:G9 e clicar no botão Centralizar .

Freqüência Simples Relativa

Na célula E2, digitar a fórmula = D2/$D$9 e pressionar a tecla Enter.

60

Page 61: Apostila Estatística

Retornar para a célula E2 e no canto inferior direito, pressionar o botão esquerdo do mouse e arrastar até a célula E8.

Na barra de ferramentas, clicar no botão Diminuir Casas Decimais, até 4 casas decimais.

Na célula E9, clicar no botão Auto Soma .

Freqüência Acumulada

Na célula F2, digitar a fórmula = FREQÜÊNCIA($A$1:$A$26,C2) e pressionar a tecla Enter. Retornar para a célula F2 e no canto inferior direito, pressionar o botão esquerdo do mouse e

arrastar até a célula F8.

Freqüência Acumulada Relativa

Na célula G2, digitar a fórmula = F2/$D$9 e pressionar a tecla Enter. Retornar para a célula G2 e no canto inferior direito, pressionar o botão esquerdo do mouse e

arrastar até a célula G8. Na barra de ferramentas, clicar no botão Diminuir Casas Decimais, até 4 casas decimais.

Histograma e Freqüência Simples

Na barra de títulos, abrimos o menu Ferramentas, escolher Análise de Dados, recebe-se a caixa de diálogo com todas as ferramentas de análise disponíveis. Nessa caixa de diálogo escolher Histograma e pressionar o botão Ok.

Obs.: Se ao abrirmos o menu Ferramentas, não estiver disponível Análise de Dados, devemos clicar em Suplementos. Ao abrir uma janela, devemos ativar Ferramentas de Análise, pressionar o botão Ok e repetir o passo anterior.

No Intervalo de Entrada, digitar $A$1:$A$26. No Intervalo do Bloco, digitar $C$2:$C$8. No Intervalo de Saída, digitar $C$11. (O resultado gráfico será apresentado a partir desta

célula.) Assinalar, através de um click, Porcentagem Cumulativa e Resultado Gráfico e pressionar o

botão Ok. Marcar e deletar as células C19:E19. Dar um duplo click dentro de um dos retângulos do histograma. Dentro da caixa Formatar Ponto de Dados, selecionar Opções. A Largura do Espaçamento, reduzir para zero, e pressionar o botão Ok.

Distribuição de Freqüência com Intervalos de Classe

Selecionar uma nova planilha, copiando para essa os dados da coluna A. Na célula C1, digitar Classes. Na célula D1, digitar Li. Na célula E1, digitar fi. Marcar as células C1:E1, centralizar e colocar em negrito. Marcar as células C2:E5 e centralizar. Digitar as classes na coluna C e os limites superiores na coluna D.

Marcar as células E2:E5, na barra de ferramentas, clicar no botão Colar Função. Na janela da esquerda, clicar em Estatística e na janela da direita, procurar Freqüência, clicar em Ok.

Na Matriz_dados, digitar A1:A26. Na Matriz_bin, digitar D2:D5. Como os dados foram preparados para obter os dados da função freqüência como matriz

coluna, no lugar de pressionar Ok ou a tecla Enter , devemos pressionar ao mesmo tempo as três teclas Ctrl + Shift + Enter.

Análise dos Dados

Na barra de títulos, abrimos o menu Ferramentas, escolher Análise de Dados, recebe-se a caixa de diálogo com todas as ferramentas de análise disponíveis. Nessa caixa de diálogo escolher Estatística Descritiva e pressionar o botão Ok.

61

Page 62: Apostila Estatística

No Intervalo de Entrada, digitar $A$1:$A$26. No Intervalo de Saída, digitar $B$7. Assinalar em Resumo Estatístico, Enésimo Maior e Enésimo Menor, pressionar o botão Ok.

Abaixo, encontram-se os resultados das atividades descritas acima:

62