UNIVERSIDADE FEDERAL DO PARANÁ - Páginas...

113
ESTATÍSTICA Notas de Aula para o curso de Tecnologia Prof. a Paula Francis Benevides Ministério da Educação Universidade Tecnológica Federal do Paraná Campus Curitiba Gerência de Ensino e Pesquisa Departamento Acadêmico de Matemática

Transcript of UNIVERSIDADE FEDERAL DO PARANÁ - Páginas...

Page 1: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

ESTATÍSTICA

Notas de Aula para o curso de Tecnologia

Prof.a Paula Francis Benevides

Ministério da Educação

Universidade Tecnológica Federal do Paraná

Campus Curitiba Gerência de Ensino e Pesquisa

Departamento Acadêmico de Matemática

Page 2: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

2

Conteúdo

AULA 1 .................................................................................................................................... 7

1. CONCEITOS PRELIMINARES: .............................................................................................. 7

1.1 MÉTODO ESTATÍSTICO .......................................................................................................... 7

1.1.1 O método experimental: ........................................................................................ 7

1.1.2 O método estatístico: ............................................................................................. 7

2. A ESTATÍSTICA .................................................................................................................. 7

3. FASES DO MÉTODO ESTATÍSTICO ...................................................................................... 7

3.1 COLETA DE DADOS: .............................................................................................................. 7

3.2 CRÍTICA DE DADOS: ............................................................................................................... 8

3.3 APURAÇÃO DOS DADOS: ........................................................................................................ 8

3.4 EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS: .............................................................................. 8

3.5 ANÁLISE DOS RESULTADOS: .................................................................................................... 8

4. VARIÁVEIS ........................................................................................................................ 9

5. POPULAÇÃO E AMOSTRA.................................................................................................. 9

6. AMOSTRAGEM ............................................................................................................... 10

6.1 AMOSTRAGEM CASUAL OU ALEATÓRIA SIMPLES: ....................................................................... 10

6.2 AMOSTRAGEM PROPORCIONAL ESTRATIFICADA: ....................................................................... 12

SEXO ................................................................................................................................. 12

POPULAÇÃO ..................................................................................................................... 12

AMOSTRA ......................................................................................................................... 12

Total ................................................................................................................................................................................ 12

6.3 AMOSTRAGEM SISTEMÁTICA: ............................................................................................... 12

7. TENDENCIOSIDADE DA AMOSTRA .................................................................................. 13

AULA 2 .................................................................................................................................. 16

8. DISTRIBUIÇÃO DE FREQÜÊNCIA ...................................................................................... 16

Page 3: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

3

9. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA..................................................... 17

9.1 CLASSE: ............................................................................................................................ 17

9.2 LIMITE DE CLASSE: .............................................................................................................. 18

9.3 AMPLITUDE DE UM INTERVALO DE CLASSE: ............................................................................. 18

9.4 AMPLITUDE TOTAL DA DISTRIBUIÇÃO: .................................................................................... 18

9.5 AMPLITUDE AMOSTRAL: ...................................................................................................... 18

9.6 PONTO MÉDIO DE UMA CLASSE: ........................................................................................... 19

9.7 FREQÜÊNCIA SIMPLES OU ABSOLUTA ..................................................................................... 19

9.8 FREQUÊNCIA ABSOLUTA ACUMULADA .................................................................................... 20

9.9 FREQÜÊNCIA RELATIVA ........................................................................................................ 20

AULA 3 .................................................................................................................................. 25

10. REPRESENTAÇÃO GRÁFICA ............................................................................................. 25

10.1 GRÁFICO DE BARRAS:.......................................................................................................... 25

10.2 GRÁFICO DE SETORES (PIZZA): .............................................................................................. 26

10.3 DIAGRAMAS DE DISPERSÃO: ................................................................................................. 26

10.4 HISTOGRAMA (OU OGIVA DE GALTON): ................................................................................. 28

10.5 DIAGRAMA DE PARETO: ...................................................................................................... 29

10.6 GRÁFICO POLÍGONO DE FREQÜÊNCIA: .................................................................................... 30

Tabela 10.4 – PONTOS MÉDIOS DOS INTERVALOS DE CLASSE E FREQUENCIAS PARA

ESTATURA DOS ALUNOS DA TURMA A-51 .................................................................................. 30

10.7 GRÁFICO POLÍGONO DE FREQUÊNCIA ACUMULADA (OU OGIVA): ................................................ 31

10.8 PICTOGRAMA: ............................................................................................................... 32

TOTAL ................................................................................................................................... 33

AULA 4 .................................................................................................................................. 36

11. MEDIDAS DE POSIÇÃO .................................................................................................... 36

11.1 MÉDIA ARITMÉTICA ( x ): ..................................................................................................... 36

11.1.1 Dados não Agrupados: ....................................................................................... 36

11.1.2 Desvio em relação à média: ............................................................................... 37

11.1.3 Propriedades da média: ..................................................................................... 37

11.1.4 Dados Agrupados: .............................................................................................. 38

Page 4: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

4

11.1.4.1 Sem intervalo de classe: .............................................................................................................................. 38

11.1.4.2 Com intervalos de classe: ............................................................................................................................ 39

11.2 A MODA (MO) ................................................................................................................. 40

11.2.1 Dados não agrupados: ....................................................................................... 40

11.2.2 Dados agrupados: .............................................................................................. 41

11.2.2.1 Sem intervalo de classe: .............................................................................................................................. 41

11.2.2.2 Com intervalo de classe: ............................................................................................................................. 41

11.3 A MEDIANA (MD): ............................................................................................................ 41

11.3.1 Dados não agrupados: ....................................................................................... 41

11.3.2 Dados Agrupados: .............................................................................................. 42

11.3.2.1 Sem intervalo de classes: ............................................................................................................................ 43

11.3.2.2 Com intervalos de Classe: ........................................................................................................................... 44

11.4 POSIÇÃO RELATIVA DA MÉDIA, MEDIANA E MODA:.................................................................. 46

AULA 5 .................................................................................................................................. 51

11.5 AS SEPARATRIZES: .............................................................................................................. 51

11.5.1 Os Quartis: ......................................................................................................... 51

11.5.2 Os Percentis: ...................................................................................................... 52

AULA 6 .................................................................................................................................. 55

12. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE ............................................................ 55

12.1 AMPLITUDE: ..................................................................................................................... 55

12.2 DESVIO MÉDIO: ................................................................................................................. 55

12.3 DESVIO PADRÃO: ............................................................................................................... 57

12.3.1 Propriedades do Desvio Padrão ......................................................................... 58

12.3.2 Dados não- agrupados: ...................................................................................... 58

12.3.3 Dados agrupados: .............................................................................................. 58

12.3.3.1 Sem intervalo de Classe: ............................................................................................................................. 58

12.3.3.2 Com intervalo de classe: ............................................................................................................................. 59

12.4 VARIÂNCIA:....................................................................................................................... 60

12.5 COEFICIENTE DE VARIAÇÃO: .................................................................................................. 60

AULA 7 .................................................................................................................................. 64

13. MEDIDAS DE ASSIMETRIA: .............................................................................................. 64

13.1 DISTRIBUIÇÃO DE FREQÜÊNCIA SIMÉTRICA: ............................................................................. 64

Page 5: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

5

13.2 DISTRIBUIÇÃO DE FREQÜÊNCIA ASSIMÉTRICA: .......................................................................... 64

13.3 COEFICIENTE DE ASSIMETRIA: ............................................................................................... 66

14. MEDIDAS DE CURTOSE: .................................................................................................. 68

14.1 COEFICIENTE DE CURTOSE: ................................................................................................... 68

AULA 8 .................................................................................................................................. 72

15. PROBABILIDADE: ............................................................................................................ 72

15.1 INTRODUÇÃO: ................................................................................................................... 72

15.2 EXPERIMENTO ALEATÓRIO: .................................................................................................. 72

15.3 ESPAÇO AMOSTRAL: ........................................................................................................... 72

15.4 EVENTOS: ......................................................................................................................... 73

15.5 PROBABILIDADE: ................................................................................................................ 74

15.6 EVENTOS COMPLEMENTARES: .............................................................................................. 75

15.7 PROBABILIDADE COM REUNIÃO E INTERSECÇÃO DE EVENTOS: ...................................................... 76

15.8 EVENTOS INDEPENDENTES: .................................................................................................. 77

15.9 EXPERIMENTOS NÃO EQUIPROVÁVEIS: .................................................................................... 78

AULA 9 .................................................................................................................................. 80

15.10 PROBABILIDADE CONDICIONADA: .......................................................................................... 80

15.11 DISTRIBUIÇÃO BINOMIAL: .................................................................................................... 81

AULA 10 ................................................................................................................................ 84

16. DISTRIBUIÇÕES DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS DISCRETAS: ................ 84

16.1 INTRODUÇÃO: ................................................................................................................... 84

16.2 VARIÁVEIS ALEATÓRIAS: ...................................................................................................... 84

16.2.1 Variável aleatória discreta: ................................................................................ 84

16.2.2 Variável aleatória contínua: .............................................................................. 84

16.3 FUNÇÃO DE PROBABILIDADE:................................................................................................ 85

16.4 FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA: ............................................................................... 86

16.5 VALOR ESPERADO OU MÉDIA DE UMA VARIÁVEL ALEATÓRIA DISCRETA: ....................................... 87

16.6 VARIÂNCIA E DESVIO PADRÃO DE UMA VARIÁVEL ALEATÓRIA DISCRETA: ...................................... 88

16.7 DISTRIBUIÇÃO BINOMIAL: .................................................................................................... 89

Page 6: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

6

16.7.1 Medidas Características: .................................................................................... 89

16.8 DISTRIBUIÇÃO DE POISSON: ................................................................................................. 91

16.8.1 Hipótese do modelo de Poisson: ........................................................................ 92

16.9 APROXIMAÇÃO DAS PROBABILIDADES BINOMIAIS COMAS PROBABILIDADES DA DISTRIBUIÇÃO DE

POISSON: ...................................................................................................................................... 94

AULA 11 ................................................................................................................................ 96

17. DISTRIBUIÇÃO DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS CONTÍNUAS:................ 96

17.1 DISTRIBUIÇÃO NORMAL: ..................................................................................................... 96

17.2 USO DA TABELA DA DISTRIBUIÇÃO NORMAL PADRONIZADA: ...................................................... 100

AULA 12 .............................................................................................................................. 104

17.3 DISTRIBUIÇÃO T DE STUDENT: ............................................................................................. 104

17.3.1 Uso da tabela da distribuição t de Student: .................................................... 105

17.4 DISTRIBUIÇÃO F: .............................................................................................................. 109

17.4.1 Uso da tabela da distribuição F: ...................................................................... 110

Page 7: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

7

AULA 1

1. CONCEITOS PRELIMINARES:

1.1 MÉTODO ESTATÍSTICO

1.1.1 O MÉTODO EXPERIMENTAL:

Consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de

modo que o pesquisador possa descobrir seus efeitos, caso existam.

É o método preferido no estudo da Física, da Química, etc.

1.1.2 O MÉTODO ESTATÍSTICO:

O método estatístico diante da impossibilidade de manter as causas constantes, admite

todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no

resultado final, que influências cabem a cada uma delas.

2. A ESTATÍSTICA

A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta,

organização, descrição, análise e interpretação de dados e para a utilização dos mesmo na tomada

de decisões.

A coleta, a organização e a descrição dos dados, estão a cargo da Estatística Descritiva,

enquanto a análise e a interpretação desses dados ficam a carga da Estatística Indutiva ou

Inferencial.

Em geral, as pessoas desconhecem que o aspecto essencial da Estatística é o de proporcionar

métodos inferenciais, que permitam conclusões que transcendam os dados obtidos inicialmente.

Assim, a análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de

uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condições de

funcionamento, produtividade), a formação de soluções apropriadas e um planejamento objetivo de

ação.

3. FASES DO MÉTODO ESTATÍSTICO

3.1 COLETA DE DADOS:

A coleta pode ser direta e indireta.

A coleta é direta quando feita sobre elementos informativos de registros obrigatórios

(nascimentos, casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes

Page 8: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

8

aos prontuários dos alunos de uma escola, ou ainda, quando os dados são coletados pelo próprio

pesquisador através de inquéritos e questionários, como é o caso das notas de verificação e de

exames do censo demográfico, etc.

A coleta direta de dados podem ser classificadas relativamente ao fator tempo em:

contínua (registro) – quando feita continuamente, tal como a de nascimentos e

óbitos e a frequência dos alunos às aulas.

periódica – quando feita em intervalos constantes de tempo em tempo,como os

censos (de 10 em 10 anos) e as avaliações mensais dos alunos.

ocasional – quando feita extemporaneamente, a fim de atender a uma conjuntura ou

a uma emergência, como no caso de epidemias que assolam ou dizima rebanhos

inteiros.

A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do

conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como por exemplo,

podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma

coleta direta.

3.2 CRÍTICA DE DADOS:

Externa: quando visa às causas dos erros por parte do informante, por distração ou má

interpretação das perguntas que lhe foram feitas.

Interna: quando visa observar os elementos originais dos dados da coleta.

3.3 APURAÇÃO DOS DADOS:

Pode ser manual, eletromecânica ou eletrônica.

3.4 EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS:

Os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais

fácil o exame daquilo que está sendo objeto de tratamento estatístico.

3.5 ANÁLISE DOS RESULTADOS:

Como já dissemos, o objetivo último da Estatística é tirar conclusões sobre o todo

(população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim,

realizadas as fases anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos

através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução ou

inferência, e tiramos desses resultados conclusões e previsões.

Page 9: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

9

4. VARIÁVEIS

Variável: conjunto de resultados possíveis de um fenômeno.

Cada fenômeno corresponde um número de resultados possíveis Assim por exemplo:

Para o fenômeno ―sexo‖ são dois os resultados possíveis: sexo masculino e sexo

feminino.

Para o fenômeno ―número de filho‖ há um número de resultados possíveis expresso

através dos números naturais: 0, 1, 2, 3, ...., n

Para o fenômeno ―estatura‖ temos uma situação diferente, pois os resultados podem

tomar um número infinito de valores numéricos dentro de um determinado intervalo.

Logo, as variáveis podem ser:

Qualitativa: se os valores tomados não são numéricos, como: raça, meio de transporte, sexo

do bebe, etc.

Quantitativa: se os valores tomados são numéricos, como altura, peso, preço de um produto,

etc. Variável quantitativa também se chama variável estatística ou simplesmente variável. Cada

valor que essa variável pode assumir chama-se dado estatístico.

As variáveis estatísticas podem ser:

Contínuas: quando podem assumir qualquer valor do intervalo de variação. Por exemplo, na

determinação das alturas dos adolescentes de uma escola, a variável ―altura‖ é continua.

Discretas: quando só podem assumir valores inteiros. Por exemplo, na determinação do

número de alunos de uma certa turma, a variável ―número de alunos‖ é discreta.

De um modo geral, as medições dão origem a variável contínuas e as contagens ou

enumerações, a variáveis discretas.

5. POPULAÇÃO E AMOSTRA

Entende-se por população o conjunto de elementos que tem, em comum, determinada

característica. As populações podem ser finitas, como, por exemplo, os alunos matriculados em

determinada escola, ou infinitas, como por exemplo, os resultados obtidos quando se joga um dado

sucessivamente. Existem populações que embora finita, são consideradas infinitas para qualquer

finalidade prática. Como exemplo, imagine o número de peixes que há no mar.

Entende-se por amostra qualquer conjunto de elementos, retirados da população, desde que

esse conjunto seja não-vazio e tenha menor número de elementos que a população. É um

subconjunto finito de uma população

Page 10: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

10

6. AMOSTRAGEM

Existe uma técnica especial – amostragem – para recolher amostras, que garante, tanto

quanto possível, o acaso da escolha.

Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o

que garante á amostra o caráter de representatividade, e isto é muito importante, pois, como vimos,

nossas conclusões relativas á população vão estar baseadas nos resultados obtidos nas amostras

dessa população.

Daremos, a seguir, três das principais técnicas de amostragem.

6.1 AMOSTRAGEM CASUAL OU ALEATÓRIA SIMPLES:

Este tipo de amostragem é equivalente a um sorteio lotérico.

Na pratica, a amostragem casual ou aleatória simples pode ser realizada numerando-se a

população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k

números dessa sequência, os quais corresponderão aos elementos pertencentes a amostra.

Exemplo:

Vamos obter uma amostra representativa para a pesquisa da estatura de noventa alunos de

uma escola:

Numeramos os alunos de 01 a 90.

Escrevemos os números, de 01 a 90, em pedaços iguais de um mesmo papel,

colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os

pedaços de papel e retiramos, um a um, nove números que formarão a amostra. Neste

caso, 10% da população.

Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito

trabalhoso. A fim de facilita-lo, foi elaborada uma tabela – Tabela de Números Aleatórios –

construída de modo que os dez algarismos (0 a 9) são distribuidos ao acaso nas linhas e colunas.

Page 11: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

11

* TABELA DE NÚMEROS ALEATÓRIOS *

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10

C11

C12

C13

C14

C15

C16

C17

C18

C19

C20

C21

C22

C23

C24

C25

C26

C27

C28

C29

L1 4 1 6 1 6 1 0 2 3 5 7 6 2 0 9 9 8 1 0 3 4 7 2 1 0 8 7 8 4

L2 3 0 7 2 6 3 9 5 5 3 4 8 8 0 9 3 0 1 7 0 4 0 8 3 1 2 0 1 2

L3 2 2 5 3 7 5 0 1 9 8 7 6 3 0 0 1 2 1 4 3 2 4 5 6 7 7 4 3 0

L4 1 9 8 4 7 7 8 6 5 2 7 8 1 0 0 7 5 3 2 2 5 8 1 9 0 3 2 3 4

L5 0 3 4 5 8 9 0 2 0 3 1 0 1 1 2 4 3 1 9 5 6 8 5 0 2 3 4 9 0

L6 0 8 9 6 8 1 7 2 2 2 2 8 6 1 9 4 5 2 0 0 1 3 1 0 9 2 3 4 1

L7 8 3 3 7 9 0 6 3 7 6 4 0 7 1 2 1 0 1 2 8 9 7 5 3 2 1 1 8 2

L8 8 8 0 8 9 2 3 6 3 7 3 7 8 9 4 3 9 2 3 2 3 0 0 4 4 2 3 1 3

L9 5 4 1 9 0 0 2 0 3 7 5 0 9 7 6 5 7 8 0 8 4 5 2 3 0 7 4 3 6

L10 6 7 2 0 0 3 1 1 1 2 6 0 2 0 8 0 9 7 7 7 3 6 7 2 9 0 3 1 0

L11 4 4 0 5 1 9 1 9 4 1 8 4 2 1 3 3 2 7 6 4 4 3 8 9 0 7 2 2 9

L12 3 5 1 4 3 3 0 3 2 3 7 0 3 4 5 8 9 3 5 2 4 0 1 7 9 1 8 1 3

L13 2 6 9 3 5 8 2 3 6 5 0 2 6 3 6 7 0 1 7 9 6 8 3 5 3 3 5 7 2

L14 0 1 2 2 7 4 0 7 0 7 9 0 0 6 5 2 7 8 1 0 0 7 5 3 0 9 1 1 3

L15 9 0 8 1 9 8 3 8 3 9 4 0 1 9 5 2 2 0 0 2 1 2 4 7 6 3 2 1 5

L16 7 2 2 0 2 5 0 5 3 2 1 3 5 8 9 1 2 3 9 6 5 2 7 8 1 0 0 7 0

L17 8 9 3 9 4 7 4 1 1 4 2 4 6 7 0 2 3 7 8 5 3 1 2 5 6 9 0 7 9

L18 6 3 0 8 6 6 0 1 4 6 2 2 3 3 0 1 5 4 5 1 1 3 4 7 8 1 2 8 8

L19 5 8 1 7 8 7 5 9 4 8 0 0 2 3 6 9 6 4 3 6 7 2 1 9 7 0 1 8 5

L20 3 4 0 6 0 1 9 8 4 0 2 9 2 3 2 5 3 5 7 2 7 8 2 5 6 2 2 9 4

L21 8 7 2 1 1 3 5 2 4 1 7 5 7 3 0 0 9 1 2 0 3 4 9 3 0 4 4 9 1

L22 1 4 9 1 3 2 8 6 1 2 0 2 0 1 3 5 4 6 4 3 2 0 0 3 9 6 6 0 2

L23 2 7 3 2 5 4 6 5 8 4 0 8 0 1 9 6 9 5 0 8 0 2 4 9 8 8 8 0 3

L24 4 3 8 2 7 3 7 8 0 3 0 9 2 2 6 7 6 4 9 8 9 4 7 7 7 0 0 2 4

L25 5 0 3 3 9 5 7 0 4 5 8 7 4 2 2 3 8 2 1 2 2 0 7 0 6 1 1 2 5

L26 2 5 7 3 0 4 2 2 6 6 1 1 0 3 9 9 1 0 3 4 3 9 6 3 5 3 3 4 8

L27 1 1 4 4 2 6 3 2 0 8 9 2 3 3 7 7 4 0 5 6 8 8 5 2 4 5 5 4 0

L28 0 2 7 4 3 6 4 3 1 7 1 0 2 0 9 6 4 3 7 9 0 7 6 1 3 7 5 5 8

L29 9 1 5 5 6 8 5 6 9 8 2 0 2 3 0 1 4 3 3 7 7 5 6 7 4 3 4 0 1

Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo qualquer

da mesma, a partir do qual iremos considerar números de dois, três ou mais algarismos, conforme

nossa necessidade. Os números assim obtidos irão indicar os elementos da amostra.

A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-versa),

verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou

descendente) ou formando o desenho de uma letra qualquer. A opção porém, deve ser feita antes de

iniciado o processo.

Assim, para o nosso exemplo, considerando a 18o linha, tomamos os números de dois

algarismo (tantos algarismos quantos formam o maior número da população, obtendo:

63 08 66 01 46 22 33 01 54 51 13 47 81 28

Evidentemente, se constasse um numeral maior que 90, este seria desprezado, pois não

consta da população, como será também abandonado um numeral que já tenha aparecido. Temos

então: 63 08 66 01 46 22 33 54 51

Medindo as alturas dos alunos correspondentes aos números sorteados obteremos uma

amostra das estaturas dos noventa alunos.

Page 12: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

12

6.2 AMOSTRAGEM PROPORCIONAL ESTRATIFICADA:

Muitas vezes a população se divide em subpopulações – estratos.

Como é provável que a variável em estudo apresente de estrato, um comportamento

heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos

elementos da amostra leve em consideração tais estratos.

É exatamente isso que fazemos quando empregamos a amostragem proporcional

estratificada, que, além de considerar a existência dos estratos, obtém os elementos da amostra

proporcional ao número de elementos dos mesmos.

Exemplo:

Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam meninos e 36 meninas,

vamos obter a amostra proporcional estratificada.

São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de

10% da população. Logo, temos:

SEXO POPULAÇÃO 10% AMOSTRA

M

F

54

36

4,5100

5410

6,3100

3610

5

4

Total 90 0,9100

9010

9

Numeramos os alunos de 01 a 90, sendo que de 01 a 54 corresponde aos meninos e de 55 a

90, meninas. Tomando na Tabela de Números Aleatórios a primeira e a segunda coluna da

esquerda, de cima para baixo, obtemos os seguintes números:

41 30 22 19 03 08 83 88 54 67 44 35 26 01 90 72 89 63 58 34 87 14 27 43 50

25 11 02 91

Temos então:

41 30 22 19 03 – para os meninos

83 88 67 90 – para as meninas

6.3 AMOSTRAGEM SISTEMÁTICA:

Quando os elementos da população já se acham ordenados, não há necessidade de construir

o sistema de referências. São exemplos os prontuários médicos de um hospital, os prédios de uma

rua, as linhas de produção, etc. Nestes casos, a seleção dos elementos que constituirão a amostra

Page 13: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

13

pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos

sistemática.

Assim, no caso de uma linha de produção, podemos a cada dez itens produzidos, retirar um

para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho da

amostra em 10% da população.

Exemplo:

Suponhamos uma rua contendo novecentos prédios, dos quais desejamos obter uma amostra

formada por cinquenta prédios. Podemos, neste caso, usar o seguinte procedimento: como 900/50 =

18, escolheremos por sorteio casual um número de 1 a 18 (inclusive), o qual indicaria o primeiro

elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18

em 18. Assim, se o número sorteado fosse o 4, tomaríamos, pelo lado direito da rua, o 4o prédio, o

22o, o 40

o etc, até voltarmos ao início da rua, pelo lado esquerdo.·.

7. TENDENCIOSIDADE DA AMOSTRA

Muitas vezes as amostras são constituídas por pessoas que devem executar algum tipo de

tarefa, com responder perguntas, preencher um questionário ou até mesmo testar um produto.

Algumas pessoas se recusam a cooperar. Nesses casos é preciso ter muito senso crítico para avaliar

se a amostra efetivamente utilizada é representativa da população. Sempre é possível que a amostra

obtida seja tendenciosa ou viciada, isto é, não representativa da população.

O senso crítico ainda é mais importante quando as amostrar são constituídas por voluntários.

Muitas vezes, o procedimento usado para solicitar voluntários conduz á formação de amostrar

tendenciosas. Como por exemplo, imagine que um professor de educação física peça que três alunos

da turma se apresentem como voluntários para apostar uma corrida. Ora, é bastante razoável

imaginar que, neste caso, se apresentarão como voluntários apenas os alunos que sabem ser bons

corredores. Então, os três alunos não constituirão uma amostra representativa da turma, mas uma

amostra tendenciosa ou viciada.

Page 14: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

14

AULA 01 - EXERCICIOS

1) O método experimental é mais usados por ciências como:........

2) As ciências humanas e sociais, para obterem os dados que buscam, lançam mão de que método?

3) O que é Estatística?

4) Cite as fases do método estatístico.

5) Para você o que é coletar dados?

6) Para que serve a crítica dos dados?

7) O que é apurar dados?

8) Como podem ser apresentados os expostos os dados?

9) Cite três ou mais atividades do planejamento empresarial em que a Estatística se faz necessária.

10)Classificar as variáveis em qualitativas ou quantitativas (continuas e discretas):

a. População: os alunos de uma escola.

Variável: cor dos cabelos

b. P: casais residentes em uma cidade

V: número de filhos

c. P: as jogadas de um dado

V: o ponto obtido em cada jogada

d. P: peças produzidas por certas máquinas

V: número de peças produzidas por hora

e. P: peças produzidas por certa máquina

V: diâmetro externo

f. P: estação meteorológica de uma cidade

V: precipitação pluviométrica, durante um ano.

g. P: alunos de uma cidade

V: cor dos olhos

h. P: bolsa de valores de São Paulo

V: números de ações negociadas

i. P: funcionários de uma empresa

V: salários.

j. P: pregos produzidos por uma máquina

V: comprimento

k. P: propriedades agrícolas no Brasil

V: produção de algodão

l. P: segmento de reta

V: comprimento

m. P: biblioteca da cidade de Curitiba

V: número de volumes

Page 15: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

15

n. P: indústrias de uma cidade

V: índice de liquidez.

11)A massa (em quilogramas) de 20 trabalhadores de uma empresa com 100 funcionários esta

registrada a seguir:

62 52 73 80 65 50 70

75 80 65 70 77 82 91

75 52 68 86 70 80

Com base nos dados obtidos, responda:

a. Qual a população e a unidade estatística dessa pesquisa?

b. Qual é a sua amostra?

c. Qual é a variável nessa pesquisa? Ela é discreta ou contínua?

12) Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente, n1=40,

n2= 100 e n3= 60. Sabendo-se que, ao ser realizada uma amostragem estratificada proporcional,

nove elementos da amostra foram retirados do 3o estrato, determine o número total de elementos da

amostra.

13) Mostre como seria possível retirar uma amostra de 32 elementos de uma população ordenada

formada por 2.432 elementos. Na ordenação geral, qual dos elementos abaixo seria escolhido para

pertencer à amostra, sabendo-se que o elemento de ordem 1.420 a ela pertence?

1648, 290, 725, 2025, 1120

Page 16: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

16

AULA 2

8. DISTRIBUIÇÃO DE FREQÜÊNCIA

Tabela primitiva: tabela cujos elementos não foram numericamente organizados

Rol: Tabela obtida após a ordenação dos elementos da tabela primitiva

No exemplo em que trabalharemos, a variável em questão, nota, será observada e estudada

muito mais facilmente quando dispusermos valores ordenados em uma coluna e colocarmos, ao

lado de cada valor, o número de vezes que aparece repetido.

Denominamos de frequência o número de alunos que fica relacionado a um determinado

valor da variável. Obtemos assim, uma tabela que recebe o nome de distribuição de frequência.

Vamos analisar a seguinte situação:

Consideremos o quadro seguinte que mostra as notas de Cálculo dos alunos de uma classe

de 2o período de Eletrotécnica numa determinada Faculdade.

Disciplina: Cálculo Turma: 2o período

Número 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Nota 5,0 4,0 6,0 8,0 3,0 5,0 7,0 6,0 8,0 4,0 6,0 9,0 7,0 5,0 7,0 5,0 6,0 8,0 7,0 9,0 4,0 6,0 6,0 8,0 7,0

Tabela 1

Nesse caso temos:

População estatística: grupo de 25 alunos do segundo período

Unidade estatística: cada aluno desse ano

Variável estatística: as notas da prova de Cálculo

A partir desse conhecimento, elaboramos a seguinte tabela:

i Notas Número de alunos(fi)

1 0 0

2 1,0 0

3 2,0 0

4 3,0 1

5 4,0 3

6 5,0 4

7 6,0 6

8 7,0 5

9 8,0 4

10 9,0 2

11 10,0 0

Total: 25 Tabela 2

Page 17: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

17

Mas o processo dado é ainda inconveniente, já que exige muito espaço, mesmo quando o

número de valores da variável (n) é de tamanho razoável. Sendo possível, a solução mais aceitável,

pela própria natureza da variável contínua, é o agrupamento de valores em vários intervalos.

Assim, se um dos intervalos for, por exemplo, 0| 4, 0, (é um intervalo fechado à esquerda

e aberto à direita, 0 x< 4,0) em vez de dizermos que a nota de nenhum aluno é 0 ou 1,0 ou 2,0 e de

1 aluno é 3,0, diremos que 1 aluno tem nota entre 0, inclusive, e 4,0.

Deste modo, estaremos agrupando os valores da variável em intervalos, sendo que, em

Estatística, preferimos chamar de classes.

Chamando de frequência de uma classe o número de valores da variável pertencentes à

classe, os dados da tabela 2, podem ser dispostos como na tabela 3, denominada distribuição de

frequência com intervalos de classe.

Notas Frequência

0 | 2,0 0

2,0 | 4,0 1

4,0 | 6,0 7

6,0 | 8,0 11

8,0 | 11,0 6

Tabela 3

Ao agruparmos os valores da variável em classes, ganhamos em simplicidade, mas

perdemos em pormenores. Assim, na Tabela 2 podemos verificar facilmente, que 2 alunos têm nota

9,0 e que nenhum tem nota 10,0. Já na tabela 3 não podemos ver se algum aluno tem nota 10,0. No

entanto, sabemos com segurança, que onze alunos tem nota compreendida entre 6,0 e 8,0.

O que pretendemos com a construção dessa nova tabela é realçar o que há de essencial nos

dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição, até porque a

Estatística tem por finalidade específica analisar o conjunto de valores, desinteressando-se por casos

isolados.

9. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA

9.1 CLASSE:

Classes de frequência ou, simplesmente, classes são intervalos de variação da variável.

As classes são representadas simbolicamente por i, sendo i = 1, 2, 3,..., k (onde k é o número

total de classes da distribuição).

Page 18: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

18

Assim, em nosso exemplo, o intervalo 2,0 | 4,0 define a segunda classe (i = 2). Como a

distribuição é formada de 5 classes, podemos afirmar que k = 5.

9.2 LIMITE DE CLASSE:

Denominamos de limite de classe os extremos de cada classe.

O menor número é o limite inferior da classe ( i ) e o maior número, o limite superior

da classe(Li).

Na segunda classe, por exemplo, temos:

2 = 2,0 e L2 = 4,0

Obs.: Os intervalos de classe devem ser escritos, de acordo com a Resolução 886/66 do

IBGE, em termos de desta quantidade até menos aquela, empregando, para isso, o símbolo |

(inclusão de i e exclusão de Li). Assim, o indivíduo com uma nota de 4,0 está incluído na

terceira classe (i = 3) e não na segunda.

9.3 AMPLITUDE DE UM INTERVALO DE CLASSE:

Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do

intervalo que define a classe.

Ela é obtida pela diferença entre os limites superior e inferior dessa classe e indicada por hi .

Assim:

hi = Li - i

Na distribuição da tabela 3 temos:

h2 = 4,0 – 2,0 = 2,0

9.4 AMPLITUDE TOTAL DA DISTRIBUIÇÃO:

Amplitude total da distribuição (AT) é a diferença ente o limite superior da última classe

(limite superior máximo) e o limite inferior da primeira classe ( limite inferior mínimo).

AT = L(máx) – (mín)

Em nosso exemplo, temos: AT = 11,0 – 0 = 11,0

Obs.: É evidente que, se as classes possuem o mesmo intervalo, verificamos a relação:

kh

AT

i

9.5 AMPLITUDE AMOSTRAL:

Amplitude amostral (AA) é a diferença entre o valor máximo e o valor mínimo da amostra.

AA = x (max.) – x (min.)

Page 19: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

19

Em nosso exemplo, temos: AA = 10,0 – 0 = 10,0

Observe que a amplitude total da distribuição jamais coincide com a amplitude amostral.

9.6 PONTO MÉDIO DE UMA CLASSE:

Ponto médio de uma classe (xi) é como o próprio nome indica o ponto que divide o intervalo

de classe em duas partes iguais.

Para obtermos o ponto médio de uma classe, calculamos a semissoma dos limites da classe

(média aritmética).

2

ii

i

Lx

Assim, o ponto médio da segunda classe, em nosso exemplo é:

9.7 FREQÜÊNCIA SIMPLES OU ABSOLUTA

A primeira fase de um estudo estatístico consiste em recolher, contar e classificar os dados

pesquisados sobre uma população estatística ou sobre uma amostra dessa população.

Escolhida uma característica sobre os elementos de uma população, devemos elaborar uma

tabela de dados denominada distribuição estatística. Posteriormente, os resultados podem ser

interpretados por meio de um gráfico. Diversos tipos de gráficos são usados em Estatística: de

barras, de setores, por pontos, etc.

Na coluna ―Notas‖ aparecem os diferentes valores da variável estatística. Na coluna

―Número de alunos‖ está indicado o número de vezes que cada valor se repete é a coluna de

frequência absoluta (fi).

Logo, frequência absoluta (fi), simples, ou frequência de classe ou de um valor individual é

o número de observações correspondentes a essa classe ou a esse valor.

Utilizando o somatório ( ): O símbolo é usado para escrever abreviadamente

expressões que envolvem adição. Assim, indicamos a adição dos termos fi, com i variando de 1 até

k (k |N*), como:

K

i

if1

ou nf i

No exemplo das notas de Cálculo, o desenvolvimento do somatório do

7

1i

if é dado por:

7

1i

if = f1 + f2 + f3 + f4 + f5 + f6 + f7

7

1i

if = 0 + 0 + 0 + 1 + 3 + 4 + 6 = 14

Page 20: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

20

9.8 FREQUÊNCIA ABSOLUTA ACUMULADA

A distribuição de frequência absoluta pode ser completada com mais uma coluna, chamada

de frequências absolutas acumuladas (fia), cujos valores são obtidos adicionando a cada frequência

absoluta os valores das frequências anteriores.

Veja como fica o quadro anterior:

i Nota fi fia

1 0 0 0

2 1,0 0 0

3 2,0 0 0

4 3,0 1 1

5 4,0 3 1 + 3 = 4

6 5,0 4 4 + 4 = 8

7 6,0 6 8 + 6 = 14

8 7,0 5 14 + 4 = 19

9 8,0 4 19 + 4 = 23

10 9,0 2 23 + 2 = 25

11 10,0 0 25

N = 25

Pelo quadro e usando a frequência acumulada, podemos fazer algumas observações, tais

como:

8 alunos não obtiveram nota superior a 5,0 nessa classe

25 – 14 = 11 alunos obtiveram nota 7,0 ou acima de 7,0 nessa classe

f6a =

6

1i

if = 8

9.9 FREQÜÊNCIA RELATIVA

Chama-se frequência relativa (fr) do valor de xi da variável o quociente entre a frequência

absoluta (fi) e a frequência total (número de elementos n da amostra), ou seja:

i

i

rf

ff

Observe o gráfico:

Page 21: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

21

Devemos observar que se a frequência relativa (fr) é dada na forma de porcentagem, ela vai

tornar mais clara à análise de certos dados.

Se tomarmos como exemplo o quadro de frequência das notas de Cálculo de uma classe de

segundo período de Eletrotécnica, podemos, então, completar o quadro de distribuição de

frequência com mais duas colunas; a coluna das frequências relativas (fr) e a coluna das frequências

relativas acumuladas (fa).

xi fi fia Fr (%) Fra (%)

3,0 1 1 1/25 = 4% 4%

4,0 3 4 3/25 = 12% 16%

5,0 4 8 4/25 = 16% 32%

6,0 6 14 6/25 = 24% 56%

7,0 5 19 5/25 = 20% 76%

8,0 4 23 4/25 =16% 92%

9,0 2 25 2/25 = 8% 100%

Observando a tabela, temos:

20% dos alunos obtiveram média 7,0

56% dos alunos obtiveram média inferior a 7,0

100% - 56% = 44% obtiveram média igual ou superior a 7,0

Page 22: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

22

AULA 02 - EXERCÍCIOS

1) Numa pesquisa de opinião pública com 800 telespectadores sobre o programa de televisão de

sua preferência, obteve-se a seguinte tabela de frequências absolutas:

Programa de TV Número de Telespectadores

Novela 360

Esportes 128

Filmes 80

Noticiário 32

Shows 200

Construa um quadro com distribuição de frequências absolutas acumuladas, frequências

relativas e frequências relativas acumuladas.

2) Um dado foi jogado 20 vezes. Em cada jogada foram obtidos os seguintes pontos:

1 5 6 5 2 2 2 4 6 5

2 3 3 1 6 6 5 5 4 2

a) Elabore um quadro com distribuição de frequências absolutas, frequências absolutas

acumuladas, frequências relativas e frequências relativas acumuladas.

b) Observando a tabela responda:

I. Quantas vezes o número 3 foi obtido no dado?

II. Quantas vezes o número obtido no dado foi menor que 5?

III. Qual o índice, em porcentagem, em que o número 6 foi obtido no dado?

IV. Qual o índice, em porcentagem, em que números maiores que 4 foram obtidos no

dado?

3) Veja os principais motivos alegados por 30 000 devedores, pesquisados em uma região

metropolitana, ao justificarem atrasos do crediário ou cheque sem fundo.

Com base nessa pesquisa, responda:

a) Qual a frequência relativa das pessoas que apresentam outras justificativas?

b) Quais as frequências absolutas para cada tipo de devedor?

Page 23: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

23

4) Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos, que

compõem uma amostra de alunos de um colégio A., resultando a seguinte tabela de valores:

166 160 161 150 162 160 165 167 164 160

162 161 168 163 156 173 160 155 164 168

155 152 163 160 155 155 169 151 170 164

154 161 156 172 153 157 156 158 158 161

Determine:

a) O rol da tabela primitiva acima.

b) A distribuição de frequência

c) Distribuição de frequência com intervalos de classe. (sugestão, de 4 em 4)

d) A segunda classe.

e) Os limites da segunda classe.

f) O intervalo (amplitude) da segunda classe.

g) A amplitude total da distribuição.

h) A amplitude amostral

i) O ponto médio da segunda classe.

j) A frequência absoluta da segunda classe.

5) A tabela abaixo apresenta as vendas diárias de um determinado aparelho elétrico, durante um

mês, por uma firma comercial:

14 12 11 13 14 13

12 14 13 14 11 12

12 14 10 13 15 11

15 13 16 17 14 14

Forme uma distribuição de frequência sem intervalos de classe.

6) Considerando as notas de um teste de inteligência aplicado a 100 alunos:

64 78 66 82 74 103 78 86 103 87

73 95 82 89 73 92 85 80 81 90

78 86 78 101 85 98 75 73 90 86

86 84 86 76 76 83 103 86 84 85

76 80 92 102 73 87 70 85 79 93

82 90 83 81 85 72 81 96 81 85

68 96 86 70 72 74 84 99 81 89

71 73 63 105 74 98 78 78 83 96

95 94 88 62 91 83 98 93 83 76

94 75 67 95 108 98 71 92 72 73

Forme a distribuição de frequência:

Page 24: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

24

7) A tabela abaixo apresenta uma distribuição de frequência das áreas de 400 lotes:

Área

(m2)

300 |— 400 |— 500 |— 600 |— 700 |— 800 |— 900 |— 1.000 |— 1.100 |— 1.200

No DE

LOTES

14 46 58 76 68 62 48 22 6

Com referência a essa tabela, determine:

a) a amplitude total;

b) o limite superior da quinta classe;

c) o limite inferior da oitava classe;

d) o ponto médio da sétima classe;

e) a amplitude do intervalo da segunda classe;

f) a frequência da quarta classe;

g) a frequência relativa da sexta classe;

h) a frequência acumulada da quinta classe;

i) o número de lotes cuja área não atinge 700 m2;

j) o número de lotes cuja área seja maior ou igual a 900 m2;

k) a percentagem dos lotes cuja área [e de 500 m2, no mínimo, mas inferior a 1.000 m

2;

l) a classe do 72o lote;

m) até que classe estão incluídos 60% dos lotes.

8) Complete a tabela abaixo:

i CLASSES fi fr fia fra

1

2

3

4

5

0 |— 8

8 |— 16

16 |— 24

24 |— 32

32 |— 40

4

10

14

9

3

40

00,1

Page 25: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

25

AULA 3

10. REPRESENTAÇÃO GRÁFICA

Em muitos casos, uma representação gráfica de uma distribuição de frequência nos dá uma

ideia melhor de um levantamento estatístico do que um quadro com números.

Nesse item, estudaremos as representações gráficas mais usadas em Estatística.

10.1 GRÁFICO DE BARRAS:

Os gráficos de Barras ou colunas são gráficos que podem ser facilmente elaborados à mão

ou com uso de softwares específicos, tais como o software Excel ou outro programa gerador de

gráficos.

Como exemplo, considere-se uma pesquisa de opinião realizada em determinada

comunidade, para a qual os dados coletados indicaram o hábito dos moradores em assistir ou não

horário político televisivos. Tais informações constam na Tabela 10.1.

Tabela 10.1 - HÁBITO DE ASSISTIR O HORÁRIO POLÍTICO

HÁBITO FREQUENCIA PERCENTUAL

SIM 1150 31,5%

NÃO 2500 68,5%

TOTAL 3650 100%

A tabela 10.1 facilita a apresentação dos resultados e o entendimento do leitor sobre como

se comporta os moradores quanto ao hábito de assistirem ou não o horário político. Igualmente, o

gráfico de barras também se constitui em uma excelente forma de apresentação de tais informações.

GRÁFICO 10.1 – FREQUENCIA COMPORTAMENTAL DOS MEMBROS DE UMA COMUNIDADE

QUANTO AO HÁBITO DE ASSISTIR O HORÁRIO POLITICO TELEVISIVO

1150

2500

31,50% 68,50% 0

500

1000

1500

2000

2500

3000

SIM NÃO

Page 26: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

26

10.2 GRÁFICO DE SETORES (PIZZA):

O gráfico de setores pode ser utilizado tanto para variáveis quantitativas como para

variáveis qualitativas. Este gráfico também possui a peculiaridade de facilitar a visualização de

resultados, especialmente quando se trata de porcentagens.

GRÁFICO 10. 2 – PORCENTAGENS DOS MEMBROS DE UMA COMUNIDADE QUE POSSUEM O

HÁBITO DE ASSISTIR O HORÁRIO POLÍTICO TELEVISIVO

O Gráfico é construído com base em um círculo, e é empregado sempre que desejamos

ressaltar a participação do dado no total.

O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes.

Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série.

Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total da

série corresponde à 360o.

Temos

3650 - 3600 x1 = 113,4 x1 = 113

o

1150 - x x2 = 246,6 x2 = 247o

Notas:

O gráfico em setores só deve ser empregado quando há, no máximo, sete dados.

Se a série já apresenta os dados percentuais, obtemos os respectivos valores em graus

multiplicando o valor percentual por 3,6.

10.3 DIAGRAMAS DE DISPERSÃO:

Às vezes temos dados emparelhados de uma forma que associa cada valor de um conjunto

a um determinado valor de um segundo conjunto. Um diagrama de dispersão é um gráfico dos

dados emparelhados (x, y), com um eixo x horizontal e um eixo y vertical. Para construir

manualmente um diagrama de dispersão, traçamos um eixo horizontal para os valores da primeira

31,50%

68,50%

Page 27: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

27

variável e um eixo vertical para os valores da segunda variável e marcamos os pontos. O padrão dos

pontos assim marcados costuma ajudar a determinar se existe algum relacionamento entre as duas

variáveis.

Exemplo: O gráfico de dispersão abaixo mostra a estatura de um grupo de alunos do Curso

Superior de Tecnologia de Alimentos do CEFET-PR, Unidade de Medianeira, em função da ordem

de coleta.

Tabela 10.2 - ESTATURA DOS ALUNOS DA TURMA A-51, DO CEFET-PR, UNIDADE MEDIANEIRA.

2o SEMESTRE 2003

ALUNOS ESTATURA ALUNOS ESTATURA

1 178 10 160

2 165 11 167

3 168 12 173

4 169 13 167

5 165 14 174

6 168 15 160

7 183 16 160

8 175 17 160

9 167 18 166

O gráfico de dispersão é um importante instrumento de análise preliminar sobre o

comportamento de um conjunto de dados. No gráfico acima é possível visualizar, mesmo que

subjetivamente, como se comporta a variável estatura dos alunos da turma A-51.

155

160

165

170

175

180

185

0 5 10 15 20

es

tatu

ra

alunos

Page 28: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

28

10.4 HISTOGRAMA (OU OGIVA DE GALTON):

O histograma é um gráfico formado por um conjunto de colunas retangulares. No eixo das

abscissas marcamos as classes, cujas amplitudes correspondem às bases dos retângulos. No eixo das

ordenadas marcamos as frequências absolutas, que correspondem às alturas dos retângulos. Os

pontos médios das bases dos retângulos coincidem com os pontos médios dos intervalos de classes.

Os dados da Tabela 10.2 podem ser organizados em uma distribuição de frequência, tal

como na tabela abaixo.

Tabela 10.3 – DISTRIBUIÇÃO DE FREQUENCIA PARA ESTATURA DOS ALUNOS DA TURMA A-51

CLASSES FREQUENCIAS

160 | 165 4

165 | 170 9

170 | 175 2

175 | 180 2

180 | 185 1

A organização dos dados como na Tabela 10.3 facilita a construção do histograma. Observe

que cada um dos intervalos deve-se construir um retângulo de área proporcional à frequência

absoluta respectiva.··.

Page 29: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

29

10.5 DIAGRAMA DE PARETO:

Consideremos a afirmação: De 75.200 mortes por acidente nos EUA, em um ano recente,

43.500 foram causados por veículos motorizados, 12.200 por quedas, 6.400 por envenenamento,

4.600 por afogamentos, 4.200 por incêndios, 2.900 por ingestão de alimentos ou de um objeto, e

1.400 por armas de fogo (com base em dados do conselho de Segurança Nacional). O ponto fraco

dessa afirmação escrita é não caracterizar bem um relacionamento entre categorias diferentes de

dados qualitativos. Uma forma mais conveniente de indicar relações entre dados qualitativos é a

construção de um diagrama de Pareto.

Um Diagrama de Pareto é um gráfico em barras pra dados qualitativos, com as barras

ordenadas de acordo com a frequência. Tal como no caso dos histogramas, as escalas verticais em

um diagrama de Pareto podem representar frequências absolutas ou frequências relativas. A barra

mais alta fica à esquerda, e as barras menores na extrema direita. Dispondo as barras por ordem de

frequência, o diagrama de Pareto focaliza a atenção sobre as categorias mais importantes.

Page 30: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

30

Segundo o gráfico construído acima, podemos ver que as mortes acidentais causadas por

veículos motorizados representam um problema muito mais sério do que as outras categorias.

Embora as mortes acidentais causadas por armas de fogo mereçam considerável atenção dos jornais,

elas constituem um problema relativamente pequeno quando comparadas com as outras categorias.

10.6 GRÁFICO POLÍGONO DE FREQÜÊNCIA:

O polígono de frequência também é estruturado a partir da tabela de frequência, tal qual o

histograma.

Define-se o gráfico polígono de frequência como um gráfico de linha, onde os pontos a

serem conectados pela linha são os pontos médios dos intervalos de classe para as abscissas com as

correspondentes frequências para as ordenadas.

TABELA 10.4 – PONTOS MÉDIOS DOS INTERVALOS DE CLASSE E FREQUENCIAS PARA ESTATURA

DOS ALUNOS DA TURMA A-51

PONTO MÉDIO DOS

INTERVALOS DE CLASSES

FREQÜÊNCIAS

160,0 0

162,5 4

167,5 9

172,5 2

177,5 2

182,5 1

185,0 0

Page 31: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

31

10.7 GRÁFICO POLÍGONO DE FREQUÊNCIA ACUMULADA (OU OGIVA):

Trata-se de um gráfico importante na análise dos resultados de uma variável, uma vez que

em cada valor da abscissa a partir do valor mínimo, corresponde a frequência acumulada. Neste

caso também a construção de uma Tabela facilita a construção do gráfico.

O polígono de frequência acumulada pode ser definido como um dos gráficos de linhas,

ligadas aos pontos correspondentes ao limite superior dos intervalos de classes para as abscissas e

as frequências acumuladas para as ordenadas. Destaca-se que o primeiro ponto deve ser o valor

mínimo dos dados para a variável independente x e zero para a ordenada.

Tabela 10.5 – DISTRIBUIÇÃO DE FREQUENCIA ACUMULADA PARA ESTATURA DOS ALUNOS

DA TURMA A-51

CLASSES FREQUENCIAS FREQUENCIA ACUMULADA

160 | 165 4 4

165 | 170 9 13

170 | 175 2 15

175 | 180 2 17

180 | 185 1 18

Page 32: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

32

10.8 PICTOGRAMA:

O gráfico que utiliza desenhos para representar um conjunto de dados é denominado

pictograma.

Os gráficos pictogramas são muitos usados na mídia, imprensa escrita e apresentações

visuais. Para elaboração desse tipo de gráfico, é comum a inserção de figuras relacionadas com a

variável em estudo, substituindo representando os elementos dos gráficos gerados.

- Pictograma do Histograma da Estatura dos alunos da turma A-51

AULA 3 - Exercícios

1) Pergunte aos colegas da sua turma de aula qual a disciplina que cada um mais gosta no semestre

e qual é a que cada um menos aprecia. Faça um gráfico de barras para representar os resultados.

2) Os alunos do primeiro ano do Ensino Médio do CEFET-PR, turma M12, fizeram uma prova de

Matemática e obtiveram as seguintes notas:

5 8 5 6 7 5 6 8

4 7 5 5 5 8 5 6

2 5 6 0 6 5 6 7

6 6 7 2 7 6 8 3

4 9 0 1 7 6 3 4

Construa a partir destas notas, os gráficos de:

a. Dispersão

b. Polígono de frequência

c. Frequência Acumulada

d. Histograma

3) Em um mercado de telefones celulares da Região Oeste do Paraná, considerando-se uma fatia de

mercado meramente ilustrativa, obtiveram-se os resultados conforme descritos na tabela abaixo:

Page 33: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

33

MARCAS PARTICIPAÇÃO NO MERCADO

Nokia 60%

Ericson 20%

Gradiente 15%

Motorola 5%

TOTAL 100%

Construa um gráfico de setores.

4) Baseando-se no gráfico, responda às questões a seguir:

a. Qual o assunto de que ele trata?

b. Quantas pessoas contaminadas pelo vírus da Aids morreram em 1995? E em 1999?

c. Em que ano se deu a maior contaminação pelo vírus da Aids? Qual o número de pessoas

contaminadas?

d. Qual a porcentagem de mulheres contaminadas pelo vírus da Aids de 1995 a 1999 em

relação ao total de pessoas contaminadas?

5) Analise o gráfico a seguir e responda:

a. De que trata o gráfico em questão?

b. A que tipo de informação o consumidor brasileiro tem menos acesso? Qual a

porcentagem correspondente?

6) O quadro mostra a distribuição dos salários mensais (agrupados em classes) de 40 empregados de

uma firma.

Page 34: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

34

SALÁRIO (EM REAIS) NÚMERO DE EMPREGADOS (fi)

800 | 900 4

900 | 1000 10

1000 | 1100 18

1100 | 1200 5

1200 | 1300 3

Nessas condições:

a. Qual é a amplitude do intervalo de classe?

b. Elabore um quadro de distribuição de frequências acumuladas, relativas e relativas

acumuladas. A seguir, construa o histograma de frequências.

c. Quantos empregados ganham menos que R$ 1.000,00 mensais? d. Qual o índice, em porcentagem, de empregados que ganham R$ 1.000,00 mensais ou

mais.

e. Quantos empregados ganham entre R$ 800,00 (inclusive) e R$ 1200,00?

f. Qual é o índice, em porcentagem, de empregados que ganham menos que R$ 1 000,00?

7) No quadro a seguir estão registradas as massas, em quilogramas, de 50 pessoas que frequentam

uma academia de ginástica.

72 81 57 64 87 90 74 69 77 73

80 96 55 58 88 92 47 60 68 80

77 76 59 57 83 81 90 68 65 74

91 97 86 82 73 64 69 71 88 94

77 72 81 91 49 75 52 50 63 70

a. Escolha um intervalo com amplitude conveniente e elabore um quadro de distribuição de

frequências absolutas e relativas.

b. Construa o histograma para a distribuição.

c. Calcule os pontos médios dos intervalos e represente a distribuição por meio de um

polígono de frequências.

d. Represente essa distribuição por meio de um gráfico de setores com as respectivas

frequências relativas.

8) No laboratório de Eletromecânica, um aluno pesquisador testa cinco diferentes ligas metálicas

para resistência de tensores. O experimento foi efetuado com diversos ensaios relativos às diferentes

ligas. Os resultados obtidos constam da Tabela abaixo:

Page 35: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

35

MATERIAL

TESTADO RESULTADO DOS ENSAIOS

Liga metálica 1 12,4 19,8 15,2 14,8 18,5

Liga metálica 2 8,9 11,6 10 10,3 9,8

Liga metálica 3 10,5 13,8 12,1 11,9 12,6

Liga metálica 4 16,4 15,9 17,8 20,3 18,5

Liga metálica 5 12,8 14,2 15,9 14,1 14,8

Com base nos dados obtidos, construa:

a. Um gráfico de linhas que relacione os valores dos ensaios em funções das ligas.

b. Um gráfico de colunas para cada tipo de liga.

c. Um gráfico de dispersão dos resultados em função das ligas.

Page 36: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

36

AULA 4

11. MEDIDAS DE POSIÇÃO

As medidas de posição permitem ao pesquisador verificar a distribuição e o

comportamento de dados no intervalo fechado [Valor mínimo; Valor máximo].

Entre as medidas de posição citam-se a média aritmética, a mediana e a moda, conhecidas

como medidas de tendência central. As separatrizes também são denominadas medidas de posição:

1o, 2

o e 3

o quartis, decis e percentis. O segundo quartil equivale à mediana.

11.1 MÉDIA ARITMÉTICA ( x ):

Média aritmética é o quociente da divisão da soma dos valores das variáveis pelo número

deles:

n

xx

i

sendo:

x = a média aritmética

ix = os valores da variável

n = o número de valores.

11.1.1 DADOS NÃO AGRUPADOS:

Quando desejamos conhecer a média dos dados não agrupados, determinamos a média

aritmética simples.

Exemplo: Relacionam-se há seguir os tempos (em anos) que os 10 primeiros presidentes

americanos sobreviveram à posse. Calcule a média dessa amostra:

10 29 26 28 15 23 17 25 0 20

Solução:

x = 10 + 29 + 26 + 28 + 15 + 23 + 17 + 25 + 0 + 20 = 193

3,1910

193x

A média é 19,3 anos.

Page 37: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

37

11.1.2 DESVIO EM RELAÇÃO À MÉDIA:

Denomina-se desvio em relação à média a diferença entre cada elemento de um conjunto

de valores e média aritmética.

Designando o desvio por di , temos:

xxd ii

Para o exemplo dado, temos:

di = 10 – 19,3 = - 9,3 d6 = 23 – 19,3 = 3,7

d2 = 29 – 19,3 = 9,7 d7 = 17 – 19,3 = - 2,3

d3 = 26 – 19, 3 = 6,7 d8 = 25 – 19,3 = 5,7

d4 = 28 - 19,3 = 8,7 d9 = 0 - 19,3 = - 19,3

d5 = 15 – 19, 3 = - 4,3 d10 = 20 – 19,3 = 0,7

11.1.3 PROPRIEDADES DA MÉDIA:

1a Propriedade: A soma dos desvios tomados em relação à média é nula.

n

i

id1

0

No exemplo anterior, temos:

10

1i

id - 9,3 + 9,7 + 6,7 + 8,7 + (- 4,3) + 3,7 + (- 2,3) + 5,7 + (- 19,3) + 0,7 = 0

2a Propriedade: Somando-se (ou subtraindo-se) uma constante (c) de todos os valores de

uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante.

cxycxy ii

Somando 2 a cada um dos valores da variável do exemplo dado, temos:

y1 = 12, y2 = 31, y3 28, y4 = 30, y5 = 17, y6 = 25, y7 = 19, y8 = 27, y9 = 2 e y10 = 22

10

1i

iy 12 + 31 + 28 + 30 + 17 + 25 + 19 + 27 + 2 + 22 = 213

Como n = 10, vem: 223,193,213,2110

213 xyyy

3a Propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por

uma constante (c), a média do conjunto final fica multiplicado (ou dividido) por essa constante.

cxycxy ii

ou c

xy

c

xy i

i

Page 38: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

38

11.1.4 DADOS AGRUPADOS:

11.1.4.1 Sem intervalo de classe:

Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável

o número de filhos do sexo masculino.

Tabela 11.1

No

DE MENINOS fi

0 2

1 6

2 10

3 12

4 4

= 34

Neste caso, como as frequências são números indicadores da intensidade de cada valor da

variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética

ponderada, dada pela fórmula:

i

ii

f

fxx

O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna

correspondente aos produtos xifi:

Tabela 11.2

xi fi xifi

0 2 0

1 6 6

2 10 20

3 12 36

4 4 16

= 34 = 78

Logo:

i

ii

f

fxx 3,229,2

34

78 xx meninos

Nota:

Page 39: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

39

Sendo x uma variável discreta, como interpretar o resultado obtido, 2 meninos e 3 décimos

de menino?

O valor médio 2,3 meninos sugere, neste caso, que o maior número de famílias tem 2

meninos e 2 meninas, sendo, porém, a tendência geral de uma leve superioridade numérica

em relação ao número de meninos.

11.1.4.2 Com intervalos de classe:

Neste caso, convencionamos que todos os valores incluídos em um determinado

intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética

ponderada por meio da fórmula:

i

ii

f

fxx onde xi é o ponto médio da classe.

Consideremos a distribuição:

Tabela 11.3

i ESTATURAS (cm) fi

1 150 | 154 4

2 154 | 158 9

3 158 | 162 11

4 162 | 166 8

5 166 | 170 5

6 170 | 174 3

= 40

Pela mesma razão do caso anterior, vamos, inicialmente, abrir uma coluna para os pontos

médios e outra para os produtos xifi:

Tabela 11.4

i ESTATURAS (cm) fi xi xifi

1 150 | 154 4 152 608

2 154 | 158 9 156 1404

3 158 | 162 11 160 1760

4 162 | 166 8 164 1312

5 166 | 170 5 168 840

6 170 | 174 3 172 516

= 40 = 6440

Page 40: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

40

Logo:

i

ii

f

fxx 161161

40

6440 xx cm

11.2 A MODA (MO)

Denominamos moda o valor que ocorre com maior frequência em uma série de valores, ou

seja, é o valor de maior frequência absoluta.

Desse modo, o salário modal dos empregados de uma indústria é o salário mais comum,

isto é, o salário recebido pelo maior número de empregados dessa indústria.

11.2.1 DADOS NÃO AGRUPADOS:

Quando lidamos com valores não agrupados, a moda é facilmente reconhecida: basta, de

acordo com a definição, procurar o valor que mais se repete.

A série de dados:

7, 8, 9, 10, 10, 10, 10, 11, 12, 13, 15

tem moda igual a 10.

Podemos, entretanto, encontrar séries nas quais não exista valor modal, isto em nas quais

nenhum valor apareça mais vezes que outros. É o caso da série:

3, 5, 8, 10, 11, 13, 15

que não apresenta moda, então dizemos que é amodal.

Em outros casos, ao contrário, pode haver dois ou mais valores de concentração. Dizemos,

então, que a série tem dois ou mais valores modais. Na série:

2, 3, 4, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9

temos duas modas: 4 e 7, o conjunto se diz bimodal.

Se mais de dois valores ocorrem com a mesma frequência máxima, cada uma deles é uma

moda, e o conjunto é multimodal.

Page 41: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

41

11.2.2 DADOS AGRUPADOS:

11.2.2.1 Sem intervalo de classe:

Uma vez agrupado os dados, é possível determinar imediatamente a moda: basta fixar o

valor da variável de maior frequência.

Na distribuição da Tabela 11.1, à frequência máxima (12) corresponde o valor 3 da

variável. Logo:

Mo = 3

11.2.2.2 Com intervalo de classe:

A classe que apresenta a maior frequência é denominada classe modal. Pela definição,

podemos afirmar que a moda, neste caso, é o valor dominante que esta compreendido entre os

limites da classe modal.

O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe

modal.

Damos a esse valor a denominação de moda bruta.

Temos então:

2

LlMo

, onde l é o limite inferior da classe modal e L é o limite superior.

Assim, para a distribuição da Tabela 11.3, temos que a classe modal é i = 3, l = 158 e L =

162.

Logo:

1602

320

2

162158

Mo

11.3 A MEDIANA (MD):

A mediana é outra medida de posição definida como o número que se encontra no centro de

uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana

de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal

forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos.

11.3.1 DADOS NÃO AGRUPADOS:

Dada uma série de valores, como por exemplo:

5, 13, 10, 2, 18, 15, 6, 16, 9

Page 42: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

42

de acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (ordem

crescente ou decrescente) dos valores:

2, 5, 6, 9, 10, 13, 15, 16, 18

Em seguida, tomamos aquele valor central que apresenta o mesmo número de elementos à

direita e à esquerda. Em nosso exemplo, esse valor é 10, já que nessa série, há quatro elementos

acima dele e quatro abaixo. Temos então:

Md = 10

Se porém, a série dada tiver um número par de termos, a mediana será, por definição,

qualquer dos números compreendidos entre os dois valores centrais da série. Convencionou-se

utilizar o ponto médio

Assim, a série de valores:

2, 6, 7, 10, 12, 13, 18, 21

tem para mediana a média aritmética entre 10 e 12.

Logo:

11112

22

2

1210

MdMd

Verificamos que, estando ordenados os valores de uma série e sendo n o número de

elementos da série, o valor mediano será:

o termo de ordem 2

1n, se n for ímpar

a média aritmética dos termos de ordem 2

ne 1

2

n, se n for par.

Notas:

A mediana e a média aritmética não tem necessariamente, o mesmo valor.

A mediada, como vimos, depende da posição e não dos valores dos elementos na série

ordenada. Essa é uma diferença marcante entre a mediana e a média (que se deixa influenciar,

e muito, pelos valores extremos).

A mediana designada, muitas vezes, por valor mediano.

11.3.2 DADOS AGRUPADOS:

Se os dados se agrupam em uma distribuição de frequência, o cálculo da mediana se

processa de modo muito semelhante aquele dos dados não agrupados, implicando porém, a

determinação prévia das frequências acumuladas. Ainda aqui, temos que determinar um valor tal

que divida a distribuição em dois grupos que contenham o mesmo número de elementos.

Page 43: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

43

Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é

dada por:

2

if

11.3.2.1 Sem intervalo de classes:

Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade

da soma das frequências. A mediana será aquele valor da variável correspondente a tal frequência

acumulada.

Tomemos a distribuição relativa a Tabele 11.1, completando-a com a coluna correspondente

à frequência acumulada:

Tabela 11.5

No DE MENINOS fi fia

0 2 2

1 6 8

2 10 18

3 12 30

4 4 34

= 34

Sendo:

2

if= 17

2

34

a menor frequência acumulada que supera esse valor é 18, que corresponde ao valor 2 da

variável, sendo este valor mediano. Logo, Md = 2 meninos

Nota:

No caso de existir uma frequência acumulada (fia), tal que: 2

if

iaf , a mediana será

dada pela média aritmética entre o valor da variável correspondente a essa frequência

acumulada e o seguinte.

Exemplo:

Page 44: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

44

Tabela 11.6

xi fi fia

12 1 1

14 2 3

15 1 4

16 2 6

17 1 7

20 1 8

= 8

Temos:

8/2 = 4

Logo, 5,152

31

2

1615

Md

2

1 ii xx

Md

Onde:

Md = 15,5

11.3.2.2 Com intervalos de Classe:

Neste caso o problema consiste em determinar o ponto do intervalo em que esta

compreendida a mediana.

Para tanto, temos inicialmente que determinar a classe na qual se acha a mediana – classe

mediana. Tal classe será, evidentemente, aquela correspondente a frequência acumulada

imediatamente superior a 2

if.

Feito isso, um problema de interpolação (inserção de uma determinada quantidade de

valores entre dois números) resolve a questão, admitindo-se agora, que os valores se distribuam

uniformemente em todo o intervalo de classe.

Assim, considerando a distribuição da Tabela 11.3, acrescida das frequências acumuladas:

Page 45: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

45

Tabela 11.7

i ESTATURAS (cm) fi fia

1 150 | 154 4 4

2 154 | 158 9 13

3 158 | 162 11 24

4 162 | 166 8 32

5 166 | 170 5 37

6 170 | 174 3 40

= 40

Temos:

2

if= 20

2

40

Como há 24 valores incluídos nas três primeiras classes da distribuição, a partir do início da

série, vemos que este deve estar localizado na terceira classe (i = 3), supondo que as frequências

dessas classes estejam uniformemente distribuídas.

Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar, a

partir do limite inferior, à distância:

11

284

11

1320

e a mediana será dada por:

54,16011

28158 Md

Logo, Md = 160,5 cm.

Na prática executamos os seguintes passo:

1o) Determinamos as frequências acumuladas

2o) Calculamos

2

if

3o) Marcamos a classe correspondente à frequência acumulada imediatamente

superior a 2

if - classe mediana – e, em seguida, empregamos a fórmula:

Page 46: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

46

i

ia

i

f

hantff

lMd

)(

2

onde:

l é o limite inferior da classe mediana

fia(ant) é a frequência acumulada da classe anterior à classe mediana

fi é a frequência simples da classe mediana

h é a amplitude do intervalo da classe mediana.

11.4 POSIÇÃO RELATIVA DA MÉDIA, MEDIANA E MODA:

Quando uma distribuição é simétrica, as três medidas coincidem. Porém, a assimetria

torna-as diferente e essa diferença é tanto maior quanto maior é a assimetria. Assim, em uma

distribuição em forma de sino, temos:

MoMdx , no caso da curva simétrica;

xMdMo , no caso da curva assimétrica positiva;

MoMdx , no caso da curva assimétrica negativa.

Page 47: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

47

AULA 04 - Exercícios

1) Complete o esquema para o cálculo da média aritmética da distribuição de frequência.

CUSTO (R$) 450 | 550 | 650 | 750 | 850 | 950 | 1050 | 1150

fi 8 10 11 16 13 5 1

Temos:

xi fi xi fi

1 500 8 4000

2 10

3 11

4 16

5 13

6 5

7 1100 1

= =

Logo: ..............

.......x onde x = R$ 755

2) No ano 2000, o número de nascimentos, por mês, em uma maternidade foi:

Mês

Jan

Fev

Ma

r Ab

r Ma

io

Jun

Jul

Ago

Set

Out

Nov

Dez

Nascimento 38 25 42 30 29 47 18 36 38 43 49 37

a) Calcule a média de nascimentos.

b) Em que meses o número de nascimentos ficou acima da média?

3) A classificação final para um determinado curso é a média ponderada das provas de capacidade

geral, com peso 3, e das provas de capacidade especifica, com peso 2. Nessas condições, qual é

a classificação final de um aluno que obteve 162 pontos na prova de capacidade geral e 147

pontos na prova de capacidade específica?

Page 48: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

48

4) O quadro de distribuição de frequência representa os salários mensais de 40 empregados de

uma firma. Calcule o salário médio mensal dos empregados dessa firma.

CLASSE (em R$) Ponto Médio da Classe Frequência (fi )

180 | 200 190 4

200 | 220 210 18

220 | 240 230 10

240 | 260 250 5

260 |280 270 3

5) É dado um conjunto de 20 números cuja média aritmética é 64. Cada número desse conjunto é

multiplicado por 2 e, em seguida, acrescido de 5 unidades. Qual é a média aritmética dos 20

números assim obtidos?

6) A média das idades de um grupo de estudantes é 22 anos. Excluindo-se o mais novo deles, que

tem 17 anos, a média do novo grupo formado passa a ser 23 anos. Quantos estudantes há no

primeiro grupo?

7) Um comerciante mistura 4 kg do café tipo A, que custa R$ 6,00 o quilo; 10 kg do café B, que

custa R$ 5,60 o quilo; e 6 kg do café C, que custa R$ 5,00 o quilo. Qual o preço por quilo da

mistura?

8) Para ser aprovado em uma disciplina, o aluno precisa ter média maior ou igual a 5,0, obtida

num conjunto de cinco provas, sendo quatro parciais, com peso 1 cada, e uma prova-exame,

com peso 2. Um aluno obteve, nas quatro provas parciais, notas iguais a 3,0; 6,0; 5,0 e 7,0.

Calcule a nota mínima que esse aluno deverá obter na prova-exame para ser aprovado.

9) As marcas obtidas, em metros, pelos alunos numa prova de salto em distancia foram as

seguintes

2,20 2,28 2,23 2,20 2,35 2,28 2,25 2,30 2,37

Calcule a média, a mediana e a moda dessa distribuição.

10) O quadro de frequências a seguir, refere-se às idades dos jogadores de basquete de um clube.

ID

ADE

NÚMERO DE

JOGADORES

xi fi

16 6

14 12

15 15

20 24

23 9

Qual será a mediana dos dados nesse caso?

Page 49: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

49

11) Em uma casa de repouso, as pessoas internadas tem as seguintes idades:

67 68 74 67 68 84 75 80 75 84

75 73 67 74 78 77 75 80 74 77

85 85 68 74 72 73 71 73 71 85

68 84 80 77 78 75 71 72 73 84

Calcule a mediana e a moda dessa distribuição.

12) Complete o esquema para o cálculo da mediana das distribuições:

xi 2 4 6 8 10

fi 3 7 12 8 4

Temos:

xi fi fia

2 3

4 7 10

6 12

8 8 30

10 4

=

Como:

...........2

......

2

if vem: Md=.................

13) Complete o esquema para o cálculo da mediana da distribuição de frequência:

CUSTO (R$) 450 | 550 | 650 | 750 | 850 | 950 | 1050 | 1150

fi 8 10 11 16 13 5 1

Temos:

i CUSTOS (R$) fi fia

1 450 | 550 8 8

2 550 | 650 18

3 650 | 750

4 750 | 850

5 850 | 950

6 950 | 1050

7 1050 | 1150

=

Page 50: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

50

...........2

......

2

if

l =................., fia (ant) = .................., fi = .................... e h = ......................

Logo:

..............................................

....................

...............

.)...................(...................

Md

isto é:

Md = R$ 769

Page 51: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

51

AULA 5

11.5 AS SEPARATRIZES:

Como vimos, a mediana caracteriza uma série de valores devido à sua posição central. No

entanto, ela apresenta uma outra característica, tão importante quanto a primeira: ela separa a série

em dois grupos que apresentam o mesmo número de valores.

Assim, além das medidas de posição que estudamos, há outras que, consideradas

individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à

sua segunda característica, já que se baseiam em sua posição na série. Essas medidas – os quartis,

os percentis e os decis – são, juntamente com a mediana, conhecidas pelo nome genérico de

separatrizes.

11.5.1 OS QUARTIS:

Denominamos, quartis os valores de uma série que a dividem em quatro partes iguais.

Há portanto, três quartis:

a) O primeiro quartil (Q1) – valor situado de tal modo na série que uma quarte parte

(25%) dos dados é menor que ele e as três quartas partes restantes (75%) são

maiores.

b) O segundo quartil (Q2) – evidentemente, coincide com a mediana (Q2 = Md)

c) O terceiro quartil (Q3) – valor situado de tal modo que as três quartas partes (75%)

dos termos são menores que ele e uma quarta parte (25%) é maior.

Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do

cálculo da mediana, bastando substituir, na fórmula da mediana 2

if por:

4

ifk sendo k o

número de ordem do quartil.

Assim temos: i

ia

i

kf

hantffk

lQ

)(

4

Exemplo:

Page 52: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

52

Tabela 11.8

Primeiro Quartil Terceiro Quartil

104

40

4

if 30

4

403

4

3

if

66,156

9

44101541

Q

165

8

424301623

Q

cmQ 7,1561 cmQ 1653

11.5.2 OS PERCENTIS:

Denominamos percentis os noventa e nove valores que separam uma série de 100 iguais.

Indicamos por P1, P2,....,P32,....,P99.

É evidente que:

P50 = Md, P25 = Q1 e P75 = Q3

O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém, a fórmula

2

if será substituída por:

100

ifk sendo k o número de ordem do percentil.

Assim temos: i

iai

kf

hantffk

lP

)(

100

Exemplo: Considerando a Tabela 11.8, temos para o oitavo percentil:

2,3100

408

100

88

ifk

Logo: 2,1534

4)02,3(1508

P

ESTATURAS (cm) fi fia

150 | 154 4 4

154 | 158 9 13 ← (Q1)

158 | 162 11 24

162 | 166 8 32 ← (Q3)

166 | 170 5 37

170 | 174 3 4

= 40

Page 53: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

53

AULA 05 - EXERCÍCIOS

1) Calcule do primeiro quartil, o terceiro quartil e o vigésimo percentil da distribuição de

frequência:

CUSTO (R$) 450 | 550 | 650 | 750 | 850 | 950 | 1050 | 1150

fi 8 10 11 16 13 5 1

i CUSTOS (R$) fi fia

1 450 | 550 8 8

2 550 | 650 10 18 ← (Q1)

3 650 | 750 11 29

4 750 | 850 16 45

5 850 | 950 13 58 ← (Q3)

6 950 |1050 5 63

7 1050 | 1150 1 64

∑ = 64

2) Calcule a média aritmética, a mediana, a moda, o primeiro e o terceiro quartis, o 10o, o 1

o, o 23

o,

o 15o e o 90

o percentis das distribuições de frequência abaixo:

a) b)

NOTAS fi

0 | 2 5

2 | 4 8

4 | 6 14

6 | 8 10

8 | 10 7

∑ = 44

ESTATURAS (cm) fi

150 | 158 5

158 | 166 12

166 | 174 18

174 | 182 27

182 | 190 8

∑= 70

Page 54: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

54

c) d)

3) Determine os desvios em relação à média dos seguintes dados: 6, 8, 5, 12, 11, 7, 4, 15. Qual a

soma dos desvios?

4) Em uma classe com 50 alunos, as notas obtidas formaram a seguinte distribuição:

Notas 2 3 4 5 6 7 8 9 10

NO DE ALUNOS 1 3 6 10 13 8 5 3 1

Calcule:

a) a nota média

b) a nota mediana

c) a nota modal

5) Considerando a distribuição abaixo:

xi 3 4 5 6 7 8

fi 4 8 11 10 8 3

Calcule:

a) a média

b) a mediana

c) a moda

6) Os salários-hora de cinco funcionários de uma companhia são: R$75, R$ 90, R$ 83, R$ 142 e R$

88. Determine:

a) a média dos salários-hora

b) o salário-hora mediano.

7) Considere o conjunto de dados:

a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6

b) 20, 9, 7, 2, 12, 7, 20, 15, 7

c) 51, 6; 48,7; 50,3; 49,5; 48,9

d) 15, 18, 20, 13, 10, 16, 14

Calcule:

I. a média

II. a mediana

III. a moda

SALÁRIOS (R$) fi

500 | 700 18

700 | 900 31

900 | 1100 15

1100 | 1300 3

1300 | 1500 1

1500 | 1700 1

1700 | 1900 1

∑ = 70

PESOS (kg) fi

145 |151 10

151 | 157 9

157 | 163 8

163 | 169 6

169 | 175 3

175 | 181 3

181 | 187 1

∑ = 40

Page 55: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

55

AULA 6

12. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE

As medidas de dispersão medem a variabilidade dos dados em estudo. As medidas de

dispersão como amplitude, variância, desvio padrão e coeficiente de variação, permitem verificar se

o conjunto de dados é homogêneo ou heterogêneo.

12.1 AMPLITUDE:

Amplitude total ou máxima é a diferença entre o maior e o menor valor de um conjunto de

dados. O cálculo e a interpretação da amplitude máxima é muito fácil. Como no caso da estatura da

Tabela 11.4, a amplitude máxima é dada pela diferença entre 174 e 150cm, ou seja, 24 cm. Logo, a

estatura dos alunos em questão vaia de 24 cm.

A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da

série, descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade

do resultado. Ela é apenas uma indicação aproximada da dispersão ou variabilidade.

Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um

dia ou no ano, no controle de qualidade ou como uma medida de cálculo rápido, e quando a

compreensão popular é mais importante que a exatidão e a estabilidade.

12.2 DESVIO MÉDIO:

A média aritmética dos valores absolutos dos desvios para a média é uma medida de

dispersão chamada desvio médio, que se indica por dm.

Quando os dados da distribuição estão agrupados, a fórmula para o cálculo do desvio médio

é:

n

i

i

i

n

i

i

m

f

xxf

d

1

1

Exemplo:

1) A tabela abaixo mostra o total de pontos obtidos por dois times de futebol no período de 1996 a

2000.

1996 1997 1998 1999 2000

TIME A 7 12 20 16 10

TIME B 18 16 15 9 12

Page 56: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

56

Qual o desvio médio de cada um desses times?

Time A:

Vamos calcular a média aritmética dos dados:

13

5

101620127

x

Vamos calcular os desvios para a média, ou seja x1- x

7 - 13 = - 6 16 – 13 = 3

12 – 13 = - 1 10 – 13 = - 3

20 – 13 = 7

Finalmente, vamos calcular o desvio médio:

45

|3||3||7||1||6|

md

Logo, o desvio médio do time A é 4

Time B:

A média aritmética é igual a:

145

129151618

x

Os desvios para as médias são iguais a:

18 – 14 = 4 15 – 14 = 1 12 – 14 = - 2

16 – 14 = 2 9 – 14 = - 5

O desvio médio é igual a:

8,25

|2||5||1||2||4|

md

Logo, o desvio médio do time A é 2,8

Qual o time mais regular nesse período?

Como o desvio médio do time B é menor que o desvio médio do time a (2,8 < 4), o time B é

o mais regular.

2) Considere a distribuição de frequência representada pelo quadro abaixo e determine:

a) a média aritmética

b) o desvio médio

I Classe fi

1 O | 4 2

2 4 | 8 6

3 8 | 12 8

4 12 | 16 3

5 16 | 20 1

Page 57: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

57

Tomando como base essa distribuição, vamos fazer um quadro mais completo, que nos

permite calcular a média, os desvios em relação à média e o desvio médio.

i Classe Ponto médio da classe if

ii xf . xxi xxf ii

1 0 | 4 2 2 4 7 14

2 4 | 8 6 6 36 3 18

3 8 | 12 10 8 80 1 8

4 12 | 16 14 3 42 5 15

5 16 | 20 18 1 18 9 9

∑=20 ∑= 180 ∑= 64

920

1805

1

5

1

i

i

i

ii

f

xf

x 2,3

20

645

1

5

1

i

i

i

i

i

m

f

xxf

d

Logo o valor da média aritmética é 9 e o desvio médio tem valor 3,2

12.3 DESVIO PADRÃO:

Ao iniciar as análises de um agrupamento de dados, a média permite que se estabeleça um

juízo sobre tal conjunto. Porém, não permite avaliar a dispersão, principalmente para conjunto de

dados numerosos.

O desvio padrão foge a falha que ocorre na amplitude, por levar em conta todos os valores

em questão. Portanto, o desvio padrão é muito mais conveniente no cálculo da dispersão.

O desvio padrão é definido como a raiz quadrada da média dos quadrados dos desvios.

n

xxs

i

2

Se bem que a fórmula dada para o cálculo do desvio seja a que torna mais fácil a sua

compreensão, ela não é uma boa fórmula para fins de computação, pois, em geral, a média

aritmética ( x ) é um número fracionário, o que torna pouco prático o cálculo das quantidades

2)( xxi .

Para simplificar os cálculos , usamos a seguinte fórmula:

22

n

x

n

xs

ii

Page 58: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

58

12.3.1 PROPRIEDADES DO DESVIO PADRÃO

O desvio padrão goza de algumas propriedades, dentre as quais destacamos:

1a Propriedade: Somando-se (ou subtraindo-se) uma constante de todos os valores de uma

variável, o desvio padrão não se altera.

2a Propriedade: Multiplicando-se todos os valores de uma variável por uma constante

(diferente de zero), o desvio padrão fica multiplicado por essa constante.

12.3.2 DADOS NÃO- AGRUPADOS:

Tomemos, como exemplo, o conjunto de valores da variável x:

40 45 48 52 54 62 70

O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas,

uma pra xi e outra para xi2.

Tabela 12.1

xi xi2

40 1600

45 2025

48 2304

52 2704

54 2916

62 3844

70 4900

∑ = 371 ∑= 20293

Como n = 7, temos:

486,9907

371

7

202932

s

logo, s = 9,49

12.3.3 DADOS AGRUPADOS:

12.3.3.1 Sem intervalo de Classe:

Como, neste caso, temos a presença de frequências, devemos levá-las em consideração,

resultando a fórmula:

22

n

xf

n

xfs

iiii

Page 59: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

59

Consideremos, como exemplo a seguinte tabela:

Tabela 12.2

O modo mais prático para se obter o desvio padrão é abrir, na tabela dada, uma colunapara

os produtos fixi e outra para fixi2, lembrando que para obter fixi

2 basta multiplicar cada fixi pelo seu

respectivo xi. Assim:

Tabela 12.3

xi fi fixi fixi2

0 2 0 0

1 6 6 6

2 12 24 48

3 7 21 63

4 3 12 48

∑ = 30 ∑ = 63 ∑ = 165

Logo:

044,109,130

63

30

1652

s

Daí: s = 1, 04

12.3.3.2 Com intervalo de classe:

Tomemos como exemplo a distribuição da seguinte Tabela 11.3.

Começaremos por abrir as colunas para xi (ponto médio), para fixi e para fixi2. Assim

Tabela 12.4

i ESTATURAS (cm) fi xi fixi fixi2

1 150 | 154 4 152 608 92416

2 154 | 158 9 156 1404 219024

3 158 | 162 11 160 1760 281600

4 162 | 166 8 164 1312 215168

5 166 | 170 5 168 840 141120

6 170 | 174 3 172 516 88752

= 40 ∑ = 6440 ∑= 1038080

xi 0 1 2 3 4

fi 2 6 12 7 3

Page 60: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

60

Logo:

567,53140

6440

40

10380802

s daí: s = 5,57

12.4 VARIÂNCIA:

A variância nada mais é do que o quadrado do desvio padrão.

12.5 COEFICIENTE DE VARIAÇÃO:

O coeficiente de variação dá uma idéia da precisão de um experimento ou da dispersão de

um conjunto de dados. É definido como o quociente entre desvio padrão e a média, multiplicado por

100. Logo, o coeficiente de variação nada mais é do que o desvio padrão em porcentagem da média.

100x

sCV

Para a distribuição da tabela 12.4, obtemos x = 161 cm e s = 5,57 cm, logo

%5,3459,3100161

57,5CV

Exemplo:

Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de

indivíduos:

x s

ESTATURAS 175 cm 5,0 cm

PESOS 68 kg 2,0 kg

Temos:

85,2100175

5ECV % e 94,2100

68

2PCV %

Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que as

estuturas.

Page 61: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

61

AULA 6 - Exercícios

1) As alturas dos jogadores de um time de basquete são, em centímetros, 195, 198, 201, 192 e 204.

Nessas condições, determine:

a) a média das alturas

b) o desvio médio

2) A tabela seguinte mostra o número de operários acidentados por mês numa fábrica, durante o ano

de 2000.

Mês

Jan.

Fev

.

Mar

.

Abri

l.

Mai

o.

Junho

Julh

o

Agost

o.

Set

.

Out.

Nov.

Dez

.

Operários 4 8 3 6 7 7 3 8 4 4 3 3

Organize uma tabela de distribuição de frequências e determine:

a) a média aritmética dessa distribuição

b) o desvio médio

3) Determine a média aritmética e o desvio médio, dos valores apresentados na tabela seguinte:

xi 2 3 4 5 6 7

fi 5 10 15 12 5 3

4) A tabela a seguir mostra o número de votos por classe de dois candidatos que estão concorrendo

a uma vaga de representante no conselho da escola.

3A 3B 3C 3D 3E 3F

VITOR 12 15 12 16 14 15

RAFAEL 12 11 18 9 19 15

Calcule o desvio padrão de cada um desses candidatos.

Qual dos dois candidatos é o mais regular?

5) Calcule a variância e o desvio padrão da seguinte distribuição:

Classe fi

O | 4 2

4 | 8 6

8 | 12 8

12 | 16 3

16 | 20 1

Page 62: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

62

6) As velocidades máximas das cinco voltas dadas em um teste de Fórmula 1, em km/h, foram: 190,

198, 196, 204 e 202. Nessas condições, determine:

a) a média das velocidades

b) a variância

c) o desvio padrão

7) Dez canções concorrentes a um festival foram apreciadas por um júri que lhes atribuiu as

seguintes pontuações: 1, 5, 4, 3, 2, 1, 1, 1, 5, 2.

a) elabore uma tabela com as frequências e com os quadrados dos desvios para a média

b) calcule a moda e a mediana

c) desvio padrão

8) O tempo gasto por seis alunos para fazer um trabalho foi, em minutos, 6, 5, 5, 3, 3, 2. Nessas

condições, calcule a média aritmética, o desvio médio, a variância e o desvio padrão dessa

distribuição.

9) Complete o esquema para o cálculo do desvio padrão, dados os valores da variável: 8, 10, 11, 15,

16, 18

xi xi2

8 64

n = ∑ = ∑ =

Logo:

.........

.....

.....

.....

.....2

s ........... isto é: s = 3,56

10) Comprove a primeira propriedade do desvio padrão somando 5 a cada valor da variável do

exercício anterior.

11) Comprove a segunda propriedade do desvio padrão multiplicando por 2 cada valor da variável

do exercício 9.

12) Complete o esquema para o cálculo do desvio padrão da distribuição:

xi 1 2 3 4 5 6

fi 2 5 8 6 3 1

Temos:

Page 63: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

63

xi fi fixi fixi2

1 2 2 2

2

3

4

5

6

∑ = ∑ = ∑ =

Logo:

..................(........)...........

.....

.....

..... 22

s isto é: s = 1,24

13) Calcule a amplitude total e os desvios padrões dos conjuntos de dados:

a) 1, 3, 5, 9

b) 20, 14, 15, 19, 21, 22, 20

c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2

d) – 10, - 6, 2, 3, 7, 9, 10

14) Calcule os desvios padrões e a amplitude total das distribuições:

a)

xi 2 3 4 5 6 7 8

fi 1 3 5 8 5 4 2

b)

Classes 1,5 | 1,6 | 1,7 | 1,8 | 1,9 | 2,0 | 2,1 | 2,2

fi 4 8 12 15 12 8 4

Page 64: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

64

AULA 7

13. MEDIDAS DE ASSIMETRIA:

A medida de assimetria indica o grau de distorção da distribuição em relação e uma

distribuição simétrica.

13.1 DISTRIBUIÇÃO DE FREQÜÊNCIA SIMÉTRICA:

Uma distribuição é dita simétrica se existe um eixo de simetria no gráfico gerado pela tabela

de frequência. Esse eixo divide o gráfico em duas partes iguais, de modo que, se rebatermos uma na

outra, elas se sobrepõem completamente. Como mostra as figuras abaixo.

Sempre que os dados tiverem média, mediana e moda iguais, a distribuição será simétrica.

13.2 DISTRIBUIÇÃO DE FREQÜÊNCIA ASSIMÉTRICA:

Se a distribuição não for simétrica, podemos ter dois casos de assimetria: assimetria positiva

e assimetria negativa.

A assimetria será negativa se a cauda da distribuição estiver do lado esquerdo do gráfico,

como mostra a figura 13.2a, e será positiva se a cauda da distribuição estiver do lado direito do

gráfico, como mostra a figura 13.2b. A assimetria geralmente ocorre devido à extensão de uma das

caudas da distribuição. Uma vez que os valores da cauda afetam muito a média, mas não a mediana

e a moda, a média sempre acompanha o lado da cauda da distribuição, como mostra a figura 13.1.

x=Md=Mo

Page 65: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

65

13.2 - Distribuições assimétricas

Das figuras 13.3a e 13.3b, podemos verificar que a distância da média em relação à moda e a

mediana será maior, quanto maior for a extensão da cauda da distribuição e, conseqüentemente,

maior será a assimetria da distribuição.

13.3 – Distribuições assimétricas positivas

Mo Md x< <

Moda

Mediana

Média

X Md Mo< <

A natureza da assimetria já foi estudada no capítulo 11, item 11.4, quando vimos que, sendo

a distribuição simétrica, a média e a moda coincidem; sendo a distribuição assimétrica à esquerda

ou negativa, a média é menor que a moda; e sendo assimétrica à direita ou positiva, a média é maior

que a moda.

Baseando-se nessas relações entre média e a moda, podemos empregá-las para determinar o

tipo de assimetria. Assim, assim calculando o valor da diferença:

Mox

se:

x - Mo = 0 assimetria nula ou distribuição simétrica

x - Mo < 0 assimetria negativa ou à esquerda

x - Mo > 0 assimetria positiva ou à direita

Page 66: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

66

13.3 COEFICIENTE DE ASSIMETRIA:

A medida anterior, por ser absoluta, apresenta a mesma deficiência do desvio padrão, isto é,

não permite a possibilidade de comparação entre as medidas de duas distribuições. Por esse motivo,

daremos preferência ao coeficiente de assimetria de Pearson, dado por:

s

MdxAs

)(3 ou

s

MoxAs

Dependendo do valor de As, podemos classificar a distribuição em:

Simétrica, se |As| < 0,15

Assimétrica moderada, se 0,15 ≤ |As| <1,0

Assimétrica forte, se |As| ≥ 1,0

A análise da assimetria pode ser feita por outras expressões, como:

3

1

3)(

s

n

xx

As

n

i

i

ou )()(

)()(

13

13

QmedianamedianaQ

QmedianamedianaQAs

(coeficiente de Bowley)

Exemplo:

DISTRIBUIÇÃO A

Pesos(kg) fi

2 | 6

6 | 10

10 | 14

14 | 18

18 | 22

6

12

24

12

6

∑ = 60

x =12 kg Md = 12 kg Mo = 12 kg s = 4,42 kg

Page 67: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

67

DISTRIBUIÇÃO B

Pesos(kg) fi

2 | 6

6 | 10

10 | 14

14 | 18

18 | 22

6

12

24

30

6

∑ = 78

x =12,9 kg Md = 13,5 kg Mo = 16 kg s = 4,20 kg

DISTRIBUIÇÃO C

Pesos(kg) fi

2 | 6

6 | 10

10 | 14

14 | 18

18 | 22

6

30

24

12

6

∑ = 78

x =11,1 kg Md = 10,5 kg Mo = 8 kg s = 4,20 kg

Logo:

A: 12 – 12 = 0 a distribuição é simétrica

B: 12,9 – 16 = - 3,1 a distribuição é assimétrica negativa

C: 11,1 – 8 = 3,1 a distribuição é assimétrica positiva

Considerando os gráficos das distribuições anteriores, temos:

Page 68: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

68

14. MEDIDAS DE CURTOSE:

Denominamos de curtose o grau de achatamento de uma distribuição em relação a uma

distribuição em relação a uma distribuição padrão, denominada curva normal (curva

correspondente a uma distribuição teórica de probabilidade).

Quando a distribuição apresenta uma curva de frequência mais fechada que a normal (ou

mais aguda em sua parte superior), ela recebe o nome de leptocúrtica.

Quando a distribuição apresenta uma curva de frequência mais aberta que a normal (ou mais

achatada na sua parte superior), ela é chamada de platicúrtica.

A curva normal, que é a nossa referencial, recebe o nome de mesocúrtica.

14.1 COEFICIENTE DE CURTOSE:

A curtose pode ser medida pela seguinte expressão:

)(2 1090

13

PP

QQc

Essa fórmula é conhecida como coeficiente percentílico de curtose.

Relativamente a curva normal, temos; c = 0,263

Page 69: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

69

Assim:

C = 0,263 curva mesocúrtica

C < 0,263 curva leptocúrtica

C > 0,263 curva platicúrtica

Exemplo:

Sabendo-se que uma distribuição apresenta as seguintes medidas:

Q1 = 24,4 cm, Q3 = 41,2 cm, P10 =20,2 cm e P90 =49,4 cm, temos:

287,02866,0

5,58

8,16

)2,205,49(2

4,242,41

CC

Como: 0,287>0,263, concluímos que a distribuição é platicúrtica, em relação a normal.

AULA 07 - Exercícios

1) Uma escola faz uma pesquisa sobre o tempo, em horas, que os estudantes dedicam ao estudo

durante o dia, fora da aula. Com uma amostra aleatória de 60 estudantes, obtiveram-se os dados da

tabela de frequência a seguir. Calcule a média, a moda e o desvio padrão e classifique a assimetria

da distribuição de frequência obtida.

Horas de Estudo No de alunos

0,5 | 1,5

1,5 | 2,5

2,5 | 3,5

3,5 | 5,5

5,5 | 8,5

25

17

10

6

2

2) Uma maternidade está analisando a idade das mulheres que tiveram o seu primeiro filho. Os

dados obtidos são:

25 23 21 28 41 18 19 23 20 22 23

Considerando os dados como amostrais, calcule a média, a mediana e o desvio padrão desses

dados. Classifique os dados em relação a assimetria.

Page 70: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

70

3) O gasto mensal de energia elétrica de cada apartamento de um prédio esta tabelado a seguir:

Gasto Mensal Número de apartamentos

5,00 | 10,00

10,00 | 15,00

15,00 | 20,00

20,00 | 30,00

30,00 |40,00

40,00 |60,00

60,00 | 90,00

90,00 | 120,00

120,00 | 150,00

4

9

18

26

18

11

8

4

2

Calcule a média e a moda dos dados.

Calcule o desvio padrão dos dados

Calcule a assimetria através do coeficiente de Pearson e classifique esta assimetria.

4) Considere os seguintes resultados relativos a três distribuições de frequência e determine o tipo

de assimetria de cada uma delas.

Distribuições x Mo

A

B

C

52

45

48

52

50

46

5) Uma distribuição de frequência apresenta as seguintes medidas: x = 48,1, Md = 47,9 e s = 2, 12.

Calcule o coeficiente de assimetria.

6) Observou-se o número dos 100 sapatos vendidos em uma loja de calçados. Os resultados obtidos

estão em forma de tabela, a seguir:

Número de sapato Frequência

25 | 28

28 | 31

31 | 34

34| 37

37 | 40

40 | 43

43 |46

2

9

17

35

20

10

7

Calcule a média, a moda, a mediana, o desvio padrão e classifique a assimetria e a curtose

desses dados.

Page 71: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

71

7) Um hospital observou o tempo, em minutos, que 100 pacientes tiveram que esperar até serem

atendidos por um médico. Os dados obtidos estão na tabela a seguir.

Tempo de espera Número de

pacientes

0 | 5

5 | 10

10 | 15

15 | 20

20 | 30

30 |45

45 | 60

13

25

30

16

9

5

2

Calcule a média, a moda, a mediana, o desvio padrão e classifique a assimetria e a curtose

desses dados.

8) Considere as seguintes medidas, relativas a três distribuições de frequência:

Distribuições Qi Q2 P10 P90

A

B

C

814

63,7

28,8

935

80,3

45,6

772

55,0

20,5

1012

86,6

49,8

Calcule os respectivos graus de curtose

Classifique cada uma das distribuições em relação à curva normal.

9) Determine o grau de curtose e classifique a distribuição em relação à curva normal:

Pesos (kg) 50 | 58 | 66 | 74 | 82 | 90 | 98

No de operários 10 15 25 24 16 10

Page 72: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

72

AULA 8

15. PROBABILIDADE:

15.1 INTRODUÇÃO:

Embora o cálculo das probabilidades pertença ao campo da Matemática, sua inclusão nesta

matéria se justifica pelo fato de que a maioria dos fenômenos de que trata a Estatística ser de

natureza aleatória ou probabilística.

15.2 EXPERIMENTO ALEATÓRIO:

Todos sabemos de experimentos científicos e de engenharia. A experimentação é útil, pois

podemos assumir que, se executarmos certos experimentos sob condições quase idênticas,

chegaremos essencialmente aos mesmos resultados. Nestas circunstâncias, somos capazes de

controlar o valor das variáveis que afetam o resultado do experimento.

Entretanto, em alguns experimentos, não somos capazes de conhecer nem controlar o valor de

certas variáveis, pois os resultados irão variar de uma realização do experimento para outra, mesmo que as

condições, em sua maioria, sejam as mesmas. Estes experimentos são ditos aleatórios.

Experimentos ou Fenômenos aleatórios são aqueles que, mesmo repetidos várias vezes sob

condições semelhantes, apresentam resultados imprevisíveis.

Exemplo:

o lançamento de uma moeda

o lançamento de um dado

15.3 ESPAÇO AMOSTRAL:

A cada experimento correspondem, em geral, vários resultados possíveis. Assim, ao

lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa. Já ao lançarmos

um dado há seis resultados possíveis: 1, 2, 3, 4, 5 ou 6.

Ao conjunto desses resultados possíveis damos o nome de espaço amostral ou conjunto

universo, representado por S.

A cada um dos elementos de S que corresponde a um resultado recebe o nome de ponto

amostral.

Assim, no lançamento de um dado, 2S 2 é um ponto amostral de S.

Se um espaço amostral tem um número finito de pontos é chamado de espaço amostral

finito. Se ele tem tantos pontos quanto no conjunto dos números naturais 1, 2, 3,..., é chamado de

espaço amostral infinito contável. Se ele tem tantos pontos quanto existem em algum intervalo

sobre o eixo x, tal como 0 ≤ x ≤ 1, ele é dito um espaço amostral infinito não contável. Um

Page 73: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

73

espaço amostral finito ou infinito contável é dito espaço amostral discreto, enquanto que um

infinito não contável é dito espaço amostral não discreto.

15.4 EVENTOS:

Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento

aleatório.

Considere o experimento aleatório: lançamento de dois dados, um branco e outro vermelho.

O espaço amostral que descreve essa experiência é:

S = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6),

(2,1), (2,2), (2,3), (2,4), (2,5), (2,6)

(3,1), (3,2), (3,3), (3,4), (3,5), (3,6)

(4,1), (4,2), (4,3), (4,4), (4,5), (4,6)

(5,1), (5,2), (5,3), (5,4), (5,5), (5,6)

(6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}

O primeiro de cada par acima indica o resultado no dado branco, e o segundo número indica

o resultado no dado vermelho.

Por exemplo, (3,6) é 3 no dado branco e 6 no vermelho.

Considere, agora, os seguintes eventos:

A: a soma dos resultados nos dois dados é menor que 4

A = {(1,1), (1,2), (2,1)}

B: a soma dos resultados nos dois dados é menor que 1

B =

Neste caso, quando o evento é o conjunto vazio, dizemos que o evento é impossível.

C: a soma dos resultados nos dois dados é igual a 12 ou menor que 12.

C = S

Neste caso, quando o evento é o próprio espaço amostral S, dizemos que o evento é

certo.

D: o resultado do primeiro dado é 5 e no segundo dado é 3

O evento, neste caso, é D = {(5,3)}

Quando o evento é um conjunto unitário, dizemos que o evento é simples ou

elementar.

E: o resultado no dado branco é um número impar

Page 74: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

74

F: o resultado no dado branco é um número par

Então, E = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (3,1), (3,2), (3,3), (3,4), (3,5), (3,6),

(5,1), (5,2), (5,3), (5,4), (5,5), (5,6)}

F = {((2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6),

(6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}

Observe que E F = S

Neste caso, dizemos que os eventos E e F são complementares.

Indicamos o complementar de um evento A por A´

G: a soma dos resultados é igual a 5

H: a soma dos resultados é menor ou igual a 3.

G = {((1,4), (2,3), (3,2), (4,1)}

H = {(1,1), (1,2), (2,1)}

Observe que G H =

Neste caso, dizemos que os eventos G e H são eventos mutuamente exclusivos.

I: nos dois dados, os resultados devem ser números ímpares.

J: a soma dos resultados nos dois dados devem ser um número par.

I = {(1,1), (1,3), (1,5), (3,1), (3,3), (3,5), (5,1), (5,3), (5,5)}

J = {(1,1), (1,3), (1,5), (2,2), (2,4), (2,6), (3,1), (3,3), (3,5), (4,2), (4,4), (4,6), (5,1), (5,3),

(5,5), (6,2), (6,4), (6,6)}

Observe que I J

Neste caso, dizemos que o evento I implica no evento J.

15.5 PROBABILIDADE:

Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os

elementos de S tenham a mesma chance de acontecer, ou seja, que S é um conjunto equiprovável.

Chamamos de probabilidade de um evento A (AS) o número real P(A), tal que;

)(

)()(

Sn

AnAP

onde:

n(A) é o número de elementos de A

n(S) é o número de elementos de S.

Page 75: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

75

Exemplo:

No lançamento de um dado, determinar a probabilidade de se obter:

o número 2

um número par

um número múltiplo de 3

a) O espaço amostral S = {1, 2, 3, 4, 5, 6}, portanto n(S) = 6

Ocorrência do número 2:

A = {2}, portanto n(A) = 1

P(A) = n(A)/n(S) = 1/6 = 0,1666 ou 16%

b) ocorrência de um número par:

B = {2, 4, 6}

P(B) = 3/6 = ½ = 0,5 ou 50 %

c) ocorrência de um número múltiplo de 3

C = {3, 6}, portanto n(C) = 2

P(C) = 2/6 = 1/3 = 0,3333 ou 33%

15.6 EVENTOS COMPLEMENTARES:

Sejam A e A´ dois eventos complementares de um espaço amostrar S, então:

P(A) + P(A´) = 1

Exemplo:

Considere um conjunto de 10 frutas em que 3 estão estragadas. Escolhendo-se

aleatoriamente 2 frutas desse conjunto, determinar a probabilidade de:

a) ambas não estarem estragadas

b) pelo menos uma estar estragada

a) Cálculo do número de maneiras de escolher duas frutas entre dez:

n(S) = C10,2 = 45

Seja A o evento ―ambas as frutas não estão estragadas‖.

Cálculo do número de maneiras de escolher duas frutas não estragadas entre sete.

n(A) = C7,2 = 21

Page 76: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

76

Logo, a probabilidade desse evento é:

P(A) = n(A)/n(s) = 21/45 = 7/15

b) o evento B ―pelo menos uma esteja estragada‖ significa que uma fruta ou duas frutas

devem estar estragadas.

Esse evento B é o complementar A´ do evento A.

Logo P(A) + P(A´) = 1

1 – 7/15 = 8/15

15.7 PROBABILIDADE COM REUNIÃO E INTERSECÇÃO DE EVENTOS:

Algumas vezes necessitamos saber a probabilidade da ocorrência de duas condições e da

ocorrência dessas condições serem simultâneas.

Exemplo:

Numa pesquisa sobre a preferência em relação a dois jornais, foram consultadas470 pessoas

e o resultado foi o seguinte: 250 delas lêem o jornal A, 180 lêem o jornal B e 60 lêem os jornais A e

B. Escolhendo um dos entrevistados ao acaso, qual a probabilidade de que ele seja:

leitor dos jornais A e B

leitor do jornal A ou do jornal B?

a)

A B

190 60 120

Como 60 pessoas lêem os jornais A e B, marcamos 60 na intersecção de A com B. Se 250

lêem o jornal A, marcamos 190 (250 – 60 = 190) na parte de A que não esta em B. se 180 lêem o

jornal B, marcamos 120 (180 – 60 = 120) na parte de B que não esta em A. Como foram

consultadas 470 pessoas e já marcamos 370 (190 + 60 + 120), concluímos que 100 pessoas não

lêem nenhum dos dois jornais. Assim a probabilidade de que a pessoa leia os dois jornais A e B, é:

47

6

470

60

)(

)()(

Sn

bAnBAP

Page 77: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

77

b) Quando somamos o número de pessoas que lêem o jornal A com o número de pessoas

que lêem o jornal B, contamos duas vezes aquelas que lêem os dois jornais.

P(A B) = P(A) + P(B) – P(AB)

Portanto, a probabilidade de ocorrer um evento A ou um evento B é dada pela soma das

probabilidades de os dois eventos ocorrerem separadamente, menos à probabilidade deles

ocorrerem simultaneamente.

Logo, P(A B) = 25/47 + 18/47 – 6/47 = 37/47

15.8 EVENTOS INDEPENDENTES:

Dizemos que dois eventos são independentes quando a realização ou não realização de um

dos eventos não afeta a probabilidade da realização do outro e vice versa.

Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do

resultado obtido no outro.

Se dois eventos são independentes, a probabilidade de que eles se realizem

simultaneamente é igual ao produto das probabilidades de realização dos dois eventos.

Assim, sendo p1 a probabilidade de realização do primeiro evento e p2 a probabilidade de

realização do segundo evento, a probabilidade de que tais eventos se realizem simultaneamente é

dada por:

P = p1 x p2

Exemplos:

1) Retirando-se duas cartas ao acaso, sem reposição, de um baralho de 52 cartas, qual a

probabilidade do naipe da primeira ser de paus e da segunda ser de copas?

Das 52 cartas do baralho, 13 são de paus, 13 de copas, 13 de ouros e 13 de espadas. A

probabilidade de ocorrer o evento independente A: ―A primeira carta é de paus‖ é: 13/52 = ¼

Como a segunda carta é retirada sem reposição da primeira, restam 51 cartas no baralho

(retiramos uma carta de paus). A probabilidade de ocorrer o evento independente B: ―a segunda

carta é de copas‖ é; 13/51.

A probabilidade de a primeira carta ser de paus e a segunda ser de copas é dada pelo

produto:

204

13

51

13

4

1)().()( BPAPBAP

Page 78: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

78

2) Uma moeda é lançada 4 vezes. Qual a probabilidade de sair pelo menos uma cara?

Neste problema vamos usar o conceito de eventos complementares, vamos calcular a

probabilidade de nenhuma ser cara e depois diminuir de 1(ou 100%).

P(A) = probabilidade de não sair nenhuma cara

16

1

2

1

2

1

2

1

2

1)( AP cada multiplicação equivale a um lançamento

Portanto, a probabilidade de sair pelo menos uma cara é:

1 – P(A) = 1 – 1/16 = 15/16

15.9 EXPERIMENTOS NÃO EQUIPROVÁVEIS:

Um experimento é dito não equiprovável, quando os eventos elementares do espaço

amostrar não apresentam a mesma probabilidade de ocorrência.

Exemplo:

Numa moeda viciada, a chance de ocorrer cara num lançamento é igual a quatro vezes a

chance de ocorrer coroa. Calcular a probabilidade de ocorrer cara num lançamento dessa moeda.

Sejam os eventos:

C: ocorrer ―cara‖

K: ocorrer ―coroa‖

Com P(C) = 4P(K) e como os eventos são exclusivos e complementares, temos:

P(C) + P(K) = 1

P(C) + ¼ P(C) = 1

P(C) = 4/5

AULA 7 – Exercícios

1) Com os algarismos 3, 5 e 7 formamos todos os números de 3 algarismos possíveis, sem

repetição. Escolhendo um desses números ao acaso, qual a probabilidade dessa escolha recair em

um número:

a) múltiplo de 3? (100%)

b) par? (0%)

2) Numa gaveta há 3 canetas que escrevem em azul, 2 em preto, 4 em verde e 3 que não possuem

carga. Escolhendo ao acaso, uma dessas canetas, ache a probabilidade de que a caneta:

a) escreva (3/4)

b) não escreva (1/4)

c) escreva em azul (1/4)

3) Uma urna contém 500 bolas, cada uma delas identificada por um número; para essa identificação

foram utilizados todos os números da progressão aritmética (1, 3, 5, 7,...,999). Retirando-se

Page 79: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

79

aleatoriamente da urna uma única bola, calcule a probabilidade, em porcentagem, de que o número

dessa bola tenha o algarismo das unidades igual a 3. (20%).

4) Numa máquina caça níquel, cada resultado é formado pr três quaisquer de cinco frutas diferentes,

podendo haver repetição. Calcule a probabilidade de um resultado ter duas frutas iguais e uma

diferente. (12/25)

5) Escolhendo aleatoriamente um natural no conjunto {1, 2,...,100} de naturais sucessivos, seja p a

probabilidade deste natural ser divisível por 2 ou por 3. Indique 100p. (67)

6) Dentro de um armário há 3 pares de sapatos de cores diferentes. Retiram-se ao acaso dois

sapatos. Qual a probabilidade de:

a) eles serem do mesmo par? (1/5)

b) um ser do pé direito e outro do pé esquerdo? (3/5)

7) Dois jogadores, Kleber e Arnaldo, lançam um dado uma única vez cada um. Vence o jogo quem

tirar o maior número. Sabendo que Kleber tirou 4, qual a probabilidade de:

a) Kleber vencer o jogo ( ½)

b) haver empate (1/6)

c) Arnaldo vencer o jogo? (1/3)

8) Uma moeda é lançada 4 vezes. Qual a probabilidade de sair pelo menos uma cara? (15/16)

9) Considere duas caixas, I e II. Na caixa I há 4 bolas pretas e 6 azuis e na caixa II há 8 bolas pretas

e 2 azuis. Escolhi ao acaso uma caixa e, em seguida, tirei uma bola. Qual a probabilidade desta bola

ser preta? (3/5)

10) Qual a probabilidade de um casal ter 4 filhos e todos do sexo feminino? (1/16)

11) Retiram-se duas cartas de um baralho de 52 cartas. Qual a probabilidade de que pelo menos

uma seja de ouros? ( 44,12%)

12) Num certo pais, 10% das declarações de imposto de renda são suspeitas e submetidas a uma

análise detalhada; entre estas verificou-se que 20% são fraudulentas. Entre as não suspeitas, 2% são

fraudulentas.

a) Se uma declaração é escolhida ao acaso, qual a probabilidade de ela ser suspeita e

fraudulenta? (2%)

b) Se uma declaração é fraudulenta, qual a probabilidade de ela ter sido suspeita?

(52,6%)

13) Três carros A, B e C participam de uma corrida. A tem duas vezes mais chances de ganhar do

que B, e B tem três vezes mais chances de ganhar de que C. Determine as probabilidades de vitória

de cada carro. (A=3/5, B = 3/10 e C = 1/10)

Page 80: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

80

AULA 9

15.10 PROBABILIDADE CONDICIONADA:

Se a condição de independência estatística não for satisfeita, deve ser usada uma fórmula

mais geral, envolvendo probabilidades condicionadas. Dados dois eventos, A e B, e a

probabilidade de que o evento B ocorra, dado que o evento A já ocorreu, é a probabilidade

condicionada de B, escrita por P(B/A). Similarmente, escrevemos a probabilidade da ocorrência de

A, condicionada à ocorrência de B, como P(B/A) (lê-se probabilidade de A dado que B tenha

ocorrido, ou probabilidade de A condicionada à ocorrência de B).

Suponha que existam 10 rótulos de papel que podem ser distinguidos pelo número e pela

cor: por exemplo, os rótulos numerados por 1, 2 e 3 são amarelos e os restantes, brancos. Se todos

forem colocados em uma urna e retirados ao acaso, a probabilidade de se extrair um rótulo

particular é 1/10. Se, porém, após retirar um rótulo ao acaso, ele for amarelo, como calcular a

probabilidade de que um certo rótulo,por exemplo, aquele com o número 1, seja extraído?

Evidentemente, o número possível de acontecimentos favoráveis está agora reduzido de 10

para três, em outras palavras, o rótulo desejado deve ter o número 1 e ser amarelo. Calculamos a

probabilidade condicionada pela razão

3

1

10/3

10/1

)(

)1(/1

amareloP

amareloenrótuloPamarelonrótuloP

oo

De modo geral, dados dois eventos a e B, que não são independentes, a probabilidade

condicionada de A, dado B, é definida como:

)(

)(

)(

)()/(

Bn

BAn

BP

BAPBAP

Ou seja, como a razão entre a probabilidade e o evento conjunto A e B ocorrer e a

probabilidade da ocorrência de B.

Exemplos:

1) Uma carta é retirada de um baralho. Qual a probabilidade de ser um rei preto, dado que a carta

retirada foi uma ―figura‖ (valete, damas ou rei)?

Sejam:

A: rei preto

B: figura

Então: P(A/B) = 6

1

12

2

5212

522

Page 81: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

81

Veja: no baralho, existem dois reis pretos, os quais também são figuras, portanto:

P(A∩B0 = 2/52

Doze cartas são figuras, logo P(B) = 12/52, Então a probabilidade de um rei preto,

condicionada a ocorrência de uma figura é 1/6 ou 17%.

2) Numa classe de 60 alunos, 40 estudam só Matemática, 10 estudam só Física e 5 estudam

Matemática e Física. Determine a probabilidade de um aluno que estuda Matemática, estudar

também Física.

F: estudam Física

M: estudam Matemática

n(F∩M) = 5

n(M) = 45 ( pois tem os que só estudam Matemática e mais os que estudam Matemática e

Física)

Logo, P(F/M) = 4/45 = 1/9

15.11 DISTRIBUIÇÃO BINOMIAL:

Neste item, vamos considerar experimentos que satisfaçam as seguintes condições:

a. O experimento dever ser repetido, nas mesmas condições, um número finito de vezes (n)

b. As provas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar

os resultados das sucessivas.

c. Em cada prova deve aparecer um dos dois possíveis resultados: sucesso e insucesso.

d. No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q

)1( pq do insucesso manter-se-ão constantes.

Resolveremos problemas do tipo: determinar a probabilidade de se obterem k sucessos em n

tentativas.

A probabilidade de que um evento se realize k vezes nas provas é dada pela função:

knk qp

k

nP

na qual:

p é a probabilidade de que o evento se realize em uma só prova – sucesso

q é a probabilidade de que o evento não se realize no decurso dessa prova – insucesso

n é o número de tentativas

k número de vezes que o evento deve ocorrer.

Exemplo:

Page 82: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

82

1) Um dado é lançado cinco vezes. Calcular a probabilidade de ocorrer um 3 ou um 4 duas vezes.

Quando lançamos um dado podemos obter 6 resultados possíveis: 1, 2, 3, 4, 5, ou 6

A probabilidade de ocorrer um 3 ou um 4 em cada lançamento é p = 2/6 = 1/3

Logo:

n = 5

k = 2

p = 1/3

q = 2/3

%33240

80

3

2

3

1

2

532

P

2) Um jogador de xadrez tem 2/5 de probabilidade de vitória quando joga. Na realização de cinco

partidas, determinar a probabilidade de esse jogador vencer:

duas partidas:

p = 2/5, q = 3/5, r = 2 e k = 5

substituindo na fórmula temos P = 216/625 = 34,56%

mais que a metade das partidas.

O jogador vence mais da metade das partidas se vencer 3, 4 ou 5 partidas, logo:

%74,31~3125

992

5

3

5

2

5

5

5

3

5

2

4

5

5

3

5

2

3

5051423

totalP

AULA 8 - Exercícios

1) A probabilidade de se escolher uma peça defeituosa em uma loja é de 1/5. Calcule a

probabilidade de ao se escolher 4 peças, 3 delas sejam defeituosas. (2,56%)

2) A probabilidade de um atirador acertar o alvo em um único tiro é 0,25. Dando 4 tiros, qual a

probabilidade de acertar o alvo pelo menos duas vezes? (26,17%)

3) Uma prova do tipo múltipla escolha contém 10 testes, com 5 alternativas cada um. Somente uma

alternativa é correta para cada teste. Qual a probabilidade de um aluno, ―chutar‖ os dez testes,

acertar a metade das respostas? (2,64%)

4) Uma cadela teve cinco filhotes em uma ninhada, sendo três machos e duas fêmeas. Qual a

probabilidade de se obter uma ninhada como esta? (5/16)

Page 83: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

83

5) Num jogo de basquete, a probabilidade de um jogador fazer a cesta a certa distância é 0,4. Ache a

probabilidade de que em 5 tentativas ele:

a) não faça nenhuma cesta (7,78%)

b) faça duas cestas (34,56%)

c) faça alguma cesta (92,22%)

6) Determine a probabilidade de um casal ter 6 filhos do sexo masculino. (1/64)

7) Numa caixa existem cinco cartões numerados de 1 a 5. Retirando-se dois cartões sucessivamente,

sem reposição do primeiro, determine a probabilidade de que os dois números retirados sejam

ímpares. (30%)

8) Em uma amostra de 500 peças, existem exatamente quatro defeituosas. Retirando-se, ao acaso,

uma peça dessa amostra, qual a probabilidade que ela seja perfeita? (99,2%)

9) O código de acesso de um cartão de crédito é formado por seis dígitos decimais. Cada dígito é

um número inteiro que pode assumir qualquer valor entre 0 e 9. Tendo extraviado seu cartão de

crédito, Tongomiro receia que um estranho o encontre e tente descobrir o código. Calcule a

probabilidade aproximada de alguém acertar o código do cartão de Tongomiro num total de 1000

tentativas aleatórias e distintas. (0,1%)

10) Ao lançar um dado muitas vezes, uma pessoa percebeu que a face 6 saia com o dobro de

frequência da face 1, e que as outras faces saíam com a frequência esperada em um dado não

viciado. Qual a frequência da face 1? (1/9)

11) Um dado honesto é lançado duas vezes. Encontre a probabilidade de obter 4, 5, ou 6 no

primeiro lançamento e 1, 2, 3, ou 4 no segundo lançamento. (1/3)

12) Roberto J., administrador recém formado, envia um currículo para duas empresas A e B, à

procura de emprego. A probabilidade de ser aceito pela empresa A é de 25% e a de ser aceito pela

empresa B é de 20%; a probabilidade de ser aceito por ambas é 8%.

a) Qual a probabilidade de ser aceito por ao menos uma das empresas? (37%)

b) Qual a probabilidade de ser aceito exatamente por uma empresa? (29%)

Page 84: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

84

AULA 10

16. DISTRIBUIÇÕES DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS

DISCRETAS:

16.1 INTRODUÇÃO:

Neste capítulo, são apresentadas as distribuições de probabilidade de populações. A

distribuição de frequência é uma amostra é uma estimativa de distribuição de probabilidade da

população correspondente. Se o tamanho da amostra for grande, podemos esperar que a distribuição

de frequência da amostra seja uma boa aproximação da distribuição de probabilidade da população.

As análises das distribuições de probabilidades possibilitam a construção de modelos que

nos auxiliam no entendimento de fenômenos do mundo real.

16.2 VARIÁVEIS ALEATÓRIAS:

Seja um experimento aleatório e S o espaço amostral associado ao experimento. Uma

função X que associe a cada elemento s S um número real X(s) é denominado variável aleatória.

Observe que, apesar do nome, variável aleatória é uma função cujo domínio é o conjunto S,

e o contradomínio o conjunto de todos os valores possíveis de X, os X(s).

16.2.1 VARIÁVEL ALEATÓRIA DISCRETA:

Seja X uma variável aleatória. Se o número de valores possíveis de X for finito ou infinito

numerável, denominaremos X de variável aleatória discreta.

16.2.2 VARIÁVEL ALEATÓRIA CONTÍNUA:

Seja X uma variável aleatória. Se o contradomínio de X é um intervalo, ou uma coleção de

intervalos, denominaremos X de variável aleatória contínua.

Neste capítulo iremos estudar as variáveis aleatórias discretas e, no próximo, as variáveis

aleatórias contínuas.

Page 85: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

85

Exemplos:

a) X: número de caras obtidas no lançamento de duas moedas (variável aleatória)

Então: = lançamento de duas moedas

S = {cc, ck, kc, kk}, c = cara e k = coroa

A variável X poderá assumir os valores, 0, 1 e 2

Assim: X = 0 corresponde ao resultado do evento kk (nenhuma cara)

X = 1 corresponde ao resultado ck ou kc (uma cara)

X = 2 corresponde ao resultado kk (duas caras)

(variável aleatória discreta)

b) X: altura dos alunos entre 1,60m e 1,70 m

(variável aleatória contínua)

16.3 FUNÇÃO DE PROBABILIDADE:

Seja X a variável aleatória discreta. Sejam x1, x2, x3,...seus possíveis valores. A cada

resultado de xi, associaremos um número p(xi) = P(X =xi), denominado probabilidade de xi, tal que:

a) p (xi) ≥ 0 para todos os xi

b) 1)(1

i

ixp

Essa função é denominada função de probabilidade da variável aleatória X.

A distribuição de probabilidade de X é dada pelos pares [xi; p(xi)], i = 1, 2, 3,... e poderá ser

expressa por uma tabela, gráfico ou fórmula.

Exemplo:

Vamos encontrar a distribuição discreta de probabilidade da variável número de caras

encontradas no lançamento de três moedas.

Logo, = lançamento de três moedas

S = {ccc, cck, ckc, kck, kcc, kkc, kkk}

X = número de caras = 0, 1, 2,...

X = 0 → kkk

X = 1 → kkc, kck, ckk

Page 86: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

86

X = 2 → cck, ckc, kcc

X = 3 → ccc

Eis a distribuição de probabilidade expressa por uma tabela:

xi 0 1 2 3

p(xi)

8

1

8

3

8

3

8

1

16.4 FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA:

Se X for uma variável aleatória discreta, define-se Função de Distribuição Acumulada em

um ponto x como a soma das probabilidades dos valores xi, menores ou iguais a x.

Isto é:

xx

i

i

xpxF )()(

Exemplo:

Em uma caixa, tem-se cinco peças boas e quatro defeituosas. São retiradas aleatoriamente

três peças sem reposição. Façamos X a variável aleatória: número de peças boas entre as três peças

retiradas.

Logo, os valores de X são: 0 (nenhuma peça boa), 1, 2 e 3

Para a montagem da tabela de distribuição de probabilidade, necessitamos calcular as

p(xi).

n(S)= C9,3 = 84 (5 das peças boas + 4 das peças defeituosas)

p(x = 0) = 21

4

84

4

84

3,4

C

p(x = 1) = 14

5

84

30

84

1,52,4

CC

p(x= 2) = 21

10

84

40

84

2,51,4

CC

p(x = 3) = 42

5

84

10

84

3,5

C

Page 87: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

87

Portanto, a distribuição de probabilidade pode ser expressa pela tabela:

xi 0 1 2 3

p(xi)

84

4

84

30

84

40

84

10

Com referência à função acumulativa de probabilidade, temos os seguintes exemplos,

considerando os dados já calculados:

Observe a tabela anterior.

a) F(-0,7) = 0

b) F(0,5) = 4/84

c) F(1) = 34/84

d) F(1,8) = 34/24

e) F(2,1) = 74/84

f) F(3) = 84/84 = 1

g) F(8) = 1

Quanto às probabilidades, temos:

a) P(2 ≤ x ≤ 3) = 50/84= 25/42

b) P(x< 1) = 4/84 = 1/21

c) P(x > 3) = 0

d) Probabilidade de pelo menos uma peça boa

P(x ≥ 1) = P(X = 1) + P(X = 2) + P(X = 3)= 30/84 + 40/84 + 10/84 = 80/84 = 20/21

Ou P(X ≥ 1) = 1 – P(x = 0) = 1 – 4/84 = 80/84 = 20/21

16.5 VALOR ESPERADO OU MÉDIA DE UMA VARIÁVEL ALEATÓRIA DISCRETA:

Seja X uma variável aleatória discreta, com valores x1, x2, ..., xk, o valor esperado de X (ou

esperança matemática de x), ou simplesmente média de X é definida como:

)(x

)(][1

ii

k

i

xpxx

Page 88: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

88

Exemplo: Considere um jogo no qual se lançam três moedas, não viciadas, e se recebe um

dólar por cada cara que apareça. Quanto se esperaria ganhar, se pudesse fazer o jogo apenas uma

vez? Ou de outra maneira: qual é o valor esperado de uma jogada?

A distribuição de probabilidade será:

Número de Caras 0 1 2 3

Xi : valor a ser recebido ($) 0 1 2 3

Probabilidades: p(xi) 1/8 3/8 3/8 1/8

50,1$8

13

8

32

8

31

8

10][)( xx

O valor esperado é uma média a longo prazo. No caso, após várias jogadas se esperaria

ganhar $1,50.

16.6 VARIÂNCIA E DESVIO PADRÃO DE UMA VARIÁVEL ALEATÓRIA DISCRETA:

Como já vimos anteriormente, a variância é uma medida de dispersão – avalia o grau de

homogeneidade dos valores da variável em torno da média. A definição de variância de uma

variável aleatória discreta x é dada por:

2

)(

22

)( ][ xx xs

onde:

k

i

ii xpxx1

22 )(][ e

k

i

iix xpx1

)( )(

desvio padrão é igual à raiz quadrada positiva da variância:

2

)()( xx ss

Exemplo:

Suponha que um gerente de loja tenha construído a seguinte distribuição para as vendas de

fogões por semana:

xi (vendas) 0 1 2 3 4

p(xi) 0,20 0,30 0,30 0,15 0,05

Page 89: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

89

O número esperado de venda semanal será:

][)( xx = 0.(0,20) + 1.(0,30) + 2.(0,30) + 3.(0,15) + 4.(0,05) = 1,55 fogões

Quanto à variância:

E[x2] = 0

2.(0,20) + 1

2.(0,30) + 2

2.(0,30) + 3

2.(0,15) + 4

2.(0,05) = 3,65

2

)(

22

)( ][ xx xs = 3,65 – (1,55)2 = 1,25

E o desvio padrão será de: 2

)()( xx ss = 25,1 1,1180 =1,12 fogões

16.7 DISTRIBUIÇÃO BINOMIAL:

Como já foi visto na aula anterior, trata-se de um modelo que dá a probabilidade do número

de sucessos quando são realizadas n provas do mesmo tipo – o experimento é repetido n vezes.

Cada experimento admite dois resultados – sucesso ou fracasso – com probabilidade p de sucesso e

1 – p = q de fracasso, constantes em cada uma das provas.

Relembrando a fórmula para o cálculo da probabilidade de distribuição binomial:

knk qp

k

nP

16.7.1 MEDIDAS CARACTERÍSTICAS:

Média ou valor esperado:

)(k E[ k ] = np

Variância:

s2(k)=Var [ k ] = npq

Desvio padrão:

npqs k )(

Moda:

O valor mais provável (modal) de uma distribuição binomial é o número inteiro

compreendido entre np + p e np – p. A moda toma um valor próximo da média np. No caso

particular de p = q = ½ e n ímpar, os dois extremos np + p e np – p serão inteiros que diferem de 1;

neste caso, a distribuição será bimodal.

Page 90: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

90

Exemplo:

Admite-se que uma válvula eletrônica, instalada em determinado circuito, tenha

probabilidade 0,3 de funcionar mais de 600h. Se ensaiarmos 10 válvulas, qual será a probabilidade

de que entre elas, exatamente 3 funcionem mais de 600 h? Determine também a média, a variância,

o desvio padrão e a moda.

Temos:

k = variável aleatória: número de sucessos nos 10 ensaios. Assim, k = 4

p = 0,3 probabilidade de sucesso de cada válvula funcionar mais de 600h

q = 1 – 0,3 = 0,7 probabilidade de fracasso de cada válvula funcionar menos de 600h

n = 10 ensaios

Então:

73 )7,0.()3,0(3

10

P = 120 x 0,027 x 0,0823543 =0,2668

Média:

μ(k) = 10.(0,3) = 3

Variância:

s2 = 10.(0,3).(0,7) = 2,1

Desvio padrão:

s = √2,1 = 1,45

Moda:

np+p = 10.(0,3) + 3 + 3,3

np – p = 10.(0,3) – 0,3 = 2,7

Logo, Mo = 3 (inteiro entre 2,7 e 3,3)

Page 91: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

91

Observações importantes:

1. Uma distribuição binomial fica caracterizada pelos parâmetros n e p.

2. Se n for pequeno, os cálculos serão relativamente fáceis. Contudo, se n for

relativamente grande, os cálculos tornam-se cansativos. Felizmente, dispomos de

calculadoras, tabelas apropriadas, e também poderemos aproximar a distribuição

binomial pela de Poisson, como veremos no próximo item.

3. Para qualquer n, a distribuição binomial será simétrica, se p = q = 0,5; será

assimétrica á direita se p > q, e assimétrica à esquerda, se p < q.

16.8 DISTRIBUIÇÃO DE POISSON:

A distribuição de Poisson representa um modelo probabilístico adequado para o estudo de

um grande número de fenômenos observáveis. Eis alguns exemplos:

Chamadas telefônicas por unidade de tempo.

Defeitos por unidade de área.

Acidentes por unidade de tempo.

Chegada de clientes a um supermercado por unidade de tempo.

Número de glóbulos sangüíneos visíveis ao microscópio por unidade de área.

Número de partículas emitidas por uma fonte de material radioativo por unidade de tempo.

Seja X uma variável aleatória igual ao número de ocorrências (sucessos) quando se realizam

(ou se observam) resultados de fenômenos semelhantes aos dos exemplos anteriores, X poderá

assumir os valores: 0, 1, 2, ...

Ao aplicar o modelo de Poisson, o interesse poderá ser, por exemplo, calcular a

probabilidade de receber cinco chamadas telefônicas, em três minutos, em dado aparelho: P(X = 5,3

minutos).

De início, poderíamos pensar no uso do modelo binomial, porém, não sabemos qual o

número de provas (n = ?), nem a quantidade de fracassos: quantos chamados não ocorreram?

Se adotamos algumas hipóteses quanto à taxa de frequência ( λ ) dessas ocorrências por uma

pequena unidade de tempo: ( Δt ), ou, conforme o caso: ( Δs ) = unidade de área..., e algumas outras

premissas, enunciadas a seguir, obtemos o modelo de Poisson como limite da distribuição binomial,

quando n tende ao infinito.

Page 92: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

92

16.8.1 HIPÓTESE DO MODELO DE POISSON:

A expressão que dá a probabilidade de x sucessos em um intervalo t (tempo, área,...) é:

!

.)(),(

x

ettxXP

tx

onde:

λ = coeficiente de proporcionalidade, ou taxa de frequência por unidade de tempo, área,

t = tempo, área,

e = base dos logaritmos naturais (2,71828)

x = número de ocorrências (sucessos)

Considerando que a média da distribuição é dada por λt, ou seja, μ = λt, temos

!

.),(

x

etxXP

x

A variância da distribuição também é dada por λt, ou seja: s2 = λt.

A moda corresponde ao maior inteiro contido em λt. Se λt for inteiro, então haverá duas

modas os pontos: x = λt e x – 1 = λt – 1.

Exemplo:

Experiências passadas indicam que, em média, há duas chamadas por hora em certo

telefone. Vamos calcular as probabilidades de, em uma hora, o telefone receber: nenhuma chamada,

uma, duas, três,...

Sabe-se que μ = λt, logo 2 = μ1, consequentemente, λ = 2, ou ainda μ = 2

Nenhuma chamada P(X = 0,1h) = !

.

x

ex

= !0

.2 20 e= 0,1353

Uma chamada P(X = 1,1h) = !1

.2 21 e = 0,2706

Duas chamadas P(X = 2,1h) = !2

.2 22 e= 0,1804

Três chamadas P(X = 3,1h) = 0,1804

Page 93: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

93

Quatro chamadas P(X = 4,1h) = 0,0902

Cinco chamadas P(X = 5,1h) = 0,0361

Seis chamadas P(X = 6,1h) = 0,0120

Sete chamadas P(X = 7,1h) = 0,0034

Oito chamadas P(X = 8,1h) = 0,0009

Nove chamadas P(X = 9,1h) = 0,0002

A tabela de distribuição de probabilidade da variável X: número de chamadas telefônicas

será:

X 0 1 2 3 4 5 6 7 8 9

P(Xi) 0,1353 0,2706 0,2706 0,1804 0,0902 0,0361 0,0120 0,0034 0,0009 0,0002

Quanto às medidas de posição:

Média:

μ = 2

Moda:

como λt = 2, inteiro, temos duas modas, M1 = 2 e M2 = 1

Quanto às medidas de dispersão:

Variância:

s2 = λt = 2

Desvio Padrão:

s =√2 = 1,4142

Coeficiente de variação:

100x

sCV

CV = 1002

4142,1 = 70,71%

Page 94: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

94

16.9 APROXIMAÇÃO DAS PROBABILIDADES BINOMIAIS COMAS PROBABILIDADES

DA DISTRIBUIÇÃO DE POISSON:

Na aplicação do modelo de distribuição binomial, quando n for grande (n > 50) e np < 5, é

possível obter as probabilidades binomiais por meio do modelo de Poisson.

Exemplo:

Em um cruzamento de duas avenidas de tráfego intenso, a probabilidade de um carro sofrer

acidente é de 0,0001. Se entre as 17h e 19h passam 1000 veículos nesse cruzamento, qual é a

probabilidade de que dois ou mais acidentes ocorram durante esse período?

Solução pela distribuição binomial:

Temos:

p = 0,0001 n = 1000 q = 1 – 0,0001 = 0,9999

P(k ≥ 2) = 1 – [P(k = 0) + P(k = 1)] =

= 1 -

999110000 )9999,0.()0001,0.(1

1000)9999,0.()0001,0.(

0

1000

É evidente, o cálculo desse resultado cria sérias dificuldades.

Como n > 50 e np = 1000 =0,1 < 5, podemos obter o resultado desejado pelo modelo de

Poisson.

Assim, μ = np μ = 1000 x 0,0001 = 0,1

P(k ≥ 2) = 1 – [P(x=0) + P(x = 1)]

(x = 0) = !0

.1,0 1,00 e=0,905

P(x=1) = !1

.1,0 1,01 e= 0,090

P(k ≥ 2) = 1 – (0,905 + 0,090) = 0,00045

Ou seja, a probabilidade aproximada da ocorrência de dois ou mais acidentes é de 0,045%

Page 95: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

95

AULA 9 – Exercícios

1) Faça X a variável aleatória soma dos pontos obtidos no lançamento de dois dados. Determine:

a) Tabela da distribuição de probabilidade de x

b) P(3 ≤ x ≤ 10) 8/9

c) P(x > 7) 5/12

d) P(x ≤ 5) 5/18

e) Probabilidade de soma máxima 6 5/36

f) Probabilidade de se obter pelo menos soma 3 35/36

g) F(4) 1/6

h) F(8) 13/18

i) F(15) 1

j) F(1) 0

k) F(5,5) 5/18

l) F(12) 1

2) Uma variável aleatória discreta pode assumir cinco valores, conforme a distribuição de

probabilidade:

X 1 2 3 4 5

p(x) 0,20 0,25 … 0,30 0,10

a) Encontre o valor de p(3) 0,15

b) Qual é o valor da função acumulativa para x = 5? 0,90

c) Encontre a média da distribuição 3,45

d) Calcule a variância e o desvio padrão 4,55 e 2,13

3) Uma moeda é jogada 10 vezes. Calcule as seguintes probabilidades:

a) de ocorrer seis caras; 105/512

b) de dar pelo menos duas caras; 1013/1024

c) de não dar nenhuma coroa; 1/1024

d) de dar pelo menos uma coroa; 1023/1024

e) de não dar 5 caras e 5 coroas; 193/256

4) O pessoal de inspeção de qualidade afirma que os rolos de fita isolante apresentam, em média,

uma emenda a cada 50 metros. Admitindo-se que a distribuição do número de emendas é dada pela

Poisson, calcular as probabilidades:

a) de nenhuma emenda em um rolo de 125 metros. 0,0821

b) de ocorrerem no máximo duas emendas em um rolo de 125 metros 0,5440

c) de ocorrer pelo menos uma emenda em um rolo de 100 metros 0,8647

5) Uma loja atende em média dois clientes por hora. Calcule a probabilidade de em uma hora:

a) atender exatamente dois clientes 0,27

b) atender três clientes 0,18

6) Suponha 400 erros de impressão distribuídos aleatoriamente em um livro de 500 páginas.

Encontre a probabilidade de que cada página contenha:

a) nenhum erro 0,449

b) exatamente dois erros 0,1437

Page 96: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

96

AULA 11

17. DISTRIBUIÇÃO DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS

CONTÍNUAS:

17.1 DISTRIBUIÇÃO NORMAL:

Entre as distribuições teóricas de variáveis aleatórias contínuas, uma das mais empregadas é

a distribuição normal.

Muitas das variáveis analisadas na pesquisa socioeconômicas correspondem à distribuição

normal ou delas se aproximam.

A distribuição normal é também conhecida como distribuição de Gauss, distribuição de

Laplace, ou ainda, distribuição de Laplace-Gauss.

A distribuição de Gauss constitui a base teórica de toda inferência estatística, além de sua

utilidade prática. O gráfico da distribuição normal assemelha-se muito a um sino, e seu formato

dependerá dos valores dos parâmetros e s. Eis dois exemplos de gráficos da distribuição normal.

Figura 17.1 – Gráfico de distribuições normais.

Observando os gráficos, é possível identificar algumas características importantes das distribuições

normais:

A variável aleatória X pode assumir todo e qualquer valor real.

A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica

em torno da média ( ), que recebe o nome de curva normal ou de Gauss.

A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área

corresponde à probabilidade de a variável aleatória X assumir qualquer valor real.

A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se

indefinidamente do eixo das abscissas, sem, contudo, alcança-lo.

Como a curva é simétrica em torno de X, a probabilidade de ocorrer valor maior do que a

média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as

probabilidades são iguais a 0,5, assim: média = mediana = moda.

Page 97: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

97

Quando temos em mão uma variável aleatória com distribuição normal nosso principal

interesse é obter a probabilidade de essa variável aleatória assumir um valor em um determinado

intervalo. Vejamos como proceder, por meio de um exemplo concreto.

Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por uma

certa máquina. Vamos supor que essa variável tenha distribuição normal com média = 2 cm e

desvio padrão s= 0,04 cm.

Pode haver interesse em conhecer a probabilidade de um parafuso ter um diâmetro com

valor entre ―a‖ e ―b‖ cm.

É fácil notar que essa probabilidade, indicada por P(a < x < b), corresponde à área

hachurada na figura abaixo.

Figura 17.2 – Ilustração: probabilidade de os valores de uma distribuição

Normal pertencerem a um intervalo específico

O valor numérico dessa área hachurada e o resultado da integral de f(x) entre a e b, isto é:

b

a

x

es

bxaP

2

22

1

2

1)(

dx

Essa integração não pode ser calculada analiticamente e deve ser computada por métodos

numéricos (desenvolvimento de série). Entretanto, podemos contornar facilmente esse problema.

Basta aceitar, sem demonstração, que, se X é uma variável aleatória com distribuição normal de

média e desvio padrão s, então a variável :

s

xz

tem distribuição normal reduzida, isto é, tem distribuição normal de média 0 e desvio

padrão 1.

As probabilidades associadas à distribuição normal padronizada são encontradas em tabelas,

não havendo necessidade de serem calculadas

A tabela de distribuição normal padrão, nos dá a probabilidade de Z tomar qualquer valor

entre a média O e um dado valor z, isto é; P(0 < Z < z).

Temos, então, que se X é uma variável aleatória com distribuição normal de média e

desvio padrão s, podemos escrever: P( < X < x) = P() < Z <z), com s

xz

Page 98: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

98

Voltemos então ao nosso problema:

Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por uma

certa máquina. Vamos supor que essa variável tenha distribuição normal com média = 2 cm e

desvio padrão s= 0,04 cm. Queremos calcular a probabilidade de um parafuso ter um diâmetro com

valor entre 2 e 2,05 cm. P(2 < X < 2,05).

Para obter essa probabilidade, precisamos, em primeiro lugar, calcular o valor de z que

corresponde à x = 2,05. Temos então:

s

xz

= 25,1

04,0

05,0

04,0

205,2

donde:

P (2 < X < 2,05) = P(0 < Z < 1,25).

Procuremos agora na tabela o valor de z = 1,25.

Na primeira coluna encontramos o valor 1,2. Em seguida, encontramos na primeira linha o

valor 5, que corresponde ao último algarismo do número 1,25. Na intersecção da linha e coluna

correspondentes encontramos o valor 0,3944, o que nos permite escrever:

P(0 < Z < 1,25) = 0,3944

Assim a probabilidade de um parafuso fabricado por essa máquina apresentar um diâmetro

entre a média = 2 e o valor x = 2, 05 é 0,3944.

Escrevemos então:

P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%

A função densidade de probabilidade de uma variável X com distribuição normal é dada

por:

2

2

1

2

1)(

s

x

es

xf

ou

2

2

1

2

1)(

z

es

xf

sendo que;

e = 2,71828...

= 3,14159...

= média da população

s = desvio padrão da população

x = qualquer valor real da variável aleatória contínua

Page 99: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

99

zc 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359

0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753

0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141

0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517

0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879

0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224

0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549

0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852

0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133

0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389

1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830

1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441

1,6 0,4452 0,4463 0,4474 0,4484 0,4495 *0,4505 0,4515 0,4525 0,4535 0,4545

1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633

1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706

1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857

2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890

2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916

2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936

2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 *0,4951 0,4952

2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964

2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974

2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981

2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986

3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990

3,10 ou + 0,4999

NOTA: Para valores de Z acima de 3,09, use 0,4999 como área.

P(0 Z zc)

DEPARTAMENTO DE MATEMÁTICA

DISCIPLINA: ESTATÍSTICA – PROF.a PAULA

TABELA - Distribuição Normal Padrão Z~N(0,1)

Page 100: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

100

17.2 USO DA TABELA DA DISTRIBUIÇÃO NORMAL PADRONIZADA:

Há vários tipos de tabelas que oferecem as áreas sob a curva normal padrão. O tipo mais

comum é a tabela de faixa central cuja cópia esta na página anterior.

A tabela de faixa central dá a área sob a curva normal padrão entre z = 0 e outros valores

positivos da variável Z. A simetria da distribuição Z em relação a sua média (z = 0) permite obter

áreas entre z = 0 e outros valores negativos da variável, já que a área entre z = 0 e zo será igual à

área entre – zo e z = 0. Veja o gráfico a seguir. A área hachurada é obtida na tabela.

Figura 17.3 – Área(probabilidade) obtida em uma tabela de faixa central

Assim, P(0 < z < 1,17) será obtida por meio da consulta à tabela.

Lembre-se: 1,17 = 1,1 + 0,07

Z 0,00 0,01 ... ... 0,07 ... 0,09

0,0

0,1

M

1,1 0,3790

M

Graficamente:

Figura 17.4 – Probabilidade de (0 < z < 1,17)

Page 101: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

101

Exemplos:

1) Desejam-se as probabilidades:

a) P ( z > 1,17) = ?

Construindo o gráfico:

Como P(z > 0 ) = 0,5

P(z > 1,17) = 0,5 – 0,3790 = 0,1210 ou 12,10%

b) P (z < 1,17) = ?

Construindo o gráfico;

Como P( z < 0 ) = 0,5

P (z < 1,17) = 0,5 + 0,3790 = 0,8790 ou 87,90%

c) P(- 1,17 < z < 0) = ?

Construindo o gráfico:

Lembrando que:

P(0 < z < zo) = P( - zo < z < 0), devido à simetria, então:

Page 102: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

102

P( - 1,17 < z < 0) = P(0 < z < 1,17) = 0,3790 ou 37,90%

d) P (2,05 < z < 2,93) = ?

Construindo o gráfico:

P(0 < z < 2,93) = 0,4983

P(0 < z < 2,05) = 0,4798

Portanto, P(2,05 < z < 2,93) = 0,4983 – 0,4798 = 0,0185 ou 1,85%

e) P(- 0,85 < z < 1,75) = ?

Construindo o gráfico :

P(- 0,85 < z < 0) = 0,3023

P(0 < z < 1,75) = 0,4599

Portanto, P(- 0,85 < z < 1,75) = 0,3023 + 0,4599 = 0,7622 ou 76,22%

2) Os salários semanais dos operários industriais são distribuídos normalmente, em torno da média

de R$500, com desvio padrão de R$40. Calcule a probabilidade de um operário ter um salário

semanal situado entre R$490 e R$520.

Devemos, inicialmente, determinar os valores de distribuição normal reduzida, assim:

25,040

5004901

z e

5,040

5005202

z

Logo, a probabilidade procurada é dada por:

P(490 < x < 520) = P(-0,25 < z< 0,5) = P(-0,25<z<0) + P(0<z<0,5) = 0,0987 + 0,1915 =

0,2902

É de se esperar que, em média, 29,02% dos operários tenham salários entre R$490 e R$520.

Page 103: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

103

AULA 10 – Exercícios

1) Sendo Z uma variável com distribuição normal reduzida, calcule:

a) P(0 < z < 1,44)

b) P(-0,85 < z < 0)

c) P(-1,48 < z < 2,05)

d) P(0,72 < z < 1,89)

e) P(z > -2,03)

f) P(z > 1,08)

g) P(z < - 0,66)

h) P(z < 0,60)

2) Um teste padronizado de escolaridade tem distribuição normal com média 100 e desvio padrão 10.

Determine a probabilidade de um indivíduo submetido ao teste ter nota:

a) maior de 120

b) maior que 80

c) entre 85 e 115

d) maior que 100

3) Os pesos de 600 estudantes são normalmente distribuídos com média 65,3 kg e desvio padrão 5,5 kg.

Determine o número de estudantes que pesam:

a) entre 60 e 70 kg

b) mais que 63,2 kg

c) menos que 68 kg

4) a duração de um certo componente eletrônico tem média de 850 dias e desvio padrão de 40 dias. Sabendo

que a duração é normalmente distribuída, calcule a probabilidade de esse componente durar:

a) entre 700 e 1000 dias

b) mais de 800 dias

c) menos de 750 dias

Page 104: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

104

AULA 12

17.3 DISTRIBUIÇÃO T DE STUDENT:

Sejam Z e V variáveis aleatórias independentes com distribuições: N(0,1) e 2X ,

respectivamente. Define-se distribuição t de Student com graus de liberdade, como:

V

Zt

Onde:

Média da distribuição: 0 ttE

Variância da distribuição: '2

)(2

tstVar 2

gráfico da distribuição t é simétrico em relação a sua média. Assemelha-se à distribuição

Normal Padronizada: N(0,1). A distribuição t é mais dispersa do que a N(0,1). À medida que

aumenta, a dispersão diminui, sendo que para valores de > 30 temos praticamente iguais as

distribuições Normal Padronizada e de Student. Eis uma ilustração para = 4

Lembre-se: a área sob cada uma dessas curvas vale 1, ou 100%

Page 105: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

105

17.3.1 USO DA TABELA DA DISTRIBUIÇÃO T DE STUDENT:

A distribuição t esta tabelada. Encontram-se abscissas da distribuição, dado um parâmetro

(grau de liberdade) e uma área na cauda direita da curva. Assim:

0,25

........

.

.

.

.....

Valor da abscissa que deixa a probabilidade

na cauda à direita

.

Page 106: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

106

= graus de liberdade

DEPARTAMENTO DE MATEMÁTICA

DISCIPLINA: ESTATÍSTICA – PROF.a PAULA

TABELA - Distribuição t de Student (Unicaudal e Bicaudal)

25% 10% 5% 2,5% 1% 0,5% 25% 10% 5% 2,5% 1% 0,5%

1 1,0000 3,0777 6,3138 12,7062 31,8207 63,6574 46 0,6799 1,3002 1,6787 2,0129 2,4102 2,6870

2 0,8165 1,8856 2,9200 4,3027 6,9646 9,9248 47 0,6797 1,2998 1,6779 2,0117 2,4083 2,6846

3 0,7649 1,6377 2,3534 3,1824 4,5407 5,8409 48 0,6796 1,2994 1,6772 2,0106 2,4066 2,6822

4 0,7407 1,5332 2,1318 2,7764 3,7469 4,6041 49 0,6795 1,2991 1,6766 2,0096 2,4049 2,6800

5 0,7267 1,4759 2,0150 2,5706 3,3649 4,0322 50 0,6794 1,2987 1,6759 2,0086 2,4033 2,6778

6 0,7176 1,4398 1,9432 2,4469 3,1427 3,7074 51 0,6793 1,2984 1,6753 2,0076 2,4017 2,6757

7 0,7111 1,4149 1,8946 2,3646 2,9980 3,4995 52 0,6792 1,2980 1,6747 2,0066 2,4002 2,6737

8 0,7064 1,3968 1,8595 2,3060 2,8965 3,3554 53 0,6791 1,2977 1,6741 2,0057 2,3988 2,6718

9 0,7027 1,3830 1,8331 2,2622 2,8214 3,2498 54 0,6791 1,2974 1,6736 2,0049 2,3974 2,6700

10 0,6998 1,3722 1,8125 2,2281 2,7638 3,1693 55 0,6790 1,2971 1,6730 2,0040 2,3961 2,6682

11 0,6974 1,3634 1,7959 2,2010 2,7181 3,1058 56 0,6789 1,2969 1,6725 2,0032 2,3948 2,6665

12 0,6955 1,3562 1,7823 2,1788 2,6810 3,0545 57 0,6788 1,2966 1,6720 2,0025 2,3936 2,6649

13 0,6938 1,3502 1,7709 2,1604 2,6503 3,0123 58 0,6787 1,2963 1,6716 2,0017 2,3924 2,6633

14 0,6924 1,3450 1,7613 2,1448 2,6245 2,9768 59 0,6787 1,2961 1,6711 2,0010 2,3912 2,6618

15 0,6912 1,3406 1,7531 2,1315 2,6025 2,9467 60 0,6786 1,2958 1,6706 2,0003 2,3901 2,6603

16 0,6901 1,3368 1,7459 2,1199 2,5835 2,9208 61 0,6785 1,2956 1,6702 1,9996 2,3890 2,6589

17 0,6892 1,3334 1,7396 2,1098 2,5669 2,8982 62 0,6785 1,2954 1,6698 1,9990 2,3880 2,6575

18 0,6884 1,3304 1,7341 2,1009 2,5524 2,8784 63 0,6784 1,2951 1,6694 1,9983 2,3870 2,6561

19 0,6876 1,3277 1,7291 2,0930 2,5395 2,8609 64 0,6783 1,2949 1,6690 1,9977 2,3860 2,6549

20 0,6870 1,3253 1,7247 2,0860 2,5280 2,8453 65 0,6783 1,2947 1,6686 1,9971 2,3851 2,6536

21 0,6864 1,3232 1,7207 2,0796 2,5177 2,8314 66 0,6782 1,2945 1,6683 1,9966 2,3842 2,6524

22 0,6858 1,3212 1,7171 2,0739 2,5083 2,8188 67 0,6782 1,2943 1,6679 1,9960 2,3833 2,6512

23 0,6853 1,3195 1,7139 2,0687 2,4999 2,8073 68 0,6781 1,2941 1,6676 1,9955 2,3824 2,6501

24 0,6848 1,3178 1,7109 2,0639 2,4922 2,7969 69 0,6781 1,2939 1,6672 1,9949 2,3816 2,6490

25 0,6844 1,3163 1,7081 2,0595 2,4851 2,7874 70 0,6780 1,2938 1,6669 1,9944 2,3808 2,6479

26 0,6840 1,3150 1,7056 2,0555 2,4786 2,7787 71 0,6780 1,2936 1,6666 1,9939 2,3800 2,6469

27 0,6837 1,3137 1,7033 2,0518 2,4727 2,7707 72 0,6779 1,2934 1,6663 1,9935 2,3793 2,6459

28 0,6834 1,3125 1,7011 2,0484 2,4671 2,7633 73 0,6779 1,2933 1,6660 1,9930 2,3785 2,6449

29 0,6830 1,3114 1,6991 2,0452 2,4620 2,7564 74 0,6778 1,2931 1,6657 1,9925 2,3778 2,6439

30 0,6828 1,3104 1,6973 2,0423 2,4573 2,7500 75 0,6778 1,2929 1,6654 1,9921 2,3771 2,6430

31 0,6825 1,3095 1,6955 2,0395 2,4528 2,7440 76 0,6777 1,2928 1,6652 1,9917 2,3764 2,6421

32 0,6822 1,3086 1,6939 2,0369 2,4487 2,7385 77 0,6777 1,2926 1,6649 1,9913 2,3758 2,6412

33 0,6820 1,3077 1,6924 2,0345 2,4448 2,7333 78 0,6776 1,2925 1,6646 1,9908 2,3751 2,6403

34 0,6818 1,3070 1,6909 2,0322 2,4411 2,7284 79 0,6776 1,2924 1,6644 1,9905 2,3745 2,6395

35 0,6816 1,3062 1,6896 2,0301 2,4377 2,7238 80 0,6776 1,2922 1,6641 1,9901 2,3739 2,6387

36 0,6814 1,3055 1,6883 2,0281 2,4345 2,7195 81 0,6775 1,2921 1,6639 1,9897 2,3733 2,6379

37 0,6812 1,3049 1,6871 2,0262 2,4314 2,7154 82 0,6775 1,2920 1,6636 1,9893 2,3727 2,6371

38 0,6810 1,3042 1,6860 2,0244 2,4286 2,7116 83 0,6775 1,2918 1,6634 1,9890 2,3721 2,6364

39 0,6808 1,3036 1,6849 2,0227 2,4258 2,7079 84 0,6774 1,2917 1,6632 1,9886 2,3716 2,6356

40 0,6807 1,3031 1,6839 2,0211 2,4233 2,7045 85 0,6774 1,2916 1,6630 1,9883 2,3710 2,6349

41 0,6805 1,3025 1,6829 2,0195 2,4208 2,7012 86 0,6774 1,2915 1,6628 1,9879 2,3705 2,6342

42 0,6804 1,3020 1,6820 2,0181 2,4185 2,6981 87 0,6773 1,2914 1,6626 1,9876 2,3700 2,6335

43 0,6802 1,3016 1,6811 2,0167 2,4163 2,6951 88 0,6773 1,2912 1,6624 1,9873 2,3695 2,6329

44 0,6801 1,3011 1,6802 2,0154 2,4141 2,6923 89 0,6773 1,2911 1,6622 1,9870 2,3690 2,6322

45 0,6800 1,3006 1,6794 2,0141 2,4121 2,6896 90 0,6772 1,2910 1,6620 1,9867 2,3685 2,6316

100 0,677 1,290 1,660 1,984 2,364 2,626

120 0,677 1,289 1,658 1,980 2,358 2,617

0,674 1,282 1,645 1,960 2,326 2,576

Page 107: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

107

Exemplos:

1) Admita parâmetro 9, ou seja = 9 e = 5%

Entrando na 1o coluna com = 9 e na primeira linha com = 0,05 (5%), encontramos, na

interseção dessa linha e coluna, o número 1,8331. Graficamente:

Obs.: Como a distribuição t é simétrica em relação a origem t = 0, a abscissa – 1,8331

deixará 0,05 = 5% de área (probabilidade) à esquerda.

2) Sendo = 25 e = 10%, temos:

3) Considere uma distribuição t com parâmetro 18. Encontre a média, a variância, o desvio padrão,

a mediana, o 1o quartil e o 95

o percentil.

Média : 0 ttE

Variância : 13,1218

18)( 18

2

ts

Desvio Padrão : s(t18) = 13,1 =1,06

Page 108: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

108

Mediana:

Logo, Md (t18) = 0

1o Quartil:

Como a distribuição é simétrica, temos Q3 = 0,6884

95o Percentil:

Page 109: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

109

17.4 DISTRIBUIÇÃO F:

Desenvolvida por R.A. Fischer, a distribuição F possui importante aplicação na Análise da

Variância. Sejam: 21

X e 22

X duas variáveis aleatórias independentes com distribuições Qui-

Quadrado. Define-se como distribuição F com parâmetros 1 e 2 ( 1 = grau de liberdade do

numerador e 2 = grau de liberdade do denominador), como:

1

2

2

2

2

211),(

X

XF 11 22

Observe que: F( 1, 2) > 0

Média da distribuição: 22

2

, 2 >2

Variância da distribuição: 2

221

21

2

22

)2)(4(

)2(2

s , 2 > 4

A distribuição tem uma única moda, no valor:

2

2

2

2

1

1

Mo , 21

Para cada par ( 1, 2), temos diferentes gráficos:

Page 110: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

110

17.4.1 USO DA TABELA DA DISTRIBUIÇÃO F:

Na tabela encontram-se abscissas da distribuição F dados os parâmetros 1 e 2 e,

admitindo-se áreas ( ) de 5% na cauda à direita. Assim:

Para consultar a tabela:

1

2

1

........

.

.

Valor da abscissa que deixa a probabilidade na cauda à

direita

.

Para encontrarmos o valor da abscissa F95% ( 1, 2), utilizamos a seguinte fórmula:

),(

1),(

12%5

21%95

F

F

Graficamente, temos:

A fórmula também é válida para F97,5%( 1,

2) e F2,5%( 1,

2)

Page 111: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

111

DEPARTAMENTO DE MATEMÁTICA

DISCIPLINA: ESTATÍSTICA – PROF.a PAULA

TABELA - Distribuição F de Fisher = 5%

Graus de liberdade para o numerador

11 2 3 4 5 6 7 8 9 10 12 14 15 16 18 20 24 30 40 60 120

2

Gra

us

de l

iber

dade p

ara

o d

eno

min

ado

r

1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,4 245,9 246,5 247,3 248,0 249,1 250,1 251,1 252,2 253,3 254,3

2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,42 19,43 19,43 19,44 19,45 19,45 19,46 19,47 19,48 19,49 19,50

3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,72 8,70 8,69 8,67 8,66 8,64 8,62 8,59 8,57 8,55 8,53

4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,87 5,86 5,84 5,82 5,80 5,77 5,75 5,72 5,69 5,66 5,63

5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,64 4,62 4,60 4,58 4,56 4,53 4,50 4,46 4,43 4,40 4,36

6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,96 3,94 3,92 3,90 3,87 3,84 3,81 3,77 3,74 3,70 3,67

7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,53 3,51 3,49 3,47 3,44 3,41 3,38 3,34 3,30 3,27 3,23

8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,24 3,22 3,20 3,17 3,15 3,12 3,08 3,04 3,01 2,97 2,93

9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,03 3,01 2,99 2,96 2,94 2,90 2,86 2,83 2,79 2,75 2,71

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,87 2,85 2,83 2,80 2,77 2,74 2,70 2,66 2,62 2,58 2,54

11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,74 2,72 2,70 2,67 2,65 2,61 2,57 2,53 2,49 2,45 2,40

12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,64 2,62 2,60 2,57 2,54 2,51 2,47 2,43 2,38 2,34 2,30

13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,55 2,53 2,52 2,48 2,46 2,42 2,38 2,34 2,30 2,25 2,21

14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,48 2,46 2,44 2,41 2,39 2,35 2,31 2,27 2,22 2,18 2,13

15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,42 2,40 2,39 2,35 2,33 2,29 2,25 2,20 2,16 2,11 2,07

16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,37 2,35 2,33 2,30 2,28 2,24 2,19 2,15 2,11 2,06 2,01

17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,34 2,31 2,29 2,26 2,23 2,19 2,15 2,10 2,06 2,01 1,96

18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,29 2,27 2,25 2,22 2,19 2,15 2,11 2,06 2,02 1,97 1,92

19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,26 2,23 2,22 2,18 2,16 2,11 2,07 2,03 1,98 1,93 1,88

20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,22 2,20 2,18 2,15 2,12 2,08 2,04 1,99 1,95 1,90 1,84

21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,20 2,18 2,16 2,12 2,10 2,05 2,01 1,96 1,92 1,87 1,81

22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,17 2,15 2,13 2,10 2,07 2,03 1,98 1,94 1,89 1,84 1,78

23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,15 2,13 2,11 2,08 2,05 2,01 1,96 1,91 1,86 1,81 1,76

24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,13 2,11 2,09 2,05 2,03 1,98 1,94 1,89 1,84 1,79 1,73

25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,11 2,09 2,07 2,04 2,01 1,96 1,92 1,87 1,82 1,77 1,71

26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,09 2,07 2,05 2,02 1,99 1,95 1,90 1,85 1,80 1,75 1,69

27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,08 2,06 2,04 2,00 1,97 1,93 1,88 1,84 1,79 1,73 1,67

28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,06 2,04 2,02 1,99 1,96 1,91 1,87 1,82 1,77 1,71 1,65

29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,05 2,03 2,01 1,97 1,94 1,90 1,85 1,81 1,75 1,70 1,64

30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,04 2,01 1,99 1,96 1,93 1,89 1,84 1,79 1,74 1,68 1,62

40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,95 1,92 1,90 1,87 1,84 1,79 1,74 1,69 1,64 1,58 1,51

60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,86 1,84 1,81 1,78 1,75 1,70 1,65 1,59 1,53 1,47 1,39

120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91 1,83 1,77 1,75 1,72 1,69 1,66 1,61 1,55 1,50 1,43 1,35 1,25

3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,69 1,67 1,63 1,60 1,57 1,52 1,46 1,39 1,32 1,22 1,00

Page 112: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

112

EXEMPLO: Sendo 1 = 20 e 2 = 18, determinar o 95% e o 5% percentis.

Graficamente:

Para determinar o P95 (95o percentil), entramos na 1

o linha da tabela com 20 ( 1 = 20) e na

1o coluna com 18 ( 2 = 18), encontrando 2,19. Logo: P95 = 2,19

Page 113: UNIVERSIDADE FEDERAL DO PARANÁ - Páginas Pessoaispaginapessoal.utfpr.edu.br/paulabenevides/outros-materiais... · A coleta direta de dados podem ser classificadas ... conjunto de

Estatística Prof a Paula Francis Benevides

113

REFERÊNCIAS

AKANIME, C.T.; YAMAMOTO, R.K. Estatística Descritiva. Editora Érica, 2000

CRESPO, A.A. Estatística Fácil. 17 ed. Saraiva, 2002.

GIOVANNI, J.R.; BONJORNO, J.R.; JR GIOVANNI, J.R. Matemática Fundamental. Uma nova

abordagem. Volume Único. Editora FTD, 2002.

JAMES, B. R. Probabilidade: um curso em nível intermediário. 3 ed. IMPA, 2006.

MUCELIN, C.A. Estatística. Editora do Livro Técnico. 2004