CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em...

105
UNIVERSIDADE FEDERAL RURAL DO RIO DE JANEIRO INSTITUTO DE CIÊNCIAS EXATAS Departamento de Matemática Área de Estatística IC 280 – ESTATÍSTICA BÁSICA IC 281 – INTRODUÇÃO À BIOESTATÍSTICA Marcelo Jangarelli Prof. Adjunto – DEMAT/ICE/UFRRJ

Transcript of CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em...

Page 1: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

UNIVERSIDADE FEDERAL RURAL DO RIO DE JANEIRO

INSTITUTO DE CIÊNCIAS EXATAS

Departamento de Matemática

Área de Estatística

IC 280 – ESTATÍSTICA BÁSICA

IC 281 – INTRODUÇÃO À BIOESTATÍSTICA

Marcelo JangarelliProf. Adjunto – DEMAT/ICE/UFRRJ

Seropédica – Rio de Janeiro

Março – 2012

Page 2: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

UNIVERSIDADE FEDERAL RURAL DO RIO DE JANEIRO

INSTITUTO DE CIÊNCIAS EXATAS

Departamento de Matemática

Área de Estatística

IC 280 – ESTATÍSTICA BÁSICA

IC 281 – INTRODUÇÃO À BIOESTATÍSTICA

Esta apostila constitui o material básico das disciplinas IC 280 – Estatística Básica e

IC 281 – Introdução à Bioestatística. Em todas as aulas serão feitas complementações

suplementares com o objetivo de atualizar, acrescentar novas informações relevantes ainda

não implementadas e facilitar o entendimento do material apresentado.

Marcelo JangarelliProf. Adjunto – DEMAT/ICE/UFRRJ

Seropédica – Rio de Janeiro

Março – 2012

Page 3: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

Sumário

I Somatório 01

II Análise Exploratória de Dados 04

III Probabilidade 27

IV Variáveis Aleatórias 35

V Distribuições de Variáveis Aleatórias 40

VI Inferência Estatística 44

VII Listas de Exercícios 48

VIII Gabarito 65

IX Referência Bibliográfica Adicional 72

X Tabela da Distribuição Normal 73

Page 4: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

CONTEÚDO I

SOMATÓRIO

1 – INTRODUÇÃO

A notação de somatório é de grande importância para a estatística, pois a operação de

adição é fundamental nesta ciência. Utiliza-se Σ (sigma), letra grega maiúscula, para facilitar a

representação de somas com grande número de parcelas/termos.

As principais representações são:

→ Soma simples → x1 + x2 + x3 + ... + xn

→ Soma de quadrados →

→ Quadrado da soma → (x1 + x2 + ... + xn)2

→ Soma de produto → x1y1 + x2y2 + ... + xnyn

→ Produto das somas → (x1 + x2 + ... + xn) (y1 + y2 + ... + yn)

A expressão é lida da seguinte maneira: Somatório ou soma de x índice i com i

variando de 1 até n.

A finalidade do índice i é indicar a ordem de cada parcela/termo da soma. O número

inferior indica a ordem da primeira parcela e o superior da última parcela. São também

chamados de limite inferior e limite superior, respectivamente.

Quando não se deseja somar todos os valores que se dispõe na notação do somatório

podem-se utilizar restrições indicando/limitando os termos/parcelas a serem somados.

Ex.:

O número de parcelas/termos (NP) da soma é dado por :

1

Page 5: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

NP = (Ls – Li) + 1 ,

em que:

Ls = limite superior;

Li = limite inferior.

Se o somatório estiver sujeito a R restrições, o NP será dado por:

NP = (Ls – Li) + 1 – R ,

em que:

R = número de restrições.

2 – PROPRIEDADES

As propriedades facilitam o desenvolvimento das expressões algébricas com a notação

do somatório.

P1 → Somatório de uma constante (k) é igual ao produto do número de

termos/parcelas pela constante;

P2 → O somatório do produto de uma constante (k) multiplicada por uma variável é

igual ao produto da constante pelo somatório da variável;

P3 → O somatório de uma soma ou subtração de variáveis é igual à soma ou

subtração dos somatórios destas variáveis.

EXERCÍCIOS PROPOSTOS

1 – Considere as variáveis X e Y. Elas representam as notas de duas disciplinas para um

grupo de seis alunos.

X = {90 ; 95 ; 97 ; 98 ; 100 ; 60}

Y = {60 ; 70 ; 80 ; 60 ; 90 ; 75}

Calcule:

2

Page 6: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

a)

b)

c)

d)

e)

f)

2 – Obter o número de termos/parcelas para os seguintes somatórios:

a)

b)

CONTEÚDO II

3

Page 7: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

ANÁLISE EXPLORATÓRIA DE DADOS

1 – INTRODUÇÃO

A estatística é uma ciência de obtenção de informações a partir de dados numéricos.

Ela é entendida como a matemática aplicada a dados observados, fornecendo métodos para

geração, coleta, organização, descrição, análise e interpretação dos dados. O estudo estatístico

tem se revelado essencial no mundo moderno. Ao verificar os diferentes meios de

comunicação (internet, rádio, televisão, jornais e revistas) evidencia-se a relevância da

estatística para a sociedade.

A estatística faz parte do cotidiano de cada cidadão. Ela se mostra imprescindível para

a tomada de decisões, para a resolução de problemas e, principalmente, para a pesquisa

científica. Seu objetivo é proporcionar conhecimentos a partir de dados. Na estatística os

dados não são apenas números, mas sim números com um contexto, tornando-os

informativos. É fundamental conhecer a origem dos dados, contextualizando-os com as

questões a serem solucionadas. Devido à automatização na resolução de cálculos, bem como

na construção de gráficos e tabelas, o mais relevante que podemos obter de um estudo

estatístico é a compreensão de ideias e a interpretação dos resultados.

Vejamos algumas situações onde a estatística se torna foco central:

Na pesquisa eleitoral, quando os percentuais de intenção de votos de cada candidato

são divulgados;

Na pesquisa médica, quando se anuncia os benefícios de um novo medicamento;

Na pesquisa de opinião sobre um novo produto lançado no mercado;

Na divulgação de vítimas (mortos, feridos e desabrigados) por sinistros naturais;

Na avaliação do desempenho de dado setor econômico (ex. agronegócio);

Em discussões polêmicas (ex. a questão de produtos/alimentos transgênicos).

2 – DEFINIÇÕES

2.1 Variável: é uma característica qualquer do objeto em estudo. Pode ser classificada como:

Variável Qualitativa: É uma variável que assume como possíveis valores, atributos ou

qualidades do objeto em estudo. Ela pode ser dividida em: i) Variável Qualitativa

Nominal, se não existir nenhuma ordem em suas realizações e; ii) Variável Qualitativa

Ordinal, se existir uma ordem em suas possíveis realizações.

4

Page 8: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Variável Quantitativa: É uma variável que assume como possíveis valores, números,

resultantes de uma contagem ou mensuração. Ela também pode ser dividida em: i)

Variável Quantitativa Discreta, no caso em que os possíveis valores/números formam

um conjunto finito ou infinito enumerável e; ii) Variável Quantitativa Contínua, para

o caso em que os possíveis valores/números formam um intervalo ou união de

intervalos de números reais.

2.2 População: é um conjunto de indivíduos (ou objetos) tendo pelo menos uma variável em

comum.

2.3 Amostra: é qualquer subconjunto da população.

3 – CONCEITOS

Dados Brutos: São os dados coletados que não foram numericamente ordenados, ou

seja, são aqueles que não se encontram preparados para análise; Ex: 20 – 27 – 16 – 23

– 15 – 17 – 25 – 21 – 20 – 13

Rol: é a série estatística quando dispõe os valores dos dados brutos em ordem

crescente ou decrescente; Ex: 13 – 15 – 16 – 17 – 20 – 20 – 21 – 23 – 25 – 27

Amplitude Total (AT): é a diferença entre o maior e o menor valor da série estatística

em rol; Ex: AT = 27 – 13 = 14

Frequência Absoluta (fi): é o número de vezes que determinado valor Xi é observado;

Ex: f15 = 1 ; f20 = 2

Intervalo de Classe: é cada um dos intervalos disjuntos em que se subdivide o

conjunto total de valores observados da variável em estudo. Os intervalos de classe

podem ser apresentados pelos seguintes símbolos:

a├─┤b → ambos elementos (a e b) pertencem ao intervalo;

a├── b → apenas o elemento “a” pertence ao intervalo, já o elemento “b” não

pertence;

a ──┤b → apenas o elemento “b” pertence ao intervalo, já o elemento “a” não

pertence;

a ─── b → ambos elementos (a e b) não pertencem ao intervalo;

Limite de Classes: são os extremos de cada intervalo de classe;

Li → limite inferior → Li = a

Ls → limite superior → Ls = b

5

Page 9: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Amplitude de Classe (h): é a diferença entre o limite superior e o limite inferior da

classe correspondente i;

hi = Ls – Li

Ponto Médio (PM): é a média aritmética entre o Ls e o Li da classe correspondente,

isto é:

PM = ou PM = Li +

Frequência Acumulada (fai): é a soma da frequência absoluta (fi) da presente classe

com as frequências absolutas das classes anteriores;

Frequência Relativa Simples (fri): é o quociente da frequência absoluta (fi) da

presente classe pelo número total de observações (n), isto é: fri =

Frequência Relativa Acumulada (frai): é o quociente da frequência acumulada (fai)

da presente classe pelo número total de observações (n), isto é: frai =

Distribuição de Frequência: é o arranjo dos valores numéricos (quantitativos)

observados em uma tabela com suas respectivas frequências. Se o conjunto de valores

de uma variável for muito grande devem-se agrupar os dados em Intervalos de Classes

com o objetivo de diminuir o tamanho da tabela e facilitar a visualização da variação

do fenômeno em estudo. Não há uma regra geral para determinar o número de classes

(k) de uma distribuição. É importante que a distribuição tenha um número adequado

de classes, pois um número muito reduzido ou muito extenso pode prejudicar a

interpretação do fenômeno em estudo. Há diversos métodos para determinar o número

de classes, entre eles citam-se:

Se o número de observações for maior que 25 (n > 25), o número de classes (k)

é determinado por k = , caso contrário k = 5;

Regra de Sturges, no qual o número de classes é obtido por: k = 1 + 3,22 log n

Determinado o número de classes (k), o segundo passo na construção de uma Tabela

de Distribuição de Frequência é determinar a amplitude da classe (h), que se

aproxima do quociente da amplitude total e o número de classes, ou seja:

hi =

OBS: Na medida do possível recomenda-se que todas as classes apresentem a mesma

amplitude.

6

Page 10: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

4 – APRESENTAÇÃO DOS DADOS

A apresentação dos dados para proporcionar uma melhor visualização do fenômeno

em estudo pode se dar por meio de Tabelas e Gráficos.

4.1 Tabelas

A organização dos dados por meio de tabelas talvez seja a forma mais simples de se

resumir um conjunto de observações. Todas as variáveis em estudo podem ser resumidas por

meio de uma tabela.

4.1.1 Elementos da Tabela

Toda tabela deve ser simples, clara, objetiva e auto-explicativa. Os elementos

fundamentais de uma tabela são: título; cabeçalho, coluna indicadora e corpo.

O título aponta o fenômeno, época e local de ocorrência. O cabeçalho explica o

conteúdo das colunas. A coluna indicadora detalha as linhas. O corpo mostra os dados. De

modo complementar tem-se: fonte (citação da origem dos dados), notas (esclarecimento de

conteúdo e/ou metodologia utilizada) e chamadas (esclarecimento de pontos específicos da

tabela).

Tabela XX – Título respondendo as perguntas: o quê, onde e quando?

Coluna Indicadora Cabeçalho

Col

una

Conteúdo da Linha Célula

Fonte: Origem dos dados.Nota: Informação esclarecedora.

Ressalta-se que as tabelas devem ser numeradas em ordem crescente ou em que

aparecem no texto, como é o caso de trabalhos científicos. As bordas superior e inferior

devem ser fechadas com traços horizontais enquanto às da esquerda e direita não, podendo ou

não as colunas no corpo da Tabela serem separadas por traços verticais. É conveniente

também que o número de casas decimais seja padronizado.

7

Page 11: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

4.2 Gráficos

Além das tabelas, outra forma de apresentar os dados é por meio da utilização de

gráficos. A representação gráfica da distribuição de uma variável tem a vantagem de informar

sobre sua variabilidade de maneira rápida e concisa.

4.2.1 Gráficos de Variáveis Qualitativas

Diversos são os tipos de gráficos que podem ser utilizados para representar as

variáveis qualitativas. Limitamos a apresentar dois tipos: Gráficos em Barras e Gráficos de

Setores (“pizza”).

4.2.1.1 Gráfico em Barras

É um dos gráficos mais utilizados para representar variáveis qualitativas. Ele pode ser

assim caracterizado:

O gráfico tem apenas uma escala, a que representa a frequência ou a percentagem em

cada nível da variável;

A largura da barra utilizada não tem nenhum significado especial além da estética;

Para facilitar a compreensão e análise, é preferível que as barras sejam apresentadas

segundo uma ordem sistemática. O critério mais utilizado é ordená-las por sua

magnitude;

As barras devem ser colocadas preferencialmente no sentido horizontal, pois assim o

nome dos níveis (atributos) da variável pode ser melhor visualizado.

4.2.1.2 Gráfico de Setores

Também representa um gráfico bastante utilizado para representar variáveis

qualitativas. Neste gráfico, um círculo representa 100% das observações e cada nível da

variável é representado por um setor de área proporcional à frequência observada. Algumas

observações podem ser mencionadas a respeito da construção deste gráfico:

Não é um gráfico recomendado para representar subdivisões dos níveis da variável;

Não é recomendado quando o número de níveis da variável é muito grande.

8

Page 12: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

4.2.2 Gráficos de Variáveis Quantitativas

4.2.2.1 Gráfico de Colunas

No gráfico em colunas os níveis das variáveis são representados por barras verticais.

4.2.2.2 Histograma

É uma representação gráfica por meio de retângulos justapostos, com base sobre o

eixo das abscissas. Em geral é utilizado para representar distribuições de variáveis

quantitativas contínuas, quando os dados estão agrupados em intervalo de classe (IC).

A base do retângulo é o comprimento/amplitude do IC;

A altura do retângulo pode ser representada pela frequência, proporção ou

percentagem da classe correspondente;

A área total do histograma representa 100% das observações. Logo, a área total de um

histograma de frequência é igual a n; a de um histograma de proporção é igual a 1; e a

de um histograma de percentagem é igual a 100%.

4.2.2.3 Polígono de Frequência (Simples)

O polígono de frequência é construído de forma semelhante a do histograma.

Representa uma linha poligonal que une os pontos resultantes da ligação dos pontos médios

dos IC localizados no eixo das abscissas e das frequências dos IC no eixo das ordenadas. Para

fechar o polígono, unem-se os extremos da figura com o eixo das abscissas, nos quais

estariam os pontos médios das classes anterior e posterior, imediatamente antes da primeira

classe e após a última classe, respectivamente.

4.2.2.4 Polígono de Frequência Acumulada ou Ogiva

9

Page 13: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

É o gráfico representativo de uma distribuição acumulada de frequência e consta de

uma linha poligonal ascendente. No eixo horizontal (abscissas) inserem-se os limites

superiores de cada IC e no eixo vertical (ordenadas) as frequências acumuladas.

4.3 Ramo-e-Folhas

A forma da distribuição da variável em estudo é uma característica importante em um

conjunto de dados. Um procedimento alternativo para resumir um conjunto de valores, tendo

como objetivo a obtenção da forma de sua distribuição, é o Ramo-e-Folhas. Uma vantagem

deste diagrama sobre o histograma é que não perdemos (ou perdemos pouca) informação

sobre os dados em si.

Não existe uma regra fixa para construir o Ramo-e-Folhas, mas a ideia básica é dividir

cada observação em duas partes: a primeira (o Ramo) é colocada à esquerda de uma linha

vertical; a segunda (a Folha) é colocada à direita. Um ramo com muitas folhas significa maior

incidência daquele ramo. Uma maneira alternativa quando se dispõe de ramos excessivamente

grandes (com grande número de folhas) é duplicá-lo, sinalizando com um asterisco (*).

5 – MEDIDAS DE POSIÇÃO OU TENDÊNCIA CENTRAL

O resumo dos dados provenientes da observação de uma variável quantitativa por

meio de gráficos e tabelas de frequências fornece informações sobre o comportamento

(distribuição) desta variável. As medidas de posição ou medidas de tendência central são

empregadas para resumir todo o conjunto de dados por meio de um ou alguns valores que

possam ser representativos para todos os dados. Quando utilizamos um único valor obtemos

uma redução drástica do conjunto de dados.

5.1 Média Aritmética

É a mais simples representação de um conjunto de dados. Representada por , ou

, a média aritmética é definida como a soma de todas as observações dividida pelo número

total de observações, ou seja:

10

Page 14: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

=

Se os valores de X1, X2, ..., Xn ocorrem com respectivas frequências (pesos) fi (pi),

tem-se a Média Aritmética Ponderada, calculada pela fórmula:

=

5.1.1 Média Aritmética para dados agrupados em Intervalo de Classe

O cálculo da média aritmética é feito utilizando a fórmula:

= ,

em que:

Xi ponto médio da i’ésima classe;

fi frequência absoluta da i’ésima classe.

5.1.2 Propriedades da Média Aritmética

As propriedades a seguir são válidas para a média aritmética simples e ponderada.

A soma algébrica dos desvios de um conjunto de números em relação à média

aritmética é zero. Logo, ;

Somando ou subtraindo uma constante (k) a cada um dos valores de um conjunto de

dados (X1, X2, ..., Xn) a média aritmética ficará somada ou subtraída por esta constante;

Multiplicando ou dividindo cada um dos valores de um conjunto de dados (X1, X2, ...,

Xn) por uma constante (k) a média aritmética ficará multiplicada ou dividida por esta

constante;

Se todo o conjunto de dados apresenta valores iguais a um determinado

número/constante (k, k, ..., k) então a média aritmética é igual a este número/constante

(k).

11

Page 15: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

5.2 Moda

A moda (Mo) de um conjunto de dados/observações é o valor/atributo que ocorre com

maior frequência. É uma medida que pode ser calculada para quaisquer tipos de dados:

quantitativos e qualitativos. De acordo com o comportamento da série estatística de dados

podemos ter: Série Amodal; Série Unimodal; Série Bimodal; ...; Série Multimodal.

EX1: 1, 2, 3, 4, 5. O conjunto não tem moda (Amodal);

EX2: 1, 2, 2, 2, 3, 4. Mo = 2 (Unimodal);

EX3: 1, 1, 2, 3, 4, 4, 5, 5. Mo = 1, 4 e 5 (Trimodal ou Multimodal).

5.2.1 Moda para dados agrupados em Intervalo de Classe

Para os valores de uma variável agrupados em intervalo de classe, dispostos em uma

tabela de Distribuição de Frequência, a moda é determinada identificando a classe que

apresenta a maior frequência absoluta (fi), chamada de classe modal e, posteriormente,

aplicando a fórmula:

Mo = ,

em que:

Li = limite inferior da classe modal;

∆1 = diferença entre a frequência absoluta da classe modal e da classe anterior a classe

modal;

∆2 = diferença entre a frequência absoluta da classe modal e da classe posterior a

classe modal;

h = amplitude da classe modal.

5.3 Mediana

A mediana (Md) é definida como sendo à medida que ocupa a posição central de uma

série de observações, estando elas ordenadas segundo suas grandezas (ordem crescente ou

decrescente). A mediana é o valor abaixo ou acima do qual se tem a metade dos

dados/observações, isto é, 50% da distribuição dos dados estão abaixo e 50% estão acima do

valor da mediana.

12

Page 16: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Para determinar a posição do elemento mediano em um conjunto de dados (n) em rol

e, posteriormente, verifica-se qual é o valor da mediana, se faz necessário considerar dois

casos:

Caso em que o número de dados (n) é ímpar:

PMd =

Caso em que o número de dados (n) é par:

PMd =

5.3.1 Mediana para dados agrupados em Intervalo de Classe

Para os valores de uma variável agrupados em intervalo de classe, dispostos em uma

tabela de Distribuição de Frequência, a mediana é determinada identificando a classe que

apresenta o elemento mediano (P), ou seja, a classe que apresenta o valor resultante da divisão

do número de observações/dados (n) por dois (P = n/2), chamada de classe mediana.

Posteriormente utiliza-se a fórmula:

Md = ,

em que:

P = posição do elemento mediano = n/2;

Li = limite inferior da classe mediana;

faai = frequência acumulada da classe anterior a classe mediana;

fi = frequência absoluta da classe mediana;

h = amplitude da classe mediana.

5.4 Outras Medidas de Posição – Quantis

Algumas vezes estamos interessados não apenas em dividir o conjunto de dados em

duas partes iguais, mas sim em quatro, dez ou 100 partes iguais. Essas medidas são chamadas

de Quartis, Decis e Percentis, respectivamente, dividindo a distribuição de dados em grupos

de mesmo tamanho.

A determinação dessas medidas é semelhante ao da mediana, com a diferença na

determinação do valor do Quantil (P).

13

Page 17: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

5.4.1 Quartil

Os quartis dividem o conjunto de dados em quatro partes do mesmo tamanho. O

primeiro quartil (Q1) deixa um quarto das observações abaixo e três quartos acima dele. O

segundo quartil (Q2 = Md) deixa metade dos valores abaixo e metade dos valores acima dele.

Já o terceiro quartil (Q3) deixa três quartos dos valores abaixo e um quarto acima dele.

Determinação da posição do Quartil i (Qi), ou seja, do PQi:

PQi =

Posteriormente identifica-se a classe que apresenta o valor PQi e aplica-se a fórmula:

Qi = ,

em que:

PQi = posição do elemento do Quartil i [PQi = (i.n)/4];

Li = limite inferior da classe do Quartil i;

faai = frequência acumulada da classe anterior a classe do Quartil i;

fi = frequência absoluta da classe do Quartil i;

h = amplitude da classe do Quartil i.

5.4.2 Decil

Os decis dividem o conjunto de dados em dez partes do mesmo tamanho.

Determinação da posição do Decil i (Di), ou seja, do PDi:

PDi =

Posteriormente identifica-se a classe que apresenta o valor PDi e aplica-se a fórmula:

Di = ,

em que:

PDi = posição do elemento do Decil i [PDi = (i.n)/10];

Li = limite inferior da classe do Decil i;

faai = frequência acumulada da classe anterior a classe do Decil i;

fi = frequência absoluta da classe do Decil i;

14

Page 18: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

h = amplitude da classe do Decil i.

5.4.3 Percentil

Os percentis dividem o conjunto de dados em cem (100) partes do mesmo tamanho. O

percentil de ordem “i” (Pi) de um conjunto de valores dispostos em ordem crescente é um

determinado valor tal que pelo menos “i%” das observações são menores ou iguais a ele e,

consequentemente, pelo menos “(100 – i)%” são maiores ou iguais a ele. O percentil i = 50

(P50) é igual à mediana (Md), Q2 e D5.

Determinação da posição do Percentil i (Pi), ou seja, do PPi:

PPi =

Posteriormente identifica-se a classe que apresenta o valor PPi e aplica-se a fórmula:

Pi = ,

em que:

PPi = posição do elemento do Percentil i [PPi = (i.n)/100];

Li = limite inferior da classe do Percentil i;

faai = frequência acumulada da classe anterior a classe do Percentil i;

fi = frequência absoluta da classe do Percentil i;

h = amplitude da classe do Percentil i.

6 – MEDIDAS DE DISPERSÃO OU VARIABILIDADE

O resumo de um conjunto de dados por meio de uma única medida representativa de

tendência central (posição) esconde informações sobre a variabilidade deste conjunto. Desta

forma, a análise completa dos dados requer não somente sua apresentação por meio de

gráficos, tabelas e medidas de posição. Caracterizar um conjunto de valores apenas por

medidas de posição é inadequado e perigoso, pois os dados diferem entre si em maior ou

menor grau. Dois conjuntos com medidas de posição semelhantes, por ex. a média, podem

ficar sujeitos a erros em suas considerações, aferindo sobre sua homogeneidade

inadequadamente. As observações podem estar mais ou menos centradas em torno da média.

Neste contexto, as medidas de dispersão ou variabilidade apresentam um aspecto importante

na análise exploratória de dados.

15

Page 19: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

6.1 Variância

A variância mede a dispersão dos valores em torno da média, sendo denotada por Var,

s2 ou . Ela é dada pela soma dos quadrados dos desvios em relação à média aritmética

dividido por (n – 1) graus de liberdade (g.l.).

Var = s2 =

Se os valores X1, X2, ..., Xn estiverem associados as frequências f1, f2, ..., fn, a variância

é denotada por:

s2 =

6.1.1 Variância para dados agrupados em Intervalo de Classe

Utiliza-se a mesma fórmula da variância acima mencionada, quando os valores estão

associados à frequências:

s2 = ,

em que:

fi = frequência absoluta da i’ésima classe;

Xi = ponto médio da i’ésima classe.

16

Page 20: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

6.2 Desvio Padrão

O desvio padrão é denotado por DP, s ou . Ele é definido como a raiz quadrada

positiva da variância. É outra medida que fornece uma ideia a respeito da dispersão dos

valores em torno da média. Um desvio padrão grande significa que as observações se

dispersam muito em torno da média, ao passo que quando pequeno as observações se

concentram próximas à média, indicando pequena variabilidade entre as observações.

Ele é de grande utilidade na estatística inferencial, pois é uma medida de variabilidade

absoluta e sempre na mesma unidade das observações (dados) originais.

DP = s =

6.3 Intervalo Interquartílico

O intervalo interquartílico (ou intervalo interquartil) é a diferença entre o terceiro

quartil (Q3) e o primeiro quartil (Q1), isto é:

IQ = Q3 – Q1

6.4 Coeficiente de Variação

Comparar a variabilidade de duas séries estatísticas distintas, quando as médias ou

suas unidades de escala são diversas, torna-se impossível pela simples verificação do desvio

padrão. É necessário mencionar uma dispersão relativa, isto é, uma medida de variabilidade

relativa, tomando o desvio padrão em percentagens dos valores médios.

O coeficiente de variação é definido por:

CV(%) = . 100

A grande vantagem desta medida (C.V.) é que ela é adimensional, ou seja, independe

das unidades de escala, permitindo a comparação de diferentes conjuntos de dados. Quanto

maior o C.V. mais heterogênea é a amostra. Ao passo que quando um C.V. de pequena

magnitude indica homogeneidade na amostra.

17

Page 21: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

6.5 Erro Padrão da Média

A média aritmética ( ) é uma estimativa e por isso não é exata. A determinação do

erro no cálculo da média é feita por meio do desvio padrão, pois a variação da estimativa da

média com relação ao valor real está na dependência da variabilidade dos dados. O erro

padrão da média é definido como o quociente entre o desvio padrão e a raiz quadrada positiva

do número de observações (n).

Note que o erro padrão da média [ ] é inversamente proporcional à raiz de n, ou seja,

quanto maior o tamanho da amostra utilizada para estimar a média menor será o erro padrão

da média.

7 – MEDIDAS DE ASSIMETRIA E CURTOSE

7.1 Medida de Assimetria

A medida de Assimetria ou Simetria é um indicador da forma da distribuição dos

dados. Ao construir uma distribuição de frequências e/ou histograma, busca-se identificar a

forma da distribuição dos dados, que pode ou não ser confirmada pelo Coeficiente de

Assimetria de Pearson (As).

De acordo com o Coeficiente de Assimetria de Pearson (As), a distribuição pode ser

classificada como:

Simétrica → As = 0;

Assimétrica Negativa → As < 0;

Assimétrica Positiva → As > 0.

7.2 Medida de Curtose

18

Page 22: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

A medida de Curtose (K) mede o grau de achatamento da distribuição. É definido

como:

A Curtose ou Achatamento é mais uma medida com a finalidade de complementar a

caracterização da dispersão em uma distribuição. Esta medida quantifica a concentração ou

dispersão dos valores de um conjunto de dados em relação às medidas de tendência central em

uma distribuição de frequências.

Uma distribuição pode ser classificada com relação a sua medida de curtose como:

Leptocúrtica → quando a distribuição apresenta uma curva de frequência bastante

fechada, com os dados fortemente concentrados em torno de seu centro (K < 0,263);

Mesocúrtica → quando os dados estão razoavelmente concentrados em torno de seu

centro (K = 0,263);

Platicúrtica → quando a distribuição apresenta uma curva de frequência mais aberta,

com os dados fracamente concentrados em torno de seu centro (K > 0,263).

8 – BOX PLOT (Desenho Esquemático)

O Box Plot é outra forma alternativa para representar um conjunto de dados. Este

desenho esquemático fornece informações sobre a assimetria (ou simetria), achatamento,

dispersão e posição dos dados, além de informar sobre dados discrepantes, isto é, dados com

valor muito diferente do restante do conjunto. É extremamente útil quando se deseja comparar

várias distribuições. Ele é construído a partir do esquema de cinco números, sendo eles:

Os quartis Q1, Q2 e Q3;

E os extremos M (valor máximo) e m (valor mínimo).

Na construção do Box Plot deve-se calcular também as seguintes quantidades:

Limite Inferior → Li = Q1 –

Limite Superior → Ls = Q3 +

19

Page 23: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Os valores compreendidos entre estes dois limites são chamados valores adjacentes.

As observações que estiverem acima do limite superior ou abaixo do limite inferior serão

chamadas pontos exteriores ou discrepantes, sendo representadas por asteriscos (*).

8.1 Construção do Box Plot

Em um eixo vertical representam-se os valores da variável em questão. Do lado do

eixo construímos uma caixa da seguinte maneira:

1. A base da caixa fica na altura do primeiro quartil (Q1) e o seu topo fica na altura do

terceiro quartil (Q3);

2. Em seguida marcamos no interior da caixa uma linha na altura da mediana ou do

segundo quartil (Q2);

3. Do alto da caixa segue uma linha até o limite superior e de sua base segue uma linha

até o limite inferior;

4. Os pontos exteriores ou discrepantes são marcados individualmente por asteriscos.

9 – ANÁLISE BIDIMENSIONAL

Até agora vimos como organizar e resumir informações pertinentes a uma única

variável (ou a um único conjunto de dados). Entretanto, frequentemente há interesse em

analisar o comportamento conjunto de duas ou mais variáveis.

Suponha que o interesse seja em analisar o comportamento conjunto de duas variáveis.

A distribuição conjunta de duas variáveis pode ser representada por meio de uma Tabela de

Frequência de dupla entrada (ou Tabela de Contingência).

Como exemplo, considere o comportamento conjunto de duas variáveis: “Sexo” (X) e

“Nível de atividade física” (Y), cuja distribuição conjunta está representada na tabela abaixo.

Tabela XX – Distribuição conjunta das variáveis sexo e nível de atividade física.

SexoNível de Atividade Física Feminino Masculino Total

20

Page 24: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Ativo 0 4 4Médio 5 6 11

Sedentário 12 18 30Total 17 28 45

A linha dos totais fornece a distribuição total da variável X e a coluna dos totais

fornece a distribuição total da variável Y. As distribuições assim obtidas (Distribuições dos

Totais das Variáveis X e Y) são chamadas de Distribuições Marginais das Variáveis X e Y.

Pode-se também construir tabelas de frequências relativas. Em uma distribuição

conjunta é possível expressar a proporção de cada casela (célula) de três maneiras diferentes:

i) em relação ao total geral; ii) em relação ao total de cada linha; e iii) em relação ao total de

cada coluna. A maneira mais conveniente a ser utilizada depende do objetivo da pesquisa.

Para exemplificar foi construído, utilizando os dados da tabela acima, a distribuição

conjunta dos percentagens em relação ao total geral das variáveis X e Y.

SexoNível de Atividade Física Feminino Masculino Total

Ativo 0% 8,9% 8,9%Médio 11,1% 13,3% 24,4%

Sedentário 26,7% 40,0% 66,7%Total 37,8% 62,2% 100,0%

O principal objetivo da distribuição conjunta é descrever o grau de associação entre as

variáveis, de modo que possamos predizer o resultado de uma variável quando a outra não é

conhecida.

9.1 Coeficiente de Contingência

O Coeficiente de Contingência é uma medida que quantifica a associação entre duas

variáveis, podendo ser utilizado tanto para variáveis qualitativas quanto para variáveis

quantitativas agrupadas em intervalos de classe. Inicialmente, obtêm-se as diferenças entre os

valores observados (oij) na pesquisa e os valores esperados (eij). Essas diferenças são

chamadas de desvios [d = (oij - eij)].

A soma de todos os desvios relativos é denominada (Qui-quadrado) sendo definida

pela expressão:

21

Page 25: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

De acordo com Pearson, o Coeficiente de Contingência (C) proposto é definido:

,

em que n é o número total de observações.

Os coeficientes de associação entre variáveis frequentemente variam entre 0 e 1, ou

entre –1 e +1, sendo que a proximidade de zero indica falta de associação entre as variáveis.

Contudo, o Coeficiente de Contingência (C) acima descrito não varia entre 0 e 1. O seu valor

máximo fica na dependência do número de níveis das variáveis. Uma alternativa, então, é

considerar como medida de associação o seguinte coeficiente, denominado Coeficiente de

Contingência Corrigido (C*), dado por:

,

em que t é o número mínimo entre o número de colunas e o número de linhas da tabela de

contingência, ou seja, é o mínimo entre os níveis das variáveis envolvidas na pesquisa.

OBS: Uma maneira fácil de obter o valor esperado em cada casela da tabela de contingência

é:

9.2 Coeficiente de Correlação

O Coeficiente de Correlação (r ou ) mede o grau de associação entre duas variáveis

quantitativas (não agrupadas em intervalos de classe) X e Y. Um procedimento bastante útil

para verificar a existência de associação entre as variáveis é o Gráfico de Dispersão, por meio

da representação dos pares de valores (Xi e Yi) em um sistema cartesiano.

Considere duas amostras relativas às variáveis X e Y, dadas a seguir:

Xi X1 X2 X3 .......... Xn

22

Page 26: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Yi Y1 Y2 Y3 .......... Yn

O Coeficiente de Correlação entre duas variáveis X e Y é definido por:

rxy = = … Cov(X,Y) =

O Coeficiente de Correlação assume sempre um valor entre –1 e +1. Valores positivos

correspondem a uma associação direta, já os valores negativos correspondem a uma

associação inversa. Quando o Coeficiente de Correlação for igual a +1 ou –1, diz que existe

uma associação (relação) perfeita entre as variáveis X e Y. Ao passo que quando ele se iguala

ou se aproxima de zero (0) é um indicativo de que não exista associação entre as variáveis.

EXERCÍCIOS PROPOSTOS

1 – Considere o conjunto de dados obtido ao medir a altura de 100 indivíduos (dados em cm).

151 153 154 155 156 158 159 160 161 161162 162 162 163 163 164 165 165 166 166166 166 167 167 167 167 167 167 168 168168 168 168 168 168 168 168 169 169 169169 169 169 169 169 170 170 170 170 170171 171 171 171 172 172 172 172 173 173173 174 174 174 174 175 175 175 175 175176 176 176 177 177 177 177 177 177 177178 179 180 180 181 181 181 181 182 182182 182 183 184 185 186 187 188 190 190

Pede-se:

a) Obter a Distribuição de Frequência em Intervalo de Classe;

b) Construir os gráficos: b.1) Histograma; b.2) Polígono de Frequência; b.3) Polígono de

Frequência Acumulada (Ogiva).

2 – Os dados abaixo se referem ao ganho de peso (kg) de animais que foram alimentados com

determinada ração. Construir um Ramo-e-Folhas para o conjunto de dados.

26 30 65 43 27 28 30 33 60 34 26 32 34 31 2827 31 66 44 28 29 41 34 61 25 17 43 35 32 19

23

Page 27: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

3 – Registraram-se as vendas semanais de determinada loja durante o mês de fevereiro/2011,

com os seguintes resultados, em milhões de reais:

11,3 ; 12,4 ; 15,8 ; 9,6

Qual a venda média semanal para o mês de fevereiro/2011?

4 – Um estudante obteve as seguintes notas parciais nas provas de Estatística:

Prova Peso Nota1ª 1 5,02ª 1 7,03ª 2 5,04ª 4 7,0

Considerando que as provas apresentam pesos distintos, qual a média final do

estudante na disciplina?

5 – São fornecidos três conjuntos de dados (amostras). Obter em cada qual a Moda (Mo) e a

Mediana (Md).

a) 11,3 ; 12,4 ; 15,8 ; 9,6 ; 10,4 ; 8,3 ; 7,8 ; 9,5

b) 11,3 ; 12,4 ; 9,6 ; 8,3 ; 7,8 ; 8,3

c) 11,2 ; 11,2 ; 15,8 ; 10,7 ; 9,6 ; 7,8 ; 9,6

6 – Considere o conjunto de dados: {9 ; 3 ; 8 ; 8 ; 9 ; 8 ; 9 ; 1}. Calcular:

a) Variância;

b) Desvio Padrão;

c) Erro Padrão da Média;

d) Coeficiente de Variação.

7 – A tabela abaixo apresenta a Distribuição de Frequência das notas (0 a 100) de um exame

final feito por estudantes matriculados na disciplina de Estatística.

Classes fi

5├── 15 515├── 25 8

24

Page 28: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

25├── 35 635├── 45 445├── 55 1055├── 65 1265├── 75 1575├── 85 1085├── 95 10

Calcular:

a) Média;

b) Moda;

c) Mediana;

d) Q1 ; D9 ; P10 ;

e) Variância;

f) Desvio Padrão;

g) Coeficiente de Variação;

h) Erro Padrão da Média;

i) Valor (nota) acima do qual se encontra 60% dos dados;

j) Qual a percentagem de alunos que obtiveram nota superior a 50?

k) Assimetria;

l) Curtose.

8 – São fornecidas algumas estatísticas referentes às produções (ton/ha) de duas variedades de

cana-de-açúcar.

Variedade 1 → Q1 = 47,00 ; Md = 53,00 ; Q3 = 55,00

Variedade 2 → Q1 = 68,00 ; Md = 70,00 ; Q3 = 76,00

Pede-se:

a) Box Plot das variedades 1 e 2;

b) Comentários/Comparações das variedades de cana-de-açúcar com relação à dispersão

e simetria de suas produções.

9 – Em um experimento para testar a resistência de Eucalyptus à ferrugem causada por

Puccinia psidii, determinado número de plantas de três espécies diferentes de Eucalyptus

foram infectadas artificialmente. Após certo tempo, contou-se o número de plantas doentes.

Os resultados estão na tabela abaixo. Obter os Coeficientes de Contingência (C) e de

Contingência Corrigido (C*).

25

Page 29: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Infecção E. citrioda E. urophylla E. cloeziana TotalDoentes 6 10 80 96Sadias 104 90 30 224Total 110 100 110 320

10 – Sete clones de cacaueiros foram avaliados para Número Total de Frutos Colhidos

(NTFC) e Número Total de Frutos Sadios (NTFS). Calcule o Coeficiente de Correlação (r)

entre as variáveis NTFC e NTFS.

Clones CAB443 CAB444 CAB447 CAB450 CAB452 CAB453 CAB454NTFC (X) 92,00 75,40 60,40 100,60 46,20 97,60 42,00NTFS (Y) 66,40 44,80 41,40 82,40 33,40 77,60 29,40

CONTEÚDO III

PROBABILIDADE

1 – INTRODUÇÃO E PROPRIEDADES

26

Page 30: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

A teoria da probabilidade representa um instrumento para a construção e análise de

modelos matemáticos relacionados a fenômenos aleatórios. Ao estudarmos um fenômeno

aleatório estamos diante de um experimento cujo resultado não pode ser determinado, mas

sim ter o seu comportamento probabilístico.

Modelo Determinístico → É o modelo em que a partir das condições sobre as quais

um experimento é executado pode-se determinar o seu resultado.

Ex.: s = -1,6 t2 + v0t

Modelo Não-Determinístico ou Probabilístico → É o modelo em que às condições

de execução de um experimento não permitem determinar o seu resultado, mas sim

apenas um comportamento probabilístico do resultado a ser observado.

Ex.: Previsão do tempo

Experimentos Probabilísticos ou Aleatórios → São experimentos que repetidos

diversas vezes, sob condições idênticas, podem fornecer resultados distintos entre as

repetições, ou seja, os resultados podem não ser os mesmos.

Ex1: Lançar um dado e verificar sua face superior

Ex2: Lançar uma moeda e verificar sua face superior

Espaço Amostral → Representa o conjunto de todos os possíveis resultados de um

experimento aleatório. Em geral, é representado pela simbologia “S”.

S1: {1;2;3;4;5;6}

S2: {Ca ; Co}

Evento → É um subconjunto qualquer do espaço amostral, ou mesmo um conjunto

particular de resultados do “S” (subconjunto do S). Será útil considerarmos o “S” e o

conjunto vazio (Ø) como eventos. O primeiro é considerado evento certo → P(S) = 1.

O segundo evento impossível → P(Ø) = 0.

Ex1.: Evento A = Ocorrer face ímpar no lançamento de um dado → A = {1;3;5}

Ex2.: Evento B = Ocorrer face par no lançamento de um dado → B = {2;4;6}

Ex3.: Evento C = Ocorrer face superior a dois (2) no lançamento de um dado →

C = {3;4;5;6}

27

Page 31: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Eventos Mutuamente Exclusivos (Disjuntos) → Diz-se que dois eventos são

mutuamente exclusivos se, e somente se, a ocorrência de um evento impedir a

ocorrência do outro. Na teoria dos conjuntos eles não possuem nenhum ponto em

comum.

Ex.: Eventos A e B

Eventos Não-Mutuamente Exclusivos ou Eventos Quaisquer → Dois eventos são

designados como eventos quaisquer quando eles podem ocorrer simultaneamente

(possuem pontos em comum).

Ex.: Eventos A e C ou Eventos B e C

A U B → É a união de dois eventos, representando a ocorrência de pelo menos um

dos eventos “A” ou “B”.

A ∩ B → É a interseção de dois eventos, representando a ocorrência simultânea dos

eventos “A” e “B”.

Eventos Complementares → Dois ou mais eventos são complementares quando sua

união resulta no “S”.

Ex.: Eventos A e B, ou seja, o evento B é definido como sendo o AC

Frequência Relativa → Seja “E” um experimento e “A” e “B” eventos associados a

este experimento. Se após “n” realizações/repetições do experimento forem

observados nA e nB resultados favoráveis aos eventos A e B, respectivamente, então

suas frequências relativas são: fA = nA/n e fB = nB/n.

Propriedades da Frequência Relativa:

0 ≤ fA ≤ 1

fA = 1 ↔ nA = n

fA = 0 ↔ nA = 0

Se A ∩ B = Ø, então fAUB = fA + fB

O Princípio da Regularidade Estatística afirma que se um experimento for realizado

sob as mesmas condições um grande número de vezes, determinada frequência relativa tende

28

Page 32: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

a se estabilizar e se aproximar do seu valor de probabilidade. Neste caso, definimos uma

função P : S → [0 ; 1], que chamaremos de Probabilidade, se forem satisfeitas as seguintes

condições:

0 ≤ P(A) ≤ 1, para qualquer evento “A” do “S”

P(S) = 1

Se A ∩ B = Ø, então P(A U B) = P(A) + P(B)

OBS1: Esta terceira condição pode ser generalizada para o caso de um número finito de

eventos mutuamente exclusivos → P(A1 U A2 U ... U An) = P(A1) + P(A2) + ... + P(An);

OBS2: P(S) = P(A) + P(AC) = 1;

OBS3: Se os elementos do “S” são equiprováveis, isto é, apresentam a mesma chance

de ocorrer, definiremos a probabilidade de um evento A como sendo:

P(A) =

1.1 Teoremas de Probabilidade

Teorema 1 → Seja Ø o evento vazio, então:

P(Ø) = 0

Teorema 2 → AC denomina-se o complemento do evento “A”, então:

P(AC) = 1 – P(A)

Teorema 3 → Sejam “A” e “B” dois eventos quaisquer associados a um mesmo

experimento aleatório, então:

P(A U B) = P(A) + P(B) – P(A ∩ B)

Teorema 4 → Sejam “A”, “B” e “C” três eventos quaisquer associados a um mesmo

experimento aleatório, então:

P(A U B U C) = P(A) + P(B) + P(C) – P(A ∩ B) – P(A ∩ C) – P(B ∩ C) + P(A ∩ B ∩ C)

2 – PROBABILIDADE CONDICIONAL

29

Page 33: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Sejam “A” e “B” dois eventos quaisquer, associados a um experimento aleatório. A

probabilidade do evento “A” ocorrer uma vez que o evento “B” tenha ocorrido, ou seja, a

probabilidade condicional de “A” dado que “B” ocorreu, é definida por:

P(A/B) = , para P(B) > 0

(Lê-se: probabilidade condicional de “A” dado que “B” ocorreu)

OBS: Quando P(B) = 0 tem-se que P(A/B) = 0.

2.1 Teorema do Produto das Probabilidades

Vimos que a probabilidade condicional do evento “A” na hipótese de que o evento “B”

tenha ocorrido é dada por:

P(A/B) =

Multiplicando ambos os lados da igualdade obtêm:

P(A ∩ B) = P(A/B) x P(B)

Este resultado é designado pelo nome “Teoria do Produto das Probabilidades”. É de

grande utilidade, pois permite o cálculo da probabilidade de interseção a partir da

probabilidade condicional.

3 – INDEPENDÊNCIA PROBABILÍSTICA

Sejam “A” e “B” dois eventos quaisquer, associados a um experimento aleatório.

Dizemos que “A” e “B” são dois eventos independentes se for válida a igualdade:

P(A ∩ B) = P(A) x P(B)

30

Page 34: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Se “A” e “B” são independentes, temos então que P(A/B) = P(A), pois:

P(A/B) = = = P(A)

Suponha três eventos quaisquer “A”, “B” e “C”. Eles serão independentes se for válida

as seguintes condições:

i) P(A ∩ B) = P(A) x P(B)

P(A ∩ C) = P(A) x P(C)

P(B ∩ C) = P(B) x P(C)

ii) P(A ∩ B ∩ C) = P(A) x P(B) x P(C)

Se os eventos “A”, “B” e “C” satisfazerem as condições i e ii eles são referidos como

mutuamente independentes.

4 – TEOREMA DE BAYES

Com base na definição de probabilidade condicional pode-se estabelecer um resultado

útil, conhecido como Teorema de Bayes.

Sejam “A” e “B” dois eventos quaisquer, associados a um experimento aleatório, com

P(A) > 0 e P(B) > 0.

P(B/A) =

P(Bj/A) = =

31

Page 35: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

O Teorema de Bayes relaciona a probabilidade de um evento principal com

probabilidades condicionais, em que B1, B2, ..., Bn são eventos mutuamente exclusivos e

exaustivos. Simbolicamente P(Bi ∩ Bj) = Ø para i ≠ j e P(B1 U B2 U ... U Bn) = P(S) = 1.

EXERCÍCIOS PROPOSTOS

1 – De acordo com o experimento defina o espaço amostral (S):

a) Lançamento de uma moeda duas vezes;

b) Jogar um dado e observar sua face superior;

c) Uma fábrica produz determinado artigo. Da linha de produção são retirados três

artigos, cada qual classificado como Bom (B) ou Defeituoso (D).

2 – Determinar os eventos de acordo com os experimentos do exercício anterior:

a) Evento A → Ocorrência de uma cara;

b) Evento B → Ocorrência de face menor que seis;

c) Evento C → Obtenção de dois artigos defeituosos.

3 – Um lote é formado por dez artigos bons, quatro com defeitos menores e dois com defeitos

graves. Um artigo é escolhido ao acaso. Calcule a probabilidade de que:

a) Ele não tenha defeitos;

b) Ele não tenha defeitos graves;

c) Ele seja perfeito ou tenha defeitos graves.

4 – Considere um experimento aleatório e os eventos A e B associados a ele. Sabendo-se que

P(A) = ½; P(B) = 1/3 e P(A ∩ B) = ¼. Calcule:

a) P(AC);

b) P(BC);

c) P (A U B).

5 – Sejam A, B e C três eventos de um mesmo espaço amostral. Sabe-se que P(A) = P(B) =

1/3; P(C) = ¼; P(A ∩ B) = 1/8; P(A ∩ C) = P(B ∩ C) = 1/9 e P(A ∩ B ∩ C) = 1/20.

Calcular as seguintes probabilidades:

32

Page 36: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

a) De um evento “X”, consistindo na realização de pelo menos um dos eventos A, B ou

C; (Considere que sejam três eventos quaisquer)

b) De um evento “Y”, consistindo na realização de pelo menos um dos eventos A, B ou

C. (Considere que sejam três eventos mutuamente exclusivos)

c) Os eventos A, B e C são mutuamente independentes?

6 – O quadro abaixo representa a divisão dos alunos matriculados em determinado Instituto de

Matemática. Pede-se:

SexoCurso Masculino Feminino Total

Matemática Pura (MP) 70 40 110Matemática Aplicada (MA) 15 15 30Estatística (E) 10 20 30Computação (C) 20 10 30

Total 115 85 200

a) A probabilidade de o aluno estar matriculado em Matemática Pura (MP);

b) A probabilidade de o aluno ser do sexo feminino;

c) Dado que o aluno escolhido ao acaso esteja matriculado no curso de Estatística (E),

qual a probabilidade de ser do sexo feminino;

d) Sabendo que uma aluna foi escolhida, qual a probabilidade dela estar matriculada no

curso de Estatística (E).

7 – Em determinada universidade 25% dos estudantes foram reprovados em Matemática (M),

15% em Estatística (E) e 10% em Matemática e Estatística. Um estudante é selecionado

aleatoriamente:

a) Se ele foi reprovado em Estatística, qual é a probabilidade de ter sido reprovado em

matemática;

b) Se ele foi reprovado em Matemática, qual é a probabilidade de ter sido reprovado em

Estatística;

c) Qual é a probabilidade de ter sido reprovado em Matemática ou Estatística.

8 – Uma indústria farmacêutica produz medicamentos em três laboratórios: I, II e III. O

laboratório I produz 40% dos medicamentos, enquanto que os laboratórios II e III produzem

30% cada. A probabilidade de que um medicamento produzido por estes laboratórios

33

Page 37: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

apresente adulteração com relação a sua composição química é de 0,01; 0,04 e 0,03 para os

laboratórios I, II e III, respectivamente.

a) Sabendo que o medicamento escolhido é adulterado, determinar a probabilidade de ele

ter sido produzido pelo laboratório I;

b) Sabendo que o medicamento escolhido é adulterado, determinar a probabilidade de ele

não ter sido produzido pelo laboratório I.

CONTEÚDO IV

VARIÁVEIS ALEATÓRIAS

34

Page 38: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

1 – INTRODUÇÃO

Variável Aleatória (v.a.) é toda e qualquer variável associada a uma probabilidade, isto

é, os seus valores estão relacionados a um experimento aleatório.

Exemplo: Ao jogar uma moeda duas vezes, o espaço amostral associado a este

experimento aleatório será: S = { Ca Ca ; Ca Co ; Co Ca ; Co Co}.

Considere que “X” represente o número de caras na face superior do lançamento da

moeda. Temos então uma função definida no espaço amostral:

Ponto Amostral XCa Ca 2Ca Co 1Co Ca 1Co Co 0

Uma função definida em um espaço amostral é denominada variável aleatória, sendo

designada, em geral, por uma letra maiúscula (X, Y, Z, ...).

Uma variável aleatória pode ser classificada como Variável Aleatória Discreta (v.a.d.)

ou Variável Aleatória Contínua (v.a.c.).

2 – VARIÁVEL ALEATÓRIA DISCRETA

Considere X uma Variável Aleatória. Se o conjunto de valores de X for finito ou

infinito enumerável, então X será uma Variável Aleatória Discreta (v.a.d.), sendo obtida

mediante a alguma forma de contagem.

Exemplos:

Número de acidentes ocorridos em uma semana;

Número de peças defeituosas produzidas por uma máquina;

Número de filhos do sexo masculino de um casal.

2.1 Função de Probabilidade

35

Page 39: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

A Função de Probabilidade de uma Variável Aleatória Discreta X é uma função que

define a probabilidade de ocorrência de cada resultado xi desta variável, isto é, se X assume os

valores {x1 ; x2 ; ... ; xn}, então:

P(X = xi) = P(xi) = pi ,

em que a cada valor xi associa-se a sua probabilidade de ocorrência.

A Função de Probabilidade satisfaz as seguintes condições:

P(xi) ≥ 0, para todo xi

A coleção dos pares [xi ; P(xi)], com i = 1, 2, ..., n, denominaremos de Distribuição de

Probabilidade da Variável Aleatória Discreta X, podendo ser representada por meio de

tabelas e/ou gráficos.

Exemplo: Considere o experimento aleatório mencionado anteriormente (lançamento

de uma moeda duas vezes), em que “X” represente o número de caras na face superior do

lançamento da moeda. A Distribuição de Probabilidade da Variável Aleatória Discreta X

será:

Xi 0 1 2P(Xi) 1/4 1/2 1/4 1,0

2.2 – Medidas de Posição

2.2.1 Esperança Matemática ou Valor Esperado

A Esperança Matemática ou Valor Esperado quantifica a média de uma Variável

Aleatória Discreta (v.a.d.).

Seja X uma v.a.d. com a seguinte Distribuição de Probabilidade:

Xi X1 X2 ... Xn

P(Xi) P(X1) P(X2) ... P(Xn) 1,0

Define-se Esperança Matemática de X por:

36

Page 40: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

E(X) = X1.P(X1) + X2.P(X2) + ... + XnP(Xn) =

Propriedades da Esperança Matemática:

A Esperança Matemática de uma constante é a própria constante → E(K) = K;

A Esperança Matemática do produto de uma constante por uma variável é igual ao

produto da constante pela Esperança Matemática da variável → E(KX) = K.E(X);

Se X e Y são duas variáveis aleatórias independentes → E(XY) = E(X).E(Y);

Esperança Matemática da soma ou da subtração de duas variáveis quaisquer é igual à

soma ou subtração das Esperanças Matemáticas das duas variáveis aleatórias → E(X

Y) = E(X) E(Y);

A Esperança Matemática da soma ou subtração de uma variável aleatória com uma

constante é igual à soma ou subtração da Esperança Matemática da variável com a

constante → E(X K) = E(X) K.

2.2.2 – Mediana

A Mediana é o valor de Xi que divide a Distribuição de Probabilidade em duas partes

equiprováveis.

P(X ≤ Md) = P(X > Md) = ½

2.2.3 – Moda

A Moda de uma Variável Aleatória Discreta X é o valor de Xi que apresenta maior

probabilidade em sua Distribuição de Probabilidade.

2.3 – Medidas de Dispersão

37

Page 41: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

2.3.1 – Variância

A Variância é uma medida que quantifica a dispersão dos valores em torno da média.

A Variância de uma Variável Aleatória Discreta X é definida por:

V(X) =

em que:

E(X2) =

Propriedades da Variância:

A variância de uma constante é igual à zero → V(K) = 0;

Somando ou subtraindo uma constante a uma variável aleatória sua variância não se

altera → V(X ± K) = V(X);

Multiplicando uma variável aleatória por uma constante sua variância fica

multiplicada pelo quadrado da constante → V(K.X) = K2.V(X);

A variância da soma ou subtração de duas Variáveis Aleatórias Independentes (X e Y)

é igual à soma de suas variâncias → V(X ± Y) = V(X) + V(Y).

2.3.2 – Desvio Padrão

O Desvio Padrão de uma Variável Aleatória Discreta X é a raiz quadrada positiva da

variância da v.a.d. X.

3 – VARIÁVEL ALEATÓRIA CONTÍNUA

Seja X uma Variável Aleatória (v.a.). Se X puder assumir todo e qualquer valor em

algum intervalo a ≤ X ≤ b, em que a e b podem ser - e + , então X é uma Variável

Aleatória Contínua (v.a.c.). A v.a.c. está associada a um espaço amostral infinito e não

enumerável.

EXERCÍCIOS PROPOSTOS

38

Page 42: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

1 – Uma urna contém quatro bolas azuis e seis bolas brancas. Duas bolas são retiradas

sucessivamente. Determinar a Distribuição de Probabilidade do número de bolas brancas

retiradas, em cada caso:

a) Com reposição;

b) Sem reposição.

2 – Seja X uma Variável Aleatória Discreta (v.a.d.) com a seguinte Distribuição de

Probabilidade:

Xi – 2 – 1 2 4 TotalP(Xi) 1/4 1/8 1/2 1/8 1,0

Pede-se:

a) E(X);

b) Md(X);

c) Mo(X);

d) V(X);

e) DP(X);

f) E(Y) e V(Y), dado que Y = 2X + 5.

CONTEÚDO V

39

Page 43: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS

1 – DISTRIBUIÇÃO BINOMIAL (Variável Aleatória Discreta)

Um Experimento de Bernoulli é um experimento que admite apenas dois tipos de

resultados, denominados sucesso e fracasso. A probabilidade de ocorrência de sucesso é igual

ao parâmetro p.

Exemplos de Experimentos de Bernoulli:

Lançar uma moeda e observar a face superior. Os possíveis resultados são cara (sucesso) e

coroa (fracasso) OU cara (fracasso) e coroa (sucesso);

Lançar um dado e observar se ocorre à face número 5 (face 5: sucesso) ou a ocorrência de

outra face (faces 1; 2; 3; 4 ou 6: fracasso).

Seja X o número de sucessos em n repetições independentes e idênticas de um

Experimento de Bernoulli caracterizado com o parâmetro p. Então X terá Distribuição

Binomial, caracterizada pelos parâmetros n e p.

Notação da Distribuição Binomial: X ~ B (n ; p) → X segue Distribuição Binomial

com n repetições e p probabilidade de sucesso.

A esperança matemática e a variância de uma variável aleatória X que segue

Distribuição Binomial são definidas por:

E(X) = n.p

V(X) = n.p.q, em que q = 1 – p (q = fracasso)

Exemplos de experimentos que seguem Distribuição Binomial:

n lançamentos de uma moeda, em que X = número de caras;

n lançamentos de um dado, em que X = número de vezes que ocorre a face 5;

OBS: Observar que a v.a.d. X que segue Distribuição Binomial pode assumir os valores:

{0 ; 1 ; 2 ; 3 ; ... ; n}

A Função de Probabilidade de uma v.a.d. X que segue Distribuição Binomial é

definida por:

40

Page 44: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

P(X = x) = ,

em que:

n > 0 ; 0 < p < 1 ; p + q = 1

2 – DISTRIBUIÇÃO NORMAL (Variável Aleatória Contínua)

Diz-se que uma Variável Aleatória Contínua X segue Distribuição Normal, com

parâmetros μ e σ2, se o gráfico de sua Função Densidade de Probabilidade for uma Curva

Normal, ou seja, apresentar Distribuição Simétrica. Mais especificamente, quando sua

Função Densidade de Probabilidade for definida pela equação:

, -∞ < x < ∞ ,

em que:

e = 2,71828… ; π = 3,14159…

Os parâmetros que caracterizam a Distribuição Normal são a média e a variância da

Variável Aleatória Contínua X, denotados por μ e σ2, respectivamente.

Notação da Distribuição Normal: X ~ N (μ ; σ2) → X segue Distribuição Normal com

média μ e variância σ2.

2.1 – Características da Distribuição Normal

A curva normal é simétrica em torno de sua média μ;

A área total abaixo da curva vale 1 (um). Devido a sua simetria, 50% da área ficam à

esquerda da média μ e 50% ficam à direita da média μ;

A média, a mediana e a moda são iguais (Distribuição Simétrica);

A Distribuição Normal fica completamente caracterizada identificando os parâmetros

μ e σ2 (μ pode assumir qualquer valor real e σ2 é sempre positiva);

41

Page 45: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Qualquer combinação linear de uma v.a.c. que segue Distribuição Normal também

resultará em uma v.a.c. com Distribuição Normal. Mais especificamente, se X ~ N (μ ;

σ2) e Y = aX + b, sendo a e b constantes quaisquer, então Y ~ N (aμ + b ; a2σ2).

2.2 – Distribuição Normal Padrão ou Normal Reduzida

Diz-se que uma v.a.c. X segue Distribuição Normal Padrão ou Normal Reduzida se X

~ N (0 ; 1), isto é, se X apresentar uma Distribuição Normal com média 0 e variância 1. A

Função Densidade de Probabilidade da Distribuição Normal Padrão é definida por:

, -∞ < x < ∞

A Distribuição Normal Padrão está tabelada, o que facilita seus cálculos. Para

determinar a área abaixo da Curva da Normal Padrão, entre dois pontos quaisquer, não há

necessidade de calcular a integral de sua Função Densidade de Probabilidade. Para obter as

áreas de interesse sob a Curva da Normal Padrão utiliza-se a Variável Normal Padronizada

(Z):

,

em que:

Z = Valor da Variável Normal Padronizada, obtido em tabela específica;

X = Valor assumido pela v.a.c. X;

= Média da v.a.c. X;

= Desvio Padrão da v.a.c. X.

Como os valores da Variável Normal Padronizada (Z) estão tabelados, para

determinar a área abaixo da curva entre dois pontos quaisquer basta consultar a Tabela da

Distribuição Normal.

A média e a variância da Variável Normal Padronizada (Z) são 0 e 1, respectivamente.

Ou seja, E(Z) = 0 e V(Z) = 1.

Notação da Variável Normal Padronizada (Z): Z N (μ ; σ2) → Z N (0 ; 1).

EXERCÍCIOS PROPOSTOS

42

Page 46: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

1 – Um produtor de sementes afirma que 80% das sementes produzidas por determinado

genótipo germinam. Você planta cinco destas sementes, compradas deste produtor. Qual a

probabilidade de:

a) Exatamente duas sementes germinarem;

b) Exatamente duas sementes não germinarem;

c) Pelo menos duas sementes germinarem;

d) Suponha que 100 pessoas estejam em situação análoga a sua, isto é, cada uma plantou

cinco destas sementes. Para quantas pessoas espera-se que exatamente duas sementes

germinem?

2 – Entre 2.000 famílias com quatro crianças cada, quantas famílias são esperadas que

apresentem:

a) Pelo menos um menino;

b) Exatamente uma menina.

3 – Calcular:

a) P(Z ≤ 1,82);

b) P(Z ≤ - 2,03);

c) P(- 2,55 ≤ Z ≤ 1,20);

d) P(Z ≥ 1,93).

4 – Seja X uma v.a.c. normalmente distribuída com média 850 e desvio padrão 48.

Determinar:

a) P(X < 790);

b) P(X > 940);

c) P(760 < X < 920).

5 – Considere que X e Y sejam duas v.a. com Distribuição Normal e Independentes.

Determinar para a variável W a probabilidade de ser superior a 25, ou seja, P(W > 25).

Dados: E(X) = 5 ; V(X) = 2 ; E(Y) = 3 ; V(Y) = 1 ; W = 3X + Y + 2

CONTEÚDO VI

43

Page 47: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

INFERÊNCIA ESTATÍSTICA

1 – INTRODUÇÃO

Ao retirar uma amostra aleatória de uma população e calcularmos a partir desta

amostra qualquer quantidade (medidas descritivas numéricas), encontramos a estatística, ou

seja, chamaremos os valores calculados em função dos elementos da amostra de estatísticas.

As estatísticas, sendo variáveis aleatórias, terão alguma distribuição de probabilidade,

com uma média, uma variância, etc. A distribuição de probabilidade de uma estatística é

denominada de Distribuição Amostral.

A inferência estatística tem por objetivo fazer generalização sobre uma população com

base em dados de uma amostra. As populações são caracterizadas por medidas descritivas

numéricas, chamadas de parâmetros. Muitas pesquisas estatísticas tem por objetivo fazer

inferência a respeito de um ou mais parâmetros da população. Essa inferência pode ser por

meio de um único valor numérico (estimação por ponto), por uma amplitude de valores

numéricos (estimação por intervalo) ou pelo simples “sim” ou “não” (teste de hipótese).

Como exemplo, considere uma nova marca de inseticida lançada no mercado. A

pesquisa estatística pode ter diversos interesses: i) saber qual dose de inseticida mata 90% dos

insetos (estimação por ponto); ii) desejar um intervalo com coeficiente 1 – α de confiança

para que se tenha a mortalidade de 90% dos insetos (estimação por intervalo); iii) ou ainda o

interesse poderia focar se o inseticida novo é preferível aos já existentes no mercado (teste de

hipóteses).

A estimação por ponto utiliza a informação da amostra para chegar a um único valor

numérico ou ponto, que estima o parâmetro de interesse (parâmetro populacional). Ex: Média,

Variância, Coeficiente de Variação, etc.

A estimação por intervalo utiliza a informação da amostra para chegar a dois números,

entre os quais se espera encontrar o parâmetro de interesse. Caso este intervalo esteja

associado a uma probabilidade “1 – α”, tem-se um intervalo de confiança com coeficiente de

confiabilidade de “1 – α”.

2 – CONCEITOS

44

Page 48: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

População: é o conjunto de todos os elementos sobre os quais desejamos desenvolver

determinado estudo;

Amostra: é uma parte dos elementos da população, ou seja, qualquer subconjunto da

população;

Parâmetro: é uma medida utilizada para descrever uma característica da população;

Estatística: é uma característica da amostra, ou seja, uma estatística T é uma função de

X1, X2, X3, ..., Xn → T = f (X1, X2, X3, ..., Xn);

Estimador: é qualquer estatística T = f (X1, X2, X3, ..., Xn) utilizada para estimar uma

quantia desconhecida. Em geral, ele é representado por uma determinada fórmula;

Estimativa: é o valor numérico assumido pelo estimador quando os valores observados

(X1, X2, X3, ..., Xn) são considerados.

3 – DISTRIBUIÇÃO AMOSTRAL DA MÉDIA

A distribuição amostral de uma determinada estatística é a distribuição de todos os

possíveis valores que ela pode assumir, calculados a partir de todas as possíveis amostras de

mesmo tamanho.

Para determinado tamanho “n” da amostra, tomada de uma população com média “μ”,

o valor da média amostral ( ) varia de uma amostra para outra. A distribuição amostral da

média é descrita para determinar o Valor Esperado [E( )] e o Desvio Padrão [σ( )] da

distribuição das médias. Uma vez que o Desvio Padrão indica a acurácia da média da amostra

como um estimador por ponto, σ( ) é usualmente chamado de Erro Padrão da Média. Em

geral, o Valor Esperado e o Erro Padrão da Média são definidos como:

E( ) = μ

σ( ) =

4 – INTERVALO DE CONFIANÇA (IC)

45

Page 49: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

A estimação por ponto é bastante útil, porém nenhuma acurácia ou precisão pode ser

associada a esta estimação. Assim, ao invés de inferirmos sobre um único valor referente ao

parâmetro populacional, podemos inferir se o verdadeiro parâmetro está contido em

determinado intervalo compreendido entre dois valores, que representam os extremos do

intervalo (LSuperior e LInferior).

O objetivo da estimação por intervalo é gerar intervalos pequenos que incluam o

verdadeiro parâmetro populacional com alta probabilidade.

Os extremos do intervalo podem variar aleatoriamente de uma amostra para outra, pois

estão em função das médias amostrais (estimativas).

O comprimento do intervalo pode ser obtido pela diferença entre os limites superior e

inferior (LSup. – LInf.).

4.1 IC para a Média (μ) de uma População Normal com σ2 conhecida

P = 1 – α

IC (μ) 1 – α: ±

O comprimento do IC além de ser obtido pela diferença entre os limites superior e

inferior, também pode ser obtido pela expressão:

Comprimento do IC = 2.

Caso seja mantido os valores de n, σ e α o seu comprimento será fixo/constante. Já a

estimativa da média ( ) continua sendo uma variável aleatória, que determina os extremos do

intervalo de acordo com a amostra considerada.

A interpretação do IC pode ser assim mencionada: Tem-se 1 – α (%) de confiança de

que o parâmetro populacional (μ) esteja compreendido no intervalo obtido. Ou mesmo, se

construirmos n intervalos do mesmo tipo (tamanho e confiança), espera-se que em 1 – α (%)

deles contenha o verdadeiro parâmetro (μ).

EXERCÍCIOS PROPOSTOS

1 – Suponha que a média de uma população seja μ = 50,00 e o desvio padrão σ = 12,00.

46

Page 50: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

a) Determinar a Distribuição Amostral da Média das amostras de tamanho n = 36 em

termos de Valor Esperado e Erro Padrão da Média;

b) Determinar o tamanho da amostra para se obter um Erro Padrão da Média igual a

3,00.

2 – Uma Variável Aleatória X tem Distribuição Normal, com média 100 e desvio padrão 10.

a) Se é a média de uma amostra de 16 elementos retirados dessa população, calcule P

(90 < < 110);

b) Que tamanho deveria ter a amostra para que P (90 < < 110) = 95%?

3 – Seja X a duração da vida de uma peça de equipamento, tal que σ = 5 horas. Admita que

100 peças foram ensaiadas fornecendo uma duração de vida média de = 500 horas.

a) Obter um intervalo de 95% de confiança para a média μ;

b) Qual o tamanho da amostra para que o intervalo 500 ± 1,63 tenha 95% de confiança?

CONTEÚDO VII

LISTAS DE EXERCÍCIOS

47

Page 51: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

CONTEÚDO I – Somatório

1 – Considere os seguintes valores:

X1 = 2 X2 = 4 X3 = 6 X4 = 8 X5 = 10 X6 = 12 X7 = 14 X8 = 16

Y1 = 1 Y2 = 3 Y3 = 5 Y4 = 7 Y5 = 9 Y6 = 11 Y7 = 13 Y8 = 15

Calcule os somatórios:

a)

b)

c)

d)

2 – Calcule os valores de X1 e X3.

Dados:

3 – Sabendo-se que:

X1 = 3 X2 = 4 X3 = 8 X4 = 7 X5 = 6

Y1 = 3 Y2 = 8 Y3 = 2 Y4 = 5 Y5 = 6

Calcule:

a)

b)

c)

d)

48

Page 52: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

e)

f)

4 – Dados:

i fi Xi

1 3 102 5 113 9 154 10 195 2 216 1 26

Calcule os seguintes somatórios:

a)

b)

c)

d)

e)

5 – Calcule o valor de X nos seguintes casos:

a)

b)

49

Page 53: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

CONTEÚDO II – Análise Exploratória de Dados

1 – Considere os dados: {12; 17; 17; 17; 10; 10; 9; 9; 9; 12; 12; 6; 6; 6; 17; 17; 12; 12; 9; 9; 9;

12; 12; 12; 12}. Suponha que sejam valores assumidos por uma variável aleatória discreta X.

Pede-se:

a) Tabela de Distribuição de Frequência;

50

Page 54: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

b) Média, Mediana e Moda;

c) Erro padrão da média e Coeficiente de variação (C.V.%);

d) Considere que os dados foram obtidos incorretamente. As medidas apresentam erros

de modo que todos os valores da série tenham que ser multiplicados por um fator de

correção igual a 1,1. Corrigindo o suposto erro, qual seria o novo valor da média, do

erro padrão da média e do coeficiente de variação?

e) Coeficiente de Assimetria.

2 – Para cada série de dados abaixo, determine: Tabela de Distribuição de Frequência; Média;

Moda; Mediana; Variância; Desvio Padrão; Erro Padrão da Média e Coeficiente de Variação.

a) {1; 3; 3; 4; 5; 6; 6};

b) {9; 8; 1; 3; 8; 3; 4; 6};

c) {88; 82; 91; 93; 86; 84}.

3 – Uma prova consta de três questões com peso (Pi) igual a 1, 2 e 3, para as notas (X i) da 1ª,

2ª e 3ª questão, respectivamente (i = 1, 2, 3). Considere o valor máximo de cada questão igual

a dez (10) e que um aluno obteve nota oito (8) na prova. Qual nota ele conseguiu na 1ª

questão, sabendo que na 2ª questão obteve nota seis (6) e na 3ª nota nove (9)?

4 – Em um grupo de 600 hóspedes de determinado hotel, tem-se os seguintes valores com

relação ao tempo de permanência no hotel:

Média = 9 dias;

1º Quartil = 5 dias;

3º Quartil = 15 dias;

Coeficiente de variação = 20%.

Pede-se:

a) Quantos hóspedes permaneceram mais de 15 dias;

b) Quantos hóspedes permaneceram entre 5 e 15 dias;

c) O desvio padrão para o tempo de permanência;

d) Supondo que o grupo de 600 hóspedes permaneça mais dois dias, calcule a nova

média, o desvio padrão e o coeficiente de variação.

51

Page 55: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

5 – Um caminhão cujo peso vazio é de 3.200 kg será carregado com 470 caixas de 11 kg cada,

360 caixas de 9 kg cada, 500 caixas de 4 kg cada e 750 caixas de 6 kg cada. O motorista do

caminhão pesa 75 kg e a lona de cobertura da carga pesa 48 kg.

a) Sabendo-se que este caminhão tem que passar por uma balança que só permite a

passagem de veículos com peso máximo de 16 toneladas, pergunta-se: Ele passará

pela balança?

b) Qual o peso médio das caixas carregadas no caminhão?

6 – A tabela abaixo apresenta os resultados, em pontos, da prova final da Disciplina de

Estatística de 80 estudantes.

20 28 20 25 21 25 21 23 23 2328 34 30 33 30 33 30 32 30 3035 40 35 39 35 39 37 38 38 3840 49 40 47 40 45 42 45 43 4450 55 50 54 50 53 51 52 52 5255 57 55 57 55 57 55 57 55 5657 65 58 65 58 65 60 63 60 6267 88 68 88 72 85 73 80 74 75

Obter a Distribuição de Frequência em Intervalo de Classe e determinar: (Dados: k =

9; h = 8 e Limite Inferior = 20. Adotar intervalo fechado à esquerda).

a) Os pontos médios;

b) As frequências absoluta e acumulada;

c) As frequências relativas simples e acumulada;

d) Construir: Histograma, Polígono de Frequência Simples e Polígono de Frequência

Acumulada;

e) Média, Mediana e Moda;

f) Qual a percentagem de alunos que obtiveram mais de 50 pontos;

g) Qual a percentagem de alunos que obtiveram menos de 40 pontos;

h) 3º Quartil; 6º Decil e 40º Percentil;

i) Variância, Desvio Padrão e Coeficiente de Variação.

7 – Os desvios tomados em relação à média aritmética de um conjunto de dados são: {-7;

-5; -1; 0; 0; 1; 4; 4; 4}. Sabendo-se que = 45, determine:

a) O conjunto de dados;

b) Moda;

52

Page 56: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

c) Mediana;

d) Variância;

e) Desvio Padrão;

f) Coeficiente de Variação.

8 – A série de dados abaixo se refere às medidas tomadas de uma amostra de cães.

Cão 1 2 3 4 5 6 7 8 9 10Peso (kg) 23,0 22,7 21,2 21,5 17,0 28,4 19,0 14,5 19,0 19,5Comprimento (cm) 104 105 103 105 100 104 100 91 102 99

Pedem-se, para cada característica avaliada (peso e comprimento), as estatísticas:

a) Média;

b) Mediana;

c) Moda;

d) Variância;

e) Desvio Padrão;

f) Erro Padrão da Média;

g) Coeficiente de Variação;

h) Qual das duas características é mais homogênea?

i) Coeficiente de Correlação entre as duas características.

9 – Complete a tabela abaixo. Utilize intervalo fechado à esquerda.

Classes PM fi fai fri

10 5 0,062520 8

19 0,075

10 330,15

15 600,125

10 80

Pede-se:

a) Média, Mediana e Moda;

b) Variância, Desvio Padrão e Coeficiente de Variação;

c) 1º Quartil, 2º Decil e 30º Percentil;

53

Page 57: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

d) Valor acima do qual se encontram 60% dos dados;

e) Curtose.

10 – Duas turmas A e B com nA = 50 e nB = 80, apresentam Médias A = 65 e B = 70 e

Variâncias e . Qual é a turma mais homogênea?

11 – Um pesquisador dispõem das seguintes informações a respeito de uma amostra:

Média = 50,34

Soma do quadrado dos valores = 150.000

Número de elementos da amostra = 54

Calcular as medidas de dispersão possíveis a partir das informações fornecidas.

12 – Cem (100) animais foram divididos em dois grupos: 1º grupo com 56 animais; 2º grupo

com 44 animais. No primeiro grupo, que foi vacinado contra determinada doença, 47 animais

não adoeceram. No segundo grupo, que não foi vacinado, 28 animais não adoeceram.

a) Construir a Tabela de Contingência;

b) Calcular o Coeficiente de Contingência e o Coeficiente de Contingência Corrigido.

CONTEÚDO III – Probabilidade

1 – Defina e dê exemplo:

a) Espaço Amostral;

54

Page 58: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

b) Evento;

c) Evento Mutuamente Exclusivo;

d) Evento Não Mutuamente Exclusivo;

e) Evento Independente;

f) Evento Dependente.

2 – Considerando o espaço amostral de um experimento constituído do lançamento de dois

dados perfeitamente simétricos, pede-se:

a) Qual a probabilidade de que o primeiro dado mostre a face 5 e o segundo a face 3?

b) Qual a probabilidade de que os dois dados mostrem um número par?

c) Qual a probabilidade de que o primeiro dado mostre um número menor em sua face

em comparação ao segundo dado?

3 – Uma moeda perfeita é lançada três vezes e observa-se o número de caras. Qual é a

probabilidade de ocorrer:

a) Pelo menos uma cara?

b) Só cara ou só coroa?

c) Exatamente uma cara?

4 – Em um processo produtivo, 10% dos itens fabricados apresentam defeito. Qual a

probabilidade na escolha aleatória de dois itens:

a) De os dois serem defeituosos?

b) De os dois não serem defeituosos?

c) De pelo menos um ser defeituoso?

5 – Em determinada universidade, dos 300 estudantes matriculados no curso de Ciências

Biológicas, 100 cursam Química, 80 Estatística e 30 ambas as disciplinas. Ao escolher

aleatoriamente um estudante de Ciências Biológicas, qual a probabilidade de ele cursar:

a) Química?

b) Estatística?

c) Estatística e Química?

d) Nenhuma das duas disciplinas?

e) Estatística ou Química?

55

Page 59: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

6 – Sejam A, B e C três eventos de um mesmo espaço amostral S. Sabendo-se que: P(A) =

P(B) = 1/3; P(C) = 1/4; P(A∩B) = 1/8; P(A∩C) = P(B∩C) = 1/9 e P(A∩B∩C) = 1/20.

Calcular as probabilidades:

a) De ocorrer pelo menos um dos eventos A, B ou C;

b) De que não se realize nenhum dos eventos A, B ou C;

7 – Jogam-se dois dados. Se as duas faces mostram números diferentes, qual a probabilidade

de que uma das faces seja o 4?

8 – Quatro equipes A, B, C e D participam de um torneio que premiará uma única equipe

campeã. Quanto às probabilidades de cada equipe vencer o torneio, as equipes C e D são

equiprováveis, a equipe A é duas vezes mais provável de vencer em relação a equipe B, sendo

esta (equipe B) duas vezes mais provável de vencer em relação as equipes C e D. Pede-se:

Qual a probabilidade de que as equipes C ou D sejam campeãs?

9 – Se P(A) = 1/2 e P(B) = 1/4. Calcular: P(AC), P(BC) e P(AUB), se:

a) A e B são eventos mutuamente exclusivos;

b) A e B são eventos quaisquer e independentes.

10 – Uma urna contém cinco bolas pretas, três vermelhas e duas brancas. Foram extraídas três

bolas com reposição. Qual a probabilidade de terem sido duas bolas pretas e uma vermelha?

11 – Uma caixa A contém oito peças, das quais três são defeituosas. Uma outra caixa B

contém cinco peças, das quais duas são defeituosas. Uma peça é retirada aleatoriamente de

cada caixa.

a) Qual a probabilidade “p” de ambas as peças não serem defeituosas?

b) Qual a probabilidade “p” de que uma peça seja defeituosa e a outra não?

12 – Uma urna contém 12 bolas: cinco brancas, quatro vermelhas e três pretas. Outra urna

contém 18 bolas: cinco brancas, seis vermelhas e sete pretas. Uma bola é retirada de cada

urna. Qual a probabilidade de que as duas bolas sejam da mesma cor?

13 – João é um rapaz ganancioso, trabalhador e objetivo. Ele estabeleceu por meta em cinco

anos ter o patrimônio de R$700.000,00. Deste modo, João decidiu trabalhar no exterior com

56

Page 60: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

as seguintes probabilidades de destino: EUA 25%, Japão 60% e Austrália 15%. Caso ele

optasse pelos EUA, a probabilidade de alcançar a meta seria de 50%, para o Japão 80% e para

a Austrália 35%. Pois bem, decorridos cinco anos, João está de volta ao Brasil tendo

cumprido sua meta. Quais são as probabilidades de ter cumprido a meta tendo o João

trabalhado:

a) Nos EUA;

b) No Japão;

c) Na Austrália.

14 – Em uma turma de Estatística 20%, 50% e 30% do total de alunos matriculados são dos

cursos de Ciências Biológicas (A), Educação Física (B) e Medicina Veterinária (C),

respectivamente. Destes, 20%, 5% e 2% são alunos repetentes, respectivamente. Um aluno é

escolhido ao acaso e este é repetente.

a) Qual a probabilidade de ele cursar Ciências Biológicas?

b) Qual a probabilidade de ele cursar Medicina Veterinária?

CONTEÚDO IV – Variáveis Aleatórias

1 – Quatro carneiros e três ovelhas são colocados em um cercado. Se dois animais são

retirados aleatoriamente deste cercado, sem reposição, sendo X o número de ovelhas,

encontrar:

a) A Distribuição de Probabilidade de X;

57

Page 61: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

b) E(X);

c) Desvio Padrão de X;

d) V .

2 – Seja X uma v.a.d. com a seguinte Distribuição de Probabilidade:

Xi - 2 - 1 1 2P(Xi) 1/4 1/4 1/4 1/4

Pede-se:

a) E(X);

b) V(X);

c) σ(X);

d) Md(X). Justifique;

e) Mo(X). Justifique.

3 – Suponha que X e Y (Variáveis Aleatórias Discretas) tenham as seguintes Distribuições de

Probabilidade:

Xi 1 2 4 5P(Xi) 0,30 0,2 0,30

Yj 2 3P(Yj) 0,6

Pede-se:

a) E ;

b) V(5X – 3Y). Considerar X e Y Variáveis Aleatórias Independentes.

4 – Sabendo-se que X e Y são variáveis aleatórias independentes, sendo E(X) = 5; V(X) = 2;

E(Y) = 8 e V(Y) = 3, calcule:

a) E(X – Y + 3);

b) E[(X – Y)2];

c) V ;

d) V(3Y + 2).

58

Page 62: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

5 – Sabendo-se que Y = 3X – 5 e que E(X) = 2 e V(X) = 1, encontrar:

a) E(Y);

b) V(Y);

c) E(X + 3Y);

d) E(X2 + Y2);

e) V(3X + 2Y).

CONTEÚDO V – Distribuições de Variáveis Aleatórias

1 – Determinar a probabilidade de que, em cinco lançamentos de um dado, apareça a face 3:

a) Duas vezes;

b) No máximo uma vez;

c) Ao menos duas vezes.

59

Page 63: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

2 – Considere a amostragem de 3 peças que saem de uma linha de produção. Sabe-se que

desta linha de produção 20% das peças são defeituosas. Calcular as probabilidades:

a) De duas peças serem defeituosas;

b) De duas peças não serem defeituosas;

c) Quantas peças defeituosas esperam-se amostrar, considerando 500 peças?

3 – Sabe-se que 24% dos indivíduos que recebem determinado medicamento sofrem certos

efeitos colaterais. Se este medicamento for ministrado a quatro pacientes, qual a probabilidade

de:

a) Nenhum sofrer efeitos colaterais;

b) Pelo menos um sofrer efeitos colaterais;

c) Três não sofrerem efeitos colaterais.

4 – Em uma prova com 10 questões de múltipla escolha, cada uma com 5 alternativas e

somente uma correta, pede-se:

a) Quantas questões acerta, em média, um aluno que marca todas as questões

inteiramente ao acaso?

b) Qual a probabilidade do aluno acertar 5 questões?

5 – Se X ~ B (16 ; 0,75), determinar:

a) A média de X;

b) A variância de X.

6 – Dada uma distribuição normal com μ = 100 e σ = 10. Qual a probabilidade de que:

a) X > 75?

b) 75 < X < 85?

c) X > 112?

d) X < 80 ou X > 110?

e) X < 80 e X > 110?

f) X < 90 e X > 80?

g) Considere que 80% dos dados estejam entre dois valores X1 e X2 (simetricamente

distribuídos em torno da média). Encontrar os dois valores;

h) Considere que 70% dos dados estejam abaixo de determinado valor X. Encontrar o

valor de X.

60

Page 64: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

7 – As notas de uma prova são normalmente distribuídas com média 73 e variância 225. Os

15% melhores alunos recebem o conceito A e os 11,9% piores alunos recebem o conceito R

(Reprovado). Pede-se:

a) Nota mínima para receber o conceito A?

b) Nota mínima para ser aprovado?

c) P(X ≥ 55,3).

8 – A obtenção dos pesos X, de um grande número de espigas de milho, mostrou que essa

variável é normalmente distribuída com média μ = 120g e desvio padrão σ = 10g. Em um

programa de melhoramento genético da cultura do milho, entre outras características, uma

linhagem deve satisfazer à condição 112 < X < 140. Em um programa envolvendo 450

linhagens, qual deve ser o número provável de linhagens que atende a essa condição (112 < X

< 140)?

9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído

com média 18 e variância 2,25. Um lote de 5.000 cabeças, com essa característica, foi

destinado ao frigorífico que abate só a partir de um peso mínimo W. Sabendo-se que foram

abatidas 4.200 cabeças, pede-se:

a) Qual o valor de W?

b) O número esperado de bovinos com peso entre 17 e 19 arrobas?

10 – Em determinada região, a altura das pessoas apresenta distribuição normal com desvio

padrão de 8 cm e tal que 20% da população é constituída de pessoas com menos de 168 cm de

altura. Calcule a proporção de pessoas com altura:

a) Superior a 190 cm;

b) Entre 170 e 185 cm.

11 – Em indivíduos sadios, o consumo renal de oxigênio tem distribuição normal com média

12 cm3/min e desvio padrão 1,5 cm3/min. Determinar:

a) A proporção de indivíduos sadios com consumo inferior a 10 cm3/min;

b) A proporção de indivíduos sadios com consumo superior a 8 cm3/min;

c) A proporção de indivíduos sadios com consumo entre 9,4 e 13,2 cm3/min;

d) O valor do consumo renal que é superado por 98,5% dos indivíduos sadios.

61

Page 65: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

CONTEÚDO VI – Inferência Estatística

1 – O peso dos ovos de determinada linhagem de ave de postura tem distribuição normal, com

média de 65 gramas e desvio padrão de 5 gramas. Considere uma amostra aleatória de uma

dúzia (caixa) desses ovos. Qual a probabilidade de que o peso dessa caixa esteja

compreendido entre o intervalo de 750 e 825 gramas?

62

Page 66: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

2 – Para avaliar a precisão de uma balança de laboratório, pesa-se repetidas vezes um objeto

padrão de peso conhecido igual a 10 gramas. As leituras da balança tem distribuição normal.

Sabe-se que o desvio padrão das leituras é 0,0002 gramas. Pesa-se o objeto cinco vezes e o

resultado médio é 10,0023 gramas.

a) Estabeleça um intervalo de 95% de confiança para a média de repetidas pesagens do

objeto;

b) Quantas pesagens ou medidas devem entrar no cálculo da média a fim de que se

obtenha uma margem de erro de 0,0001 com 95% de confiança?

3 – Uma agência de propaganda, que atende a uma das principais estações de rádio, gostaria

de calcular a quantidade média de tempo que a audiência gasta diariamente ouvindo radio. A

partir de estudos anteriores, o desvio padrão é calculado em 45 minutos.

a) Qual o tamanho da amostra necessário se a agência quiser ter 90% de confiança de

estar correta em um intervalo de ± 5 minutos?

b) Se for desejado um nível de 99% de confiança, qual o novo tamanho da amostra

necessário? (considerar a mesma margem de erro da alínea anterior: ± 5 minutos)

c) Faça inferências a respeito dos tamanhos das amostras encontrados nas alíneas

anteriores (a e b), explicando o motivo de ter encontrado dimensões distintas.

4 – Estudos anteriores levam a supor que crianças de dois meses alimentadas exclusivamente

com leite do tipo A sofrem um aumento de peso que segue distribuição normal, com média

desconhecida, porém de variância 9.000 gramas2. Escolhe-se ao acaso 20 crianças de dois

meses, alimentando-as exclusivamente com leite do tipo A. Nesta amostra o aumento de peso

médio foi de 475 gramas. Obtenha um intervalo de 99% de confiança para o aumento médio

do peso das crianças nas condições apresentadas.

5 – O consumo mensal de calorias (kcal/g) de determinada espécie de esquilo segue

distribuição normal com desvio padrão 0,16. Recolheu-se uma amostra aleatória de dimensão

18 cuja média amostral do consumo de calorias foi de 0,41.

a) Obtenha um intervalo de confiança a 95% para o consumo médio de calorias;

b) Qual deve ser a dimensão da amostra para que um intervalo de confiança a 95% para o

consumo médio de calorias tenha amplitude 0,2?

63

Page 67: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

6 – Qual deve ser a dimensão da amostra a recolher de uma população normal de valor médio

μ e desvio padrão 10, de modo que o intervalo de confiança para μ a 99% tenha amplitude de

uma unidade (1)?

CONTEÚDO VIII

GABARITO

CONTEÚDO I – Somatório

1 – a) – 14

64

Page 68: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

b) 33,33

c) 3.968

d) 445

2 – 2 e 6

3 – a) 24

b) 112

c) 39

d) 29

e) 128

f) 52

4 – a) 102

b) 30

c) 8.098

d) 15,93

e) 16,62

5 – a) 1

b) 7/3

CONTEÚDO II – Análise Exploratória de Dados

1 – b) = 11,4 Md = 12 Mo = 12

c) s( ) = 0,6904 CV = 30,285%

d) = 12,54 s( ) = 0,7594 CV = 30,285%

e) – 0,1738

2 –

Mo Md s2 s s( ) CVa) 4,0 3 e 6 4,0 3,333 1,825 0,689 45,62%b) 5,25 3 e 8 5,0 8,5 2,915 1,030 55,52%

65

Page 69: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

c) 87,333 Amodal 87,0 17,466 4,179 1,706 4,78%

3 – 9

4 – a) 150

b) 300

c) 1,8

d) 11 1,8 16,36%

5 – a) Não

b) 7,17 kg

6 – e) = 48,20 Md = 48,44 Mo = 55,809

f) 47,82% ≈ 48% dos alunos com mais de 50 pontos

g) 36,248% dos alunos com menos de 40 pontos

h) Q3 = 58,73 D6 = 53,684 P40 = 42,00

i) s2 = 272,128 s = 16,496 CV = 34,23%

7 – a) {38;40;44;45;45;46;49;49;49}

b) Mo = 49

c) Md = 45

d) s2 = 15,5

e) s = 3,937

f) CV = 8,748%

8 –

Peso (X) Comprimento (Y)a) 20,58 kg 101,3 cmb) Md 20,35 kg 102,5 cmc) Mo 19,00 kg 100; 104 e 105 cmd) s2 14,2973 kg2 17,7889 cm2

e) s 3,7812 kg 4,2177 cmf) s( ) 1,1957 kg 1,3338 cmg) CV 18,37% 4,16%

66

Page 70: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

h) Comprimentoi) rxy = 0,7710

9 – a) = 56,5 Md = 60,833 Mo = 68,75

b) s2 = 592,65 s = 24,34 CV = 43,07%

c) Q1 = 37,5 D2 = 30,0 P30 = 46,0

d) 54

e) K = 0,275

10 – Turma B

11 – s2 = 357,37 s = 18,9 CV = 37,54% s( ) = 2,62

12 – b) C = 0,226; C* = 0,32

CONTEÚDO III – Probabilidade

2 – a) 1/36

b)1/4

c) 5/12

3 – a) 7/8

b)1/4

c) 3/8

4 – a) 0,01

b) 0,81

c) 0,19

5 – a) 1/3

b) 4/15

c) 1/10

d)1/2

67

Page 71: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

e)1/2

6 – a) 223/360

b) 137/360

7 – 1/3

8 – ¼

9 – a) 1/2 3/4 3/4

b) 1/2 3/4 5/8

10 – 9/40

11 – a) 3/8

b) 19/40

12 – 35/108

13 – a) ≈ 0,19

b) ≈ 0,73

c) ≈ 0,08

14 – a) ≈ 0,563

b) ≈ 0,0845

CONTEÚDO IV – Variáveis Aleatórias

1 – b) 6/7

c) 0,6389

d) 0,0454

68

Page 72: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

2 – a) 0

b) 2,5

c) 1,581

d) – 1 e 1

e) Amodal

3 – a) - 1

b) 72,25

4 – a) 0

b) 14

c) 7/3

d) 27

5 – a) 1

b) 9

c) 5

d) 15

e) 81

CONTEÚDO V – Distribuições de Variáveis Aleatórias

1 – a) 625/3888

b) 3125/3888

c) 763/3888

2 – a) 0,096

b) 0,384

c) 100

3 – a) 0,3336

b) 0,6664

69

Page 73: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

c) 0,4213

4 – a) 2

b) 0,0264

5 – a) 12

b) 3

6 – a) 0,9938

b) 0,0606

c) 0,1151

d) 0,1815

e) 0

f) 0,1359

g) 87,2 e 112,8

h) 105,2

7 – a) 88,6

b) 55,3

c) 0,8810

8 – 345

9 – a) 16,52

b) 2.486

10 – a) 0,0281

b) 0,6239

11 – a) 0,0918

b) 0,9962

c) 0,7463

d) 8,745

70

Page 74: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

CONTEÚDO VI – Inferência Estatística

1 – 0,9535

2 – a) 10,0021247 10,0024753

b) n = 15,37 ≈ 16

3 – a) n = 220,52 ≈ 221

b) n = 539,17 ≈ 540

4 – 420,27 529,73

5 – a) 0,3361 0,4839

b) n = 9,83 ≈ 10

6 – n = 2.662,56 ≈ 2.663

CONTEÚDO IX

REFERÊNCIA BIBLIOGRÁFICA ADICIONAL

BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 5 ed. São Paulo: Saraiva, 2002.

71

Page 75: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

CALLEGARI-JAQUES, S. M. Bioestatística: Princípios e Aplicações. Porto Alegre:

Artmed Editora, 2003.

FONSECA, J. S.; MARTINS, G. A. Curso de Estatística. 3 ed. São Paulo: Atlas, 1982.

PERES, A. A. Q.; CUNHA, M. T. C. Estatística Básica. Apostila para disciplina IC 280:

Editora UFRRJ, 2001.

SPIEGEL, M. R. Estatística. 3 ed. São Paulo: Makron, 1993.

TRIOLA, M. F. Introdução à Estatística. 7 ed. Rio de Janeiro: LTV, 1999.

VIEIRA, S. Introdução à Bioestatística. 4 ed. rev. Rio de Janeiro: Elsevier, 2008.

CONTEÚDO X

TABELA DA DISTRIBUIÇÃO NORMAL

72

Page 76: CONTEÚDO I - lafrural.files.wordpress.com€¦  · Web view9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância

IC280 – Estatística Básica e IC281 – Introdução à BioestatísticaProfessor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

73