Est at is Tic A

download Est at is Tic A

of 263

Transcript of Est at is Tic A

UNIFEI - Universidade Federal de Itajub

Instituto de Engenharia de Produo & Gesto

Notas compiladas por

PEDRO PAULO BALESTRASSI ANDERSON PAULO DE PAIVA

Itajub/2007

CAPTULO 1 - ESTATSTICA

1.1 - Do que trata a Estatstica

A essncia da cincia a observao. A cincia que se preocupa com a organizao, descrio, anlise e interpretao dos dados experimentais denominada de Estatstica, um ramo da Matemtica Aplicada. A palavra estatstica provm de Status.

1.1.1 - Grandes reas

O diagrama seguinte mostra o contexto em que se situa o estudo da Estatstica, aqui subdividido em Estatstica Descritiva e Estatstica Indutiva (ou Inferencial).

Estatstica Descritiva

Amostragem

Clculo de Probabilidade

Estatstica Indutiva

A Estatstica Descritiva est relacionada com a organizao e descrio de dados associada a clculos de mdias, varincias, estudo de grficos, tabelas, etc.. a parte mais conhecida . A Estatstica Indutiva o objetivo bsico da cincia. A ela est associada, Estimao de Parmetros, Testes de Hipteses, Modelamento, etc.. No Clculo de Probabilidades, est a essncia dos modelos No-Determinsticos e a corroborao de que toda inferncia estatstica est sujeita a erros. A Amostragem o ponto de partida (na prtica) para todo um Estudo Estatstico. Estatstica - 1

Aqui pode se ter origem um problema bastante comum em Engenharia: Anlise profunda sobre dados superficiais ! .

1.1.2 - Modelos

Um dos objetivos da anlise de dados buscar um modelo para as observaes. Na figura abaixo, duas variveis esto representadas.

y

Resduo

Dado

Modelo

x

De um modo esquemtico, podemos ento escrever que:

Dado = Modelo + Resduo (D = M + R)

Tukey (1977) chama M de parte suave dos dados e R de parte grosseira. A anlise de R to importante quanto a de M. Os modelos podem ser essencialmente determinsticos ou no-determinsticos (probabilsticos ou estocsticos). Nos determinsticos as condies sob as quais um experimento executado determina o resultado do experimento.

Ex.: I pode ser determinado por V/R em um circuito eltrico resistivo elementar.

Nos modelos no determinsticos usa-se uma Distribuio de Probabilidade.

Estatstica - 2

Ex.: Peas so fabricadas at que x peas perfeitas sejam produzidas; o nmero total de peas fabricadas contado. Usa-se uma distribuio, no caso a Geomtrica, para a tomada de decises

1.1.3 - Populao e Amostra

O estudo de qualquer fenmeno, seja ele natural, social, econmico ou biolgico, exige a coleta e a anlise de dados estatsticos. A coleta de dados , pois, a fase inicial de qualquer pesquisa. A Populao a coleo de todas as observaes potenciais sobre determinado fenmeno. O conjunto de dados efetivamente observados, ou extrados, constitui uma Amostra da populao. sobre os dados da amostra que se desenvolvem os estudos, com o objetivo de se fazer inferncias sobre a populao.

1.2 - Anlise exploratria dos Dados

Os erros e inconsistncias ocorridos na coleta de dados devem ser corrigidos. As amostras de dados devem ser agrupadas de forma que seu manuseio, visualizao e compreenso sejam simplificados.

1.2.1 - Tipos de variveis

Os dados coletados em uma primeira fase podem ser definidos como variveis qualitativas ou quantitativas, de acordo com a seguinte figura:

Nominal Qualitativa Ordinal Varivel Discreta Quantitativa Contnua

Estatstica - 3

Ex.: Para uma populao de peas produzidas em um determinado processo, poderamos ter: Varivel Estado: Perfeita ou defeituosa Qualidade: 1a, 2a ou 3a categoria No de peas defeituosas Dimetro das peas Tipo Qualitativa Nominal Qualitativa Ordinal Quantitativa Discreta Quantitativa Contnua

1.2.2 - Agrupamentos de Dados e Distribuio de Freqncias

Quando se vai fazer um levantamento de uma populao, um dos passos retirar uma amostra desta populao e obter dados relativos varivel desejada nesta amostra. Cabe Estatstica sintetizar estes dados na forma de tabelas e grficos que contenham, alm dos valores das variveis, o nmero de elementos correspondentes a cada varivel. A este procedimento est associado o conceito de: Dados brutos: o conjunto de dados numricos obtidos e que ainda no foram organizados. Rol: o arranjo dos dados brutos em ordem crescente (ou decrescente). Amplitude (H): a diferena entre o maior e o menor dos valores observados. Freqncia absoluta ( ni ): o nmero de vezes que um elemento aparece na amostra:

n1

K

i

= n onde n o nmero total de dados da amostra e k o nmero de valores

diferentes na amostra.

Freqncia Relativa ( f i ):fi = ni n

e

fi=1

K

i

=1

Freqncia Absoluta Acumulada (Ni): a soma da freqncia absoluta dovalor da varivel i com todas as freqncias absolutas anteriores.

Estatstica - 4

Freqncia Relativa Acumulada (Fi):Fi = Ni n

Ex.: Populao = Dimetro de determinada pea (em mm). Dados brutos: { 168, 164, 164, 163, 165, 168, 165, 164, 168, 168 } Rol : { 163, 164, 164, 164, 165, 165, 168, 168, 168, 168 }

H = 168 - 163 = 5

X 163 164 165 168

ni 1 3 2 4 10

fi 0.1 0.3 0.2 0.4 1

Ni 1 4 6 10

Fi 0.1 0.4 0.6 1.0 Obs.: Esse tipo de tabela denominada de Distribuio de Freqncias.

Questo: Como implementar um programa computacional que fornea o rol de 2000 valores de uma determinada varivel, de maneira tima?

1.2.3 - Classes

As classes so um artifcio para condensar o nmero de elementos diferentes de uma amostra. Imagine construir uma tabela para 200 valores diferentes, nos moldes do problema anterior? Os principais pr-requisitos para uma boa definio de classes em um conjunto de dados so:

a) As classes devem abranger todas as observaes; b) O extremo superior de uma classe o extremo inferior da classe subseqente (simbologia: , intervalo fechado esquerda e aberto direita); c) Cada valor observado deve enquadrar-se em apenas uma classe; d) k 25, de um modo geral, sendo k o nmero de classes; e) As unidades das classes devem ser as mesmas dos dados. Estatstica - 5

Clculo de k (opes no rgidas):

Frmula de Sturges:N k = 1 + log 2

k NObs.: N o nmero de elementos diferentes da amostra e em muitas vezes pode ser considerado N = n

Geralmente, temos ainda:

Intervalo da classe (h): h H / k Ponto mdio da classe ( xi ): Ponto mdio entre o limite inferior e o limitesuperior de cada classe .

Ex.: Construo da distribuio de freqncias contendo classes:

X10 20 20 30 30 10 40 50 50 60

xi15 25 35 45 55

ni2 12 18 13 5 50

i0.04 0.24 0.36 0.26 0.1 1

%4 24 36 26 10

Ni2 14 32 45 50

Fi0.04 0.28 0.64 0.9 5.0

F%4 28 64 90 100

Obs.: A partir dos dados que no esto em negrito pode-se montar toda a tabela. Confira!.

1.2.4 - Grficos

Tradicionalmente, uma anlise descritiva dos dados se limita a calcular algumas medidas de posio e variabilidade, como mdia e varincia, por exemplo. Contrria a esta tendncia, uma corrente mais moderna, liderada por Tukey , utiliza principalmente tcnicas visuais, representaes pictricas dos dados, em oposio aos dados numricos. Estatstica - 6

Os principais grficos sero sucintamente descritos a seguir. importante lembrar que os modernos programas computacionais de Edio de Texto, Planilha Eletrnica e Banco de Dados facilitam em muito a manipulao com grficos. Alguns desses programas so: Word, Wordperfect, QuatroPro, Lotus, Dbase, Excell, ...

Histograma e polgono de freqncia.

i ou ni

i ou ni

Histograma alisado

x Classe

x

As reas dos retngulos so proporcionais s freqncias e o polgono utiliza os pontos mdios das classes. O histograma alisado obtido quando o intervalo da classe diminudo suficientemente para que uma curva contnua possa ser traada. Tal curva muito til para ilustrar rapidamente qual o tipo de comportamento que se espera para a distribuio de uma dada varivel. No captulo referente a variveis aleatrias contnuas, voltar-se- a estudar esse histograma sob um ponto de vista mais matemtico. Ex.: Construo da tabela de distribuio de freqncias a partir do histograma de classes desiguais.

ni 10 8 6 4 2 10 20 30 40 60 x

X 10 20 20 30 30 40 40 60

ni4 6 10 4 24

fi4/24 6/24 10/24 4/24 !! 1

Estatstica - 7

Ogiva (De Galton)

Ni,Fi

x

A ogiva utiliza os pontos extremos das classes e usado em freqncias acumuladas. Tal grfico pode fornecer informaes adicionais por meio de simples operaes grficas.

Ex.: Para um valor de Fi correspondendo a 0.5 (50%) pode-se chegar mediana ( ~ ) do conjunto de observaes: x

Fi

0,5

~ x

x

Grficos em barras (ou colunas)

ni fi

x

As distribuies no envolvem classes ou so qualitativas. Estatstica - 8

Grfico de pontos

xPara pequena quantidade de elementos.

Grfico em setores

40%

10% 20% 30%

As subdivises so mensurveis.

Grfico em linha

f i , ni

x classe

Um dos mais utilizados. No h observaes intermedirias.

1.2.5 - Ramo-e-folhas Estatstica - 9

Alternativo ao grfico, o Ramo-e-Folhas uma boa prtica (sempre que possvel), ao se iniciar uma anlise de dados.Temos aqui:

Ramos

x x x x x x x x x x x Folhas

Ex.: A ingesto diria mdia, per capita, em gramas, de protenas para 33 pases desenvolvidos : 81 113 108 74 79 78 90 93 105 109 95 85 90 94 93 94 86

106 103 100 100 100 101 101 101 90 91 92 93 87 89 78 89

Construo do ramo-e-folhas:

11 10 9 8 7

3 8 0 1 4 5 3 7 9 9 3 9 8 6 5 9 8 ou 3 0 5 0 4 6 0 0 0 1 1 2 1 3 1 4

11 10+ 109-

3 8 3 0 1 4 5 0 3 7 9 9 0 3 9 8 6 0 5 9 8 1 0 5 1 4 6 1 0 1 2 3 4

8 7

Estatstica - 10

Exerccios I01) Os pesos dos jogadores de um time de futebol variam de 75 a 95 quilos. Quais seriam os extremos se quisssemos grup-los em 10 classes? 02) em certa poca, os salrios mensais dos operrios de uma indstria eletrnica variavam de 1.500 a 3.250 unidades monetrias. Quais seriam os extremos se quisssemos gruplos em seis classes? 03) Os nmeros de lugares vagos em vos entre duas cidades foram agrupados nas classes 05 510 1020 2025 2530 30 ou mais. Com esta distribuio possvel determinar o nmero de vos em que h: (a) menos de 20 assentos vagos; (b) mais de 20; (c) ao menos 9; (d) no mximo 9; (e) exatamente 5; (f) entre 10 e 25? 04) Os pontos mdios de uma distribuio de leituras de temperaturas so 16, 25, 34, 43, 52, 61. Determinar os limites de classe e o intervalo de classe. 05) Para agrupar os dados relativos ao nmero de dias chuvosos em julho durante os ltimos 50 anos, um meteorologista utilizou as classes 05, 611, 1216, 1824, 2431. Explique onde pode surgir dificuldades. 06) Construir o histograma para a distribuio de freqncias abaixo: No Empregados 0 10 20 30 40 60 10 20 30 40 60 80 ni 5 20 35 40 50 30 20 20 15 15 Representar o Histograma alisado.

80 100 100 140 140 180 180 260

Exerccios I - 1

07)

Para distribuio de freqncia abaixo, construir a ogiva de Galton. Salrios 4,00 8,00 ni 10 12 8 5 1

8,00 12,00 12,00 16,00 16,00 20,00 20,00 24,00

Aproximadamente, qual o salrio S tal que 50% dos funcionrios ganham menos que S. 08) Os dados abaixo referem-se produo em toneladas, de dado produto, para 20 companhias qumicas (numeradas de 1 a 20). (1,50), (6,500), (11,180), (16,5100), (2,280), (7,250), (12,1000), (17,480), (3,50), (8,200), (13,1100), (18,90), (4,170), (9,1050), (14,120), (19,870), (5,180) (10,240) (15,4200) (20,360)

Construir o ramo-e-folhas das produes.

Exerccios I - 2

1.3 - Medidas EstatsticasA reduo dos dados atravs de ramo-e-folhas e tabelas de freqncias fornece muito mais informaes sobre o comportamento de uma varivel do que a prpria srie original de dados. Contudo, muitas vezes queremos resumir ainda mais esses dados, apresentando um ou alguns valores que sejam representativos da srie toda. Quando usamos um s valor, obtemos uma reduo drstica dos dados. As principais medidas estatsticas (ou simplesmente estatsticas) referem-se s medidas de posio (locao ou tendncia central) ou s medidas de disperso (ou variabilidade):

1.3.1 - Medidas de posio

Mostram o valor representativo em torno do qual os dados tendem a agrupar-se com maior ou menor freqncia. Mdia Aritmtica simples ( x ) (ou simplesmente mdia)x1 + x 2 + L + x n = n

xi =1

n

i

x=

n

Usada em dados no agrupados em classes . Mdia Aritmtica ponderada (tambm x )

x p + x p + L + x n pn x= 1 1 2 2 = p1 + p2 + L + pn pi = peso da amostra xi

xpi =1 n i

n

i

pi =1

onde,i

Agora, para dados agrupados em classes, temos:

xx=i =1 n i =1

n

i

nii

n

1 = n

xi =1

n

i

ni = x i f ii =1

n

Estatstica - 11

A mdia aritmtica simples pode ser vista como a mdia ponderada com todos os pesos iguais. Para efeito de nomenclatura sempre trataremos a mdia aritmtica simples ou ponderada simplesmente por mdia ( x ).

x Mediana ( ~ ) o valor do meio de um conjunto de dados, quando os dados esto dispostos em ordem crescente ou decrescente. Para dados no agrupados em classes: n + 1 termo Se n mpar ~ = x 2 o

n n termo + + 1 termo 2 2 Se n par ~ = x 2o o

Ex.:

~ {35, 36, 37, 38, 40, 40, 41, 43 ,46} x = 40

~ {12, 14, 14, 15, 16, 16, 17, 20} x = 15 + 16 = 15,5 2 Mdia Mediana A mdia muito sensvel a valores extremos de um conjunto de observaes, enquanto a mediana no sofre muito com a presena de alguns valores muito altos ou muito baixos. A mediana mais robusta do que a mdia. Devemos preferir a mediana como medida sintetizadora quando o histograma do conjunto de valores assimtrico, isto , quando h predominncia de valores elevados em uma das caudas.Ex.:

{ 200, 250, 250, 300, 450, 460, 510 } ~ x = 345,7 x = 300

x Tanto x como ~ so boas medidas de posio.Ex.:

{ 200, 250, 250, 300, 450, 460, 2300 } ~ = 300 x x = 601

x Devido ao valor 2300, ~ prefervel a x . Percentis Estatstica - 12

O percentil de ordem 100.p, 0 p 1, de um conjunto de valores dispostos em

ordem crescente um valor tal que (100 p)% das observaes esto nele ou abaixo dele e 100 (1 - p)% esto nele ou acima dele.

Os percentis de ordem 25,50 e 75 so chamados de quartis. Representam-se por x Q1, Q2 e Q3. Naturalmente Q2 = ~ . Os decis so os percentis de ordem 10, 20, ... 90.

Ex.: Para valores de 51 a 100, ordenados crescentemente:

Q1 deixa 25% dos dados (12,5 13 valores) nele ou abaixo dele e 75% dos dados (37,5 38 valores) nele ou acima dele. Assim: Q1 = 63. Similarmente, P80 deixa 80% dos dados (40 valores) nele ou abaixo dele e 20% dos dados (10 valores) nele ou acima dele. Assim: P80 =

90 + 91 = 90,5 2

Obs.: Os programas computacionais usam regras de interpolao para o clculo de percentis e diferem ligeiramente dos valores acima (No Excel, por exemplo, Q1 = 63,25)

Para dados agrupados em classes, os percentis podem ser obtidos por interpolao linear (regra de trs simples). Para P50 = Q2 = ~ , por exemplo, temos: x ~ = L + ( n 2) N a h x i ni O exemplo a seguir explica os termos desta frmula. Faa a associao!

Ex.: Dada a distribuio de freqncia de uma varivel X qualquer:

X

xi

ni 7 14 18 7

Ni 7 21 39 46

1,810 | 1,822 1,816 1,822 | 1,834 1,828 1,834 | 1,846 1,840 1,846 | 1,858 1,852

1,858 | 1,870 1,864 4 50 Temos que, para ( ~ ), o 25o elemento (50% de 50), est na terceira classe: x Estatstica - 13

n 18 14 8%

07 04 14% 28% 36% x1.810 1.822 1.834

~ x

1.846

1.858

1.870

1846 1834 ~ 1834 . . x . = 36% 8%Logo ~ =1.837 x

Um outro processo grfico pode ser usado para o clculo desses percentis. (Veja Ogiva de Galton). Tal processo exige rigor no traado e deve-se preferir papel milimetrado.

Obs.: As calculadoras geralmente no fornecem mediana e percentis.

A Mdia Aparada (ou mdia interna) obtida eliminando do conjunto as m maiores e as m menores observaes. Geralmente, 2,5% m 5% dos dados. Esta eliminao corresponde, na realidade, supresso dos valores extremos - muito altos ou muito baixos. Tal mdia representa um valor entre x e ~ . xEx.:

{ 200, 250, 250, 300, 450, 460, 2300 }

x (m = 1) =

250 + 250 + 300 + 450 + 460 = 342 5

A moda e a classe modal (mo) o valor que representa a maior freqncia em um conjunto de observaes individuais. Para dados agrupados temos a classe modal. Em alguns casos pode haver mais de uma moda. Assim temos uma distribuio bimodal, trimodal, etc...Ex.:

Estatstica - 14

mo

x

X 10 | 20 20 | 30 30 | 40 40 | 50 50 | 60

xi 15 25 35 45 55

ni 2 4 10 6 2Distribuio Bimodal

Classe Modal

mo I

mo II

x

Obs.: A moda geralmente no fornecida em calculadoras.

1.3.2 - Medidas de disperso ou Variabilidade

Quase nunca uma nica medida suficiente para descrever de modo satisfatrio um conjunto de dados. Torna-se ento necessrio estabelecer medidas que indiquem o grau de disperso em relao ao valor central. Nos seguintes conjuntos de dados, por exemplo: A = { 3, 4, 5, 6, 7 } B = { 1, 3, 5, 7, 9 } C = { 5, 5, 5, 5 } D = { 3, 5, 5, 7 } E = { 3.5, 5, 6.5 } F = { -1000, 15, 1000 } Temos em todos eles a mesma mdia. A identificao de cada um desses Estatstica - 15

conjuntos de dados pela sua mdia nada informa sobre as diferentes variabilidades dos mesmas. Algumas medidas que sintetizam essa variabilidade so: Amplitude (H): Como anteriormente definida, H tem o inconveniente de levar em conta somente os dois valores extremos, o maior e o menor deles. Desvio Mdio (DM(x)), Varincia (S2,Var(X) ou 2) eDesvio Padro (S,DP(X) ou ):

Aqui o princpio bsico analisar os desvios das observaes em relao mdia das observaes. Em A = { 3, 4, 5, 6, 7 },por exemplo, os desvios xi - x so: -2, -1, 0, 1, 2. fcilver que a soma dos desvios, identicamente nula e que portanto no serve como medida de disperso:

(xi =1

n

1

x ) = x1 x = n x n x 0i =1 i =1

n

n

Duas opes para analisar os desvios das observaes so:a) considerar o total dos desvios em valor absoluto ou; b) considerar o total dos quadrados dos desvios.

Assim, para o conjunto A, teramos, respectivamente

i =15

5

xi x = 2 + 1 + 0 + 1 + 2 = 6 x ) = 4 + 1 + 0 + 1 + 4 = 102

e

(xi =1

i

Associando estas medidas mdia, temos:

DM(x)=i =1

n

xi x n que o desvio mdio.

Estatstica - 16

S2

= i =1

(x

n

i

x)

2

n

que a varincia ( Var(x))

Sendo a varincia uma medida que expressa um desvio quadrtico mdio, conveniente usar uma medida que expresse a mesma unidade dos dados originais. Tal medida o desvio padro S (ou DP(x)), dada por:

S = S2

O uso do DM(x) pode causar dificuldades quando comparamos conjuntos de dados com nmero diferentes de observaes.Ex.: Em A = { 3, 4, 5, 6, 7 }

temos:

DM(x) = 6/5 = 1.2 e S2 = 10/5 = 2 temos:

Em D = { 3, 5, 5, 7 } DM(x) = 1,0 e S2 = 2,0

Assim, podemos dizer que, segundo o Desvio Mdio, o Grupo D mais homogneo (tem menor disperso) do que A, enquanto que ambos tem a mesma homogeneidade segundo a varincia. O desvio mdio possui pequena utilizao em estatstica e em geral vale 0.8 vezes o desvio padro

O clculo do desvio padro exige o clculo prvio da varincia e uma frmula alternativa para S2 dada por:

(xS2 =i =1

n

i

x)

2

x=i =1

n

2

i

n

n

x2

(Confira!)

Relacionados inferncia estatstica, alguns autores usam (n - 1) como divisor para a varincia:

(xS2 =i =1

n

i

x)

2

n1

, e isto ser visto adiante (tendenciosidade). Estatstica - 17

Obs.: Muitas calculadoras cientficas possuem duas medidas para desvio padro.

Uma associada diviso por n (simbolizada geralmente por ou n) e outra associada diviso por n - 1 (chamada tambm de no-polarizada, simbolizada geralmente por S ou n-1). Verifique a simbologia usada pela sua calculadora, caso voc possua uma!

Para dados agrupados em classes, a varincia dada por:

( x x)S =2 i =1 i

K

2

ni ou S 2 =ou

nK2

( x x)i =1K

K

2

i

fi

S 2 = xi f i x 2i =1

S 2 = xi 2

i =1

ni x2 n

intuitivamente claro que a multiplicao de cada parcela (xi - x )2 por nisignifica a repetio dos desvios quadrados (xi - x )2, ni vezes. Momentos de uma distribuio de frequncias

Definimos o momento de ordem t de um conjunto de dados como Mt =

xi =1

n

t i

n

Definimos o momento de ordem t centrado em relao a uma constante a como Mt =

(xi =1

n

i

a) t

n

Especial interesse tem o caso do momento centrado em relao a x , dado pormt =

(xi =1

n

i

x )t

n

Conforme j vimos nos casos da mdia e da varincia, as expresses precedentes podem ser reescritas levando-se em considerao as frequncias dos diferentes valores existentes. Temos ento respectivamente,

Estatstica - 18

Mt =

xi =1 n

n

t i

fi

n

M ta =

(xi =1 n

i

a) t f i n

mt =

(xi =1

i

x)t fi n M1 = x ; m1 =0; m2=s2

fcil ver que:

Escores padronizados (zi)

No contexto de um nico conjunto de dados, o desvio padro pode ser interpretado intuitivamente como unidade natural de disperso de dados. Essa interpretao utilizada na construo de escores padronizados de larga utilizao: xi x s

zi =

Repare que: i) xi - x considera o afastamento de xi em relao mdia.ii) A diviso por s toma s como unidade ou padro de medida.

Ex.: Dois grupos de pessoas acusam os seguintes dados:

Grupo

Peso mdio

Desvio Padro

A B

66.5 kg 72.9 kg

6.38 kg 7.75 kg

Nesses grupos h duas pessoas que pesam respectivamente, 81.2 kg e 88.0 kg. Usando o conceito de escore padronizado podemos ver que: Estatstica - 19

em A : em B :

zA = zB =

81,2 66,5 = 2,3 6,38 88 72,9 = 1,95 7,75

e

Logo, a pessoa de A revela um maior excesso relativo de peso.

Coeficiente de variao (cv)

cv =

S x

cv exprime a variabilidade em termos relativos. uma medida adimensional e sua grande utilidade permitir a comparao das variabilidades em diferentes conjuntos de dados.

Ex.: Testes de resistncia trao aplicados a dois tipos diferentes de ao:x (kg/mm2)

s (kg/mm2) 2,0 17,25

Tipo I Tipo II

27,45 147,00

cvI =

2 = 7,29 % 27,45

cv II =

17,25 = 11,73 % 147

Assim, apesar do Tipo I ser menos resistente, ele mais estvel, mais consistente.

O uso do coeficiente de variao pode ser pensado considerando a questo: Um desvio padro de 10 se a mdia 10.000 bem diferente se a mdia 100! Outros Tpicos: Assimetria e Curtose Box Plots (Mtodo dos cinco nmeros)

Estatstica - 20

Exerccios II01) Mostre que: (a) (b) (c) (d)

(xi =1

n

i

x) = 0

( xn i=1 ki=1 k i

i

x ) = x nx = x 2 n n i=1 2 1 2 i=1 2 ii

(x )i

2

n

n (x f (xi=1 i

x ) = ni x i2 nx 22 k

i

x ) = f i x i2 x 22 i=1

i=1 k

02)

O conjunto abaixo representa as notas do exame final de uma determinada turma: 54 61 70 81 64 66 58 66 50 50 66 48 57 45 48 71 15 35 60 34 74 58 73 66 65 54 60 73 60 67 76 67 70 75 71 65 63 71 81 50 42 71 64 62 85 53 83 76 77 64 63 66 47 23 62 60 33 10 77 75 67 61 75 45 55 51 75 60 79 66 69 61 92 86 70 85 37 88 68 74

a) Construir uma distribuio de freqncia, adotando um intervalo de classe conveniente, o histograma e o polgono de freqncia. Construir o ramo-e-folha. (Sugerem-se classes de tamanho 10, a partir de 10.) b) Calcular a mdia, o desvio padro, a mediana, o 1o quartil e o 65o percentil. c) Resolver (b) graficamente no que couber, com auxlio da ogiva de freqncia acumuladas. 03) Dado o histograma abaixo, calcular a mdia, a varincia, a mediana e o 3o quartil. Sabese que o nmero total de observaes 90.25

20

15 13

5 4 3 2 3

10

20

30

40

50

60

70

80

90

Exerccios II - 1

04)

Dado o conjunto de observaes 120 107 95 118 150 130 132 109 136

( a ) Determinar os quartis. ( b ) Calcular a mdia aparada com m = 1. ( c ) A mdia aparada praticamente coincide com a mdia aritmtica simples. Por qu? 05) 06) Esboce o histograma de uma distribuio que tenha mdia e mediana iguais. Construir dois conjuntos de dados de mesma amplitude mas com variabilidade diferentes. 07) Por engano, um professor omitiu uma nota no conjunto de notas de 10 alunos. Se as nove notas restantes so 48, 71, 79, 95, 45, 57, 75, 83, 97 e a mdia das 10 notas 72, qual o valor da nota omitida. 08) Em certo ano, uma universidade pagou a cada um de seus 45 instrutores um salrio mdio mensal de R$ 1.500, a cada um de seus 67 assistentes R$ 2.000, a cada um de seus 58 adjuntos R$ 2.600 e a cada um de seus 32 titulares R$ 3.100. Qual o salrio mdio mensal dos 202 docentes? 09) So os seguintes os nmeros de alunos e respectivos QI mdios em trs estabelecimentos de ensino: Estabelecimento A B C No de Alunos 790 155 530 QI Mdio 104 110 106

Qual o QI mdio global dos trs estabelecimentos? Que tipo de mdia foi utilizada? 10) Alega-se que, para amostras de tamanho n = 10, a amplitude amostral deve ser aproximadamente trs vezes o desvio padro. Verifique a alegao com relao aos seguintes dados que representam a velocidade de 10 carros cronometrados em um posto de controle: 97 80 88 62 93 105 74 86 83 (Km/h).

Exerccios II - 2

11)

Calcule x , S2 e S para os dados abaixo, onde os valores de x so pontos mdios deintervalos. Determine o escore padronizado para x = 80: xi ni 15 1 25 5 35 12 45 18 55 21 65 19 75 10 85 7 95 6 105 1

12)

Tempos, em minutos, de espera numa fila de nibus, durante 13 dias, de um cidado que se dirige diariamente ao seu emprego: 15 10 2 17 6 8 3 10 2 9 5 9 13

Calcular a mdia, a mediante e a moda. 13) Dada a seguinte distribuio de idades dos membros de uma sociedade, Idade 15 20 20 25 25 30 30 35 Calcular: a) x e s; xi 17 22 27 32 ni 16 35 44 27 Idade 35 40 40 45 45 50 50 55 xi 37 42 47 52 ni 17 8 2 1

~ b) x , Q1, Q3;c) o quartil mdio dado por1 ( Q + Q3 ) ; 2 11 ( Q Q1 ) . 2 3

d) o intervalo interquartil Q3 - Q1; e) o intervalo semi-interquartil dado por

Nota: o quartil mdio s vezes usado como medida de tendncia central em lugar da mdia. O intervalo interquartil e o intervalo semi-interquartil so usados como medidas de variabilidade. 14) Para comparar a preciso de dois micrmetros, um tcnico estuda medidas tomadas com ambos os aparelhos. Com um mediu repetidamente o dimetro de uma pequena esfera de rolamento; as mensuraes acusam mdia de 5,32 mm e d.p. de 0,019 mm. Com outro mediu o comprimento natural de uma mola, tendo as mensuraes acusado mdia Exerccios II - 3

de 6,4 cm e d.p. de 0,03 cm. Qual dos dois aparelhos relativamente mais preciso? 15) Uma pesquisa sobre consumo de gasolina deu os seguintes valores para a quilometragem percorrida por trs marcas de carro (de mesma classe), em cinco testes com um tanque de 40 l: Carro A Carro B Carro C 400 403 399 397 401 389 401 390 403 389 378 387 403 395 401

Qual a medida mais adequada para comparar o desempenho dos carros? 16) O que acontece com a mediana, a mdia e o desvio padro de uma srie de dados quando: a) Cada observao multiplicada por 2; b) Soma-se 10 a cada observao; c) Subtrai-se a mdia geral x de cada observao; d) De cada observao subtrai-se x e divide-se pelo desvio padro. 17) A tabela abaixo mostra o tempo gasto por empregados numa determinada operao em uma fbrica: Tempo (min) 10 15 15 20 20 25 25 30 30 40 desses funcionrios? (tempo de 150 funcionrios) 18) Em testes de resistncia trao aplicados a um tipo de ao, obteve-se um coeficiente de variao de 8%. O escore padronizado obtido para uma resistncia de 28 kg/mm2 foi de -0,4. a) Qual a resistncia mdia? b) Qual o desvio padro? c) O que significa o resultado negativo do escore padronizado? Exerccios II - 4 Freqncia 5 57 42 28 18

a) Esboce o histograma correspondente; b) Calcule a mdia, o desvio padro; c) O presidente decide separar os funcionrios mais rpidos (com tempo inferior a um desvio padro abaixo da mdia) para receberem promoo. Qual a porcentagem

19)

O histograma abaixo descreve o tempo (em min) gasto por funcionrios de uma fbrica em uma determinada operao:ni

50

30 20 15 10

5

10

15

20

25

35

t

a) Construa a distribuio para o histograma; b) Calcule a mdia e o desvio padro; c) O presidente decide demitir os funcionrios mais lentos (com tempo superior a meio desvio padro acima da mdia). Qual a porcentagem desses funcionrios?

Exerccios II - 5

1.4 - Anlise Bidimensional

Aqui, o interesse reside em analisar o comportamento conjunto de duas variveis e de um modo geral, podemos representar tais variveis utilizando uma tabela de dupla entrada, ou seja, uma Distribuio Conjunta das freqncias das variveis.

Assim, para duas variveis X= xi, com i = 1, 2, ...k e Y= yj com j = 1, 2, ... l, temos:

Y X 1 2 M i M k Total

1 n 11 n 21 M ni 1 M nk 1 n 1

2 n 12 n 22 M ni 2 M nk 2 n 2

L L L M L M L L

j n 1j n2j M ni j M nk j n j

L L L M L M L L

L n 1L n 2L M niL M nk L n L

Total n 1 n 2 M n i M nk n

Onde:

nij = nmero de elementos pertencentes ao i-simo nvel da varivel X e j-simonvel da varivel Y.

ni = nij = nmero de elementos do i-simo nvel da varivel X.j =1 K

L

n j = nij = nmero de elementos do j-simo nvel da varivel Y.i =1 K

n = i =1

nj =1

L

ij

= ni = n j = no total de elementos.i =1 j =1

K

L

De modo anlogo, podemos definir as freqncias relativas (propores) do seguinte modo:

f ij =

nij n

, fi =

ni n

e f j =

nj n

.

Estatstica - 21

Uma outra freqncia que pode ser construda aquela para a qual se mantm fixa uma linha. Para a i-sima linha fixa, temos ento:fj i = nij ni

( leia-se freqncia de j, dado i ), que a proporo dentre os

indivduos do i-simo nvel X que possuem a j-sima caracterstica de Y. Analogamente, temos:

fi j =

nij nj

Ex.: Sejam as seguintes variveis:

X Curso escolhido Y Alunos segundo sexo.

Yj Xi Economia

Masculino Feminino Total

( Tabela A ) Distribuio conjunta das freqncias das variveis X e Y.

85 55 140

35 25 60

120 80 200

Administrao Total

A linha e coluna de totais so chamados de marginais.

Uma tabela (dentre outras possveis) poderia ser escrita a partir da Tabela A:

Yj Xi Economia

Masculino Feminino Total

( Tabela B ) Distribuio conjunta das

61% 39% 100%

58% 42% 100%

60% 40%

Administrao Total

propores em relao aos totais de cada nij Nesse caso, temos f i j = nj

100% coluna.

1.4.1 - Independncia de variveis

Um dos principais objetivos de uma distribuio conjunta descrever a Estatstica - 22

associabilidade existente entre as variveis, isto , queremos conhecer o grau de dependncia entre elas, de modo que possamos prever melhor o resultado de uma delas, quando conhecemos a realizao da outra.

Ex.: A partir de uma renda familiar podemos estimar a classe social de uma

pessoa, pois sabemos da existncia de dependncia entre essas duas variveis.

Usando uma distribuio conjunta, como a fornecida pela Tabela A, verificamos que fica relativamente difcil tirar alguma concluso, devido diferena entre os totais marginais. Por outro lado, usando a Tabela B, podemos observar que independentemente do sexo, 60% das pessoas preferem economia e 40%, administrao (observe na coluna de total). No havendo dependncia entre as variveis, esperaramos estas mesmas propores para cada sexo. De fato, vemos que as propores do sexo masculino ( 61% e 39% ) e do feminino ( 58% e 42% ) so prximas das marginais ( 60% e 40% ). Esses resultados parecem indicar no haver dependncia entre as duas variveis. X e Y so portanto variveis independentes.

Observe agora a dependncia quando os cursos so Engenharia e Cincias Sociais.

X Y Engenharia

Masculino Feminino

Total

( Tabela C ) Distribuio conjunta das propores em relao aos totais de cada linha. nij Nesse caso, temos f j i = ni

100 (83%) 20 (17%) 20 (25%) 60 (75%)

120 (100%) 80 (100%) 200 (100%)

C. Sociais Total

120 (60%) 80 (40%)

1.4.2 - Coeficiente de Contingncia ( C )

Existem algumas medidas que quantificam a dependncia entre variveis nominais. Uma delas o chamado coeficiente de contingncia, C, devido a Pearson. Tal coeficiente varia entre 0 e 1, e a proximidade de 0 indica total independncia.Ex.: O clculo de C pode ser entendido por meio do seguinte exemplo, onde

queremos verificar se a criao de determinado tipo de cooperativa est associada com algum fator regional. A tabela a seguir, sintetiza os dados coletados (Dados observados, oij). Estatstica - 23

Estado Consumidor So Paulo Paran Rio G.Sul Total 214 (33%) 51 (17%) 111 (18%) 376 (24%)

Tipo de Cooperativa Produtor 237 (37%) 102 (34%) 304 (51%) 643 (42%) Escola 78 (12%) 126 (42%) 139 (23%) 343 (22%) Outros 119 (18%) 22 ( 7%) 48 ( 8%) 189 (12%) Total 648 (100%) 301 (100%) 602 (100%) 1551 (100%)

(Tabela D) Distribuio con-junta das

propor-es em relao aos totais de cada linha.

nij f j/i = ni .

Tal tabela mostra a existncia de uma certa dependncia entre as variveis. Caso houvesse independncia, esperaramos que em cada estado tivssemos 24% de cooperativas de consumidores, 42% de produtores, 22% de escolas e 12% de outros. Uma nova tabela, tabela E, poderia ser agora construda, onde teramos todos os valores esperados (eij) caso as variveis fossem independentes. ela dada a seguir:

Estado Consumidor So Paulo Paran Rio G.Sul Total 156 (24%) 72 (24%) 144 (24%) 376 (24%)

Tipo de Cooperativa Produtor 272 (42%) 127 (42%) 254 (42%) 643 (42%) Escola 142 (22%) 66 (22%) 132 (22%) 343 (22%) Outros 78 (12%) 36 (12%) 72 (12%) 189 (12%) Total 648 (100%) 301 (100%) 602 (100%) 1551 (100%)

(Tabela E) Distribuio conjun-ta valores em dos es-perados aos

relao

totais das linhas. ( nij = f i n j )

Comparando as Tabelas D e E, podemos verificar as discrepncias existentes entre os valores observados (oij) e os esperados (eij). Na prxima tabela, (F), evidenciamos essa discrepncia :

Estatstica - 24

Estado Consumido r

Tipo de Cooperativa Produtor Escola Outros

(Tabela F) Desvios entre dados

observados e esperados. -35 -25 50 -64 60 7 41 -14 -24 ( nij = oij eij )

So Paulo Paran Rio G. Sul

58 -21 -33

Observe que: i) A soma em cada linha nula (soma dos resduos)

ii) Em Escola - So Paulo, temos:

oij = 78 eij = 142 oij - eij = -64

Em Escola - Paran, temos:

oij = 126 ei = 66 oij - eij = 60

fcil ver que em relao aos valores esperados (eij), o desvio em Escola - Paran (60) maior do que o desvio em Escola - So Paulo (-64).Uma maneira de observar melhor esses desvios relativos a eij considerar a seguinte medida:

(o e )ij ij

2

eij

,

que para Escola - So Paulo fica:

( 64 ) 2142

= 28,84 e

para Escola - Paran fica:

( 60) 266

= 54 ,54

A tabela a seguir indica todos os valores desses desvios relativos a eij:

Estatstica - 25

Estado Consumido r

Tipo de Cooperativa Produtor Escola Outros

(Tabela G) Desvios entre dados

observados e esperados.4,50 4,92 9,84 28,84 54,54 0,37 21,55 5,44 8,00 o e n = ij ij ij eij

So Paulo Paran Rio G. Sul

21,56 6,12 7,56

(

)

2

Uma medida de afastamento global pode ser dada pela soma de todos os valores da tabela G. Essa medida possui distribuio de 2 (qui-quadrado) e, no nosso exemplo temos:

2

(o e ) = eij ij i j ij

2

= 21,56 + 6,12+L+8,00 = 173,24

Quanto maior for o valor de 2, maior ser o grau de associao existente entre as duas variveis. Pearson props o chamado coeficiente de contingncia C definido por

C=

2 2 +n

onde 0 C 1, sendo C = 0 quando 2 = 0 .Uma melhor aproximao de C para avaliar a independncia de variveis dado por:

C =

C t 1 t

Onde t = mnimo entre o nmero de colunas e o nmero de linhas da tabela. Assim, para o nosso exemplo, temos:C= 173,24 = 0,32 e 173,24 + 1551

C =

0,32 2 3

= 0,40

A quantificao dessa independncia poder ser vista futuramente em Testes de Hipteses

Estatstica - 26

1.4.3 - Coeficiente de correlao (r)

Um procedimento til para se verificar a associao entre variveis quantitativas o grfico de disperso, que nada mais do que a representao dos pares de valores (nuvem de pontos) em um sistema cartesiano. Admitamos um grfico de disperso como os dados a seguir, onde, atravs de uma transformao conveniente a origem foi colocada no centro da nuvem de pontos:

(A)

(B)

(C)

Em ( A ) os dados possuem uma certa associao linear direta (ou positiva). Observando-os, notamos que a grande maioria dos pontos est situada no primeiro e terceiro quadrantes, onde as coordenadas tm o mesmo sinal e portanto o produto ser sempre positivo. Se somarmos o produto das coordenadas de todos os pontos, o resultado ser um nmero positivo. Em ( B ), usando o mesmo procedimento, o resultado ser negativo. Em ( C ), o resultado ser nulo.Obs.: A soma dos produtos das coordenadas depende, e muito, do nmero de

pontos e torna-se difcil comparar essa medida para dois conjuntos diferentes de pontos. Isto atenuado usando-se a mdia da soma dos produtos das coordenadas.

Ex.: Suponha que o nosso desejo seja o de quantificar a associabilidade entre duas

variveis relacionadas a cinco agentes de uma seguradora. Assim, temos: X Anos de experincia do agente. Y Nmero de clientes do agente. A tabela e o grfico de disperso seguintes mostram os dados obtidos:

Estatstica - 27

Agente A B C D E Total

X 2 4 5 6 8 25

Y 48 56 64 60 72 300

O primeiro problema que devemos resolver a mudana da origem do sistema para o centro da nuvem pontos. O ponto mais conveniente aquele formado pelas duas mdias ( x , y ) . A transformao dos eixos x em x x e y em y y resolve esse problema.

Observando esses valores centrados, verificamos que ainda existe um problema quanto escala. A variabilidade em Y muito maior do que em X, e o produto das coordenadas ficar muito mais afetado pelos resultados de Y do que de X. Para corrigir isso, podemos reduzir as duas variveis a uma mesma escala. Isso obtido dividindo-se os desvios pelos respectivos desvios padres. Observe isso na figura a seguir:y y

zy =3 2 1 1 2 3

12 8 4 -3 -2 -1

y y sy

-4 -8

xx

-3

-2

-1

-1 -2 -3

1

2

3zx =

xx sx

-12

Assim, podemos montar a seguinte tabela:

Estatstica - 28

Agente A B C D E Total

x2 4 5 6 8 25

y48 56 64 60 72 300

xx

yy-12 -4 4 0 12 0

xx = zx sx-1.5 -0.5 0 0.5 1.5 0

y y = zy sy

zx . z y2,25 0,25 0 0 2,25 4,75

-3 -1 0 1 3 0

-1.5 -0.5 0.5 0 1.5 0

x =5

Sx = 2

y = 60

Sy = 8

Para completar a definio da medida descrita no incio desse tpico, basta calcular a mdia dos produtos das coordenadas reduzidas, isto a correlao linear entre X e Y, dada por:r = Correlao ( X , Y ) =

4,75 = 0,95 = 95 % 5

Portanto, para este exemplo, o grau de associabilidade est quantificado em 95%. Da discusso feita at aqui, podemos definir o coeficiente de correlao entre duas variveis X e Y, dados n pares ordenados ( x1 , y1 ) , ( x2 , y2 ) L( xn , yn ) como sendo:r = Corr ( X , Y ) = 1 n 1 n xi x yi z xi z y i = n i =1 n i =1 s x s y y

ou seja, a mdia dos produtos dos valores reduzidos da varivel. Costuma-se usar outras frmulas para r:r= 1 ( x i x )( y i y ) Covarincia ( X , Y ) , ou ainda = n sx s y sx s y

r=

( x

xyi 2 i

nx 2 )( yi2 ny 2 )

i

nx y

Obs.: Pode-se demonstrar que 1 r 1 .

Ateno: A correlao apresentada aqui linear. Existem outros tipos de correlao!

Estatstica - 29

Exerccios III

01)

No estudo de uma certa comunidade verificou-se que: I. A proporo de indivduos solteiros de 0,4;

II. A proporo de indivduos que recebem at 10 salrios mnimos de 0,2; III. A proporo de indivduos que recebem at 20 salrios mnimos de 0,7; IV. A proporo de indivduos casados entre os que recebem mais de 20 salrios mnimos de 0,7; V. A proporo de indivduos que recebem at 10 salrios mnimos entre os solteiros de 0,3. a) Construa a distribuio conjunta das variveis estado civil e faixa salarial e as respectivas distribuies marginais; b) Voc diria que existe relao entre as duas variveis consideradas?

02)

Uma amostra de 200 habitantes de uma cidade foi colhida para analisar a atitude frente a um certo projeto governamental. O resultado foi o seguinte:

Local de Residncia Opinio A favor Contra Total Urbano 30 60 90 Suburbano 35 25 60 Rural 35 15 50 Total 100 100 200

a) Calcule as propores em relao ao total das colunas b) Voc diria que a opinio independe do local de residncia? c) Encontre uma medida de dependncia entre as variaes 03) Numa amostra de 5 operrios de uma dada empresa, foram observadas duas variveis; sendo X os anos de experincia num dado cargo e Y o tempo, em minutos, gasto na execuo de uma certa tarefa relacionada com esse cargo. x = 16 y = 22 x.y = 53 x2 = 62 y2 = 130

X Y

1 7

2 8

4 3

4 2

5 2

Exerccios III - 1

Usando um critrio estatstico, voc diria que a varivel X pode ser usada para explicar a variao de Y? Justifique. 04) Muitas vezes, a determinao da capacidade de produo instalada para certo tipo de indstria em certas regies um processo difcil e custoso. Como alternativa, pode-se estimar a capacidade de produo atravs da escolha de uma outra varivel de medida mais fcil e que esteja linearmente relacionada com ela. Suponha que foram observados os valores para as variveis: capacidade de produo instalada, potncia instalada e rea construda. Com base num critrio estatstico, qual das variveis voc escolheria para estimar a capacidade de produo instalada?

X capacidade de produo instalada (ton) Y potncia instalada (1.000 kW) Z rea construda (100 m) x = 80; x.y = 361; y = 38; x.z = 848; z = 100; y.z = 411.

4 1 7

5 1

4 2

5 3

8 3

9 10 11 12 12 5 5 6 6 6

7 10 10 11

9 12 10 11 14 z2 = 1048;

x2 = 736;

y2 = 182;

Exerccios III - 2

Captulo 2 - Probabilidades e Variveis Aleatrias2.1 - Introduo ProbabilidadeA probabilidade em termos prticos uma medida que exprime a incerteza presente em situaes onde os resultados so variveis. Um experimento aleatrio (ou experimento no-determinstico) o processo de coleta de dados relativos a um fenmeno que acusa variabilidade em seus resultados. Um Espao Amostral (E) o conjunto de todos os resultados de um experimento aleatrio. Um Evento um subconjunto de um espao amostral. Os principais tipos de eventos so (considere A E e B E ): Evento Simples: O nmero de elementos do evento igual a 1, n (A) = 1. Evento Impossvel: A = , n(A)=0 Evento Certo: A = E Evento Complementar: A = E A=CEA Evento Interseo: A B Evento Unio: A B Eventos Mutuamente Excludentes (ou Exclusivos): A B =

Obs.: Devido ao clculo de probabilidade envolver operaes entre conjuntos, o anexo I, ao final desse captulo, descreve sucintamente a Teoria Axiomtica da lgebra de Boole aplicada a conjuntos.

A probabilidade, em sua definio clssica pode ser assim definida:

Dado um espao amostral E com n (E) elementos e um evento A de E com n(A) elementos, a probabilidade do evento A o nmero P(A) tal que: P( A) =n( A ) n( E )

Na prtica:

no casos favorveis P(A) = no casos possveis

Probabilidades - 1

Obs.: A feqncia relativa fi = ni /n comumente associada probabilidade. Essa associao nos leva a diversas distribuies de probabilidade. Atualmente, principalmente devido a Kolmogorov, um grande matemtico russo, o clculo de probabilidades constitui uma Teoria Matemtica com suas definies, axiomas, teoremas e demonstraes. As regras bsicas que constituem essa teoria so vistas a seguir.

Consideremos um espao amostral E com A e B eventos de E, com os seguintes axiomas: A1 : 0 P(A) 1 A2 : P (E) = 1 A3: Para qualquer A1, A2, ... Ai , Exclusivos Ai A j = i j , temos que

(

)

k k P U Ai = P ( Ai ) i =1 i =1Alguns teoremas dessa teoria so: T1: P ( A B ) = P ( A) + P ( B ) P ( A B ) T2: P ( A ) = 1 P( A) T3: Se A B ento P ( A) P( B )T4 : P ( A B C ) = P ( A) + P ( B ) + P ( C ) P ( A C ) P ( A B ) P( B C ) + P( A B C )

Obs.: Demonstre os teoremas T1 a T4. . Obs.: Uma breve reviso de Anlise Combinatria est descrita no anexo II. Este conhecimento muito til na determinao do nmero de elementos de um evento qualquer.

2.2 - Probabilidade Condicional e Independncia de Eventos

Para dois eventos quaisquer A e B, sendo P(B) > 0 definimos a probabilidade

condicional de A, dado B, P(A | B), como sendo P(A | B) =P( A B ) P( B )

Obs.: Entenda tal definio a partir do seguinte grfico: Probabilidades - 2

E A B ocorreu o evento A B ocorreu o evento B

P ( A| B ) =

n( A B ) n( A B ) n ( E ) P ( A B ) = = n( B ) n( B ) n( E ) P( B)

A partir da definio de probabilidade condicional obtemos a chamada regra do produto de probabilidades:

P ( A B) = P ( B) P ( A | B) ,de larga utilizao.

Dois eventos A e B so denominados independentes se a ocorrncia de um deles no interfere na ocorrncia do outro. Neste caso:

P ( A B) = P ( B) P ( A | B) = P ( A) P ( B | A) = P ( A) P ( B)Obs.: freqente, aqui, adotarmos P(A B) = P(AB)

Se E1, E2, ... En so eventos de um espao amostral E, ento tais eventos so

mutuamente independentes se: P(E1 E2 E3 ... En) = P(E1) . P(E2) . P(E3) ... P(En)

Probabilidades - 3

Ex.: A fundao de um alto edifcio pode ceder devido a falhas do tipo Bearingou do tipo Settlement. Seja B e S os respectivos modos de falha. Se P(B) = 0.1%, P(S) = 0.8% e

P(B|S) = 10% (Probabilidade de falha B devido a falha S).A probabilidade de falha da fundao pode ser dada por:

P (Falha) = P (B S) = P (B) + P (S) - P (B S)= P (B) + P (S) - P (B | S) . P(S) = 0.001 + 0.008 - (0.1) (0 008) = 0.082 = 8,2% A probabilidade de que o edifcio tenha falha S mas no tenha falha B :

P( S B ) = P( B S ) = P( S ) P( B | S )= P( S ) 1 P( B | S ) = 0.008 [1 01] . = 0.0072 = 0.72%

[

]

Em um grande nmero de aplicaes, teremos que adotar a hiptese de independncia de dois eventos A e B, e depois empregar essa suposio para calcular P(AB) como igual a P(A) . P(B). Geralmente, condies fsicas sob as quais o experimento seja realizado tornaro possvel decidir se tal suposio ser justificada ou aproximadamente justificada.

Ex.: Consideremos um grande lote de peas, digamos 10.000. Admitamos que 10% dessas

peas sejam defeituosas e 90% perfeitas. Duas peas so extradas. Qual a probabilidade de que ambas sejam perfeitas?

Definamos os eventos A e B, assim A = { A primeira pea perfeita} B = { A segunda pea perfeita}

Se admitirmos que a primeira pea seja reposta, antes que a segunda seja escolhida, ento os eventos A e B podem ser considerados independentes e, portanto, P(A B) = P(A) . P(B) = (0.9) (0.9) = 0.81.Probabilidades - 4

Na prtica, contudo, a segunda pea escolhida sem a reposio da primeira pea; neste caso, P(A B) = P(A) . P(B | A) = (0.9) . que aproximadamente igual 0.81.8999 9999

Assim, muito embora A e B no sejam independentes no segundo caso, a hiptese de independncia (que simplifica consideravelmente os clculos) acarreta apenas um erro desprezvel. Se existissem somente poucas peas no lote, a hiptese de independncia poderia acarretar um erro grande.

2.2.1 - Confiabilidade

A teoria da confiabilidade estuda sistemas e seus componentes, como, por exemplo, sistemas mecnicos ou eletrnicos (um automvel ou um computador). O objetivo desta teoria estudar relaes entre o funcionamento dos componentes e do sistema. A figura a seguir ilustra um sistema composto de dois componentes ligados em srie.

O sistema funciona se os componentes 1 e 2 funcionam simultaneamente. Se um dos componentes no funciona, o sistema tambm no funciona. Supondo que os componentes funcionem independentemente, e se pi a probabilidade do componente i (i=1,2) funcionar, ento a probabilidade do sistema funcionar p1p2.

Chamando: E : o sistema funciona Ai : o componente i funciona, i = 1,2 ento, P(E) = P(A1 A2) = P(A1) P(A2) = p1 p2 Cada pi chamada a confiabilidade do componente i e P(E) = h (p1, p2) = p1 p2 Probabilidades - 5

chamada a confiabilidade do sistema. Se os componentes 1 e 2 estiverem ligados em paralelo, como na figura a seguir, ento o sistema funciona se pelo menos um dos dois componentes funciona. Ou seja,

P (E) = P (A1 A2) = P (A1) + P (A2) - P (A1 A2) e a confiabilidade do sistema h (p1, p2) = p1 + p2 - p1p2

Ex.: Suponhamos que para o circuito da figura a seguir, a probabilidade de que cada rel

esteja fechado seja p, e que todos os rels funcionem independentemente. Qual ser a probabilidade de que o circuito permita a passagem de corrente entre A e B?1 5 2

A

3

4

B

Empregando a mesma definio dos circuitos anteriores: P(E) = P(A1 A2) + P(A5) + P(A3 A4) - P(A1 A2 A5) - P(A1 A2 A3 A4) - P(A5 A3 A4) + P(A1 A2 A3 A4 A5) = = p2 + p + p2 -p3 - p4 - p3 + p5 p + 2p2 - 2p3 - p4 + p5

Uma bastante comum, mas errnea, resoluo de um problema, pode ser vista a seguir.

Ex.: Admita-se que dentre seis parafusos,.dois sejam menores do que um comprimento

especificado. Se dois dos parafusos forem escolhidos ao acaso, qual ser a probabilidade p de que os dois parafusos mais curtos sejam retirados? Adote que, Ai : o i-simo parafuso curto (i = 1,2) Probabilidades - 6

A soluo correta dada por: p = P (A1 A2) = P(A2 | A1) . P(A1) =1 2 1 = 5 6 15

ou ainda, usando o conceito de probabilidade;p= n casos favoraveis favor veis = n casos possiveis possveis 1 = 6 2 1 15

A soluo comum, mas incorreta, obtida escrevendo-se1 2 1 p = P ( A1 A2 ) = P ( A2 ) P ( A1 ) = = . 5 6 15

Naturalmente, o importante que, muito embora a resposta esteja numericamente correta, a identificao de 1/5 com P(A2) incorreta; 1/5 representa P(A2 | A1). Para calcular P(A2) corretamente, escrevemos P(A2) = = =

P ( A2 A1 ) + P ( A2 A1 )

P ( A2 | A1 ) P ( A1 ) + P ( A2 | A1 ) P ( A1 )1 2 2 4 1 + = 5 6 5 6 3

2.2.2 - Teorema de Bayes

Uma das relaes mais importantes envolvendo probabilidades condicionais dada pelo teorema de Bayes que expressa uma probabilidade condicional em termos de outras probabilidades condicionais. Se E1, E2, ... En so eventos mutuamente excludentes (Ei Ej = para todo i j)n de um espao amostral Exaustivo E, U Ei = E , ento cada Ei denominado de partio de i=1

E. Se A um evento arbitrrio de E com p(A) > 0, ento a probabilidade de ocorrncia de uma das parties Ek, dado que ocorreu o evento A, pode ser expressa por:P( E k | A ) = P ( E k A) P ( E K A) = n P( A ) P ( A Ei )i=1

Probabilidades - 7

ou, mais simplesmente (!?), por:

P( E k | A) =

P(E k ) P( A| E K )

P(E ) P( A| E )i =1 i i

n

, e i = 1, 2, ....n

Sendo que P( A| E K ) =

P( A Ei ) P( A E K ) e P( A| Ei ) = P( E k ) P(E i )

Ex.: Uma companhia produz circuitos integrados em trs fbricas, I, II e III. A fbrica I

produz 30% dos circuitos, enquanto II e III produzem 45% e 25% respectivamente. As probabilidades de que um circuito integrado produzido por estas fbricas no funcione so 0.01, 0.02 e 0.04, respectivamente. Escolhido um circuito da produo com defeito conjunta das trs fbricas, qual a probabilidade de ele ter sido fabricado em I?

A tabela a seguir sintetiza os dados, F = I, II, III

Fbrica

Produo

d (defeituoso)

P(F).P(d|F)

I II III

30% 45% 25%

0,01 0,02 0,04

0,003 0,009 0,01 0,022

Assim:P( I ) P( d | I )

P( I |d ) =

P( F ) P( d |F )F =I

III

=

0.003 =13.63% 0.022

Probabilidades - 8

Exerccios IV

1 - Do-se as seguintes probabilidades para A e B: P(A) = 1/2, P(B) = 1/4,P(A | B) = 1/3. a) Utilizando as leis de probabilidade, calcular P( A ), P( AB ), P( A B ).

b) Usar diagrama para calcular P( AB ) e P( A B ) . 2 - Se A, B e C so eventos arbitrrios, exprima em notao de conjuntos os seguintes eventos: a) ocorrem apenas 2 eventos; b) ocorrem no mais de 2 eventos; c) ocorrem A e B mas no C. d) ocorre ao menos um e) no ocorre nenhum; f) ocorre apenas um. 3 - Numa amostra de 40 indivduos, 10 acusam presso alta. Estime a probabilidade de outro indivduo escolhido ao acaso, no mesmo grupo do qual foi extrada a amostra, tambm ter presso elevada. 4 - Jogam-se dois dados. Qual a probabilidade de o produto dos nmeros das faces superiores estar entre 12 e 15 inclusive? 5 - Uma moeda viciada de tal forma que a probabilidade de ocorrer cara duas vezes a de ocorrer coroa. Jogada trs vezes a moeda, qual a probabilidade de aparecerem exatamente duas coroas? 6 - Admitindo que a probabilidade de uma criana ser menino (H) seja 0,51, determinar a probabilidade de uma famlia de seis filhos ter: a) ao menos um H; b) ao menos uma M. 7 - Escolhido ao acaso um ponto no disco unitrio, determinar a probabilidade de o ponto estar no setor [0, /6]. 8 - A experincia indica que 15% dos que reservam mesa em um restaurante nunca aparecem. Se o restaurante tm 60 mesas e aceita 62 reservas, qual a probabilidade de poder acomodar todos os que comparecerem?Exerccios IV - 1

9 - Um sistema tem dois componentes que operam independentemente. Suponhamos que as probabilidades de falha dos componentes 1 e 2 sejam 0,1 e 0,2, respectivamente. Determinar a probabilidade de o sistema funcionar nos dois casos seguintes: a) os componentes so ligados em srie (isto , ambos devem funcionar para que o sistema funcione); b) os componentes so ligados em paralelo (basta um funcionar para que o sistema funcione) 10 - Aps seleo preliminar, uma lista de jurados consiste em 10 homens e sete mulheres. Escolhidos dentre esses os cinco membros de um jri, a escolha recai somente sobre homens. O processo sugere discriminao contra as mulheres? Responda calculando a probabilidade de no haver nenhuma mulher no jri. 11 - Qual o nmero mnimo de jogadas de uma moeda necessrio para assegurar uma probabilidade superior a 0,74 de obter ao menos uma cara ? 12 - De acordo com certa tbua de mortalidade, a probabilidade de Jos estar vivo daqui a 20 anos 0,6, e a mesma probabilidade para Joo 0,9. Determinar: a) P (ambos estarem vivos daqui a 20 anos) b) P (nenhum estar vivo daqui a 20 anos) c) P (um estar vivo e outro estar morto daqui a 20 anos) 13 - Uma tbua de mortalidade acusa as seguintes taxas de mortalidade qx (isto , probabilidade de um indivduo de idade x morrer antes de atingir a idade x + 1): x q 30 31 32 33 34 35

0,00213 0,00219 0,00225 0,00232 0,00240 0,00251

a) Dado um indivduo de 30 anos, qual a probabilidade de ele atingir a idade de 31 anos? b) Para o mesmo indivduo, qual a probabilidade de morrer antes de completar 35 anos? 14 - Determinar a probabilidade de n pessoas (n 365) fazerem aniversrio em datas diferentes. 15 - As probabilidades de um estudante passar em lgebra (A), em Literatura (L) e ambas (AL) so 0,75, 0,84 e 0,63 respectivamente. Qual a probabilidade de passar em lgebra, sabendo-se que passou em Literatura?

Exerccios IV - 2

16 - A caixa I tem duas bolas brancas e duas pretas; a caixa II tem duas bolas brancas e uma preta; a caixa III tem uma bola branca e trs pretas. a) Tira-se uma bola de cada caixa. Determinar a probabilidade de serem todas brancas. b) Escolhe-se uma caixa ao acaso e tira-se uma bola. Qual a probabilidade de ser branca ? c) Em (b), calcular a probabilidade de ter sido escolhida a caixa I, sabendo-se que a bola extrada branca. 17 - Suponha um teste para cncer em que 95% dos que tm o mal reagem positivamente, enquanto que 3% dos que no tm o mal reagem positivamente. Suponhamos ainda que 2% dos internos de um hospital tenham cncer. Qual a probabilidade de um doente escolhido ao acaso, e que reaja positivamente ao teste, ter de fato o mal? 18 - Duas sacolas tm, cada uma, m moedas de R$ 5,00 e n moedas R$ 2,00. Extrai-se uma moeda de cada sacola. a) Calcular a probabilidade de ambas serem de R$ 5,00. b) Mostrar que essa probabilidade maior do que a de extrair duas moedas de R$ 5,00 de uma nica sacola com todas as moedas. 19 - Quando surgiu a LOTO, estabeleceu-se que o valor a ser cobrado por carto apostado seria proporcional ao nmero de quinas presentes no carto. Um carto com seis dezenas 6 7 tem = 6 quinas. Um com sete dezenas tem = 21 quinas. Como o nmero de 5 5 dezenas permitido varia de 5 a 10, temos os seguintes resultados: No de dezenas 5 No de quinas 1 6 6 7 21 8 56 9 126 10 252

Assim, um carto com cinco dezenas custava Cr$ 1,00, enquanto um com 10 dezenas custava Cr$ 252,00. Com estes preos, tornava-se muito caro apostar em vrias dezenas. O prmio acumulou vrias semanas! A dificuldade com o sistema adotado que ele considera apenas o prmio da quina, quando, na realidade, existem prmios tambm para as quadras e ternos. Considerando-se estes outros prmios, as relaes entre os preos dos cartes so outras. Seu clculo, entretanto, bem mais complicado. Em um volante com 100 dezenas, 00, 01, 02 ... 98, 99, o apostador pode marcar de 5 a 10 dezenas, concorrendo ao sorteio de uma quina, cinco quadras e 10 ternos. No menor jogo, cinco dezenas, ele paga (em fevereiro de 1986) Cr$ 1,20 e, pelo maior jogo, Cr$ 43,00.

Exerccios IV - 3

Qual a probabilidade de acertar a quina com um carto de cinco dezenas? de 10 dezenas? 20 - Com relao ao problema anterior, se estamos interessados apenas no prmio pago ao acertador da quina, o que mais vantajoso: um carto com 10 dezenas ou 35 cartes com cinco dezenas cada? 21 - Uma determinada pea manufaturada por trs fbricas, I, II e III. Sabe-se que I produz o dobro que II, II e III produziram o mesmo nmero de peas. 2% das peas produzidas por I e II so defeituosas; em III tem-se 4% de defeituosas. Todas as peas produzidas so colocadas em um depsito e depois uma pea extrada ao acaso. Qual a probabilidade de que esta pea seja defeituosa? 22 - Um sistema automtico de alarme contra incndio utiliza trs clulas sensveis ao calor que agem independentemente uma da outra. Cada clula entra em funcionamento com probabilidade 0,8 quando a temperatura atingir 60 C. Se pelo menos uma das clulas entrar em funcionamento o alarme soa. Calcular a probabilidade do alarme soar quando a temperatura atingir 60 C. 23 - Uma montagem eletromecnica formada por dois subsistemas A e B. De procedimentos de ensaios anteriores, as seguintes probabilidades se admitem conhecidas:

P(A falhe) = 0.20 P(A e B falhem) = 0.15 P(B falhe sozinho) = 0.25Calcule a probabilidade: P(A falhe | B falhe). 24 - Um certo tipo de motor eltrico falha, com probabilidade de 10% devido aos fatores: emperramento de mancais, queima de enrolamentos, desgaste das escovas. Suponha que o emperramento seja duas vezes mais provvel do que a queima, e a queima, quatro vezes mais provvel do que o desgaste. Qual a probabilidade de que a falha se d por desgaste das escovas? (Obs.: a probabilidade de que haja falha devido aos trs fatores pode ser desprezada e os fatores so independentes) 25 - Uma companhia produz circuitos integrados em trs fbricas, I, II e III. A fbrica I produz 40% dos circuitos, a fbrica II 15% e a fbrica III 45%. As probabilidades de que um circuito integrado produzido por estas fbricas no funcionem so: 0.01, 0,04 e 0.03, respectivamente. Escolhido um circuito da produo conjunta das trs fbricas, qual a Exerccios IV - 4

probabilidade de o mesmo no funcionar?

26 - Um sistema de proteo atua devido a falhas em duas subestaes A e B, que agem conjuntamente. As probabilidades de falha nessas duas subestaes so P(A) = 0.002 e

P(B) = 0.008. sabe-se tambm que a probabilidade de falha em A devido a falha em B 0.2. Determine: a) A probabilidade do sistema de proteo atuar; b) A probabilidade de que o sistema atue devido a falha em A mas no falhe em B. 27 - Uma companhia produz cilindros em trs fbricas I, II e III. A fbrica I produz 30% dos cilindros, a fbrica II 45% e a fbrica III 25%. As probabilidades de que um cilindro produzido por estas fbricas seja defeituoso so 0.01, 0.02 e 0.04, respectivamente. Escolhido um cilindro da produo conjunta das trs fbricas, qual a probabilidade de o mesmo ser da fbrica I? 28 - Numa indstria de enlatados, as linhas de produo I, II e III respondem por 50%, 30% e 20% da produo, respectivamente. As propores de latas com defeito de produo nas linhas I, II e III so 0.4%, 0.6% e 1.2%. Qual a probabilidade de uma lata defeituosa (descoberta ao final da inspeo do produto acabado) provir da linha I. 29 - Sabe-se que na fabricao de um certo artigo, defeitos de um tipo ocorrem com probabilidade 0.1 e defeitos de outro tipo com probabilidade 0.05. Qual ser a probabilidade de que: a) Um artigo no tenha defeito? b) Um artigo seja defeituoso? c) Um artigo tenha apenas um tipo de defeito, sabido que defeituoso?

Exerccios IV - 5

2.3 - Variveis Aleatrias

2.3.1 - Variveis Aleatrias Unidimensionais

Varivel Aleatria (va) uma funo que associa nmeros reais aos pontos de um espao amostral. Ou seja, os resultados do experimento aleatrio so associados numericamente. Geralmente usamos letras maisculas (X, Y, Z...) para designar as variveis aleatrias, e minsculas (x, y, z...) para indicar particulares valores dessas variveis. O comportamento de uma varivel aleatria descrito por sua distribuio de probabilidade.

Ex.: No teste de dois componentes eletrnicos, podemos ter o seguinte espao amostral. E = { PP, PN, NP, NN } sendo P resultado positivo e N negativo.

Seja X o nmero de resultados positivos do teste. X uma varivel aleatria. Temos ento:

Pontos de E X

PP 2

PN 1

NP 1

NN 0

A distribuio de probabilidades de X dada pela seguinte tabela:

X P(X)

2 1/4

1 1/2

0 1/4

sendo P(X) a sua probabilidade

As variveis aleatrias podem ser discretas, contnuas ou mistas. No caso discreto a distribuio de probabilidade pode ser caracterizada por uma funo de probabilidade, que indica diretamente as probabilidades associadas a cada valor. No caso contnuo temos a funo densidade de probabilidade (fdp).

Tais distribuies possuem as seguintes propriedades: Probabilidades - 9

Caso discreto a) f (xi) 0 b)

Caso contnuo f (x) 0

f (x ) =1i=1 i

n

f ( x ) dx = 1

c) P (X = xi) = f (xi)

P (a < X b) =

b

a

f ( x ) dx

( b > a)

Ex.: No teste de partida de vlvulas eletrnicas a probabilidade de que haja um resultado positivo P (+) = 3/4 e um resultado negativo P (-) = (1/4). Os testes prosseguem at que acontea o primeiro resultado positivo. Temos ento o seguinte espao amostral: E = { +, - +, - - +, - - - +, ...} Definindo a varivel aleatria X como: X : nmero de testes do experimento. X = 1, 2, 3, ... temos a seguinte distribuio de probabilidade.

X P (X)

13 4

2

3 ...

3 16

3 ... 48

P(X) foi calculado usando a seguinte funo de probabilidade (aceitando que uma vlvula no influencie na outra):

P( X = x n ) = f ( x n ) = (1 / 4)

n1

( 3 / 4)

com n = 1, 2, 3, ...

observe que ocorre um resultado positivo precedido de n - 1 negativos.

As propriedades a) e c) so imediatas, b) pode ser vista assim: n 1 1 3 3 3 3 3 1 f ( xi ) = 4 + 16 + 48 +... = 4 1 + 4 + 16 +... 4 . 1 = 1 i =1 1 4 Obs.: Estamos empregando o resultado de que a srie geomtrica 1 + r + r2 + ... converge para 1/(1-r) sempre que | r | < 1.

Probabilidades - 10

Ex.: Seja X a durao da vida (em horas) de um certo tipo de lmpada. Admitindo que X seja uma varivel aleatria contnua, suponha que a fdp f de X seja dada por f(x) = a/x3, 1.500 x 2.500 = 0 , para quaisquer outros valores. (Isto , est se atribuindo probabilidade zero aos eventos { x < 1500} e {x > 2500}).

Para calcular a constante a, recorre-se condio

f ( x ) dx = 1, que neste caso se torna:

2.500

1.500

( a x ) dx = 1.3

Da obtemos que a = 7.031.250 e o grfico de f dado a seguir:f(x) 0.00208

A=1 1500 2500 x

Em captulo posterior estudaremos melhor muitas variveis aleatrias importantes, tanto discretas como contnuas.

2.3.2 - Funo de Repartio ou de Distribuio Acumulada (F(x))

Tal funo definida por: F(x) = P (X x),

servindo como alternativa para a caracterizao da distribuio de probabilidade de qualquer tipo de varivel aleatria.

No caso discreto temos que Probabilidades - 11

F ( x) =e no caso contnuo,

P( x )i xi

x

xi x

F ( x ) = f ( x ) dx ,x

com

f ( x) =

d F( x) . dx

So propriedades da funo de repartio: a)

0 F( x ) 1 F ( ) = 0 F ( + ) = 1

b) c)

d) F(x) sempre no-decrescente e)

F ( b) F ( a ) = P( a < x b)

( b > a)

Ex.: Suponhamos que a varivel aleatria X assuma os trs valores 0,1 e 2, com probabilidade

1/3, 1/6 e 1/2, respectivamente. Ento, temos o seguinte grfico:

F(x) Funo degrau ou escada 1

1/2 1/3 0 1 2 3 x

Observe que P(X = xi) igual ao salto que a funo F(x) d em xi; por exemplo, P(X=1)= 1/6 = F(1) - F (1-). De um modo geral P(X = xi) = F(xi) - F(xi-)Obs.: F ( x i ) = lim F ( y )y x

Ex.: Suponhamos que X seja uma varivel aleatria contnua com fdp

f(x) = 2x, 0 < x < 1 = 0, para quaisquer outros valores. Portanto, F(x) dada por:Probabilidades - 12

F(x) = 0 se x 0 =

x

0

2sds = x 2

se 0 < x 1

= 1 se x > 1

Assim, temos o seguinte grfico:

1 f(x)=2x

F(x)

1

x

Ex.: Suponha que uma varivel aleatria contnua tenha F(x) dado por:

F(x) = 0

,x0

= 1 - e-x , x > 0

Nesse caso, f (x) =

d F( x) = e-x dx

x0

= 0, para quaisquer outros valores. Assim temos:F(x)

1

f(x) 0x

Ex.: Suponha que estejamos ensaiando um equipamento e faamos igual a X o tempo de

funcionamento, uma v.a.contnua com fdp f (x) para x 0. No entanto, podem surgir situaes

Probabilidades - 13

nas quais exista uma probabilidade no nula p de que o equipamento no funcione no momento x = 0. Nesse caso, podemos modificar o nosso modelo e atribuir P (X = 0) = p e P(X > 0) = 1 - p. Deste modo, p descreve a distribuio de X no ponto 0 (v.a. discreta), enquanto f (x) descreve a distribuio para valores de x > 0 (v.a. contnua). Tal distribuio um exemplo de distribuio mista. Observe o grfico:

P(X = 0) = p f(x)

0

f ( x )dx = 1 p

0

x

2.3.3 - Variveis aleatrias bidimensionais

Um par ordenado de valores aleatrios define uma v.a. bidimensional. Uma distribuio de probabilidade bidimensional pode ser discreta, sendo caracterizada por uma funo probabilidade bidimensional tal que i j P x i , y j = 1;

(

)

P xi , y j 0

(

)

para todo (x, y)

ou contnua, sendo caracterizada por uma funo densidade de probabilidade bidimensional tal que

f ( x, y ) dx dy = 1

f ( x, y ) 0

No caso discreto, definem-se as distribuies marginais de X e Y (os totais em cada linha e coluna - ver cap1) respectivamente, por:

( ) P( Y = y ) = P( x , y ) ,j i i j

P( X = xi ) = j P xi , y j ,

e no caso contnuo, por

g( x ) = f ( x, y ) dy

Probabilidades - 14

h( y ) = f ( x, y ) dx

Duas v.a. discretas X e Y so independentes se, para todos os pares (xi, yj) P(xi, yj) = P(X = xi) . P(Y = yj)

Analogamente, no caso contnuo, X e Y so independentes se, para todos os pares (x, y), f (x, y) = g(x) . h (y)

Ex.: Duas linhas de produo fabricam um certo tipo de pea. Suponha que a capacidade (em

qualquer dia) seja de 5 peas na linha I e 3 peas na linha II. Admita que o nmero de peas realmente produzidas em qualquer linha seja uma varivel aleatria, e que (x, y) represente a varivel aleatria bidimensional que fornece o nmero de peas produzidas pela linha I e a linha II, respectivamente. A tabela a seguir fornece a distribuio de probabilidade conjunta de (x, y) . Cada casa representa p = (xi , yi) = P (X =xi ,Y = yi) Assim, p (2,3) = P (X = 2; Y = 3) = 0.04, etc...

Se B for definido, por exemplo, como: B : Mais peas so produzidas pela linha I do que pela linha II ento encontraremos que: P (B) = 0.01 + 0.03 + 0.05 + 0.07 + 0.09 + 0.04 + 0.05 + 0.06 + 0.08 + 0.05 + 0.05 + 0.06 + 0.06 + 0.05 = 0.75

Y

X

0 0 0.01 0.01 0.01

1 0.01 0.02 0.03 0.02

2 0.03 0.04 0.05 0.04

3 0.05 0.05 0.05 0.06

4 0.07 0.06 0.05 0.06

5 0.09 0.08 0.06 0.05

Total 0.25 0.26 0.25 0.24

0 1 2 3

Total 0.03 0.08 0.16 0.21 0.24 0.28 1.00 Suponhamos que se deseje calcular a probabilidae condicionada P(X = 2 | Y = 2). Temos ento:

Probabilidades - 15

P(X = 2 | Y = 2) =

P ( X = 2, Y = 2) 0.05 = = 0.20 P ( Y = 2) 0.25

e generalizando: P(xi | yj) =P xi , y j P yj

(

( )

) = P(X = x | Y = y ) ,i j

P (yj) > 0

Ex.: Suponha que um fabricante de lmpadas esteja interessado no nmero de lmpadas

encomendadas a ele durante os meses de janeiro e fevereiro. Sejam X e Y, respectivamente, o nmero de lmpadas encomendadas durante esses dois meses. Admitiremos que (X , Y) seja uma v.a contnua bidimensional, com a seguinte fdp conjunta f (x, y) = c =0 5000 x 10.000 , 4.000 y 9.000

para quaisquer outros valores

y

9000 R 4000

5000

10000

x

Assim, c calculado como

9.000

4.000

10.000

5.000

cdxdy = c[5000] = 1 c = (5.000)2

2

Se, por exemplo, B = { X Y}, teremos9.000

P (B) = 1 c 5.000

y 5.000

dxdy = 1 c 5.000 [ y 5.000] dy =9.000

17 25

Ex.: Seja (x, y) uma v.a. com fdp dada por:Probabilidades - 16

f (x, y) = x 2 + =0

xy 3

0x1

0y2

para outros valores

f ( x, y ) dx dy = 1

(Verifique!)

Se B = {X + Y 1} P(B) = 1 - P( B )

podemos calcular P(B) como: onde B = {X + Y 1}.

Portanto, P(B) = 1 0y 21

1 x 0

2 xy 65 x + dy dx = 3 72

y=1-x

1

x

As distribuies marginais g(x) e h(y) so dadas por: g (x) = h (y) =

2 xy 2 x + dy = 2 x 2 + x 0 3 32 1

x 0

2

+

xy y 1 dx = + 3 6 3

e as probabilidades condicionadas g (x | y) e h (y | x) so dadas por: g (x | y) =h( y | x ) =

f ( x, y ) x 2 + xy 3 6 x 2 + 2 xy = = h( y ) 1 3+ y 6 2+ yf ( x , y ) x 2 + xy 3 3x + y = = 2 6x + 2 g( x ) 2 2x + x 3

0 x 1, 0 y 20 x 1, 0 y 2

Pode-se verificar tambm que g(x | y) e h (y | x) so fdp. Observe:

Probabilidades - 17

1 0

6 x 2 + 2 xy 2+ y dx = =1 2+ y 2+ y3x + y dy = 1 6x + 2

2 0

Ex.: Duas caractersticas do desempenho do motor de um foguete so o empuxo X e a taxa demistura Y. Suponha que (X, Y) seja uma varivel aleatria bidimensional com funo: f (x, y) = 2 (x + y - 2xy) 0 x 1, 0y1

= 0 para quaisquer outros valores.

A funo de probabilidade marginal de X dada por: g (x) g (x) =

y2 2( x + y 2 xy ) dy = 2 xy + xy 2 0 2 1

1 0

=1

0x1

Isso significa que X distribuda uniformemente sobre [0,1].

Para Y, a funo marginal dada por: h (y) =

2( x + y 2xy ) dx = 2( x1 0

2

/ 2 + xy x 2 y )

1 0

=1

0y1

Portanto, Y tambm uniformemente distribuda sobre [0,1].

Obs.: Dizemos que a v.a. contnua bidimensional uniformemente distribuda sobre umaregio R do plano euclideano quando f (x, y) = cte =0 para (x, y) R para qualquer outra regio

Em virtude da condio

f ( x, y ) dxdy = 1

a definio acima acarreta que a constante ser igual a 1/rea (R). Estamos supondo que R seja uma regio com rea finita, no nula.

Probabilidades - 18

Ex.: Suponhamos que a v.a. (x, y) seja uniformemente distribuda sobre a regio R indicadana figura a seguir. Portanto, f (x, y) =y (1,1) y=x R y = x2 x

1 , area ( R)

( x, y ) R

Assim rea ( R ) = 0 ( x x 2 ) dx = 1 61

e a fdp ser dada por f (x, y) = 6 =0

, (x, y) R , (x, y) R

As fdp marginais de X e Y so dadas por:

g( x ) = f ( x, y ) dy = x 2 6 dy = 6( x x 2 ) ,x

0 x 1,

e

h( y ) = f ( x, y ) dy = y 6 dx = 6( y y ) , y

0 y 1

e seus respectivos grficos so:

g(x)

h(y)

x = 1/2

(1,0)

x

y = 1/4

y

Ex.: Suponhamos que uma mquina seja utilizada para determinada tarefa durante a manh eProbabilidades - 19

para uma tarefa diferente durante a tarde. Representemos por X e Y, respectivamente o nmero de vezes que a mquina pra por defeito de manh e tarde. A tabela a seguir d a distribuio de probabilidade conjunta de (x, y).

Y

X

0 0.1 0.04 0.06 0.2

1 0.2 0.08 0.12 0.4

2 0.2 0.08 0.12 0.4

p(yj) 0.5 0.2 0.3 1.0

Um clculo simples mostra que, para todas as casas temos p(xi, yj) = p(xi) . p(yj). Portanto, X e Y so v.a.

0 1 2 p(xi)

independentes.

Ex.: Sejam X e Y a durao da vida de dois dispositivos eletrnicos. Suponha que a fdpconjunta seja dada por: f (x, y) = e-(x+y) x0 y0

Desde que podemos fatorar f (x, y) = e-x . e -y, a independncia entre X e Y fica estabelecida.

Ex.: Seja agora f (x, y) = 8 x y , 0 x y 1 uma fdp. O domnio indicado pela regio dafigura seguinte.

y

1

x

Muito embora f j seja escrita na forma fatorada, X e Y no so independentes j que o campo de definio dependente.

Probabilidades - 20

Exerccios V1 - Uma moeda viciada de tal forma que P(K) = 2P(C). Jogando-a trs vezes, determinar a distribuio de probabilidade do nmero de caras, X. Determinar a funo cumulativa e calcular: a)

P(1 X 3) b)

P( X > 2)

2 - Calcular P(a < X < b), conhecida F(x).

3 - No exerccio anterior, determinar uma aproximao para: p( X 8 6) . 4 - Em cada caso, determinar se os valores dados podem ser considerados como integrantes de uma v.a. X que tome apenas os valores 1, 2, 3, 4: a) f(1) = 0,23 b) f(1) = 1/7 c) f(1) = 0,15 d) f(1) = 0,26 f(2) = 0,28 f(2) = 2/7 f(2) = 0,2 f(2) = 0,49 f(3) = 0,39 f(3) = 1/14 f(3) = 0,38 f(3) = 0,08 f(4) = 0,18 f(4) = 3/7 f(4) = 0,27 f(4) = 0,33

5 - Determinar a distribuio de probabilidade e a distribuio acumulada do nmero de discos de rock, quando se escolhem aleatoriamente quatro discos de uma coleo com cinco discos de rock, trs de msicas popular e dois clssicos. 6 - O dimetro X de um cabo eltrico supe-se ser uma v.a. contnua X, com fdp f ( x ) = 6 x (1 x ) , 0 x 1. a) Verifique se f(x) realmente uma fdp e esboce o seu grfico; b) Obtenha uma expresso para F(x); c) Calcule P( X 1 2 | 1 3 < X < 2 3) 7 - A porcentagem de lcool em certo composto pode ser considerada uma v.a X., onde X,0 < X < 1, tem a seguinte funo de probabilidade:

f ( x ) = 20 x 3 (1 x ) 0 < X < 1a) Estabelea a expresso de F(x); b) Calcule p( x 2 3) ; c) Suponha que o preo de venda desse composto dependa do contedo de lcool. Especificamente, se 1/3 < x < 2/3, o composto se vende por C1 dlares/galo; caso contrrio, ele se vende por C2 dlares/galo. Se o custo for C3 dlares/galo, calcule a distribuio de probabilidade do lucro lquido por galo.

Exerccios V - 1

2.4 - Esperana Matemtica

As distribuies de probabilidade so modelos tericos onde as probabilidades dos valores assumidos pela v.a. podem ser interpretadas como freqncias relativas (fi ) em um nmero sempre crescente de provas, ou seja, como limites de freqncias relativas. Podemos, pois, definir, para as distribuies de probabilidade, as mesmas medidas de tendncia central e de disperso utilizadas nas distribuies de freqncias do Captulo 1.

Guardando essa semelhana podemos definir a mdia de uma v.a. X como: E(X) = xi f ( xi )

(caso discreto)

E(X) a Esperana Matemtica, tambm chamada de Valor Esperado, Expectncia ou ainda Mdia Populacional (). Repare que E(X) uma mdia ponderada dos xi, em que os pesos so as probabilidades associadas.

Se X uma v.a. contnua com fdp f, E(X) dada por:

E(X) =

x f ( x ) dx

(caso contnuo)

Sendo (X, Y) uma v.a. bidimensional, faamos Z = H (X, Y). - Se (X, Y) for discreta e se p (xi, yj) = p (X = xi, Y = yj), E(Z) = j=1 i j i j

i, j = 1, 2, 3, ... teremos:

H( x , y ) p( x , y )i=1

- Se (x, y) for contnua com fdp f, teremos: E(Z) =

H ( x, y ) f ( x, y ) dx dy

Probabilidades - 21

So propriedades de E(X) (as verificaes so aqui dadas apenas para o caso contnuo. Verifique tais propriedades tambm para o caso discreto):

i)

Se X uma v.a. com X = c, onde c uma constante, ento E(X) = E(c) = c. Pois: E( X ) = c f ( x ) dx = c f ( x ) dx = c

Observe o significado de X = c

F(x) 1 X nesse caso freqentemente denominada v.a. degenerada x=c x 1

f(x)

x=c

x

ii) E(cX) = c E(X) Nesse caso:

E ( cX ) = cx f ( x ) dx = c x f ( x ) dx = cE( X )

Obs.: Se multiplicarmos todos os termos de uma v.a. X por c, o seu valor mdio fica tambm multiplicado por c.

iii) Seja (X, Y) uma v.a. bidimensional. Seja Z = H1 (x, y) e W = H2 (x, y). Ento E (Z + W) = E(Z) + E (W) Realmente:

E ( Z + W ) = [ H1 ( x, y ) + H 2 ( x, y )] f ( x, y ) dxdy = E( Z ) + E (W )

iv) Se X e Y so duas v.a. quaisquer. Ento E(X + Y) = E(X) + E(Y). E isso decorre imediatamente de iii. v) Sejam n v.a. X1, X2, ... Xn.. Ento: Probabilidades - 22

E ( X 1 + X 2 + L+ X n ) = E ( X 1 ) + E ( X 2 ) + L+ E ( X n )

Isso decorre de iv, pela aplicao da induo matemtica.

vi) Seja (X,Y) uma v.a. bidimensional. Se X e Y so independentes, entoE ( XY ) = E ( X ). E ( Y )

De fato:E ( XY ) =

xy f ( x , y ) dxdy = xy g( x ) h( y) dxdy = x g( x ) dx yh( y ) dy = E ( X ). E (Y )

Ex.: Seja X uma v.a. que assume os seguintes valores X = {15, 10, 5 - 5} e tenha a seguinte distribuio de probabilidade: X f(x)

15 0,56 10 0,23 5 0,02 -5 0,19

Assim, para o clculo da Esperana Matemtica, temos:

E( X ) = x i f ( x i ) = 15( 0.56) + 10( 0.23) + 5( 0.02) + (5)( 019) = 9,85 .Se fizermos Z1 = 2 X

teremos uma nova v.a. com os seguintes valores

Z1 = {30, 20, 10, -10} e E ( Z1 ) = E ( 2 X ) = 2 E ( X ) = 19.7 (O valor esperado E(X) foi

duplicado) Se fizermos Z2 = X + 2 teremos uma nova v.a. com os seguintes valores,Z2 = {17, 12, 7, - 3} e E ( Z2 ) = E ( X + 2 ) = 2 + E ( X ) = 11,85.

Ex.: Suponhamos que a procura D, por semana, de um certo produto seja uma v.a. com uma certa distribuio de probabilidade, digamos P( D = n ) = p( n ) , n = 0, 1, 2, ... . Admitamos que Probabilidades - 23

o custo para o vendedor seja C1 dlares por pea, enquanto ele vende cada pea por C2 dlares. Qualquer pea que no tenha sido vendida at o fim de semana deve ser estocada ao custo de C3 dlares por pea. Se o vendedor decidir produzir N peas no incio da semana, qual ser seu lucro esperado por semana? Para que valor de N, o lucro esperado se torna mximo? Se L for o lucro semanal, temos

L = NC2 NC1 = DC2 C1N C3 ( N D )Reescrevendo:

D>N DN

L = N ( C2 C1 )

= ( C2 + C3 )D N ( C1 + C3 )

D>N DN

O lucro esperado ser dado por:

E ( L ) = N ( C2 C1 ). P( D > N ) + [( C2 + C3 )D N ( C1 + C3 )] P( D N ) = N ( C2 C1 ). P( D > N ) + ( C2 + C3 ) np( n ) N ( C1 + C3 ) P( D N ) = N ( C2 C1 )n= N +1 N n= 0

p( n) + ( C

2

+ C3 ) np( n ) N ( C1 + C3 ) p( n )n= 0 n= 0

N

N

N N = N ( C2 C1 ) + ( C2 + C3 ) np( n ) N p( n ) n= 0 n= 0

E ( L ) = N ( C2 C1 ) + ( C2 + C3 ) p( n ) ( n N )n= 0

N

Suponhamos que se saiba a seguinte distribuio de probabilidade seja apropriada para D:P( D = n ) = 1 5 ;

n = 1, 2, 3, 4, 5.

Ento:

E ( L) = N (C2 C1 ) +

(C2 + C3 ) [ N ( N + 1) 2 N 2 ] 5 1 = N (C2 C1 ) + (C2 + C3 ) (15 5 N ) 5

N 5 N >5

Suponhamos ainda que:C1 = $3, C 2 = $9 e C3 = $1.

Probabilidades - 24

Logo,

E ( L) = 6N + 2 [ N ( N + 1) 2 N 2 ] = 6N + 2(15 5N )ou aindaE( L) = 7N N 2 = 30 4 N N 5 N >5

N 5 N >5

Portanto, o mximo ocorre para N = 3,5. Para N = 3 ou 4, teremos E ( L ) = 16 , que o mximo atingvel, posto que N inteiro.E (L)

3 .5

N

2.4.1 - A varincia de uma v.a.

Seja X uma v.a.. Definimos a varincia de X denotada por Var(X), S2 ou 2, da seguinte maneira:

Var ( X ) = E[( X E( X ))2 ] ou Var ( X ) = E[( X )2 ]A raiz quadrada positiva de Var(X) o desvio padro de X, DP(X), S ou .

Uma outra expresso para a varincia :Var ( X ) = E ( X 2 ) [ E ( X )] = E ( X 2 ) 22

Comprove!

Obs.: Var ( X ) = E[( X E( X ))2 ] um caso especial da seguinte noo mais geral. O k-simo

momento da v.a. X, em relao sua esperana, definida como sendo

k = E[( X E( X ))k ] . Evidentemente, para k = 2 obtemos a varincia (ver Cap.1).

Ex.: O servio de meteorologia classifica o tipo de cu que visvel, em termos de graus de

Probabilidades - 25

nebulosidade. Uma escala de 11 categorias empregada: 0, 1, 2, ... 10, onde 0 representa o cu perfeitamente claro, enquanto os outros valores representam as diferentes condies intermedirias. Suponha que uma determinada estao meteorolgica faa tal classificao em um determinado dia e hora. Seja X a v.a. que pode tomar um dos 11 valores acima. Admita-se que a distribuio de probabilidade de X seja:

p0 = p10 = 0.015 . p1 = p2 = p8 = p9 = 015 p3 = p4 = p5 = p6 = p7 = 0.06

Portanto,E ( X ) = 1.( 015) + 2 .( 015)+L+10 .( 0.05) = 5.0 . .

A fim de calcular Var(X), necessitamos calcular E ( X 2 )

E( X 2 ) = 1(015) + 4(015)+L+100(0.05) = 35.6 . .e

Var( X ) = E( X 2 ) 2 = 35.6 25 = 10.6DP(X) = 3.25

Ex.: Suponhamos que X seja uma v.a. contnua com fdp:

f ( x ) = 1 + x 1 x 0 = 1 x 0 x 1f(x)

-11 0 1 1 0 1 1 0

1

x

E ( X ) = xf ( x )dx = x(1 + x )dx + x (1 x )dx = 0 E ( X ) = x (1 + x )dx + x (1 x )dx = 1 62 2 2 0 1

Var( X ) = 1 6

So propriedades da Varincia: Probabilidades - 26

i)

Var ( X + c ) = Var ( X ) , c = cte

Pois: Var ( X + c ) = E [( X + c ) E ( X + c )]

{

2

} = E{[( X + c) E( X ) c] }2

= E[( X E( X ))2 ] = Var( X ) Obs.: Esta propriedade intuitivamente evidente, porque somar uma constante a um resultado X no altera sua variabilidade, que aquilo que a varincia mede. Apenas desloca os valores de X para a direita ou esquerda, dependendo do sinal de c. ii) Var(cX) = c2 Var(X) Pois: Var ( cX ) = E [( cX )2 ] [ E ( cX )] = c 2 E ( X 2 ) c 2 [ E ( X )]2 2

= c 2 E( X )2 [ E ( X )]

{

2

} = c Var( X )2

iii) Se X, Y forem independentes ento:Var ( X + Y ) = Var ( X ) + Var ( Y )

Pois:

Var( X + Y ) = E[( X + Y )2 ] E[( X + Y )]2= E[ X 2 + 2 XY + Y 2 ] [ E ( X ) + E (Y )]2 = E[ X 2 + 2 XY + Y 2 ] [ E ( X )]2 2 E ( X ) E (Y ) [ E (Y ) 2 ] = E ( X 2 ) [ E ( X )]2 + E (Y 2 ) [ E (Y )]2 = Var ( X ) + Var (Y )

Obs.: importante lembrar que a varincia no , em geral, aditiva, como o

E( X ) .

iv) Sejam X1 , X 2 , L X n , n v.a. independentes.Var ( X 1 + X 2 +L+ X n ) = Var ( X 1 ) + Var ( X 2 )+L+Var ( X n )

v) Seja X uma v.a. com varincia finita. Para R , temos:

Var( X ) = E[( X )2 ] [E( X ) ]2

Obs.: Se interpretarmos Var(X) como o momento de inrcia e E(X) como o centro de uma

unidade de massa, ento a propriedade acima uma formulao do teorema dos eixos Probabilidades - 27

paralelos, em Mecnica. O momento de inrcia em relao a um ponto arbitrrio igual ao momento de inrcia em relao ao centro de gravidade, mais o quadrado da distncia desse ponto arbitrrio ao centro de gravidade.E ( X ) se torna mnimo se = E ( X ) . Isto decorre imediatamente da

propriedade acima. Portanto, o momento de inrcia (de uma unidade de massa distribuda sobre uma reta), em relao a um eixo que passe por um ponto arbitrrio, torna-se mnimo se esse ponto escolhido for o centro de gravidade.

2.4.2 - Desigualdade de Tchebichev

Existe uma bem conhecida desigualdade, devida ao matemtico russo Tchebichev, que nos fornece meios de compreender precisamente como a varincia mede a variabilidade em relao ao valor esperado de uma v.a.. ela:

2 P( X ) 2 ou, com = k onde:P( X k ) 1 k2

0

X uma v.a. contnua ou discreta com mdia e varincia 2, ambas finitas.

Ex.: Fazendo k = 2 na desigualdade de Tchebichev, vemos que

P( X 2 ) 0.25 ou

P( X < 2 ) 0.75Em palavras, a probabilidade de X diferir de sua mdia em mais de dois desvios padres inferior ou, no mximo, igual a 0.25; equivalentemente, a probabilidade de X estar compreendido no intervalo de dois desvios padres a contar de sua mdia, superior ou, no mnimo, igual a 0.75. Tal fato tanto mais notvel quanto se considerarmos que nem sequer especificamos a distribuio de probabilidade de X.

Probabilidades - 28

Exerccios VI1 - Se uma pessoa recebe R$ 5,00 se aparecerem somente caras ou somente coroas na jogada de trs moedas, e paga R$ 2,00 em caso contrrio, qual seu ganho esperado? 2 - Determinar o nmero esperado de qumicos em um comit de trs elementos escolhidos entre quatro qumicos e trs bilogos. 3 - X uma v.a. com a seguinte distribuio de probabilidade: x f(x) 0 1/4 1 1/8 2 1/4 3 1/8 4 1/4

Determinar o valor esperado de Y = ( X + 1) 2

4 - Mostre que a varivel padronizada tem mdia 0 e varincia 1. 5 - O tempo T, em minutos, necessrio para um operrio de uma indstria processar certa pea uma v.a. com a seguinte distribuio de probabilidade: T 2 3 4 5 6 7 P 0.1 0.1 0.3 0.2 0.2 0.1 Para cada pea processada, o operrio ganha um fixo de U$ 2.0 mas se ele processa uma pea em menos de 6 minutos, ganha U$ 0.5 por minuto poupado (por exemplo, se ele processa a pea em quatro minutos, recebe a quantia adicional de U$ 1.0). Qual a mdia e a varincia da quantia ganha por pea? 6 - Suponha que um mecanismo eletrnico tenha um tempo de vida X (em unidades de 1000 horas) que tenha uma funo de probabilidade dada por: f ( x ) = e x , x > 0 . Suponha que o custo de fabricao de um item seja U$ 200 e o preo de venda seja U$ 500. O fabricante garante total devoluo se x 0,8. Qual o lucro esperado por item? 7 - O tempo de vida (em horas) de um mancal uma varivel aleatria, com funo de probabilidade dada por: 1 t 800 e f ( t ) = 800 0 ,t0 ,t 500000) = P ( 30000 X 5000 > 500000) 505000 = P X > 30000 = P ( X > 16.833) = 1 P ( X 16 ) = 1 ( 0.25)( 0.75) x 1x =1 16

= 1 ( 0.25) ( 0.75) x 1 0.01 = 1 %x =1

16

A distribuio geomtrica decresce, isto , p (x) < p (x - 1) para x = 2, 3, .... Isto mostrado no seguinte grfico.

Distribuies - 9

P(x)

x

Obs.: Uma interessante e til propriedade da distribuio geomtrica que ela

no tem memria, isto , P (X > x + s | X > s) = P (X > x) ou seja: Suponha-se que o evento S no tenha ocorrido durante as primeiras s repeties do experimento. Ento a probabilidade de que ele no ocorra durante as prximas x repeties ser a mesma probabilidade que no tivesse ocorrido durante as primeiras x repeties. Em outras palavras, a informao de nenhum S esquecida, no que interessa aos clculos subseqentes.

Distribuies - 10

Exerccios VIII1 - Um estudo mostra que 70% dos pacientes que vo a uma clnica mdica devem esperar no mnimo 15 minutos para serem atendidos. Determinar as probabilidades de que, de oito pacientes, 0, 1, 2, 3, ..., 7, 8 tenham de sujeitar-se quela espera. Fazer um histograma dessa distribuio de probabilidade. 2 - Utilizando a tbua de probabilidades binomiais, determinar as seguintes probabilidades: a) 3 sucessos em 9 provas, com p = 0,4; b) 6 falhas em 15 provas, com p = 0,6; c) 5 ou mais sucessos em 8 provas, com p = 0,5; d) entre 7 e 12 (ambos inclusive) sucessos em 15 provas, com p= 0,7. 3 - Se h 0,2 de probabilidade de uma pessoa dar crdito a um rumor sobre a vida pr