Estatística Aplicada - Exercícos Resolvidos

140

Transcript of Estatística Aplicada - Exercícos Resolvidos

Page 1: Estatística Aplicada - Exercícos Resolvidos

Page 2: Estatística Aplicada - Exercícos Resolvidos

104Introdução ao e-learning

FMD_i.p65 15-01-2004, 10:49104

Page 3: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 2

ÍNDICE 1. INTRODUÇÃO .............................................….................................... 4

1.1 Definições Gerais ........................................................................ 5

1.1.1. População 5

1.1.2. Variáveis ou atributos 5

1.1.3. Processo de amostragem 5

1.2 A Estatística Descritiva e a Estatística Indutiva .............…...... 6

2. ESTATÍSTICA DESCRITIVA .............................................…................... 8

2.1 Variáveis Qualitativas ................................................................. 8

2.2 Variáveis Quantitativas Discretas ............................................. 9

2.3 Variáveis Quantitativas Contínuas ............................................ 10

2.4 Medidas de Localização ............................................................. 11

2.4.1. Média 11

2.4.2. Mediana 12

2.4.3. Moda 13

2.5 Medidas de Ordem ...................................................................... 13

2.6 Medidas de Assimetria ............................................................... 14

2.7 Medidas de Dispersão ................................................................ 15

2.7.1. Dispersão Absoluta 15

2.7.2. Dispersão Relativa 16

2.8 Análise de Concentração ........................................................... 17

2.8.1. Curva de Lorenz 17

2.8.2. Índice de Gini 18

2.9 Estatística Descritiva Bidimensional ........................................ 19

Page 4: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 3

3. ESTATÍSTICA INDUTIVA .............................................…...................... 45

3.1 Noções básicas de probabilidades ........................................... 45

3.2 Probabilidade condicionada ...................................................... 48

3.3 Funções de Probabilidade ........................................….............. 49

3.4 Estimação por Intervalos ..........................................….............. 76

3.5 Testes de hipóteses ..................................................….............. 89

3.6 Aplicações Estatísticas: Fiabilidade ......................................... 105

3.6.1. Conceito de fiabilidade 105

3.6.2. Fiabilidade de um sistema 105

3.7 Aplicações Estatísticas: Controlo Estatístico de Qualidade .. 110

3.8 Aplicações Estatísticas: Tratamento Estatístico de Inquéritos . 114

3.8.1. Teste de independência do qui-quadrado 114

Page 5: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 4

"A estatística é a técnica de torturar os números até que eles confessem". Autor desconhecido

1. INTRODUÇÃO Inicialmente, a actividade estatística surgiu como um ramo da Matemática.

Limitava-se ao estudo de medições e técnicas de contagem de fenómenos

naturais e ao cálculo de probabilidades de acontecimentos que se podiam

repetir indefinidamente. Actualmente, os métodos estatísticos são utilizados em

muitos sectores de actividade, tendo como algumas aplicações estudos de

fiabilidade, pesquisas de mercado, testes de controle de qualidade, tratamento

de inquéritos, sondagens, modelos econométricos, previsões, etc.

Exemplo de uma estatística: os valores da inflação entre 1980 e 1990

constituem uma estatística. Fazer estatística sobre estes dados poderia

consistir, por exemplo, em traçar gráficos, calcular a inflação média trimestral

ou prever a inflação para 1991.

A análise de um problema estatístico desenvolve-se ao longo de várias fases

distintas:

(i) Definição do Problema

Saber exactamente aquilo que se pretende pesquisar; estabelecer o

objectivo de análise e definição da população

(ii) Amostragem e Recolha de Dados

Fase operacional. É o processo de selecção e registo sistemático de dados,

com um objectivo determinado. Os dados podem ser primários (publicados

pela própria pessoa ou organização) ou secundários (quando são

publicados por outra organização).

(iii) Tratamento e Apresentação dos Dados

Resumo dos dados através da sua contagem e agrupamento. É a

classificação de dados, recorrendo a tabelas ou gráficos.

Page 6: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 5

(iv) Análise e Interpretação dos Dados

A última fase do trabalho estatístico é a mais importante e delicada. Está

ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidade

principal é descrever o comportamento do fenómeno em estudo (estatística

descritiva). Na estatística indutiva a interpretação dos dados se

fundamentam na teoria da probabilidade.

1.1. Definições Gerais

1.1.1. População

Fazer estatística pressupõe o estudo de um conjunto de objectos bem

delimitado com alguma característica em comum sobre os quais observamos

um certo número de atributos designados por variáveis.

Exemplo: Empresas existentes em Portugal

1.1.2. Variáveis ou atributos As propriedades de uma população são estudadas observando um certo

número de variáveis ou atributos. As variáveis podem ser de natureza

qualitativa ou quantitativa. As variáveis quantitativas podem ainda dividir-se

entre discretas e contínuas. As variáveis discretas assumem apenas um

número finito numerável de valores. As variáveis contínuas podem assumir um

número finito não numerável ou um número infinito de valores.

Exemplo: um conjunto de empresas pode ser analisado em termos de sector

de actividade (atributo qualitativo), número de trabalhadores (atributo

quantitativo discreto), rácio de autonomia financeira (atributo quantitativo

contínuo), etc

1.1.3. Processo de amostragem Para conhecer de forma completa a população, podem efectuar-se:

Page 7: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 6

- recenseamentos (indagação completa de todos os elementos da

população); este processo é, no entanto, tipicamente moroso e

dispendioso, sendo esses os motivos porque os Censos são realizados

apenas em cada 10 anos.

- estudos por amostragem (observação de apenas um subconjunto, tido

como representativo do universo). As técnicas de recolha de amostras

garantem a sua representatividade e aleatoriedade.

1.2. A Estatística Descritiva e a Estatística Indutiva

Para além do ramo de amostragem, a estatística compreende dois grandes

ramos: a estatística descritiva e a estatística indutiva.

A estatística descritiva é o ramo da estatística que se encarrega do tratamento

e análise de dados amostrais. Assim, depois de recolhida a amostra de acordo

com técnicas que garantem a sua representatividade e aleatoriedade, fica

disponível um conjunto de dados sobre o universo “em bruto” ou não

classificados. Para que seja possível retirar qualquer tipo de conclusões, torna-

se necessário classificar os dados, recorrendo a tabelas de frequências e a

representações gráficas, isto é, é preciso tratar os dados. Depois de tratados,

será possível proceder à análise dos dados através de várias medidas que

descrevem o seu comportamento: localização, dispersão, simetria dos dados,

concentração, etc. São disso exemplo indicadores numéricos bem conhecidos

como a média ou a variância.

A estatística indutiva é o ramo da estatística que se ocupa em inferir das

conclusões retiradas sobre a amostra para a população. De facto, a amostra

não é mais do que um passo intermédio e exequível de obter informações

sobre o verdadeiro objecto de estudo, que é o universo. A estatística indutiva

(ou inferência estatística) garante a ligação entre amostra e universo: se algo

se concluiu acerca da amostra, até que ponto é possível afirmar algo

semelhante para o universo? É nesta fase que se procuram validar as

hipóteses formuladas numa fase prévia exploratória. Claro que o processo de

Page 8: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 7

indução implica um certo grau de incerteza associado à tentativa de

generalização de conclusões da “parte” (amostra) para o “todo” (universo). O

conceito de probabilidade vai ter aqui, então, um papel fundamental. Isto é, não

vai ser possível afirmar com toda a certeza que o comportamento da amostra

ilustra perfeitamente o comportamento do universo, mas apenas que o faz com

forte probabilidade. As inferências indutivas são assim elaboradas medindo, ao

mesmo tempo, o respectivo grau de incerteza. Daí que, na ficha das técnicas

das sondagens eleitorais, por exemplo, apareçam referências ao “nível de

confiança” associado aos resultados e ao “erro” cometido.

O esquema seguinte ilustra a “roda” da disciplina de estatística, relacionando

os seus diferentes ramos:

POPULAÇÃO OU UNIVERSO

Amostragem

TRATAMENTO E ANÁLISE DA AMOSTRA

Estatística Descritiva

InferênciaEstatística

INFERIR DA AMOSTRA PARA O UNIVERSO

Gráficos; tabelas; medidas descritivas

Previsões Estimação

Erros

AMOSTRA

Page 9: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 8

2. ESTATÍSTICA DESCRITIVA

Os resultados da observação de um atributo sobre os elementos do conjunto a

analisar constituem os dados estatísticos. O ramo da estatística que se ocupa

do tratamento, apresentação e análise de dados amostrais denomina-se de

estatística descritiva.

2.1. Variáveis Qualitativas

Os dados qualitativos são organizados na forma de uma tabela de frequências,

que representa o número ni de elementos de cada uma das categorias ou

classes e que é chamado de frequência absoluta. A soma de todas as

frequências é igual à dimensão da amostra (n).

Numa tabela de frequências, além das frequências absolutas, também se

apresentam as frequências relativas (fi), obtida dividindo a frequência absoluta

pelo número total de observações.

Modalidades Frequências absolutas Frequências relativas Mod. 1 n1 f1

Mod. j nj fj

Mod. n nn fn Total n: dimensão da amostra 1

nni

fi = ; ni: nº de vezes que cada modalidade da variável foi observada.

Page 10: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 9

Estes dados podem também ser representados graficamente através de:

Diagrama de barras

Para cada modalidade, desenha-se uma barra de altura igual à frequência

absoluta ou relativa (as frequências relativas são de preferir, pois permitem a

comparação de amostras de diferentes dimensões).

Diagrama sectorial ou circular

Esta representação é constituída por um círculo, em que se apresentam tantas

“fatias” quantas as modalidades em estudo. O ângulo correspondente a cada

modalidade é proporcional às frequências das classes, fazendo corresponder o

total da amostra (n) a 360º Geralmente, juntamente com a identificação da

modalidade, indica-se a frequência relativa respectiva.

2.2. Variáveis Quantitativas Discretas São variáveis que assumem um número finito ou infinito numerável de valores.

A apresentação destas amostras é semelhante às variáveis qualitativas,

fazendo-se uma tabela de frequências e uma representação gráfica recorrendo

ao diagrama de barras.

Valores da variável Frequências absolutas Frequências relativas

X1 n1 f1

Xj nj fj

Xn nn fn Total n: dimensão da amostra 1

Também é possível calcular as frequências (absolutas – Ni - e relativas - Fi)

acumuladas, como se pode ver no exemplo:

Nº defeituosos (X) Nº embalagens (ni) % embalagens (fi) Ni Fi

0 80 40% 80 40% 1 60 30% 80+60 40%+30% 2 30 15% 170 85% 3 20 10% 190 95% 4 10 5% 200 100%

Total 200 1

Page 11: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 10

2.3. Variáveis Quantitativas Contínuas

Como foi dito anteriormente, uma variável (ou atributo) é contínua quando

assume um número infinito não numerável de valores, isto é, podem assumir

qualquer valor dentro de um intervalo.

Neste caso, a construção da tabela compreende duas etapas:

(i) Definição de classes de valores disjuntas, correspondentes a intervalos de

números reais fechados à esquerda e abertos à direita, cuja constituição

obedece a certas regras

(ii) Contagem das observações pertencentes a cada classe

Regra de construção de classes (pressupõe a formação de classes de igual amplitude)

- Número de classes a constituir Depende de n = dimensão da amostra Se n≥25, o número de classes a constituir deve ser 5 Se n<25, o número de classes a constituir deve ser n

- Amplitude comum a todas as classes Sendo a amplitude total dos dados dada pela diferença entre o valor máximo e o valor mínimo observados, então a amplitude de cada classe será:

Valor máximo da variável observado – Valor mínimo da variável observado Nº de classes a constituir

Classes de

valores da variável Frequências absolutas Frequências relativas

[x1; x2[ n1 f1 [x2; x3[ [x3; x4[ nj fj

[xn-1; xn] n fn

Total n: dimensão da amostra 1

A distribuição de frequências representa-se através de um histograma.

Um histograma é uma sucessão de rectângulos adjacentes, em que a base é

uma classe e a altura a frequência (relativa ou absoluta) por unidade de

amplitude (ni/ai ou fi/ai), sendo a amplitude de cada classe ai=ei-ei-1. A área total

do histograma é a soma das frequências relativas, isto é, 1.

Page 12: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 11

1. Esta distribuição permite visualizar o tipo de distribuição e deve salientar

alguns aspectos mais relevantes desta (moda, classe modal, ...). Como

as classes podem ter amplitudes diferentes, para que todos os

rectângulos (colunas) sejam comparáveis é necessário corrigir as

frequências das classes (calculando as frequências que se teria se a

amplitude de todas as classes fosse igual e igual a 1)

2. É preferível representar o histograma com fi/hi do que com ni/hi uma vez

que deste modo é possível comparar distribuições com diferente número

de observações amostrais.

Também é possível calcular as frequências (absolutas – Ni - e relativas - Fi)

acumuladas.

2.4. Medidas de localização 2.4.1. Média ( X ) É a medida de localização mais usada, sobretudo pela sua facilidade de

cálculo.

Dados não-classificados (não agrupados numa tabela de frequências)

=

=n

iix

nx

1

1 Média aritmética simples

Dados classificados (isto é, agrupados numa tabela de frequências)

Variáveis discretas

==

==n

iiii

n

ii xfxn

nx

11

1Média ponderada dos valores de X

Dados classificados (isto é, agrupados numa tabela de frequências)

Variáveis contínuas

==

==n

iiii

n

ii cfcn

nx

11

1 Média ponderada dos pontos médios das classes

Page 13: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 12

onde ci é o ponto médio de cada classe (2

.sup.lim.inf.lim + )

A média é uma medida de localização que, geralmente, indica o valor central

da distribuição, entendido como o valor em torno do qual se distribuem os

valores observados. Desta forma, a média é muitas vezes utilizada como valor

representativo da amostra.

No entanto, a média tem o grande inconveniente de ser sensível a valores

muito extremados ou aberrantes da distribuição (outliers). Em casos desses, a

média deixa de ser um valor que aparece na parte central da distribuição para

ser “empurrada” para os extremos. Nestes casos, é preferível recorrer à

informação complementar fornecida por outras medidas de localização, como a

moda e a mediana, que se definem a seguir.

2.4.2. Mediana (Me)

A mediana não se calcula a partir do valor de todas as observações, mas a

partir da posição dessas observações.

Dados não-classificados

Se tivermos n valores x1, x2, ... xn

Se n fôr ímpar,

21+= nxMe

Se n fôr par,

2

122

++

=nn xx

Me

Dados classificados

A mediana é o valor tal que Fi = 0,5

Variáveis discretas

Se existe um valor de xi para o qual Fi = 0,5, então fala-se em intervalo

mediano.

Page 14: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 13

Se não existe nenhum valor de xi para o qual Fi = 0,5, então a mediana é

o primeiro valor para o qual Fi > 0,5.

Variáveis contínuas

Em geral, determina-se o valor para o qual Fi = 0,5 através de uma regra

de três simples, atendendo a que as frequências acumuladas variam

uniformemente dentro de cada classe.

De uma forma geral:

medianaclassexampFLFL

FLLMe .

infsupinf5.0

inf−

−+=

2.4.3. Moda (Mo)

Variáveis discretas

A moda é valor de X para o qual fi é máximo, isto é, é o valor mais

frequente da distribuição.

Variáveis contínuas

A classe modal é a classe de valores de X para o qual fi/hi é máximo,

isto é, é a classe a que corresponde maior frequência por unidade de

amplitude.

2.5. Medidas de ordem Tal como se definiu para a mediana, é possível definir outros valores de

posição ou valores separadores da distribuição em partes iguais.

Chama-se quantil de ordem p ao valor de x a que corresponde Fi = p.

- Se p=0,01; 0,02;.....0,99, chama-se ao quantil percentil

- Se p=0,1; 0,2;...0,9, chama-se ao quantil decil

- Se p=0,25, 0,5, 0,75, chama-se ao quantil QUARTIL (Q1, Q2 e Q3). A

mediana é uma caso particular dos quartis (coincide com Q2)

Variável discreta

O quantil de ordem p é o primeiro valor de x para o qual i>p.

Page 15: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 14

Variável contínua

Calcula-se por uma regra de três simples, como a mediana.

De uma forma geral:

1.infsup

inf25.0inf1 Qclassexamp

FLFLFL

LQ−

−+=

3.infsup

inf75.0inf3 Qclassexamp

FLFLFL

LQ−

−+=

A representação gráfica destas medidas designa-se de diagrama de

extremos e quartis e serve para realçar algumas características da amostra.

Os valores da amostra compreendidos entre os 1º e 3º quartis são

representados por um rectângulo (caixa) com a mediana indicada por uma

barra. Seguidamente, consideram-se duas linhas que unem os meios dos

lados do rectângulo com os extremos da amostra.

A partir deste diagrama, pode reconhecer-se a simetria ou enviesamento dos

dados e a sua maior ou menor concentração:

2.6. Medidas de assimetria A assimetria é tanto maior quanto mais afastados estiverem os valores da

média, mediana e moda. Concretamente, se:

− X = Me = Mo, a distribuição diz-se simétrica

− X > Me > Mo, a distribuição diz-se assimétrica positiva (ou enviesada à

esquerda)

− X < Me < Mo, a distribuição diz-se assimétrica negativa (ou enviesada à

direita)

Coeficiente de assimetria de Bowley (g’): 13

)12()23(QQ

QQQQ−

−−−

Se g’ = 0 ..............a distribuição é simétrica positiva ou equilibrada

Os quartis estão à mesma distância da mediana.

Se g’ > 0 ..............a distribuição é assimétrica positiva ou “puxada” para

25% maiores

Page 16: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 15

a esquerda (se fôr = 1, assimetria é máxima)

A mediana desliza para o lado do Q1,

logo Q3-Q2 > Q2-Q1

Se g’ < 0 ..............a distribuição é assimétrica negativa ou “puxada” para

a direita (se fôr = -1, assimetria é máxima)

A mediana desliza para o lado do Q3,

logo Q2-Q1 > Q3-Q2

2.7. Medidas de dispersão Duas distribuições podem distinguir-se na medida em que os valores da

variável se dispersam relativamente ao ponto de localização (média, mediana,

moda). Apresentam-se de seguida algumas das mais utilizadas, classificadas

consoante a medida de localização usada para referenciar a dispersão das

observações:

2.7.1 Medidas de dispersão absoluta

(i) Em relação à mediana

Amplitude inter-quartis = Q = Q3 – Q1

Significa que 50% das observações se situam num intervalo de

amplitude Q. Quanto maior (menor) a amplitude do intervalo, maior

(menor) a dispersão em torno da mediana.

(ii) Em relação à média

Variância amostral: mede os desvios quadráticos de cada valor

observado em relação à média, havendo pouca dispersão se os desvios

forem globalmente pequenos, e havendo muita dispersão se os desvios

forem globalmente grandes.

Q1 Q2 Q3

Assimétrica positiva

Assimétrica negativa

Q1 Q2 Q3

Page 17: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 16

Dados não-classificados

( )2

1

2 1

=

−=n

i

xxin

s

Dados classificados

Variáveis discretas

( ) ( )==

−=−=n

i

n

i

xxifixxinin

s1

22

1

2 1

Dados classificados

Variáveis contínuas

( ) ( )==

−=−=n

i

n

i

xcifixcinin

s1

22

1

2 1

onde ci é o ponto médio de cada classe i.

Desvio-padrão: Medida de dispersão com significado real, mas que só é

possível calcular indirectamente, através da raiz quadrada da variância.

Está expressa nas mesmas unidades da variável.

2.7.2 Medidas de dispersão relativa

Muitas vezes, avaliar a dispersão através de um indicador de dispersão

absoluta não é conveniente, assim como comparara a dispersão de duas

distribuições, uma vez que estas medidas vêm expressas na mesma unidade

da variável – como é o caso, por exemplo, da variância. Assim, é de esperar

que os valores da variância sejam mais elevados quando os valores da variável

são maiores, o que não significa que a distribuição seja muito dispersa. Para

comparar diferentes distribuições de frequência são precisas medidas de

dispersão relativa:

definidaestáqualàrelaçãoemolocalizaçãdeMedidaabsolutaDispersão

relativaDispersão =

Page 18: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 17

Coeficiente de variação

xs

CV = x100%

Outras medidas

213

QQQ −

Estas medidas não estão expressas em nenhuma unidade, e permitem

comparar dispersões entre duas amostras, pois não são sensíveis à escala

(eventualmente diferente) em que as variáveis estejam expressas.

2.8. Análise da concentração

A noção de concentração apareceu associada ao estudo de desigualdades

económicas, como a repartição do rendimento ou a distribuição de salários. O

fenómeno de concentração está relacionado com a variabilidade ou dispersão

dos valores observados, apesar de não poder ser analisado através das

medidas de dispersão atrás descritas, que apenas medem a dispersão dos

valores em relação a um ponto. O objectivo é determinar como o atributo

(rendimento, salários, número de empresas) se distribui (se de forma mais ou

menos uniforme) pelos diferentes indivíduos da amostra (que devem ser

susceptíveis de serem adicionados, isto é, a análise de concentração não se

aplica a idade, altura, peso, etc).

Se o atributo estiver igualmente repartido pelos indivíduos, temos uma situação

extrema de igual distribuição; e vice-versa de o atributo estiver concentrado

num só indivíduo, temos uma situação extrema de máxima concentração. Em

geral, interessa medir o grau de concentração em situações intermédias.

Para analisar a concentração, existem dois instrumentos: a Curva de Lorenz e o Índice

de Gini.

2.8.1 Curva de Lorenz

Page 19: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 18

O objectivo é comparar a evolução das frequências acumuladas (Fi = pi) com a

evolução da soma dos valores da variável (qi)

Quadro de dados

Classes de valores da variável ni Quantidade

atributo Freq.relativa acumuladas

Proporção atrib.acumul,

[x1; x2[ n1 yi p1 q1 [x2; x3[ [x3; x4[ nj yj pj qj

[xn-1; xn[ nn yn pn=1 qn=1

Total n Os pontos (pi;qi) pertencem ao quadrado (0,1) por (0,1). A curva que os une é

a curva de Lorenz. Se houver igual distribuição, a frequência das observações

deve ter uma evolução igual à proporção do atributo correspondente, isto é,

pi=qi. Nesse caso, a curva de Lorenz coincide com a diagonal do quadrado,

que é designada de recta de igual repartição. Quanto mais a curva se afastar

da recta, maior é a concentração. A zona entre a diagonal e acurva de Lorenz

designa-se, por isso, de zona de concentração.

2.8.2 Índice de Gini

O índice de Gini é calculado pela seguinte expressão

=

=

−= 1

1

1

1

)(

n

i

n

i

pi

qipiG

Quando G = 0, a concentração é nula, havendo igual repartição. Caso o valor

de G seja 1, a concentração será máxima. O valor de G varia entre 0 e 1, e

quanto maior o seu valor, maior a concentração.

Page 20: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 19

2.9. Estatística Descritiva Bidimensional Numa situação em que se observam pares de valores (xi; yj), pode ter interesse

estudar as relações porventura existentes entre os dois fenómenos,

nomeadamente relações estatísticas. Não se trata de estudar relações

funcionais (isto é, a medida em que o valor de uma variável é determinado

exactamente pela outra), mas sim de estudar a forma como a variação de uma

variável poderá afectar a variação da outra, em média. (por exemplo, o peso e

a altura normalmente estão relacionados, mas a relação não é determinística).

Duas variáveis ligadas por uma relação estatística dizem-se correlacionadas.

Se as variações ocorrem, em média ou tendencialmente, no mesmo sentido, a

correlação diz-se positiva. Se ocorrem em sentidos opostos, a correlação diz-

se negativa.

Trata-se então de estudar se:

- Se existe alguma correlação entre os fenómenos ou variáveis

observadas

- A existir, se é traduzível por alguma lei matemática, nem que

tendencialmente

- A existir, se é possível medi-la

Por vezes, a representação gráfica do conjunto de dados bivariados sugere o

ajustamento de uma recta a este conjunto de pontos, indicando a existência de

uma tendencial correlação linear entre as duas variáveis, como é o caso do

exemplo atrás descrito. A essa recta chama-se recta de regressão de y sobre

x, que permite descrever como se reflectem em y (variável dependente ou

explicada) as modificações processadas em x (variável independente ou

explicativa). Essa recta torna possível, por exemplo, inferir (em média) a altura

de um indivíduo, conhecendo o respectivo peso.

Um dos métodos mais conhecidos de ajustar uma recta a um conjunto de

dados é o Método dos Mínimos Quadrados, que consiste em determinar a recta

que minimiza a soma dos quadrados dos desvios entre os verdadeiros valores

de y e os obtidos a partir da recta que se pretende ajustar. Obtém-se assim a

Page 21: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 20

recta de regressão ou recta dos mínimos quadrados. Assim, se a recta de

regressão obedecer à seguinte fórmula geral:

y = a + bx

o método permite minimizar a soma dos desvios quadráticos yi - (a + bxi).

Assim sendo, obtém-se:

−= 22 xnx

yxnyxb

i

ii e xbya −=

Matematicamente, b designa o declive da recta. Em termos estatísticos, b

corresponde ao coeficiente de regressão de y sobre x, que indica a variação

média de y que acompanha uma variação unitária de x.

O valor de a designa a ordenada na origem, isto é, o valor que y assume

quando x=0.

Quando, quer através do diagrama de dispersão, quer através da recta de

regressão, se verifica a existência de uma associação linear entre as variáveis,

pode-se medir a maior ou menor força com que as variáveis se associam

através do coeficiente de correlação linear r:

))((,1

yyxxsss

sr i

n

iixy

yyxx

xy −−== =

Este indicador da correlação tem a vantagem de não depender das unidades

ou da ordem de grandeza em que as variáveis estão expressas. O coeficiente

de correlação linear está sempre compreendido entre –1 e 1.

Se r > 0, então pode dizer-se que existe uma correlação positiva entre as

variáveis, isto é, as variáveis variam no mesmo sentido: um aumento

(diminuição de x) provoca um aumento (diminuição) de y, mas menos que

proporcional.

Page 22: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 21

Se r < 0, então pode dizer-se que existe uma correlação negativa entre as

variáveis, isto é, as variáveis variam em sentidos opostos: um aumento

(diminuição de x) provoca uma diminuição (aumento) de y, mas menos que

proporcional.

Se r = 0, então pode dizer-se que as variáveis não estão correlacionadas

linearmente.

Antes de se efectuar um estudo de correlação, deve-se procurar justificação

teórica para a existência ou inexistência de correlação. Caso contrário, poderá

acontecer que variáveis sem relação de causalidade entre si, variem num certo

sentido por razões exteriores. A esta correlação ilusória, chama-se correlação

espúria.

Nos extremos, se r = 1 ou se r = -1, então pode dizer-se que existe uma

correlação positiva ou negativa perfeita, respectivamente, entre as variáveis,

isto é, uma variação numa variável provoca na outra uma variação

exactamente proporcional no mesmo sentido ou em sentido contrário. Isto é, a

correlação é máxima.

Correlação ordinal Por vezes, as variáveis vêm expressas numa escala ordinal, isto é, interessa

mais conhecer a ordenação dos valores do que os valores observados

propriamente ditos. Neste caso, em vez do coeficiente de correlação linear,

calcula-se o coeficiente de correlação ordinal:

yi

xii

n

ii

s RRdnn

dr −=

−−=

= ,

)1(61 2

1

2

Ordens (“ranks”) das observações de X e

de Y, respectivamente

Page 23: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 22

ESTATÍSTICA DESCRITIVA Exercícios resolvidos Exercício 1

Considere a distribuição de 1000 empresas de um sector de actividade

segundo os resultados líquidos (em milhares de u.m.):

Resultado Líquido Frequência. Relativa (%)

[0; 1[ 10 [1; 3[ 25 [3; 5[ 35

[5; 15[ 15 [15; 25[ 10 [25; 50[ 5

Total 100

a) Represente a distribuição graficamente.

b) Determine a média e a moda da distribuição. Qual o significado dos

valores encontrados?

c) Calcule as frequências acumuladas e represente-as graficamente.

Determine a mediana da distribuição.

d) Determine os quartis da distribuição. Faça a sua representação gráfica.

e) Analise a (as)simetria da distribuição em causa.

f) Analise a concentração através do Índice de Gini e da Curva de Lorenz.

Resolução a)

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0,16

0,18

0,2

0 10 20 30 40 50 60

fi/hi

Page 24: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 23

b) 325,7%)55.37(...%)252(%)105,0(1

11

=+++=== ==

xxxcfcnn

xn

iiii

n

ii

Em média, o resultado líquido de uma empresa é de 7325 unidades

monetárias.

A classe modal é aquela a que corresponde maior frequência por unidade de

amplitude. Neste caso, o maior valor de fi / hi é 0,175. correspondente à classe

[3; 5[, isto é, os valores de resultado líquido mais prováveis para uma empresa

situam-se entre 3000 u.m. e 5000 u.m.

c) A representação gráfica das frequências acumuladas (ver tabela) designa-se

de polígono integral:

Classe mediana (classe a que corresponde uma frequência acumulada 0,5): [3; 5[

3 : Fi=0,35

5 : Fi = 0,7

Fi

0

0,2

0,4

0,6

0,8

1

0 20 40 60 80 100 120

X fi hi fi/hi Fi ci [0; 1[ 10% 1 0.1 10% 0.5 [1; 3[ 25% 2 0.125 35% 2

[3; 5[ 35% 2 0.175 70% 4 [5; 15[ 15% 10 0.015 85% 10

[15; 25[ 10% 10 0.01 95% 20 [25; 50] 5% 25 0.002 100% 37.5

Total 1

Page 25: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 24

Cálculo da mediana:

0,7 - 0,35 ------------ 5 - 3

0,5 – 0,35 -------------- Me – 3

Me = 3 + ((2x0,15)/0,35) = 3,857

50% das empresas apresentam resultados líquidos inferiores a 3857 u.m.

d) Classe a que pertence Q1 (classe a que corresponde uma frequência

acumulada 0,25): [1; 3[

1 : Fi=0,1

3 : Fi = 0,35

Cálculo do Q1:

0,35 - 0,1 ------------ 3 - 1

0,25 – 0,1 -------------- Q1 – 1

Q1 = 1 + ((2x0,15)/0,25) = 2,2

25% das empresas apresentam resultados líquidos inferiores a 2200 u.m.

Classe a que pertence Q3 (classe a que corresponde uma frequência

acumulada 0,75): [5; 15[

5 : Fi=0,7

15 : Fi = 0,85

Cálculo do Q3:

0,85 - 0,7 ------------ 15 - 5

0,75 – 0,7 -------------- Q3 – 5

Q3 = 5 + ((10x0,05)/0,15) = 8,333(3)

75% das empresas apresentam resultados líquidos inferiores a 8333 u.m.

e)

04596,02,2333,8

)2,2857,3()857,3333,8(13

)12()23(' >=

−−−−=

−−−−=

QQQQQQ

g

A distribuição é assimétrica positiva ou enviesada à esquerda.

Page 26: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 25

f) X fi ni ci Atributo pi (=Fi) qi

[0; 1[ 10% 1000x10%=100 0.5 100x0.5=50 0.1 0.007 [1; 3[ 25% 250 2 250x2=500 0.35 0.075 [3; 5[ 35% 350 4 1400 0.7 0.266

[5; 15[ 15% 150 10 1500 0.85 0.471 [15; 25[ 10% 100 20 2000 0.95 0.744 [25; 50[ 5% 50 37.5 1875 1 1

Total 1 n=1000 7325

47,095,085,07,035,01,0

)744,095,0(...)007,01,0( =++++−++−=G

A distribuição dos resultados líquidos

apresenta concentração média (G=0,5

corresponde ao centro da escala

possível, entre 0 e 1). Por exemplo,

70% das empresas apresentavam

resultados até 5000 u.m., mas isso

representava apenas 26,6% do total

de resultados das empresas da

amostra, o que sugere um tecido

empresarial com muitas PMEs, mas

em que cada uma tem baixo resultado

líquido.

Exercício 2

Considere a seguinte amostra de dimensão 200, referente aos lucros obtidos

por empresas de um dado sector industrial, expressas numa determinada

unidade monetária.

Analise a concentração através do Índice de Gini e da Curva de Lorenz.

Res.Liq.Totais

7325140050050 ++

Curva de Lorenz

0

0,2

0,4

0,6

0,8

1

0 0,2 0,4 0,6 0,8 1

Page 27: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 26

Resolução

Lucros ni Lucro total pi (=Fi) qi [0; 50[ 20 600 0.1 0.02

[50; 100[ 60 4400 0.4 0.16(6) [100; 200[ 80 14000 0.8 0.63(3) [200; 300[ 30 7500 0.95 0.883(3) [300; 500] 10 3500 1 1

Total 200 30000

243,025,2

)6(546,0)(

1

1

1

1 ==−

=

=

=n

i

n

i

pi

qipiG

Tanto pela análise da Curva de Lorenz, como pelo valor do Índice de Gini,

conclui-se que esta amostra apresenta concentração moderada, encontrando-

se os valores razoavelmente repartidos.

Exercício 3

Considere o exemplo abaixo referente ao peso e altura de 10 indivíduos.

a) Represente o diagrama de dispersão.

b) Analise a correlação existente entre peso e altura.

c) Ajuste, pelo Método dos Mínimos Quadrados, uma função linear que

exprima as peso em função da altura.

Curva de Lorenz

0

0,2

0,4

0,6

0,8

1

0 0,2 0,4 0,6 0,8 1

Page 28: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 27

Indivíduo Peso (kg) Altura (cm)

A 72 175 B 65 170 C 80 185 D 57 154 E 60 165 F 77 175 G 83 182 H 79 178 I 67 175 J 68 173

Resolução a)

b) No exemplo, r = 0,90681871, isto é, existe uma correlação positiva forte

entre as duas variáveis, quase perfeita.

c)

Diagrama de Dispersão

150

160

170

180

190

50 60 70 80 90

Peso (kg)

Altu

ra (c

m)

Recta de Regressão

y = 0,9016x + 109,36

150

160

170

180

190

50 60 70 80 90

Peso (kg)

Altu

ra (c

m)

Page 29: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 28

A equação desta recta traduz-se em

Altura = 109,36 + 0,9016 x Peso

Isto é, se um indivíduo pesar 70 kg, a altura esperada será de 109,36 + 0,9016

x 70 = 172,472.

Por cada kg de peso adicional, espera-se que a altura do indivíduo aumente

0,9016 cm.

Exercício 4

O quadro abaixo apresenta as vendas e as despesas em publicidade (ambas

em milhares de u.m.) de uma empresa no período de 7 anos:

Ano Vendas Desp. Publicidade 1 10 3 2 13 3 3 18 5 4 19 6 5 25 8 6 30 9 7 35 13

a) Compare as vendas e as despesas em publicidade quanto à dispersão.

b) Analise a correlação existente entre volume e custo de produção.

c) Ajuste, pelo Método dos Mínimos Quadrados, uma função linear que

exprima as vendas em função das despesas em publicidade.

Resolução a) Para comparar a dispersão das duas distribuições, é necessário calcular os

coeficientes de variação (medidas de dispersão relativa):

Dados não-classificados

429,211

1

== =

n

iix

nx 714,6

1

1

== =

n

iiy

ny

( ) 9408,691 2

1

2 =−= =

n

ix xxi

ns ( ) 0651,11

1 2

1

2 =−= =

n

iy yyi

ns

39,0429,219408,69

===xs

CV xx < 495,0

714,60651,11

===y

sCV y

y

A dispersão das despesas em publicidade é superior à dispersão das vendas.

Page 30: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 29

b)

( )( ) ( )( )[ ]98,0

0651,119408,69

714,613429,2135...714,63429,211071

=−−++−−

==xss

sr

yyxx

xy

Existe uma correlação positiva linear forte entre as duas variáveis. Em média,

quando as despesas em publicidade aumentam (diminuem), as vendas

aumentam (diminuem) de forma quase exactamente proporcional.

c)

Exercício 5

Considere que 10 estudantes foram sujeitos a uma prova de avaliação no início

e no final do curso. No quadro abaixo, encontram-se as ordenações desses 10

estudantes segundo as classificações obtidas em cada uma das provas:

Aluno Prova inicial Ri

x Prova final

Riy

di Ri

x - Riy

A 1 1 0 B 3 2 1 C 2 3 -1 D 5 4 1 E 7 6 1 F 8 8 0 G 9 7 2 H 10 9 1 I 6 10 -4 J 4 5 -1

Recta de Regressão

y = 2,4649x + 4,8782

0

10

20

30

3 8 13

Desp. Public.

Ven

das

Page 31: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 30

Resolução

Como não dispomos das classificações dos alunos, mas sim das ordenações

das classificações (do 1º ao 10º classificado), para avaliar a correlação

existente entre as 2 provas calcula-se o coeficiente de correlação ordinal:

8424,0)1100(10

)11614011110(61

)1(61 2

1

2

=−

+++++++++−=−

−=

=

xx

nn

dr

n

ii

s

A correlação é positiva e elevada (rs varia entre –1 e 1), isto é, os alunos que

tiveram boa nota na prova inicial tiveram, em média, igualmente boa nota na

prova final.

Exercício 6

O quadro que se segue descreve a distribuição do rendimento anual (em

milhares de u.m.) de 2500 famílias da população de um país:

Rendimento anual Nº de famílias [0, 1[ 250 [1, 2[ 375 [2, 5[ 625

[5, 15[ 750 [15, 25[ 375 [25, 50[ 125

a) Represente as frequências acumuladas graficamente.

b) Determine o rendimento médio e mediano.

c) Determine os três primeiros quartis. Que indicações lhe dão sobre a

(as)simetria?

d) O que pode concluir quanto à dispersão?

e) Calcule o índice de Gini. O que conclui sobre a concentração do

rendimento?

Resolução a)

Rendimento anual Nº de famílias % de famílias Fi (%) ci [0, 1[ 250 10 10 0.5 [1, 2[ 375 15 25 1.5 [2, 5[ 625 25 50 3.5

[5, 15[ 750 30 80 10 [15, 25[ 375 15 95 20 [25, 50[ 125 5 1 37.5

Page 32: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 31

b) 025,9%)55.37(...%)155.1(%)105,0(1

11

=+++=== ==

xxxcfcnn

xn

iiii

n

ii

Em média, o rendimento anual de uma família é de 9025 unidades monetárias.

Classe mediana (classe a que corresponde uma frequência acumulada 0,5): [2; 5[

5 : Fi = 0,5. Logo, a mediana é 5 (50% das famílias têm rendimentos anuais até

5000 unidades monetárias).

c) Classe a que pertence Q1 (classe a que corresponde uma frequência

acumulada 0,25): [1; 2[

3 : Fi = 0,25

25% das famílias apresentam rendimentos anuais inferiores a 2000 u.m.

Classe a que pertence Q3 (classe a que corresponde uma frequência

acumulada 0,75): [5; 15[

5 : Fi=0,5

15 : Fi = 0,8

Cálculo do Q3:

0,8 - 0,5 ------------ 15 - 5

0,75 – 0,5 -------------- Q3 – 5

Q3 = 5 + ((10x0,25)/0,3) = 13,333(3)

75% das famílias apresentam rendimentos anuais inferiores a 13333 u.m.

0

0,2

0,4

0,6

0,8

1

0 10 20 30 40 50 60 70 80 90 100

Page 33: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 32

047,02333,13

)25()5333,13(13

)12()23(' >=

−−−−=

−−−−=

QQQQQQ

g

A distribuição é assimétrica positiva ou enviesada à esquerda.

d) ( ) 286875,82*2

1

22

1

2 =−=−= ==

xficixcifisn

i

n

ix

071,9286875,822 === xx ss

e)

Rendimento anual ni ci Rend. total pi (=Fi) qi [0, 1[ 250 0.5 125 0,1 0.00554 [1, 2[ 375 1.5 562,5 0,25 0.0305 [2, 5[ 625 3.5 2187,5 0,5 0.1274

[5, 15[ 750 10 7500 0,8 0.46 [15, 25[ 375 20 7500 0,95 0.7922 [25, 50[ 125 37.5 4687.5 1 1

Total 2500 22562,5

4555,06,2

18436,1)(

1

1

1

1 ==−

=

=

=n

i

n

i

pi

qipiG Concentração moderada do rendimento

Exercício 7

Considere a seguinte tabela que representa a distribuição dos empregados de

uma instituição bancária segundo a remuneração bruta mensal (em milhares de

unidades monetárias):

Remuneração Frequência. Relativa (%)

[60; 80[ 7.8 [80; 100[ 15.2

[100; 120[ 31.2 [120; 140[ 19.5 [140; 160[ 7.2 [160; 200[ 8.1 [200; 250[ 5.4 [250, 300[ 2.6 [300; 350] 3.0

Total 100

Page 34: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 33

a) Calcule os quartis da distribuição.

b) Analise a dispersão da distribuição em causa.

c) Analise a assimetria da distribuição em causa.

Resolução a)

Remuneração Frequência. Relativa (%) Fi (%)

[60; 80[ 7.8 7.8 [80; 100[ 15.2 23

[100; 120[ 31.2 54.2 [120; 140[ 19.5 73.7 [140; 160[ 7.2 80.9 [160; 200[ 8.1 89 [200; 250[ 5.4 94.4 [250, 300[ 2.6 97 [300; 350] 3.0 100

Total 100 Classe a que pertence Q1 (classe a que corresponde uma frequência acumulada

0,25): [100; 120[

1 : Fi=0,23

3 : Fi = 0,542

Cálculo do Q1:

0,542 - 0,23 ------------ 120 - 100

0,25 - 0,23 -------------- Q1 - 100

Q1 = 100 + ((20x0,02)/0,312) = 101,28

25% dos empregados auferem remunerações inferiores a 101,28 milhares u.m.

Classe a que pertence Q2 (classe a que corresponde uma frequência acumulada

0,5): [100; 120[

100 : Fi=0,23

120 : Fi = 0,542

Cálculo do Q2:

0,542 - 0,23 ------------ 120 - 100

0,5 - 0,23 -------------- Q2 - 100

Q2 = 100 + ((20x0,27)/0,312) = 117,3

50% dos empregados auferem remunerações inferiores a 117,3 milhares u.m.

Page 35: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 34

Classe a que pertence Q3 (classe a que corresponde uma frequência

acumulada 0,75): [140; 160[

120 : Fi=0,737

140 : Fi = 0,809

Cálculo do Q3:

0,809 - 0,737 ------------ 160 - 140

0,75 – 0,737 -------------- Q3 - 140

Q3 = 140 + ((20x0,013)/0,072) = 143,61(1)

75% dos empregados auferem remunerações inferiores a 143,61(1) milhares u.m.

b) Amplitude do intervalo inter-quartis = Q3 - Q1 = 143,61(1) - 101,28 = 42,33

(dispersão reduzida em torno da mediana)

c) 0243,028,10161,143

)28,1013,117()3,11761,143(13

)12()23(' >=

−−−−=

−−−−=

QQQQQQ

g

A distribuição é assimétrica positiva ou enviesada à esquerda.

Exercício 8

Os dados seguintes referem-se ao peso, expresso em gramas, do conteúdo de

uma série de 100 garrafas que, no decurso de um teste, saíram de uma linha

de enchimento automático:

Peso (em gramas) Frequência. Relativa (%)

[297; 298[ 8 [298; 299[ 21 [299; 300[ 28 [300; 301[ 15 [301; 302[ 11 [302; 303[ 10 [303; 304[ 5 [304; 305[ 1 [305; 306] 1

Total 100 a) Represente graficamente os dados acima.

b) Calcule as frequências acumuladas e represente-as graficamente.

Page 36: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 35

c) Determine o peso médio, mediano e modal. Qual o seu significado?

d) Determine os quartis da distribuição.

e) Analise a dispersão do peso das garrafas.

Resolução a)

b)

Peso (em gramas) Frequência Relativa (%) Fi (%) [297; 298[ 8 8 [298; 299[ 21 29 [299; 300[ 28 57 [300; 301[ 15 72 [301; 302[ 11 83 [302; 303[ 10 93 [303; 304[ 5 98 [304; 305[ 1 99 [305; 306] 1 100

Total 100

c)

11,300%)15,305(...%)215,298(%)85,297(1

11

=+++=== ==

xxxcfcnn

xn

iiii

n

ii

O peso médio das garrafas é de 300,11 kg.

0

0,05

0,10,15

0,2

0,25

0,3

296 297 298 299 300 301 302 303 304 305 306 307

Histograma

0

0,2

0,4

0,6

0,8

1

295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310

F*

Page 37: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 36

Classe mediana (classe a que corresponde uma frequência acumulada 0,5): [299;

300[

299 : Fi = 0,29

300 : Fi = 0,57

Cálculo do Q2:

0,57 - 0,29 ------------ 300 - 299

0,5 - 0,29 -------------- Q2 - 299

Q2 = 299 + ((1x0,21)/0,28) = 299,75

50% das garrafas têm peso inferior a 299,75 kg.

A classe modal é aquela a que corresponde maior frequência relativa. Neste

caso, o maior valor de fi é 0,28 correspondente à classe [299; 300[, isto é, os

pesos mais prováveis das garrafas situam-se entre 299 kg e 300 kg.

d) Classe a que pertence Q1 (classe a que corresponde uma frequência

acumulada 0,25): [298; 299[

298 : Fi=0,08

299 : Fi = 0,29

Cálculo do Q1:

0,29 - 0,08 ------------ 298 - 299

0,25 - 0,08 ------------ Q1 - 299

Q1 = 299 + ((1x0,17)/0,21) = 299,0357

25% das garrafas têm peso inferior a 299,0357 kg.

Classe a que pertence Q3 (classe a que corresponde uma frequência

acumulada 0,75): [301; 302[

301 : Fi=0,72

302 : Fi = 0,83

Cálculo do Q3:

0,83 - 0,72 ------------ 302 - 301

0,75 – 0,72 -------------- Q3 - 301

Q3 = 301 + ((1x0,03)/0,11) = 301,27(27)

75% das garrafas têm peso inferior a 301,27(27) kg.

Page 38: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 37

e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 301,27(27) - 299,0357 = 2,237

(dispersão reduzida em torno da mediana)

Exercício 8

Numa faculdade, mediram-se as alturas de 100 alunos do primeiro ano:

Altura (em metros) Nº Alunos [1,4; 1,5[ 2

[1,5; 1,55[ 10 [1,55; 1,6[ 25 [1,6; 1,65[ 13 [1,65; 1,7[ 17 [1,7; 1,75[ 20 [1,75; 1,8[ 10 [1,8; 1,9] 3

Total 100 a) Represente graficamente os dados acima.

b) Determine a altura média e a altura modal. Qual o seu significado?

c) Calcule as frequências acumuladas e represente-as graficamente.

d) Determine os quartis da distribuição e diga qual o seu significado.

e) Analise a dispersão da distribuição.

f) Analise a (as)simetria da distribuição.

Resolução a)

Altura (em metros) ni fi ci hi fi/hi Fi [1,4; 1,5[ 2 0,02 1,45 0,1 0,2 0,02

[1,5; 1,55[ 10 0,1 1,525 0,05 2 0,12 [1,55; 1,6[ 25 0,25 1,575 0,05 5 0,37 [1,6; 1,65[ 13 0,13 1,625 0,05 2,6 0,5 [1,65; 1,7[ 17 0,17 1,675 0,05 3,4 0,67 [1,7; 1,75[ 20 0,2 1,725 0,05 4 0,87 [1,75; 1,8[ 10 0,1 1,775 0,05 2 0,97 [1,8; 1,9] 3 0,03 1,85 0,1 0,3 1

Total 100 1

0

1

23

4

5

6

1,4 1,5 1,6 1,7 1,8 1,9

Histogramafi/hi

Page 39: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 38

b) 65,1%)385,1(...%)10525,1(%)245,1(1

11

=+++=== ==

xxxcfcnn

xn

iiii

n

ii

A altura média dos alunos é de 1,65 m.

A classe modal é aquela a que corresponde maior frequência por unidade de

amplitude. Neste caso, o maior valor de fi / hi é 5. correspondente à classe

[1,55; 1,6[, isto é, a altura mais provável de um aluno rondará 1,55m / 1,6m.

c)

d) Classe a que pertence Q1 (classe a que corresponde uma frequência

acumulada 0,25): [1,55; 1,6[

1,55 : Fi=0,12

1,6 : Fi = 0,37

Cálculo do Q1:

0,37 – 0,12 ------------ 1,6 – 1,55

0,25 – 0,12 ------------ Q1 – 1,55

Q1 = 1,55 + ((0,05x0,13)/0,25) = 1,576

25% dos alunos têm altura inferior a 1,576 m.

Classe a que pertence Q2 (classe a que corresponde uma frequência

acumulada 0,5): [1,6; 1,65[

1,65 : Fi = 0,5

50% dos alunos têm altura inferior a 1,65 m.

Classe a que pertence Q3 (classe a que corresponde uma frequência

acumulada 0,75): [1,7; 1,75[

1,7 : Fi=0,67

1,75 : Fi = 0,87

0

0,2

0,4

0,6

0,8

1

1,3 1,4 1,5 1,6 1,7 1,8 1,9 2

F*

Page 40: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 39

Cálculo do Q3:

0,87- 0,67------------ 1,75 – 1,7

0,75 – 0,67-------------- Q3 – 1,7

Q3 = 1,7 + ((0,05*0,08)/0,2) = 1,72

75% dos alunos têm altura inferior a 1,72 m.

e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 1,72 – 1,576 = 0,144

(dispersão reduzida em torno da mediana)

( ) 00536875,0*2

1

22

1

2 =−=−= ==

xficixcifisn

i

n

ix

07327,000536875,02 === xx ss (dispersão reduzida em torno da média)

f) 0)7(027,0576,172,1

)576,165,1()65,172,1(13

)12()23(' <−=

−−−−=

−−−−=

QQQQQQ

g

A distribuição é ligeiramente assimétrica negativa ou enviesada à direita

(quase simétrica).

Exercício 9

Em determinada central telefónica, registou-se a duração das chamadas

realizadas em Dezembro de 2001:

Duração (em minutos) Nº Chamadas

[0; 5[ 2000 [5; 10[ 1500

[10; 20[ 1000 [20; 30[ 300 [30; 50] 200

Total 5000

a) Represente graficamente as frequências simples e acumuladas.

b) Determine a duração média das chamadas e respectivo desvio-padrão.

c) Qual a duração da chamada mediana? Qual o significado do valor

encontrado?

Page 41: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 40

d) Sabe-se que as chamadas realizadas durante o ano de 2001

apresentaram uma duração média de 10 minutos, com desvio-padrão de

8,7 minutos. Compare, quanto à dispersão, as chamadas efectuadas em

Dezembro com as que tiveram lugar durante todo o ano de 2001.

Resolução a)

Duração (em minutos) ni fi hi fi/hi Fi ci [0; 5[ 2000 0,4 5 0,08 0,4 2,5

[5; 10[ 1500 0,3 5 0,06 0,7 7,5 [10; 20[ 1000 0,2 10 0,02 0,9 15 [20; 30[ 300 0,06 10 0,006 0,96 25 [30; 50] 200 0,04 20 0,002 1 40

Total 5000 1

b) 35,9%)440(...%)305,7(%)405,2(1

11

=+++=== ==

xxxcfcnn

xn

iiii

n

ii

A duração média de uma chamada é de 9,35 minutos.

( ) 4525,81*2

1

22

1

2 =−=−= ==

xficixcifisn

i

n

ix

025,900536875,02 === xx ss

c) Classe mediana (classe a que corresponde frequência acumulada 0,5): [5; 10[

0

0,02

0,04

0,06

0,08

0,1

0 10 20 30 40 50 60

Histogramafi/hi

0

0,2

0,4

0,6

0,8

1

0 10 20 30 40 50 60 70 80 90 100

F*

Page 42: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 41

5 : Fi = 0,4

10 : Fi = 0,7

Cálculo da Me:

0,7 - 0,4 ------------ 10 - 5

0,5 - 0,4 ------------ Me - 5

Me = 5 + ((5x0,1)/0,3) = 6,67

50% das chamadas têm duração a 6,67 minutos.

d) 965,035,9025,9 ===

xs

CV xDez > 87,0

107,8

2001 ===y

sCV y

Exercício 10

Uma empresa coligiu dados relativos à produção de 12 lotes de um tipo especial

de rolamento. O volume de produção e o custo de produção de cada lote

apresentam-se na tabela:

Lote Volume (unidades) Custo (contos) 1 1500 3100 2 800 1900 3 2600 4200 4 1000 2300 5 600 1200 6 2800 4900 7 1200 2800 8 900 2100 9 400 1400

10 1300 2400 11 1200 2400 12 2000 3800

a) Analise a correlação existente entre volume e custo de produção.

b) Ajuste, pelo Método dos Mínimos Quadrados, uma função linear que

exprima o custo em função do volume de produção.

Resolução

a) ( )( ) ( )( )[ ]

98,01145944520854

3,270838003,13582000...3,270831003,13581500121

=−−++−−

==xss

sr

yyxx

xy

Correlação positiva quase perfeita.

Page 43: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 42

b)

Exercício 11

Um conjunto de empresas do sector da Construção e Obras Públicas cotadas

na Bolsa de Valores foram analisadas relativamente aos seguintes indicadores:

EPS (Earnings per Share): Resultado Líquido por Acção

PBV (Price/Book Value): Preço / Situação Líquida por Acção

Empresa EPS ($) PBV ($) 1 191 0.9 2 32 1.0 3 104 0.8 4 117 0.8 5 210 1.5 6 95 0.7 7 65 0.9 8 201 1.3 9 81 0.4

a) Analise a correlação existente entre aqueles dois indicadores.

b) Ajuste, pelo Método dos Mínimos Quadrados, uma função linear que

exprima a variável EPS em função de PBV.

Resolução

a) ( )( ) ( )( )[ ]

61,0096933,0332,3669

92,04,07,12181...92,09,07,12119191

=−−++−−

==xss

sr

yyxx

xy

Correlação positiva moderada.

y = 1,4553x + 731,6

0

1000

2000

3000

4000

5000

6000

0 500 1000 1500 2000 2500 3000

Volume

Cus

to

Page 44: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 43

b)

Exercício 12

Recolheu-se uma amostra em 17 cidades do país relativamente aos seguintes

indicadores:

Ri: Rendimento médio mensal na cidade i (em 106 unidades monetárias)

Gi: Gasto médio mensal em bens de luxo na cidade i (em 106 u.m.)

Ri Gi Ri Gi

125 54 144 61 127 56 147 62 130 57 150 62 131 57 152 63 133 58 154 63 135 58 160 64 140 59 162 65 143 59 165 66 169 66

Dados adicionais

= 2467iR = 1030iG = 3610732iR

= 626202iG = 150270iiGR

a) Estude a correlação entre rendimento e despesas em bens de luxo.

b) Ajuste, pelo Método dos Mínimos Quadrados, uma função linear que

exprima a variável Gi em função de Ri.

y = 124,04x + 7,383

0

50

100

150

200

250

0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6

PBV

EP

S

Page 45: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 44

Resolução a)

986,0

)17

1030*1762620)(

172467

*17361073(

171030

*17

2467*17150270

))((2

22

2

2222=

−−

−=

−−

−=

GnGRnR

GRnGRr

ii

iiXY

Correlação positiva forte. b)

y = 0,2604x + 22,801

50

52

54

56

58

60

62

64

66

68

100 120 140 160 180 200

Rendimento

Gas

to

Page 46: Estatística Aplicada - Exercícos Resolvidos

104Introdução ao e-learning

FMD_i.p65 15-01-2004, 10:49104

Page 47: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 45

3. ESTATÍSTICA INDUTIVA

A estatística indutiva é o ramo da estatística que se ocupa em inferir das

conclusões retiradas sobre a amostra para a população. Claro que o processo

de indução implica um certo grau de incerteza associado à tentativa de

generalização de conclusões da “parte” (amostra) para o “todo” (universo). O

conceito de probabilidade vai ter aqui, então, um papel fundamental. Isto é, não

vai ser possível afirmar com toda a certeza que o comportamento da amostra

ilustra perfeitamente o comportamento do universo, mas apenas que o faz com

forte probabilidade.

De seguida, serão apresentadas algumas noções simples de probabilidades e

funções de probabilidade, que serão úteis a aplicações de estatística indutiva

relacionadas com controlo estatístico de qualidade e fiabilidade de

componentes e sistemas.

3.1. Noções básicas de probabilidade A teoria das probabilidades é um ramo da matemática extremamente útil para o

estudo e a investigação das regularidades dos chamados fenómenos

aleatórios. O exemplo seguinte pretende clarificar o que vulgarmente é

designado por experiência aleatória.

Deve entender-se como experiência qualquer processo ou conjunto de

circunstâncias capaz de produzir resultados observáveis; quando uma

experiência está sujeita à influência de factores casuais e conduz a resultados

incertos, diz-se que a experiência é aleatória.

Fundamentalmente, as experiências aleatórias caracterizam-se por:

Page 48: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 46

(i) poder repetir-se um grande número de vezes nas mesmas condições

ou em condições muito semelhantes

(ii) cada vez que a experiência se realiza, obtém-se um resultado

individual, mas não é possível prever exactamente esse resultado

(iii) os resultados das experiências individuais mostram-se irregulares,

mas os resultados obtidos após uma longa repetição da experiência

patenteiam uma grande regularidade estatística no seu conjunto

Alguns autores consideram inserido no conceito de experiência aleatória um

outro, o de espaço de resultados. O espaço de resultados corresponde ao

conjunto formado por todos os resultados possíveis de uma experiência

aleatória. Por exemplo, num lançamento de um dado ordinário tem-se que o

espaço de resultados é 6,5,4,3,2,1 .

A importância da definição deste conceito advém sobretudo por ser o meio

empregue para a definição de acontecimentos, que não sei mais que

subconjuntos do espaço de resultados. Por exemplo, no lançamento de um

dado podem definir-se, para além dos 6 acontecimentos elementares

correspondentes à saída de cada uma das faces, outros como “saída de um

número ímpar” definido pelo subconjunto 5,3,1 .

Definidos como conjuntos, aos acontecimentos é aplicável toda a construção

disponível para aqueles, isto é, existe um paralelismo perfeito entre álgebra de

conjuntos e álgebra de acontecimentos:

(i) O acontecimento que contem todos os elementos do espaço de

resultados chama-se acontecimento certo

(ii) O acontecimento que não contem qualquer elemento do espaço de

resultados chama-se acontecimento impossível

(iii) Dois acontecimentos são mutuamente exclusivos se não têm em

comum qualquer acontecimento do espaço de resultados

(iv) A união de dois acontecimentos A e B representa-se por A ∪ B e é

formado pelos elementos que pertencem a pelo menos um dos dois,

A ou B

(v) A intersecção de dois acontecimentos A e B representa-se por A ∩ B e

é formado pelos elementos comuns a A e B

Page 49: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 47

Probabilidade de um acontecimento é expressa na escala de 0 a 1, sendo 0 a

probabilidade associada a um acontecimento impossível e 1 a probabilidade

associada a um acontecimento certo. A primeira definição foi proposta por

Laplace em 1812. Pode definir-se probabilidade de um acontecimento A

como sendo:

Número de casos favoráveis ao acontecimento A P(A) =

Número total de casos possíveis na exp. aleatória

Uma das principais críticas a esta definição é a de que ela só é aplicável

quando o espaço de resultados é finito e os seus elementos possuem igual

probabilidade; daí que ela surja muito ligada aos “jogos de azar”, que possuem

essas propriedades. É o que acontece com as duas faces de uma moeda, as

52 cartas de um baralho, as 6 faces de um dado, etc.

Para se analisar a probabilidade de ocorrência de determinados

acontecimentos, deve ter-se em atenção o seguinte:

− Dois acontecimentos são ditos mutuamente exclusivos se não puderem

acontecer ao mesmo tempo; se dois acontecimentos forem mutuamente

exclusivos, então:

P(A ∩ B) = 0

− A probabilidade de união de dois acontecimentos mutuamente

exclusivos é dada por

P (A ∪ B) = P(A) + P(B)

− Para dois acontecimentos quaisquer, vem que

P (A ∪ B) = P(A) + P(B) - P(A ∩ B)

− Dois acontecimentos dizem-se complementares se:

P(A) = 1 – P( A )

− Dois acontecimentos são ditos independentes se a ocorrência de um

não afectar a probabilidade de ocorrência de outro; a probabilidade de

ocorrência de dois ou mais acontecimentos independentes é o produto

das probabilidades dos respectivos acontecimentos, isto é:

P(A ∩ B) = P(A) x P(B)

Page 50: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 48

Após a apresentação desta definição, convém ainda referir que, numa outra

perspectiva, a da chamada teoria frequencista, a probabilidade de um

acontecimento é definida como sendo o valor para o qual tende a frequência

relativa do acontecimento quando o número de repetições da experiência

aumenta.

3.2. Probabilidade condicionada

Exemplo:

Um grupo de pessoas é classificado de acordo com o seu peso e a incidência

de hipertensão. São as seguintes as proporções das várias categorias:

Obeso Normal Magro Total

Hipertenso 0,1 0,08 0,02 0,2

Não Hipertenso 0,15 0,45 0,2 0,8

Total 0,25 0,53 0,22 1,00

a) Qual a probabilidade de uma pessoa escolhida ao acaso ser hipertensa?

b) Qual a probabilidade de uma pessoa obesa ser hipertensa?

Resolução

a) Basta ver que a proporção de hipertensos é de 20%

b) Há que tomar em atenção que o que se pretende é a proporção de

hipertensos na população de obesos, isto é 4,025,01,0 = . Por outras palavras,

pretende-se calcular a probabilidade do acontecimento “ser hipertenso”,

sabendo que ocorreu o acontecimento “ser obeso”. Repare-se que este

quociente resulta da divisão entre a probabilidade de uma pessoa ser

hipertensa e obesa e a probabilidade de uma pessoa ser obesa. Pode

escrever-se que a probabilidade pretendida é dada por:

)()(

)/(OP

OHPOHP

∩=

onde P(H/O) é a probabilidade de ocorrer o acontecimento “ser hipertenso”,

sabendo que ocorreu ou condicionado pelo acontecimento “ser obeso”.

Este exemplo corresponde ao cálculo de uma probabilidade condicionada.

Page 51: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 49

Como se viu anteriormente, dois acontecimentos são ditos independentes se a

ocorrência de um não afectar a probabilidade de ocorrência de outro, isto é, se:

P(A / B) = P(A) e se P(B / A) = P(B).

Teorema de Bayes

Seja B um acontecimento que se realiza se e só se um dos acontecimentos

mutuamente exclusivos A1, A2,…An se verifica. Aos acontecimentos A1, A2,…An

dá-se o nome de acontecimentos antecedentes. O teorema de Bayes permite

calcular a probabilidade à posteriori de A1, A2,… An, isto é, a probabilidade de

ocorrência de A1, A2,… An calculadas sob a hipótese de que B (acontecimento

consequente) se realizou. De acordo com este teorema:

=

=n

iii

iii

ABPAP

ABPAPBAP

1

)/().(

)/().()/(

Este Teorema utiliza-se em situações em que a relação causal está invertida.

=

n

iii ABPAP

1

)/().( designa-se de probabilidade total de ocorrência do

acontecimento B, isto é, é a probabilidade de ocorrência do acontecimento

consequente B face a todos os possíveis acontecimentos A1, A2,… An que o

podem ter antecedido (ou causado a sua ocorrência).

3.3. Funções de probabilidade

A probabilidade associada aos acontecimentos possíveis numa experiência

aleatória obedecem, por vezes, a um padrão. Se associarmos a uma

experiência aleatória uma variável X (por exemplo, associar aos resultados da

experiência lançamento de um dado - que são 6 (saída de face 1 a 6) – a

variável X:“Nº da face resultante do lançamento de um dado”), então pode ser

constituída uma lei ou função de probabilidade (f(x)) dessa variável X, tal que

f(x) = P(X=xi)

Page 52: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 50

Por exemplo, para X: nº da face resultante do lançamento de um dado, vem

que:

xi 1 2 3 4 5 6

f(xi) 1/6 1/6 1/6 1/6 1/6 1/6

que se designa por lei uniforme.

Algumas leis de probabilidade servem para explicar (ou aplicam-se a) um maior

número de fenómenos estatísticos do que outras. Entre estas, contam-se a lei

Binomial, a lei de Poisson e a lei Exponencial.

(i) Lei Binomial

Há alguns acontecimentos que são constituídos por um conjunto de

experiências independentes, cada uma das quais com apenas dois estados

possíveis de ocorrência e com uma probabilidade fixa de ocorrência para cada

um deles. Por exemplo, os produtos resultantes de uma fábrica podem ser

classificados como sendo defeituosos ou sendo não defeituosos, e o facto de

um ter saído (ou não) defeituoso não influencia os outros serem (ou não). A

distribuição das duas classes possíveis é discreta e do tipo binomial.

No exemplo anterior, consideremos uma amostra de n artigos retirados da

produção total, em relação aos quais se pretende identificar a variável X: “Nº de

artigos defeituosos nos n que constituem a amostra”. A probabilidade de

ocorrência do acontecimento “artigo é defeituoso” é dada por p: incidência de

defeituosos na produção (convenientemente calculada através de métodos de

estimação). A probabilidade do acontecimento complementar “artigo é não-

defeituoso” é dada por

1 – p = q

A probabilidade associada a x artigos defeituosos é dada por px (p x p x p x

p...x vezes). Se há x defeituosos, restam n-x artigos não-defeituosos, com

probabilidade dada por qn-x. Para calcular o número exacto de combinações de

x artigos defeituosos com n-x artigos não-defeituosos, utiliza-se a figura

“combinações de n, x a x, oriunda das técnicas de cálculo combinatório. Vem

Page 53: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 51

então que a probabilidade de existência de x defeituosos (e logo n-x não

defeituosos) é igual a:

xnxxnxnx qp

ppnn

qpCxf −−

−==

!)!(!

)(

sendo que X segue Bi (n;p), sendo n e p os parâmetros caracterizadores da lei.

Um acontecimento deve ter 4 características para que se possa associar a uma

lei binomial:

- número fixo de experiências (n)

- cada experiência ter apenas duas classes de resultados possíveis

- todas as experiências terem igual probabilidade de ocorrência (p)

- as experiências serem independentes

Em sistemas eléctricos de energia é possível, por exemplo, aplicar a

distribuição binomial quando se pretende calcular a fiabilidade de uma central

eléctrica, com várias unidades iguais e admitindo que cada unidade apenas

pode residir em dois estados, a funcionar ou avariada.

(ii) Lei de Poisson

A lei de Poisson (ou lei dos acontecimentos raros ou cadenciados) dá a

probabilidade de um acontecimento ocorrer um dado número de vezes num

intervalo de tempo ou espaço fixado, quando a taxa de ocorrência é fixa (por

exemplo, nº de chamadas que chegam a uma central telefónica por minuto; nº

de varias que ocorrem numa máquina por dia). Os números de acontecimentos

de “sucesso” ocorridos em diferentes intervalos são independentes. O

parâmetro caracterizador da distribuição de Poisson é λ, que corresponde ao

número médio de ocorrências por unidade de tempo ou espaço.

Como o número médio de ocorrências do acontecimento é proporcional à

amplitude do intervalo de tempo ou espaço a que se refere, a variável X: “Nº de

ocorrências do acontecimento no intervalo [0,t[” segue lei de Poisson de

parâmetro λt (isto é, se para 1 unidade de tempo o nº médio de ocorrências é

λ, para t unidades de tempo o número médio de ocorrências é λt). A expressão

( ) tx

ext λλ −

!

Page 54: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 52

dá a probabilidade de acontecerem x ocorrências no intervalo de tempo [0,t[, e

corresponde à expressão da lei de probabilidade de Poisson : Po(λt)

Por exemplo, se X fôr o “Nº de avarias que ocorrem no intervalo de tempo

[0,t[”, então a probabilidade de não ocorrerem avarias nesse intervalo, isto é, a

fiabilidade do componente/sistema como função do tempo, é dada por:

( ) tt eet λλλ −− =!0

0

(iii) Lei Exponencial

Seja T a variável “Tempo ou espaço que decorre entre ocorrências

consecutivas de um acontecimento”. Então T segue lei exponencial Exp (λ),

sendo

λ1

o tempo que, em média, decorre entre ocorrências sucessivas do

acontecimento.

Note-se que é possível estabelecer uma relação entre a lei exponencial e a lei

de Poisson. Assim, se X fôr o “Nº de avarias que ocorrem no intervalo de

tempo [0,t[”, e T fôr o “Tempo que decorre entre avarias consecutivas”, então:

P (T>t) = P(tempo que decorre entre avarias exceder t)

= P(até ao instante t, não ocorre qualquer avaria)

= P (ocorrerem zero avarias no intervalo [0,t[) = P(X=0) = te λ−

A distribuição exponencial é a mais usada em estudos de fiabilidade, já que a

probabilidade de um componente sobreviver até ao instante t é dada por te λ−

A probabilidade de avariar até ao instante t é dada por te λ−−1

Page 55: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 53

(iv) Lei Normal

A lei Normal tem como parâmetros caracterizadores a média µ e o desvio-

padrão σ. Isto é, os valores observados têm uma determinada tendência

central e uma determinada dispersão em torno da tendência central.

A expressão

−−2

2)(21

21 σ

µ

σ

Xi

e

representa a função densidade de probabilidade da distribuição Normal.

Se se fizer o valor médio µ igual a zero e todos os desvios forem medidos em

relação à média, a equação será:

σµ−= X

Z

que corresponde a uma distribuição normal estandardizada (0;1) com os

valores tabelados, a qual é caracterizada por uma curva de Gauss:

Esta distribuição apresenta 99,73% dos valores entre os extremos –3 e 3.

Existem muitos tipos de distribuição, mas a curva normal é a forma de

distribuição mais frequente nos processos industriais para características

mensuráveis, e pode considerar-se como estabelecida pela experiência prática.

Page 56: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 54

(v) Lei Qui-Quadrado

Considere-se um conjunto de n variáveis aleatórias Zi, obedecendo às

seguintes condições:

- cada variável Zi segue distribuição N(0,1);

- as variáveis Zi são mutuamente independentes

Então, a variável aleatória X, construída a partir da soma das n variáveis Zi

elevadas ao quadrado, segue distribuição Qui-Quadrado com n graus de

liberdade, denotada por

222

21

1

2 ... n

n

ii ZZZZX +++==

=

2nX χ∩

O termo “Graus de Liberdade” (d.f: degrees of freedom) é habitualmente usado

para designar o número n de parcelas (variáveis Zi) adicionadas. É possível

demonstrar que o valor esperado e a variância da distribuição de uma variável

Qui-Quadrado são respectivamente n=µ

n22 =σ

A distribuição Qui-Quadrado é uma distribuição assimétrica à esquerda,

aproximando-se da distribuição Normal à medida que n cresce.

Page 57: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 55

Page 58: Estatística Aplicada - Exercícos Resolvidos

104Introdução ao e-learning

FMD_i.p65 15-01-2004, 10:49104

Page 59: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 56

PROBABILIDADES Exercícios resolvidos

Exercício 1

De um baralho ordinário (52 cartas) extrai-se ao acaso 1 carta. Determine a

probabilidade dos seguintes acontecimentos:

a) saída de Rei

b) saída de copas

c) saída de Rei ou copas

d) saída de Rei mas não de copas

e) não saída de Rei

f) não saída de Rei nem de copas

g) não saída de Rei ou não saída de copas

Resolução

A: saída de Rei

B: saída de copas

a) P(A)=1/13

b) P(B)=1/4

c) P(A ∪ B) = P(A) + P(B) - P(A ∩ B) = 1/13+1/4-1/52 = 4/13 (=(13+3)/52)

d) P(A-B) = P(A) – P(A ∩ B) = 1/13 – 1/52 = 3/52 (= (4-1)/52)

e) P( A )= 1-1/13 = 12/13 (=(52-4)/52)

f) P( )BA ∩ = P( BA ∪ ) = 1 – P(A ∪ B) = 1 – 4/13 = 9/13

g) P( )BA ∪ = P( BA ∩ ) = 1 – P )( BA ∩ = 1 – 1/52 = 51/52

Exercício 2

Um sistema electrónico é formado por dois sub-sistemas, A e B. De ensaios

anteriores, sabe-se que:

- a probabilidade de A falhar é de 20%

- a probabilidade de B falhar sozinho é 15%

- a probabilidade de A e B falharem é 15%

Determine a probabilidade de:

Page 60: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 57

a) B falhar

b) falhar apenas A

c) falhar A ou B

d) não falhar nem A nem B

e) A e B não falharem simultaneamente

Resolução A: o subsistema A falha

B: o subsistema B falha

P(A)=20% P( A )= 80%

P(B-A)=15%

P(A ∩ B)=15%

a) P(B) = P(B-A)+ P(A ∩ B) = 0,15 + 0,15 = 30%

b) P(A-B) = P(A) – P(A ∩ B) = 0,2 – 0,15 = 5%

c) P(A ∪ B) = P(A) + P(B) - P(A ∩ B) = 0,2 + 0,3 – 0,15 = 35%

d) P( )BA ∩ = P( BA ∪ ) = 1 – P(A ∪ B) = 1 – 0,35 = 65%

e) P( BA ∩ ) = 1 – P )( BA ∩ = 1 – 0,15 = 85%

Exercício 3

Suponha que há 3 jornais, A, B e C, com as seguintes percentagens de leitura:

A: 9,8%; B: 22,9%; C: 12,1%; A e B: 5,1%; A e C: 3,7%; B e C: 6%;

A, B e C: 2,4%

Escolhe-se uma pessoa ao acaso. Calcule a probabilidade dessa pessoa:

a) ler pelo menos um dos jornais

b) ler A e B mas não C

c) ler A mas não ler B nem C

Resolução A: a pessoa escolhida lê o jornal A

B: a pessoa escolhida lê o jornal B

C: a pessoa escolhida lê o jornal C

P(A) = 9,8% P(B) = 22,9% P(C) = 12,1%

P(A ∩ B) = 5,1% P(A ∩ C) = 3,7% P(B ∩ C) = 6%

P(A ∩ B ∩ C) = 2,4%

Page 61: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 58

a)

)()()()()()()()( CBAPCBPCAPBAPCPBPAPCBAP ∩∩+∩−∩−∩−++=∪∪= 0,098+0,229+0,121-0,051-0,037-0,06+0,024 = 32,4%

b) P( )CBA ∩∩ = P( )() CBAPBA ∩∩−∩ = 0,051 – 0,024 = 2,7%

c) )( CBAP ∩∩ = P(A) - )()()( CBAPCAPBAP ∩∩+∩−∩

= 0,098-0,051-0,037+0,024 = 3,4%

Exercício 4

Um gerente de uma galeria de arte muito creditada no mercado, está

interessado em comprar um quadro de um pintor famoso para posterior venda.

O gerente sabe que há muitas falsificações deste pintor no mercado e que

algumas dessa falsificações são bastante perfeitas o que torna difícil avaliar se

o quadro que ele pretende comprar é ou não um original. De facto, sabe-se que

há 4 quadros falsos desse pintor para 1 verdadeiro.

O gerente não quer comprometer o “bom nome” da galeria para a qual trabalha

comprando um quadro falso. Para obter mais informação o gerente resolve

levar o quadro a um museu de arte e pede para que o especialista do museu o

examine. Este especialista garante-lhe que em 90% dos casos em que lhe é

pedido para examinar um quadro genuíno daquele pintor, ele identifica-o

correctamente como sendo genuíno. Mas em 15% dos casos em que examina

uma falsificação do mesmo pintor, ele identifica-o (erradamente) como sendo

genuíno.

Depois de examinar o quadro que o gerente lhe levou, o especialista diz que

acha que o quadro é uma falsificação. Qual é agora a probabilidade de o

quadro ser realmente uma falsificação?

Resolução V: o quadro é genuíno

F: o quadro é falso

I: o quadro é identificado correctamente

P(V) = 20%

P(F) = 80%

P(I/V) = 90% P( )/VI = 10%

P( )/ FI = 15% P(I/F) = 85%

Page 62: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 59

P(ser realmente falsificação/especialista identificou como falsificação) =

= %1,977,068,0

1,0*2,085,0*8,085,0*8,0

)/(*)()/(*)()/(*)( ==

+=

+ VIPVPFIPFP

FIPFP

Exercício 5

Na ida para o emprego, o Sr. Óscar, polícia de profissão, tem de passar

obrigatoriamente por três cruzamentos com semáforos. No primeiro

cruzamento, o do Largo Azul, a probabilidade do semáforo se encontrar com

sinal vermelho é de 10%. Em cada um dos cruzamentos seguintes, o Sr. Óscar

fica parado devido aos sinais vermelhos em metade das vezes que lá passa.

O Sr. Óscar já descobriu que os semáforos funcionam separadamente, não

estando ligados entre si por qualquer mecanismo.

Embora goste de cumprir a lei, o guarda Óscar passa no sinal verde e acelera

no amarelo, só parando mesmo no sinal vermelho.

a) Qual a probabilidade do Sr. Óscar chegar ao emprego sem ter de parar

em qualquer sinal vermelho?

b) Qual a probabilidade do Sr. Óscar ter de parar num só semáforo?

c) Qual a probabilidade do Sr. Óscar ter parado no sinal vermelho do

cruzamento do Largo Azul, sabendo que parou num só semáforo na sua

ida para o emprego?

Resolução

A: polícia encontra sinal vermelho no 1º cruzamento

B: polícia encontra sinal vermelho no 2º cruzamento

C: polícia encontra sinal vermelho no 3º cruzamento

P(A)=10% P( A )= 90%

P(B)=50% P( B )= 50%

P(C)=50% P(C )= 50%

a) P( )CBA ∩∩ = P( A )*P( B )*P(C ) = 0,9*0,5*0,5 = 22,5%

b) P( )CBA ∩∩ + P( )CBA ∩∩ +P( )CBA ∩∩ =

= P( A )*P( B )*P(C ) + P( A )*P( B )*P(C ) + P( A )*P( B )*P(C ) = 47,5%

Page 63: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 60

c) P(polícia parar no 1º cruzamento / polícia parou num só semáforo)

%26,5475,0

)(*)(*)(475,0

)( ==∩∩= CPBPAPCBAP

Exercício 6

Após alguns testes efectuados à personalidade de um indivíduo, concluiu-se

que este é louco com probabilidade 60%, ladrão com probabilidade igual a 70%

e não é louco nem ladrão com probabilidade 25%. Determine a probabilidade

do indivíduo:

a) Ser louco e ladrão

b) Ser apenas louco ou apenas ladrão

c) Ser ladrão, sabendo-se que não é louco

Resolução

A: indivíduo é louco

B: indivíduo é ladrão

P(A)=60%

P(B)=70%

P( )BA ∩ = 25% = P( BA ∪ ) P(A ∪ B) = 1 – 0,25 = 75%

a) P(A ∪ B) = P(A) + P(B) - P(A ∩ B) 0,75 = 0,6 + 0,7 - P(A ∩ B)

P(A ∩ B) = 0,6 + 0,7 – 0,75 = 55%

b) P(A-B) + P(B-A) = (0,6-0,55) + (0,7-0,55) = 20í

c) P(B/ A ) = %5,374,0

15,06,01

)()(

)( ==−

−=∩ ABP

AP

ABP

Exercício 7

Uma moeda é viciada, de tal modo que P(F) = 2/3 e P(C) = 1/3. Se aparecem

faces, então um número é seleccionado de 1 a 9. Se parecem coroas, um

número é seleccionado entre 1 e 5. Determine a probabilidade de ser

seleccionado um número par.

Resolução

P(Par) = 2/3*4/9 + 1/3*2/5 = 42,96%

Page 64: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 61

Exercício 8

Numa fábrica, 3 máquinas, M1, M2 e M3 fabricam parafusos, sendo a produção

diária total de 10000 unidades. A probabilidade de um parafuso escolhido ao

acaso ter sido produzido por M1 é 30% da probabilidade de ter sido produzido

por M2. A incidência de defeituosos na produção de cada máquina é:

M1: 3% M2: 1% M3: 2%

Extrai-se ao acaso da produção diária um parafuso. Sabendo que a

probabilidade dele ser defeituoso é de 1,65%, determine o número de

parafusos que cada máquina produz diariamente.

Resolução

M1: o parafuso foi produzido por M1

M2: o parafuso foi produzido por M2

M3: o parafuso foi produzido por M3

D: o parafuso é defeituoso

n = 10000 unidades

P(M1) = 0,3 P(M2)

P(D / M1) = 3%

P(D / M2) = 1%

P(D / M3) = 2%

P(D) = 1,65%

Prod. 1 = P(M1)*10000 = ?

Prod. 2 = P(M2)*10000 = ?

Prod. 3 = P(M3)*10000 = ?

++==++

=

)3/(*)3()2/(*)2()1/(*)1()(1)3()2()1(

)2(3,0)1(

MDPMPMDPMPMDPMPDP

MPMPMP

MPMP

++==+

02,0*)3(01,0*)2(03,0*)2(3,00165,01)3()2(3,1

MPMPMP

MPMP ⇔

Page 65: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 62

−++=−=

02,0*))2(3,11(01,0*)2(03,0*)2(3,00165,0)2(3,11)3(

MPMPMP

MPMP ⇔

==−=−=

==

%50)2(%355,0*3,11)2(3,11)3(

%155,0*3,0)1(

MP

MPMP

MP

Exercício 9

O João tem à sua disposição 3 meios de transporte diferentes para se deslocar

de casa para a escola: os transportes A, B ou C. Sabe-se que a probabilidade de:

- chegar atrasado à escola é 60%

- chegar atrasado utilizando o transporte A é 80%

- chegar atrasado utilizando o transporte B é 50%

- chegar atrasado utilizando o transporte C é 60%

- utilizar os transportes B e C é a mesma

a) Calcule a probabilidade de o João utilizar o transporte A

b) Sabendo que o João chegou atrasado à escola, calcule a probabilidade

de ter utilizado os transportes B ou C.

Resolução T: O João chega atrasado

A: o João utiliza o transporte A

B: o João utiliza o transporte B

C: o João utiliza o transporte C

P(T) = 0,6

P(T/A) = 0,8

P(T/B) = 0,5

P(T/C) = 0,6

P(B) = P(C)

P(A)+P(B)+P(C) = 1 P(A) = 1- 2P(B)

a) P(T) = P(A)*P(T/A) + P(B)*P(T/B) + P(C)*P(T/C)

Page 66: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 63

Logo

0,6 = (1-2P(B))*0,8 + P(B)*0,5 + P(B)*0,6

e vem que

P(B) = 40%

Então P(A) = 1 – 2P(B) = 1 – 2*0,4 = 20%

b) P(B ∪ C / T) = )(

)/(*)()/(*)(TP

CTPCPBTPBP + =

6,06,0*4,05,0*4,0 +

=73,3%

Exercício 10

Uma empresa que se dedica à prestação de serviços de selecção de pessoal

em relação a um teste psicotécnico para uma profissão específica sabe o

seguinte:

- as percentagens de indivíduos com um quociente de inteligência (Q.I.)

elevado e médio são, respectivamente, de 30% e de 60%

- a percentagem de indivíduos com Q.I. médio que ficam aptos no teste é

de 50%

- a probabilidade de um indivíduo com Q.I. baixo ficar apto no teste é de

20%

- finalmente, sabe-se que 70% dos indivíduos com Q.I. elevado ficam

aptos no teste

a) Qual a probabilidade de um indivíduo escolhido ao acaso ficar apto no

teste?

b) Qual a probabilidade de um indivíduo ter Q.I. baixo, sabendo-se que

ficou inapto?

Resolução

A: indivíduo fica apto no teste

E: indivíduo tem QI elevado

M: indivíduo tem QI médio

B: indivíduo tem QI baixo

P(E) = 30% P(M) = 60% P(B) = 1 –0,3 – 0,6 = 10%

P(A/M) = 50% P(A/B) = 20% P(A/E) = 70%

Page 67: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 64

a) P(A)

=P(E)*P(A/E)+P(M)*P(A/M)+P(B)*P(A/B)

=0,3*0,7+0,6*0,5+0,1*0,2=53%

b) P(B/ A ) = %1753,01

8,0*1,0)(

)/(*)( =−

=AP

BAPBP

Exercício 11

Os resultados de um inquérito aos agregados familiares de uma determinada

cidade forneceram os seguintes dados:

- 35% dos agregados possuem telefone

- 50% dos agregados possuem frigorífico

- 25% dos agregados possuem automóvel

- 15% dos agregados possuem telefone e frigorífico

- 20% dos agregados possuem telefone e automóvel

- 10% dos agregados possuem frigorífico e automóvel

- 5% dos agregados possuem telefone, automóvel e frigorífico

a) Calcule a probabilidade de um agregado familiar

1. possuir telefone ou frigorífico

2. não possuir nem telefone nem automóvel

b) Calcule a probabilidade de um agregado que possui automóvel

1. possuir também frigorífico

2. possuir também telefone ou frigorífico

c) Calcule a probabilidade de um agregado familiar

1. possuir pelo menos um daqueles três objectos

2. não possuir nenhum daqueles três objectos

Resolução

A: agregado familiar possui telefone

B: agregado familiar possui frigorífico

C: agregado familiar possui automóvel

P(A) = 35%

P(B) = 50%

P(C) = 25%

Page 68: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 65

P(A ∩ B) = 15%

P(A ∩ C) = 20%

P(B ∩ C) = 10%

P(A ∩ B ∩ C) = 5%

a) 1. P(A ∪ B) = P(A) + P(B) - P(A ∩ B) = 0,35 + 0,5 – 0,15 = 70%

2. P( )CA ∩ = P( CA ∪ ) = 1 – P(A ∪ C) = 1 – 0,4 = 60%

P(A ∪ C) = P(A) + P(C) - P(A ∩ C) = 0,35 + 0,25 – 0,2 = 40%

b) krysktsh1. P(B / C) = %4025,01,0

)()( ==∩

CPCBP

2. P(A ∪ B/ C) =

%10025,0

05.01,02,0)(

)()()( =−+=∩∩−∩+∩CP

CBAPCBPCAP

c) 1.

)()()()()()()()( CBAPCBPCAPBAPCPBPAPCBAP ∩∩+∩−∩−∩−++=∪∪= 0,35+0,5+0,25-0,15-0,2-0,1+0,05 = 70%

2. 1 – P( )CBA ∪∪ = 1 – 0,7 = 30%

Exercício 12

Admita que 60% dos seguros no ramo automóvel respeitam a condutores com

mais de 40 anos de idade, dos quais 5% sofrem, pelo menos, um acidente por

ano. De entre os segurados com idade igual ou inferior a 40 anos, 3% têm um

ou mais acidentes no mesmo período.

a) Qual a probabilidade de um segurado não sofrer qualquer acidente

durante um ano?

b) Qual a probabilidade de um segurado que sofreu pelo menos um

acidente ter idade igual ou inferior a 40 anos?

c) Qual a probabilidade de, numa amostra de três segurados

1. todos terem idade igual ou inferior a 40 anos?

2. nenhum ter sofrido qualquer acidente durante um ano?

3. Todos terem idade igual ou inferior a 40 anos, dado que cada um

sofreu, pelo menos, um acidente durante o referido período?

Page 69: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 66

Resolução

I1: o segurado tem mais de 40 anos de idade

I2: o segurado tem 40 anos ou menos de idade

A: o segurado sofre pelo menos 1 acidente por ano

A : o segurado não sofre nenhum acidente por ano

P(I1) = 60% P(I2) = 1 – 0,6 = 40%

P(A/I1) = 5% P( A /I1) = 1 – 0,05 = 95%

P(A/I2) = 3% P( A /I2) = 1 – 0,03 = 97%

a) P( A ) = P(I1)* P( A /I1) + P(I2)* P( A /I2) = 0,6*0,95 + 0,4*0,97 = 95,8%

b) P(I2/A) = %57,28958,01

03,0*6,0)(

)2/(*)2()(

)2( =−

==∩AP

IAPIPAP

IAP= P(B)

c) 1. P( )222 III ∩∩ = 0,4*0,4*0,4 = 6,4%

2. P( )AAA ∩∩ = 0,958*0,958*0,958 = 87,9%

3. P( )BBB ∩∩ = 0,2857*0,2857*0,2857 = 2,3%

Page 70: Estatística Aplicada - Exercícos Resolvidos

104Introdução ao e-learning

FMD_i.p65 15-01-2004, 10:49104

Page 71: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 67

FUNÇÕES DE PROBABILIDADE Exercícios resolvidos

Exercício 1

Se 20% das bobinas de um determinado cabo eléctrico forem defeituosas,

calcule a probabilidade de, entre as 4 bobines necessárias a um determinado

cliente, escolhidas ao acaso uma ser defeituosa.

Resolução X: número de bobines defeituosas no conjunto de 4 bobines necessárias a um

determinado cliente (0,1,2,3,4)

n=4 p=0,2 q=1-p=0,8

P(X=1)=C4p1q4-1 = 4*0,2*0,83 = 0,4096 = 41%

Exercício 2

O número médio de chamadas telefónicas a uma central, por minuto, é 5. A

central só pode atender um número máximo de 8 chamadas por minuto. Qual a

probabilidade de não serem atendidas todas as chamadas no intervalo de

tempo de 1 minuto?

Resolução

X: número de chamadas telefónicas atendidas numa central, por minuto

(0,1,2,3,4, 5, 6, 7, 8)

λ=5 p=0,2 q=1-p=0,8

P(X ≤ 8) = =

−8

0

5

!5

x

x

xe

= 0,932 Logo P(X>8) = 1-0,932 = 0,06

Exercício 3

O tempo de funcionamento sem avarias de uma determinada máquina de

produção contínua segue uma lei exponencial negativa com valor esperado

igual a 4,5 horas. Imagine que a máquina é (re)colocada em funcionamento no

instante t=0 horas.

Qual a probabilidade de não ocorrerem avarias antes do instante t=6 horas?

Page 72: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 68

Resolução Seja

T: tempo de funcionamento sem avarias (ou entre avarias consecutivas) de

uma máquina, e

X: numero de avarias que ocorrem no intervalo [0,6[, isto é, num período de 6h

λ=1/4,5 corresponde ao número de avarias por unidade de tempo (por hora) Logo

P(T ≥ 6) = P(X=0)= 333,16*

5,41

−−

= ee = 0,264

Exercício 4

Considere que o comprimento médio de determinado fio condutor é 120, com

desvio padrão 0,5. Qual a percentagem de fio com comprimento superior a 121?

Resolução X: comprimento de determinado fio condutor

Calculando a variável reduzida correspondente, vem:

25,0120121 =−=Z

Consultando a tabela, verifica-se que o valor da função Z é P(X ≤ 2) = 0,9772.

Logo P(X>2) = 1-0,9772 = 2,28%.

Exercício 5

Numa praia do litoral português existe um serviço de aluguer de barcos,

destinado aos turistas que a frequentam. O número de turistas que procuram

este serviço, por hora, está associado a uma variável aleatória com distribuição

de Poisson.

Verificou-se que, em média, em cada hora, esse serviço é procurado por 8

turistas interessados em alugar barcos; sabe-se, por outro lado, que esse

serviço funciona ininterruptamente das 8 às 20 horas.

a) Qual a probabilidade de que, entre as 8 e as 9 horas, se aluguem 5

barcos?

b) Qual a probabilidade de que, entre as 9 e as 11 horas, os barcos

sejam procurados por mais de 25 turistas?

Page 73: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 69

Resolução

X: nº de turistas que procuram o serviço de aluguer de barcos por hora

X segue Po(λ=8)

a) Na tabela da Po(λ=8) vem P(X=5) = 9,16%

b) Y1: nº de turistas que procuram o serviço de aluguer na 1ª hora

Y2: nº de de turistas que procuram o serviço de aluguer na 2ª hora

Logo

Y1+Y2: nº de turistas que procuram o serviço de aluguer em 2 horas

Pelo Teorema da Aditividade da Poisson, considerando Y1 e Y2

independentes e que todas seguem Po(8), vem que:

Z=Y1+Y2 segue Po(2*8=16)

Logo P(Z>25) = f(26) +... + f(33) = 0,0057 + ... + 0,0001 = 1,32%

Exercício 6

O número de navios petroleiros que chegam diariamente a certa refinaria é

uma variável com distribuição de Poisson de parâmetro 2. Nas actuais

condições, o cais da refinaria pode atender, no máximo, 3 petroleiros por dia.

Atingido este número, os restantes que eventualmente apareçam deverão

seguir para outro porto.

a) Qual a probabilidade de, num qualquer dia, ser preciso mandar

petroleiros para outro porto?

b) De quanto deveriam ser aumentadas as instalações de forma a

assegurar cais a todos os petroleiros em 99,9% dos dias?

c) Qual o número esperado de petroleiros a chegarem por dia?

d) Qual o número mais provável de petroleiros a chegarem por dia?

e) Qual o número esperado de petroleiros a serem atendidos diariamente?

f) Qual o número esperado de petroleiros que recorrerão a outros portos

diariamente?

Resolução

X: nº de petroleiros que chegam diariamente a uma certa refinaria

X segue Po (2)

Capacidade máxima de atendimento da refinaria: 3 petroleiros/dia

Page 74: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 70

a) P(X>3) = 1 – P(X ≤ 3) = 1 – F(3) = 1 – 0,8571 =14,29%

(tab. pg.14)

b) Nº máximo de petroleiros que podem chegar: 9 (informação da tabela)

Logo, a capacidade devia aumentar em 6 petroleiros/dia (9-3)

c) E(X) = 2

d) X = 1 ou X = 2, com probabilidade 27,07%

e) Y: nº de petroleiros que são atendidos diariamente numa certa refinaria

(0,1, 2, 3)

g(0) = P(X=0) = 0,1353

g(1) = P(X=1) = 0,2707

g(2) = P(X=2) = 0,2707

g(3) = P(X=3) = 1 – P(X<3) = 1 – P(X ≤ 2) = 1 – 0,6767 = 0,3233

E(Y) = 0*0,1353 + … + 3*0,3233 = 1,782

São atendidos, em média, entre 1 e 2 petroleiros diariamente

f) Z: nº de petroleiros que recorrem diariamente a outros portos

(0,1, 2, 3, 4, 5, 6)

Logo, Z = X - Y

E(Z) = E(X -Y) = E(X) - E(Y) = 2 - 1,782 = 0,218

Recorrem a outros portos, em média, entre 0 e 1 petroleiro por dia

g) W: nº de dias em que é preciso mandar petroleiros para outro porto num

mês de 30 dias (0,1, 2,...30)

W segue Bi (n = 30; p = P(X>3) = 0,1429)

E(W) = 30*0,1429 = 4,3

Em média, é preciso enviar petroleiros para outro porto 4 a 5 dias/mês

Exercício 7

Os Serviços Municipalizados de Gás e Electricidade debitam mensalemnte aos

seus clientes um consumo teórico T de energia eléctrica calculado de tal modo

que a probabilidade de o consumo efectivo o exceder seja de 30,85%.

Suponha um cliente cujo consumo por mês segue lei normal de média 400 kwh

e desvio-padrão 40 kwh.

a) Qual o consumo teórico que lhe é mensalmente debitado?

b) 1. Qual a distribuição do consumo efectivo durante 3 meses?

Page 75: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 71

2. Qual a probabilidade de que, ao fim de 3 meses, o consumo teórico

exceda o efectivo em mais de 100 kwh?

Resolução

X: consumo efectivo de energia eléctrica de um cliente por mês (em kwh)

T: consumo teórico (valor fixo) debitado ao cliente por mês (em kwh)

T: P(X>T) = 0,3085

X segue N(400; 1600)

a) P(X>T) = 0,3085 ⇔ P( 3085,0)40

40040

400 =−>− TX ⇔

P(N(0,1) 4205,040

4006915,0)

40400 =⇔=−⇔=−≤ T

TT

b) 1.

X1: consumo efectivo de energia eléctrica de um cliente no 1ºmês (em kwh)

X2: consumo efectivo de energia eléctrica de um cliente no 2ºmês (em kwh)

X3: consumo efectivo de energia eléctrica de um cliente no 3ºmês (em kwh)

Logo

X1+X2+X3: consumo efectivo de energia eléctrica em 3 meses (em kwh)

Pelo Teorema da Aditividade da Normal, considerando X1, X2 e X3

independentes e que todas seguem N(400, 1600), vem que:

Y=X1+X2+X3 segue N(400*3; 1600*3), isto é, N(1200; 4800)

2. P(3*420-Y > 100) = P(Y < 1160) = P(N(0,1)< )4800

12001160 −=

= P(N(0,1)<-0,58) = 28,1%

Exercício 8

Num determinado processo de fabrico, existem 2 cadeias de montagem A e B,

com funcionamento independente.

A cadeia A opera a um ritmo médio de 2 montagens por hora, e a probabilidade

da cadeia B efectuar pelo menos uma montagem numa hora é de 98,71%.

Admitindo que o número de montagens efectuadas por hora em ambas as

cadeias é uma v.a. Poisson, determine:

a) a probabilidade de se efectuarem mais de 6 montagens numa hora com

a cadeia B

Page 76: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 72

b) a probabilidade de, em 3 horas de trabalho, se efectuarem no máximo

10 montagens com a cadeia B

c) a probabilidade de, numa hora, a cadeia A efectuar o dobro de

montagens de B

d) o número médio de montagens efectuadas num dia de trabalho de 8

horas com ambas as cadeiras

Resolução

X: nº de montagens da cadeia A por hora X segue Po(2)

Y: nº de montagens da cadeia B por hora

a) Y segue Poisson, mas desconhece-se a média (=parâmetro λ)

No entanto, como se sabe que P(Y ≥ 1) = 0,9817, vem que

P(Y<1) = 1 – 0,9817 = 0,0183

Na tabela da Poisson, percorrendo as linhas de valor = 0, vem que o

valor 0,0183 pode ser encontrado no cruzamento da linha 0 com a

coluna 4. Logo, λ = 4.

Na tabela da Po(4), P(Y>6) = 1–P(Y ≤ 6) = 1–F(6) = 1-0,8893=11,07%

b)

Y1: nº de montagens da cadeia B na 1ª hora

Y2: nº de montagens da cadeia B na 2ª hora

Y3: nº de montagens da cadeia B na 3ª hora

Logo

Y1+Y2+Y3: nº de montagens da cadeia B em 3 horas

Pelo Teorema da Aditividade da Poisson, considerando Y1, Y2 e Y3

independentes e que todas seguem Po(4), vem que:

Z=Y1+Y2+Y3 segue Po(4*3=12)

P(Z ≤ 10) = f(0) + f(1) +... + f(10) = 0 + 0,0001 + … + 0,1048 = 34,72%

c) P(X=2Y) = P(X=0 ∩ Y=0) + P(X=2 ∩ Y=1) + P(X=4 ∩ Y=2) +

P(X=6 ∩ Y=3) + P(X=8 ∩ Y=4) = 0,1353*0,0183 + 0,2707*0,0753 +

0,0902*0,1465 + 0,012*0,1954 + 0,0009*0,1954 = 3,8%

d) W: nº de montagens das 2 cadeias num dia de trabalho de 8 horas

W = )(8

1i

ii YX +

=

onde Xi + Yi corresponde ao nº de montagens das 2 cadeias por hora

Page 77: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 73

Pelo Teorema da Aditividade de Poisson, sendo as variáveis

independentes e seguindo Po(2) e Po(4) respectivamente, vem que

Xi + Yi segue também Po(2+4=6).

E Z , também pelo mesmo Teorema, segue Po(6*8=48)

Logo, o número médio de montagens efectuado pelas 2 cadeias num dia

de trabalho de 8 horas é de 48.

Exercício 9

Uma companhia de tabacos recebeu em dada altura um elevado número de

queixas quanto à qualidade dos cigarros de certa marca que comercializa.

Numa rápida análise às condições de produção, constata-se que 1% dos filtros

que compõem o cigarro saem defeituosos. Nestas condições, determine:

a) a probabilidade de um maço acabado de formar

1. conter 1 cigarro com filtro defeituoso

2. conter 0 cigarros com filtro defeituoso

b) o número de maços que, num volume que contém 20, a companhia

espera poder aproveitar se utilizar o critério:

1. maço é aproveitável se não contiver cigarros defeituosos

2. maço é aproveitável se contiver no máximo 1 cigarro defeituoso

Resolução

X: nº de cigarros com filtro defeituoso em 20 cigarros de um maço

X segue Bi(n=20; p=0,01)

a) 1. P(X=1) = 20*0,01*0,9919 = 16,52%

2. P(X=0) = 0,010*0,9920 = 81,79%

b) 1. Crit. 1: maço é aproveitável se não contiver cigarros defeituosos

Y: nº de maços aproveitáveis num volume que contem 20 maços

Y segue Bi(n=20; p=P(X=0) = 0,8179)

Logo E(Y) = 20*0,8179 = 16,36

2. Crit. 2: maço é aproveitável se contiver no máximo 1 cigarro defeituoso

Y: nº de maços aproveitáveis num volume que contem 20 maços

Y segue Bi(n=20; p=P(X=0)+P(X=1)= 0,8179+0,1652 = 0,9831)

Logo E(Y) = 20*0,9831 = 19,66

Page 78: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 74

Exercício 10

O comprimento das peças produzidas por uma máquina é uma v.a. Normal

com média µ e variância σ2. Uma peça defeituosa se o seu comprimento diferir

do valor médio mais do que σ. Sabemos que 50% das peças produzidas têm

comprimento inferior a 0,25 mm e 47,5% têm comprimento entre 0,25 mm e

0,642 mm.

a) Calcule a média e o desvio-padrão do comprimento das peças.

b) Determine a probabilidade de uma peça não ser defeituosa.

Resolução

X: comprimento das peças produzidas por uma máquina

X segue N(µ; σ2)

Peça defeituosa se X>µ + σ ou se X< µ - σ

P(X<0,25) = 50%

P(0,25<X<0,642) = 47,5%

a) Como P(X<0,25) = 50% vem que

P( %50)25,0 =−<−

σµ

σµX

Na tabela, σ

µ−25,0 tem que ser =0, logo µµµµ = 0,25

E como

P(0,25<X<0,642) = 47,5% vem que

=<<=−<−<−)

392,0)1,0(0()

25,0642,025,025,025,0(

σσσσNP

XP

)0()392,0

( θσ

θ −= = 0,475

Sendo θ (0)=0,5, vem que 975,05,0475,0)392,0

( =+=σ

θ

Na tabela 3B da Normal, vem que 96,1392,0 =σ

e logo σσσσ = 0,2

b) P(peça não defeituosa) = P(µ - σ < X < µ + σ) = P(0,05 < X < 0,45) =

P(X<0,45) – P(X<0,05) =

%13,84)1()1()1()2,0

25,005,0()

2,025,045,0

( ==−−=−−−Dθθθθ

Page 79: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 75

Exercício 11

Sabe-se que a probabilidade de cura de uma certa doença é 20%. Põe-se à

prova um novo medicamento, que eleva a probabilidade de cura para 40%,

ministrando-o a um grupo de 20 doentes. Admite-se que o medicamento é

eficaz no caso de contribuir para a cura de, pelo menos, 8 doentes em 20.

Calcule a probabilidade de se concluir pela ineficácia do medicamento, ainda

que este eleve de facto a probabilidade de cura para 40%.

Resolução

X: número de doentes curados no grupo de 20 a que é ministrado o novo

medicamento (0,1,2...19, 20)

n=20 p=0,4 q=1-p=0,6 X segue Bi (20; 0,4)

P(X ≥ 8)=1- F(7) = 41,58%

Exercício 12

Sabe-se por via experimental que, por cada período de 5 minutos, chegam, em

média, 4 veículos a determinado posto abastecedor de combustíveis. Um

empregado entra ao serviço às 8 horas. Qual a probabilidade de ter de

aguardar mais de 10 minutos até à chegada de um veículo?

Resolução

X: nº de veículos que chegam ao posto abastecedor por período de 5 minutos

X segue Po(4)

Se

X1: nº de veículos que chegam ao posto no 1º período de 5 minutos

X2: nº de veículos que chegam ao posto no 2º período de 5 minutos

então

X1+X2: nº de veículos que chegam ao posto abastecedor em 10 minutos

Pelo Teorema da Aditividade de Poisson, considerando X1 e X2 independentes

e que ambas seguem Po(4), vem que X1+X2 também segue Po(4+4=8)

Logo P(X1+X2=0) na tabela da Po(8) vem igual a 0,03%.

Page 80: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 76

3.4. Estimação por intervalos

Conhecendo-se uma amostra em concreto, é possível estimar os valores dos

seus parâmetros caracterizadores através de métodos probabilísticos.

Por exemplo, suponhamos que numa fábrica produtora de açúcar se pretende

averiguar se o peso dos pacotes produzidos está, em média, dentro das

normas de qualidade exigíveis. Na impossibilidade de medição do peso de

todos os pacotes, pela morosidade e dispêndio de recursos que tal implicaria, a

estatística permite que, a partir da observação de uma única amostra, seja

possível inferir entre que valores varia o peso médio com um grau de confiança

ou probabilidade elevado. Assim, ao recolher um determinado número de

pacotes da produção total aleatoriamente, é possível calcular o peso médio de

acordo com as técnicas de estatística descritiva apreendidas atrás. Claro que

nada nos garante que esse valor coincide com o valor do parâmetro da

população em estudo. De facto, é até provável que não coincida e, mais, se

recolhermos outro conjunto idêntico de pacotes, o valor seja diferente. Isto é,

para cada amostra de dimensão n recolhida, a estimativa do parâmetro

assumiria valores distintos. Então, como retirar conclusões? Como garantir

algum nível de rigor?

O método a estudar neste capítulo – a estimação por intervalos – permite, a

partir da recolha de uma única amostra, aferir entre que valores seria de

esperar que variasse o parâmetro de interesse se nos empenhássemos a

recolher um número infinito de amostras. Isto é, por exemplo, caso o valor

amostral fosse de 1,02 kg, este método poderia, por exemplo, permitir afirmar

que seria altamente provável que o peso dos pacotes produzidos estivesse a

variar entre 0,92 kg e 1,12 kg. E esse resultado tem um determinado nível de

confiança associado: por exemplo, se dissermos que o nível de confiança ou

certeza implicado é de 95%, tal significa que, se nos fosse possível observar

um número infinito de amostras, o intervalo de valores apresentado

corresponderia aos resultados obtidos em 95% delas (os valores mais

usualmente utilizados são 90%, 95% ou 99% de confiança). Caberia depois à

empresa julgar se esses seriam ou não valores aceitáveis e proceder aos

eventuais reajustes necessários.

Page 81: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 77

A partir do conceito de intervalo de confiança para um parâmetro, é fácil

concluir que a sua especificação implica conhecer:

- o estimador do parâmetro em causa

- a sua distribuição de probabilidade

- uma estimativa particular daquele parâmetro

Como parâmetros de interesse e para efeitos de exemplificação, vão

considerar-se duas tipologias de intervalo: o intervalo de confiança para a

média de uma população normal e o intervalo de confiança para a proporção

de uma população binomial. Para efeitos de simplificação, vão considerar-se

apenas exemplos relativos a amostras de grande dimensão (na prática, n ≥ 100)

(i) Intervalo de confiança para a média µµµµ de uma população normal

Seja X (média amostral) o estimador da média da população. Porque a

distribuição é Normal, a distribuição deste estimador será:

);(n

NXσµ∩

Uma vez que apenas se encontra tabelada a distribuição N(0,1), torna-se

necessário calcular a variável reduzida correspondente:

)1;0(N

n

XZ ∩−= σ

µ

Esta variável permitirá deduzir a fórmula geral do intervalo de confiança para a

média µ de uma população normal:

+−n

cXn

cXσσ

;

Isto é, em torno do valor do estimador, é definido um intervalo de variação onde

é possível afirmar que o parâmetro a estimar está contido com um grau de

confiança δ . Esse intervalo de variação depende:

- da dimensão da amostra (n): quanto maior a dimensão da amostra,

menor a amplitude do intervalo. Este resultado explica-se facilmente: no

limite, se fosse possível observar todo o universo de dados (n=∞ ), o

valor amostral calculado corresponderia ao valor da população.

Page 82: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 78

- do desvio - padrão da população (σ ): quanto maior o desvio - padrão,

maior a amplitude do intervalo. Como se sabe, o desvio - padrão é uma

medida que caracteriza a dispersão da distribuição. Quanto maior o seu

valor, maior a variabilidade apresentada pelos dados, sendo natural que

a margem de variação de prever em torno do valor amostral recolhido

seja também, naturalmente, maior.

- do valor crítico (c): quanto maior o valor c, maior a amplitude do

intervalo. O valor crítico reflecte o nível de confiança adoptado.

Naturalmente, para que aumente a confiança de que o valor do

parâmetro a estimar está contido no intervalo, a sua amplitude deve

aumentar também (no limite, se o intervalo se alongasse de -∞ a + ∞ a

confiança seria total ou 100%). É possível encontrar o valor c na tabela

da normal (pois esta é a lei do estimador), da seguinte forma:

δ=≤≤− )( cZcP

já que assim é possível definir a fórmula geral do intervalo,

resolvendo a inequação em ordem ao parâmetro, µ :

δσµσδσµ =−≤≤−⇔=≤−≤− )()(

ncX

ncXPc

n

XcP

Se o desvio - padrão da população fôr desconhecido, utiliza-se este intervalo

considerando-se como estimativa de σ o desvio - padrão corrigido da amostra,

ou seja, s’=1

)( 2

−−

n

xxi , tal que:

+−

n

scX

n

scX

''

;

(ii) Intervalo de confiança para a proporção p de uma população binomial

Seja p (proporção amostral ou frequência observada na amostra) o estimador

da proporção p de uma população binomial. Sendo a amostra de grande

dimensão, a distribuição deste estimador será:

))1(

;(ˆn

pppNp

−∩

Page 83: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 79

Uma vez que apenas se encontra tabelada a distribuição N(0,1), torna-se

necessário calcular a variável reduzida correspondente:

)1;0()1(

ˆN

npp

ppZ ∩

−−=

Esta variável permitirá deduzir a fórmula geral do intervalo de confiança para a

proporção p de uma população binomial:

−+−−n

ppcp

npp

cp)ˆ1(ˆ

ˆ;)ˆ1(ˆ

ˆ

(como estimativa de )1( pp − foi utilizado ))ˆ1(ˆ pp −

Como é óbvio, pretende-se que o resultado possua o máximo de confiança

possível. No entanto, se uma maior confiança é pretendida na estimação, esta

conduz a possibilidades de erro maiores, dado que um elevado nível de

confiança conduz a um intervalo maior e, como tal, a precisão da estimação

diminui.

Exemplo: Consideremos 3 afirmações de alunos que aguardam a saída das pautas de

um exame de Estatística:

Afirm. 1: “Tenho a sensação que as pautas serão afixadas durante a manhã”

Afirm. 2: “Tenho quase a certeza que as pautas serão afixadas entre as 10h e

as 11h

Afirm. 3: “Tenho a certeza absoluta que as pautas ou são afixadas às 10h30 ou

já não são afixadas hoje”

Estas 3 afirmações permitem constatar facilmente que se se pretende maior

confiança na estatística, se tem que permitir que a possibilidade de erro

aumente. Por outro lado, se se permitir que o erro diminua, os extremos do

intervalo aumentam, embora o resultado perca alguma precisão. No entanto,

há que ter em atenção que, se um intervalo de confiança tem uma amplitude

demasiado grande, a estimativa não tem utilidade. Cabe ao investigador gerir

este “trade-off”.

Page 84: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 80

Isto leva a uma questão importante: o dimensionamento de amostras. Até aqui,

sempre se assumiu que as dimensões são conhecidas à partida, sem referir

como se determinam. No entanto, a resolução deste problema tem um enorme

interesse prático, já que (i) recolher e tratar uma amostra demasiado grande

para os resultados que se pretendem obter constitui um evidente desperdício

de recursos e (ii) recolher uma amostra cuja dimensão é insuficiente para

retirar conclusões constitui um erro.

A dimensão das amostras aumentará se se pretender garantir maior precisão

ao intervalo e/ou maior grau de confiança.

No capítulo dedicado a aplicações estatísticas, será possível ver como é

possível utilizar o conceito de intervalo de confiança ao controlo estatístico de

processos de qualidade.

Page 85: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 81

INTERVALOS DE CONFIANÇA Exercícios

Exercício 1

Suponha-se que se tem uma população normal com média µ desconhecida e

desvio - padrão 3, N (µ, 9) e uma amostra de 121 observações. Deduza um

intervalo de confiança para a µ com 95% de confiança.

Resolução Para os dados deste exercício, vem:

n=121

σ =3

c: 96,1%95)(%95)( =⇔=⇔=≤≤− ccDcZcP

e logo

[ ]535,0;535,011

396,1;

11396,1

; +−=

−−=

+− XXx

Xx

Xn

cXn

cXσσ

O intervalo [ ]535,0;535,0 +− XX contém o verdadeiro valor do parâmetro µ

com probabilidade ou confiança de 95%. Conhecida uma estimativa particular

daquele parâmetro, torna-se possível calcular entre que valores seria de

esperar que, com 95% de confiança, variasse µ .

Exercício 2

Numa cidade pretende-se saber qual a proporção da população favorável a

certa modificação de trânsito. Faz-se um inquérito a 100 pessoas, e 70

declaram-se favoráveis.

Determine um intervalo de confiança a 95% para a proporção de habitantes

dessa cidade favoráveis à modificação de trânsito.

Resolução n=100

p = 7,010070 =

c: 96,1%95)(%95)( =⇔=⇔=≤≤− ccDcZcP

e logo

Page 86: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 82

=

−−=

−+−−100

3,07,096,17,0;

1003,07,0

96,17,0)ˆ1(ˆ

ˆ;)ˆ1(ˆ

ˆ xxn

ppcp

npp

cp

[ ]7898,0;6102,0=

O intervalo [ ]7898,0;6102,0 contém o verdadeiro valor do parâmetro p com

probabilidade ou confiança de 95%.

Ou seja, a proporção de habitantes favoráveis à modificação de trânsito está

situada entre 61,02% e 78,98%, com probabilidade de 95%.

Exercício 3

Uma máquina fabrica cabos cuja resistência à ruptura (em kg/cm2) é uma

variável com distribuição Normal de média 100 e desvio - padrão 30. Pretende-

se testar uma nova máquina que, segundo indicações do fabricante, produz

cabos com resistência média superior. Para isso, observam-se 100 cabos

fabricados pela nova máquina, que apresentam uma resistência média de 110

kg/cm2. Admita que o novo processo não altera o desvio padrão da resistência

à ruptura dos cabos.

a) Determine um intervalo de confiança a 95% para a resistência média à

ruptura dos cabos produzidos pela nova máquina.

b) Suponha que pretendíamos obter um intervalo de confiança com a

mesma amplitude do anterior, mas com nível de confiança de 99%.

Quantos cabos deveriam ser observados?

Resolução

a)

X segue N(100; 302)

n=100 x =110 σ=30 γ=95%

c: 96,1%95)(%95)( =⇔=⇔=≤≤− ccDcZcP

e logo

[ ]88,115;12,10410

3096,1110;

103096,1

110; =

−−=

+− xx

ncX

ncX

σσ

Estima-se, com 95% de confiança, que a resistência média à ruptura dos cabos

produzidos pela nova máquina se situa entre 104,12 kg/cm2 e 115,88 kg/cm2.

Page 87: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 83

b) Amplitude = 115,88 – 104,12 = 11,76

Amplitude = Lim.Sup. - Lim.Inf. = (n

cXσ+ ) -(

ncX

σ− ) = n

2

Logo n

2 =11,76

Sendo que x =110 σ=30 c: 576,2%99)(%99)( =⇔=⇔=≤≤− ccDcZcP vem que n = 173 cabos

Exercício 4

Uma amostra de 20 cigarros é analisada para determinar o conteúdo de

nicotina, observando-se um valor médio de 1,2 mg. Sabendo que o desvio -

padrão do conteúdo de nicotina de um cigarro é 0,2 mg, diga, com 99% de

confiança, entre que valores se situa o teor médio de nicotina de um cigarro.

Resolução

X segue N(µ; 0,22)

n=20 x =1,2 σ=0,2 γ=99%

c: 576,2%99)(%99)( =⇔=⇔=≤≤− ccDcZcP

e logo

[ ]315,1;085,120

2,0576,22,1;

20

2,0576,22,1; =

−−=

+− xx

ncX

ncX

σσ

Estima-se, com 99% de confiança, que o teor médio de nicotina de um cigarro

se situa entre 1,085 mg e 1,315 mg.

Exercício 5

Admita-se que a altura dos alunos de uma escola segue distribuição Normal

com variância conhecida e igual a 0,051. Admita-se ainda que foi recolhida

uma amostra aleatória com dimensão n=25 alunos e calculada a respectiva

média amostral, tendo-se obtido o valor de 1,70m. Defina um intervalo que,

com probabilidade 95%, contenha o valor esperado da altura µ.

Page 88: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 84

Resolução

X segue N(µ; 0,051)

n=25 x =1,70 σ2=0,051 γ=95%

c: 96,1%95)(%95)( =⇔=⇔=≤≤− ccDcZcP

e logo

[ ]788,1;611,125

051,096,12,1;

25

051,096,17,1; =

−−=

+−xx

ncX

ncX

σσ

Estima-se, com 95% de confiança, que o teor médio de nicotina de um cigarro

se situa entre 1,085 mg e 1,315 mg.

Exercício 6

Numa fábrica, procura conhecer-se a incidência de defeituosos na produção de

uma máquina. Para tanto, colhe-se uma amostra de dimensão suficientemente

grande (1600 artigos), onde 10% dos artigos são defeituosos. Determine o

intervalo de confiança para a referida proporção com 90% de confiança.

Resolução n=1600

p =10%

c: 645,1%90)(%90)( =⇔=⇔=≤≤− ccDcZcP

e logo

=

−−=

−+−−1600

9,01,0645,11,0;

16009,01,0

645,11,0)ˆ1(ˆ

ˆ;)ˆ1(ˆ

ˆ xxn

ppcp

npp

cp

[ ]1123,0;0876,0=

Estima-se, com 90% de confiança, que a proporção de artigos defeituosos na

produção se situa entre 8,76% e 11,23%.

Exercício 7

O director fabril de uma empresa industrial que emprega 4000 operários emitiu

um novo conjunto de normas internas de segurança. Passada uma semana,

seleccionou aleatoriamente 300 operários e verificou que apenas 75 deles

conheciam suficientemente bem as normas em causa. Construa um intervalo

Page 89: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 85

de confiança a 95% para a proporção de operários que conheciam

adequadamente o conjunto das normas uma semana após a sua emissão.

Resolução n=300

p = 25,030075 =

c: 96,1%95)(%95)( =⇔=⇔=≤≤− ccDcZcP

e logo

=

−−=

−+−−300

75,025,096,125,0;

30075,025,0

96,125,0)ˆ1(ˆ

ˆ;)ˆ1(ˆ

ˆ xxn

ppcp

npp

cp

[ ]299,0;201,0=

Estima-se, com 95% de confiança, que a proporção de operários que

conheciam adequadamente o conjunto das normas se situa entre 20,1% e

29,9%.

Exercício 8

A Direcção de Marketing de uma empresa pretende conhecer a notoriedade da

marca de determinado produto. Nesse sentido, efectuou um inquérito junto de

1200 pessoas escolhidas aleatoriamente, verificando que 960 a conheciam.

a) Estime a proporção de pessoas conhecedoras da marca através de

um intervalo de confiança a 90%.

b) Se se pretender que a amplitude do intervalo de confiança da alínea

anterior não seja superior a 0,034, qual deve ser a dimensão mínima

da amostra?

c) Sabendo que o intervalo de confiança determinado pela Direcção de

Marketing foi [0,767; 0,833], calcule o nível de confiança utilizado

Resolução a) n=1200

p = 8,01200960 =

c: 645,1%90)(%90)( =⇔=⇔=≤≤− ccDcZcP

e logo

Page 90: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 86

=

−−=

−+−−1200

2,08,0645,18,0;

12002,08,0

645,18,0)ˆ1(ˆ

ˆ;)ˆ1(ˆ

ˆ xxn

ppcp

npp

cp

[ ]819,0;781,0=

Estima-se, com 90% de confiança, que a proporção de indivíduos

conhecedores da marca se situa entre 78,1% e 81,9%.

b) Amp.=Lim.Sup.-Lim.Inf. = (n

ppcp

)ˆ1(ˆˆ −+ ) – (

npp

cp)ˆ1(ˆ

ˆ −− ) = n

ppc

)ˆ1(ˆ2

Logo

1499034,02,0*8,0

*645,1*2)ˆ1(ˆ

2 ≥⇔≤=−n

nnpp

c

c) n

ppcp

)ˆ1(ˆˆ −+ = 0,833

Logo 86,2833,01200

2,0*8,08,0 =⇔=+ cc

E D(2,86) na tabela N(0,1) vem igual a 99,6%, a que corresponde o nível de

confiança utilizado

Exercício 9

O gabinete de projectos de uma empresa de material de construção civil

pretende estimar a tensão de ruptura do material usado num determinado tipo

de tubos.

Com base num vasto conjunto de ensaios realizados no passado, estima-se

que o desvio - padrão da tensão de ruptura do material em causa é de 70 psi.

Deseja-se definir um intervalo de confiança a 99% para o valor esperado da

tensão de ruptura, pretendendo-se que a sua amplitude não exceda 60 psi.

Qual o número de ensaios necessário para definir tal intervalo?

Resolução

n=? σ=70 γ=99%

c: 576,2%99)(%99)( =⇔=⇔=≤≤− ccDcZcP

Amplitude = n

2 Logo 366070

*576,2*2602 ≥⇔≤⇔≤ nnn

Page 91: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 87

Exercício 10

A empresa SCB controla regularmente a resistência à ruptura dos cabos por si

produzidos. Recentemente, foram analisadas as tensões de ruptura de 10

cabos SCB-33R, seleccionados aleatoriamente a partir de um lote de grandes

dimensões, tendo sido obtida uma média de 4537 kg/cm2. Existe uma norma

de 112 kg/cm2 em relação à variância, que é respeitada. O director comercial

pretende saber qual o intervalo de confiança, a 95%, para o valor esperado da

tensão de ruptura dos cabos do lote em causa. Defina esse intervalo.

Resolução

X segue N(µ; 112)

n=10 x =4537 σ=10,58 γ=95%

c: 96,1%95)(%95)( =⇔=⇔=≤≤− ccDcZcP

e logo

[ ]5,4543;5,453010

58,1096,14537;

10

58,1096,14537; =

−−=

+− xx

ncX

ncX

σσ

Estima-se, com 95% de confiança, que o tensão média de ruptura dos cabos

se situa entre 4530,5 kg/cm2 e 4543,5 kg/cm2.

Exercício 11

Uma amostra de 50 capacetes de protecção, usados por trabalhadores de uma

empresa de construção civil, foram seleccionados aleatoriamente e sujeitos a

um teste de impacto, e em 18 foram observados alguns danos.

Construa um intervalo de confiança, a 95%, para a verdadeira proporção p de

capacetes que sofre danos com este teste. Interprete o resultado obtido.

Resolução a) n=50

p = 36,05018 =

c: 96,1%95)(%95)( =⇔=⇔=≤≤− ccDcZcP

e logo

Page 92: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 88

=

−−=

−+−−50

64,036,096,136,0;

5064,036,0

96,136,0)ˆ1(ˆ

ˆ;)ˆ1(ˆ

ˆ xxn

ppcp

npp

cp

[ ]49305,0;22695,0=

Estima-se, com 95% de confiança, que a proporção de capacetes que sofre

danos se situa entre 22,7% e 49,3%.

Exercício 12

Qual deve ser o número de habitantes da cidade do Porto a seleccionar

aleatoriamente para estudar a proporção de portuenses que usam óculos, de

modo a garantir que um intervalo de confiança a 95% para essa proporção

tenha uma amplitude não superior a 8 pontos percentuais?

Resolução n = ?

Amp.= (n

ppcp

)ˆ1(ˆˆ −+ ) – (

npp

cp)ˆ1(ˆ

ˆ −− ) = n

ppc

)ˆ1(ˆ2

−< 0,08

c: 96,1%95)(%95)( =⇔=⇔=≤≤− ccDcZcP

Considerando que a proporção amostral é a que maximiza a amplitude (pior

dos casos), isto é, que a proporção amostral é 50% ( 0ˆ21)'ˆ1(ˆ =−=− ppp ), vem

que:

60008,05,0*5,0

*96,1*2)ˆ1(ˆ

2 >⇔<=−n

nnpp

c

Page 93: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 89

3.5. Testes de hipóteses

Todos os dias temos de tomar decisões respeitantes a determinadas

populações, com base em amostras das mesmas (decisões estatísticas). Nesta

tomada de decisões, é útil formular hipóteses sobre as populações, hipóteses

essas que podem ou não ser verdadeiras. A essas hipóteses chamamos

hipóteses estatísticas, as quais geralmente se baseiam em afirmações sobre

as distribuições de probabilidade das populações ou sobre alguns dos seus

parâmetros. Uma hipótese pode então ser definida como uma conjectura

acerca de uma ou mais populações.

Desta forma, os testes de hipóteses podem considerar-se uma segunda

vertente da inferência estatística, tendo por objectivo verificar, a partir de dados

observados numa amostra, a validade de certas hipóteses relativas à

população. O resultado do teste corresponde inevitavelmente a uma das duas

respostas possíveis para cada questão: afirmativa ou negativa. Em ambos os

casos corre-se o risco de errar. Uma das características do teste de hipóteses

é, justamente, a de permitir controlar ou minimizar tal risco.

Nos testes de hipóteses, e ao contrário dos intervalos de confiança, em vez de

procurar uma estimativa ou um intervalo para um parâmetro, admite-se ou

avança-se um valor hipotético para o mesmo, utilizando depois a informação da

amostra para confirmar ou rejeitar esse mesmo valor. A hipótese a testar

denomina-se, pois, de H0 ou de hipótese nula. O objectivo é verificar se os

factos observados a contradizem, levando a optar pela hipótese alternativa H1.

Isto é, a estratégia básica seguida no método de teste de hipóteses consiste

em tentar suportar a validade H1 de uma vez provada a inverosimilhança de H0.

Exemplo: Registos efectuados durante vários anos permitiram estabelecer que o nível de

chuvas numa determinada região, em milímetros por ano, segue uma lei

normal N(600;100). Certos cientistas afirmavam poder fazer aumentar o nível

médio µµµµ das chuvas em 50 mm. O seu processo foi posto à prova e anotaram-

se os valores referentes a 9 anos:

510 614 780 512 501 534 603 788 650

Que se pode concluir? Adopte um nível de significância de 5%.

Page 94: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 90

Resolução: Duas hipóteses se colocavam: ou o processo proposto pelos cientistas não

produzia qualquer efeito, ou este aumentava de facto o nível médio das chuvas

em 50 mm. Estas hipóteses podem formalizar-se do modo seguinte:

H0: µ=600 mm

H1: µ=650 mm

Este é um problema clássico de teste de hipóteses, em que está em causa

aceitar ou rejeitar a hipótese nula, em função dos resultados de uma amostra.

Ao utilizar uma amostra de uma população, estamos a lidar com leis de

probabilidades, logo não é possível de saber se a hipótese nula é verdadeira

ou falsa, mas apenas medir as probabilidades envolvidas na tomada de

decisão.

Podem-se definir 2 formas de especificar Ho e H1:

(i) hipótese simples contra hipótese simples

Ho: θ = θ0

H1: θ = θ1

(ii) hipótese simples contra hipótese composta

Ho: θ = θ0

H1: θ > θ0 ou θ < θ0 ou θ ≠ θ0

Estes testes designam-se respectivamente de teste unilateral à

direita, teste unilateral à esquerda e teste bilateral

Sendo os testes de hipóteses, portanto, um processo de inferência estatística

onde se procuram tomar decisões sobre a população com base numa amostra,

é natural que envolvam alguma margem de erro e que ocorram em situação de

incerteza. Estes erros não podem ser completamente evitados mas, no

entanto, pode-se manter pequena a probabilidade de os cometer. Compete ao

investigador decidir qual a dose de risco de se enganar em que está disposto a

incorrer. Vamos supor uma probabilidade de erro de, por exemplo, 5%. Nesse

caso, e avançada a hipótese nula Ho, o investigador só estaria disposto a

rejeitá-la se o resultado obtido na amostra fizesse parte de um conjunto de

resultados improváveis que teriam apenas, por exemplo, 5 chances em 100 de

Page 95: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 91

se produzir. Este tipo de formulação é conhecida como postura conservadora.

Ou seja, estamos mais propensos a achar que o novo processo não tem

qualquer efeito sobre o nível das chuvas (isto é, que tudo se mantém igual) do

que investir no novo processo (mudar), arriscando apenas quando houver

evidências da amostra muito fortes a favor do novo. Para que esta decisão

possa ser tomada de uma forma controlada, é conveniente pois que, à partida,

se fixe o valor a partir do qual se considera improvável a validade da hipótese

nula. Tal fixação corresponde à fixação da regra de decisão do teste.

A formalização desta regra passa pela especificação de uma região de região

de rejeição. A essa região, isto é, ao conjunto de valores “improváveis” que

conduzem à rejeição da hipótese nula dá-se o nome de Região Crítica. Ao

limite superior de risco, que na maior parte dos casos é de 10%, 5% ou 1%, dá-

se o nome de Nível de Significância do teste, sendo este que permite definir a

condição de rejeição de Ho. O Nível de Significância designa-se de α e

corresponde, então, à probabilidade de o resultado amostral levar à rejeição de

Ho, supondo Ho verdadeira, isto é, à probabilidade de se estar a cometer aquilo

a que se convenciona chamar de erro de 1ª espécie.

Como veremos no exemplo, existem também erros de 2ª espécie, cuja

probabilidade se designa pela letra β. Em resumo:

Quadro de decisão em condição de incerteza

Hipótese nula Ho

Decisão Hipótese Ho ser verdadeira:

Hipótese Ho ser falsa

Aceitar Ho

Decisão correcta (1-α) Erro de tipo II Beta (β)

Rejeitar Ho

Erro de tipo I Alfa (α)

Decisão correcta (1-β)

Como decidir? Visto que se trata de testar o valor de µ, a variável de decisão

será X . Considerando Ho verdadeira vem que

)9

100;600(NX ∩ .

Page 96: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 92

Em princípio, grandes valores de X são improváveis, pelo que se opta pela

seguinte regra de decisão:

Se X fôr demasiado grande, isto é, superior a um valor crítico c que tem

apenas 5 chances em 100 de ser ultrapassado, opta-se por H1 com

probabilidade 5% de se estar a cometer um erro. Se tal não acontecer,

conserva-se Ho, por falta de provas suficientes para não o fazer.

Logo, sendo

P(Rejeitar Ho / Ho) = α = 5%, vem que

⇔=−>−⇔==> 05,0)

9

100600

(05,0)600/(c

n

XPcXP σ

µµ

)3(83,6543

100645,1600 =+=⇔ xc

A regra de decisão é, então, a seguinte:

- rejeitar H0 em favor de H1, se o valor amostral fôr superior a 654,83(3)

- conservar H0 em detrimento de H1 se fôr inferior a 654,83(3)

Isto é, a Região Crítica deste teste, isto é, o conjunto de acontecimentos que

levam à rejeição de H0 corresponde a todos os valores de X >654,83(3).

Os dados recolhidos indicavam X =610,2 mm, pelo que a decisão é conservar

H0 , isto é, considerar que o processo científico não produz efeitos.

RR: Região Crítica ou de

Rejeição

RA: Região de Aceitação

Xµµµµ = 600

RA=(1-αααα) RR=αααα

654,83(3)

Page 97: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 93

No entanto, os erros incorridos não se ficam apenas pelos de 1ª espécie.

Existem também erros de 2ª espécie. Isto é, à partida parte-se do princípio

que H0 é verdadeira e só se rejeitará essa hipótese se ocorrerem

acontecimentos pouco prováveis.

No entanto, é possível alternativamente partir do princípio que é H1 que é

verdadeira, ou seja, considerar que o processo científico é realmente eficaz no

aumento do nível médio das chuvas, mas que, infelizmente, o número de

valores observado não permite observar resultados ou esses resultados foram

insuficientes.

Supondo então que H1 é verdadeira (µ=650 mm), então vem que:

)9

100;650(NX ∩

A probabilidade de rejeitar H1 erradamente, isto é, de se cometer um erro de 2ª

espécie, vem então igual a:

P(Rejeitar H1 / H1)=β

%57,55)14,0)1,0(()

9100

650)3(83,654()650/)3(83,654( =≤=−≤−==≤ NP

n

XPXP σ

µµ

É através das probabilidades α e β que se procura o melhor teste de hipóteses,

sendo o teste ideal o que minimiza simultaneamente ambos os valores. No

entanto, e como α e β se referem a realidades opostas e variam em sentido

contrário, tal não é possível. O que na maior parte dos casos se faz é fixar o α

(para amostras de dimensão n) e tentar minimizar β.

1-ββββ RR

ββββ RA

µµµµ = 650 X

Page 98: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 94

Região de rejeição e de aceitação da hipótese nula Unilateral Bilateral Unilateral à esquerda à direita H1: µµµµ < 600 H1: µµµµ ≠ 600 H1: µµµµ > 600

Chama-se potência de um teste à probabilidade de rejeitar H0 quando esta é

falsa. Esta é uma decisão certa, não implica erro, e é complementar do erro de

2ª espécie. Logo, quanto menor o erro de 2ª espécie, maior será o valor da

potência do teste e, logo, maior a sua qualidade (diz-se que o teste é mais

potente) . Quando H1 é uma hipótese composta (>, < ou ≠ ), a potência do teste

é variável, dependendo do valor do parâmetro que não é fixo. Nesse caso fala-

se em função potência do teste = 1 -β (µ1)

Resumindo: passos para construção de um teste de hipóteses:

Passo No 1: Formular as hipóteses nula e alternativa

Passo No 2: Decidir qual estatística (estimador) será usada para julgar a Ho e a

variável de decisão

Passo No 3: Definir a forma da Região Crítica, em função da hipótese H1

Passo Nº 4: Fixar o nível de significância

Passo Nº 5: Construir a Região Crítica em função do nível de significância

Passo Nº 6: Cálculo (eventual) da potência do teste

Passo Nº 7: Calcular a estatística da amostra

Passo No 8: Tomar a decisão: rejeição ou não de Ho

RA RA RA

RR αααα

RR αααα/2 RR

αααα

RR αααα/2

1−α1−α1−α1−α 1−α1−α1−α1−α 1−α1−α1−α1−α

Page 99: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 95

TESTES DE HIPÓTESES Exercícios

Exercício 1

Suponha que o director de qualidade pretende averiguar se o peso dos pacotes

de arroz produzidos corresponde ao valor assinalado na embalagem. Seja X a

variável que representa o peso de um pacote de arroz. Suponha que

)01,0;( 2µNX ∩ e que se conhece a seguinte amostra:

1,02 0,98 0,97 1,01 0,97 1,02 0,99 0,98 1,00

Será que, para um nível de significância de 5% se pode dizer que o peso médio

corresponde ao peso de 1 kg assinalado na embalagem?

Resolução Passo 1

Formular as hipóteses: Ho: µµµµ = 1 H1: µµµµ < 1

Passo 2

A estatística a ser utilizada será a média amostral

Passo 3

A região crítica é formada por todos os valores menores ou iguais a c

Passo 4

Assumir um nível de significância de 5%

Passo 5

Para α=5%, determinar a região de rejeição e aceitação. Logo, sendo

P(Rejeitar Ho / Ho) = α = 5%, vem que

⇔=−<−⇔==< 05,0)

901,0

1(05,0)1/(

c

n

XPcXP σ

µµ

9945,0301,0

645,11 =−=⇔ xc

Logo, ] ]9945,0;∞−=RC

Page 100: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 96

Passo 6

Calcular a estatística == 9933,091

ixX

Passo 7 Tomar a decisão

Como o valor da amostra foi 0,9933 e é menor que o valor crítico 0,9945,

rejeita-se Ho

Ou seja, considera-se que o arroz contido em cada pacote era inferior ao

indicado. No entanto, há o risco de se mandar parar a produção para revisão

do equipamento sem necessidade. Reduzindo a probabilidade de isso ocorrer

de 5% para 1%, vem:

-∞ 0 +∞ 0,9922 0.9945

Valor da amostra: 0,9933 A única mudança será no Valor Crítico, que de 0,9945 para 0,9922. Neste

caso, aceitaremos Ho, ou seja, consideraremos que não há qualquer anomalia

na produção.

Exercício 2

Numa cidade, pretende-se saber se metade da população é favorável à

construção de um centro comercial. Faz-se um inquérito a 200 pessoas, e 45%

declaram-se favoráveis. Estes valores contradizem a hipótese?

Resolução

Passo 1

Formular as hipóteses: Ho: p = 0,5 H1: p < 0,5

α=1% α=5%

RA: Continuar a produção

RR: Parar a produção

Page 101: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 97

Passo 2

A estatística a ser utilizada será a proporção amostral, onde o cuidado deve ser

trabalhar com grandes amostras.

Passo 3

A região crítica é formada por todos os valores menores ou iguais a c

Passo 4

Assumir um nível de significância de 5%

Passo 5

Para α=5%, determinar a região de rejeição e aceitação.

Logo, sendo

P(Rejeitar Ho / Ho) = α = 5%, vem que

⇔=−

−<−

−⇔==< 05,0)

200)5,01(5,0

5,0)1(

ˆ(05,0)5,0/ˆ(

c

npp

ppPpcpP

442,0200

)5,01(5,0645,15,0 =−−=⇔ xc Logo, ] ]442,0;∞−=RC

Passo 6

p =0,45

Passo 7

Como o valor amostral 0,45 é maior que o valor crítico 0,442, não se rejeita Ho

-∞ 0 +∞

Valor amostral: 0,45 0,442

Ou seja, apesar de apenas 45% dos habitantes se terem manifestado a favor

da construção do centro comercial, essa margem não é suficiente para decidir

deixar de o construir.

RR: Não construir o

centro comercial α=5%

RA: Decidir pela construção RR: Parar a

construção

Page 102: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 98

Exercício 3

O peso dos pacotes de farinha de 1 kg, produzidos por uma fábrica, é uma

variável normalmente distribuída, com desvio padrão 0,01. Da produção de

determinado dia é retirada uma amostra de 49 pacotes, com peso médio de

0,998 Kg.

Pode-se afirmar, a um nível de significância de 1%, que o peso médio dos

pacotes de farinha nesse dia não está de acordo com o peso indicado?

Resolução

X segue N(µ; 0,012)

n = 49

x = 0,998

α = 1%

H0: µ = 1

H1: µ < 1

P(Rejeitar Ho/Ho verdadeira) = α = 1%

997,0326,2

49

01,01

01,0)

49

01,01

(01,0)1/( =⇔−=−⇔=−≤−⇔==≤ ccc

n

XPcXP σ

µµ

Como x = 0,998 > c = 0,997, não pertence à região crítica, logo não se rejeita

Ho a um nível de significância de 1% (não se pode afirmar que o peso médio

não esteja de acordo com o indicado).

Exercício 4

Numa região onde existem entre os maiores de 18 anos 50% de fumadores, é

lançada uma intensa campanha anti-tabaco.

Ao fim de três meses, realiza-se um mini-inquérito junto de 100 cidadãos com

mais de 18 anos, registando-se 45 fumadores.

a) Com 1% de significância, pode concluir-se que a campanha surtiu

efeito?

b) Em caso negativo, qual seria a dimensão da amostra a partir da qual

aquela percentagem permitiria afirmar que a cmapnha atingiu o fim em

vista?

Page 103: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 99

Resolução

a) n = 100

p = 0,45

α = 1%

H0: p = 0,5 (a campanha não surtiu efeito)

H1: p < 0,5 (a campanha surtiu efeito)

P(Rejeitar Ho/Ho verdadeira) = α = 1%

384,0326,2

1005,0*5,0

5,001,0)

1005,0*5,0

5,0

)1(

ˆ(01,0)5,0/( =⇔−=−⇔=−≤

−−⇔==≤ c

cc

npp

ppPpcXP

Como p = 0,45 > c = 0,384, não pertence à região crítica, logo não se rejeita

Ho a um nível de significância de 1% (a campanha não surtiu efeito).

b) ⇔=−≤−

−⇔==≤ 01,0)5,0*5,05,045,0

)1(

ˆ(01,0)5,0/45,0(

nnpp

ppPpXP

⇔ 541326,25,0*5,05,045,0 =⇔−=−

n

n

Exercício 5

Um fabricante afirma que o tempo médio de vida de um certo tipo de bateria é

de 240 horas, com desvio-padrão de 20 horas. Uma amostra de 18 baterias

forneceu os seguintes valores:

237 242 232

242 248 230

244 243 254

262 234 220

225 236 232

218 228 240

Supondo que o tempo de vida das baterias se distribui normalmente, poder-se-á

concluir, a 5% de significância, que as especificações não estão a ser cumpridas?

Page 104: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 100

Resolução

X segue N(µ; 202)

n = 18

x = = 05,237181

ix

α = 5%

H0: µ = 240

H1: µ < 240

P(Rejeitar Ho/Ho verdadeira) = α = 1%

25,232645,1

18

20240

05,0)

18

20240

(05,0)240/( =⇔−=−⇔=−≤−⇔==≤ ccc

n

XPcXP σ

µµ

Como x = 237,05 > c = 232,25, não pertence à região crítica, logo não se

rejeita Ho a um nível de significância de 1% (não se pode afirmar que as

especificações não estão a ser cumpridas).

Exercício 6

Uma empresa de cerâmica tem, em dada secção, fornos controlados por

termóstatos para manter a temperatura no interior dos fornos a 600 graus

centígrados. A experiência tem demonstrado que a variância dos valores da

temperatura no interior desses fornos é de 360.

A empresa fornecedora dos fornos comercializa agora um novo tipo de

controlador, que é anunciado como garantindo que as temperaturas se mantêm

dentro do limite desejado. Foram registadas 5 medidas de temperatura de

fornos regulados para 600º, utilizando novos controladores:

620º 595º 585º 602º 608º

Para 5% de significância, poder-se-á concluir que a temperatura não se afasta

significativamente do valor desejado?

Resolução

X segue N(µ;360)

n = 5

Page 105: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 101

x = = 60251

ix

α = 5%

H0: µ = 600

H1: µ > 600

P(Rejeitar Ho/Ho verdadeira) = α = 5%

96,613645,1

5

97,18600

95,0)

5

360

600(05,0)600/( =⇔=−⇔=−≤−⇔==≥ c

cc

n

XPcXP σ

µµ

Como x = 602 < c = 613,96, não pertence à região crítica, logo não se rejeita

Ho a um nível de significância de 1% (a temperatura não se afasta

significativamente do valor desejado).

Exercício 7

O peso dos ovos de chocolate produzidos numa fábrica segue distribuição

normal com variância 90,25.

a) O fabricante diz que o peso médio é de 160 g. Foi recolhida uma

amostra de 100 ovos, cujo peso médio foi de 158, 437 g. Teste, a um

nível de significância de 1%, se a afirmação do fabricante pode ser

considerada verdadeira, ou se, pelo contrário, o verdadeiro peso dos

ovos será menor.

b) Qual o nível de significância a partir do qual a conclusão seria diferente?

Resolução

a) X segue N(µ; 90,25)

n = 100

x = 158,437

α = 1%

H0: µ = 160

H1: µ < 160

P(Rejeitar Ho/Ho verdadeira) = α = 1%

Page 106: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 102

79,157326,2

100

5,91

01,0)

100

25,90

160(01,0)160/( =⇔−=−⇔=−≤−⇔==≤ c

cc

n

XPcXP σ

µµ

Como x = 158,437 > c = 157,79, não pertence à região crítica, logo não se

rejeita Ho a um nível de significância de 1% (a afirmação do fabricante pode

ser considerada verdadeira).

b)

%5)645,1()

100

25,90

160437,158()160/437,158( =⇔=−⇔=−≤−⇔==≤ ααασ

µαµ F

n

XPXP

Exercício 8

Um jornal semanário afirma ter atingido, numa região, a percentagem, até

então nunca atingida por qualquer semanário, de 60% de leitores que

regularmente compram um jornal desse tipo.

Efectuando um inquérito junto de 600 leitores, 55% declararam adquirir, por

hábito, o semanário em causa.

Adoptando um nível de significância de 1%, pronuncie-se quanto à projecção

que o semanário reclama.

Resolução

n = 600 p = 0,55 α = 1%

H0: p = 0,6

H1: p < 0,6

P(Rejeitar Ho/Ho verdadeira) = α = 1%

5535,0326,2

6004,0*6,0

6,001,0)

6004,0*6,0

6,0

)1(

ˆ(01,0)6,0/( =⇔−=−⇔=−≤

−−⇔==≤ c

cc

npp

ppPpcXP

Como p = 0,55 < c = 0,5535, pertence à região crítica, logo rejeita-se Ho a um

nível de significância de 1% (o semanário não atingiu a projecção que

reclama).

Page 107: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 103

Exercício 9

Um molde de injecção tem produzido peças de um determinado material

isolante térmico com uma resistência à compressão com valor esperado de

5,18 kg/cm2 e variância 0,0625 (kg/cm2)2. As últimas 12 peças produzidas

nesse molde foram recolhidas e ensaiadas, tendo-se obtido para a resistência

média à compressão o valor de 4,95 kg/cm2.

a) Poder-se-á afirmar, a um nível de significância de 5%, que as peças

produzidas recentemente são menos resistentes do que o habitual?

b) Qual a potência do teste efectuado anteriormente, admitindo que o valor

esperado da resistência à compressão das peças produzidas

recentemente é de 4,90 kg/cm2?

Resolução

a) X segue N(µ; 0,0625)

n = 12

x = 4,95

α = 5%

H0: µ = 5,18

H1: µ < 5,18

P(Rejeitar Ho/Ho verdadeira) = α = 5%

061,5645,1

12

25,018,5

05,0)

12

0625,0

18,5(05,0)18,5/( =⇔−=−⇔=−≤−⇔==≤ c

cc

n

XPcXP σ

µµ

Como x = 5,18 > c = 5,061, não pertence à região crítica, logo não se rejeita

Ho a um nível de significância de 1% (as peças produzidas recentemente não

são menos resistentes do que o habitual).

b) Potência = 1-β

β = (Conservar Ho/H1 verdadeira)

%6,495040,01)01,0(1)

12

0625,0

9,4061,5()9,4/061,5( =−=−=−>−==> F

n

XPXP σ

µµ

Page 108: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 104

Exercício 10

Um jornal desportivo noticiou que o número de espectadores de um programa

desportivo que é apresentado na televisão aos domingos à noite está

igualmente dividido entre homens e mulheres.

De uma amostra aleatória de 400 pessoas que vêem regularmente o referido

programa, concluiu-se que 240 são homens.

Pode-se concluir, para um nível de significância de 10%, que a notícia é falsa?

Resolução

n = 400 p = 0,6 α = 10%

H0: p = 0,5

H1: p > 0,5

P(Rejeitar Ho/Ho verdadeira) = α = 10%

53205,0282,1

4005,0*5,0

5,09,0)

4005,0*5,0

5,0

)1(

ˆ(1,0)5,0/( =⇔=−⇔=−≤

−−⇔==≥ c

cc

npp

ppPpcXP

Como p = 0,6 > c = 0,53205, pertence à região crítica, logo rejeita-se Ho a um

nível de significância de 1% (a notícia é falsa).

Page 109: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 105

3.6. Aplicações estatísticas

Fiabilidade de componentes e sistemas 3.6.1 Conceito de fiabilidade Define-se fiabilidade como sendo a probabilidade de um sistema (ou

componente) desempenhar a função para a qual foi concebido, nas condições

previstas e nos intervalos de tempo em que tal é exigido.

A análise da fiabilidade será, então, um método de quantificar o que se espera

que aconteça e pode ser usada para indicar méritos relativos de sistemas,

tendo em atenção um pré-definido nível de fiabilidade.

A fiabilidade de um componente pode ser obtida a partir da sua taxa de

avarias. Se um sistema fôr constituído por vários componentes, então a

fiabilidade será dependente da fiabilidade dos componentes que compõem

esse mesmo sistema.

É necessário, quando se apresentam os resultados de um estudo de fiabilidade

saber expô-los, pois os interpretadores poderão não ter a noção daquilo que se

está a querer transmitir. Assim, dizer que a fiabilidade de um sistema ou

componente é de 0,998 pode não significar muito; no entanto, se tal facto fôr

traduzido em que, por ano, o sistema em questão estará fora de serviço por

avaria num período de 9 horas já significa alguma coisa.

Como o estudo da fiabilidade se trata de um estudo extremamente importante,

pois que muitas vezes estão em jogo vidas humanas, é importante desenvolver

um estudo de probabilidade relativo ao funcionamento adequado de um

componente ou sistema.

3.6.2 Fiabilidade de um sistema Ao analisar a fiabilidade de um sistema constituído por vários componentes, é

necessário estudar a fiabilidade desses componentes e a forma como estão

ligados (estrutura do sistema e definição do funcionamento do sistema). De

seguida, são apresentados 3 casos: (i) as associações de componentes em

Page 110: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 106

paralelo; (ii) a associação de n unidades idênticas em paralelo em que é

apenas necessário o funcionamento de m (m<=n) para o sistema funcionar; (iii)

e as associações em série.

(i) Associação em paralelo

Consideremos vários componentes redundantes e independentes:

Uma vez que os componentes são redundantes, basta apenas um para que o

sistema funcione. Considerando um sistema composto por apenas 2

componentes, se cada um dos componentes estiver no seu período de vida útil,

a fiabilidade do sistema (Rs) é dada por:

Rs = P (funcionar pelo menos um componente)

= P (funcionarem 1 ou 2 componentes)

= 1 – P (não funcionar nenhum)

= 1 – P (não funcionar comp.1 e não funcionar comp.2)

= 1 - P (não funcionar comp.1) x P(não funcionar comp.2)

pois o funcionamento é independente

= 1 – q1 x q2

onde q1 e q2 são, respectivamente as indisponibilidades (isto é, as

probabilidades de não funcionamento) das componentes 1 e 2. Se houver n

componentes ligadas em paralelo, a fiabilidade do sistema é dada por

Rs = 1 - q1 x q2 x q3 x … x qn = 1 - ∏i

iq

1

2

3

4

Page 111: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 107

Veja-se que, no caso de sistemas redundantes, a fiabilidade do sistema

aumenta à medida que aumenta o número de componentes ligadas ao sistema

(que representam como garantias de funcionamento adicionais).

(ii) Associação em paralelo de componentes não redundantes

Se o sistema não fôr redundante, as condições de funcionamento e de avaria

para o sistema têm de ser definidos, isto é, é necessário saber qual o número

mínimo de componentes que necessitam de estar em funcionamento para que

o sistema sobreviva.

Para o efeito, vai considerar-se de novo um sistema composto por quatro

componentes em paralelo. Se as componentes forem todas iguais, com

probabilidade de funcionamento p e de indisponibilidade q, a probabilidade

associada a cada um dos estados possíveis (1, 2, 3 ou 4 componentes, no

mínimo, a funcionar), a fiabilidade do sistema é dada pelo quadro seguinte:

Nº mínimo de componentes

necessárias ao funcionamento do sistema

Probabilidade de o sistema funcionar

4 p4

3 p4 + 4p3q 2 p4 + 4p3q + 6p2q2 1 p4 + 4p3q + 6p2q2 + 4pq3

Ou seja, a fiabilidade do sistema funcionar pode ser calculada recorrendo à lei

binomial. Assim, por exemplo, para um nº mínimo de 3 componentes

necessárias, vem:

Rs = P(pelo menos 3 componentes a funcionar)

= P(funcionarem as 4) + P (funcionarem 3)

= 34343

44444

−− + qpCqpC

= qpp 34 4+

Por exemplo, se todos os componentes tivessem fiabilidade 0,9 (p=0.9), então

a fiabilidade de um sistema deste tipo seria 94,77%.

Page 112: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 108

(iii) Associação em série

Quando os componentes se encontram associados em série, para que o

sistema funcione torna-se necessário que todos os componentes se encontrem

em bom estado de funcionamento.

No caso mais vulgar de os componentes serem independentes, a fiabilidade do

sistema é dada por

Rs = p1 x p2 x p3 x ... x pn

No caso de todas as componentes serem iguais

Rs = pn

Facilmente se depreende que a fiabilidade do sistema diminui à medida que

aumenta o número de componentes ligadas em série.

A distribuição exponencial é a mais usada em estudos de fiabilidade, já que a

probabilidade de um componente sobreviver até ao instante t é dada por te λ−

A probabilidade de avariar até ao instante t é dada por te λ−−1

Num sistema com várias componentes em série, em que o componente se

encontra a funcionar no seu período de vida útil, a fiabilidade do sistema é

dada por

= =

−n

ii t

s eR 1

λ

(iv) Outros sistemas

Quando a estrutura do sistema não puder ser enquadrada em nenhuma das

anteriores, terão que ser analisadas técnicas mais gerais, tais como a árvore

de avarias. O método consiste basicamente em identificar todos os modos

possíveis de avaria e controlá-los. Assim, supondo que se pretende analisar a

fiabilidade da iluminação de uma sala com uma lâmpada.

1 2 3

Page 113: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 109

Se o objectivo fôr calcular a probabilidade de falta de energia (acontecimento

secundário) vem

P (avaria) = P (A ∪ B) = P (A) + P(B) + P(A)xP(B)

Para o acontecimento prioritário (sala às escuras) vem:

P(sala às escuras) = P(falta de energia ∪ lâmpada estragada)

Esta metodologia pode ser aplicada a estudos de fiabilidade de sistemas de

protecção e esquemas de comando (fiabilidade de mísseis e reactores

nucleares, por exemplo).

Sala às escuras

Falta de energia

Lâmpada estragada

Avaria na rede

Actuação da protecção

Page 114: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 110

3.7. Aplicações estatísticas

Controlo Estatístico de Qualidade É do conhecimento geral que nenhum processo de produção executa dois

produtos iguais. Os processos industriais são caracterizados por produzirem

peças cujas características variam dentro de certos valores toleráveis. As

variações são inevitáveis, podendo ser grandes, pequenas, muito ou pouco

dispersas. O conhecimento do tipo, da extensão e da evolução dessas

variações é extremamente importante para podermos garantir que nos é

possível produzir produtos que vão cumprir as especificações, para eles

definidas, a um nível aceitável.

Os testes descritos anteriormente referiam-se em situações em que o estudo

não era cronológico. É simples imaginar situações onde, pelo contrário, o

processo a analisar deva ser monitorado ao longo do tempo. Situações deste

tipo ocorrem em linhas de fabrico de produtos, estudos de conservação de

materiais e máquinas, qualidade de serviços. Duma forma geral, entende-se

por controle de qualidade a monitorização de um processo, cujos resultados de

natureza quantitativa se devem encontrar dentro de determinados limites. Um

processo está sob controle se os resultados estão em conformidade com os

limites impostos; caso contrário, o processo deve ser investigado para que

sejam detectadas as causas do desvio. A "qualidade" pode referir-se a um

valor fixo, que constitui o objectivo desejado (por exemplo, a conformidade da

média relativamente a "limites normais"). A avaliação do processo implica, que

em certos intervalos de tempo se proceda a uma amostragem.

O controlo estatístico de qualidade permite uma intervenção nos processos, no

sentido de se ajustarem e corrigirem os processos, antes de qualquer alteração

não natural passar a fazer efeito de forma contínua. As cartas de controlo são

um instrumento poderoso que permite identificar as causas de variação não

natural nos processos.

Ao definir uma carta de controle para a média, é necessário começar por definir

a norma para µ (µ0) e 2 níveis de controle: os de vigilância “garantida” (limites

Page 115: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 111

inferior e superior de vigilância: LIV e LSV) e os de controle (limites inferior e

superior de controle: LIC e LSC). Se a média amostral cair fora da área de

tolerância definida pelos LIC e LSC, é por que há alguma anomalia e deve

haver paragem da produção.

Supõe-se que a variável em estudo segue Distribuição Normal, sendo os LIC e

LSC calculados da seguinte forma:

LIC / LSC = µ0 +/- n

(metodologia baseada na estimação por intervalos estudada atrás)

Ao definir uma carta de controle para a proporção, por exemplo, de

defeituosos, é necessário começar por definir a norma para p (p0) e 2 níveis de

controle: os de vigilância “garantida” (limites inferior e superior de vigilância: LIV

e LSV) e os de controle (limites inferior e superior de controle: LIC e LSC). Se

a proporção amostral cair fora da área de tolerância definida pelos LIC e LSC,

é por que há alguma anomalia e deve haver paragem da produção.

Os LIC e LSC calculados da seguinte forma:

Page 116: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 112

LIC / LSC = p0 +/- n

pp )ˆ1(ˆ −

(metodologia baseada na estimação por intervalos estudada atrás) As cartas de controlo são instrumentos fáceis e simples de aplicar pelos

executantes, no sentido de se obter o controlo contínuo do processo. Podem

ser traçadas nos próprios locais de trabalho, dando informações preciosas

sobre os momentos em que são necessárias acções correctivas.

Desde que o processo esteja sob controlo estatístico, as cartas de controlo

permitem prever de forma adequada o comportamento do processo, e melhorar

os processos, com base na informação disponível nas cartas, no sentido de

reduzir a sua variabilidade.

As cartas são elaboradas a partir de medições efectuadas de uma

característica do processo (a média, por exemplo). Os dados são obtidos de

amostras de tamanho constante, geralmente 3 ou 5 unidades, recolhidas

consecutivamente em intervalos de tempo constantes. Deve ser elaborado um

plano de recolha de dados, que deverá ser usado como base para a colheita,

registo e marcação dos dados no gráfico. As amostras a utilizar devem ser de

tamanho racional, isto é, devem ser eficazes para o controlo sem acarretar

esforço demasiado e desnecessário na colheita.

A interpretação dos limites de controlo é a seguinte: se a variabilidade peça a

peça do processo permanecesse constante e nos níveis encontrados, seria

legítimo concluir que na base de um ponto fora dos limites de controlo estariam

causas que importa conhecer e sanear. Um ponto fora do controlo deve

merecer uma análise imediata quanto à causa.

Pode ser mantido um registo das médias amostrais por meio de uma carta

como a representada na figura abaixo, denominada carta de controle de

qualidade.

Cada vez que for calculada uma média amostral, ela será representada por um

ponto particular. Enquanto eles caírem entre o limite inferior e o superior, o

processo está sob controle. Quando um ponto estiver fora desses limites de

Page 117: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 113

controle (como ocorreu com a terceira amostra tomada na quinta-feira), há a

possibilidade de haver alguma anomalia, o que justifica uma investigação.

Os limites de controlo especificados são denominados de limites de confiança.

A escolha, em cada caso, depende das circunstâncias particulares de cada

processo.

Média Amostral

(cm) Segunda-feira Terça-feira Quarta-feira Quinta-feira Sexta-feira

• •

• •

• •

• • •

• • •

• •

• • •

• • •

• •

• •

50

LSuperior

LInferior

Page 118: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 114

3.8. Aplicações estatísticas

Tratamento estatístico de inquéritos 3.8.1 Teste de independência do qui-quadrado O teste do é muito eficiente para avaliar a associação existente entre

variáveis qualitativas. Trata-se de um teste de hipóteses semelhante aos

anteriormente estudados, mas que se inclui na categoria dos testes não-

paramétricos, isto é, aqueles que não incidem explicitamente sobre um

parâmetro de uma ou mais populações (por exemplo, o valor esperado ou a

proporção, como os estudados anteriormente). No entanto, a lógica de

formulação das hipóteses e de definição de uma regra de decisão é

equivalente aos testes paramétricos. O princípio básico deste método não-

paramétrico é comparar as divergências entre as frequências observadas e as

esperadas.

Este teste encontra aplicabilidade no tratamento estatístico de inquéritos. De

facto, para além do tratamento frequencista dos inquéritos, é por vezes

interessante aferir da existência de relações estatísticas relevantes entre as

diversas questões (por exemplo, testar se há alguma coerência entre quem

respondeu à opção 1 da pergunta X e à opção 2 da pergunta Y). O estudo

destas relações encontra aplicabilidade no campo das análises de mercado,

em que o objectivo é proceder à sua segmentação. A existência de

associações entre as questões permite determinada um vector comum entre

grupos de inquiridos que responderam de forma semelhante a certo tipo de

questões (concluir algo como que os habitantes de uma dada área foram

sempre os que assinalaram determinado tipo de respostas e constituem, por

isso, um segmento geográfico autónomo e com características próprias de

entre o total dos inquiridos).

De uma maneira geral, pode dizer-se que dois grupos se comportam de modo

semelhante se as diferenças entre as frequências observadas e as esperadas

em cada categoria forem muito pequenas ou próximas de zero.

Page 119: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 115

Exemplo: Um pesquisador deseja verificar se há associação entre três cursos de uma

universidade e dependência de drogas. Entrevistou 120 alunos, sendo 25 de

Medicina, 35 de Farmácia e 60 de Biologia, perguntando sobre o uso de

drogas, admitindo somente duas respostas: sim ou não. Após o processamento

dos dados, chegou-se à seguinte tabela de distribuição de frequências:

Medicina Farmácia Biologia Total

Usa drogas 10 20 30 60

Não usa drogas 15 15 30 60

Total 25 35 60 120

As tabelas como aquela na qual se apresentam os resultados referentes ao

exemplo são habitualmente designadas de tabelas de contingência. Admita-

se que os resultados que nela figuram resultam de amostras aleatórias. Tais

resultados representam o número de observações incluídas nas diferentes

combinações das classes nas quais as duas variáveis em estudo se exprimem.

Mod. 1 Mod. 2 … Mod. n Total

Modalidade 1 n11 n12 … … n1.

Modalidade 2 n21 n22 … … n2.

… … … … … …

Modalidade n … … … nnn ni.

Total n.1 n.2 … n.j n

onde

nij: frequência observada na célula ij

n.j: frequência marginal observada na modalidade j

ni.: frequência marginal observada na modalidade i

n: dimensão da amostra

Page 120: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 116

O objectivo do teste é o de verificar se as duas variáveis em questão são ou

não relacionadas. As hipóteses nula e alternativa são então as seguintes:

Ho: As variáveis são independentes

H1: As variáveis não são independentes

As frequências observadas são obtidas directamente dos dados da amostra,

enquanto que as frequências esperadas são calculadas a partir destas, sob o

pressuposto de que Ho é verdadeira, isto é, admitindo a hipótese de

independência.

Na prática, a frequência esperada é calculada pela multiplicação do total da

coluna respectiva pelo total da linha a que pertence, dividindo-se o produto pela

dimensão total da amostra:

n

nne ji

ij.. *

=

O é calculado da seguinte forma:

=−

i j ij

ijij

e

en 2)(

Note-se que o numerador faz referência à diferença entre frequência observada

e frequência esperada, que deverá ser calculada para cada célula da tabela.

Quando as frequências observadas são muito próximas das esperadas, o valor

do numerador é pequeno; no entanto, quando as discrepâncias são grandes, o

valor do numerador passa a ser grande e, consequentemente, o assume

valores altos. Ou seja, quando há fortes discrepâncias entre o que de facto foi

observado e o que seria de esperar sob a hipótese de independência, a

variável de decisão assume um valor elevado e há motivos ou significância

estatística para rejeitar Ho.

No teste qui-quadrado compara-se o valor calculado com o valor crítico

fornecido em uma tabela, considerando o nível de significância adoptado e os

graus de liberdade GL ou d.f. (obtidos por (número de linhas-1)*(número de

colunas-1)).

Page 121: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 117

Tome-se o caso de GL (d.f.) = 4:

Para o nível de significância de 5%, obtém-se da

tabela de valores críticos da (ver página seguinte):

Rejeita-se a hipótese nula se for maior que o valor crítico fornecido na

tabela.

Resolução: Como pode ser observado, entre os 120 alunos incluídos no estudo há um

número igual (60) que afirma usar e não usar drogas. No entanto, a distribuição

entre os vários cursos não ocorre de forma homogénea.

Medicina Farmácia Biologia Total

Usa drogas 10 20 30 60

Não usa drogas 15 15 30 60

Total 25 35 60 120

Os dados são do tipo qualitativo, pois cada aluno entrevistado foi classificado

sob uma determinada categoria. Neste caso, pode usar-se o teste do qui-

quadrado com duas hipóteses de trabalho:

Ho: Não há associação entre tipo de curso e dependência de drogas

H1: Há associação entre tipo de curso e dependência de droga

Page 122: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 118

Se o obtido fôr maior ou igual ao crítico, Ho deverá ser rejeitada.

Para o cálculo do recomendam-se os seguintes passos:

1. Calcular as frequências esperadas n

nne ji

ij.. *

=

Por exemplo, se as duas variáveis fossem independentes, seria de esperar que

o número de estudantes de Medicina a admitir usar drogas fosse de:

5,12120

60*25* .. ===n

nne ji

ij

2. As frequências esperadas deverão ser anotadas nas correspondentes

células:

Medicina Farmácia Biologia Total

Usa drogas nij 10 20 30 60

eij 12,5 17,5 30,0

Não usa drogas nij 15 15 30 60

eij 12,5 17,5 30,0

Total 25 35 60 120

3. A seguir aplica-se a fórmula =−

i j ij

ijij

e

en 2)(= …=1,7

4. Determinam-se os graus de liberdade na tabela

Os graus de liberdade da tabela são calculados multiplicando

(número de linhas-1)*(número de colunas-1)= (2-1)*(3-1)=2 GL

5. Por último, compara-se o valor do observado obtido (1,7) com o valor do

crítico, considerando os graus de liberdade (GL) e o nível de significância

adoptado (ver tabela anexa).

Vem que o obsv.=1,7 é menor do que o valor obtido a partir da tabela, que

é 5,991 (cruzamento da linha 2 com a coluna 0,05). Assim sendo, a hipótese Ho

não pode ser rejeitada, concluindo-se que, no grupo estudado, não há

associação entre as variáveis. Em média, a proporção de alunos que usam ou

não drogas não varia entre os cursos.

Page 123: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 119

Observação:

Caso 20% ou mais das células tenham frequências esperadas menores que 5,

ou haja uma ou mais frequências esperadas com valores menores ou igual a 1,

não se deve usar o teste do . Uma boa alternativa para estes casos é o

agrupamento de linhas e colunas adjacentes, desde que tenha algum sentido

lógico, de modo a diminuir os graus de liberdade associados.

Page 124: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 120

! " ! # $&%' ($ )"*+, - ./0120

0.995 0.975 0.9 0.5 0.1 0.05 0.025 0.01 0.005 0.001

1 0.000 0.001 0.016 0.455 2.706 3.841 5.024 6.635 7.879 10.827

2 0.010 0.051 0.211 1.386 4.605 5.991 7.378 9.210 10.597 13.815

3 0.072 0.216 0.584 2.366 6.251 7.815 9.348 11.345 12.838 16.266

4 0.207 0.484 1.064 3.357 7.779 9.488 11.143 13.277 14.860 18.466

5 0.412 0.831 1.610 4.351 9.236 11.070 12.832 15.086 16.750 20.515

6 0.676 1.237 2.204 5.348 10.645 12.592 14.449 16.812 18.548 22.457

7 0.989 1.690 2.833 6.346 12.017 14.067 16.013 18.475 20.278 24.321

8 1.344 2.180 3.490 7.344 13.362 15.507 17.535 20.090 21.955 26.124

9 1.735 2.700 4.168 8.343 14.684 16.919 19.023 21.666 23.589 27.877

10 2.156 3.247 4.865 9.342 15.987 18.307 20.483 23.209 25.188 29.588

11 2.603 3.816 5.578 10.341 17.275 19.675 21.920 24.725 26.757 31.264

12 3.074 4.404 6.304 11.340 18.549 21.026 23.337 26.217 28.300 32.909

13 3.565 5.009 7.041 12.340 19.812 22.362 24.736 27.688 29.819 34.527

14 4.075 5.629 7.790 13.339 21.064 23.685 26.119 29.141 31.319 36.124

15 4.601 6.262 8.547 14.339 22.307 24.996 27.488 30.578 32.801 37.698

16 5.142 6.908 9.312 15.338 23.542 26.296 28.845 32.000 34.267 39.252

17 5.697 7.564 10.085 16.338 24.769 27.587 30.191 33.409 35.718 40.791

18 6.265 8.231 10.865 17.338 25.989 28.869 31.526 34.805 37.156 42.312

19 6.844 8.907 11.651 18.338 27.204 30.144 32.852 36.191 38.582 43.819

20 7.434 9.591 12.443 19.337 28.412 31.410 34.170 37.566 39.997 45.314

21 8.034 10.283 13.240 20.337 29.615 32.671 35.479 38.932 41.401 46.796

22 8.643 10.982 14.041 21.337 30.813 33.924 36.781 40.289 42.796 48.268

23 9.260 11.689 14.848 22.337 32.007 35.172 38.076 41.638 44.181 49.728

24 9.886 12.401 15.659 23.337 33.196 36.415 39.364 42.980 45.558 51.179

25 10.520 13.120 16.473 24.337 34.382 37.652 40.646 44.314 46.928 52.619

26 11.160 13.844 17.292 25.336 35.563 38.885 41.923 45.642 48.290 54.051

27 11.808 14.573 18.114 26.336 36.741 40.113 43.195 46.963 49.645 55.475

28 12.461 15.308 18.939 27.336 37.916 41.337 44.461 48.278 50.994 56.892

29 13.121 16.047 19.768 28.336 39.087 42.557 45.722 49.588 52.335 58.301

30 13.787 16.791 20.599 29.336 40.256 43.773 46.979 50.892 53.672 59.702

Page 125: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 121

FIABILIDADE Exercícios

Exercício 1

Num centro comercial, está instalado um sistema de 10 máquinas para

utilização de cartão multibanco. Diz-se que o sistema está em funcionamento

se pelo menos uma das máquinas funciona. Suponha que cada máquina

funciona independentemente das outras e a probabilidade de funcionamento de

cada máquina é 85%. Calcule a probabilidade do sistema estar em

funcionamento.

Resolução

P(avaria) = 1-0,85 = 15%

P(sistema estar em funcionamento) = 1 – P(sistema avariar)

= 1 – P(nenhuma das máquinas funcionar)

= 1 – P(maq1 não funcionar e...e maq 10 não funcionar)

= 1 – 0,15*0,15*...*0,15 = 1 (aproximadamente)

2. Quatro componentes de um sistema encontram-se associados de acordo

com a figura junta. Estão no seu período de vida útil e as taxas médias de

avarias são 10-4 avarias/hora (A), 2x10-5 avarias/hora (B e C) e 5x10-5

avarias/hora (D).

Calcule a probabilidade do sistema estar em funcionamento após 5 000 horas.

Resolução

A: === −− − 5,05000*10 4

eeRs 60,6531%

D: === −− − 25,05000*10*5( )5

eeRs 77,8801%

AB

CDA

B

CD

Page 126: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 122

B e C: === −− − 1,05000*10*2( )5

eeRs 90,4837%

P(funcionar 1 ou 2) = 1-P(funcionar nenhuma) = 1 – (1-0,904837)2 = 99,0944%

Logo, P(sistema estar em funcionamento após 5 000 horas) =

= 0,606531*0,990944*0,778801 = 46,8%

Exercício 3

Foram ensaiadas durante 3 000 horas, sem que se verificasse qualquer avaria,

cinco unidades idênticas de um equipamento que se sabe ter uma curva de

sobrevivência que obedece a uma distribuição exponencial, com um MTBF de

17 500 horas.

Calcule a fiabilidade do equipamento.

Resolução

X: tempo de funcionamento sem avarias da máquina (em horas)

(isto é, tempo que decorre entre avarias consecutivas (em horas))

X segue Exp(α=1/17500) MTBF = 17500

Y: nº de avarias no intervalo [0,3000] horas

=== −− 171429,0175003000

eeRs 84,25%

Exercício 4

O tempo de funcionamento sem avarias de uma determinada máquina de

produção contínua segue uma lei exponencial negativa com valor esperado

igual a 4,5 horas. Imagine que a máquina é (re)colocada em funcionamento no

instante t=0 horas.

a) Qual a probabilidade de não ocorrerem avarias antes do instante t=6

horas?

b) Admitindo que a máquina se encontrava em funcionamento no instante

t=4 horas, qual a probabilidade de não ocorrerem avarias até t=6 horas?

c) Qual a probabilidade de se verificarem 2 avarias durante as primeiras 6

horas de funcionamento da máquina?

Page 127: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 123

Resolução

a) X: tempo de funcionamento sem avarias da máquina (em horas)

(isto é, tempo que decorre entre avarias consecutivas (em horas))

X segue Exp(α=1/4,5) MTBF = 4,5

P(X ≥ 6) = %4,265,4

11)6(1 5,4

65,4

16

0==−=<−

−−

edxeXP

Ou considerando Y: nº de avarias no intervalo [0,6] horas, como Y segue

Po(1/4,5), vem que P(X ≥ 6) = P(Y=0) = e-λt = e-(1/4,5)t = e-(6/4,5) = 26,4%

b) P(X ≥ 6/ X ≥ 4) = )2(%1,64)4()6(

)4()46(

5,44

5,46

≥===≥≥=

≥≥∩≥

XP

e

eXPXP

XPXXP

c) Y: nº de avarias no intervalo [0,6] horas

P(Y=2) = %4,23!2

)5,4/6( 25,46

=−

xe

Exercício 5

Sabe-se que um determinado modelo de lâmpadas apresenta no período de

vida útil (3625 horas) um MTBF de 12 000 horas. Calcular:

a) A probabilidade de falha de uma ou mais lâmpadas, num conjunto de 10,

no período de vida útil.

b) Quantas lâmpadas, de um conjunto de 1 000, estarão provavelmente em

funcionamento após 2 000 horas de utilização.

Resolução

a) === −− 302,0120003625

eeRs 73,9%

Em 10, 1 - P(falhar nenhuma) = 1 - 0,73910 = 1 – 0,0488 = 95,12%

b) === −− 1667,0120002000

eeRs 84,6% Logo, 0,846x1000 lâmpadas = 846

Page 128: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 124

Exercício 6

Num grande centro comercial existem 3 telefones públicos, colocados

estrategicamente a fim de satisfazer adequadamente os utentes. A observação

prolongada do funcionamento dos telefones levou a concluir que as

probabilidades dos 3 telefones, T1, T2 e T3 se encontrarem avariados são,

respectivamente, 0,15, 0,2 e 0,25 e que as avarias são independentes. O grupo

de telefones satisfaz minimamente o serviço se pelo menos 2 estiverem sem

avarias. Qual a probabilidade de pelo menos dois destes telefones estarem

sem avarias?

Resolução

P(pelo menos dois destes telefones estarem sem avarias ) = P(2 ou 3 estarem

sem avarias) = 0,095+0,51=60,5%

P(2 sem avarias) = 0,15*0,2*0,75+0,85*0,2*0,25+0,15*0,8*0,25=9,5%

P(3 sem avarias) = 0,85*0,8*0,75=51%

Exercício 7

Um sistema é constituído por 5 componentes iguais, sendo 0.05 a

probabilidade de um elemento falhar ao longo de qualquer dia da semana. No

caso de nenhum elemento avariar o sistema funciona normalmente; se um dos

elementos avariar o sistema funciona com probabilidade 0.7; se mais de um

elemento avariar o sistema não funciona. Calcule:

a) a probabilidade do sistema funcionar ao longo do dia.

b) a função de probabilidade do nº de falhas registadas nos seus

componentes ao longo de um dia, indicando o valor médio de tal

distribuição.

Resolução

a) P(sist. funcionar) = P(0 avariar e funcionar) + P(1 avariar e funcionar)

= (0,955)* 1 + (5*0,954*0,05)*0,7 = 0,7738 + 0,1425 = 91,63%

b) Bi(n=5;p=0,05) Valor médio=5*0,05=0,25

Page 129: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 125

CONTROLE ESTATÍSTICO DE QUALIDADE Exercícios

Exercício 1

Uma empresa fabrica e comercializa condutores eléctricos cujas condições de

controlo da produção e aceitabilidade a seguir se indicam (relativos à

resistência de um componente em Ω):

− Característica sob controlo: µ

− LIC: 49,8775

− LSC: 50,1225

− n=16

− σ=0,25

− Proceder-se-á à paragem da produção sempre que os limites de controlo

sejam desrespeitados

− Um condutor é considerado não defeituoso se a sua resistência em Ω

estiver compreendida entre [49,530; 50, 470]

Nestas condições, determine:

a) O valor da norma µ0

b) A probabilidade de se proceder a uma paragem indevida da produção

c) A probabilidade de, estando a norma a ser cumprida, se produzir um

artigo defeituoso.

Resolução

X: resistência de um componente em Ω

))25,0(;( 2µNX ∩

a) LIC = 8775,49=−n

cσµ

LSC = 1225,50=+n

cσµ

Como LIC + LSC = 100 vem que 1002 ==

++

− µσµσµn

c

n

c

Logo µ=100/2 = 50 Ω

Page 130: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 126

b)

P (parar indevidamente o processo produtivo) =

P( X cair fora dos limites de controlo quando µ=µ0) =

1 - P(49,8775 ≤ X ≤ 50,1225 sendo µ=50) =

1 - P(

16

25,0508775,49 − ≤ X ≤

16

25,0501225,50 −

) =

1- P(-1,96 ≤ X ≤ 1,96) =

Na tabela da Normal, vem D(1,96) = 0,95 donde

1 – 0,95 = 5%

c) P(produzir um artigo defeituoso, sendo a norma respeitada) =

1 – P(49,53 ≤ X ≤ 50,47 sendo µ=50) =

1 - P(

16

25,05053,49 − ≤ X ≤

16

25,05047,50 −

) =

1 - P(-1,88 ≤ X ≤ 1,88) =

Na tabela da Normal, vem D(1,88) = 0,9399 donde

1 – 0,9399 = 6,01%

Exercício 2

A empresa “TRADECHO, SA” mantém um diferendo com os seus principais

clientes, que afirmam que os produtos produzidos (em série) por esta empresa

não obedecem às normas de qualidade estabelecidas e que são:

- a norma para o comprimento médio das peças é de 20 cm;

- a norma para a variância é de 4 e está a ser cumprida;

- a amplitude do intervalo de controle para a média deve ser de 1,96;

- a dimensão das amostras a extrair é de 16

Afirmam os clientes que a probabilidade de parar indevidamente o processo

produtivo é superior àquela que decorre das normas.

Page 131: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 127

a) Determine a probabilidade referida.

b) Represente a carta de controle para a média

c) A recolha de 5 amostras forneceu os seguintes resultados para a média:

20,05 19,90 20,00 20,30 20,15

Qual a medida a tomar?

Resolução

X: comprimento das peças em cm

)4;(µNX ∩

a) P (parar indevidamente o processo produtivo) =

P( X cair fora dos limites de controlo quando µ=µ0) =

1 - P(20-1,96/2 ≤ X ≤ 20+1,96/2 sendo µ=20) =

1 - P(

16

298,0− ≤ X ≤

16

298,0

) =

1- P(-1,96 ≤ X ≤ 1,96) =

Na tabela da Normal, vem D(1,96) = 0,95 donde

1 – 0,95 = 5%

b) e c)

Média Amostral

(cm) Amostra 1 Amostra 2 Amostra 3 Amostra 4 Amostra 5

•20,5 •

• •

• •

• • •20,3

• • •20,15

• •

19,90 • • •

• • •

• •

• •

Não é necessário parar o processo produtivo (valores dentro dos limites de

controlo).

20

20,98

19,02

20

Page 132: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 128

Exercício 3

Numa empresa procede-se ao exame das condições de produção relativas à

duração (em horas) das lâmpadas fabricadas (produção em série). Sabe-se

que o desvio-padrão da duração de uma lâmpada é de 100 horas.

O Departamento de Produção construiu o seguinte intervalo para a duração

média de uma lâmpada, a partir de uma amostra de dimensão 100:

[983,55; 1016,45]

parando-se o processo produtivo se o valor médio amostral se situar fora deste

intervalo.

a) Calcule o valor adoptado para a norma (µ0)

b) Determine a probabilidade de se parar indevidamente o processo

produtivo.

Resolução

X: duração das lâmpadas em horas

))100(;( 2µNX ∩

a) LIC = 55,983=−n

cσµ

LSC = 45,1016=+n

cσµ

Como LIC + LSC = 2000 vem que 20002 ==

++

− µσµσµn

c

n

c

Logo µ=2000/2 = 1000 h

b) P (parar indevidamente o processo produtivo) =

P( X cair fora dos limites de controlo quando µ=µ0) =

1 - P(983,55 ≤ X ≤ 1016,45 sendo µ=1000) =

1 - P(

100

100100055,983 − ≤ X ≤

100

100100045,1016 −

) =

1- P(-1,645 ≤ X ≤ 1,645) =

Page 133: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 129

Na tabela da Normal, vem D(1,645) = 0,9 donde

1 – 0,9 = 10%

Exercício 4

O novo Conselho de Administração da empresa de componentes eléctricas

“Alta Tensão, SA” resolveu efectuar um estudo aprofundado sobre o controle

estatístico de qualidade das peças produzidas. Assim, definiu com o director de

produção os aspectos considerados relevantes no controle da duração média

das componentes:

- o limite superior de qualidade (LSC) deve ser de 10,8 milhares de horas

- a amplitude do intervalo não deve exceder 1,96 milhares de horas

- a probabilidade de se parar indevidamente a produção é de 5%

Sabe-se ainda que o desvio padrão da duração de uma componente é de 4 mil

horas.

a) Determine a dimensão da amostra que é necessário recolher para

cumprir as condições definidas.

b) Calcule a norma.

Resolução

X: duração das componentes em milhares de horas

))4(;( 2µNX ∩

a) LSC = 8,10=+n

cσµ

D(c)= 5% logo c= 1,96

2 96,1≤n

cσ logo 2 6496,1

4*96,1 ≥⇔≤ nn

b) LSC = 8,10=+n

cσµ logo µ = 10,8 - 64

4*96,1 = 9,82

Exercício 5

O director de produção da empresa DISLIX, SA pretende implementar um

sistema de controle interno de qualidade de um determinado tipo de geradores

fabricados em série. Para tal, procede à verificação da produção de energia

Page 134: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 130

eléctrica (em kws/hora) tendo e vista a construção de um intervalo de controle

para a produção média de energia de um gerador que cumpra os seguintes

objectivos:

- Norma de produção para a média: 10

- A amplitude do intervalo não deve exceder 3,92

- A probabilidade de se parar indevidamente a produção não deve

exceder 5%

Sabe-se que o desvio padrão da produção da energia eléctrica de um gerador

é de 4 kws/hora e que a variável segue distribuição Normal.

a) Determine a dimensão mínima da amostra a utilizar para o controle de

produção.

b) Represente a carta de controle para a média.

Resolução

X: energia eléctrica produzida em kws/hora

))4(;( 2µNX ∩

a) D(c)= 5% logo c= 1,96

2 92,3≤n

cσ logo 2 1692,3

4*96,1 ≥⇔≤ nn

b)

Média Amostral

(cm) Amostra 1 Amostra 2 Amostra 3 Amostra 4 Amostra 5

• •

• •

• •

• • •

• • •

• •

• • •

• • •

• •

• •

LIC = 04,816

4*96,110 =−=−

n

cσµ

LSC = 96,1116

4*96,110 =+=+

n

cσµ

10

11,96

8,04

Page 135: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 131

TRATAMENTO ESTATÍSTICO DE INQUÉRITOS Exercícios

Exercício 1

A empresa BrasFruta Lda está a instalar-se em Portugal com um produto

inovador, um concentrado de fruta semelhante a um sumo de fruta natural. A

intenção é vender o produto em cafés, esplanadas e bares que passariam a

dispor de uma imitação perfeita de um sumo acabado de fazerva um preço

vantajoso.

Através de um estudo qualitativo com consumidores, conseguiu-se apurar que

existia uma grande sensibilidade ao preço. Apesar de haver uma preferência

generalizada por sumos naturais face a refrigerantes, os consumidores

mostravam-se cépticos em relação à qualidade quando se falav em preços

baixos.

Entendeu-se então levantar a seguinte questão: “a sensibilidade ao preço é

afectada pelo poder de compra dos clientes?” Numa sondagem efectuada a

1973 clientes potenciais, confrontaram-se os inquiridos com três alternativas:

adquirir sumo natural a preço elevado, adquirir sumo natural a preço baixo ou

adquirir refrigerantes. A sondagem revelou que, dos clientes classes A/B/C1,

598 pagariam um preço mais elevado pelo sumo natural, enquanto 212 não

estariam dispostos a gastar tanto. Em relação aos 977 clientes das classes

C2/D/E, 164 só consumiriam sumo natural se o preço fosse baixo e 285

preferiam refrigerante.

Represente adequadamente e interprete a informação contida nestes dados.

Utilize um nível de significância de 1%.

Resolução

Preço Elevado Preço Baixo Refrigerante Total

A/B/C1 598 212 186 996

C2/D/E 528 164 285 977

Total 1126 376 471 1973

As conclusões foram retiradas pelo recurso à análise correlacionada através do

teste do qui-quadrado. Estes testes foram elaborados sobretudo com o intuito

Page 136: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 132

de segmentar o mercado. As frequências foram utilizadas para analisar o

mercado como um todo e para interpretar o resultado dos testes de correlação,

para os quais se convencionou a adopção de um nível de significância de 5%,

considerado razoável face aos valores normalmente utilizados.

Para o cálculo das frequências esperadas, procedeu-se à aplicação de

n

nne ji

ij.. *

= , de que resultou a seguinte tabela:

Preço Elevado Preço Baixo Refrigerante Total

A/B/C1 nij 598 212 186 996

eij 568.4 189.8 237.8

C2/D/E nij 528 164 285 977

eij 557.6 186.2 233.2

Total 1126 376 471 1973

Ho: As variáveis são independentes

H1: As variáveis não são independentes

crítico (GL=2; α=0,05)=5,991

observado = 31,141

Vem que o obsv.=31,141 é maior do que o valor obtido a partir da tabela,

que é 5,991 (cruzamento da linha 2 com a coluna 0,05). Assim sendo, a

hipótese Ho será rejeitada, concluindo-se que, no grupo estudado, há

associação entre as variáveis. Em média, o poder de compra do consumidor

influencia a sensibilidade ao preço.

Exercício 2

Aos exames de primeira época de determinada disciplina compareceram 105

alunos, dos quais 20 não tinham prestado qualquer prova durante o ano. O

número de aprovações foi de 33, das quais 3 foram de alunos que não tinham

efectuado provas durante o ano.

Page 137: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 133

Diga, com base nestes elementos, se, para um nível de significância de 5%, se

pode afirmar que existe independência entre a comparência (ou não) a provas

durante o ano de aprovação (ou não) em exame.

Resolução

Aprovações Comparecem

Aprovado Reprovado Total

Sim 30 55 85 Não 3 17 20 Total 33 72 105

Ho: As variáveis são independentes

H1: As variáveis não são independentes

crítico (GL=2; α=0,05)=3,84

observado = 3,122

Vem que o obsv.= 3,122 é menor do que o valor obtido a partir da tabela.

Logo, a hipótese Ho não será rejeitada (há independência).

Exercício 3

Com o objectivo de testar se existe relação entre a formação do gerente de

uma dependência bancária e a respectiva “performance”, construiu-se a

seguinte tabela de contingência, relativa a 300 balcões de diferentes bancos:

Formação

Gerente Vol. Negócios

Média

Superior

Baixo 44 52 Médio 55 43

Elevado 51 55

Que conclui, a um nível de significância de 1%?

Resolução

Ho: As variáveis são independentes

H1: As variáveis não são independentes

Page 138: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 134

Valores esperados:

Formação Gerente

Vol. Negócios

Média

Superior

Baixo 48 48 Médio 49 49

Elevado 53 53

crítico (GL=2; α=0,01)=9,21

observado = 2,2876

Valor obsv. est. teste = 21,92876,253

)5355(...

48)4844( 22

>=−++−

Vem que o obsv.= 2,2876 é maior do que o valor obtido a partir da tabela,

Assim sendo, a hipótese Ho será rejeitada, concluindo-se que há associação

entre as variáveis.

Exercício 4

Pretendendo-se analisar o comportamento do volume de divisas ao longo do

ano, deu-se particular atenção à influência exercida pelas remessas de

emigrantes. Assim, o ano foi dividido em duas épocas: Época de Ponta,

compreendendo os meses de vinda de emigrantes (Verão e Natal) e Época

Normal (restantes meses).

Assim, observou-se o nível de Disponibilidades Líquidas sobre o Exterior (DLX)

para cada mês, tendo-se obtido:

Volume DLX

Época Baixo/Médio Elevado

Normal 150 50 Ponta 20 80

A um nível de significância de 5%, que pode concluir?

Resolução

Ho: As variáveis são independentes

H1: As variáveis não são independentes

Page 139: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 135

Valores esperados:

Volume DLX Época

Baixo/Médio Elevado

Normal 113,33 86,66 Ponta 6,66 43,33

crítico (GL=1; α=0,05)=5,991

observado = 85,069

Valor obsv. est. teste = 84,3069,8533,43

)33,4380(...

33,113)33,113150( 22

>=−++−

Vem que o obsv.= 85,069 é maior do que o valor obtido a partir da tabela,

Assim sendo, a hipótese Ho será rejeitada, concluindo-se que há associação

entre as variáveis.

Exercício 5

Num estudo que pretendia averiguar a existência de relação entre a procura de

moeda e a taxa de juro, procedeu-se à recolha periódica de elementos sobre

essas variáveis, construindo-se a seguinte tabela de contingência:

Taxa juro

Proc. Moeda Reduzida Média Elevada

0-10 20 30 200 10-45 20 400 30 45-70 250 30 20

Utilizando um nível de significância de 5%, que conclusão pode tirar?

Resolução

Ho: As variáveis são independentes

H1: As variáveis não são independentes

Valores esperados: Taxa juro

Proc. Moeda Reduzida Média Elevada

0-10 72.5 115 62.5 10-45 130.5 207 112.5 45-70 87 138 75

Page 140: Estatística Aplicada - Exercícos Resolvidos

Manual de Exercícios

Estatística Aplicada 136

crítico (GL=4; α=0,05)=9,49

observado = 1183,7

Vem que o obsv.= 1183,7 é maior do que o valor obtido a partir da tabela,

Assim sendo, a hipótese Ho será rejeitada, concluindo-se que há associação

entre as variáveis.

Exercício 6

Um investigador seleccionou três amostras de estudantes, A, B e C, que fazem

parte de um determinado projecto de estudo e aplicou-lhes uma escala de

atitudes com o objectivo de conhecer as suas opiniões em relação ao projecto.

Os resultados de uma amostra de 140 estudantes foram os seguintes:

Grupo de Tipo estudantes de atitude

A

B

C

Atitude negativa 30 30 10 Atitude positiva 10 20 40

Utilizando um nível de significância de 5%, que conclusão pode tirar?

Resolução

Ho: As variáveis são independentes

H1: As variáveis não são independentes

Valores esperados: Grupo de Tipo estudantes de atitude

A

B

C

Atitude negativa 20 25 25 Atitude positiva 20 25 25

crítico (GL=2; α=0,05)=3,84

observado = 30

Vem que o obsv.= 30 é maior do que o valor obtido a partir da tabela,

Assim sendo, a hipótese Ho será rejeitada, concluindo-se que há associação

entre as variáveis.